zum Directory-modus

Spezielle Verteilungsfunktionen

Hypergeometrische Verteilung

Die hypergeometrische Verteilung beschreibt die Verteilung von Stichproben bezüglich der betrachteten Gesamtheit. Beispielsweise ist bekannt, dass ein bestimmter Bus statistisch an jedem fünften Tag (aus der Statistik des Nahverkehrsunternehmens) zu früh kommt. Wie wahrscheinlich ist es, dass jemand während eines Semesters (65 Busfahrten) zehnmal seinen Bus verpasst? Es gilt offensichtlich, eine Stichprobe zu finden, in der der Bus zehnmal zu früh und 55 mal pünktlich oder zu spät kommt. Man muss nur berechnen, wie viele solche Stichproben es geben kann, und wie viele es überhaupt gibt. Da der Bus im Jahr (365 Tage) statistisch 73 mal zu früh gefahren ist (und 292 mal nicht), muss man berechnen, wie viele verschiedene Möglichkeiten es gibt, 10 aus 73 beziehungsweise 55 aus 292 auszuwählen. Dies sind die entsprechenden Binomialkoeffizienten:

73 10

beziehungsweise

292 55 .

Insgesamt kann es

365 65

verschiedene 65-elementige Teilmengen der 365-elementigen Menge geben (das sind die überhaupt möglichen Stichproben). Es ergibt sich die Wahrscheinlichkeit

h ( X = 10 ) = 73 10 292 55 365 65 .

Allgemeiner formuliert: Wenn eine Menge N in zwei Klassen mit K und N - K Objekten zerfällt, verteilen sich n -elementige Stichproben mit x von den K Objekten und n - x von den N - K Objekten nach folgender Funktionsgleichung:

h : 0 [ 0 , 1 ] , h ( x ) K x N - K n - x N n , x 0 , 1 , , K 0

mit n N . Diese Funktion heißt die Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung auf 0 . Ihr Erwartungswert und ihre Varianz sind

E ( X ) = n K N σ 2 ( X ) = n K N N - K N N - n N -1 .
Abb.1
Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung

h ( x ) für N = 20 , K = 7 und n = 5

Für große N , K , N - K und relativ kleine Werte von n kann die hypergeometrische Verteilung gut durch die Binomialverteilung angenährt werden.

Seite 5 von 7