Normal-Approximation

Methode zur Annäherung der Binomialverteilung mithilfe der Normalverteilung

Die Normal-Approximation ist eine Methode der Wahrscheinlichkeitsrechnung, um die Binomialverteilung für große Stichproben durch die Normalverteilung anzunähern. Hierbei handelt es sich um eine Anwendung des Satzes von Moivre-Laplace und damit auch um eine Anwendung des Zentralen Grenzwertsatzes.

Formulierung Bearbeiten

Für eine binomialverteilte Zufallsvariable   mit dem Erwartungswert   und der Standardabweichung   gilt nach dem Satz von Moivre-Laplace

 ,

wobei   die Wahrscheinlichkeitsverteilungsfunktion der Standardnormalverteilung bezeichnet.

Diesen asymptotischen Zusammenhang verwendet man zur Rechtfertigung der Approximation der Verteilungsfunktion von   durch die Verteilungsfunktion der Normalverteilung   für endliches, aber hinreichend große  , d. h.

 

Mit dieser Approximation der Verteilungsfunktion erhält man für   mit  

 

Eine exakte Berechnung der Wahrscheinlichkeit würde dagegen durch

 

erfolgen.

Güte der Approximation Bearbeiten

Für viele Anwendungen gilt die Näherung als hinreichend gut, falls   gilt.[1][2][3] Falls dies nicht gilt, so sollte zumindest   und   gelten.[4][5] Je asymmetrischer die Binomialverteilung ist, d. h. je größer die Differenz zwischen   und   ist, umso größer sollte   sein.

Für   nahe an 0 ist zur Näherung die Poisson-Approximation besser geeignet. Dabei wird die Binomialverteilung   durch eine Poissonverteilung mit dem Parameter   approximiert. Für   nahe an 1 sind beide Approximationen schlecht, dann kann jedoch   statt   betrachtet werden, d. h. bei der Binomialverteilung werden Erfolge und Misserfolge vertauscht.   ist wieder binomialverteilt mit Parametern   und   und kann daher mit der Poisson-Approximation angenähert werden.

Stetigkeitskorrektur Bearbeiten

Mit der Stetigkeitskorrektur wird eine verbesserte Approximation von Wahrscheinlichkeiten der Binomialverteilung   berechneten Wahrscheinlichkeiten durch die Wahrscheinlichkeiten aus der Normalverteilungsapproximation   mit den Parametern   und   und der Verteilungsfunktion   angestrebt.

Die Grundidee ist, den   Stellen   der Binomialverteilung die Wahrscheinlichkeiten der Normalverteilung in den   Intervallen

 

zuzuordnen. Für   gilt dann

 

Für einen Wert   ergeben sich mit Verwendung der Stetigkeitskorrektur die Approximationen

 
 

und

 

Für zwei Werte   mit   ergibt sich mit Verwendung der Stetigkeitskorrektur die Approximation

 

Beispiele Bearbeiten

Beispiel 1 Bearbeiten

Ein fairer Würfel wird 1000 Mal geworfen. Gesucht ist die Wahrscheinlichkeit, dass mindestens 100 und höchstens 150 Mal die Sechs gewürfelt wird.

  • Berechnung mit Binomialverteilung
Die Zufallsvariable  , die die zufällige Anzahl der gewürfelten Sechsen bei   Versuchen beschreibt, ist binomialverteilt mit den Parametern   und  , es gilt also  .[6] Die gesuchte Wahrscheinlichkeit ist daher
 
Mit einer Wahrscheinlichkeit von ca. 8,4 % wird also bei 1000 Versuchen zwischen 100 und 150 Mal die Sechs gewürfelt.
  • Berechnung mit Normal-Approximation
Es ist  . Entsprechend der Faustformel gilt die approximierte Lösung also ausreichend genau. Die beiden Parameter für die Approximation der Binomialverteilung durch eine Normalverteilung sind   und  
Die Approximation ohne Stetigkeitskorrektur, wobei die Verteilungsfunktion der Binomialverteilung durch die Verteilungsfunktion einer Normalverteilung mit denselben Parametern approximiert wird, ist
 
  • Berechnung mit Normal-Approximation und Stetigkeitskorrektur
Die Approximation mit Stetigkeitskorrektur ist
 

Die Werte   können numerisch bestimmt werden oder aus Tabelle abgelesen werden, da keine explizite Stammfunktion existiert. Die approximierte Lösung ist häufig numerisch günstiger, da keine umfangreichen Berechnungen der Binomialkoeffizienten durchgeführt werden müssen.

Beispiel 2 Bearbeiten

 
Plot der Dichte der Normalverteilung mit μ = 12 und σ = 3 und der Binomialverteilung mit n = 48 und p = 1/4

Gegeben sei eine binomialverteilte Zufallsvariable   mit den Parametern   und  , dann hat   den Erwartungswert   und die Varianz  . Die Binomialverteilung wird durch eine Normalverteilung   mit dem Mittelwert   und der Varianz   approximiert.

Nun suchen wir die Antwort auf die Frage: „Wie groß ist die Wahrscheinlichkeit, dass   Werte kleiner oder gleich 3 annimmt?“ bzw. „Wie groß ist die Wahrscheinlichkeit  ?“ Da   ist, handelt es sich um eine kleine Wahrscheinlichkeit im linken Verteilungsende, die exakt mit Hilfe der Binomialverteilung oder approximativ aus der Normalverteilung berechnet werden kann. Für diese Fragestellung und Parameterkonstellation ergeben sich folgende Resultate:

  • Berechnung mit der Binomialverteilung
 
  • Abschätzung mit der Normalverteilung
 
 

Die Berechnung mit der Normalverteilung ohne Stetigkeitskorrektur überschätzt die Wahrscheinlichkeit. Dies ist darauf zurückzuführen, dass die Binomialverteilung bei dieser Parameterkonstellation eine Schiefe aufweist, die dazu führt, dass die Normalverteilung im linken Verteilungsende die entsprechenden Wahrscheinlichkeiten überschätzt und im rechten Verteilungsende überschätzt. Ob dieser Approximationsfehler akzeptabel ist, hängt von der Anwendung und Fragestellung ab. Der absolute Approximationsfehler 0,001343 - 0,0007882 liegt unter 0,001 und kann damit z. B. in solchen statistischen Anwendungsfällen akzeptabel sein, bei denen Konfidenz- und Signifikanzniveaus in einer der groben Stufen   festgelegt werden. Anderseits ist der relative Approximationsfehler (0,001343 - 0,0007882)/0,0007882 = 70,39 %. Dies kann bei anderen Anwendungen eine unakzeptable Ungenauigkeit der zu bestimmenden Wahrscheinlichkeit sein.

Die Verwendung der Stetigkeitskorrektur verschlechtert bei dieser Konstellation die Approximation durch die Normalverteilung, da durch die Berücksichtigung zusätzlicher Wahrscheinlichkeitsmasse die Überschätzung durch die Normalverteilung weiter verstärkt wird. Das Beispiel zeigt insofern die Problematik einer standardmäßigen Anwendung der Stetigkeitskorrektur, wenn damit die Vorstellung einer gleichmäßigen Verbesserung verbunden ist.

Literatur Bearbeiten

Einzelnachweise Bearbeiten

  1. Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 304.
  2. Michael Sachs: Wahrscheinlichkeitsrechnung und Statistik für Ingenieurstudenten an Fachhochschulen. Fachbuchverlag Leipzig, München 2003, ISBN 3-446-22202-2, S. 129–130
  3. Christian Hassold, Sven Knoth, Detlef Steuer; Formelsammlung Statistik I & II. Beschreibende Statistik - Wahrscheinlichkeitsrechnung - Schließende Statistik; Hamburg 2010, S. 25 (Memento vom 9. Februar 2016 im Internet Archive), zuletzt abgerufen 9. Februar 2016.
  4. K.Zirkelbach, W.Schmid; Kommentierte Formelsammlung Statistik I und II. Deskriptive Statistik - Wahrscheinlichkeitsrechnung; Frankfurt(Oder) 2008, S. 29.
  5. Formelsammlung zur Vorlesung Statistik I/II für Statistiker, Mathematiker und Informatiker (WS 08/09); LMU München 2008, S.23, zuletzt abgerufen 9. Februar 2016.
  6. Etwas "exakter": Zur Modellierung definiert man den Wahrscheinlichkeitsraum   mit der Ergebnismenge   der Anzahl der gewürfelten Sechsen. Die σ-Algebra ist dann kanonisch die Potenzmenge der Ergebnismenge   und die Wahrscheinlichkeitsverteilung die Binomialverteilung  , wobei   ist und  .