Dieser Abschnitt ist unglücklich aufgebaut und schlecht lesbar. Es ist unklar, welche Aussage überhaupt bewiesen werden soll, da die Begriffe Normalverteilung und Binomialverteilung unscharf verwendet werden.
Zunächst heißt es "Die Normalverteilung kann aus der Binomialverteilung hergeleitet werden, wenn [...]". Dann werden vier Bedingungen aufgezählt, unter denen diese Herleitung möglich sei, wobei unklar bleibt, ob diese vier Bedingungen nun erfüllt sind oder nicht, und unter welchen Voraussetzungen sie erfüllt sind. Dann ist von Annäherungen für
n
→
∞
{\displaystyle n\to \infty }
die Rede, wobei
n
{\displaystyle n}
auf beiden Seiten der jeweiligen Gleichungen steht. Was hier stattdessen stehen könnte, ist ein klarer Beweis beruhend auf den Verteilungsfunktionen von Binomialverteilungen und Normalverteilungen oder auf der Wahrscheinlichkeitsfunktion der Binomialverteilung und der Dichtefunktion der Normalverteilung. Die angegebene Quelle scheint mir nicht die Qualitätsanforderungen der WP zu erfüllen, sie enthält noch nicht einmal den Namen eines Autors. Das Abschreiben eines Beweises ist überdies möglicherweise eine Urheberrechtsverletzung. Ich schlage vor, diesen Beweis zu löschen.--Sigma^2 (Diskussion ) 22:34, 11. Okt. 2023 (CEST) Beantworten
Nachdem es nun innerhalb von vier Wochen keinen Widerspruch und keine Überarbeitung des Beweises gab, werde ich den Beweis aus dem Artikel hierher verlagern, damit er z. B. hier überarbeitet werden kann.
Beweis (Fassung vom 8.11.2023)
Bearbeiten
Die Normalverteilung kann aus der Binomialverteilung hergeleitet werden, wenn die Differenz
k
−
n
p
{\displaystyle k-np}
zwischen der Anzahl
k
{\displaystyle k}
der Erfolge und dem Erwartungswert
n
p
{\displaystyle np}
von der Größenordnung
O
(
n
)
{\displaystyle {\mathcal {O}}({\sqrt {n}})}
ist und
k
{\displaystyle k}
und
n
−
k
{\displaystyle n-k}
von der Größenordnung
O
(
n
)
{\displaystyle {\mathcal {O}}(n)}
sind.
Aus der Stirlingformel
n
!
=
n
n
e
−
n
2
π
n
(
1
+
O
(
1
n
)
)
{\displaystyle n!=n^{n}e^{-n}{\sqrt {2\pi n}}\left(1+{\mathcal {O}}\left({\frac {1}{n}}\right)\right)}
ergibt sich dann folgende Näherung für die Binomialverteilung :
B
(
k
∣
p
,
n
)
=
n
!
k
!
(
n
−
k
)
!
p
k
(
1
−
p
)
n
−
k
=
n
n
e
−
n
2
π
n
k
k
e
−
k
2
π
k
(
n
−
k
)
n
−
k
e
−
(
n
−
k
)
2
π
(
n
−
k
)
p
k
(
1
−
p
)
n
−
k
(
1
+
O
(
1
n
)
)
=
n
n
(
p
k
)
k
(
1
−
p
n
−
k
)
n
−
k
n
2
π
k
(
n
−
k
)
(
1
+
O
(
1
n
)
)
=
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
n
2
π
k
(
n
−
k
)
(
1
+
O
(
1
n
)
)
{\displaystyle {\begin{aligned}B(k\mid p,n)&={\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}\\&={\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}(1-p)^{n-k}\left(1+{\mathcal {O}}\left({\frac {1}{n}}\right)\right)\\&=n^{n}\left({\frac {p}{k}}\right)^{k}\left({\frac {1-p}{n-k}}\right)^{n-k}{\sqrt {\frac {n}{2\pi k(n-k)}}}\left(1+{\mathcal {O}}\left({\frac {1}{n}}\right)\right)\\&=\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}{\sqrt {\frac {n}{2\pi k(n-k)}}}\left(1+{\mathcal {O}}\left({\frac {1}{n}}\right)\right)\\\end{aligned}}}
Um den Ausdruck
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
{\displaystyle \left({\tfrac {np}{k}}\right)^{k}\left({\tfrac {n(1-p)}{n-k}}\right)^{n-k}}
als Potenz von
e
{\displaystyle e}
darzustellen, wird der natürliche Logarithmus dieses Ausdrucks approximiert . Definiert man
d
:=
k
−
n
p
{\displaystyle d:=k-np}
, dann gilt
ln
(
n
p
k
)
=
ln
(
n
p
n
p
+
d
)
=
−
ln
(
n
p
+
d
n
p
)
=
−
ln
(
1
+
d
n
p
)
ln
(
n
(
1
−
p
)
n
−
k
)
=
ln
(
n
(
1
−
p
)
n
(
1
−
p
)
−
d
)
=
−
ln
(
n
(
1
−
p
)
−
d
n
(
1
−
p
)
)
=
−
ln
(
1
−
d
n
(
1
−
p
)
)
{\displaystyle {\begin{aligned}\ln \left({\frac {np}{k}}\right)&=\ln \left({\frac {np}{np+d}}\right)=-\ln \left({\frac {np+d}{np}}\right)=-\ln \left(1+{\frac {d}{np}}\right)\\\ln \left({\frac {n(1-p)}{n-k}}\right)&=\ln \left({\frac {n(1-p)}{n(1-p)-d}}\right)=-\ln \left({\frac {n(1-p)-d}{n(1-p)}}\right)=-\ln \left(1-{\frac {d}{n(1-p)}}\right)\\\end{aligned}}}
Aus der Potenzreihe
ln
(
1
+
x
)
=
x
−
x
2
2
+
O
(
x
3
)
{\displaystyle \ln(1+x)=x-{\tfrac {x^{2}}{2}}+{\mathcal {O}}(x^{3})}
für den natürlichen Logarithmus folgt
ln
(
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
)
=
k
ln
(
n
p
k
)
+
(
n
−
k
)
ln
(
n
(
1
−
p
)
n
−
k
)
=
k
ln
(
1
+
d
n
p
)
−
(
n
−
k
)
ln
(
1
−
d
n
(
1
−
p
)
)
=
−
(
n
p
+
d
)
(
d
n
p
−
d
2
2
n
2
p
2
+
O
(
d
3
n
3
)
)
−
(
n
(
1
−
p
)
−
d
)
(
−
d
n
(
1
−
p
)
−
d
2
2
n
2
(
1
−
p
)
2
+
O
(
d
3
n
3
)
)
=
−
d
−
d
2
n
p
+
d
2
2
n
p
+
d
3
2
n
2
p
2
−
(
n
p
+
d
)
O
(
d
3
n
3
)
+
d
−
d
2
n
(
1
−
p
)
+
d
2
2
n
(
1
−
p
)
−
d
3
2
n
2
(
1
−
p
)
2
−
(
n
(
1
−
p
)
−
d
)
O
(
d
3
n
3
)
=
−
d
2
2
n
p
(
1
−
p
)
+
O
(
d
3
n
2
)
{\displaystyle {\begin{aligned}\ln \left(\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\right)&=k\ln \left({\frac {np}{k}}\right)+(n-k)\ln \left({\frac {n(1-p)}{n-k}}\right)\\&=k\ln \left(1+{\frac {d}{np}}\right)-(n-k)\ln \left(1-{\frac {d}{n(1-p)}}\right)\\&=-(np+d)\left({\frac {d}{np}}-{\frac {d^{2}}{2n^{2}p^{2}}}+{\mathcal {O}}\left({\frac {d^{3}}{n^{3}}}\right)\right)-(n(1-p)-d)\left(-{\frac {d}{n(1-p)}}-{\frac {d^{2}}{2n^{2}(1-p)^{2}}}+{\mathcal {O}}\left({\frac {d^{3}}{n^{3}}}\right)\right)\\&=-d-{\frac {d^{2}}{np}}+{\frac {d^{2}}{2np}}+{\frac {d^{3}}{2n^{2}p^{2}}}-(np+d){\mathcal {O}}\left({\frac {d^{3}}{n^{3}}}\right)+d-{\frac {d^{2}}{n(1-p)}}+{\frac {d^{2}}{2n(1-p)}}-{\frac {d^{3}}{2n^{2}(1-p)^{2}}}-(n(1-p)-d){\mathcal {O}}\left({\frac {d^{3}}{n^{3}}}\right)\\&=-{\frac {d^{2}}{2np(1-p)}}+{\mathcal {O}}\left({\frac {d^{3}}{n^{2}}}\right)\\\end{aligned}}}
Wendet man die Exponentialfunktion auf diese Gleichung an, dann erhält man
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
=
e
−
d
2
2
n
p
(
1
−
p
)
(
1
+
O
(
d
3
n
2
)
)
{\displaystyle \left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}=e^{-{\frac {d^{2}}{2np(1-p)}}}\left(1+{\mathcal {O}}\left({\frac {d^{3}}{n^{2}}}\right)\right)}
Außerdem gilt die Näherung
n
2
π
k
(
n
−
k
)
=
n
2
π
(
n
p
+
d
)
(
n
(
1
−
p
)
−
d
)
=
1
2
π
n
p
(
1
−
p
)
(
1
+
O
(
d
n
)
)
{\displaystyle {\sqrt {\frac {n}{2\pi k(n-k)}}}={\sqrt {\frac {n}{2\pi (np+d)(n(1-p)-d)}}}={\frac {1}{\sqrt {2\pi np(1-p)}}}\left(1+{\mathcal {O}}\left({\frac {d}{n}}\right)\right)}
Weil
d
:=
k
−
n
p
{\displaystyle d:=k-np}
von der Größenordnung
O
(
n
)
{\displaystyle {\mathcal {O}}({\sqrt {n}})}
ist, gilt
O
(
d
3
n
2
)
=
O
(
d
n
)
=
O
(
1
n
)
{\displaystyle {\mathcal {O}}\left({\frac {d^{3}}{n^{2}}}\right)={\mathcal {O}}\left({\frac {d}{n}}\right)={\mathcal {O}}\left({\frac {1}{\sqrt {n}}}\right)}
. Daraus folgt, dass die Binomialverteilung folgendermaßen dargestellt werden kann:
B
(
k
∣
p
,
n
)
=
1
2
π
n
p
(
1
−
p
)
e
−
(
k
−
n
p
)
2
2
n
p
(
1
−
p
)
(
1
+
O
(
1
n
)
)
{\displaystyle B(k\mid p,n)={\frac {1}{\sqrt {2\pi np(1-p)}}}e^{-{\frac {(k-np)^{2}}{2np(1-p)}}}\left(1+{\mathcal {O}}\left({\frac {1}{\sqrt {n}}}\right)\right)}
Dieser Wert nähert sich für große
n
{\displaystyle n}
der Normalverteilung mit dem Erwartungswert
μ
=
n
p
{\displaystyle \mu =np}
und der Varianz
σ
2
=
n
p
(
1
−
p
)
{\displaystyle \sigma ^{2}=np(1-p)}
an.[1]
Einzelnachweis
↑ Santa Cruz Institute for Particle Physics: The Normal Approximation to the Binomial Distribution
--Sigma^2 (Diskussion ) 00:09, 8. Nov. 2023 (CET) Beantworten