Galton-Watson-Prozess

Der Galton-Watson-Prozess, benannt nach dem britischen Naturforscher Francis Galton (1822–1911) und seinem Landsmann, dem Mathematiker Henry William Watson (1827–1903), ist ein spezieller stochastischer Prozess, der benutzt wird, um die zahlenmäßige Entwicklung einer eingeschlechtlichen Population von sich selbst replizierenden Individuen mathematisch zu modellieren. Er wird bisweilen auch als Bienaymé-Galton-Watson-Prozess bezeichnet, zu Ehren des Franzosen Irénée-Jules Bienaymé (1796–1878), der dasselbe Problem bereits längere Zeit vorher bearbeitet hatte.

Geschichte Bearbeiten

50 unabhängige GW-Prozesse mit Startwert 20 und Poisson-verteilten Nachkommen mit Parameter 0,95. Bereits bei t=41 sind alle bis auf 6 Populationen ausgestorben.

Im England des viktorianischen Zeitalters war die Aristokratie zunehmend besorgt über den Umstand, dass immer wieder Adelsgeschlechter aus Mangel an männlichen Nachkommen ausstarben und somit immer mehr traditionsreiche Namen aus der adligen Gesellschaft verschwanden. Galton, der selbst kein Mathematiker war, veröffentlichte 1873 in der Wissenschaftszeitschrift Educational Times die Frage nach der Wahrscheinlichkeit einer solchen Auslöschung und erhielt prompt Antwort von Watson. Im darauffolgenden Jahr erschien ihre Gemeinschaftsarbeit On the probability of extinction of families, in welcher sie ein stochastisches Konzept vorstellten, das heute als Galton-Watson-Prozess bekannt ist. Das Ergebnis, zu dem sie kamen, war, dass bei konstanter Bevölkerungszahl im Laufe der Zeit alle Namen bis auf einen aussterben würden. Offenbar entstand diese Arbeit im Unwissen über die Ergebnisse von Bienaymé.

Zuerst blieb das Problem der aussterbenden Nachnamen das einzige, auf das das Galton-Watson-Konzept angewendet wurde. Doch schon bald begannen Biologen, damit die Ausbreitung von Lebewesen zu modellieren. Heute wird der Prozess in vielfältigen Gebieten eingesetzt, von der Warteschlangentheorie bis hin zur Ausbreitung von ansteckenden Krankheiten und zur Verbreitung von Computerviren und Kettenbriefen.

Mathematische Modellierung Bearbeiten

Dasselbe Experiment mit Poisson-Parameter 1 (statt 0,95). Diesmal haben bis t=50 ganze 24 von 50 Populationen überlebt.

Der Galton-Watson-Prozess zeichnet sich durch folgende Modellannahmen aus:

Jedes Individuum lebt exakt einen Zeitschritt lang.
Das $i$ -te Individuum im $n$ -ten Zeitschritt hinterlässt unabhängig von allen anderen Individuen eine gewisse Anzahl an Nachkommen gemäß einer Zufallsvariable $Z_{n}^{i}$ .
Alle $Z_{n}^{i}$ sind unabhängig identisch verteilt mit Verteilung $p$ , die nur Werte in $\mathbb {N} _{0}$ annimmt.
Die Population startet mit einem Individuum.

Die letzte Annahme ist plausibel, da aufgrund der Unabhängigkeit der Fortpflanzung der Start mit $j$ Individuen äquivalent ist zu $j$ parallel voneinander laufenden Prozessen mit einem Individuum als Startpopulation.

Sei nun $X_{n}$ die Anzahl der lebenden Individuen zum Zeitpunkt $n$ (im ursprünglichen Modell die Anzahl der männlichen Stammhalter). Es gilt

X_{0}=1

und

X_{1}=Z_{1}^{1}

Dann folgt aufgrund der unabhängigen Fortpflanzung

X_{n+1}=\sum _{i=1}^{X_{n}}Z_{n}^{i}

Gab es nun in der $n$ -ten Generation genau $k$ Individuen, so ist die Verteilung von $X_{n+1}$ eindeutig bestimmt durch

(X_{n+1}|X_{n}=k)\sim p^{k*}

Hierbei ist $p^{k*}$ die $k$ -fache Faltung der Verteilung $p$ . Dies folgt direkt aus der Aufsummierung der unabhängigen Zufallsvariablen.

Somit ist der Galton-Watson-Prozess eine zeitlich homogene Markow-Kette in diskreter Zeit und abzählbarem Zustandsraum. Die (abzählbar unendlich große) Übergangsmatrix ist durch

\Pi _{k,l}:=p^{k*}(l)

gegeben. Die Wahrscheinlichkeit, $l$ Individuen zu erhalten, wenn davor $k$ Individuen vorhanden waren, wird durch die Faltung der Verteilung $p$ gegeben.

Die Aussterbewahrscheinlichkeit Bearbeiten

Die Frage, an der Galton und Watson interessiert waren, war die nach der Wahrscheinlichkeit des Aussterbens einer Population. Die Wahrscheinlichkeit, dass in der $n$ -ten Generation kein Individuum mehr lebt, ist $q_{n}:=P(X_{n}=0).$

Da aber die 0 ein absorbierender Zustand ist (es gilt $\Pi _{0,0}=1$ ), also beim einmaligen Betreten nie wieder verlassen werden kann, gilt immer: Ist $X_{n}=0$ , so ist auch $X_{n+1}=0$ . Daraus folgt direkt, dass die Wahrscheinlichkeiten, sich in der 0 zu befinden, monoton wachsend sind: $q_{n+1}\geq q_{n}$ . Somit ist die Aussterbewahrscheinlichkeit

q:=\lim _{n\to \infty }q_{n}

Die Berechnung der Aussterbewahrscheinlichkeit erfolgt mittels der wahrscheinlichkeitserzeugenden Funktion $m_{n}(t)$ der $X_{n}$ . Es gilt $m_{1}(t)=m_{p}(t)$ und dann folgt induktiv unter Ausnutzung der Tatsache, dass Summen über eine zufällige Anzahl von Summanden als Verkettung von erzeugenden Funktionen dargestellt werden können:

m_{n+1}(t)=m_{n}(m_{p}(t))=m_{p}^{\circ (n+1)}(t)

wobei $f^{\circ n}$ die $n$ -fache Komposition (Hintereinanderausführung) einer Funktion $f$ bezeichnet. Da $m_{n}(0)=P(X_{n}=0)$ gilt, ist $q=\lim _{n\to \infty }m_{n}(0)$ . Daraus folgt, dass die Aussterbewahrscheinlichkeit der kleinste nichtnegative Fixpunkt der wahrscheinlichkeitserzeugenden Funktion von $p$ ist, also Lösung der Gleichung

m_{p}(t)=t

.

Es gilt dann:

ist $\operatorname {E} (p)=m'_{p}(1)\leq 1$ , so ist $q=1$ , die Population stirbt also fast sicher aus.
ist $\operatorname {E} (p)=m'_{p}(1)>1$ , so liegt die Aussterbewahrscheinlichkeit echt zwischen 0 und 1.

Ausnahme dieser Betrachtungen ist der Fall, das jedes Individuum genau einen Nachkommen erzeugt: $p(1)=1$ . Dies ist dann ein trivialer absorbierender Zustand.

Beispiel Bearbeiten

Angenommen, jedes Individuum hat unabhängig von allen anderen Individuen eine gewisse Anzahl Nachkommen, die geometrisch verteilt zum Parameter $p={\tfrac {1}{2}}$ ist, also die Wahrscheinlichkeitsfunktion

p(\{k\})={\frac {1}{2^{k+1}}}

für alle $k\in \mathbb {N} _{0}$ besitzt. Dann ist

m_{p}(t)={\frac {p}{1-(1-p)t}}

Per Induktion lässt sich zeigen, dass

m_{p}^{\circ n}(t)={\frac {n(1-t)+t}{n(1-t)+1}}

und demnach

q=\lim _{n\to \infty }m_{p}^{\circ n}(0)=1

gilt, die Population stirbt also fast sicher aus. Das hier verwendete Vorgehen ist die Ausnahme, meistens kann keine direkte Formel für die $n$ -fache Verkettung angegeben werden. Das klassische Vorgehen wäre, den Erwartungswert von $p$ zu berechnen und dann gegebenenfalls den Fixpunkt zu bestimmen. Da hier aber schon der Erwartungswert 1 ist, kann auf die Berechnung des Fixpunktes verzichtet werden.

Modellierung von Epidemien Bearbeiten

Der Beginn einer Epidemie in einer großen Bevölkerung kann als Galton-Watson-Prozess aufgefasst werden. Die "Individuen" sind dann infizierte Personen in der Zeitspanne, in der sie die Infektion auf andere Personen übertragen können. Die Aussterbewahrscheinlichkeit ist die Wahrscheinlichkeit, dass es zu keiner großen Epidemie kommt. Die Zahl E(p) ist die Basisreproduktionszahl der Infektion.^[1]

Galton-Watson-Prozess mit mehreren Typen Bearbeiten

Die Reproduktion einer heterogenen Bevölkerung kann mit einem Galton-Watson-Prozess mit mehreren Typen (engl. multitype Galton-Watson- process) modelliert werden. Angenommen es gibt K Typen von Individuen, die Individuen des gleichen oder eines anderen Typs erzeugen können. Sei pik(n) die Wahrscheinlichkeit, dass ein Individuum des Typs i genau n Individuen des Typs k erzeugt. Dann ist die Matrix der ersten Momente die Matrix mit den Elementen

m_{ik}=\sum _{n=1}^{N}np_{ik}(n)

.

Wenn der größte Eigenwert dieser Matrix < 1 oder = 1 ist, dann ist die Aussterbewahrscheinlichkeit gleich 1^[2].

Galton-Watson-Prozesse mit mehreren Typen werden in der mathematischen Theorie der Epidemien angewendet, wenn die von der Epidemie betroffene Bevölkerung hinsichtlich von epidemiologisch relevanten Eigenschaften heterogen ist.^[3] Im Fall von Geschlechtskrankheiten in der heterosexuellen Bevölkerung ist es naheliegend, zuerst einen Prozess mit zwei Typen, männlich und weiblich, zu betrachten. Um die Ausbreitung von HIV in einer Bevölkerung von monogamen heterosexuellen Paaren zu modellieren, kann man noch weiter gehen und einen Galton-Watson-Prozess mit mehreren Typen definieren, bei dem das Geschlecht und das Alter oder die Ordinalzahl der Partnerschaft, in der die Infektion stattgefunden hat bzw. stattfinden wird, den Typ bestimmen. Dieser Ansatz kann auch zur Berechnung der Basisreproduktionszahl verwendet werden.^[4]

Bisexueller Galton-Watson Prozess Bearbeiten

Bei dieser Variante eines Galton-Watson-Prozesses besteht die Grundpopulation aus männlichen und weiblichen Teilchen, die Paare bilden müssen, um sich fortzupflanzen. Nun spielt für die Frage der Aussterbewahrscheinlickeit auch die Paarungsfunktion (die bestimmt, wie Teilchen zu heterosexuellen Paaren zusammenfinden) und nicht nur ihre Fruchtbarkeit eine entscheidende Rolle. Die Beschreibung der Entwicklung eines solchen Prozesses wird damit i. A. wesentlich komplizierter, jedoch spielt für seine Aussterbewahrscheinlichkeit die sogenannte mittlere asymptotische Reproduktionsrate von Paaren eine ähnlich wichtige Rolle wie $\operatorname {E} (p)$ für den (asexuellen) Galton-Watson-Prozess.

Literatur Bearbeiten

Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005, ISBN 978-3-8348-0063-3.
Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. de Gruyter, 2009, ISBN 978-3-11-021526-7.
Achim Klenke: Wahrscheinlichkeitstheorie. 2. Auflage. Springer-Verlag, Berlin/Heidelberg 2008, ISBN 978-3-540-76317-8.
F. Thomas Bruss: A Note on Extinction Criteria for Bisexual Galton-Watson Processes. 1984, Journal of Applied Probability, Vol. 12, S. 915–919.
Theodore E. Harris. "The Theory of Branching Processes". Berlin/Göttingen/Heidelberg: Springer, 1963

Einzelnachweise Bearbeiten

↑ Niels Becker: Estimation for the discrete time branching process with applications to epidemics. Biometrics 33 (1977), 515-522
↑ K. B. Athreya & P. E. Ney: Branching Processes. Springer-Verlag 1972, p. 186
↑ Niels Becker: The effect of heterogeneity on the spread of disease. In: J. P. Gabriel, C. Lefèvre, P. Picard (Eds.). Stochastic Processes in Epidemic Theory. Lecture Notes in Biomathematics, Vol. 86. Springer-Verlag 1990, 90-103
↑ H. Knolle: A discrete branching process model for the spread of HIV via steady sexual partnerships. J. of Mathematical Biology 48, 423-443 (2004) DOI:10.1007/s00285-003-0241-7

[1] Niels Becker: Estimation for the discrete time branching process with applications to epidemics. Biometrics 33 (1977), 515-522

[2] K. B. Athreya & P. E. Ney: Branching Processes. Springer-Verlag 1972, p. 186

[3] Niels Becker: The effect of heterogeneity on the spread of disease. In: J. P. Gabriel, C. Lefèvre, P. Picard (Eds.). Stochastic Processes in Epidemic Theory. Lecture Notes in Biomathematics, Vol. 86. Springer-Verlag 1990, 90-103

[4] H. Knolle: A discrete branching process model for the spread of HIV via steady sexual partnerships. J. of Mathematical Biology 48, 423-443 (2004) DOI:10.1007/s00285-003-0241-7

[1]

[2]

[3]

[4]