F-Verteilung

stetige Wahrscheinlichkeitsverteilung

Die F-Verteilung oder Fisher-Verteilung, auch Fisher-Snedecor-Verteilung (nach Ronald Aylmer Fisher und George W. Snedecor), ist eine stetige Wahrscheinlichkeitsverteilung. Eine F-verteilte Zufallsvariable ergibt sich als Quotient zweier jeweils durch die zugehörige Anzahl der Freiheitsgrade geteilter Chi-Quadrat-verteilter Zufallsvariablen. Die F-Verteilung besitzt zwei unabhängige Freiheitsgrade als Parameter und bildet so eine Zwei-Parameter-Verteilungsfamilie.

Die F-Verteilung wird häufig in einem Test verwendet (F-Test), um festzustellen, ob der Unterschied zweier Stichprobenvarianzen auf statistischer Schwankung beruht oder ob er auf unterschiedliche Grundgesamtheiten hinweist. Auch im Rahmen der Varianzanalyse wird mit einer F-Statistik auf signifikante Unterschiede zwischen Grundgesamtheiten (Gruppen) getestet.[1]

Definition Bearbeiten

 
Dichtefunktion der F-Verteilung mit ausgewählten Freiheitsgraden   und  
 
Verteilungsfunktion der F-Verteilung mit ausgewählten Freiheitsgraden   und  

Eine stetige Zufallsvariable genügt der F-Verteilung  , mit   Freiheitsgraden im Zähler und   Freiheitsgraden im Nenner, wenn sie die Wahrscheinlichkeitsdichte

 

besitzt. Dabei ist mit   die Gammafunktion an der Stelle   bezeichnet.

Den historischen Ursprung obiger Definition der F-Verteilung bildet die Verteilung

 

wobei   und   unabhängige, Chi-Quadrat-verteilte Zufallsvariablen mit   bzw.   Freiheitsgraden sind.

Eigenschaften Bearbeiten

Erwartungswert Bearbeiten

Der Erwartungswert existiert nur für   und hat dann den Wert

 .

Varianz Bearbeiten

Die Varianz ist nur für   definiert und lautet dann

 .

Verteilungsfunktion Bearbeiten

Die Werte der Verteilung   werden meist numerisch ermittelt und in einer Tabelle angegeben. Eine komplette Tabellierung bezüglich aller Freiheitsgrade ist i. A. nicht notwendig, sodass die meisten Verteilungstabellen die Quantile bezüglich ausgewählter Freiheitsgrade und Wahrscheinlichkeiten angeben. Man macht sich hier auch die Beziehung zunutze:

 

wobei   das  -Quantil der F-Verteilung mit   und   Freiheitsgraden bedeutet.

Die F-Verteilung lässt sich geschlossen ausdrücken als

 

wobei   die regularisierte unvollständige Betafunktion darstellt.

Maximum Bearbeiten

Für   nimmt   an der Stelle

 

das Maximum an.

Entropie Bearbeiten

Die Entropie der F-Verteilung (ausgedrückt in nats) beträgt

 

wobei   die Digamma-Funktion bezeichnet.

Beziehungen zu anderen Verteilungen Bearbeiten

Das Zeichen   bedeutet im Folgenden „ist verteilt wie“.

Beziehung zur Beta-Verteilung Bearbeiten

Die Zufallsvariable

 

ist betaverteilt mit Parametern   und     Es gilt:

 

wobei   und   unabhängige Chi-Quadrat-verteilte Zufallsgrößen sind mit   bzw.   Freiheitsgraden.

Beziehung zur Chi-Quadrat-Verteilung Bearbeiten

Aus den unabhängigen   und   Chi-Quadrat-verteilten Zufallsgrößen mit   bzw.   Freiheitsgraden lässt sich

 

konstruieren. Diese Zufallsvariable ist  -verteilt.

Beziehung zur nichtzentralen F-Verteilung Bearbeiten

Für unabhängige Zufallsvariablen   und   ist

 

verteilt nach der nichtzentralen F-Verteilung   mit Nichtzentralitäts-Parameter  . Dabei ist   eine nichtzentrale Chi-Quadrat-Verteilung mit Nichtzentralitäts-Parameter   und   Freiheitsgraden. Für   ergibt sich die zentrale F-Verteilung  .

Dichte der nichtzentralen F-Verteilung Bearbeiten

 [2]

Die Funktion   ist eine spezielle hypergeometrische Funktion, auch Kummersche Funktion genannt und   repräsentiert die oben angegebene Dichte der zentralen F-Verteilung.

Erwartungswert und Varianz der nichtzentralen F-Verteilung sind gegeben durch

  mit  

und

  mit  

Beide ergeben bei   die Formeln der zentralen F-Verteilung.

Beziehung zur Normalverteilung Bearbeiten

Wenn die unabhängigen normalverteilten Zufallsvariablen   die Parameter

 
 

besitzen, sind die jeweiligen Stichprobenvarianzen   und   unabhängig, und es gilt:

 
 

Deshalb unterliegt die Zufallsvariable

 

einer F-Verteilung mit   Freiheitsgraden im Zähler und   Freiheitsgraden im Nenner.

Beziehung zur Studentschen t-Verteilung Bearbeiten

Wenn   (Studentsche t-Verteilung), dann ist  

Das Quadrat einer t-verteilten Zufallsvariablen mit   Freiheitsgraden folgt einer F-Verteilung mit   und   Freiheitsgraden.

Herleitung der Dichte Bearbeiten

Die Wahrscheinlichkeitsdichte der F-Verteilung lässt sich herleiten (vgl. Herleitung der Dichte der Studentschen t-Verteilung) aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen   und  , die beide Chi-Quadrat-verteilt sind.[3]

 .

Mit der Transformation

 

bekommt man die gemeinsame Dichte von   und  , wobei   und   gilt.

Die Jacobideterminante dieser Transformation ist:

 

Der Wert   ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also

 

Gesucht ist nun die Randverteilung   als Integral über die nicht interessierende Variable  :

 

Quantilfunktionen Bearbeiten

Das  -Quantil der F-Verteilung   ist die Lösung der Gleichung   und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

 

mit   als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert   ist in der F-Verteilungstabelle unter den Koordinaten  ,   und   eingetragen oder in der Quantiltabelle der Fisher-Verteilung zu finden.

Für einige Werte  ,   lassen sich die Quantilsfunktionen   explizit ausrechnen. Man löst das Beta-Integral   mit   wobei für ein paar Indizes invertierbare Funktionen auftreten:

 

Aus der jeweils vollständigen Zeile und Spalte kann man sogar die allgemeinen Ausdrücke für höhere Indizes ablesen. Man findet:

 
 

Siehe auch Bearbeiten

Literatur Bearbeiten

  • Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. 12. Auflage, Oldenbourg 1999, S. 156 ff., ISBN 3-486-24984-3.

Weblinks Bearbeiten

Einzelnachweise Bearbeiten

  1. P. R. Kinnear, C. D. Gray (2004): SPSS 12 MADE SIMPLE. Psychology Press. New York. S. 208–209.
  2. Eric W. Weisstein: Snedecor’s F-Distribution. In: MathWorld (englisch).
  3. Frodesen, Skjeggestad, Tofte: Probability and Statistics in Particle Physics. Universitetsforlaget, Bergen – Oslo – Tromsø S. 145 f.