Hauptmenü öffnen

Quantil (Wahrscheinlichkeitstheorie)

Zwei Beispiele: Einmal die Standardnormalverteilung und einmal eine Chi-Quadrat-Verteilung mit drei Freiheitsgraden (schiefe Verteilung). Den jeweiligen Wahrscheinlichkeiten werden ihre Quantile zugeordnet; die Fläche unter der abgebildeten Dichte von minus unendlich bis zum Quantil ist der jeweilige Wert.

Ein Quantil ist ein Lagemaß in der Statistik. Anschaulich ist ein Quantil ein Schwellenwert: ein bestimmter Anteil der Werte ist kleiner als das Quantil, der Rest ist größer. Das 25-%-Quantil beispielsweise ist der Wert, für den gilt, dass 25 % aller Werte kleiner sind als dieser Wert. Quantile formalisieren praktische Aussagen wie „25 % aller Frauen sind kleiner als 1,62 m“ – wobei 1,62 m hier das 25-%-Quantil ist.

Eine bekannte Darstellung und Veranschaulichung einer Quantilfunktion aus der Ökonometrie ist die Parade der Einkommen (Pen’s Parade) des Ökonomen Jan Pen zur Einkommensverteilung.

Genauer ist das -Quantil, wobei eine reelle Zahl zwischen 0 und 1 ist, ein Wert einer Variablen oder Zufallsvariablen, der die Menge aller Merkmalswerte (salopp „die Verteilung“) in zwei Abschnitte unterteilt: Links vom -Quantil liegt der Anteil aller Beobachtungswerte oder der Gesamtzahl der Zufallswerte oder der Fläche unter der Verteilungskurve; rechts davon liegt der jeweilige restliche Anteil . Die Zahl heißt auch der Unterschreitungsanteil.

Spezielle Quantile sind der Median, die Quartile, die Quintile, die Dezile und die Perzentile.

Als Quantil der Ordnung oder -Quantil (veraltet auch „Fraktil“) wird in der Statistik ein Merkmalswert bezeichnet, unterhalb dessen ein vorgegebener Anteil aller Fälle der Verteilung liegt. Jeder Wert unterhalb von unterschreitet diesen vorgegebenen Anteil. Dabei kann der Unterschreitungsanteil auch als eine reelle Zahl zwischen 0 (gar kein Fall der Verteilung) und 1 (alle Fälle bzw. 100 % der Verteilung) angegeben werden.

Inhaltsverzeichnis

DefinitionBearbeiten

Für WahrscheinlichkeitsverteilungenBearbeiten

Gegeben sei eine Wahrscheinlichkeitsverteilung   auf  , also den reellen Zahlen, versehen mit der Borelschen σ-Algebra.

Dann heißt eine reelle Zahl   ein p-Quantil (von  ), wenn gilt:[1]

  und  .

Insbesondere kann mehr als ein p-Quantil existieren.

Für ZufallsvariablenBearbeiten

Gegeben sei eine reelle Zufallsvariable  .

Dann heißt eine reelle Zahl   ein p-Quantil (von  ), wenn gilt:[1]

  und  .

Damit ist das p-Quantil der Zufallsvariable   genau das p-Quantil ihrer Verteilung  .

Definition über VerteilungsfunktionenBearbeiten

Ebenso lassen sich Quantile auch über Verteilungsfunktionen definieren. Ist   die Verteilungsfunktion von   oder von  , so heißt   ein p-Quantil, wenn

  und  .

Hierbei bezeichnet   den linksseitigen Grenzwert.

Bestimmung und BeispieleBearbeiten

Bei stetigen VerteilungsfunktionenBearbeiten

Ist die Verteilungsfunktion   der Zufallsvariable oder der Wahrscheinlichkeitsverteilung stetig, die Verteilung also eine stetige Wahrscheinlichkeitsverteilung, so vereinfacht sich die Definition. Das p-Quantil   ist dann eine Lösung der Gleichung

 

Dies folgt aus der Definition des p-Quantils über die Verteilungsfunktion, da die linksseitige Stetigkeit im zweiten Kriterium aufgrund der Stetigkeit dann mit dem Funktionswert an der Stelle   übereinstimmt.

Beispiel

Betrachtet man die Exponential-Verteilung mit Parametern  , so besitzt sie die Verteilungsfunktion

 

Auflösen der Gleichung

 

für ein   nach   liefert das p-Quantil. Hier ist

 .

Ist die Verteilungsfunktion auf einem Intervall konstant, so existieren mehrdeutige p-Quantile. Betrachtet man die Verteilungsfunktion

 ,

so besitzt die Gleichung

 

unendlich viele Lösungen. Jedes   aus dem Intervall   ist dann ein  -Quantil (also ein Median).

Bei Existenz einer WahrscheinlichkeitsdichtefunktionBearbeiten

Besitzt die Zufallsvariable beziehungsweise die Wahrscheinlichkeitsverteilung eine Wahrscheinlichkeitsdichtefunktion  , (sie ist demnach eine Absolutstetige Verteilung), so ist das p-Quantil   Lösung der Gleichung

 .

Dies folgt direkt aus der Tatsache, dass absolutstetige Verteilungen immer eine stetige Verteilungsfunktion besitzen, diese sich über das Integral bestimmen lässt und der Aussage im obigen Abschnitt.

Beispiel

Bei Verteilungen mit Wahrscheinlichkeitsdichtefunktionen treten mehrdeutige Quantile dann auf, wenn die Dichtefunktion auf einem Intervall konstant null ist. So besitzt die oben über die Verteilungsfunktion definierte Verteilung die Wahrscheinlichkeitsdichtefunktion

 

Der oben hergeleitete mehrdeutige Median wird hier durch das Intervall   verursacht, auf dem die Wahrscheinlichkeitsdichtefunktion konstant gleich null ist.

Nicht-Eindeutigkeit und eindeutige DefinitionBearbeiten

 
Quantile   zu den Wahrscheinlichkeiten  
 
Die Quantilfunktion  

Ist   invertierbar, beispielsweise bei stetigen Verteilungen mit streng monotoner Verteilungsfunktion, fallen obere und untere Grenze zusammen, wodurch die obengenannte Menge einelementig bzw. das p-Quantil eindeutig wird.

Die Funktion   heißt Quantilsfunktion oder verallgemeinerte inverse Verteilungsfunktion, der Wert  , zuweilen auch   geschrieben, dementsprechend  -Quantil von   oder von   (ist klar, welche Zufallsvariable gemeint ist, wird diese oft auch weggelassen.).

In den Grafiken rechts ist   das eindeutige  -Quantil, ferner ist   das eindeutige  -Quantil,  -Quantil sowie  -Quantil.

Hat   eine Sprungstelle bei  , ist also  , so gilt   für fast alle   mit  .

In der Grafik rechts oben ist  

und daher  .

Ist   für ein   nicht invertierbar, also ein Stück weit konstant, besitzt die Quantilfunktion   für dieses   eine Sprungstelle, bei der sie als Funktionswert das kleinstmögliche p-Quantil angibt. In der Grafik ist

  •   das kleinstmögliche  -Quantil,
  •   das größtmögliche  -Quantil, und
  • jedes   ein weiteres  -Quantil.

Beim oft verwendeten 50-%-Quantil sind zur besseren Unterscheidung sogar eigene Begrifflichkeiten üblich: Der Untermedian   ist das kleinstmögliche 50-%-Quantil, der Median das mittlere 50-%-Quantil und der Obermedian das größtmögliche 50-%-Quantil, wobei alle drei deutlich auseinanderfallen können.

BeispielBearbeiten

Das Quantil   (also das 0,3-Quantil) ist der Wert des Punktes einer Verteilung, unterhalb dessen sich 30 % aller Fälle der Verteilung befinden.

 
Ein p-Quantil mit Unterschreitungsanteil

Besondere QuantileBearbeiten

Für einige bestimmte   haben die  -Quantile zusätzliche Bezeichnungen.

MedianBearbeiten

Der Median oder Zentralwert entspricht dem Quantil   (0,5-Quantil). Es erfolgt also eine Einteilung aller Fälle der Verteilung in zwei umfangsgleiche Teile. Bei jeder Einteilung in eine ungerade Anzahl von  -Quantilen mit äquidistant-verteilten   (was eine gerade Anzahl umfangsgleicher Teile impliziert) entspricht der Median jeweils dem mittleren Quantil (beispielsweise dem 2. Quartil Q2 oder dem 50. Perzentil P50).

TerzilBearbeiten

Durch Terzile wird die größengeordnete Menge der Werte in drei Abschnitte gleichen Umfangs geteilt: unteres, mittleres und oberes Drittel.

QuartilBearbeiten

 
Darstellung des Interquartilabstands einer Normalverteilung.

Quartile (lateinisch „Viertelwerte“) sind die Quantile   (0,25-Quantil),   (0,5-Quantil = Median) und   (0,75-Quantil), die auch als Q1 („unteres Quartil“), Q2 („mittleres Quartil“) und Q3 („oberes Quartil“) bezeichnet werden. Sie sind die in der Statistik mit am häufigsten verwendete Form der Quantile.

Der (Inter-)Quartilabstand oder auch (Inter-)Quartilsabstand (englisch interquartile range) bezeichnet die Differenz zwischen dem oberen und dem unteren Quartil, also   und umfasst daher 50 % der Verteilung. Der Quartilabstand wird als Streuungsmaß verwendet.

Siehe auch: Streuung (Statistik)

QuintilBearbeiten

Durch Quintile (lateinisch „Fünftelwerte“) wird die Menge der Werte der Verteilung in 5 umfangsgleiche Teile zerlegt. Unterhalb des ersten Quintils, d. h. des Quantils  , liegen 20 % der Werte der Verteilung, unterhalb des zweiten Quintils (Quantil  ) 40 % usw.

DezilBearbeiten

Durch Dezile (lateinisch „Zehntelwerte“) wird die Menge der verteilten Werte in 10 umfangsgleiche Teile zerlegt. Entsprechend liegen dann z. B. unterhalb des dritten Dezils (Quantil  ) 30 % der Werte. Dezile teilen ein der Größe nach geordnetes Datenbündel in 10 umfangsgleiche Teile. Das 10-%-Dezil (oder 1. Dezil) gibt an, welcher Wert die unteren 10 % von den oberen 90 % der Datenwerte trennt, das 2. Dezil, welcher Wert die unteren 20 % von den oberen 80 % der Werte trennt, usw. Der Abstand zwischen dem 10-%-Dezil und dem 90-%-Dezil heißt Interdezilbereich.

PerzentilBearbeiten

Durch Perzentile (lateinisch „Hundertstelwerte“), auch Prozentränge genannt, wird die Verteilung in 100 umfangsgleiche Teile zerlegt. Perzentile teilen die Verteilung also in 1-%-Segmente auf. Daher können Perzentile als Quantile betrachtet werden, bei denen   eine ganze Zahl ist. So entspricht das Quantil   dem Perzentil P97: unterhalb dieses Punktes liegen 97 % aller Fälle der Verteilung.

a-FraktilBearbeiten

Für   aus   wird das  -Quantil auch als  -Fraktil bezeichnet. Diese Unterteilung wird z. B. in der als „Paretoprinzip“ bezeichneten Vermutung verwendet.

Siehe auchBearbeiten

LiteraturBearbeiten

  • Hans-Otto Georgii: Stochastik, Einführung in die Wahrscheinlichkeitstheorie und Statistik (= De-Gruyter-Lehrbuch). 2. Auflage. de Gruyter, Berlin/New York 2004, ISBN 3-11-018282-3, S. 225 (Definition: Quantil, Quartil, a-Fraktil).

EinzelnachweiseBearbeiten

  1. a b Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 233, doi:10.1515/9783110215274.