Zentrales Schwankungsintervall

mathematische Funktion

Das zentrale Schwankungsintervall ist ein Begriff aus der mathematischen Statistik. Er sagt etwas über die Präzision der Lageschätzung eines Parameters (zum Beispiel eines Mittelwertes) aus. Das Schwankungsintervall schließt einen Bereich um den wahren Wert des Parameters in der Grundgesamtheit ein, der – vereinfacht gesprochen – mit einer zuvor festgelegten Sicherheitswahrscheinlichkeit den aus der Stichprobe geschätzten Parameter enthält.

Idee Bearbeiten

Eine Schätzfunktion   ist eine Zufallsvariable für einen unbekannten wahren Parameter   einer Grundgesamtheit. Daher besitzt sie eine Verteilung, und wir können mit der Wahrscheinlichkeit   Intervalle bezüglich der Realisierung angeben.

Das heißt, ziehen wir eine Stichprobe mit den Werten  , dann können wir einen Schätzwert   berechnen und mit einer vorgegebenen Wahrscheinlichkeit ein Intervall angeben, in dem wir den Schätzwert   erwarten.

Die zentralen Schwankungsintervalle haben einen Nachteil: Die Intervallgrenzen enthalten den unbekannten Parameter   (im Gegensatz zum Konfidenzintervall). Trotzdem liefert das zentrale Schwankungsintervall eine wertvolle Information, nämlich die Größe der Abweichung eines aus der Stichprobe geschätzten Parameters vom wahren Parameter.

Parameter Bedingung Zentrales Schwankungsintervall
   ,   bekannt  
   ,   unbekannt  
    beliebig verteilt,     (  bekannt)

  (  unbekannt)

   ,   bekannt  
   ,   unbekannt  
    Bernoulli verteilt mit Parameter     bzw.

 

Dabei sind

  •   die Sicherheitswahrscheinlichkeit,
  •  ,   und   die  -Quantile der Standardnormal-, t- und Chi-Quadrat-Verteilung mit   Freiheitsgraden,
  •   die korrigierte Stichprobenvarianz sowie
  •   der geschätzte Anteilswert aus der Stichprobe.

Formale Definition Bearbeiten

Das zentrale Schwankungsintervall für eine Schätzfunktion   ist das Intervall   für das gilt   bzw.  , also

 .

Das zentrale Schwankungsintervall kann, muss aber nicht, symmetrisch um den unbekannten Parameter liegen. Die Werte   bzw.   hängen ab

  • von dem Verteilungstyp der Schätzfunktion (siehe  ,  ) und
  • der Varianz der Schätzfunktion  :
 .

Spezielle zentrale Schwankungsintervalle Bearbeiten

Für den Mittelwert μ der Grundgesamtheit Bearbeiten

Für den unbekannten Mittelwert   der Grundgesamtheit wird die Schätzfunktion   genommen. Es ergeben sich für die Verteilung von   zwei Fälle:

  1.  , dann gilt   (Reproduktivitätseigenschaft der Normalverteilung) oder
  2.   (beliebig verteilt) und die Voraussetzungen des zentralen Grenzwertsatzes erfüllt, dann gilt  .

Daraus ergeben sich drei Schwankungsintervalle:

1a.   bekannt, dann gilt   und
 
1b.   unbekannt, dann gilt   und
 
2. Es gilt   und
 .

Die Werte   bzw.   sind die  -Quantile der Standardnormalverteilung bzw. der Studentsche t-Verteilung mit   Freiheitsgraden.

Für die Varianz σ² der Grundgesamtheit Bearbeiten

Wenn die Stichprobenvariablen   verteilt sind, dann gibt es für die Varianz   zwei verschiedene mögliche Schätzfunktionen:

  1. Wenn   bekannt ist, dann ergibt sich  .
  2. Wenn   unbekannt ist, dann ergibt sich  .

Im ersten Fall ist   verteilt, und das zentrale Schwankungsintervall ist

 

und im zweiten Fall ist   verteilt, und das zentrale Schwankungsintervall ergibt sich zu

 .

Die Werte   sind die  -Quantile der Chi-Quadrat-Verteilung mit   Freiheitsgraden.

In beiden Fällen liegt das zentrale Schwankungsintervall nicht symmetrisch um  .

Für den Anteilswert π der Grundgesamtheit Bearbeiten

Eine dichotome Zufallsvariable   Anzahl der Erfolge bei   Ziehungen mit Zurücklegen ist binomialverteilt in Abhängigkeit von der unbekannten Erfolgswahrscheinlichkeit  . Bei der Erfüllung der Approximationsbedingungen ist   normalverteilt und auch die Schätzfunktion  . Das zentrale Schwankungsintervall ergibt sich daher zu

 .

Für die praktischen Berechnungen kann man   entweder mit   abschätzen. Alternativ kann man   mit   ersetzen, und   ist der Anteilswert aus der Stichprobe.

Beispiele Bearbeiten

Beispiel 1: Wenn wir die mittlere Studiendauer in Semestern von Studenten auf   genau schätzen wollen mit einer Sicherheitswahrscheinlichkeit  , dann bedeutet dies, dass das zentrale Schwankungsintervall vom wahren Wert   um nicht mehr als   Semester abweichen darf. Die Länge des zentralen Schwankungsintervalls muss also   Semester sein.

Für die mittlere Studiendauer ist nicht bekannt, ob sie normalverteilt ist, d. h. es folgt

 ,

d. h. in Abhängigkeit von   ( ) lässt sich ein Stichprobenumfang bestimmen, um diese Genauigkeit zu erreichen:

 .

Mit   Semester müssen also 1537 Studenten befragt werden, ist   Semester, dann wären es bereits 6147 Studenten nötig. In diesem Beispiel ist nur die Lage, nicht aber die Breite des zentralen Schwankungsintervalls vom wahren Parameter abhängig.

Beispiel 2: In Wahlumfragen werden üblicherweise ca. 1000 Wahlberechtigte befragt. Mit welcher Genauigkeit bei einer Sicherheitswahrscheinlichkeit von   kann ein Wahlforscher das Ergebnis einer Partei vorhersagen?

Die Länge des zentralen Schwankungsintervalls ist

 ,

und mit  ,   ergibt sich eine Länge von  . D. h. mit 95 % Wahrscheinlichkeit wird der Anteilswert aus der Stichprobe um maximal   vom wahren Anteilswert   abweichen. Bei einem wahren Anteilswert von   ergibt sich das zentrale Schwankungsintervall also zu  ; diese große Ungenauigkeit ist einer der Gründe, warum in der Presse/Meinungsforschungsinstituten selten die Genauigkeit von Prognosen mit angegeben wird.

Zentrales Schwankungsintervall und Konfidenzintervall Bearbeiten

Ableitung Bearbeiten

Die Konfidenzintervalle werden direkt aus den zentralen Schwankungsintervallen abgeleitet:

 

  • Subtraktion von  

 

  • Subtraktion von  

 

  • Multiplikation von  

 

Und damit ergibt sich das Konfidenzintervall.

Unterschiede Bearbeiten

Die folgende Tabelle summiert einige Unterschiede zwischen dem zentralen Schwankungsintervall und dem Konfidenzintervall.

Zentrales Schwankungsintervall Konfidenzintervall
Grenzen Sind für jede Stichprobe gleich, also feste Werte Ändern sich bei jeder Stichprobe, sind also Zufallsvariablen
Lage Schließt den unbekannten Parameter der Grundgesamtheit ein Schließt den geschätzten Parameter der Stichprobe ein
Interpretation Gibt an, mit welcher Wahrscheinlichkeit der aus der Stichprobe geschätzte Parameter im Intervall enthalten ist Gibt an, welcher Anteil der Schätzintervalle den wahren Parameter enthalten