Benutzerin:Quod-erat-demonstrandum./Artikelwerkstatt/Empirische Regel

Die Empirische Regel (zur besseren Einprägsamkeit der Kernaussage auch als 68–95–99,7 %-Regel bezeichnet) besagt in der Statistik, dass sich normalverteilte Daten stets zu ähnlichen Prozentsätzen in bestimmten, festgelegten Abständen (Standardabweichungen: σ – „Sigma“) um ihren Mittelwert (μ – „My“) gruppieren.

Definition

Bearbeiten

Für Daten mit einer glockenförmigen (symmetrischen) Verteilung gilt:

  • 68 % der Daten liegen innerhalb von einer Standardabweichung um den Mittelwert
  • 95 % der Daten liegen innerhalb von zwei Standardabweichungen um den Mittelwert
  • 99,7 % der Daten liegen innerhalb von drei Standardabweichungen um den Mittelwert
Die Varianz um das arithmetische Mittel einer Normalverteilung wird in Gruppen mit einer Breite von zwei, vier und sechs Standardabweichungen um den Mittelwert eingeteilt. In diesen Gruppen befinden sich 68.27% (maximal eine Standardabweichung vom Mittelwert entfernt), 95.45% (maximal zwei Standardabweichungen vom Mittelwert entfernt) bzw. 99.73% (maximal drei Standardabweichungen vom Mittelwert entfernt) der Werte der gesamten Verteilung.

Mathematisch können diese Daten wie folgt ausgedrückt werden (  sei dabei die Auftretenswahrscheinlichkeit,   sei ein beliebiger beobachteter/gemessener Wert innerhalb einer normal verteilten Zufallsvariable,   sei der Mittelwert der Verteilung und   ihre Standardabweichung):

 

Erweiterung: Tschebyscheff-Theorem

Bearbeiten

Dem Tschebyscheff-Theorem zufolge gilt für Daten mit einer beliebigen Verteilung:

Der Anteil eines Datensatzes, der innerhalb von   Standardabweichungen um den Mittelwert liegt, beträgt mindestens

 

Verwendung

Bearbeiten

In den empirischen Wissenschaften drückt die sogenannte Drei-Sigmas-Faustregel (en.: three-sigma rule of thumb) die konventionelle Heuristik aus, dass von nahezu allen Werten angenommen werden kann, dass sie innerhalb von drei Standardabweichungen um den Mittelwert liegen, und daher eine gefundene Auftretenswahrscheinlichkeit von 99,7% als „an Sicherheit grenzende Wahrscheinlichkeit“ zu verstehen sei.[1] Die Anwendbarkeit dieser Heuristik ist abhängig von der untersuchten Fragestellung. In den Sozialwissenschaften kann ein Ergebnis als „signifikant“ gelten, wenn sein Konfidenzintervall der Ordung des Zwei-Sigma-Effekts (95%) unterliegt, während in der Teilchenphysik eine Konvention besteht, die als Konfidenzintervall einen Fünf-Sigma-Effekt (99,99994 %) vorschreibt, ab der erst von einer Entdeckung gesprochen werden darf.


Tabelle numerischer Werte

Bearbeiten
Range Expected fraction of population inside range Approximate expected frequency outside range Approximate frequency for daily event
Vorlage:Nobr Vorlage:Gaps 2 in 3 Four times a week
μ ± σ Vorlage:Gaps 1 in 3 Twice a week
μ ± 1.5σ Vorlage:Gaps 1 in 7 Weekly
μ ± 2σ Vorlage:Gaps 1 in 22 Every three weeks
μ ± 2.5σ Vorlage:Gaps 1 in 81 Quarterly
μ ± 3σ Vorlage:Gaps 1 in 370 Yearly
μ ± 3.5σ Vorlage:Gaps 1 in 2149 Every six years
μ ± 4σ Vorlage:Gaps 1 in Vorlage:Val Every 43 years (twice in a lifetime)
μ ± 4.5σ Vorlage:Gaps 1 in Vorlage:Val Every 403 years (once in the modern era)
μ ± Vorlage:Gaps 1 in Vorlage:Val Every Vorlage:Val years (once in recorded history)
μ ± 5.5σ Vorlage:Gaps 1 in Vorlage:Val Every Vorlage:Val years (thrice in history of modern humankind)
μ ± 6σ Vorlage:Gaps 1 in Vorlage:Val Every 1.38 million years (twice in history of humankind)
μ ± 6.5σ Vorlage:Gaps 1 in Vorlage:Val Every 34 million years (halfway since the extinction of dinosaurs)
μ ± 7σ Vorlage:Gaps 1 in Vorlage:Val Every 1.07 billion years (a quarter of Earth's history)
μ ± Vorlage:Mathσ   1 in   Every   days

Siehe auch

Bearbeiten
Bearbeiten

Einzelnachweise

Bearbeiten
  1. Diese Verwendung der Empirischen Regel bzw. Drei-Sigma-Regel wird erst seit der Jahrtausendwende immer geläufiger und in den Lehrbüchern wie Schaum's Outline of Business Statistics. McGraw Hill Professional, 2003, S. 359. und Erik W. Grafarend: Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter, 2006, S. 553. vorgestellt.


en:Category:Normal distribution en:Category:Statistical approximations en:Category:Rules of thumb

pl:Odchylenie standardowe#Dla rozkładu normalnego