Benutzerin:Quod-erat-demonstrandum./Artikelwerkstatt/Empirische Regel
Die Empirische Regel (zur besseren Einprägsamkeit der Kernaussage auch als 68–95–99,7 %-Regel bezeichnet) besagt in der Statistik, dass sich normalverteilte Daten stets zu ähnlichen Prozentsätzen in bestimmten, festgelegten Abständen (Standardabweichungen: σ – „Sigma“) um ihren Mittelwert (μ – „My“) gruppieren.
Definition
BearbeitenFür Daten mit einer glockenförmigen (symmetrischen) Verteilung gilt:
- 68 % der Daten liegen innerhalb von einer Standardabweichung um den Mittelwert
- 95 % der Daten liegen innerhalb von zwei Standardabweichungen um den Mittelwert
- 99,7 % der Daten liegen innerhalb von drei Standardabweichungen um den Mittelwert
Die Varianz um das arithmetische Mittel einer Normalverteilung wird in Gruppen mit einer Breite von zwei, vier und sechs Standardabweichungen um den Mittelwert eingeteilt. In diesen Gruppen befinden sich 68.27% (maximal eine Standardabweichung vom Mittelwert entfernt), 95.45% (maximal zwei Standardabweichungen vom Mittelwert entfernt) bzw. 99.73% (maximal drei Standardabweichungen vom Mittelwert entfernt) der Werte der gesamten Verteilung.
Mathematisch können diese Daten wie folgt ausgedrückt werden ( sei dabei die Auftretenswahrscheinlichkeit, sei ein beliebiger beobachteter/gemessener Wert innerhalb einer normal verteilten Zufallsvariable, sei der Mittelwert der Verteilung und ihre Standardabweichung):
Erweiterung: Tschebyscheff-Theorem
BearbeitenDem Tschebyscheff-Theorem zufolge gilt für Daten mit einer beliebigen Verteilung:
Der Anteil eines Datensatzes, der innerhalb von Standardabweichungen um den Mittelwert liegt, beträgt mindestens
Verwendung
BearbeitenIn den empirischen Wissenschaften drückt die sogenannte Drei-Sigmas-Faustregel (en.: three-sigma rule of thumb) die konventionelle Heuristik aus, dass von nahezu allen Werten angenommen werden kann, dass sie innerhalb von drei Standardabweichungen um den Mittelwert liegen, und daher eine gefundene Auftretenswahrscheinlichkeit von 99,7% als „an Sicherheit grenzende Wahrscheinlichkeit“ zu verstehen sei.[1] Die Anwendbarkeit dieser Heuristik ist abhängig von der untersuchten Fragestellung. In den Sozialwissenschaften kann ein Ergebnis als „signifikant“ gelten, wenn sein Konfidenzintervall der Ordung des Zwei-Sigma-Effekts (95%) unterliegt, während in der Teilchenphysik eine Konvention besteht, die als Konfidenzintervall einen Fünf-Sigma-Effekt (99,99994 %) vorschreibt, ab der erst von einer Entdeckung gesprochen werden darf.
Tabelle numerischer Werte
BearbeitenRange | Expected fraction of population inside range | Approximate expected frequency outside range | Approximate frequency for daily event |
---|---|---|---|
Vorlage:Nobr | Vorlage:Gaps | 2 in 3 | Four times a week |
μ ± σ | Vorlage:Gaps | 1 in 3 | Twice a week |
μ ± 1.5σ | Vorlage:Gaps | 1 in 7 | Weekly |
μ ± 2σ | Vorlage:Gaps | 1 in 22 | Every three weeks |
μ ± 2.5σ | Vorlage:Gaps | 1 in 81 | Quarterly |
μ ± 3σ | Vorlage:Gaps | 1 in 370 | Yearly |
μ ± 3.5σ | Vorlage:Gaps | 1 in 2149 | Every six years |
μ ± 4σ | Vorlage:Gaps | 1 in Vorlage:Val | Every 43 years (twice in a lifetime) |
μ ± 4.5σ | Vorlage:Gaps | 1 in Vorlage:Val | Every 403 years (once in the modern era) |
μ ± 5σ | Vorlage:Gaps | 1 in Vorlage:Val | Every Vorlage:Val years (once in recorded history) |
μ ± 5.5σ | Vorlage:Gaps | 1 in Vorlage:Val | Every Vorlage:Val years (thrice in history of modern humankind) |
μ ± 6σ | Vorlage:Gaps | 1 in Vorlage:Val | Every 1.38 million years (twice in history of humankind) |
μ ± 6.5σ | Vorlage:Gaps | 1 in Vorlage:Val | Every 34 million years (halfway since the extinction of dinosaurs) |
μ ± 7σ | Vorlage:Gaps | 1 in Vorlage:Val | Every 1.07 billion years (a quarter of Earth's history) |
μ ± Vorlage:Mathσ | 1 in | Every days |
Siehe auch
BearbeitenWeblinks
Bearbeiten- Balasubramanian Narasimhan: The Normal Distribution
- Calculate percentage proportion within x sigmas In: WolframAlpha (Online-Rechner)
Einzelnachweise
Bearbeiten- ↑ Diese Verwendung der Empirischen Regel bzw. Drei-Sigma-Regel wird erst seit der Jahrtausendwende immer geläufiger und in den Lehrbüchern wie Schaum's Outline of Business Statistics. McGraw Hill Professional, 2003, S. 359. und Erik W. Grafarend: Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter, 2006, S. 553. vorgestellt.
en:Category:Normal distribution
en:Category:Statistical approximations
en:Category:Rules of thumb