Als Fehlende Werte, Fehlender Wert, Ausfall/Ausfälle, Fehlende Daten, Missing Data, Missing Value bezeichnet man in der Statistischen Datenanalyse das Fehlen von Werten einer Variablen. Siehe auch Antwortausfall, Schweigeverzerrung und Selbstselektion.

Typen Bearbeiten

Unit Nonresponse und Item Nonresponse

Zufälligkeitsgrade fehlender Daten in Regressionsmodellen[1][2]

  • Missing Completly at Random MCAR
  • Missing at Random MAR
  • Missing not at RandomMNAR

Bevölkerungsumfragen Bearbeiten

Stichprobenneutrale Ausfälle

  • Adresse falsch, umbewohnt, niemanden angetroffen

Stichprobenspezifische Ausfälle

  • Verweigerung

Ursachen Bearbeiten

In Bevölkerungsumfragen gibt es unterschiedliche Gründe für das Fehlen einer Antwort:

  • Frage wurde nicht wahrgenommen
  • Frage wurde nicht verstanden
  • Beschaffung der benötigten Information zu aufwendig oder Information nicht bereitstellbat (Weiß nicht)
  • Frage oder Antwortmöglichkeiten treffen nicht zu ("trifft nicht zu") (Missing Data/ Missing Values) im engeren Sinne, system definiert fehlend, gefilterte Fragen aufgrund von Filterführung
  • Verweigerung der Antwort ("keine Angabe")
  • bei der Datenerfassung: Erfassungsfehler, Übertragungsfehler, unleserlich geschrieben, beim automatischen Einlesen nicht erkannt
  • gelöschte Daten (Datenbereinigung): Außreißer, Datenfehler (z.B. falsche Angaben, Messfehler), Filterführung (Fragefilter),

Weitere:

Umgang mit fehlenden Werten Bearbeiten

  • Listenweiser Ausschluss (listwise)
  • Fallweiser Ausschluss (casewise)
  • Imputation fehlender Werte

Unterscheidung in Statistik-Software systemdefinierte vs. benutzerdefinierte fehlende Werte

Folgen Bearbeiten

Systematischer Fehler Zufällige Abweichung

Schweigeverzerrung (non-response bias), z.B. insbesondere bei Sensitiven Fragen, Selektivität siehe auch Störfaktor

Siehe auch Bearbeiten

  • NaN: Weiterhin werden NaNs eingesetzt, um fehlende Werte in Berechnungen darzustellen.
  • Zensierte Daten: die Datensätze werden weggelassen und als fehlende Werte behandelt
  • SYSTAT: erlaubt Analyse fehlender Werte

Einzelnachweise Bearbeiten

  1. http://marktforschung.wikia.com/wiki/Zuf%C3%A4lligkeitsgrade
  2. http://en.wikipedia.org/wiki/Missing_completely_at_random