Suffiziente σ-Algebra

Mengensystem in der mathematischen Statistik zur verlustfreien Datenkompression

Eine suffiziente σ-Algebra ist ein spezielles Mengensystem in der mathematischen Statistik, das verwendet wird, um die Kompression von Daten ohne Informationsverlust mittels suffizienter Statistiken zu formalisieren.

DefinitionBearbeiten

Gegeben sei ein statistisches Modell   sowie eine Teil-σ-Algebra  . Sei   der bedingte Erwartungswert gegeben   unter Verwendung des Wahrscheinlichkeitsmaßes  . Die σ-Algebra   heißt dann suffizient für  , wenn für jedes   eine  -messbare Funktion   existiert, so dass

 .

BemerkungenBearbeiten

Ein Defizit des Suffizienzbegriffes ist, dass wenn   σ-Algebren sind mit   und   suffizient ist (bezüglich einer vorgegebenen Verteilungsklasse), dann folgt im Allgemeinen nicht, dass auch   suffizient ist. Das würde man aber intuitiv erwarten, denn wenn schon die kleinere σ-Algebra ausreichend ist, um eine verlustfreie Datenkompression zu ermöglichen, dann sollte dies ebenso für die größere gelten, da sie ja die kleinere enthält, in der alle Informationen von Belang schon vorhanden sind. Zu beachten ist hier, dass die Datenkompression hier dem Weglassen der Mengen aus der größeren σ-Algebra entspricht.

Formell lässt sich dieses Defizit wie folgt einsehen: ist   suffizient, so gilt laut Definition des bedingten Erwartungswertes

 

für alle  , aber eben nicht notwendigerweise für alle  .

ErläuterungBearbeiten

Klar wird die Bedeutung des Begriffes, wenn man die Wahrscheinlichkeitsmaße aus   auf   einschränkt. Dann gilt

 .

Da aber   nicht von   abhängt, können sich die Wahrscheinlichkeitsmaße nur dann unterscheiden, wenn schon deren Einschränkungen auf   verschieden sind. Damit sind alle möglichen Informationen, welche die Wahrscheinlichkeitsmaße aus   liefern können, bereits in   enthalten.

Stabilität bezüglich OperationenBearbeiten

  • Ist   und ist   suffizient für  , so ist   genau dann suffizient für  , wenn   suffizient ist für  .
  • Sei   die Mengen aller  -Nullmengen. Sind   und   suffizient und ist  , so ist auch   suffizient.
  • Ist   suffizient und ist   eine abzählbar erzeugte σ-Algebra, so ist auch   suffizient. Daraus folgt direkt, dass abzählbar erzeugte Ober-σ-Algebren von suffizienten σ-Algebren wieder suffizient sind.

Suffizienz und dominierte VerteilungsklassenBearbeiten

Mittels des Satzes von Halmos-Savage lassen sich für dominierte Verteilungsklassen   einige stärkere Aussagen zeigen:

  • Sei   suffizient und  . Dann ist jede σ-Algebra   mit
 
ebenfalls suffizient.
  •   ist genau dann suffizient bezüglich  , wenn   suffizient bezüglich   ist für alle  .
  • Sind für   die Verteilungsklassen   auf   dominiert und ist   suffizient, so ist auch   suffizient bezüglich  .

Eine weitere Möglichkeit zur Überprüfung der Suffizienz einer σ-Algebra bei Vorliegen einer dominierten Verteilungsklasse ist das Neyman-Kriterium.

Verwandte BegriffeBearbeiten

Der bekannteste Begriff, der sich aus der Suffizienz einer σ-Algebra ableiten lässt, ist die suffiziente Statistik. Eine Statistik   heißt suffizient, wenn die von ihr erzeugte σ-Algebra   suffizient ist.

Eine Abwandlung des hier behandelten Suffizienzbegriffes ist die starke Suffizienz, die mittels Markow-Kernen definiert wird. Auf borelschen Räumen stimmen die beiden Begriffe überein. Eine Verstärkung der Suffizienz ist die Minimalsuffizienz: eine σ-Algebra ist minimalsuffizient, wenn sie bis auf  -Nullmengen in jeder weiteren suffizienten σ-Algebra enthalten ist. Demnach ist eine minimalsuffiziente σ-Algebra die maximal mögliche Datenreduktion.

Ein ebenfalls verwandter, aber gegenläufiger Begriff ist der einer vollständigen Verteilungsklasse. Dies ist eine Verteilungsklasse  , so dass auf   alle Funktionen unterschieden werden können.

Gegenteil des Suffizienzbegriffs ist die Verteilungsfreiheit. Sie formalisiert, dass eine σ-Algebra keine Informationen trägt bzw. dass eine Statistik keine Informationen überträgt.

Eine Verbindung von Suffizienz, Vollständigkeit und Verteilungsfreiheit schlagen die drei Sätze von Basu.

LiteraturBearbeiten