Whitening (Statistik)

Bezeichnung einr linearen Transformation.

Die Whitening-Transformation bezeichnet eine lineare Transformation, bei der ein Vektor von Zufallsvariablen mit bekannter Kovarianzmatrix in eine Reihe von neuen Variablen umgewandelt wird, deren Kovarianzmatrix der Einheitsmatrix gleicht. Angestrebt wird ein Zustand, in dem die einzelnen Variablen unkorreliert sind und jeweils eine Varianz von 1 haben.[1] Die Transformation wird als „Whitening“ bezeichnet, da nach der Umwandlung die Verteilungseigenschaften des Inputvektors denen des Weißen Rauschens entsprechen. Ziel ist eine Stetige Gleichverteilung.

Einige andere Transformationen stehen in enger Beziehung zum Whitening:

  1. die Dekorrelationstransformation entfernt nur Korrelationen aber lässt die Varianzen intakt,
  2. die Standardisierungstransformation setzt die Varianzen 1 aber lässt die Korrelationen intakt,
  3. die Coloring-Transformation übersetzt einen Vektor mit „weißen“ Zufallsvariablen in einen Zufallsvektor mit einer spezifischen Kovarianzmatrix.[2]

Definition Bearbeiten

Angenommen   ist ein Zufalls-Spalten-Vektor mit nicht-singulärer Kovarianzmatrix  und Mittelwert  . Dann führt die Transformation  mit einer Whitening-Matrix  , welche die Bedingung   erfüllt, zu einem „whitened“ Zufallsvektor  mit einheitlicher diagonaler Kovarianz.

Es gibt eine unendliche Anzahl möglicher Whitening-Matrizen  . Gebräuchliche Auswahlen sind   (Mahalanobis or ZCA whitening), die Cholesky-Zerlegung von   (Cholesky whitening) oder die Eigenvektoren von   (PCA whitening).[3]

Kessy et al. (2018) demonstrieren, dass optimale Whitening-Transformationen durch Untersuchen der Kreuzvarianzen und Kreuzkorrelationen von  und  erkannt werden können. Zum Beispiel, die singuläre optimale Whitening-Transformation zum Erreichen der maximalen komponentenweisen Korrelation zwischen dem ursprünglichen   und geweißten   wird durch die Whitening-Matrix   erzeugt. Hierbei ist   die Korrelationsmatrix und   die Varianzmatrix.

Eine Datenmatrix „weißen“ Bearbeiten

Das Whitening einer Datenmatrix folgt den gleichen Transformationen wie Zufallsvariablen. Eine empirische Whitening-Transformation erfolgt durch die Schätzung der Kovarianz (z. B. durch die Maximum-Likelihood-Methode) und anschließender Konstruktion einer entsprechend geschätzten Whitening-Matrix (z. B. durch die Cholesky-Zerlegung).

Siehe auch Bearbeiten

Weblinks Bearbeiten

Einzelnachweise Bearbeiten

  1. Agnan Kessy, Alex Lewin, Korbinian Strimmer: Optimal Whitening and Decorrelation. In: The American Statistician. 2017, ISSN 0003-1305, S. 1–6, doi:10.1080/00031305.2016.1277159, arxiv:1512.00809 (Stand 2018).
  2. Miliha Hossain: Whitening and Coloring Transforms for Multivariate Gaussian Random Variables. Project Rhea, abgerufen am 21. März 2016.
  3. Jerome H. Friedman: Exploratory Projection Pursuit. In: Journal of the American Statistical Association. Band 82, Nr. 397, März 1987, S. 249, doi:10.2307/2289161, JSTOR:2289161.