Whitening (Statistik)

Die Whitening-Transformation bezeichnet eine lineare Transformation, bei der ein Vektor von Zufallsvariablen mit bekannter Kovarianzmatrix in eine Reihe von neuen Variablen umgewandelt wird, deren Kovarianzmatrix der Einheitsmatrix gleicht. Angestrebt wird ein Zustand, in dem die einzelnen Variablen unkorreliert sind und jeweils eine Varianz von 1 haben.^[1] Die Transformation wird als „Whitening“ bezeichnet, da nach der Umwandlung die Verteilungseigenschaften des Inputvektors denen des Weißen Rauschens entsprechen. Ziel ist eine Stetige Gleichverteilung.

Einige andere Transformationen stehen in enger Beziehung zum Whitening:

die Dekorrelationstransformation entfernt nur Korrelationen aber lässt die Varianzen intakt,
die Standardisierungstransformation setzt die Varianzen 1 aber lässt die Korrelationen intakt,
die Coloring-Transformation übersetzt einen Vektor mit „weißen“ Zufallsvariablen in einen Zufallsvektor mit einer spezifischen Kovarianzmatrix.^[2]

Definition

Angenommen $X$ ist ein Zufalls-Spalten-Vektor mit nicht-singulärer Kovarianzmatrix $M$ und Mittelwert $0$ . Dann führt die Transformation $Y=WX$ mit einer Whitening-Matrix $W$ , welche die Bedingung $W^{\mathrm {T} }W=M^{-1}$ erfüllt, zu einem „whitened“ Zufallsvektor $Y$ mit einheitlicher diagonaler Kovarianz.

Es gibt eine unendliche Anzahl möglicher Whitening-Matrizen $W$ . Gebräuchliche Auswahlen sind $W=M^{-1/2}$ (Mahalanobis or ZCA whitening), die Cholesky-Zerlegung von $M^{-1}$ (Cholesky whitening) oder die Eigenvektoren von $M$ (PCA whitening).^[3]

Kessy et al. (2018) demonstrieren, dass optimale Whitening-Transformationen durch Untersuchen der Kreuzvarianzen und Kreuzkorrelationen von $X$ und $Y$ erkannt werden können. Zum Beispiel, die singuläre optimale Whitening-Transformation zum Erreichen der maximalen komponentenweisen Korrelation zwischen dem ursprünglichen $X$ und geweißten $Y$ wird durch die Whitening-Matrix $W=P^{-1/2}V^{-1/2}$ erzeugt. Hierbei ist $P$ die Korrelationsmatrix und $V$ die Varianzmatrix.

Eine Datenmatrix „weißen“

Das Whitening einer Datenmatrix folgt den gleichen Transformationen wie Zufallsvariablen. Eine empirische Whitening-Transformation erfolgt durch die Schätzung der Kovarianz (z. B. durch die Maximum-Likelihood-Methode) und anschließender Konstruktion einer entsprechend geschätzten Whitening-Matrix (z. B. durch die Cholesky-Zerlegung).

Siehe auch

Weblinks

courses.media.mit.edu (PDF)
The ZCA whitening transformation. (PDF; 4,0 MB) Appendix A von A. Krizhevsky: Learning Multiple Layers of Features from Tiny Images.

Einzelnachweise

↑ Agnan Kessy, Alex Lewin, Korbinian Strimmer: Optimal Whitening and Decorrelation. In: The American Statistician. 2017, ISSN 0003-1305, S. 1–6, doi:10.1080/00031305.2016.1277159, arxiv:1512.00809 (Stand 2018).
↑ Miliha Hossain: Whitening and Coloring Transforms for Multivariate Gaussian Random Variables. Project Rhea, abgerufen am 21. März 2016.
↑ Jerome H. Friedman: Exploratory Projection Pursuit. In: Journal of the American Statistical Association. Band 82, Nr. 397, März 1987, S. 249, doi:10.2307/2289161, JSTOR:2289161.

[1] Agnan Kessy, Alex Lewin, Korbinian Strimmer: Optimal Whitening and Decorrelation. In: The American Statistician. 2017, ISSN 0003-1305, S. 1–6, doi:10.1080/00031305.2016.1277159, arxiv:1512.00809 (Stand 2018).

[2] Miliha Hossain: Whitening and Coloring Transforms for Multivariate Gaussian Random Variables. Project Rhea, abgerufen am 21. März 2016.

[3] Jerome H. Friedman: Exploratory Projection Pursuit. In: Journal of the American Statistical Association. Band 82, Nr. 397, März 1987, S. 249, doi:10.2307/2289161, JSTOR:2289161.

[1]

[2]

[3]