Diskussion:Hauptkomponentenanalyse/Archiv

Letzter Kommentar: vor 1 Jahr von Biggerj1 in Abschnitt Beispielbild falsch

Griechische Buchstahm

Sagt mal, Jungs, könnt ihr die Matrizen nicht mit ganz normalen Bezeichnern anstatt \Sigma, \Gamma und \Lambda verwenden? Es wäre (zumidnest für mich) um einiges einfacher, den mathematischen Sachverhalt nachzuvollziehen, wenn ich nicht immer die (für mich) fremden Buchstaben entziffern müsste. Überlets euch mal. Gruß und danke Ernie. 00:41, irgendwann im Juni 2005

Ungern. Zum Einen stehen griechische Buchstaben als Parameter der Grundgesamtheit, das lateinische Pendant ist der Stichprobenparameter. Außerdem gehen einem sonst die Zeichen aus, wenn man nicht auf griechische zurückgreifen kann. Irgendwann am frühen Morgen Gruß --Philipendula 00:53, 12. Jun 2005 (CEST)

Ist es möglich, den originalen Datensatz beizufügen, damit man selbst mit ihm spielen kann, oder ist der Datensatz proprietär? --Johannes Hüsing 14:50, 1. Jul 2004 (CEST)

Ist mir gnu-mäßig zu unsicher. --Philipendula 14:55, 1. Jul 2004 (CEST)

Faktorenanalyse wird ja angesprochen, aber wie ist das Verhältnis zur Diskriminanzanalyse? Was ist der Unterschied? -- Nichtich 21:52, 27. Jul 2004 (CEST)

Man könnte die PCA als Spezialfall der Faktorenanalyse bezeichnen. Insofern ist sie vom Verwandschaftsgrad zur Faktorenanalyse eher eine Schwester, wohingegen die DA eher als Schwippschwägerin aufzufassen ist. Lies doch mal nach unter Hauptkomponentenanalyse und Diskriminanzanalyse ;-). Oder interessiert es Dich wirklich? --Philipendula 23:06, 27. Jul 2004 (CEST)

In der Einleitung zu dem Beispiel heißt es "Es gibt tatsächlich noch einen zweiten deutlichen Faktor, der vor allem durch PS-Zahl und Knoten bestimmt wird. Vielleicht könnte man ihn „Geschwindigkeit“ nennen." Die "PS-Zahl" ist ein Maß für die Leistung, und "Knoten" eine Maßeinheit der Geschwindigkeit. Vielleicht könnte man diese Bezeichnungen für die Variablen übernehmen, nur ist es dann natürlich ungünstig, den Faktor auch "Geschwindigkeit" zu nennen. --Qlmatrix 16:53, 17. Nov 2004 (CET)

Was stört Dich an der jetzigen Bezeichnungsweise? --Philipendula 17:28, 17. Nov 2004 (CET)
Nun, "PS" und "Knoten" sind Maßeinheiten und keine Merkmale/Größen. Oben steht ja auch nicht "Meter-Zahl" , sondern Länge und Breite. Zudem ist es verwirrend einen Faktor "Geschwindigkeit" einzuführen, zu dem u.a. ein Merkmal "Geschwindigkeit" gehört und anderes ein Merkmal, das nicht die Geschwindigkeit, sondern die Antriebsleistung beschreibt. --Qlmatrix 15:44, 18. Nov 2004 (CET)
Gut. Natürlich hast Du prinzipiell recht. Allerdings war dieser Artikel keine Vorlesung: Physikalische Grundlagen. Ich dachte eigentlich, dass klar sein müsste, was mit Knoten und PS gemeint ist. Das sind ja nur Variablennamen, ich hätte sie auch x1 und x2 nennen können, das hätte dann gar nicht mit der Sache zu tun. Wenn es nur eine Ausdehnung gegeben hätte, hätte ich sie möglicherweise Meter genannt. Ich habe Knoten in einem Klammerzusatz noch präzisiert. O.K? Ein Faktor wird von einem Bündel Variablen dominiert. Es geht bei der Bezeichnung des Faktors nur darum, eine Interpretation zu finden, um anzuzeigen, welche Variablen vor allem hier wichtig sind. Es gibt auch Faktoren, die kann man gar nicht sinnvoll interpretieren, weil die Mischung der Variablen völlig rätselhaft ist. Geschwindigkeit war hier nur als Symbol gemeint, im Gegensatz zu Größe. Die PS-Zahl bestimmt ja die Höchstgeschwindigkeit eines Schiffs (Jaa, die Größe bestimmt sie auch ;)). Man könnte diesen Faktor auch als Leistung bezeichnen. Wäre Dir das lieber? Ich will nur die Variablenbezeichnung nicht ändern, sonst müsste ich die Grafiken neu machen, was mich nicht gefreut! --Philipendula 00:37, 19. Nov 2004 (CET)

Mich wunderts ein bißchen, dass in meinen Statistikbüchern (Backhaus, Bortz) die PCA als _die_ Faktorenanalyse geführt wird, in diesem Artikel aber steht, die PCA unterscheide sich von der Faktorenanalyse? Ich dachte immer die Faktorenanaylse sei ein Sammelbegriff für eine ganze Reihe von Verfahren, von denen die PCA die bekannteste sei? Natürlich stimmt nicht immer alles was in den Lehrbüchern steht ;-) Trotzdem ein "???"- Mathias Fischer 23:38, 26. Jan 2005 (CET)

Nun, der Backhaus ...räusper... vereinfacht manchmal die Tatsachen. Die Faktorenanalyse ist ein statistisches Modell, bei der eine Variable aus der Linearkombination der Faktorladungen besteht und einem Residuum. Man hebt hier vor allem auf die Kovarianzen ab. Die PCA dagegen ist ein rein mathematisches Verfahren ohne Modellannahmen, die nur dazu dient, die Daten orthogonal abzubilden. Hier sind die Varianzen der Daten von Interesse. Die Residuen werden nicht betrachtet. Man kann allerdings die PCA als Rechenverfahren bei der Faktorenanalyse einsetzen. (siehe etwa Fahrmeir, et al.). --Philipendula 23:53, 26. Jan 2005 (CET)

Habe die Artikel Karhunen-Loève-Transformation und Hauptkomponentenanalyse in einen gepackt, weil Ersterer eigentlich das Gleiche ist wie Letzterer und nur in der Bildbearbeitung einen anderen Namen hat. Das Bild Bild:PCA2.jpg hab ich rausgenommen, denn es ist nur mit großem zusätzlichen Aufwand zu verstehen. Ich warte ergebenst auf diverse Schläge ... Gruß --Philipendula 15:56, 2. Aug 2005 (CEST)


An den Buchstaben sollte es nicht liegen. biggerj1 (Diskussion) 18:51, 21. Jul. 2021 (CEST) :Archivierung dieses Abschnittes wurde gewünscht von: biggerj1 (Diskussion) 18:51, 21. Jul. 2021 (CEST)

Beispielbild falsch

 
Hauptkomponentenanalyse für die Bildverarbeitung: Zwei Hauptkomponenten eines Bildes (oblique rotiert)

Die Koordinatenachsen auf diesem Beispielbild (sowie auch auf den anderen beiden auf der Bildseite verlinkten Bildern) stehen nicht senkrecht aufeinander. Da die Koordinatenachsen der PCA immer senkrecht aufeinander stehen, ist das als sehr verwirrend und falsch einzuordnen und meiner Meinung nach komplett zu löschen, am Besten gleich in allen Sprachen (auf der Bildseite steht was vom französischen Wikipedia). MfG, RSE, 27. Juli 08, 11:12

Nein - das Bild ist korrekt! Und ja - du hast Recht, die Koordinatenachsen stehen bei der PCA natürlich senkrecht aufeinander. Und das tun sie im Bild auch! Dass die gedrehten (roten) Achsen scheinbar nicht senkrecht sind liegt nur daran, dass die Koordinatenachsen (senkrecht + waagerecht, nicht die PCA-Achsen) underschiedlich skaliert sind. Das ist ein leidiges Problem mit fast allen Grafikprogrammen, selbst wenn man die Achsenbereiche identisch vorgibt erzeugen viele Programme leider keine quadratische Grafik, sondern eine rechteckige. Dadurch werden die Achsen unterschiedlich skaliert und Relationen wie "senkrecht zueinander" gehen verloren.
MfG, Rene, 28. Juli 2008, 14:28

Ich möchte das Thema wieder aufgreifen, weil ich grade selbst darauf herein gefallen bin. Das Bild ist ziemlich verwirrend, weil man die unterschiedliche Achsenskalierung nicht sofort erkennt. Wenn ich "Bildverarbeitung" lese und dann in einem Bild unbeschriftete Achsen (auch noch mit umgekehrter Vertikalskala) sehe, gehe ich automatisch von Pixel als Einheit aus. Und die sind bei den allermeisten Grafikprogrammen doch eher genauso breit wie hoch. Ich wäre auch dafür, ein neues Bild oder zumindest eine korrekt skalierte Version des alten Bildes einzufügen.

Außerdem: Wer ist überhaupt Oblique? und warum rotiert er?-- 1420MHz 17:42, 15. Feb. 2010 (CET)

 
Hauptkomponentenanalyse für die Bildverarbeitung: Zwei Hauptkomponenten eines Bildes
So, hab jetzt mal eine gestreckte Version mit Achsenbeschriftung in den Artikel gestellt. Jetzt sieht die Forelle auch gleich viel gesünder aus :-) (nicht signierter Beitrag von 1420MHz (Diskussion | Beiträge) 07:46, 19. Feb. 2010 (CET))

ist raus

Archivierung dieses Abschnittes wurde gewünscht von: biggerj1 (Diskussion) 21:16, 1. Dez. 2022 (CET)