Diskussion:Post-hoc-Test
Englischer Artikel zum Verlinken
Bearbeitenhttp://en.wikipedia.org/wiki/Post_hoc_test (nicht signierter Beitrag von 62.153.146.198 (Diskussion) 14:09, 16. Nov. 2012 (CET))
SPSS
BearbeitenDer Hinweis, wie SPSS das macht, kann entfallen. Die Abkürzung ist nicht erklärt, und warum soll man ein Statistikprogramm von vielen an dieser Stelle nennen. Johannes Hüsing 16:47, 20. Jan. 2012 (CET)==
- Anstatt den Hinweis entfallen zu lassen, sollte man eher noch Besonderheiten weiterer Statistikprogramm ergänzen. So herum wird ein Schuh draus. Der Wikipedia-Artikel soll doch schließlich einigermaßen anwenderfreundlich gestaltet sein. --Max schwalbe (Diskussion) 16:37, 16. Dez. 2013 (CET)
Mehr nicht-mathematische Erklärung
BearbeitenHallo, ich habe gerade die englische Version gelesen und habe die erheblich besser verstanden.
Spricht etwas dagegen so einen Einleitungstext auch hier einzubauen?
Gruß G --95.116.197.103 11:23, 22. Feb. 2011 (CET)
- Nein, immer ran :) --Sigbert 19:27, 22. Feb. 2011 (CET)
== Aktualität ==
Hallo an die Schreiber und Leser dieses Artikels,
Entschuldigung vorweg für mein "Gemecker", aber ich finde, dieser Artikel ist nicht sehr aktuell. Einige der Aussagen stimmen so nicht bzw. sind missverständlich. Ein Tukey-Test ist heutzutage nichts weiter als ein Spezialfall eines sogenannten Multiplen Kontrasttests. Als solcher werden seine kritischen Werte nicht mehr wie ursprünglich mittels Studentized Range Distribution berechnet, sondern mittels multivariater t-Verteilungen. Ein Tukey-Test erfordert keinesfalls gleiche Stichprobenumfänge! Unbalanciertheit ist überhaupt kein Problem! Zudem gibt es sehr gute approximative Varianten des Tukey-Tests (bzw. aller Multiplen Kontrasttests) bei Varianzheterogenität. Die Aussage "Die Tests können teilweise geordnet werden, je nachdem wie konservativ sie sind: ... " ist verwirrend oder einfach falsch. Ein Tukey-Test ist weder konservativ noch liberal, er ist exakt. Das globale Alpha-Niveau wird exakt eingehalten. Falls mit Least significant difference der Fisher-LSD-Test gemeint ist, dann ist die Aussage, er sei nicht konservativ eine Untertreibung, da dieser bekanntermaßen das globale alpha-Niveau nicht im strengen Sinne einhält. Im Grunde sollte er überhaupt nicht mehr verwendet werden! Er wird es einfach deswegen noch, weil Softwareprogramme ihn (immer noch) anbieten. Die Aussage zum Tukey-Test "es findet keine Bonferroni Korrektur statt" ist natürlich richtig, aber sie leitet fehl! Eine Alpha-Adjustierung wird natürlich vorgenommen! Und sogar eine bessere als bei Bonferroni, da die Korrelationen der Vergleiche explizit mit berücksichtigt werden. Deswegen ist er ja gerade exakt. Sämtliche Alpha-Adjustierungsverfahren auf Bonferroni-Basis tun dies nicht.
Fehler im Text
BearbeitenDer Duncan-Test ist von den genannten Tests der konservativste. Sein kritscher Wert wird nämlich über die studentisierten Variationsbreiten so berechnet, als ob immer alle Mittelwerte bei jedem Vergleich überspannt werden, was ja nur für den Vergleich der beiden Extremwerte zutrifft. Nur für diesen Vergleich ist er exakt und entspricht dem NK-Test, für alle anderen Mittelwertvergleiche ist er konservativ,und zwar um so mehr, je weniger Mittelwerte ein Vergleich überspannt. Konservativ heißt, es werden signifikante Unterschiede nicht ausgewiesen, obwohl die Irrtumswahrscheinlichkeit kleiner das gewählte Signifikanznivau ist. Literatur: Biometrie - Einführung in die Statistik für Biologen und Agrarwissenschaftler, W. Köhler, G. Schachtel, P. Voleske, Springer-Verlag, Berlin, 1984 (nicht signierter Beitrag von 77.0.96.39 (Diskussion) 21:14, 22. Jun. 2013 (CEST))
- Ich habe den Text entsprechend geändert, danke für den Hinweis. --Max schwalbe (Diskussion) 14:56, 25. Jun. 2015 (CEST)
Fehler im Beispiel?
BearbeitenIm angeführten Beispiel wird die Nullhypothese der Varianzhomogenität abgelehnt und daraus geschlussfolgert, dass nun u.a. der Scheffé-Test anwendbar sei. Aus der Übersichtstabelle ergbit sich aber, dass Scheffé Varianzhomogenität vorraussetzt. Das widerspricht sich ja nun - wo liegt der Fehler? --Max schwalbe (Diskussion) 16:33, 16. Dez. 2013 (CET)
Gruppenweise Vergleiche ungeeignet für Signifikanzunterschiede
BearbeitenIn der Einleitung steht, "Post-hoc-Tests geben entweder mit paarweisen Mittelwertvergleichen oder mit Teilgruppenvergleichen Auskunft, welche Mittelwerte sich signifikant voneinander unterscheiden." Das ist meinesachtens falsch. Die Gruppenvergleiche geben lediglich Auskunft darüber, welche Gruppen sich NICHT signifikanz voneinander unterscheiden. Eine Schlussfolgerung, welche Gruppen also signifikant verschieden sind, ist nur teilweise und mitunter überhaupt nicht möglich. (so wie im Beispiel mit den Bundesländern! (Abschnitt 5.2.)). Es führt Anwender in die Irre, wenn man suggeriert, dass gruppenweise Vergleiche zu eindeutigen Aussagen über signifikante Unterschiede führen. So wäre es auch wichtig, etwa beim Duncan-Test darauf hinzuweisen, dass dessen output lediglich als gruppenweiser Vergleich erfolgt und damit für zahlreiche statistische Fragestellungen ungeeignet ist. --Max schwalbe (Diskussion) 14:41, 25. Jun. 2015 (CEST)