Diskussion:Simpson-Paradoxon

Ich habe heute, 16.4.9, in der Universitätsbibliothek Erlangen die Literaturangabe Pearson (1899) recherchiert. Hier stimmt noch nicht einmal der Name der Quelle. Die Bandangabe 173 passt nicht zum angegebenen Jahrgang, auch nicht die Seitenangabe. Eine Seitenzahl, wo Pearson angeblich das Problem vorweggenommen hat, fehlt. Ein Artikel der in Frage kommt, hat 73 Seiten: soll man die etwa alle auf ein unbekanntes Zitat hin überprüfen?! Ich schlage vor, dass solche pseudowissenschaftlichen bibliographischen Angaben verschwinden. Wer Sekundärquellen ungeprüft zitiert, sollte dies kenntlich machen, damit man gewarnt ist. Und wer keine genauen Seitenangaben machen kann, sollte überhaupt nicht zitieren. --R.sponsel 17:20, 16. Apr. 2009 (CEST)Beantworten

Dieser Text ist leider völlig unverständlich. Wer das Simpson-Paradoxon nicht kennt, so wie z. B. ich, hat kaum eine Chance. Was ist denn eine Vierfeldertafel und was ist ein Chancenquotient? Und was haben beide miteinander zu tun? Wenn das in absehbarer Zeit niemand erläutert, würde ich vorschlagen, diesen ohnehin recht kurzen Artikel auf die Löschliste zu setzen. -- Wolfgangbeyer 23:05, 8. Apr 2004 (CEST)

ok, finde ich auch!--^^~

Habe mal diesen ziemlich hingeschluderten Text grob aufpoliert. Man könnte sicher noch mehr tun. Was Vierfeldertafeln und Chancenquotienten sind, bleibt immer noch unklar. Insbesondere ist der letzte Abschnitt Welches Ergebnis ist relevant? noch völlig wirr. Was soll mit den beiden Statements gesagt werden? Das erste scheint mir völlig überflüssig und das zweite ist völlig unverständlich. Hätte nicht wenig Lust, das einfach zu löschen. Und sprachlich: ...die unterschiedliche Zusammensetzung der Patienten ... - schöne Stilblüte. --Wolfgangbeyer 12:57, 5. Jun 2004 (CEST)

Anderes Beispiel Bearbeiten

Das aktuelle Beispiel halte ich für unglücklich, da es nicht ganz leicht zu durchschauen ist (Unterschied zwischen "verbessern" und "bearbeiten") Hat jemand etwas dagegen, dass ich folgendes einbaue. --Suricata 12:29, 17. Jun 2005 (CEST)

Eine Fahrschule hat zwei Prüfungstage mit folgenden Durchfallquoten:

	männlich			weiblich
	bestanden	gesamt	Durchfallquote	bestanden	gesamt	Durchfallquote
1. Tag	1	1	0%	7	8	12,5%
2. Tag	2	3	33,3%	1	2	50%
Summe	3	4	25%	8	10	20%

Am ersten Tag waren die Männer besser, weil Sie eine geringere Durchfallquote hatten, am zweiten ebenfalls, aber insgesamt haben die Frauen die geringere Durchfallquote.

Einige Anmerkungen Bearbeiten

Viele Artikel werden aus den engischen Wikipedia Seiten übersetz, dabei entstehen manchmal "Stilblüten" und kleine Misverständnise. Auf der englischen Seite steht zum Beispiel nicht:

Dieses Phänomen tritt oft bei statistischen Auswertungen
in den Sozialwissenschaften und in der Medizin auf.

sondern:

 .... tritt überraschend oft ...

Ein anderer Zungenschlag, nicht wahr.

Häufig (überraschend häufig?) sind die Beiträge der englischen Wikipedia ausführlicher und klarer; in diesem Fall leider nicht.

Es sollte auf jeden Fall deutlicher herauskommen, dass der Yule-Simpson Effekt nur und auschließlich durch die unglückliche (oder manipulative) Anordnung unterschiedlich großer Einzelgruppen zustande kommt. Bei gleich großen Gruppen (an den Tagen oder innerhalb der Geschlechter) ist es auch egal, ob - wie im Text steht - unterschiedlich strenge Prüfer an den einzelnen Tagen oder für die Gruppen eingesetzt werden. Durch Beispiele mit sich nur wenig unterscheidenden Gruppengrößen fällt das nicht so ins Auge. Im folgenden Beispiel sieht man deutlicher, wie es funktioniert:

	männlich			weiblich
	bestanden	gesamt	Durchfallquote	bestanden	gesamt	Durchfallquote
1. Tag	1	1	0%	999	1000	0,1%
2. Tag	2	3	33,3%	1	2	50%
Summe	3	4	25%	1000	1002	0,2%

Wir sind alle sehr "prozentgläubig" geworden in den letzten 50 Jahren...

"Manipulative" Effekte durch geschickte Gruppenpaarungen kann man auch in anderen Bereichen studieren:

In alter Zeit kämpften zwei Könige um ein Streifen Grenzland und
ließen das durch einen Ritterkampf entscheiden. Jeder König hatte
drei Ritter folgender Kampfkraft (1 bis 10):

  König A   1  5   9
  König B   2  6  10

In drei Runden sollten nun jeweils zwei Ritter gegeneinander antreten.
Kann man einen eigentlich zu erwartenden Sieg von König B verhindern,
wenn man die Paarungen bestimmen darf?

In der Tat!

	König A	König B	Sieger
1. Runde	9	6	A
2. Runde	5	2	A
3. Runde	1	10	B
Summe	15	18

Das ist aber nicht der Simpson-Effekt - nicht mal der Samson-Effekt :-)

--MichaelP 04:18, 19. Jul 2005 (CEST)

E. H. Simpson ??? Bearbeiten

Letzter Kommentar: vor 16 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Wie heißt der Namensgeber für dieses Paradoxon vollständig? Ich finde im Netz immer nur E. H. Simpson, der wird doch wohl richtige Vornamen gehabt haben.--Cepheiden 01:11, 19. Dez 2005 (CET)

Ich habe einfach mal in der englischen Version von Wikipedia nachgesehen, da mir dieser Zustand auch unbefriedigend erschien. Die Abkürzung steht für Edward Hugh, und als weitere Information erhält man, dass er Brite war. Sehr viel mehr ist nicht zu erfahren, anscheinend ist über ihn wenig bekannt.--Slow Phil 11:36, 16. Okt. 2007 (CEST)Beantworten

Danke, damals (2005) stand das auch in der englsichen Wikipedia noch nicht. --Cepheiden 13:19, 16. Okt. 2007 (CEST)Beantworten

Auch dieses Paradoxon?? Bearbeiten

Letzter Kommentar: vor 16 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Ein Schütze schiesst auf eine Ziel und schiess 1x exakt 50 cm Abweichung nach links daran vorbei und 1x exakt 50 cm rechts daran vorbei - im Mittel hat er dann 2x ohne eine Abweichung gehabt zu haben trotzdem nicht getroffen.

Kann mich jemand aufklären, ob das auch diesem Paradoxon zuzuordnen ist? --suit 09:59, 29. Feb. 2008 (CET)Beantworten

-Das hat damit überhaupt nichts zu tun. Dass man positive und negative Abweichung nicht miteinander verrechnen darf ist in keinster Weise ein Paradoxon.

Inwiefern ist das ein Paradoxon? Bearbeiten

Letzter Kommentar: vor 14 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Inwiefern ist das Simpson-Paradoxon ein Paradoxon? Ich sehe da nichts widersprüchliches noch unauflösbares. Zumindest wird aus dem Artikel nicht ersichtlich was daran ein Paradoxon sein soll, also bitte ich das das doch erleutert werden sollte. --217.81.83.172 19:13, 22. Mär. 2010 (CET)Beantworten

Das erste Beispiel hast du dir angesehen? --suit 20:07, 22. Mär. 2010 (CET)Beantworten

Risikostrukturausgleich von Krankenkassen Bearbeiten

Letzter Kommentar: vor 13 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Bei Krankenkassen wird die unterschiedliche Zusammensetzung der Patienten durch einen Risikostrukturausgleich berücksichtigt. Bei den Abrechnungen können zum Teil Patienten mit besonders schweren Erkrankungen extra bewertet werden und fallen nicht in die Obergrenzen für die Berechnung.

So stand´s bis eben im Artikel. Ist zwar interessant, gehört aber mMn eher nach Teilmenge(nverhalten) o.ä., im Moment wäre es dort wegen der rein mathematischen Erläuterung (ohne Anwendungsbeispiele) jedoch leider etwas deplatziert. --Hæggis 18:39, 11. Aug. 2010 (CEST)Beantworten

Besseres Beispiel für ein Simpson Paradoxon? Bearbeiten

Letzter Kommentar: vor 4 Jahren4 Kommentare4 Personen sind an der Diskussion beteiligt

Hallo zusammen,

dieses Beispiel hatten wir in einer Vorlesung zu dem Thema, ich finde es relativ einleuchtend:

Cox et al. (1991)

Mit welchem Medikament möchten Sie lieber behandelt werden?

	Medikament A	Medikament B
Überlebensrate nach 5 Jahren	60,5%	65,25%

Medikament B scheint das wirksamere Medikament zu sein, da es die Überlebensdauer verlängert. Es fehlt aber eine entscheidende Information: Unter den Versuchspersonen in Gruppe B waren wesentlich mehr Patienten im Frühstadium!

Gruppenzusammensetzung nach Behandlung:

	A	B
Frühstadium	N=22 (54%)	N=53 (67%)
Spätstadium	N=19 (46%)	N=26 (33%)

Hypothetische Heilungsraten:

Frühstadium	95%	90%
Spätstadium	20%	15%

Nun die durchschnittliche Überlebensrate für A nach 5 Jahren: 0.54*95% + 0.46*20% = 60.5%

Die Durchschnittliche Überlebensrate für B nach 5 Jahren: 0.67*90% + 0.33*15% = 65.25%

Obwohl Medikament B in seiner Gesamtheit eine höhere Heilungschance aufweist, besitzt Medikament A sowohl im Spätstadium als auch im Frühstadium der Krankheit eine bessere hypothetische Heilungschance!

- dnlstnmnn (10:51, 11. Feb. 2011 (CET), Datum/Uhrzeit nachträglich eingefügt, siehe Hilfe:Signatur)

Warum nicht die Änderung der Krebshäufigkeit? Heutzutage sterben prozentual mehr Menschen an Krebs als vor hundert Jahren, aber wenn man das auf die einzelnen Altersstufen aufschlüsselt, sterben in jedem Alter weniger Menschen an Krebs als vor hundert Jahren. Die erhöhte Krebshäufigkeit ist nur darauf zurückzuführen, dass das Alter, in dem man stirbt, durchschnittlich höher ist als früher. --Hob 11:35, 11. Feb. 2011 (CET)Beantworten

Ich fand das alte Beispiel mit der Fahrprüfung deutlich besser und verständlicher. Sowohl was die Zahlen angeht als auch das Beispiel an sich und den erklärenden Text darunter. Den aktuellen Text "Obwohl Medikament B in seiner Gesamtheit eine höhere Heilungschance aufweist, besitzt Medikament A sowohl im Spätstadium als auch im Frühstadium der Krankheit eine bessere hypothetische Heilungschance!" finde ich sogar ausgesprochen unglücklich gewählt. Mag sein dass du das Beispiel mit den Medikament in der Vorlesung hattest, das macht es aber nicht automatisch besser. Beispiele sollten so einfach und anschaulich wie möglich sein. Ich werde die Änderung rückgängig machen. Sollte sich eine Mehrheit für die Version mit den Medikament aussprechen, dann werde ich sie natürlich nicht mehr anfassen. -- PeterGerbach 10:39, 20. Feb. 2012 (CET)Beantworten

Hallo, ich würde gerne (nach über 4 bzw. 5 Jahren) etwas zur Diskussion beitragen. Ich finde das medizinische Beispiel auch besser, gut vielleicht könnte / sollte man die Zahlen vereinfachen. Der Hauptgrund für meine Bevorzugung ist, dass hier aus der Benamsung der Gruppe / Kohorte bzw. des Zeitpunktes dem Leser schon klar wird, dass die Gesamtgruppe, die "viel" mehr Mitglieder als die andere Gesamtgruppe im Zeitpunkt mit besseren Ergebnis hat, auch das bessere Gesamtergebnis hat. Zusätzlich bildet das medizinische Beispiel auch besser die Realität ab: 1. Fahrschuldurchfallquote von 0,1% ?? 2. schon bei Wahrscheinlichkeiten / rel. Häufigkeiten, die sich nur um 5 Prozentpunkte unterscheiden, und Gruppenverteilungen, die sich um jeweils 10 als ingesamt 20 Prozentpunkte unterscheiden, kann das Simpson-Paradoxon auftreten. --84.183.99.153 15:01, 14. Aug. 2016 (CEST)Beantworten

Das erste Beispiel in en:Simpson's_paradox, das in dem Bild oben rechts, finde ich besonders einleuchtend, wegen der graphischen Darstellung. --VKitzing (Diskussion) 16:17, 17. Jan. 2020 (CET)Beantworten

Ergebnis der Landtagswahlen 2016 weist nicht das Simpson-Paradoxon auf! Bearbeiten

Letzter Kommentar: vor 7 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Im Artikel([1]) wird die Landtagswahl 2016 als Beispiel für das Simpson-Paradoxon mit mehreren Alternativen aufgeführt. Das ist aber falsch. Grundlegend für das Simpson-Paradoxon ist, dass eine Alternative (Wortwitz nicht beabsichtigt!) in allen Kategorien vor einer zweiten Alternative liegt, in der Gesamtbetrachtung aller Kategorien aber hinter der zweiten Alternative liegt. Bei dem Landtagswahl-Beispiel ist das nicht der Fall!

In der Tat kann hier das Simpson-Paradoxon gar nicht auftreten, da die Bezugsgröße für alle Parteien (innerhalb jedes Landes) die gleiche ist: die Wähleranzahl des Bundeslandes. Wenn Partei A in allen Bundesländern einen höheren Stimmenanteil als Partei B bekommen hat, so hat Partei A auch in der Summe aller Länder einen höheren Stimmenanteil.

Insbesondere ist auch der Satz „Auch hier liegt der Grund in der unterschiedlichen Zahl an Wählern in den drei Bundesländern.“ (was für das Simpson-Paradox tatsächliche eine notwendige Bedingung ist) für dieses Beispiel falsch, vgl. folgendes Beispiel mit zwei Ländern mit gleicher Wählerzahl, in welchen jeweils B die zweitmeisten Stimmen erhalten hat, insgesamt in der Summe aber nur die drittmeisten Stimmen aufweist.

	Land 1	Land 2	Summe
A	5	1	6
B	2	2	4
C	1	5	6

Was bei diesen Landtagswahlen lediglich vorliegt, ist das sehr viel weniger interessante Faktum, dass eine Partei, die in einem Bundesland deutlich weniger Stimmen als eine andere Partei, aber etwas mehr als eine dritte Partei und in einem weiteren Bundesland sehr viel weniger Stimmen als die dritte Partei, aber mehr als die zweite bekommt, insgesamt durchaus am wenigsten der drei Parteien bekommen kann, selbst wenn sie in beiden Bundesländern die zweitmeisten Stimmen bekommt. Das hat nichts mit dem Simpson-Paradoxon zu tun und ist insgesamt auch nicht paradox. Ich entferne den Abschnitt daher aus dem Artikel. --Arno Nymus (Diskussion) 19:50, 28. Jun. 2016 (CEST)Beantworten

Keine Evidenz für eine Klage gegen UC Berkeley Bearbeiten

Letzter Kommentar: vor 3 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Ich kann beim besten Willen keine Evidenz für die behauptete Klage gegen die Uni finden. In der Studie von Bickel steht davon nichts. Die Klage wird zwar anscheinend in einigen wiss. Artikeln und Lehrbüchern behauptet, es findet sich jedoch nie ein Verweis auf einen zeitgenössischen Zeitungsartikel, eine Gerichtsentscheidung oder Ähnliches, und ich konnte beim besten Willen keinen Medienbericht aus der Zeit finden, was man bei einer solchen Klage denke ich erwarten würde. Laut diesem Blogeintrag handelt es sich bei der Klage um eine moderne Legende, und laut eines (leider wegen Paywall für mich nicht lesbaren) Artikels im WSJ befürchtete laut Bickel die Uni lediglich eine Klage. ich habe daher den Satz mit der Klage überarbetet. Möglicherweise könnte man erwähnen, dass es die weit verbreitete Legende um eine tatsächliche Klage gibt, aber weil sich hierfür die mir zugängliche Evidenz auf den Blogartikel beschränkt, bin ich da zurückhaltend.--EpicBroccoli (Diskussion) 15:19, 14. Aug. 2020 (CEST)Beantworten

Beispiel mit der Fahrschule verbessern Bearbeiten

Letzter Kommentar: vor 2 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Ich finde das Beispiel mit der Fahrschule ließe sich noch verbessern. Ich denke man kann es sehr gut erklären, in dem man in der zweiten Tabelle einzig und allein die Werte für die Frauen am 2. Tag von 1 und 2 auf 100 und 200 ändert. Die einzelnen Durchfallquoten ändern sich dann nicht, aber dennoch ist das Gesamtergebnis ein ganz anderes. Das lässt sich auch sehr gut mit dem Vektorbild verknüpfen: alleine durch Verlängerung z.B. des roten Vektors "2" lässt sich der rote Gesamtvektor mühelos steiler als der blaue Gesamtvektor gestalten. (nicht signierter Beitrag von 77.0.76.168 (Diskussion) 11:42, 30. Nov. 2021 (CET))Beantworten

Abschnitt hinzufügen