Umtauschparadoxon

Das Umtauschparadoxon (oder Briefumschlagparadoxon) beschreibt eine spezielle mathematische Situation, bei der das naive Rechnen mit Erwartungswerten, insbesondere die Anwendung des Indifferenzprinzips, zu einem Widerspruch zum gesunden Menschenverstand führt. Es hat Ähnlichkeit mit dem Zwei-Zettel-Spiel und dem Ziegenproblem, dieses hat jedoch einen anderen wahrscheinlichkeitstheoretischen Hintergrund.

GeschichteBearbeiten

Das Umtauschparadoxon lässt sich zumindest bis 1953 zurückverfolgen und wurde damals in einem Buch des belgischen Mathematikers Maurice Kraitchik sinngemäß folgendermaßen formuliert:

„Zwei gleich wohlhabende Personen treffen einander und wollen die Inhalte ihrer Geldbörsen vergleichen. Keiner weiß, wie viel Geld der andere in der Börse hat. Sie vereinbaren folgendes Spiel: Derjenige, der weniger Geld in der Börse hat, gewinnt den Inhalt der Geldbörse des anderen. Falls beide gleich viel haben sollten, behält jeder sein Geld. Nun könnte einer der beiden folgende Überlegung anstellen: „Angenommen, ich habe den Betrag A in meiner Börse. Dann ist das das Maximum, das ich verlieren kann. Mit Wahrscheinlichkeit 0,5 gewinne ich allerdings und habe danach mehr als 2A. Daher ist das Spiel günstig für mich.“ Der andere könnte allerdings genauso argumentieren. Aus Symmetriegründen muss das Spiel aber fair sein. Worin liegt der Trugschluss dieser Argumentation?“[1]

Martin Gardner verbreitete das Rätsel 1982 in seinem Buch Aha! Gotcha, ebenfalls in der Gestalt eines Geldbörsenspiels.[2] Die heutige Form mit den beiden Briefumschlägen wurde 1989 von Barry Nalebuff formuliert.[3]

Die UmtauschsituationBearbeiten

Herr Lemke möchte Herrn Schmidt beschenken und gibt ihm zwei Briefumschläge mit den Worten „Ich schenke Ihnen einen dieser Umschläge. In beiden befindet sich ein Geldbetrag, im einen doppelt so viel wie im anderen. Sie dürfen einen Umschlag öffnen und dann entscheiden, welchen der beiden Umschläge Sie nehmen.“

Herr Schmidt öffnet einen zufällig ausgewählten der beiden Umschläge, findet zum Beispiel 100 Euro und überlegt: „Ich habe in diesem Umschlag 100 Euro. Wenn ich tausche, habe ich mit einer Wahrscheinlichkeit von 50 % 200 Euro und mit der gleichen Wahrscheinlichkeit 50 Euro. Dies macht einen Erwartungswert von 125 Euro.“

 

Nach dieser Überlegung würde sich das Tauschen lohnen.

Das ParadoxonBearbeiten

Die folgende Überlegung führt Herrn Schmidts Rechnung vermeintlich ad absurdum: Wenn die Rechnung von Herrn Schmidt für jeden beliebigen Betrag das Ergebnis lieferte, dass sich Tauschen lohne, so bräuchte er den Umschlag gar nicht zu öffnen, sondern könnte gleich den anderen Umschlag nehmen. Es kann aber nicht sein, dass der andere Umschlag immer besser ist, da ja beide Umschläge vor dem Öffnen offensichtlich gleichwertig sind.

Die DenkfalleBearbeiten

Eine mögliche Denkfalle besteht darin, dass Herr Schmidt entweder das Indifferenzprinzip oder die bedingte Wahrscheinlichkeit falsch anwendet, also davon ausgeht, dass die 100 Euro mit einer 50-50-Wahrscheinlichkeit den halben oder den doppelten Betrag darstellen. Abhängig von Herrn Lemkes Auswahlverfahren kann das für diesen Betrag richtig sein, jedoch nicht für alle Beträge. Zunächst wird tatsächlich mit einer 50 %-Wahrscheinlichkeit der Umschlag mit dem kleineren oder größeren Betrag geöffnet. Es handelt sich daher entweder um die 50/100- oder um die 100/200-Euro-Kombination. Daraus kann aber nicht geschlossen werden, dass unter der Bedingung, dass 100 Euro gefunden wurden, die Wahrscheinlichkeiten für die beiden Kombinationen gleich sind. Über die Wahrscheinlichkeiten dieser Fälle ist nichts bekannt, und das Indifferenzprinzip ist ausgehend von einem aufgedeckten Betrag   auf die Ereignisse „doppelter Betrag“ ( ) und „halber Betrag“ ( ) aus grundsätzlichen Erwägungen heraus nicht anwendbar. In der Denkfallen-Sammlung[4] wird das an einigen Rechenbeispielen weiter verdeutlicht.[5][6]

Hingegen ist es durchaus möglich, dass, ausgehend vom Wert des geöffneten Umschlags, der bedingte Erwartungswert des ungeöffneten Umschlags immer höher ist; dies aber nur, wenn der Erwartungswert des ungeöffneten Umschlags größer als der Erwartungswert des geöffneten Umschlags ist oder wenn beide Erwartungswerte unendlich sind.

Analyse mit bedingten WahrscheinlichkeitenBearbeiten

Die Rechnung mit einer 50-50-Wahrscheinlichkeit entspringt also einer unzulässigen Anwendung des Indifferenzprinzips. Die Berechnung des Erwartungswertes kann aber auch bei anderen Wahrscheinlichkeiten zu dem scheinbaren Widerspruch führen, dass ein Tausch immer angezeigt wäre. Um allgemein eine sinnvolle Tauschentscheidung zu treffen, muss sich Herr Schmidt vor Augen halten, dass er bedingte Wahrscheinlichkeiten verwenden muss, wenn er den Betrag im geöffneten Umschlag in seine Rechnung einbezieht. Der folgende Abschnitt enthält eine formale Analyse, ob bei einer gegebenen Wahrscheinlichkeitsverteilung ein Tausch für gewisse Beträge sinnvoll sein kann und ob es überhaupt eine Wahrscheinlichkeitsverteilung geben kann, bei der ein Tausch immer angezeigt ist. Ob diese Wahrscheinlichkeitsverteilung eine subjektive Einschätzung von Herrn Schmidt ist oder ob eine Wahrscheinlichkeitsverteilung der Beträge tatsächlich bekannt ist, ist für die Analyse unwesentlich.[7] Dazu kann beispielsweise folgende Notation verwendet werden:

  • die Zufallsvariable   bezeichnet den kleineren Betrag in den Umschlägen (im anderen Umschlag befindet sich dann der Betrag  ).
  • die Zufallsvariable   bezeichnet den Betrag, den Herr Schmidt im zuerst geöffneten Briefumschlag findet.
  • die Zufallsvariable   bezeichnet den Betrag, der im anderen, noch ungeöffneten Umschlag ist.

Da beide Umschläge mit gleicher Wahrscheinlichkeit gewählt werden, haben   und   die gleiche Verteilung, sind aber wegen   voneinander stochastisch abhängig. Für die Erwartungswerte gilt  . Herr Schmidt will offensichtlich die Erwartung von   berechnen, wenn er   kennt, also die bedingte Erwartung  .

Diskrete VerteilungenBearbeiten

Zunächst soll der Fall behandelt werden, dass   (und damit auch   und  ) eine diskrete Verteilung besitzt. In diesem Fall bezeichne   die Wahrscheinlichkeit, dass der kleinere Betrag in den Umschlägen gleich   ist. Für die Verteilung von   und   folgt dann

 

Im diskreten Fall gilt für die gesuchte bedingte Erwartung[8]

 

Die bedingte Wahrscheinlichkeit   ist laut Problemstellung nur dann von Null verschieden, wenn entweder   oder  . In diesen Fällen gilt für die Wahrscheinlichkeit, dass Herr Schmidt den doppelten Betrag im anderen Briefumschlag findet,

 

Die bedingte Wahrscheinlichkeit, dass Herr Schmidt den halben Betrag im anderen Briefumschlag findet, ist gerade komplementär hierzu, also gilt:

 

Sofern der Erwartungswert der Verteilung mit den korrekten Wahrscheinlichkeiten existiert, erhielte man

 

Zu tauschen würde sich demnach genau dann auszahlen, wenn   gilt; dies ist genau dann der Fall, wenn   gilt. Verteilungen, die diese Bedingung für alle möglichen   erfüllen, lassen sich konstruieren,   hat dann aber keinen endlichen Erwartungswert. Für so eine a-priori-Verteilung ist der gegebene Vorteil der Tauschentscheidung für jeden vorgefundenen Wert im geöffneten Umschlag zwar nicht intuitiv, aber nicht paradox.[7]

Natürlich widerspricht die Annahme, dass beliebig hohe Beträge im Umschlag sein können, der praktischen Einschränkung, dass niemand, also auch nicht Herr Lemke, beliebig viel Geld zur Verfügung hat.

BeispielBearbeiten

Wenn man eine Wahrscheinlichkeitsverteilung annimmt, mit der Herr Lemke das Geld in die Briefumschläge verteilt, lässt sich die Situation sehr gut simulieren. Beispielsweise sei angenommen, er bestimmt den Betrag, indem er einen fairen Würfel wirft. Zeigt der Würfel   Augen, so steckt er   Euro in den einen und   Euro in den anderen Umschlag. Herr Schmidt findet dann mit Wahrscheinlichkeit   den Betrag 25 Euro im Umschlag, mit Wahrscheinlichkeit je   einen der Beträge 50, 100, 200, 400 oder 800 Euro und wieder mit Wahrscheinlichkeit   den Betrag 1600 Euro. Tauscht er nicht, so beträgt der Erwartungswert des Geldgeschenkes also

 

Tauscht Herr Schmidt in jedem Fall, so ändert sich sein Erwartungswert nicht, da er insbesondere auch den Betrag von 1600 Euro tauscht, obwohl er in diesem Fall nichts gewinnen kann. Vermutet Herr Schmidt aber, dass wohl kaum mehr als 1000 Euro im Umschlag sind, und entscheidet sich daher, dann und nur dann zu tauschen, wenn höchstens 500 Euro im Umschlag sind, so ändern sich die Wahrscheinlichkeiten: Nach dem Tausch hat Herr Schmidt dann weiterhin mit Wahrscheinlichkeit   den Betrag 25 Euro im Umschlag, ebenso mit Wahrscheinlichkeit je   einen der Beträge 50, 100 oder 200 Euro, den Betrag von 400 Euro allerdings nur noch mit Wahrscheinlichkeit   (da Herr Schmidt bei 800 Euro nicht mehr tauscht), dafür aber mit Wahrscheinlichkeit   den Betrag von 800 Euro und wieder mit Wahrscheinlichkeit   den Betrag 1600 Euro. Der Erwartungswert des Geldgeschenkes ist nun also

 

Schätzt Herr Schmidt die Situation besser ein und beschließt, erst ab 1000 Euro aufs Tauschen zu verzichten, kann er den Erwartungswert sogar auf 460,62 Euro erhöhen; wird er aber zu gierig und tauscht beispielsweise bis zu 2000 Euro, so fällt er wieder auf den Ausgangswert 393,75 Euro zurück.

Für Herrn Schmidt ist es natürlich schwierig, Herrn Lemke richtig einzuschätzen; wesentlich ist aber, dass das Paradoxon verschwindet, sobald man irgendeine konkrete Wahrscheinlichkeitsverteilung annimmt. Je nach Tauschstrategie von Herrn Schmidt ändert sich der Erwartungswert des Geldgeschenks; die Strategie „Tausche immer“ ist aber gleich gut (oder schlecht) wie die Strategie „Tausche nie“.

Stetige VerteilungenBearbeiten

Im Falle, dass der kleinere Geldbetrag   (und damit auch   und  ) eine stetige Verteilung besitzt, ergeben sich im Wesentlichen qualitativ die gleichen Ergebnisse, allerdings können die obigen Formeln für den diskreten Fall nicht einfach analog übernommen werden.[7]

Außerdem muss beachtet werden, dass im stetigen Fall das bedingende Ereignis   für alle   die Wahrscheinlichkeit null hat, so dass nicht mehr die elementaren Definitionen für die bedingte Wahrscheinlichkeit und den bedingten Erwartungswert verwendet werden können, sondern abstraktere Versionen benutzt werden müssen.

Es bezeichne   die Dichtefunktion von  . Die Variablen   und   haben dann beide die gleiche Dichte   und es gilt

 

Im Vergleich zum diskreten Fall erscheint vielleicht der Faktor   zunächst überraschend. Allerdings wäre die durch den „analog“ gebildeten Ausdruck   definierte Funktion nicht einmal eine Wahrscheinlichkeitsdichte. Die korrekte Formel erhält man beispielsweise durch Betrachten der Verteilungsfunktionen   und  . Da die Auswahl der Umschläge mit gleicher Wahrscheinlichkeit und unabhängig von   erfolgt, gilt

 

also

 

Differenzieren nach   ergibt wegen   und   obige Formel für  .

Als bedingte Wahrscheinlichkeit, dass Herr Schmidt im anderen Umschlag den doppelten Betrag findet, kann nun

 

und entsprechend für den anderen Fall

 

gesetzt werden.[7]

Damit erhält man

 

als mögliche Version des bedingten Erwartungswerts. Somit gilt   genau dann, wenn   ist.

Wird beispielsweise für   eine stetige Gleichverteilung auf dem Intervall   angenommen, so ergibt sich

 

Der erste und der dritte Fall sind anschaulich klar: Wenn im geöffneten Umschlag weniger als 50 Euro sind, muss es sich um den kleineren der beiden Beträge handeln, bei mehr als 800 Euro um den größeren. Im mittleren Fall ist hingegen ein Vergleich mit dem diskreten Fall interessant, denn eine diskrete Gleichverteilung von   auf der Menge   ergibt in diesem Bereich nur   für gerades  , aber   für ungerades   als bedingten Erwartungswert.

Es existieren auch stetige Verteilungen, so dass formal   für alle   gilt. Wie im diskreten Fall hat dann   jedoch keinen endlichen Erwartungswert. Ein Beispiel ist die Verteilung von   mit der Dichte   für   (und   sonst). Hier gilt formal für alle  

 

Erklärung durch die Formel vom totalen ErwartungswertBearbeiten

Der diskrete Fall kann durch die Formel vom totalen Erwartungswert[9] anschaulich erklärt werden. Hierzu wird die Ausgangssituation leicht verallgemeinert. Es wird vorab nur angenommen, dass die beiden Umschläge über einen Zufallsprozess simultan mit Geld gefüllt werden und dass einer der beiden Umschläge danach ausgewählt und geöffnet wird. Dazu wird die Notation leicht verändert:

  • der diskrete Zufallsvektor   bezeichnet die Geldbeträge, die sich in den beiden Umschlägen befinden.
  • die Zufallsvariable   bezeichnet den Betrag im geöffneten Umschlag, die Zufallsvariable   den Betrag im anderen, nicht geöffneten Umschlag.
  •   und   sind die Wahrscheinlichkeiten, dass der erste bzw. der zweite Umschlag geöffnet wird.

Es soll   und   sein und die Erwartungswerte   und   sollen existieren. Dann berechnen sich die Erwartungswerte von   und   zu:

 

Zuerst wird angenommen, dass der geöffnete Umschlag zufällig auswählt wird. Dann gilt   und beide Erwartungswerte sind gleich:

 

Die zufällige Auswahl der Umschläge kann immer durch eine Änderung der Verteilung von   erreicht werden. Deshalb kann für die folgenden Überlegungen o. B. d. A.   und   angenommen werden. Es wird also immer der erste Umschlag geöffnet und es ist  ,   und somit  .

Nun wird angenommen, dass für jeden möglichen Geldbetrag im geöffneten Umschlag der bedingte Erwartungswert des anderen Umschlags immer größer ist:

 

Dieses ergibt sich automatisch, wenn man annimmt, dass der andere Umschlag stets den halben oder den doppelten Betrag enthält und dass die bedingten Wahrscheinlichkeiten für beide Ereignismöglichkeiten immer gleichverteilt sind:

 

Denn dann berechnet sich der bedingte Erwartungswert des anderen Umschlags zu:

 

Aus der Formel vom totalen Erwartungswert folgt nun:

 

Zuletzt wird angenommen, dass für jeden möglichen Geldbetrag im anderen Umschlag der bedingte Erwartungswert des geöffneten Umschlags immer größer ist:

 

Dieses ergibt sich automatisch, wenn man annimmt, dass der geöffnete Umschlag stets den halben oder den doppelten Betrag enthält und dass die bedingten Wahrscheinlichkeiten für beide Ereignismöglichkeiten immer gleichverteilt sind:

 

Denn dann berechnet sich der bedingte Erwartungswert des geöffneten Umschlags zu:

 

Aus der Formel vom totalen Erwartungswert folgt nun völlig analog:

 

Das Umtauschparadoxon lebt einzig und allein von der Tatsache, dass diese drei Annahmen nicht miteinander verträglich sind:

  • Nimmt man an, dass der geöffnete Umschlag zufällig auswählt wird, dann muss   sein.
  • Nimmt man an, dass der bedingte Erwartungswert des anderen Umschlags immer größer als der Geldbetrag im geöffneten Umschlag ist, dann muss   sein.
  • Nimmt man an, dass der bedingte Erwartungswert des geöffneten Umschlags immer größer als der Geldbetrag im anderen Umschlag ist, dann muss   sein.

Das Prinzip vom unzureichenden Grund bietet jedoch eine Lösung für dieses Problem an. Es besagt ja nur, dass ohne Vorliegen weiterer Informationen eine diskrete Gleichverteilung für die unbekannten Eintrittswahrscheinlichkeiten anzusetzen sei. Es gibt jedoch einen Grund, nicht die Gleichverteilung anzusetzen, wenn man schon die Information hat, dass der geöffnete Umschlag zufällig auswählt wird und dass somit   ist: Um nicht in den Widerspruch zu geraten, dass auch   oder   ist. Nimmt man anstelle der Gleichverteilung an, dass die bedingte Wahrscheinlichkeit für den kleineren Geldbetrag immer doppelt so groß wie für den größeren Geldbetrag ist, ergibt sich dieser Widerspruch nicht, denn aus

 

folgt stets

 

und somit auch

 .

Genauso ergibt sich aus

 

stets

 

und ebenfalls

 .

Ein einfaches Beispiel illustriert, wie sehr man mit der scheinbar plausiblen Annahme einer Gleichverteilung bei den bedingten Wahrscheinlichkeiten danebenliegen kann. Dazu werden die Umschläge immer mit 100 und 200 Euro befüllt. Es wird also eine bivariate Zweipunktverteilung von   angenommen:

 
 

Dann ergeben sich die folgenden bedingten Wahrscheinlichkeiten:

 
 
 
 

Von der angenommenen Gleichverteilung sind diese bedingten Wahrscheinlichkeiten meilenweit entfernt.

Anwendung des Zwei-Zettel-SpielsBearbeiten

In den obigen Beispielen wurde angenommen, dass bekannt ist, nach welchem Prinzip die Geldbeträge verteilt sind. Unter dieser Annahme lassen sich leicht Gewinnstrategien angeben. Die Problemformulierung enthält aber keine Information über die Verteilung. Es gibt allerdings auch eine allgemeine Gewinnstrategie für Herrn Schmidt, die diese Annahme nicht benötigt. Diese Strategie besteht darin, dass Herr Schmidt, bevor er den Umschlag öffnet, eine Zufallszahl S wählt. Die Wahrscheinlichkeitsverteilung von S muss dabei eine Dichte haben, die zwischen 0 und unendlich echt größer 0 ist, ist ansonsten aber beliebig. Dann öffnet er den Umschlag und findet den Betrag n. Ist der gefundene Betrag n kleiner gleich S, so tauscht er den Umschlag; ist der Betrag n größer als S, so behält er den Umschlag. Diese Strategie geht auf Thomas M. Cover zurück.[10] Wie im Artikel Zwei-Zettel-Spiel erklärt, erhöht er so theoretisch seine Chancen, den größeren Betrag zu erhalten.[11][12]

Angenommen, Herr Schmidt entschließt sich, das Zwei-Zettel-Spiel anzuwenden. Enthalten die Briefumschläge die Beträge   und   und öffnet Herr Schmidt zuerst den Umschlag mit Inhalt  , so wechselt er, falls  . Die bedingte Erwartung seines Gewinns beträgt dann

 

Öffnet er zuerst den Umschlag mit Inhalt  , so wechselt er, falls  . Die bedingte Erwartung seines Gewinns beträgt dann

 

Insgesamt beträgt die bedingte Erwartung bei fixen Inhalten, aber vor der Wahl des ersten Umschlags

 

Tauscht er immer oder tauscht er nie, beträgt sein Erwartungswert

 

Bei Anwendung des Zwei-Zettel-Spieles ist der Erwartungswert also um

 

höher als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise.

BeispielBearbeiten

Für   wählt Herr Schmidt beispielsweise eine Zufallsvariable S, die exponentialverteilt mit Erwartungswert 1000 ist, also  . Falls die Geldbeträge wie im oben angegebenen Beispiel auf der Menge   gleichverteilt sind, ergibt sich insgesamt folgender Erwartungswert des Geldgeschenkes:

                   
25 50 1/6 0,975 49,382 0,951 26,219 37,801 37,5 6,300
50 100 1/6 0,951 97,561 0,904 54,758 76,160 75,0 12,693
100 200 1/6 0,904 190,484 0,819 118,127 154,305 150,0 25,718
200 400 1/6 0,819 363,746 0,670 265,936 314,841 300,0 52,473
400 800 1/6 0,670 688,128 0,449 620,268 644,198 600,0 107,366
800 1600 1/6 0,449 1159,463 0,202 1438,483 1298,973 1200,0 216,496
Summe 1 421,046

Der Erwartungswert des Geldgeschenkes beträgt bei dieser Vorgangsweise also 421,046 Euro. Das ist zwar weniger als bei der optimalen Strategie (tausche bei weniger als 1000 Euro), bei der der Erwartungswert 460,62 Euro beträgt; aber jedenfalls mehr als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise, bei der der Erwartungswert 393,75 Euro beträgt. Wie aus der Tabelle ersichtlich, ist in jeder Zeile   größer als  . Der genaue Erwartungswert hängt natürlich stark von der Wahl der Verteilung von   ab, ist aber immer größer als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise.

Siehe auchBearbeiten

Verwandte Themen, bei denen man aus Teilinformationen die optimale Entscheidung des Restproblems treffen kann:

WeblinksBearbeiten

EinzelnachweiseBearbeiten

  1. Maurice Kraitchik: La mathématique des jeux. 1953
  2. Martin Gardner: Aha! Gotcha. 1982
  3. Barry Nalebuff: Puzzles: the other person’s envelope is always greener. In: Journal of Economic Perspectives. Band 3, 1989, yale.edu (PDF; 205 kB)
  4. Denkfallen und Paradoxa
  5. Denkfallen und Paradoxa: Umtauschparadoxon (Briefumschlag-Paradoxon)
  6. Denkfallen: Umtauschparadoxon. (PDF) hs-fulda.de
  7. a b c d David J. Chalmers: The Two-Envelope Paradox: A Complete Analysis?
  8. Robert B. Ash: Real Analysis and Probability. Academic Press, New York 1972, ISBN 0-12-065201-3, S. 246, 6.3.5 (2)
  9. Christoph Luchsinger: Einführung in die Statistik. Lemma 3.12, S. 70
  10. Franz Thomas Bruss: Der Ungewissheit ein Schnippchen schlagen. In: Spektrum der Wissenschaft. Band 6/2000, S. 106–107.
  11. R. Christensen, J. Utts: Bayesian Resolution of the Exchange Paradox. In: The American Statistician. 1992
  12. Dov Samet, Iddo Samet, David Schmeidler: One Observation behind Two-Envelope Puzzles. (PDF; 89 kB)