Trembling-hand-perfektes Gleichgewicht

Das trembling-hand-perfekte Gleichgewicht bzw. perfekte Gleichgewicht der zitternden Hand[1] stellt eine Möglichkeit der Selektion von Nash-Gleichgewichten dar. Entwickelt wurde es von Reinhard Selten, der die Idee 1975 unter dem Namen „A Model of Slight Mistakes“ im „International Journal of Game Theory“ veröffentlichte. Hierbei geht es darum festzustellen, wie anfällig ein Gleichgewicht gegenüber Fehlern eines Spielers ist. Nach Selten gibt es keine Fehler, wenn die Spieler absolut rational handeln. In der Realität muss man allerdings mit falschen Entscheidungen des Gegenspielers rechnen. Um dies spieltheoretisch darzustellen, wurde das Trembling-hand-perfekte Gleichgewicht entwickelt.[2]

Einfache Darstellung des Ansatzes

Bearbeiten
 
Reinhard Selten (2001)

Einfach ausgedrückt bedeutet die Idee des trembling-hand-perfekten Gleichgewichts: Angenommen Spieler A geht davon aus, dass Spieler B immer die Strategie   spielt und die beste Antwort von Spieler A auf   ist seine Strategie  . Ist dann immer Strategie   zu spielen auch dann noch die optimale Wahl, wenn Spieler B aus Versehen, sprich mit einer geringen Fehlerwahrscheinlichkeit von  ,   spielt? Wenn unter diesen Umständen   noch immer die beste Strategie von Spieler A ist, so handelt es sich um eine Trembling-hand-perfekte Strategie.

Trembling-hand-perfektes Gleichgewicht in Normalformspielen

Bearbeiten

Durch das folgende Normalformspiel, wird der Ansatz des Trembling-hand-perfekten Gleichgewichts anhand folgender Auszahlungsmatrix sehr einfach verdeutlicht:

Spieler A/Spieler B ( ) ( )
( ) (3, 3) (5, 0)
( ) (-2, -2) (5, 0)

Die beiden Nash-Gleichgewichte sind in diesem Beispiel bei   und  . Nun soll ermittelt werden, ob eines der beiden Gleichgewichte (oder auch beide), Trembling-hand-perfekte Gleichgewichte sind. Angenommen Spieler A möchte seine Strategie   spielen und geht davon aus, dass Spieler B seine Strategie   spielen wird, da beide dann eine Auszahlung von 3 bekämen. Spieler A ist sich allerdings nicht vollkommen sicher, ob Spieler B nicht doch mit einer geringen Fehlerwahrscheinlichkeit seine Strategie   spielt. Um herauszufinden, ob   trotz dieser Fehlerwahrscheinlichkeit von Spieler B noch immer die beste Wahl von Spieler A und somit Trembling-hand-perfekt ist, muss folgendes überprüft werden: Die erwartete Auszahlung von Spieler A wenn er   wählt muss mindestens so groß sein, wie die erwartete Auszahlung für die Wahl von  .

  sei die Fehlerwahrscheinlichkeit von Spieler B, die als sehr klein angenommen wird. Das heißt,   ist die damit verbundene Gegenwahrscheinlichkeit. Mit  

Die erwartete Auszahlung von Spieler A für die Wahl von   ist also:

 
=   +  

Im Vergleich dazu die erwartete Auszahlung der Strategie  :

 
=   +  

Es ist unschwer zu erkennen, dass:

  +   >   +  

Auch wenn Spieler B mit einer geringen Fehlerwahrscheinlichkeit   spielt, ist   für Spieler A die bestmögliche Wahl. Also ist die Strategie   Trembling-hand-perfekt. Ein Trembling-hand-perfektes Gleichgewicht besteht allerdings aus einer Kombination zweier Trembling-hand-perfekten Strategien. Um also zu prüfen, ob es sich bei der Strategiekombination   um ein solches handelt, muss auch   von Spieler B getestet werden. Analog zur Strategie   sieht dies folgendermaßen aus:

Die erwartete Auszahlung von Spieler B für die Wahl von   beträgt:

 
=   +  

Im Vergleich dazu die erwartete Auszahlung der Strategie  :

 
=   +  

Und wiederum ist eindeutig zu erkennen, dass:

 

Damit ist auch die Strategie   Trembling-hand-perfekt und es handelt sich beim Nash-Gleichgewicht   um ein Trembling-hand-perfektes Gleichgewicht.[3]

Formale Definition mithilfe eines perturbierten Spiels

Bearbeiten

Einfache Definition eines perturbierten Spiels

Bearbeiten

Ein perturbiertes Spiel, ist eine Kopie des zugrundeliegenden Spiels, mit der Einschränkung, dass jeder Spieler alle reinen Strategien mit einer positiven Wahrscheinlichkeit spielen muss. Das heißt, im normalen Spiel ist es Spieler A möglich seine Strategien   zu spielen. Im perturbierten Spiel muss   sein.

Formale Definition

Bearbeiten

Ausgangspunkt sei ein Spiel in strategischer Form:

 , und  

Wobei   die Menge der Spieler darstellt,   das Set an gemischten Strategien ist, welches auf der möglichen Verteilung der reinen Strategien   basiert und es sich bei   um die erwartete Auszahlung von Spieler   handelt. Die Zentrale Idee, um mögliche Fehler der Spieler abzubilden, ist es anzunehmen, dass keine reine Strategie mit einer Wahrscheinlichkeit von null gespielt werden kann. In einem solchen perturbierten Spiel gilt:

Für jeden Spieler   mit   reinen Strategien, ist   die Menge an positiven Wahrscheinlichkeiten, für die gilt:
  und  .

Die Menge an gemischten Strategien im perturbierten Spiel ist also:

 , für  .

Das heißt, dass Spieler  ,  , jede seiner reinen Strategien der Anzahl  , mindestens mit der Wahrscheinlichkeit   spielen muss. Daraus folgt das perturbierte Spiel:

 , und  

Ein Nash-Gleichgewicht im perturbierten Spiel sei   und ein Nash-Gleichgewicht im Ausgangsspiel sei:  . Wenn man die Fehlerwahrscheinlichkeit   im perturbierten Spiel gegen null gehen lässt und dadurch das Gleichgewicht des perturbierten Spiels zum Gleichen wird wie im normalen Spiel, spricht man von einem trembling-hand-perfekten Gleichgewicht. Formal ausgedrückt heißt das, wenn

 ,

handelt es sich um ein trembling-hand-perfektes Gleichgewicht.[4]

Beispiel

Bearbeiten

Als Ausgangsspiel wird ein Normalformspiel mit folgender Auszahlungsmatrix betrachtet:

Spieler A/Spieler B ( ) ( )
( ) (3, 3) (0, 0)
( ) (0, 0) (0, 0)

Im normalen Spiel gibt es zwei Nash-Gleichgewichte, die sich aus den Strategiekombinationen   und   ergeben. Es kommt für die beiden Spieler bei der Wahl ihrer jeweils besten Antwort darauf an, welche Strategie der jeweilige Gegenspieler wählt.

Im perturbierten Spiel ist dies nicht der Fall. Denn wenn es auch nur eine winzige Wahrscheinlichkeit gibt, dass Spieler B seine Strategie   wählt, dann ist die beste Antwort von Spieler A darauf   zu spielen. Da diese Wahrscheinlichkeit im perturbierten Spiel per Definition existiert, würde Spieler A immer   spielen. Aber auch Spieler A muss im perturbierten Spiel seine Strategie   mit einer positiven Wahrscheinlichkeit spielen. Deshalb ist seine beste Antwort, die gemischte Strategie  zu spielen – also die kleinstmögliche Wahrscheinlichkeit für  .

Aufgrund der Symmetrie des Spiels ist die beste Strategie für Spieler B dementsprechend:  

Das Gleichgewicht im perturbierten Spiel ist also:

 

Wenn man jetzt   und   gegen   gehen lässt, dann wird aus dem perturbierten Spiel fast wieder das Normale, denn:

 

Wenn man die Fehlerwahrscheinlichkeit gegen Null gehen lässt und sich das Gleichgewicht des perturbierten Spiels dadurch auf ein Nash-Gleichgewicht des zugrundeliegenden Spiels zubewegt, dann handelt es sich bei diesem Gleichgewicht um ein Trembling-hand-perfektes.

In diesem Beispiel bewegt sich das perturbierte Spiel gegen das Gleichgewicht   und ist somit Trembling-hand-perfekt.

 [5]

Trembling-hand-perfektes Gleichgewicht in Sequentiellen Spielen

Bearbeiten

Auch für Sequentielle Spiele ist das Konzept des Trembling-hand-perfekten Gleichgewichtes anwendbar. Ähnlich wie bei den Normalformspielen, ist es hierbei für die Selektion von Teilspielperfekten Gleichgewichten von Nutzen, um festzustellen, ob ein solches Gleichgewicht auch bei einer geringen Fehlerwahrscheinlichkeit bestehen bleibt.

Beispiel

Bearbeiten
 
Spielbaum eines Extensivformspiels zweier Spieler

Im auf der rechten Seite gibt es vier Teilspielperfekte Gleichgewichte:

 , also Spieler 1 spielt seine Strategie   und Spieler 2 spielt  , für den Fall, dass Spieler 1   gewählt hat und auch   für den Fall, dass Spieler 1   gewählt hat.   sind die anderen drei Teilspielperfekten Gleichgewichte.
Allerdings sind nur die beiden Gleichgewichte, in denen Spieler 1 seine Strategie   wählt Trembling-hand-perfekt. Denn auch wenn es nur eine winzige Wahrscheinlichkeit gibt, dass Spieler 2 seine Strategie   spielt, ist es für Spieler 1 besser immer   zu spielen, da er hier immer eine Auszahlung von 2 bekommt und er sich durch die Strategie   nie besser stellen kann, als durch die Strategie  .
Die beiden Trembling-hand-perfekten Gleichgewichte sind also:  .[6]

Trembling-hand-perfektes Gleichgewicht in extensiven Spielen mit der Agentennormalform

Bearbeiten
 
Elon Kohlbergs Dalekspiel in extensiver Form

Das vom Spieltheoretiker Elon Kohlberg entwickelte, und hier leicht abgewandelte Dalekspiel, ist ein Beispiel für eine weitere Anwendung des Trembling-hand-perfekten Gleichgewichtes. Die 1953 von Harold W. Kuhn entwickelte Agentennormalform wird angewendet, um den Informationsverlust bei einer Reduktion eines Extensivspiels auf die Normalform, auszugleichen. Wie im Dalekspiel auf der rechten Seite zu sehen, wird Spieler 1 in zwei Agenten aufgeteilt, um an jedem Entscheidungsknoten unkorrelierte Entscheidungen mathematisch abbilden zu können.[7]

Spieler 1/Spieler 2 (L) (R)
(gl) (2, 5) (2, 5)
(gr) (2, 5) (2, 5)
(ul) (4, 1) (0, 0)
(ur) (0, 0) (1, 4)

In der Normalform kann man sehr leicht erkennen, dass es drei Nash-Gleichgewichte in reinen Strategien gibt:   . Um diese Gleichgewichte nun auf ihre Trembling-hand-Perfektheit zu untersuchen, muss man sicherstellen, dass die Fehlerwahrscheinlichkeiten, die Spieler 1 an seinen beiden Entscheidungsknoten hat, nicht miteinander korrelieren. Das heißt, dass ein Fehler am ersten Entscheidungsknoten nicht dazu führen darf, dass die Wahrscheinlichkeit für einen weiteren Fehler steigt oder sinkt. Um dies sicherzustellen, wird Spieler 1 wie bereits oben beschrieben in zwei Agenten aufgeteilt, die unabhängig voneinander ihre Entscheidungen treffen.

Nun nehmen wir an, dass der erste Agent (Sp1A) mit einer geringen Wahrscheinlichkeit von   einen Fehler begeht und   anstatt von   spielt.
Dementsprechend begeht der zweite Agent (Sp1B) mit der Wahrscheinlichkeit von   einen Fehler und spielt   anstatt von  .
Spieler 2 begeht schließlich mit einer Wahrscheinlichkeit von   einen Fehler und spielt   anstatt von  .

Mit den Eingetragenen Wahrscheinlichkeiten sieht die Normalform von oben wie folgt aus:

Spieler 1/Spieler 2 (L) (R) Wahrscheinlichkeit
(gl) (2, 5) (2, 5)  
(gr) (2, 5) (2, 5)  
(ul) (4, 1) (0, 0)  
(ur) (0, 0) (1, 4)  
Wahrscheinlichkeit    

Nun kann man leicht erkennen, dass die Strategien   und   für Spieler 1 für kleine   Trembling-hand-perfekte Strategien sind. Denn er erhält eine sichere Auszahlung von 2 egal wie sich Spieler 2 entscheidet. Bei der einzigen besseren Auszahlung von 4 bei der Wahl von   erhält er aufgrund der Wahrscheinlichkeiten im Erwartungswert die Auszahlung:

  und für   ist dieser Erwartungswert schlechter als bei   und  .
Auch für Spieler 2 ist die Strategie   Trembling-hand-perfekt, weil die einzige Strategiekombination, bei der Spieler 2 eine größere Auszahlung für   als für   bekommt ist   im Gegensatz zu  . Da   aber nur eintritt, wenn beide Agenten von Spieler 1 einen Fehler machen, hat   die geringste Wahrscheinlichkeit ( ).
Damit sind die beiden Gleichgewichte   und   Trembling-hand-perfekt. Das Gleichgewicht   ist es nicht, weil die Strategie  , wie gerade gezeigt keine Trembling-hand-perfekte Strategie ist.[8][9]

Siehe auch

Bearbeiten

Literatur

Bearbeiten
  • Reinhard Selten: A reexamination of the perfectness concept for equilibrium points in extensive games, in: International Journal of Game Theorie. Physica-Verlag, Vienna 1975, S. 25–55.
  • Harold William Kuhn: Extensive Games and the Problem of Informations. In: Contribution to the Theorie of Games. Vol. 2. Princeton Univ. Press, Princeton 1953, S. 193–216.
  • Elon Kohlberg, Jean-Francois Mertens: On the Strategic Stability of Equilibria. Econometrica, 1986, S. 1003–1037.
  • Robert Gibbons: A Primer in Game Theory. Financial Times, Harlow 1992.
  • Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010.
  • Christian Rieck: Spieltheorie. 8. Auflage. Rieck, Eschborn 2008.
  • Alexander Mehlmann: Strategische Spiele für Einsteiger. Friedr. Vieweg & Sohn Verlag, Wiesbaden 2007.
  • Ken Binmore: Fun and Games. 1. Auflage. Heath, Lexington 1992.
  • Jürgen Eichberger: Game Theorie for Economists. 1. Auflage. Emerald, Bingley 2007.
Bearbeiten

Einzelnachweise

Bearbeiten
  1. Walter Schlee: Einführung in die Spieltheorie: Mit Beispielen und Aufgaben S. 289
  2. Reinhard Selten: A reexamination of the perfectness concept for equilibrium points in extensive games, in: International Journal of Game Theorie. Physica-Verlag, Vienna 1975, S. 25–55, hier S. 35.
  3. Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010, S. 38–40.
  4. Jürgen Eichberger: Game Theorie for Economists. 1. Auflage. Emerald, Bingley 2007, S. 111–113.
  5. Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010, S. 94–95.
  6. Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010, S. 53.
  7. Harold William Kuhn: Extensive Games and the Problem of Informations, in: Contribution to the Theorie of Games, Vol. 2. Princeton Univ. Press, Princeton 1953, S. 193 - 216.
  8. Alexander Mehlmann: Strategische Spiele für Einsteiger. Friedr. Vieweg & Sohn Verlag, Wiesbaden 2007, S. 88–92.
  9. Ken Binmore: Fun and Games. 1. Auflage. Heath, Lexington 1992, S. 454–462.