Das Gefangenendillemma - Simple Veranschaulichung der Spieltheorie

 

 

 

 

 

 

 

 

 

 

 

 

Um das Gefangenendillemma verstehen zu können stellen Sie sich zwei Personen vor: Cornelius (abgekürzt Mr. C) und Daniel (abgekürzt Mr. D). Beide sind sie Verbrecher, die gemeinsam eine Straftat begangen haben. Die Polizei hat sie gefangen genommen und in Untersuchungshaft gesperrt. Dort sind sie von ihrem Komplizen isoliert und wissen nicht, was der andere tut und sagt. Die Polizei hat keine klaren Beweise gegen die Verdächtigen. Wenn beide dicht halten und schweigen, können Sie diese nur wegen nebensächlicher Vergehen zu 2 Jahren Haft verurteilen.

Also bietet die Polizei beiden Verdächtigen die Kronzeugenregelung an: Wenn Mr. C gegen Mr. D aussagt und Mr. D sein Verbrechen nicht gesteht, bekommt Mr. C für seine Mitarbeit nur 1 Jahr angerechnet und Mr. D wird auf Grund seiner Uneinsichtigkeit zur Höchststrafe von 6 Jahren verurteilt. Sagt Mr. D gegen Mr. C aus und Mr. C gesteht das Verbrechen nicht, bekommt Mr. D nur 1 Jahr und Mr. C die Höchststrafe von 6 Jahren. Sagen jedoch beide gegeneinander aus, bekommen sie beide für ihre Mitarbeit weniger als die Höchststrafe aber mehr als wenn nur einer zur Mitarbeit bereit gewesen wäre: Sie müssen beide für 4 Jahre hinter Gittern.

 

Das beste kollektive Ergebnis könnten sie erreichen, wenn sie beide still halten und schweigen. Dann müssten insgesamt nur 2 * 2 = 4 Jahre abgesessen werden. Jedoch besteht für beide das Risiko, dass wenn sie schweigen und der andere sie betrügt die Höchststrafe abgesessen werden muss.


Was ist die optimale Entscheidung?

Das Nash Gleichgewicht - Wenn keiner einen Anreiz hat von der Lösung abzuweichen

Im Film "A Beautiful Mind" mit Russel Crowe als den schizophrenen Mathematiker John Nash wird in einer kurzen Szene das Nash-Gleichgewicht anschaulich erklärt.

Nash ist mit Studienkollegen in einer Bar, während eine wunderschöne Frau mit ihren durchschnittlich attraktiven Freundinnen die Kneipe betritt. Normalerweise würden sich alle Studenten auf die attraktive Frau in der Mitte stürzen. Doch nur einer könnte diesen Hahnenkampf gewinnen, die anderen gingen leer aus und müssten die Nacht alleine verbringen. In Nashs Kopf spielt sich eine Simulation der Geschehnisse ab. Er kommt zu dem Schluss, dass es für alle am rationalsten wäre, wenn sie die attraktive Frau von Anfang an ignorierten und jeder eine der  Freundinnen zum Ziel erwählte. Auf diese Weise könnte jeder von ihnen mit einer Begleiterin nach Hause gehen. Diese Szene bietet eine sehr stark vereinfachte Anspielung auf das Gefangendilemma und die Lösung per Nash-Gleichgewicht.

 

Allgemein gesprochen ist ein Nash-Gleichgewicht dann gegeben, wenn kein Spieler sich einen Vorteil verschaffen kann, in dem er vom Nash-Gleichgewicht abweicht. Nur diese Situation ist stabil.

 

Zurück zu unserem Gefangenendilemma und der Frage was die optimale Entscheidung ist:

Rechnen wir durch, welche Ergebnisse beide erzielen können, gegeben die Reaktion des Gegenspielers:

  1. Mr. D schweigt: Mr. C muss entweder 2 Jahre absitzen, wenn er schweigt, oder 1 Jahr, wenn er gesteht. => Er würde gegen Mr. D aussagen und damit ein Jahr weniger im Gefängnis sitzen als wenn er schweigt
  2. Mr D gesteht: Mr. C muss entweder 6 Jahre absitzen, wenn er schweigt, oder 4 Jahre, wenn er wie Mr. D gesteht => Er würde gegen Mr. D aussagen
  3. Mr. C schweigt: Mr. D muss entweder 2 Jahre absitzen, wenn er schweigt, oder 1 Jahr, wenn er gesteht. => Er würde gegen Mr. C aussagen
  4. Mr. C gesteht: Mr. D muss entweder 6 Jahre absitzen, wenn er schweigt, oder 4 Jahre, wenn er wie Mr. C gesteht => Er würde gegen Mr. C aussagen

=> Welche Entscheidung der Gegenspieler auch trifft, man kann sich immer einen Vorteil verschaffen, in dem man gegen den anderen aussagt.

Das kollektiv beste Ergebnis, wenn beide schweigen, ist nicht stabil. Denn jeder kann sich einen Vorteil von einem Jahr verschaffen, in dem er gegen seinen Komplizen aussagt und die Tat gesteht.

Das Nash-Gleichgewicht ist also die Lösung C=-4/D=-4.Wenn beide gestehen, kann sich keiner einen Vorteil verschaffen, in dem er eine andere Entscheidung trifft. Obwohl beide doppelt so viele Jahre absitzen müssen, als wenn sie geschwiegen hätten. Wie im Film ist nicht das bestmögliche Ergebnis das Nash-Gleichgewicht. Denn nur das zweitbeste Ergebnis ist stabil.

Wiederholtes Spiel und Tit for Tat - Wie das beste Ergebnis erreicht werden kann

Es gibt eine Möglichkeit wie das beste Ergebnis erreicht werden kann. Dazu benötigt es jedoch eine restriktive Vorbedingung:
Das Spiel muss für beide unvorhersehbar oft wiederholt werden.

 

Stellen wir uns vor die Verbrecher landen unendlich oft in Untersuchungshaft. Durch die Wiederholung besteht nun die Möglichkeit einer Bestrafung. Beide sprechen sich vorher ab die Option "Schweigen" zu wählen. Wählt Mr. D entgegen der Absprache doch "Gestehen", so macht Mr. C die Drohung wahr sich in Zukunft auch nicht mehr an die Absprache zu halten und bei den nächsten Malen ebenfalls "Gestehen" zu wählen. Tit for Tat oder auf Deutsch "Wie du mir, so ich dir", nennt sich dieser Disziplinierungsmechanismus. Jeder muss sich vor Augen führen, dass er sich nur ein einziges Mal einen Vorteil verschaffen kann und dafür die restliche Zukunft büßen muss. Der Vorteil heute führt zu einem Nachteil morgen. Durch den Bestrafungsmechanismus wird es für beide vorteilhaft zu schweigen. Das kollektiv beste Ergebnis von C=-2/D=-2 kann erreicht werden.

 

Jedoch ist das Ergebnis nur stabil, solange kein Ende der Wiederholungen in Sicht ist. Sobald ein Ende vorhersehbar wird, zerbricht die Zusammenarbeit. Bei wiederholten Spielen gelangt man in der Spieltheorie durch eine Rückwärtsinduktion zum optimalen Ergebnis. Die Optimalität wird von hinten nach vorne errechnet: Man überlegt sich, was beim letzten Spielzug die optimale Entscheidung wäre. Danach folgt die Überlegung was - abhängig von der optimalen Entscheidung des letzten Spielzugs - beim vorletzten Spielzug optimal wäre...bis man schließlich beim ersten Spielzug angelangt ist.

Bei unserem Beispiel bedeutet das: Kommt ein Ende in Sicht, wäre es rational seinen Komplizen während der letzten Untersuchungshaft zu betrügen. Weil es danach keine weitere Untersuchungshaft mehr geben wird, hat der Komplize keine Möglichkeit zur Bestrafung des Betrugs. Der rationale Komplize antizipiert den Betrug jedoch und würde bereits während der vorletzten Untersuchungshaft gestehen. Weil auch diese Entscheidung vorhersehbar ist, wäre es wiederum rational bereits bei der vor-vorletzten Untersuchungshaft zu gestehen...Letztendlich ist es rational bereits beim ersten Mal zu gestehen. Eine Kooperation des Schweigens ist folglich nur stabil, wenn sich das Gefangenendilemma bis in alle Ewigkeit wiederholt oder zumindest für beide Verbrecher kein Ende vorhersehbar ist.

Autor seit 4 Jahren
13 Seiten
Laden ...
Fehler!