Rückwirkende Induktion
Was ist Rückwärtsinduktion?
Rückwärtsinduktion in der Spieltheorie ist ein iterativer Prozess des zeitlichen Rückschlusses vom Ende eines Problems oder einer Situation, um endliche umfangreiche Formen und sequentielle Spiele zu lösen und eine Abfolge optimaler Aktionen abzuleiten.
Rückwärtsinduktion erklärt
Rückwärtsinduktion wird verwendet, um Spiele zu lösen, seit John von Neumann und Oskar Morgenstern die Spieltheorie als akademisches Fach etablierten, als sie 1944 ihr Buch Theory of Games and Economic Behavior veröffentlichten.
In jeder Phase des Spiels bestimmt die Rückwärtsinduktion die optimale Strategie des Spielers, der den letzten Zug im Spiel macht. Dann wird die optimale Aktion des vorletzten sich bewegenden Spielers bestimmt, wobei die Aktion des letzten Spielers als gegeben angenommen wird. Dieser Vorgang wird rückwärts fortgesetzt, bis die beste Aktion für jeden Zeitpunkt ermittelt wurde. Effektiv bestimmt man das Nash-Gleichgewicht jedes Teilspiels des Originalspiels.
Die aus der Rückwärtsinduktion abgeleiteten Ergebnisse können jedoch oft nicht das tatsächliche menschliche Spiel vorhersagen. Experimentelle Studien haben gezeigt, dass „rationales“ Verhalten (wie von der Spieltheorie vorhergesagt) im wirklichen Leben selten gezeigt wird. Irrationale Spieler können tatsächlich höhere Auszahlungen erzielen als durch Rückwärtsinduktion vorhergesagt, wie im Tausendfüßler-Spiel dargestellt.
Im Hundertfüßer-Spiel haben zwei Spieler abwechselnd die Möglichkeit, einen größeren Anteil eines zunehmenden Topfes Geld zu nehmen oder den Topf an den anderen Spieler weiterzugeben. Die Auszahlungen sind so angeordnet, dass man, wenn der Pot an den Gegner weitergegeben wird und der Gegner den Pot in der nächsten Runde gewinnt, etwas weniger erhält, als wenn man den Pot in dieser Runde gewonnen hätte. Das Spiel endet, sobald ein Spieler den Vorrat nimmt, wobei dieser Spieler den größeren Teil und der andere Spieler den kleineren Teil erhält.
Beispiel für Rückwärtsinduktion
Nehmen wir als Beispiel an, dass Spieler A zuerst geht und sich entscheiden muss, ob er den Vorrat, der derzeit $2 beträgt, „nehmen“ oder „passen“ soll. Wenn er nimmt, dann bekommen A und B jeweils 1 $, aber wenn A passt, muss die Entscheidung, ob er nimmt oder passt, jetzt von Spieler B getroffen werden. Wenn B nimmt, bekommt sie 3 $ (dh den vorherigen Vorrat von 2 + 1 $). und A bekommt 0 $. Aber wenn B passt, kann A jetzt entscheiden, ob er passt oder passt, und so weiter. Wenn beide Spieler immer passen, erhalten sie am Ende des Spiels jeweils eine Auszahlung von 100 $.
Der Punkt des Spiels ist, wenn A und B beide kooperieren und bis zum Ende des Spiels weiterpassen, erhalten sie die maximale Auszahlung von jeweils 100 $. Wenn sie jedoch dem anderen Spieler misstrauen und erwarten, dass sie bei der ersten Gelegenheit „ergreifen“, sagt das Nash-Gleichgewicht voraus, dass die Spieler den niedrigstmöglichen Anspruch geltend machen werden (in diesem Fall 1 USD).
Das Nash-Gleichgewicht dieses Spiels, bei dem kein Spieler einen Anreiz hat, von seiner gewählten Strategie abzuweichen, nachdem er die Wahl eines Gegners in Betracht gezogen hat, deutet darauf hin, dass der erste Spieler den Pot in der allerersten Runde des Spiels gewinnen würde. In Wirklichkeit tun dies jedoch relativ wenige Spieler. Als Ergebnis erhalten sie eine höhere Auszahlung als die von der Gleichgewichtsanalyse vorhergesagte Auszahlung.
Sequentielle Spiele mit Rückwärtsinduktion lösen
Unten ist ein einfaches sequentielles Spiel zwischen zwei Spielern. Die Labels mit Spieler 1 und Spieler 2 darin sind die Informationssätze für Spieler eins bzw. zwei. Die Zahlen in Klammern am unteren Ende des Baums sind die Auszahlungen an jedem entsprechenden Punkt. Das Spiel ist auch sequentiell, also trifft Spieler 1 die erste Entscheidung (links oder rechts) und Spieler 2 trifft seine Entscheidung nach Spieler 1 (oben oder unten).
Die Rückwärtsinduktion verwendet, wie alle Spieltheorien, die Annahmen von Rationalität und Maximierung, was bedeutet, dass Spieler 2 seine Auszahlung in jeder gegebenen Situation maximiert. Bei beiden Informationssätzen haben wir zwei Möglichkeiten, insgesamt vier. Indem wir die Entscheidungen eliminieren, die Spieler 2 nicht wählen wird, können wir unseren Baum eingrenzen. Auf diese Weise werden wir die Linien blau markieren, die die Auszahlung des Spielers bei dem gegebenen Informationssatz maximieren.
Nach dieser Reduzierung kann Spieler 1 seine Auszahlungen maximieren, sobald die Auswahl von Spieler 2 bekannt gegeben wird. Das Ergebnis ist ein Gleichgewicht, das durch Rückwärtsinduktion gefunden wird, indem Spieler 1 „rechts“ und Spieler 2 „oben“ wählt. Unten ist die Lösung des Spiels mit dem fett gedruckten Gleichgewichtspfad.
Zum Beispiel könnte man leicht ein ähnliches Spiel wie das obige mit Firmen als Spieler einrichten. Dieses Spiel könnte Szenarien zur Produktveröffentlichung beinhalten. Wenn Unternehmen 1 ein Produkt veröffentlichen möchte, was könnte Unternehmen 2 als Reaktion darauf tun? Wird Unternehmen 2 ein ähnliches Konkurrenzprodukt herausbringen? Indem wir den Umsatz dieses neuen Produkts in verschiedenen Szenarien prognostizieren, können wir ein Spiel einrichten, um vorherzusagen, wie sich Ereignisse entwickeln könnten. Unten ist ein Beispiel dafür, wie man ein solches Spiel modellieren könnte.