24 KiB
Clustered and Rewritten Text Document
This document groups text chunks based on semantic similarity. Topics and rewritten text (formatted in Markdown with LaTeX for equations) are generated by the Gemini API.
Game Theory Basics
Nash Equilibrium & Dominance Zero-Sum Games Mixed Strategies Collective Decision Making
Spieltheorie: Zusammenfassung
Nicht-kooperative Spiele sind in der Literatur und in Anwendungen weit verbreitet. Spieler können keine Absprachen vor dem Spiel treffen und haben keinerlei Vereinbarungen über gemeinsame Aktionen, die optimal für die Gruppe sind. Eine Unterscheidung ist die zwischen simultanen Spielen, bei denen alle Spieler ihre Wahl ein für alle Mal treffen (nur ein Zug), und sequentiellen Spielen.
Spielen in reinen Strategien: Eine dominante Strategie ist eine Strategie a_i
, die mindestens so gut ist wie eine andere Strategie a_i' \in A_i
für alle möglichen Aktionen der anderen Spieler a_j \in A_j \neq i
(a_i \ge a_i'
). Gilt die Ungleichung im strengen Sinn (a_i > a_i'
), spricht man von starker Dominanz. Ein Nash-Gleichgewicht liegt vor, wenn kein Spieler durch eine einseitige Abweichung davon eine höhere Auszahlung erzielen kann, d.h. für alle a_i \in A_i
und i \in N
. Das Gefangenendilemma illustriert dies: Die dominante Strategie beider Spieler ist G, ABER: das Gleichgewicht (G, G) ist ineffizient, da (L, L) eine bessere Auszahlung ergeben würde. Ein weiteres Beispiel ist das Falke-und-Taube-Spiel.
Zwei-Personen-Nullsummenspiele: Hier versuchen Spieler ihren Gewinn zu maximieren (und den Verlust des anderen zu minimieren); die Summe der Auszahlungen ist immer Null. Sie werden üblicherweise in Normalform (oder Matrixform) dargestellt. Konservative Strategien wählen den besten Wert aus allen ungünstigsten Fällen. Der Sattelpunkt (Schnittpunkt von Minimum und Maximum) repräsentiert die beste Strategie für beide Spieler. Kein Spieler kann sich durch einen einseitigen Strategiewechsel verbessern. Ein Beispiel ist die Schlacht in der Bismarcksee. Falls die Amerikaner die richtige Route überprüfen, kann die Bombardierung sofort begonnen werden (andernfalls verbleiben zwei Tage für die andere Route). Auf der Nordroute muss wegen schlechter Sicht die Bombardierung einen Tag ausbleiben. Dies ergibt folgendes 2PNS-Spiel (Gewinn ≡ mögliche Tage für Bombardierung):
SN12N32S
Japan (min)U.S. Air Force (max)
\implies i^* = N
und U^- = 2 \implies j^* = N
und U^+ = 2 \implies
Sattelpunkt bei (N, N).
Spielen in gemischten Strategien: Im Gegensatz zu reinen Strategien, bei denen sich ein Spieler a priori auf eine Strategie festlegt, werden hier Wahrscheinlichkeiten für verschiedene Strategien verwendet. Dies reduziert die Vorhersehbarkeit. Die Lösung findet man oft durch Multiplikation des 2PNS-Spiels mit Wahrscheinlichkeiten p und q und die Lösung der zugehörigen Gleichung (oftmals durch lineare Programmierung). Ein Beispiel:
1qq
S22S2131
S11p15
S121p
P1(min)P2(max)
\implies
Sattelpunkt der Funktion (graphisch) bei p = 0.5
und q = 0.25
.
Checkpoints: Wichtige Begriffe sind Spiele in reinen Strategien, Darstellung in Normalform/Bimatrixform, dominante Strategie, Nash-Gleichgewicht und Zwei-Personen-Nullsummenspiele.
Gruppenentscheidungen: Gesucht ist eine kollektive Auswahlfunktion K für die Präferenz der Gesamtheit: K: PA = PA \times PA \times \dots \times PA \to PA
. Wesentliche Bedingungen sind, dass die Auswahlfunktion total sein muss (für jede Kombination von Präferenzen muss es ein Ergebnis geben) und dass das Ergebnis selbst eine Relation in PA sein muss. Ein einfaches Verfahren ist die Rangaddition. Jede Individualpräferenz \rho_i
legt eine Rangabbildung fest. Die kollektive Präferenz wird aus den Rangnummern der Individuen bestimmt. Die Summe der Rangnummern ist keine Rangabbildung, kann aber korrigiert werden. Das Verfahren hat keine offensichtlichen Nachteile, aber kollektive Auswahlfunktionen PA \to PA
werden auch von unerwünschten Verfahren erfüllt. Zwei Bedingungen für „gerechte“ Verfahren sind die Pareto-Bedingung und die Unabhängigkeit von irrelevanten Alternativen.
Game Theory Basics
Two-Person Zero-Sum Games Bismarck Sea Battle Mixed Strategies Game Group Decisions Preference Relations Decision Procedures Arrow's Impossibility Theorem
Spieltheorie: Eine Einführung
Zwei-Personen-Nullsummenspiele
Zwei-Personen-Nullsummenspiele (2PNS-Spiele) werden auch als MinMax-Spiele bezeichnet. In Matrixform wird Spieler 1 zur Minimiererin (auch Zeilenspielerin genannt) und Spieler 2 zur Maximiererin (auch Spaltenspielerin genannt). Aufgrund der speziellen Struktur von 2PNS-Spielen nehmen Nash-Gleichgewichte die Form von Sattelpunkten an (Schnittpunkt von Minimum und Maximum). Der Min-Max-Theorem besagt: Ein Sattelpunkt existiert genau dann, wenn U^- = a_{i*j*} = U^+
. Ein Beispiel hierfür ist die Schlacht in der Bismarcksee (2.-4. März 1943). Die Japaner wollten Truppen und Material von Rabaul (Bismarck-Archipel) nach Lae (Papua-Neuguinea) verlegen. Es standen zwei mögliche Routen zur Verfügung: eine regnerische Nordroute und eine sonnige Südroute. Der japanische Konvoi war unabhängig von der gewählten Route drei Tage unterwegs. Die U.S. Air Force wurde über die Verlegung informiert und wollte den Konvoi bombardieren, hatte aber nicht genügend Flugzeuge, um beide Routen gleichzeitig zu überwachen. Die Amerikaner mussten also eine Entscheidung treffen. Wenn beispielsweise q
in S_{22}
sowie q
in S_{11}
oder S_{12}
ist, ergibt sich U^- = 2 = U^+
.
Möglichkeiten, Aktionen und Auszahlungsfunktionen
Möglichkeiten/Aktionen: A_1 = \{X, Y\}
und A_2 = \{X, Y\}
. Aktionsprofile: A = \{(X, X), (X, Y), (Y, X), (Y, Y)\}
. Auszahlungsfunktion: u_{1,2}: A \to (1, 0, 0, 1)
. Wie verändert sich das Spiel, wenn folgende Auszahlungsfunktionen gelten? Spieler 1: u_1: A \to (1, 0, 0, 0)
; Spieler 2: u_2: A \to (0, 0, 0, 1)
.
Spielen in gemischten Strategien
Aufgabe: Steuerhinterziehung. Problem: Keine dominante Strategie/kein Nash-Gleichgewicht in reinen Strategien. Wie ändert sich die Situation für den Fall s > 200
Mio. CHF?
\begin{array}{c|cc}
& K & S \\
\hline
P & (200, 0) & (200 - s, 0.05 \cdot s - 10) \\
S & (0, 0) & (0, -10)
\end{array}
Gruppenentscheidungen: Relationen und Präferenzen
Idee: Beschreibung von Beziehungen (z.B. Rangfolgen, Präferenzen) zwischen Elementen. Darstellung als Relation R
auf Paaren (x, y)
von Elementen aus A
. Formal geschrieben als (x, y) \in R
oder abkürzend als xRy
. Beispiel: Mit R
ist ‘$<$’ (kleiner) und xRy
folgt x < y
. Rangabbildungen definieren eine Präferenzrelation: x \rho y \iff r(x) < r(y)
. Relation \rho
ist transitiv und asymmetrisch. Die Menge aller (möglichen) darstellbaren Relationen auf A
ist definiert als P_A := \{\rho \subset A \times A: \rho \text{ erfüllt } x \rho y \iff r(x) < r(y) \text{ für eine Rangabbildung } r\}
. Erweiterung der Relation durch alle Paare mit gleichem Rang: x \rho^* y \iff r(x) \le r(y)
. Relation \rho^*
ist transitiv und reflexiv. Es gilt offensichtlich \rho \subset \rho^*
. Analog zur Menge P_A
lässt sich damit definieren P_A^* := \{\rho^* \subset A \times A: \rho^* \text{ erfüllt } x \rho^* y \iff r(x) \le r(y) \text{ für eine Rangabbildung } r\}
. Beispiel: A = \{x, y, z\}
, r(x) = 1
, r(y) = r(z) = 2
. Zwischen beiden Relationen gilt folgende Beziehung: x \rho y \iff \neg(y \rho^* x)
. Rangabbildungen sind vor allem für…
Gruppenentscheidungen: Entscheidungsverfahren
Entscheidungsverfahren (Fortsetzung): Extrembeispiel 1: externer Diktator. Für beliebiges \rho_E \in P_A
gilt… Das Ergebnis ist offensichtlich eine Abbildung P_A \to P_A
, aber unabhängig von den \rho_i
. Das Verfahren kann kaum als „gerecht“ oder „demokratisch“ bezeichnet werden. Extrembeispiel 2: interner Diktator. Festlegung eines Individuums d \in I
, dessen Präferenz \rho_d
das Ergebnis bestimmt. Damit gilt… Rangaddition: Beispiel: I = \{1, 2\}
, A = \{x, y, z\}
. Es folgt x \rho y
, y \rho z
und z \rho x
. Aus der Transitivität folgt schließlich x \rho x \to
kein gültiges Ergebnis, d.h. \rho \notin P_A
. Einstimmigkeit: Element x
wird Element y
vorgezogen \iff
alle Individuen teilen diese Präferenz für alle. ABER: Ein einziges Individuum, das $y$… Die Rangfolge zwischen zwei Wahlmöglichkeiten kann nicht durch Präferenzänderungen der Individuen im Hinblick auf eine dritte Wahlmöglichkeit gekippt werden. Problem: Bereits mit diesen zwei Forderungen ist kein annähernd demokratisches Verfahren mehr möglich (Satz von Arrow). Quintessenz: Demokratie funktioniert nicht…? Bedingungen an Auswahlverfahren: Möglichkeit z
soll keinen Einfluss auf das Ergebnis haben. Oder formal: Wenn kein Individuum Präferenz \rho_i, \rho_i' \in P_A
bzgl. x
und y
ändert, soll gelten (für alle) \implies
(). Rangaddition somit als „gerechtes“ Verfahren ausgeschlossen. Condorcet-Verfahren und Einstimmigkeit liefern für |A| > 2
evtl. ein ungültiges Ergebnis. Nur interner Diktator K_d
erfüllt alle Bedingungen. Der Diktator ist „großzügiger“ gegenüber anderen Gruppenmitgliedern. Bei Indifferenz (es gilt weder x \rho_d y
noch y \rho_d x
) sind beliebige Rangfolgen von x, y
zulässig. US-Wahlen haben nur zwei Kandidaten.
Game Theory Introduction
Einführung in die Spieltheorie (CDS-1012) HS 2024 Prof. Dr. rer. nat. habil. Ralf-Peter Mundani DAViS
R.-P. Mundani, ICS, HS 2024 Einleitung
- Überblick
- Einführung in die Spieltheorie
- Modellierung und Definitionen
- Spiele in reinen Strategien
- Nash-Gleichgewicht und dominante Strategien
- Zwei-Personen-Nullsummenspiele
- Konservative Strategien
- Spiele in gemischten Strategien
- Berechnung von Sattelpunkten
- Mehrheitsbeschlüsse / Gruppenentscheidungen (→ Teil 2)
R.-P. Mundani, ICS, HS 2024 Motivation aus der Stochastik: Ziegenproblem (a.k.a. Monty-Hall-Dilemma)
- Spielshow: 3 Türen – zwei Nieten (Ziege) und ein Gewinn (Auto)
- SpielerIn wählt Tür, ShowmasterIn öffnet andere Tür (Ziege) Strategie: Wahl ändern…?
- Die anderen beiden Fälle (SpielerIn wählt Tür B oder C) sind symmetrisch
- In drei Fällen (3/9) Verlust, in sechs Fällen (6/9) Gewinn Wahl ändern
- Quellen: depositphotos.com, jamara.com
R.-P. Mundani, ICS, HS 2024 Einführung in die Spieltheorie
- Grundlagen
- Definition: Spieltheorie
- Teilgebiet der Mathematik („Theorie des strategischen Denkens“)
- Modellierung von Entscheidungssituationen
R.-P. Mundani, ICS, HS 2024 Spiele in reinen Strategien
- Gefangenendilemma (das wohl bekannteste nicht-kooperative Spiel in reinen Strategien)
- Hintergrund
- Zwei Gefangene werden beschuldigt, gemeinsam ein Verbrechen verübt zu haben
- Beide Gefangenen werden getrennt vernommen und können nicht kommunizieren
- Mangels konkreter Beweise kann beiden nur ein Teil der Tat nachgewiesen werden
- Mögliche Aktionen:
- Leugnen (L): niedrige Strafe (2 Jahre)
- Gestehen (G): hohe Strafe (5 Jahre) oder Höchststrafe (8 Jahre ➡️Kronzeugenregel)
- Maximierung der Auszahlung
- Funktion
u_i
modelliert den Gewinn an Freiheit (also Höchststrafe – tatsächlicher Strafe)
R.-P. Mundani, ICS, HS 2024 Spiele in reinen Strategien (Fortsetzung)
- Darstellung in Normalform (bei zwei SpielerInnen auch Bimatrixform genannt)
- Frage: Wie finden beide SpielerInnen die für sich beste Strategie…?
\begin{array}{c|cc}
& G & L \\
\hline
G & (6, 6) & (8, 0) \\
L & (0, 8) & (3, 3) \\
\end{array}
A_1 A_2 (u_1, u_2)
R.-P. Mundani, ICS, HS 2024 Spiele in reinen Strategien
- Ein bisschen Mathematik
- Nash-Gleichgewicht
- Ein Aktionsprofil ist ein Nash-Gleichgewicht, wenn kein Spieler durch einseitige Änderung seiner Strategie seinen Nutzen verbessern kann.
- Wenn eine Strategie
a_i
für alle möglichen Strategien des Gegners einen höheren Nutzen liefert als eine andere Strategiea_i
, dann wird von starker Dominanz gesprochen, d.h. Strategiea_i
ist stark dominant über Strategiea_i
. - Profile dominanter Strategien führen zu Nash-Gleichgewichten (Umkehrung nicht gültig).
- Nochmals Frage: Was bedeutet das für das Gefangenendilemma…?
R.-P. Mundani, ICS, HS 2024 Spiele in reinen Strategien
- Ein bisschen Mathematik (Fortsetzung)
- Stark dominante Strategie beider SpielerInnen ist G
R.-P. Mundani, ICS, HS 2024 Spiele in reinen Strategien
- Übung: Steuerhinterziehung (Fortsetzung)
- Zanoma, ein fiktives Unternehmen, hat im Jahr 2023 durch kreative Buchführung 200M CHF nicht versteuert.
- Wird Zanoma durch einen privaten Steuerprüfer die Steuerhinterziehung nachgewiesen, so muss das Unternehmen eine Nachzahlung von
s
Millionen CHF (Steuer plus Busse) leisten. - Steuerprüfer bekommt im Erfolgsfall 5% der Nachzahlung als Prämie.
- Steuerprüfer hat Strategien Prüfung (P; Kosten: 10M CHF) und keine Prüfung (KP; Kosten: 0).
- Zanoma hat Strategien Steuerhinterziehung (S) und keine Steuerhinterziehung (KS).
- Fragen:
- a) Wie sieht die dargestellte Situation als Spiel in Bimatrixform aus…?
- b) Gibt es für $s < 200$M CHF dominante Strategien und Nash-Gleichgewichte…?
- Jede Ähnlichkeit mit real existierenden Unternehmen ist rein zufällig.
R.-P. Mundani, ICS, HS 2024 Spiele in reinen Strategien
- Konservative Strategien
- In Zwei-Personen-Nullsummenspielen (2PNS) wählt man Strategien, die im ungünstigsten Fall die beste Auszahlung garantieren.
- MinimiererIn P1:
U^- = \text{minimax}_{i,j} a_{ij}
- Für jede Strategie
i
: Maximiere über alle Spaltenj
(➡️größtmöglicher Verlust) - Wähle Minimum aller Spaltenmaxima ➡️konservative Strategie
i^*
(ObergrenzeU^-
) - MaximiererIn P2:
U^+ = \text{max}_j \text{min}_i a_{ij}
- Für jede Strategie
j
: Minimiere über alle Zeileni
(➡️kleinstmöglicher Gewinn) - Wähle Maximum aller Zeilenminima ➡️konservative Strategie
j^*
(UntergrenzeU^+
) - Minimax-Theorem: 2PNS-Spiele in gemischten Strategien haben immer einen Sattelpunkt.
R.-P. Mundani, ICS, HS 2024 Spiele in gemischten Strategien
- Einführung von Wahrscheinlichkeiten
- SpielerIn P1: Spielt mit Wahrscheinlichkeit
p
StrategieS_{11}
und mit1-p
StrategieS_{12}
. - SpielerIn P2: Spielt mit Wahrscheinlichkeit
q
StrategieS_{21}
und mit1-q
StrategieS_{22}
. - Für den Fall
n > 2
Strategien: Wahrscheinlichkeitenp_1, p_2, \dots, p_n
je Strategie mit\sum_{i=1}^n p_i = 1
. - Bestimmung des Sattelpunkts
- Multiplizieren des 2PNS-Spiels mit
p
undq
:
\begin{pmatrix} p & 1-p \end{pmatrix}
\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}
\begin{pmatrix} q \\ 1-q \end{pmatrix}
R.-P. Mundani, ICS, HS 2024 Spiele in gemischten Strategien
- Nochmals Aufgabe: Steuerhinterziehung (Fortsetzung)
- Aus Sicht von Zanoma:
(200 - s) \cdot q + 200 \cdot (1 - q) = 0 \cdot q + 0 \cdot (1 - q) \iff q = 200/s
- Aus Sicht des Steuerprüfers:
(0.05 \cdot s - 10) \cdot p - 10 \cdot (1 - p) = 0 \cdot p + 0 \cdot (1 - p) \iff p = 200/s
- D.h. Nash-Gleichgewicht in gemischten Strategien somit für
p = q
, d.h. für(200/s, 200/s)
. - In anderen Worten: Höhere Nachzahlungen (Bussen) senken die Wahrscheinlichkeit einer Steuerprüfung.
R.-P. Mundani, ICS, HS 2024 Gruppenentscheidungen
- Satz von Arrow
- Mit
|A| > 2
sei eine Menge von Auswahlmöglichkeiten. K: P^A \to P^A
sei kollektive Auswahlfunktion, die Pareto-Bedingung und Unabhängigkeit von irrelevanten Alternativen erfüllt.- Dann existiert immer ein Diktator: Es gibt ein
d \in I
: Für alle(\rho_1, \dots, \rho_n) \in P^A
: Für alle(x, y) \in A \times A
:x \rho_d y \implies x \rho y
. - ABER: Diktator ist „großzügiger“ gegenüber anderen.
Game Theory Basics
Nicht-kooperative Spiele zeichnen sich dadurch aus, dass alle Spieler ihre Auszahlung maximieren, indem sie ihre beste Strategie wählen – basierend auf ihrem Wissen über die Strategien der anderen. Vereinbarungen zwischen den SpielerInnen gibt es keine. Im Gegensatz dazu stehen kooperative Spiele: Hier suchen alle SpielerInnen nach gemeinsamen Aktionen, die optimal für die Gruppe sind. Vor dem Spiel können Absprachen getroffen werden. Die Unterscheidung zwischen diesen beiden Spieltypen liegt also in der Möglichkeit zur Kooperation und der damit verbundenen Vereinbarung gemeinsamer Strategien.
Game Theory Strategies
Mixed Strategies Nash
Group Decision Rankings
Group Decision Preferences
Group Decision Methods
Spieltheorie und Gruppenentscheidungen
Vorhersehbarkeit durch Mitspieler*innen ist beispielsweise bei der Schere-Stein-Papier-Variante gegeben: Schere (100%), Stein (0%), Papier (0%). Gemischte Strategien hingegen entstehen, wenn eine Spielerin zufällig zwischen Strategien entscheidet. Formal wird dies durch eine Wahrscheinlichkeitsfunktion über (reinen) Strategien charakterisiert. Ein Beispiel wäre: Schere (25%), Stein (50%), Papier (25%). Reine Strategien führen jedoch häufig nicht zu Nash-Gleichgewichten. Nicht jedes Zwei-Personen-Nullsummenspiel (2PNS-Spiel) in reinen Strategien hat einen Sattelpunkt. Betrachten wir beispielsweise die folgende Auszahlungsmatrix:
\begin{array}{c|cc}
& S_{21} & S_{22} \\
\hline
S_{11} & 3 & -1 \\
S_{12} & -1 & 5 \\
\end{array}
\min_i \max_j \rightarrow i^* = S_{11}
und U^- = 3
, \max_j \min_i \rightarrow j^* = S_{22}
und U^+ = 1
. Zwei-Personen-Nullsummenspiele in gemischten Strategien haben immer einen Sattelpunkt. Das Min-Max-Theorem wird hier erneut relevant.
Gruppenentscheidungen basieren auf Präferenzen und Entscheidungsverfahren. Situationen mit unerwünschten Ergebnissen sind jedoch in der Regel nicht vermeidbar. Wir betrachten eine endliche Menge A
von Möglichkeiten (z.B. Kandidat*innen, Pläne). Präferenzen entstehen durch die Vergabe von Rangnummern r(x)
mit x \in A
. Für zwei Möglichkeiten x, y \in A
bedeutet r(x) < r(y)
, dass x
gegenüber y
bevorzugt wird. Zwei (oder mehr) Möglichkeiten können dieselbe Rangnummer erhalten. Eine Rangabbildung r: A \to P
ist eine surjektive Abbildung der Menge der Möglichkeiten A
auf eine Menge von Präferenzen P = \{1, \dots, k\} \subset \mathbb{N}
. Beispiel:
A = \{x, y, z\}
, P = \{1, 2\}
r(x) = 1
, r(y) = r(z) = 2
.
Eigenschaften von Relationen sind Transitivität (aus xRy
und yRz
folgt xRz
), Reflexivität (xRx
für alle x \in A
), und Asymmetrie (xRy
und yRx
gelten niemals gleichzeitig). Transitive und reflexive Relationen werden auch Quasiordnungen genannt. Rangabbildungen eignen sich besonders für Visualisierungen (z.B. Fußballtabellen). x \rho y \iff \neg(y \rho^* x)
.
Betrachten wir nun Entscheidungsverfahren. Die Menge der Wähler*innen I = \{1, \dots, n\}
besteht aus Individuen, die von 1 bis n durchnummeriert sind. Jede Wählerin hat eine persönliche Präferenz P_A
. Gesucht ist eine kollektive Auswahlfunktion. Die Mehrheitsentscheidung (Condorcet-Verfahren) vergleicht im direkten Vergleich zweier Elemente x, y \in A
die Individuen \{i \in I: x \rho_i y\}
, die x
bevorzugen, mit den Individuen \{i \in I: y \rho_i x\}
, die y
bevorzugen. Das Condorcet-Verfahren zählt, wer mehr Vergleiche gewinnt. Für zwei Elemente x, y
gilt: K_C(\rho_1, \dots, \rho_n)
ist eine Relation \rho
. Das Verfahren ist für beliebige \rho
durchführbar, aber die Relation \rho
ist im Fall von mehr als zwei Möglichkeiten nicht immer transitiv, d.h. \rho
ist keine zulässige Präferenzrelation aus P_A
. Beispiel: I = \{1, 2, 3\}
, A = \{x, y, z\}
. Es folgt x \rho y
, y \rho z
und z \rho x
. Aus der Transitivität würde x \rho z
folgen, was jedoch nicht der Fall ist. Ein einziges Individuum, das y
mindestens so schätzt wie x
(y \le x
), führt dazu, dass das Verfahren in der Praxis keine echten Präferenzen liefert (für |A| > 2
, \rho \notin P_A
).
Bedingungen an Auswahlverfahren umfassen die Pareto-Bedingung (Einstimmigkeit). Eine kollektive Auswahlfunktion K: P_A \to P_A
erfüllt die Pareto-Bedingung, wenn für alle \rho_i \in P_A
gilt: Für alle x, y \in A
, wenn x \rho_i y
für alle i
, dann x \rho y
. Der externe Diktator scheidet somit aus, alle anderen Verfahren erfüllen die Bedingung. Die Unabhängigkeit von irrelevanten Alternativen fordert, dass die Platzierung einer dritten Möglichkeit z
keinen Einfluss auf die Rangordnung zwischen x
und y
haben sollte. Eine Präferenzänderung bei einem Individuum kann die kollektive Präferenz beeinflussen.
Game Theory Basics
Einführung in die Spieltheorie: Grundlagen und Anwendungen
Die Spieltheorie modelliert Entscheidungssituationen, oft im Kontext sozialer Konflikte. Die zentrale Idee ist, dass der Erfolg nicht nur von den eigenen Entscheidungen, sondern auch von den Entscheidungen anderer abhängt. Wichtige Anwendungsgebiete finden sich in den Wirtschaftswissenschaften und der Ökonomie. Bekannte Vertreter sind John von Neumann und John Forbes Nash. Man unterscheidet zwischen kooperativen und nicht-kooperativen Spielen sowie simultanen und sequentiellen Spielen.
Entscheidungen können unter Gewissheit getroffen werden (alle Aktionen und Konsequenzen sind bekannt), unter Risiko (bestimmte Wahrscheinlichkeiten von Aktionen und Konsequenzen sind bekannt) oder unter Unsicherheit (keine Aktionen und Konsequenzen sind bekannt). Die Modellierung umfasst eine Menge von SpielerInnen N = \{1, 2, \dots, n\}
, eine Menge der Aktionen (auch Strategien genannt) A_i
von SpielerIn i
für alle i \in N
, und eine Menge der Aktionsprofile (auch Strategieprofile) A = \{(a_i)_{i \in N}, a_i \in A_i \text{ für alle } i \in N\}
. Die Auszahlungsfunktion u_i: A \to \mathbb{R}
beschreibt die Auszahlung für SpielerIn i
. Ein Beispiel: Die Entscheidung zwischen zwei Möglichkeiten mit Aktionen A_1 = \{X, Y\}
und ...
Ein Nash-Gleichgewicht liegt vor, wenn kein Spieler durch einseitige Abweichung von seiner Entscheidung eine höhere Auszahlung erzielen kann, während alle anderen SpielerInnen an ihren Entscheidungen festhalten. Formal: Ein Aktionsprofil bildet genau dann ein Nash-Gleichgewicht, wenn keine der SpielerInnen durch Abweichung davon eine höhere Auszahlung erhält.
Zwei-Personen-Nullsummenspiele zeichnen sich dadurch aus, dass der Gewinn einer SpielerIn dem Verlust der anderen entspricht (die Summe ist immer null). Ein Beispiel ist das Spiel "Chicken" (Hühner-Spiel), bei dem zwei SpielerInnen (z.B. mit Autos) sich auf einer Kollisionskurs befinden und unabhängig voneinander entscheiden, ob sie ausweichen oder nicht (d.h. "hartnäckiges" Verhalten). Die USA nutzten dieses Spielmodell für strategische Analysen während der Kuba-Krise. Das Spiel wird interessant, wenn die Kosten für den Kampf (C
) die Kosten bzw. den Wert des Sieges (V
) überschreiten, d.h. C > V > 0
.
Als Übung betrachten wir Steuerhinterziehung. Ein Unternehmen, Zanoma, hat durch kreative Buchführung 200 Millionen CHF nicht versteuert. Falls s < 200
, gilt 200 - s > 0
, und "S" (Steuerhinterziehung) ist eine strikt dominante Strategie. Falls s < 200
, gilt 0.05 \cdot s - 10 < 0
, und "KP" (keine Prüfung) ist eine strikt dominante Strategie.
Spiele in gemischten Strategien können alternativ als reine Strategien aus der jeweiligen Sicht von SpielerIn P1 und P2 berechnet werden. Ein Sattelpunkt beschreibt einen Gleichgewichtspunkt. Die Darstellung in Matrixform ermöglicht die Analyse konservativer Strategien (MinimiererIn/MaximiererIn).
Gruppenentscheidungen befassen sich mit der Bestimmung einer Rangfolge von Möglichkeiten (z.B. Wahlen, Wettbewerbe). Nicht alle Beteiligten werden mit der Rangfolge einverstanden sein. Ein axiomatischer Ansatz stellt Eigenschaften auf und prüft, welche Entscheidungsverfahren diese erfüllen. Die Modellierung individueller Präferenzen und der Entscheidungsverfahren selbst ist zentral. Bedingungen an Auswahlverfahren beinhalten die Unabhängigkeit von irrelevanten Alternativen.