Teoria Gier Piotr Kuszewski 2018L
Tematyka wykładów plan akcji Wykład I John von Neumann Trochę historii Czym jest gra i strategia Użyteczność Jak wyeliminować niektóre strategie Wykład II John Nash Równowaga (Nasha) Trochę o prawdopodobieństwie i dlaczego warto zdać się na przypadek Wykład III Niccolo Machiavelli Gry w tabeli i na drzewie Podgry Równowagi doskonałe Wykład IV Harold Kuhn Jeszcze więcej drzew Wykład V Antoine Cournot Konkurencja między firmami Wykład VI George Akerlof Używane samochody Dlaczego warto się uczyć i wiele innych.. Wykład VII Robert Aumann Dlaczego nie wydarzyła się wojna atomowa Jeszcze więcej przykładów....włącznie z takimi gdzie nigdy nie przestaje się grać.. 2
Szybka powtórka Gry w formie ekstensywnej Podgry Indukcja wstecz Równowagi doskonałe Doskonała vs niedoskonała informacja (asymetria informacyjna lub niekompletna informacja to coś jeszcze innego!) Zbiory informacyjne Ale nie wiadomo co się dzieje ze strategiami mieszanymi.. 3
Gra w formie ekstensywnej 1 A B 2 2 C D E F (3,8) (8,3) (5,5) 1 G H (2,10) (1,0) 4
Harold Kuhn Urodzony w 1925 w Santa Monica. Kolega Johna Nasha ze studiów doktoranckich. Nauczył się japońskiego, żeby być tłumaczem w trakcie procesów związanych z japońskimi zbrodniami wojennymi. Warunki Kuhna-Tuckera dla problemów optymalizacyjnych, twierdzenie Kuhna dotyczące gier dynamicznych. Wskazał Johna Nasha jako kandydata do nagrody im. Nobla z ekonomii. 5
Twierdzenie Kuhna w bardzo dużym skrócie Jeśli analizujemy grę gdzie każdy pamięta swoje wcześniejsze decyzje, to każda strategia mieszana w całej grze (taka gdzie losowo wybieramy jakąś strategię czystą) będzie miała równoważną strategię gdzie losowanie będzie wydarzało się niezależnie na każdym etapie (strategia behawioralna). 6
Strategia behawioralna 1 A B 2 2 C D E F (3,8) (8,3) (5,5) 1 Strategia behawioralna: wybierz A z prawdopodobieństwem 0,5 i G z prawdopodobieństwem 0,3 Mieszana, ale nie behawioralna: (A,G) z prawdopodobieństwem 0,6 i (B,H) z prawdopodobieństwem 0,4 G H (2,10) (1,0) 7
A czy umiemy opisać grę gdzie zapominamy co się stało? 1 L R 1 2 L R U D (1,0) (100,100) (5,1) 1 (2,2) Jakie są strategie graczy? Strategia behawioralna nie jest tym samym co strategia mieszana! 8
Przykład Adam i Beata chcą się spotkać. Mają dwie możliwości: pójść na kolację do restauracji albo pójść potańczyć. Adam pierwszy wybiera miejsce a następnie Beata podejmuje decyzję gdzie pójść. Adam woli pójść na kolację a Beata woli pójść potańczyć. Każde z nich jest trzy razy bardziej zadowolone kiedy spotkają się w miejscu preferowanym przez daną osobę. Jeśli nie spotkają się w ogóle się nie cieszą (0). Opisz grę między Adamem i Beatą. Znajdź równowagę doskonałą w podgrach a następnie znajdź inne równowagi. 9
Przykład c.d. Zmieńmy trochę grę: Beata nie wie gdzie poszedł Adam, ale może się łatwo dowiedzieć. To znaczy, nie wiedząc gdzie idzie Adam, Beata wybiera czy chce się dowiedzieć. Jeśli się dowie gdzie idzie Adam to może podjąć decyzję biorąc pod uwagę swoją wiedzę. Znajdź równowagę w tej grze. 10
Przykład c.d. B Kolacja A Klub B Dowiedzieć się Nie Nie Dowiedzieć się B B B B Kolacja Klub Kolacja Klub Kolacja Klub Kolacja Klub (3,1) (0,0) (3,1) (0,0) (0,0) (1,3) (0,0) (1,3) 11
Przykład c.d. B Kolacja A Klub B Dowiedzieć się Nie Nie Dowiedzieć się B B B B Kolacja Klub Kolacja Klub Kolacja Klub Kolacja Klub (3,1) (0,0) (3,1) (0,0) (0,0) (1,3) (0,0) (1,3) 12
Niekompletna informacja Gracze mogą mieć informacje niedostępne dla pozostałych graczy, które istotnie wpływają na przebieg gry lub wypłaty Gry z niekompletną informacją = gry Bayesowskie Pokażemy, że gry niekompletną informacją można przedstawić jako gry z niedoskonałą informacją 15
Oczekiwana wypłata W przypadku gdy korzyść gracza zależy od losu wyliczaliśmy wartość oczekiwaną jego użyteczności w zależności od losowych posunięć innych graczy. 16
Matka natura Niekompletność informacji możemy zastąpić przez niedoskonałość informacji. Wystarczy dodać Naturę jako dodatkowego gracza, który w niektórych momentach dokonuje losowania. Pozostałe kroki są takie same.. 17
Przykład Losowy wybór! 1) Znajdź wszystkie równowagi Nasha w strategiach czystych. 2) Znajdź równowagę Nasha gdzie gracz nr 1 używa strategii mieszanej. 18
Bufetowa Do bufetu przychodzą dwa typy gości. Umownie nazwijmy ich spolegliwymi i niepokornymi (spolegliwy S, niepokorny N). Spolegliwi goście preferują kefir a niepokorni wolą pić piwo (kefir K, piwo P). Bufetowa nie potrafi powiedzieć czy zamawiający jest spolegliwy czy niepokorny, ale wie co zamówił do picia. Bufetowa może być dla zamawiającego miła lub niemiła (miła M, niemiła NM). Wszyscy goście bufetu wolą kiedy bufetowa jest dla nich miła. Załóżmy, że użyteczność zamawiającego jest równa 2 jeśli pije swój ulubiony napój. Jeśli zamawia coś innego to jego użyteczność jest równa 1. Użyteczność gościa bufetu wzrasta o 1, jeśli bufetowa jest dla nie go miła a maleje o 1, jeśli jest dla niego niemiła. Bufetowa czerpie przyjemność z bycia niemiłą dla spolegliwych klientów a miłą dla niepokornych. Drzewo odpowiadające temu opisowi jest przedstawione poniżej. a) Jaki jest zbiór strategii bufetowej a jaki jest zbiór strategii każdego typu klienta. b) Zapisz tę grę w postaci normalnej biorąc pod uwagę, że bufetowa nie wie jakiego typu klienta obsługuje. c) Znajdź równowagi (bayesowskie) w tej grze. 19
Bufetowa c.d. Losowy wybór! 20
Zadanie 1 Użyj indukcji wstecz, żeby znaleźć równowagę w poniższej grze. Losowy wybór! 21
Zadanie 2 Rozważmy grę, w której wszyscy posiadają pełen opis gry. Po pierwsze, Anna wybiera między działanie a i b. Następnie, z prawdopodobieństwem 1/3, Barnaba zauważa, które działanie wybrała Anna. Z prawdopodobieństwem 2/3 nie uda mu się zaobserwować działanie, które wybrała! We wszystkich przypadkach (niezależnie od tego, czy zauważył, że Anna wybrała a lub b, lub nie zauważył żadnego działania), Barnaba wybiera między akcjami α i β. Wypłata każdego gracza jest równa 1 dla (a, α) i (b, β) a 0 w pozostałych przypadkach. (a) zapisz powyższą grę w formie ekstensywnej. (b) zapisz powyższą grę w formie normalnej. 22
Zadanie 3 Trzy siostry, nazwane Alicja, Beata i Karolina mają duży kawałek ciasta (przyjmijmy, że jego rozmiar to 1). Alicja dzieli ciasto na 3 kawałki, które mogą być różnej wielkości. Następnie Beata wybiera jeden z kawałków dla siebie. Następnie Karolina wybiera jeden z pozostałych dwóch kawałków. Alicja dostaje ostatni kawałek. Użyteczność każdej siostry to wielkość kawałka ciasta. (a) stosując indukcję wstecz, znajdź równowagę tej gry. (b) powtórz punkt (a) przy założeniu, że Beata wybiera kawałek dla Alicji; Karolina wybiera kawałek dla Beaty a pozostały kawałek zostaje dla Karoliny. 23
Zadanie 4 Rząd planuje budowę autostrady między dwoma województwami, o nazwach A i B. Autostrada kosztuje rząd C > 0, a wartość autostrady dla A i B to v A 0 i v B 0, odpowiednio. Jednocześnie każde województwo i {A, B} może zadeklarować b i [0, ). Jeśli b A + b B C autostrada zostanie zbudowana. Dla każdego i, j {A, B},województwo i zapłaci C b j, jeśli b j < C b a + b b. (nie ma innej płatności.) Korzyść dla każdego województwa, to wartość autostrady do minus płatność do rządu, jeśli autostrada zostanie wybudowana i 0 gdy nie zostanie wybudowana. (można skupić się na przypadku v A + v B < C.) (a) (b) (c) Sprawdź czy to jest gra. Zapisz grę w postaci normalnej nie da się tego zrobić w tabeli, więc zapisz jakie będą wypłaty dla każdej strategii obu województw. Sprawdź, czy istnieje równowaga w strategiach czystych. Podpowiedź: sprawdź strategie dominujące! 24