Gry o sumie niezerowej

Gry o sumie niezerowej Równowagi Nasha 2011-12-06 Zdzisław Dzedzej 1

Pytanie Czy profile równowagi Nasha są dobrym rozwiązaniem gry o dowolnej sumie? Zaleta: zawsze istnieją (w grach dwumacierzowych, a także dla dużej klasy innych gier niekooperacyjnych) W grach antagonistycznych ich znajomość jest wskazówką dla graczy: wystarczy wybierać strategie prowadzące do równowagi. Na razie zakładamy zakaz komunikowania się 2011-12-06 Zdzisław Dzedzej 2

Przykład 1 A B A (2, 3) (3, 2) B (1, 0) (0,1) 2011-12-06 Zdzisław Dzedzej 3

W grze Wiersza A dominuje B Wiedząc o tym, Kolumna zagra A Profil (A,A) jest równowagą czystą Nasha Można używać diagramu przesunięć oraz kryterium dominacji (indywidualna racjonalność graczy) 2011-12-06 Zdzisław Dzedzej 4

Nie ma czystej równowagi Nasha Szukamy strategii wyrównującej Wiersza w grze Kolumny W: pa+(1-p)b? K A: 4p+1(1-p) = 0p+4(1-p) : B Stąd W : 3/7A+4/7B Podobnie K : 1/2A+1/2B po analizie gry Wiersza To daje równowagę Nasha z wynikiem (3/2, 16/7) Zauważmy, że (A,A) dałoby wynik lepszy dla obu graczy 2011-12-06 Zdzisław Dzedzej 6

Przykład 3 A B A (1, 1) (2, 5) B (5, 2) (-1,-1) 2011-12-06 Zdzisław Dzedzej 7

Są dwie czyste równowagi Nasha Profile (B, A) oraz (A, B) sa równowagami, ale dają różne wypłaty: BA jest lepsza dla Wiersza, AB dla Kolumny Jeśli obaj wybiorą strategie prowadzące do preferowanych przez siebie równowag, to wyjdzie BB najgorszy możliwy wynik na dodatek nie będący równowagą. Wniosek: równowagi nie są wymienne ani równoważne, a ich zbiór nie jest prostokątny. 2011-12-06 Zdzisław Dzedzej 8

Przykład 4 A B A (3, 3) (-1, 5) B (5,-1) (0, 0) 2011-12-06 Zdzisław Dzedzej 9

Komentarz W przykładzie 4 jest jedyna równowaga Nasha: Czysta BB powstaje ze ścisłych dominacji dla obu graczy Lepszy wynik byłby, gdyby obaj gracze wybrali A Wniosek: nie można przenieść pojęcia rozwiązania gry z gier macierzowych na dwumacierzowe bez zmian. 2011-12-06 Zdzisław Dzedzej 10

Profil Pareto -optymalny DEF: Profil jest nieoptymalny w sensie Pareto, jeśli istnieje inny profil dający wszystkim co najmniej te same wypłaty, a przynajmniej jednemu wyższą. 2011-12-06 Zdzisław Dzedzej 11

Kryterium Pareto Racjonalność grupowa: Tylko profil optymalny w sensie Pareto może być akceptowalny jako kandydat na rozwiązanie gry. Uwaga: kryterium dominacji interpretuje się jako racjonalność indywidualną. 2011-12-06 Zdzisław Dzedzej 12

Kol Przykład 1 3 AA Równowaga Nasha AB 1 BA 1 3 W 2011-12-06 Zdzisław Dzedzej 14

Kol Przykład 2 AA 3 Równowaga Nasha 1 AB 1 3 W 2011-12-06 Zdzisław Dzedzej 16

Przykład 3 A B A (1, 1) (2, 5) B (5, 2) (-1,-1) 2011-12-06 Zdzisław Dzedzej 17

Kol Przykład 3 5 AB BA 2 AA 2 5 W 2011-12-06 Zdzisław Dzedzej 18

Przykład 4 A B A (3, 3) (-1, 5) B (5,-1) (0, 0) 2011-12-06 Zdzisław Dzedzej 19

Kol Przykład 4 3 AA Równowaga Nasha 1 AB 1 3 W 2011-12-06 Zdzisław Dzedzej 20

Gry rozwiązywalne DEF: Gra dwuosobowa jest rozwiązywalna w ścisłym sensie, jeśli Posiada przynajmniej jedną równowagę Nasha optymalną w sensie Pareto, Jeśli takich równowag jest więcej, to są one ekwiwalentne i wymienne. 2011-12-06 Zdzisław Dzedzej 21

Drugi warunek oznacza, że dają równe wypłaty, a także: gdy obaj gracze zagrają dowolne swoje strategie będące składowymi punktu równowagi, to otrzymamy punkt równowagi. Z naszych przykładów tylko 1 jest rozwiązywalna w ścisłym sensie 2 ma równowagę nieoptymalną, w 3 równowagi optymalne nie są wymienne ani ekwiwalentne, w 4 równowaga też nie jest optymalna (ekstremalnie!) 2011-12-06 Zdzisław Dzedzej 22

Strategie bezpieczeństwa DEF: Strategia optymalna Wiersza (Kolumny) w grze Wiersza (Kolumny) nazywa się strategią bezpieczeństwa Wiersza (Kolumny). Odpowiednia wartość wypłaty gracza nazywa się jego poziomem bezpieczeństwa 2011-12-06 Zdzisław Dzedzej 23

Jeszcze raz Przykład 2 W grze Wiersza jest punkt siodłowy AB A B Zatem strategia A gwarantuje poziom co najmniej 1 To jest poziom bezpieczeństwa Wiersza A 2 1 B 3 0 2011-12-06 Zdzisław Dzedzej 24

Jeszcze raz Przykład 2 W grze Kolumny jej strategia bezpieczeństwa to 4/7A +3/7B, która daje poziom co najmniej 16/7 To jest poziom bezpieczeństwa Kolumny A B A 4 0 B 1 4 2011-12-06 Zdzisław Dzedzej 25

Analiza Jeśli obaj gracze zagrają swoje strategie bezpieczeństwa, otrzymamy profil 4/7AA+3/7AB To daje wypłaty (11/7, 16/7) Nie jest to wynik paretooptymalny ani nie jest to równowaga Równowaga : [3/7A+4/7B, 1/2A+1/2B] daje wypłaty (3/2, 16/7) Jeśli Kolumna przewiduje, że Wiersz gra strategię bezpieczeństwa, to powinna zagrać najlepszą odpowiedź ( strategia kontrbezpieczna) A i wygrać 4. Podobnie Wiersz ma strategię kontrbezpieczną B 2011-12-06 Zdzisław Dzedzej 26

Strategia Wiersza Strategia Kolumny Wypłata Wiersza Wypłata Kolumny Bezp A Bezp. 4/7A+3/7B 1,57 2,29 Bezp A Kontrb. A 2,00 4,00 Kontrb. B Bezp. 4/7A+3/7B 1,71 2,29 Kontrb. B Kontrb. A 3,00 1,00 2011-12-06 Zdzisław Dzedzej 27

Uwagi Strategie bezpieczeństwa są nazywane także maksyminowymi ( od sposobu obliczania poziomów bezpieczeństwa). Średnia wypłata gracza w punkcie równowagi jest co najmniej taka, jak poziom bezpieczeństwa. 2011-12-06 Zdzisław Dzedzej 28

Przykład 5 Równowagi : BB nieoptymalna AC Pareto-optymalna To nie są ich strategie bezpieczeństwa Ćwiczenie: wykonaj odp. Diagramy i rys. A B C A B C (0, -1) (0, 2) (2, 3) (0, 0) (2, 1) (1,-1) (2, 2) (1, 4) (1, -1) 2011-12-06 Zdzisław Dzedzej 29

Przykład 6! 2011-12-06 Zdzisław Dzedzej 30

Teoria użyteczności Kiedy próbujemy zastosować teorię gier do rzeczywistych przykładów, konieczna jest analiza procesu przypisywania wartości liczbowych wypłat. Podstawy teorii użyteczności stworzyli von Neumann i Morgenstern. Jakie właściwości wypłat są konieczne dla sensowności wniosków z modelu. 2011-12-06 Zdzisław Dzedzej 31

Przypadek 1- jest punkt siodłowy To znaczy,że Wiersz przedkłada go nad inne w jego kolumnie, zaś każdy w jego wierszu uważa za lepszy. Zatem wymagamy jedynie, aby liczby reprezentowały uporządkowanie wyników od najbardziej do najmniej preferowanego przez Wiersza (odwrotnie dla kolumny). Życzymy sobie by porządek wynikający z preferencji Wiersza był liniowy. Aby grę można było uznać za grę o sumie zerowej, porządek preferencji Kolumny powinien być odwrotny do preferencji Wiersza. 2011-12-06 Zdzisław Dzedzej 32

Przykład A B A 6 1 B 5 4 Punkt siodłowy BB Jeżeli przekształcimy wartości wypłat przez funkcję rosnącą, punkt siodłowy zostanie w tym samym miejscu Zachowają się też wszystkie dominacje C 2 3 2011-12-06 Zdzisław Dzedzej 33

Skala porządkowa DEF: Skalę, na której większa wartość reprezentuje bardziej preferowany wynik (znaczenie ma tylko uporządkowanie wartości) nazywamy skalą porządkową. Użyteczności wyznaczone zgodnie z taką zasadą nazywamy użytecznościami porządkowymi. 2011-12-06 Zdzisław Dzedzej 34

Przypadek 2 nie ma punktu siodłowego Tutaj trzeba posługiwać się strategiami mieszanymi Skala, na której można interpretować proporcje między różnicami różnych wartości nazywamy skalą interwałową. Liczby oddające preferencje mierzone na skali interwałowej nazywamy użytecznościami interwałowymi. A B A a b B c d Gdy a>b i d>c, to optymalną strategią Wiersza jest strategia Mieszana, ale wtedy proporcja Różnic d-c i a-b musi być interpretowalna 2011-12-06 Zdzisław Dzedzej 35

Loterie Aby rozwiązanie gry w strategiach mieszanych miało sens, liczby wpisane w macierz gry powinny być użytecznościami interwałowymi. Niech możliwymi wynikami będą u, x, w, v kolejności wg preferencji Wiersza. Chcemy tak przypisać liczby wynikom, by proporcje między różnicami użyteczności wynikały z preferencji Wiersza: Zadajemy Wierszowi pytania o stosunek do loterii : 2011-12-06 Zdzisław Dzedzej 36

u>v niech u=100, v=0 Pytamy Wiersza : czy woli x na pewno, czy loterię gdzie u z prawdopodobieństwem ½ i v też. Jeśli woli x to umieszczamy je w przedziale (50,100). Czy woli x czy loterię 1/2v,3/4u Jeśli woli loterię, to x jest w (50,75), itd. Aż do odpowiedzi, że są równie korzystne. Zgodność oznacza, że położenie wyników ilustruje preferencje Wiersza w stosunku do loterii,np. x=60 ~ 4/10v,6/10u 2011-12-06 Zdzisław Dzedzej 37

Kolumna Aby gra miała sumę zerową, preferencje Kolumny powinny być dokładnie odwrotne do Wiersza. Jednak zmieniając punkty końcowe i zachowując proporcje (tzn. Ustawiając wartości wg wartości funkcji liniowej rosnącej) dostajemy równoważną skalę interwałową. Wniosek: Niektóre gry o sumie niezerowej są równoważne grom o sumie zerowej 2011-12-06 Zdzisław Dzedzej 38

Przykład 7 Górna gra nie ma sumy zerowej ani stałej, ale stosując do użyteczności wiersza funkcję G(x)=½(x-17) otrzymamy dolną grę. A B A (27,-5) (17, 0) B (19,-1) (23,-3) A B A (5,-5) (0,0) B (1,-1) (3,-3) 2011-12-06 Zdzisław Dzedzej 39

Użyteczności Kolumny u ż 5 y t e c z n o ś c i -5 5 15 AB A B 20 BA 2 0 BB AA Użyteczności Wiersza 2011-12-06 Zdzisław Dzedzej 40

Źródła J. von Neumann, O. Morgenstern, Theory of Games and Economic Behavior 1944 I.N. Herstein, J. Milnor, An axiomatic approach to measurable utility, Econometrica 21(1953), 291-297 Ph. Straffin, Teoria Gier, W-wa 2004 2011-12-06 Zdzisław Dzedzej 41

Typowe błędy 1. Odwrócenie przyczynowości : Jeśli ktoś przedkłada jakąś propozycję nad inną, to oznacza, że ta propozycja ma wyższą użyteczność. 2. Racjonalność : Jeśli mając do wyboru jedną z dwóch propozycji osoba wybiera tę o niższej użyteczności, to znaczy, że postępuje nieracjonalnie. 2011-12-06 Zdzisław Dzedzej 42

3. Dodawanie użyteczności : Możemy określić, jaka propozycja jest społecznie najbardziej pożądana, sumując użyteczności różnych osób (Bentham i utylitaryści XIX w.). 4. Międzyosobowe porównywanie użyteczności : Jeśli dany wynik ma dla jednego z graczy wyższą użyteczność niż dla drugiego, to jest on przez pierwszego gracza bardziej pożądany niż przez drugiego. 2011-12-06 Zdzisław Dzedzej 43

John Milnor 2011-12-06 Zdzisław Dzedzej 44

John von Neumann 2011-12-06 Zdzisław Dzedzej 45

Oskar Morgenstern 2011-12-06 Zdzisław Dzedzej 46

John F. Nash 80 lat 2011-12-06 Zdzisław Dzedzej 47

POBUDKA!!! Idziemy do domu. 2011-12-06 Zdzisław Dzedzej 48

2011-12-06 Zdzisław Dzedzej 49