Instytut Informatyki Uniwersytetu Śląskiego Wykład 5 - Równowagi w grach n-osobowych
Figure: Podział gier
Definicje Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy definiowana jest jako: Γ = N, {A i }, M, i = 1, 2,..., n gdzie: N = {1, 2,..., n} jest zbiorem graczy; {A i } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ 1, µ 2,..., µ n } to zbiór funkcji wypłat dla graczy.
Układ strategii Przez a = ( a 1,..., a n ) oznaczmy profil strategii mieszanych wszystkich graczy, określany dalej jako układ strategii. a i = ( a 1,..., a i 1, a i+1,..., a n ), będzie układem strategii z wyłączeniem gracza i. Mieszana strategia gracza i określana jest jako: a i = (P(a i1 ), P(a i2 ),..., P(a im )), gdzie P(a i1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i, natomiast a i oznacza tutaj dyskretny rozkład prawdopodobieństwa nad zbiorem strategii. Wsparcie Wsparcie strategii mieszanych jest podzbiorem zbioru strategii czystych danego gracza mających niezerowe prawdopodobieństwo wyboru: i, x i M x, P(x i ) > 0
strategie B1 B2 A1 1, 4 0, 6 A2 4, 1-1, -1 Table: Prosta gra 2-osobowa Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. Figure: Graficzna reprezentacja równowagi Nasha
Równowaga Nasha Mieszana równowaga Nasha definiowana jest następująco: i, j, µ i (a) µ i (a ij, a i ), gdzie: i - oznacza i-tego gracza; j - jest numerem strategii danego gracza; µ i (a) - wypłata i-tego gracza dla profilu strategii a; µ i (a ij, a i ) - wypłata i gracza stosującego strategię j przeciwko a i.
Figure: Równowaga Nasha - klasa złożoności FP = FNP jeżeli P = NP
Figure: Przykład gry 3 osobowej
Figure: Liczba graczy a wielkość macierzy
Typy równowag równowaga Nasha; ɛ równowaga Nasha - zwana także ɛ równowagą; równowaga skorelowana - bardziej ogólna niż Nash; równowaga Pareto - równowaga Nasha z najwyższą wypłatą dla graczy; Trembling hand equilibrium - równowaga drżącej ręki - założenie, że gracz może przez nieuwagę zagrać strategię z zerowym prawdopodobieństwem wyboru; idealna równowaga w podgrach - w grach w postaci ekstensywnej; ɛ-well supported Nash - ɛ równowaga, w której każda strategia ma niezerowe prawdopodobieństwo wyboru.
Typy równowag cd Silna równowaga Nasha (ang. Coalition Proof Social Equilibrium) określana także jako CPSE (stosowana w teorii głosowania). Często pomijana w rozważaniach jako zbyt trudna do uzyskania. Punkty ogniskowe (zwane także punktem Schellinga) - punkt równowagi w grach koordynacyjnych. Równowagi Nasha z dodatkowymi właściwościami (zaproponowane przez Gilboę) dotyczą pareto równowagi Nasha, równowagi, w której gracze zobligowani są do stosowania z góry założonej strategii, lub też prawdopodobieństwo wyboru danej strategii nie może być niższe (nie może przekroczyć) konkretnej wartości. Powyższe koncepcje należą do klasy złożoności NP.
Figure: Zależność pomiędzy równowagami
Figure: Program Gamut java jar gamut.jar g GraphicalGame RG players 3 randomparams normalize minpayoff 0 maxpayoff 1 f game.nfg output GambitOutput actions 3
Figure: Program Gambit - główne okno programu
Gry: Dylemat więźnia; Gra w cykora; Oligopol Bertranda; Zgadnij 2 3 ze średniej; Dylemat podróżnika; Klasy gier: Gra bimacierzowa; Gra koordynacyjna; Kowariancja; Gra losowa; Gra losowa znormalizowana; Figure: Przykład dylematu więźnia oraz gry losowej
strategie b 1 b 2 b 3 b 4 a 1 0.2, 0.6 0.1, 0.7 0.4, 0.8 0.3, 0.5 a 2 0.4, 0.1 0.5, 0.3 0.5, 0.7 0.2, 0.7 a 3 0.1, 0.5 0.9, 0.4 0.9, 0.3 0.8, 0.1 a 4 0.5, 0.4 0.7, 0.9 0.1, 0.6 0.1, 0.6 Table: Prosta gra 2-osobowa Równowaga Nasha: {0 : 1 4 : 3 4 : 0 : 4 7 : 0 : 3 7 : 0} Wypłaty graczy to: 0.443 i 0.4.
strategie b 1 b 2 b 3 b 4 a 1 0.2, 0.6 0.1, 0.7 0.4, 0.8 0.3, 0.5 a 2 0.4, 0.1 0.5, 0.3 0.5, 0.7 0.2, 0.7 a 3 0.1, 0.5 0.9, 0.4 0.9, 0.3 0.8, 0.1 a 4 0.5, 0.4 0.7, 0.9 0.1, 0.6 0.1, 0.6 Table: Prosta gra 2-osobowa Dla układu: { 1 10 : 3 10 : 2 10 : 4 10 : 1 10 : 3 10 : 2 10 : 4 10 } Po 3 losowych grach: a 2 b 1, a 4 b 4, a 2 b 1 wypłaty graczy: 0.3 i 0.26 ɛ wynosi: 0.36 Figure: Wybór strategii
strategie b 1 b 2 b 3 b 4 a 1 0.2, 0.6 0.1, 0.7 0.4, 0.8 0.3, 0.5 a 2 0.4, 0.1 0.5, 0.3 0.5, 0.7 0.2, 0.7 a 3 0.1, 0.5 0.9, 0.4 0.9, 0.3 0.8, 0.1 a 4 0.5, 0.4 0.7, 0.9 0.1, 0.6 0.1, 0.6 Table: Prosta gra 2-osobowa Dla układu: { 1 10 : 3 10 : 2 10 : 4 10 : 1 10 : 3 10 : 2 10 : 4 10 } Po 3 innych losowych grach: a 2 b 2, a 4 b 3, a 2 b 1 wypłaty graczy: 0.333 i 0.3666 Figure: Wybór strategii
Algorytmy dla gier 2-osobowych Lemke Howson; algorytmy przybliżone; Algorytm Scarfa; Algorytmy dla gier n-osobowych Simplicial Subdivision; Globalna metoda Newtona; Metaheurystyki w wyszukiwaniu czystych równowag; Algorytm przybliżony oparty na ewolucji różnicowej;
Co na następnym wykładzie? Dylemat więźnia; Iterowany dylemat więźnia i turniej Axelroda; Gry przeciwko naturze; Gry Bayesowskie; Gry kooperacyjne.
Dziękuję za uwagę.