Uniwersytet Śląski w Katowicach, Instytut Informatyki ul. Będzińska 39 41-200 Sosnowiec 9 grudnia 2014, Chorzów
1 Motywacja 2 3 4 5 6 Wnioski i dalsze badania
Motywacja 1 są klasą gier, w których istnieje duża liczba strategii optymalnych, a jednostki użyteczności wypłacane są graczom tylko wtedy, gdy wybiorą te same strategie; 2 Zaproponowane podejście bazuje na algorytmie ewolucji różnicowej. Funkcja oceny umożliwia wyznaczenie maksymalnego odchylenia od strategii optymalnych poszczególnych graczy; 3 Metoda ta umożliwia wyznaczenie optymalnych strategii mieszanych, które są znacznie mniej popularne, niż czyste strategie optymalne.
Podstawowe definicje Wizualizacja równowagi Nasha Rysunek: Przykładowy podział gier
Podstawowe definicje Wizualizacja równowagi Nasha Definicja gry Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy definiowana jest jako: Γ = N, {A i }, M, i = 1, 2,..., n gdzie: N = {1, 2,..., n} jest zbiorem graczy; {A i } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ 1, µ 2,..., µ n } to zbiór funkcji wypłat dla graczy.
Podstawowe definicje Wizualizacja równowagi Nasha Rysunek: Gry n-osobowe
Podstawowe definicje Wizualizacja równowagi Nasha Układ strategii Przez a = ( a 1,..., a n ) oznaczmy profil strategii mieszanych wszystkich graczy, określany dalej jako układ strategii. a i = ( a 1,..., a i 1, a i+1,..., a n ), będzie układem strategii z wyłączeniem gracza i. Mieszana strategia gracza i określana jest jako: a i = (P(a i1 ), P(a i2 ),..., P(a im )), gdzie P(a i1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i, natomiast a i oznacza tutaj dyskretny rozkład prawdopodobieństwa nad zbiorem strategii.
Podstawowe definicje Wizualizacja równowagi Nasha strategie B1 B2 A1 1, 4 0, 6 A2 4, 1-1, -1 Tablica: Prosta gra 2-osobowa Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. Rysunek: Graficzna reprezentacja równowagi Nasha
Przykład gry koordynacyjnej Przegląd literatury Czym jest gra koordynacyjna? problem wyboru tej samej strategii przez każdego z graczy; gry koordynacyjne odpowiadają problemowi koordynacji - gracze zyskują tylko, jeżeli wybiorą tę samą strategię; liczne równowagi Nasha w strategiach czystych; istnieją także równowagi w strategiach mieszanych; rozwiązanie w strategiach mieszanych jest zdominowane przez rozwiązania w strategiach czystych; w grze jednoetapowej równowaga Nasha w strategiach mieszanych może okazać się lepszym wyborem.
Przykład gry koordynacyjnej Przegląd literatury Rysunek: Klasyczny przykład gry koordynacyjnej - wybór stron W powyższym przykładzie mamy dwa punkty równowagi w strategiach czystych. Problemem jest jednoczesny wybór strategii przez graczy.
Przykład gry koordynacyjnej Przegląd literatury Rysunek: Czysta gra koordynacyjna Dwa punkty równowagi. Tylko jedna pareto równowaga Nasha. Zakładając racjonalność graczy można przyjąć, iż wybiorą pierwszą strategię.
Przykład gry koordynacyjnej Przegląd literatury Rysunek: Gra koordynacyjna - wojna płci Dwa punkty równowagi. W powyższym przypadku istnieje konflikt interesów dwóch stron.
Przykład gry koordynacyjnej Przegląd literatury Rysunek: Gra koordynacyjna - uogólnienie W przypadku koordynacyjnej gry 2-osobowej spełnione są następujące warunki: A > B; D > C; a > c; d > b.
Przykład gry koordynacyjnej Przegląd literatury Przegląd literatury koncepcja punktu ogniskowego - Schelling, Thomas C. (1960, First Edition). The strategy of conflict, Cambridge: Harvard University Press; problem komunikacji w grach koordynacyjnych - R. Cooper, D. Dejong, R. Forsythe, T. Ross Communication in Coordination Games, The Quarterly Journal of Economics (1992) Vol. 107 (2), pp. 739-771; punkty ogniskowe w grach czysto koordynacyjnych - J. Mehta, Ch. Starmer, R. Sugden Focal Points in Pure Coordination Games An Experimenta Investigation, Theory and Decision (1994), Vol. 36 (2), pp 163-185;
Przykład gry koordynacyjnej Przegląd literatury Przegląd literatury II wybór punktu równowagi w grze n-osobowej - K. Youngse Equilibrium Selection in n-person Coordination Games, Games and Economic Behavior, 1996, Vol. 15, pp. 203 227. koncepcja rozwiązania opartego o grę fikcyjną - GW Brown Iterative solution of games by fictitious play, Activity analysis of production and allocation, (1951) rozwiązania oparte o grę fikcyjną (ang. fictitious play) gdzie ruch gracza wyznaczany jest w oparciu o szereg fikcyjnych decyzji - A. Sela, D. Herreiner Fictitious play in coordination games, International Journal of Game Theory (1999), Vol. 28, pp 189-197;
Przykład gry koordynacyjnej Przegląd literatury Przegląd literatury III artykuł wskazujący, że niektóre typy gier koordynacyjnych nie mogą zostać rozwiązane przy pomocy tzw. gry fikcyjnej - D. Foster On the Nonconvergence of Fictitious Play in Coordination Games, Games and Economic Behavior (1998), Vol. 25, pp 79-96; podejście oparte na kooperacji w grach iterowanych - V. Crawford, H. Haller Learning How to Cooperate: Optimal Play in Repeated Coordination Games, Econometrica, (1990), Vol. 58 (3), pp 571-595; interesująca koncepcja równowagi Nasha z filmu Piękny umysł - S. Anderson, M. Engers, A Beautiful blonde: a Nash coordination game.
Ogólny opis Podstawowy schemat DE Ewolucja różnicowa Ewolucja różnicowa jest algorytmem populacyjnym opracowanym przez R. Storna i K. Price a. 1 Stosowana najczęściej do optymalizacji funkcji ciągłych. 2 Adaptacyjny schemat mutacji. 3 Operatory genetyczne: Mutacja, Krzyżowanie. 4 Trzy populacje: Populacja rodziców; Populacja próbna; Populacja potomków.
Ogólny opis Podstawowy schemat DE Rysunek: Ewolucja różnicowa
Ogólny opis Podstawowy schemat DE Rysunek: Ewolucja różnicowa
Ogólny opis Podstawowy schemat DE 1 Mutacja : V ij = X r1j + F (X r2j X r3j) 2 Krzyżowanie : { Vi,j gdy RAND[0, 1) < CR, U i,j = w przeciwnym wypadku. 3 Selekcja : X i,j { Ui,t gdy f ( U X i,t+1 = i,t ) f ( X i,t ), X i,t w przeciwnym wypadku.
Genotyp osobnika Funkcja przystosowania Rysunek: Tworzenie genotypu osobnika
Genotyp osobnika Funkcja przystosowania Funkcja przystosowania W przypadku gier koordynacyjnych w strategii optymalnej wypłaty dla wszystkich stron są równe. f 1 = n n c u i u j ; i j i=1 j=1 gdzie u i oznacza wypłatę i-tego gracza, a c jest wartością stałą. Dodatkowa zależność dotycząca prawdopodobieństwa przedstawiona została poniżej: f 2 = n 1 m P(a ij ) i=1 j=1
Genotyp osobnika Funkcja przystosowania Funkcja przystosowania II W kolejnych iteracjach wartości genotypu powinny odpowiadać prawdopodobieństwom wyboru strategii optymalnych dla poszczególnych graczy. Dodana została także funkcja kary dla równowag czystych: { f3 + c if g[i] = 1, i, f 3 = w przeciwnym wypadku, f 3 gdzie g[i] jest i-tym genem w genotypie. Suma trzech powyższych funkcji to funkcja przystosowania: f = f 1 + c f 2 + f 3. c - wartość stała jest stosowana w celu zwiększenia wartości funkcji kary. Wartość funkcji przystosowania równa 0 to optimum globalne.
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Stosowany program GAMUT - narzędzie stosowane do generowania różnych typów gier stosowane powszechnie w teorii gier. Wartości parametrów wielkość populacji jest równa iloczynowi liczby graczy oraz liczby strategii; podstawowy schemat mutacji z wartością F = 0.7; krzyżowanie dwumianowe CR = 0.5; 10 różnych typów gier dla każdej wielkości problemu (3, 4 i 5 graczy); Każdy eksperyment został powtórzony 30 razy.
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wykres pudełkowy wartosci ɛ dla poszczególnych gier 3 - osobowych
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wykres pudełkowy wartosci ɛ dla poszczególnych gier 4 - osobowych
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Tablica: Wartosci wypłat dla poszczegególnych gier 3 - osobowych Gra 3 - osobowa Minimum Mediana Maksimum Średnia Odchylenie standardowe gra 1 0.449 0.680 0.901 0.668 0.151 gra 2 0.004 0.416 0.927 0.465 0.237 gra 3 0.077 0.561 0.839 0.554 0.231 gra 4 0.302 0.541 0.955 0.566 0.218 gra 5 0.582 0.647 0.902 0.678 0.093 gra 6 0.016 0.436 0.651 0.427 0.166 gra 7 0.258 0.439 0.803 0.475 0.139 gra 8 0.054 0.667 1 0.691 0.219 gra 9 0.235 0.395 0.674 0.413 0.124 gra 10 0.352 0.457 0.864 0.494 0.152
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Tablica: Wartosci wypłat dla poszczegególnych gier 4 - osobowych Gra 4 - osobowa Minimum Mediana Maksimum Średnia Odchylenie standardowe gra 1 0.223 0.301 0.717 0.323 0.099 gra 2 0.005 0.306 0.916 0.332 0.154 gra 3 0.018 0.395 0.785 0.408 0.222 gra 4 0.089 0.355 0.486 0.353 0.083 gra 5 0.001 0.427 0.709 0.417 0.152 gra 6 0.013 0.275 0.375 0.238 0.109 gra 7 0.033 0.308 0.6 0.3 0.138 gra 8 0.002 0.354 0.501 0.319 0.122 gra 9 0.052 0.310 0.644 0.345 0.165 gra 10 0.014 0.343 0.751 0.367 0.145
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wypłaty dla gier 3-osobowych
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wypłaty dla gier 4-osobowych
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Podsumowanie Ewolucja różnicowa może być w prosty sposób dostosowana do wyszukiwania punktów równowag w grach kooperacyjnych. Ponadto, poprzez wielokrotne uruchomienie algorytmu możliwe jest wygenerowanie kilku różnych rozwiązań. W przypadku bardzo złożonych problemów algorytm ten pozwala na wygenerowanie rozwiązań przybliżonych, czyli ɛ-równowag Nasha. Do funkcji oceny możliwe jest też dodanie funkcji kary, która uniemożliwi pojawienie się rozwiązań w strategiach czystych, a nawet zagwarantuje, iż rozwiązanie będzie zawierało wszystkie strategie dostępne dla gracza - ɛ-well supported Nash.
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Dalsze badania ograniczenia kostkowe dla genotypu osobnika. Wartości genów w genotypie maleją w kolejnych iteracjach, dlatego można założyć, że ograniczenia kostkowe mogą się zmieniać; interesujące wydaje się być także sprawdzenie, czy koncepcja punktu ogniskowego w grach koordynacyjnych może stanowić alternatywę dla klasycznego rozwiązania - równowagi Nasha.
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Storn R. and Price K. Differential evolution - a simple and efficient heuristic for global optimization over continuous spaces. Journal of Global Optimization, Vol. 11, No. 4, 341 359, 1997. Sela, A. and Herreiner D. Fictitious play in coordination games. International Journal of Game Theory, Vol. 28, pp 189-197, 1999. Daskalakis C. Mehta A. and Papadimitriou Ch. A note on approximate Nash equilibria. Journal Theoretical Computer Science, Vol. 410, pp. 1581 1588, 2009 Etessami K. and Yannakakis M. On the Complexity of Nash Equilibria and Other Fixed Points(Extended Abstract). Proceedings of the 48th Annual IEEE Symposium on Foundations of Computer Science, pp. 113 123, 2007.
Narzędzia i ustawienia Wartości ɛ Wartości wypłat Dziękuję za uwagę