Instytut Informatyki Uniwersytetu Śląskiego Wykład 1
1 Klasyfikacja gier 2 Gry macierzowe, macierz wypłat, strategie czyste i mieszane 3 Twierdzenie o minmaksie, drzewa gry 4 Punkty równowagi w grach o sumie zerowej 5 Gry dwuosobowe o sumie niezerowej 6 Równowagi Nasha 7 Gry dwuosobowe negocjacyjne 8 Gry wielosobowe 9 Gry z naturą
Teoria gier zajmuje sie badaniem optymalnego zachowania w przypadku przeciwstawnych interesów i okreslana jest jako matematyczna teoria konfliktu. minimum dwóch uczestników gry; zbiór zasad, według których postępują uczestnicy gry; wynik gry, który określony jest przez kombinacje sposobów postępowania uczestników gry; uczestnicy są racjonalni i dążą do maksymalizacji zysków.
Podstawy teorii gier: E. Borel, Sur les jeux ou interviennent le hasard et l habilit e des joueurs, the English translation [Elements of the Theory of Probability. Prentice-Hall, 1924. J. von Neumann, Zur theorie der gesellschaftsspiele. Mathematische Annalen - Contributions to the Theory of Games, Vol. 4:13 42, 1928. O. Mergenstern, J. von Neumann. Theory of Games and Economic Behavior. Princeton University Press, 1944. J. Nash, Non-Cooperative Games, The Annals of Mathematics Second Series, Vol. 54, No. 2 (Sep., 1951), pp. 286-295.
Zastosowanie teorii gier: ekonomia, J. Aubin. Mathematical Methods of Game and Economic Theory. North-Holland Publ. CO., 1979. nauki społeczne, P. Ordeshook. Game theory and political theory. Cambridge University Press, 1986. biologia, Selten R. Hammerstein, P. Handbook of game theory. University of Bonn, 1994. sztuczna inteligencja, M. Tennenholtz. Game Theory and Artificial Intelligence. Springer Berlin/Heidelberg, 2002.
handel elektroniczny, Games at Work-Agent-Mediated E-Commerce Simulation, 2000. sieci komputerowe, Mackenzie A. Menon R. Dasilva L. Hicks J. Reed J. Gilles R. Neel, J. Using game theory to analyze wireless ad hoc networks. IEEE Communications Surveys and Tutorials, Vol. 7:46 56, 2005. sieci transportowe, David Easley and Jon Kleinberg. Reasoning about a Highly Connected World. Cambridge University Press, 2010. i wiele więcej..
Rysunek: Podział gier
Jeden z możliwych podziałów gier: kolejność podejmowania decyzji: gry w postaci strategicznej i ekstensywnej; posiadana wiedza: gry z pełną informacją oraz gry z niepełną informacją; liczba graczy: gry 2-osobowe, gry n-osobowe (n 3); zbiór dostępnych akcji: gry nieskończone (kontinuum akcji), gry ze skończonym zbiorem strategii; możliwość tworzenia koalicji: gry kooperacyjne, gry niekooperacyjne; powtarzalność: gry iterowane oraz gry jednoetapowe.
Czas podejmowania decyzji Gry w postaci strategicznej (normalnej) sytuacje, w których gracze podejmują decyzje jednocześnie; zysk graczy obliczany jest na podstawie macierzy wypłat; wielkość macierzy wypłat zależy bezpośrednio od liczby graczy oraz od liczby strategii czystych dostępnych dla graczy; Gry w postaci ekstensywnej (drzewiastej) decyzje graczy podejmowane są sekwencyjnie; wypłaty graczy ustalane na podstawie drzewa gry; każdy z graczy w danej chwili zna wszystkie możliwe ruchy.
Formalnie gra w postaci normalnej: Γ = N, {A i }, M, i = 1, 2,..., n gdzie: N = {1, 2,..., n} jest zbiorem graczy; {A i } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ 1, µ 2,..., µ n } to zbiór funkcji wypłat dla graczy.
Rysunek: Przykład prostej gry dwuosobowej
Rysunek: Wielosobowa gra w postaci strategicznej w programie GAMBIT 4 graczy; każdy z graczy po 2 strategie; każda komórka macierzy to wypłata gracza przy okreśonych strategiach pozostałych graczy;
Przez a = ( a 1,..., a n ) oznaczmy profil strategii mieszanych wszystkich graczy, określany dalej jako układ strategii. a i = ( a 1,..., a i 1, a i+1,..., a n ), będzie układem strategii z wyłączeniem gracza i. Mieszana strategia gracza i określana jest jako: a i = (P(a i1 ), P(a i2 ),..., P(a im )), gdzie P(a i1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i, natomiast a i oznacza tutaj dyskretny rozkład prawdopodobieństwa nad zbiorem strategii.
Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. gdzie: i - oznacza i-tego gracza; i, j µ i (a) µ i (a ij, a i ), j - jest numerem strategii danego gracza; µ i (a) - wypłata i-tego gracza dla profilu strategii a; µ i (a ij, a i ) - wypłata i gracza stosującego strategię j przeciwko a i.
strategie B1 B2 A1 1, 4 0, 6 A2 4, 1-1, -1 Tablica: Prosta gra 2-osobowa Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. Rysunek: Graficzna reprezentacja równowagi Nasha
Rysunek: Równowaga Nasha a złożoność problemu
Rysunek: Przykłady gier w postaci normalnej dla różnej liczby graczy. a) gra 2-osobowa; b) gra 3-osobowa; c) gra 4-osobowa
Gra w postaci ekstensywnej formalnie: N = {1, 2,..., n} - zbiór graczy; G = (W, E) - drzewo gry (graf skierowany bez cykli) W - wierzchołki (sytuacje w grze); E - łuki (przejścia między sytuacjami w grze); często wyróżnia się też zbiór wierzchołków końcowych (liści).
Dowolną grę dla dwóch (i więcej) graczy taką jak szachy, kółko i krzyżyk, go, warcaby można zapisać w postaci ekstensywnej. algorytm min-max: pomaga znaleźć najlepszy ruch, pracując od końca gry. Na każdym kroku zakłada, że gracz A próbuje zmaksymalizować szanse na wygraną gracza A, podczas gdy w następnym ruchu gracz B stara się zminimalizować szanse na wygraną gracza A; algorytm alfa-beta - algorytm stosowany do redukcji liczby węzłów, które muszą zostać sprawdzone w algorytmie min-max.
Rysunek: Algorytm min-max
Rysunek: Algorytm alfa-beta
Gry z pełną informacją: każdy z graczy zna w pełni zasady gry, funkcje wypłat oraz zbiory mozliwych strategii wszystkich pozostałych graczy; założenie o racjonalności graczy, gdzie każdy z uczestników dąży do maksymalizacji zysku; gracze w każdej chwili posiadają pełną informację o poprzednich decyzjach innych graczy; grę ekstensywną można przekształcić w grę w postaci normalnej (i na odwrót);
Rysunek: Wielosobowa gra w postaci ekstensywnej
Inne typy równowag w teorii gier: równowaga Nasha; ɛ równowaga Nasha - zwana także ɛ równowagą; równowaga skorelowana - bardziej ogólna niż Nash; równowaga Pareto - równowaga Nasha z najwyższą wypłatą dla graczy; Trembling hand equilibrium - równowaga drżącej ręki - założenie, że gracz może przez nieuwagę zagrać strategię z zerowym prawdopodobieństwem wyboru; idealna równowaga w podgrach - w grach w postaci ekstensywnej; ɛ-well supported Nash - ɛ równowaga, w której każda strategia ma niezerowe prawdopodobieństwo wyboru.
Gry z niepełną informacją: określane także jako gry bayesowskie; dla gier strategicznych w przypadku informacji niepełnej definiowana jest jawnie dodatkowa funkcja prawdopodobieństwa, która w zależności od wartości określa końcową wypłatę graczy; często przyjmuje się, że gry strategiczne z niepełną informacją posiadają więcej niż jedną macierz wypłat; dla gier w postaci ekstensywnej brak pełnej informacji zaznaczony jest jako zbiory informacyjne.
Rysunek: Gra w postaci ekstensywnej z niepełną informacją
Możliwość tworzenia koalicji graczy: gry koalicyjne akcje przypisywane sa grupom (koalicjom) graczy; ze zbioru graczy możliwe jest wyszczególnienie podzbiorów graczy współpracujących ze sobą; wartość Shapleya - wartość zysku pojedynczego gracza w koalicji; gry niekooperacyjne interesy graczy w grach niekooperacyjnych nie muszą być przeciwstawne (gry o sumie niezerowej); założenie o racjonalności graczy (w przypadku gracza nieracjonalnego każda strategia ma takie samo prawdopodobieństwo wyboru);
Rysunek: Gra z elementami kooperacji dwóch graczy Dwóch graczy: każdy ma do wyboru jedną z trzech strategii. nieustępliwa: gracz jedzie drogą główną i żąda przejazdu; elastyczna: gracz jedzie drogą główną w przypadku pierwszeństwa przejazdu. W przeciwnym razie przepuszcza gracza B; wycofanie się: gracz jedzie dłuższą drogą.
Gry z kontinuum graczy stosowane do przedstawiania sytuacji wolnorynkowych; zbiór graczy reprezentowany przed odcink [0, 1]; koncepcja strategii stabilnej ewolucyjnie; Rysunek: Przykład gry ze strategią stabilną ewolucyjnie. Popularny Jastrząb-gołąb
Gry o nieskończonym zbiorze strategii są uogólnieniem gier skończonych: jeden z najpopularniejszych przykładów tego typu gier to duopol Cournota; gry na kwadracie, gdzie każdy z graczy posiada kontinuum strategii czystych; strategia mieszana dla gier na kwadracie to dystrybuanta funkcji;
Dziękuję za uwagę.