Instytut Informatyki Uniwersytetu Śląskiego Wykład 1
1 Klasyfikacja gier 2 Gry macierzowe, macierz wypłat, strategie czyste i mieszane 3 Punkty równowagi w grach o sumie zerowej 4 Gry dwuosobowe oraz n-osobowe o sumie niezerowej 5 Typy równowag oraz równowagi Nasha 6 Gry iterowane 7 Twierdzenie o minmaksie, drzewa gry 8 Gry dwuosobowe negocjacyjne 9 Gra na giełdzie jako przykład gry z naturą
Warunki zaliczenia kolokwium - zakres: gry w postaci strategicznej, wyznaczanie strategii czystych i mieszanych, wyznaczanie punktów równowag w grach o sumie zerowej, równowagi Nasha w grach dwuosobowych, równowagi przybliżone, strategie zdominowane oraz strategie dominujące 60 % oceny. turniej programów - algoritm min-max z funkcją oceniającą dla wybranej gry 40 % oceny.
Teoria gier zajmuje sie badaniem optymalnego zachowania w przypadku przeciwstawnych interesów i okreslana jest jako matematyczna teoria konfliktu. minimum dwóch uczestników gry; zbiór zasad, według których postępują uczestnicy gry; wynik gry, który określony jest przez kombinacje sposobów postępowania uczestników gry; uczestnicy są racjonalni i dążą do maksymalizacji zysków.
Podstawy teorii gier: E. Borel, Sur les jeux ou interviennent le hasard et l habilit e des joueurs, the English translation [Elements of the Theory of Probability. Prentice-Hall, 1924. J. von Neumann, Zur theorie der gesellschaftsspiele. Mathematische Annalen - Contributions to the Theory of Games, Vol. 4:13 42, 1928. O. Mergenstern, J. von Neumann. Theory of Games and Economic Behavior. Princeton University Press, 1944. J. Nash, Non-Cooperative Games, The Annals of Mathematics Second Series, Vol. 54, No. 2 (Sep., 1951), pp. 286-295.
Zastosowanie teorii gier: ekonomia, J. Aubin. Mathematical Methods of Game and Economic Theory. North-Holland Publ. CO., 1979. nauki społeczne, P. Ordeshook. Game theory and political theory. Cambridge University Press, 1986. biologia, Selten R. Hammerstein, P. Handbook of game theory. University of Bonn, 1994. sztuczna inteligencja, M. Tennenholtz. Game Theory and Artificial Intelligence. Springer Berlin/Heidelberg, 2002.
handel elektroniczny, Games at Work-Agent-Mediated E-Commerce Simulation, 2000. sieci komputerowe, Mackenzie A. Menon R. Dasilva L. Hicks J. Reed J. Gilles R. Neel, J. Using game theory to analyze wireless ad hoc networks. IEEE Communications Surveys and Tutorials, Vol. 7:46 56, 2005. sieci transportowe, David Easley and Jon Kleinberg. Reasoning about a Highly Connected World. Cambridge University Press, 2010. i wiele więcej..
Figure : Podział gier
Jeden z możliwych podziałów gier: kolejność podejmowania decyzji: gry w postaci strategicznej i ekstensywnej; posiadana wiedza: gry z pełną informacją oraz gry z niepełną informacją; liczba graczy: gry 2-osobowe, gry n-osobowe (n 3); zbiór dostępnych akcji: gry nieskończone (kontinuum akcji), gry ze skończonym zbiorem strategii; możliwość tworzenia koalicji: gry kooperacyjne, gry niekooperacyjne; powtarzalność: gry iterowane oraz gry jednoetapowe.
Czas podejmowania decyzji Gry w postaci strategicznej (normalnej) sytuacje, w których gracze podejmują decyzje jednocześnie; zysk graczy obliczany jest na podstawie macierzy wypłat; wielkość macierzy wypłat zależy bezpośrednio od liczby graczy oraz od liczby strategii czystych dostępnych dla graczy; Gry w postaci ekstensywnej (drzewiastej) decyzje graczy podejmowane są sekwencyjnie; wypłaty graczy ustalane na podstawie drzewa gry; każdy z graczy w danej chwili zna wszystkie możliwe ruchy.
Formalnie gra w postaci normalnej: Γ = N, {A i }, M, i = 1, 2,..., n gdzie: N = {1, 2,..., n} jest zbiorem graczy; {A i } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ 1, µ 2,..., µ n } to zbiór funkcji wypłat dla graczy.
Figure : Przykład prostej gry dwuosobowej
Figure : Wielosobowa gra w postaci strategicznej w programie GAMBIT 4 graczy; każdy z graczy po 2 strategie; każda komórka macierzy to wypłata gracza przy okreśonych strategiach pozostałych graczy;
Gra w postaci ekstensywnej formalnie: N = {1, 2,..., n} - zbiór graczy; G = (W, E) - drzewo gry (graf skierowany bez cykli) W - wierzchołki (sytuacje w grze); E - łuki (przejścia między sytuacjami w grze); często wyróżnia się też zbiór wierzchołków końcowych (liści).
Dowolną grę dla dwóch (i więcej) graczy taką jak szachy, kółko i krzyżyk, go, warcaby można zapisać w postaci ekstensywnej. algorytm min-max: pomaga znaleźć najlepszy ruch, pracując od końca gry. Na każdym kroku zakłada, że gracz A próbuje zmaksymalizować szanse na wygraną gracza A, podczas gdy w następnym ruchu gracz B stara się zminimalizować szanse na wygraną gracza A; algorytm alfa-beta - algorytm stosowany do redukcji liczby węzłów, które muszą zostać sprawdzone w algorytmie min-max.
Figure : Algorytm min-max
Figure : Algorytm alfa-beta
Gry z pełną informacją: każdy z graczy zna w pełni zasady gry, funkcje wypłat oraz zbiory mozliwych strategii wszystkich pozostałych graczy; założenie o racjonalności graczy, gdzie każdy z uczestników dąży do maksymalizacji zysku; gracze w każdej chwili posiadają pełną informację o poprzednich decyzjach innych graczy; grę ekstensywną można przekształcić w grę w postaci normalnej (i na odwrót);
Figure : Wielosobowa gra w postaci ekstensywnej
Gry z niepełną informacją: określane także jako gry bayesowskie; dla gier strategicznych w przypadku informacji niepełnej definiowana jest jawnie dodatkowa funkcja prawdopodobieństwa, która w zależności od wartości określa końcową wypłatę graczy; często przyjmuje się, że gry strategiczne z niepełną informacją posiadają więcej niż jedną macierz wypłat; dla gier w postaci ekstensywnej brak pełnej informacji zaznaczony jest jako zbiory informacyjne.
Figure : Gra w postaci ekstensywnej z niepełną informacją
Możliwość tworzenia koalicji graczy: gry koalicyjne akcje przypisywane sa grupom (koalicjom) graczy; ze zbioru graczy możliwe jest wyszczególnienie podzbiorów graczy współpracujących ze sobą; wartość Shapleya - wartość zysku pojedynczego gracza w koalicji; gry niekooperacyjne interesy graczy w grach niekooperacyjnych nie muszą być przeciwstawne (gry o sumie niezerowej); założenie o racjonalności graczy (w przypadku gracza nieracjonalnego każda strategia ma takie samo prawdopodobieństwo wyboru);
Figure : Gra z elementami kooperacji dwóch graczy Dwóch graczy: każdy ma do wyboru jedną z trzech strategii. nieustępliwa: gracz jedzie drogą główną i żąda przejazdu; elastyczna: gracz jedzie drogą główną w przypadku pierwszeństwa przejazdu. W przeciwnym razie przepuszcza gracza B; wycofanie się: gracz jedzie dłuższą drogą.
Gry z kontinuum graczy stosowane do przedstawiania sytuacji wolnorynkowych; zbiór graczy reprezentowany przed odcink [0, 1]; koncepcja strategii stabilnej ewolucyjnie; Figure : Przykład gry ze strategią stabilną ewolucyjnie. Popularny Jastrząb-gołąb
Gry o nieskończonym zbiorze strategii są uogólnieniem gier skończonych: jeden z najpopularniejszych przykładów tego typu gier to duopol Cournota; gry na kwadracie, gdzie każdy z graczy posiada kontinuum strategii czystych; strategia mieszana dla gier na kwadracie to dystrybuanta funkcji;
Dziękuję za uwagę.