Punkty równowagi w grach koordynacyjnych

Podobne dokumenty
Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

SZTUCZNA INTELIGENCJA

Wprowadzenie do teorii gier

Teoria gier. Łukasz Balbus Anna Jaśkiewicz

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Algorytmy ewolucji różnicowej (ang. differential evolution -DE) oraz roju cząstek (ang. particle swarm optimization -PSO)

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Hyper-resolution. Śmieciarki w Manncheim

Dobór parametrów algorytmu ewolucyjnego

Propedeutyka teorii gier

Gry o sumie niezerowej

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

Kurs z NetLogo - część 4.

Konkurencja i kooperacja w dwuosobowych grach strategicznych. Anna Lamek

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia stacjonarne i niestacjonarne

Algorytm genetyczny (genetic algorithm)-

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

Teoria gier. Strategie stabilne ewolucyjnie Zdzisław Dzedzej 1

Algorytmy ewolucyjne NAZEWNICTWO

TEORIA GIER WPROWADZENIE. Czesław Mesjasz

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia niestacjonarne

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

Strategie ewolucyjne (ang. evolution strategies)

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

Metody Rozmyte i Algorytmy Ewolucyjne

Tworzenie gier na urządzenia mobilne

ALGORYTMY GENETYCZNE ćwiczenia

Algorytmy ewolucyjne. Łukasz Przybyłek Studenckie Koło Naukowe BRAINS

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

11. Gry Macierzowe - Strategie Czyste i Mieszane

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Mikroekonomia. O czym dzisiaj?

MODELOWANIE RZECZYWISTOŚCI

Konkurencja i współpraca w procesie podejmowania decyzji

Rozwiązania gier o charakterze kooperacyjnym

Adaptacyjny algorytm ewolucji różnicowej w rozwiązywaniu problemów teorii gier

Tematy prac magisterskich i doktorskich

Generowanie i optymalizacja harmonogramu za pomoca

Teoria gier w ekonomii - opis przedmiotu

MODELOWANIE RZECZYWISTOŚCI

NASH I JEGO HISTORIA

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

Zadanie 5 - Algorytmy genetyczne (optymalizacja)

OPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie

Algorytmy ewolucyjne 1

Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009

Strategie ewolucyjne (ang. evolu4on strategies)

Load balancing games

Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP

Wprowadzenie do teorii gier

Tworzenie gier na urządzenia mobilne

Podejście memetyczne do problemu DCVRP - wstępne wyniki. Adam Żychowski

ROZWÓJ ALGORYTMU EWOLUCJI RÓŻNICOWEJ. Konrad Wypchło

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

2010 W. W. Norton & Company, Inc. Oligopol

LABORATORIUM 4: Algorytmy ewolucyjne cz. 2 wpływ operatorów krzyżowania i mutacji na skuteczność poszukiwań AE

RÓWNOWAGA NASHA W GRACH NIE KOOPERACYJNYCH NA RYNKU DNIA NASTĘPNEGO

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Elementy Modelowania Matematycznego

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

6. Klasyczny algorytm genetyczny. 1

Teoria gier a ewolucja. Paweł Kliber (UEP)

Odkrywanie algorytmów kwantowych za pomocą programowania genetycznego

Wykorzystanie metod ewolucyjnych w projektowaniu algorytmów kwantowych

EGZAMIN MAGISTERSKI, Biomatematyka

Kwantowa implementacja paradoksu Parrondo

Dr Ewa Roszkowska Wydział Ekonomiczny UwB Zakład Ekonometrii i Statystyki O TEORII GIER, EKONOMII I MATEMATYCE

System bonus-malus z mechanizmem korekty składki

Strategie kwantowe w teorii gier

Badania operacyjne egzamin

Algorytmy genetyczne

Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 1/4

Ewolucja Różnicowa Differential Evolution

Algorytmy genetyczne. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki

Wykład Ćwiczenia Laboratoriu m ,5 1,5 WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI CELE PRZEDMIOTU

ur. 28 Czerwca 1928 w Bluefield w Wirginii, matematyk i ekonomista, profesor Uniwersytetu Princeton

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek...

WAE Jarosław Arabas Pełny schemat algorytmu ewolucyjnego

Aukcje groszowe. Podejście teoriogrowe

Automatyczny dobór parametrów algorytmu genetycznego

TEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii

Wstęp do Sztucznej Inteligencji

METODY SZTUCZNEJ INTELIGENCJI algorytmy ewolucyjne

Algorytmy stochastyczne, wykład 01 Podstawowy algorytm genetyczny

Obliczenia ewolucyjne - plan wykładu

Ograniczona racjonalność w grach

Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach

Porównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT

Zasada średniego potencjału w grach ewolucyjnych. Paweł Nałęcz-Jawecki

Optymalizacja. Wybrane algorytmy

Transkrypt:

Uniwersytet Śląski w Katowicach, Instytut Informatyki ul. Będzińska 39 41-200 Sosnowiec 9 grudnia 2014, Chorzów

1 Motywacja 2 3 4 5 6 Wnioski i dalsze badania

Motywacja 1 są klasą gier, w których istnieje duża liczba strategii optymalnych, a jednostki użyteczności wypłacane są graczom tylko wtedy, gdy wybiorą te same strategie; 2 Zaproponowane podejście bazuje na algorytmie ewolucji różnicowej. Funkcja oceny umożliwia wyznaczenie maksymalnego odchylenia od strategii optymalnych poszczególnych graczy; 3 Metoda ta umożliwia wyznaczenie optymalnych strategii mieszanych, które są znacznie mniej popularne, niż czyste strategie optymalne.

Podstawowe definicje Wizualizacja równowagi Nasha Rysunek: Przykładowy podział gier

Podstawowe definicje Wizualizacja równowagi Nasha Definicja gry Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy definiowana jest jako: Γ = N, {A i }, M, i = 1, 2,..., n gdzie: N = {1, 2,..., n} jest zbiorem graczy; {A i } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ 1, µ 2,..., µ n } to zbiór funkcji wypłat dla graczy.

Podstawowe definicje Wizualizacja równowagi Nasha Rysunek: Gry n-osobowe

Podstawowe definicje Wizualizacja równowagi Nasha Układ strategii Przez a = ( a 1,..., a n ) oznaczmy profil strategii mieszanych wszystkich graczy, określany dalej jako układ strategii. a i = ( a 1,..., a i 1, a i+1,..., a n ), będzie układem strategii z wyłączeniem gracza i. Mieszana strategia gracza i określana jest jako: a i = (P(a i1 ), P(a i2 ),..., P(a im )), gdzie P(a i1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i, natomiast a i oznacza tutaj dyskretny rozkład prawdopodobieństwa nad zbiorem strategii.

Podstawowe definicje Wizualizacja równowagi Nasha strategie B1 B2 A1 1, 4 0, 6 A2 4, 1-1, -1 Tablica: Prosta gra 2-osobowa Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. Rysunek: Graficzna reprezentacja równowagi Nasha

Przykład gry koordynacyjnej Przegląd literatury Czym jest gra koordynacyjna? problem wyboru tej samej strategii przez każdego z graczy; gry koordynacyjne odpowiadają problemowi koordynacji - gracze zyskują tylko, jeżeli wybiorą tę samą strategię; liczne równowagi Nasha w strategiach czystych; istnieją także równowagi w strategiach mieszanych; rozwiązanie w strategiach mieszanych jest zdominowane przez rozwiązania w strategiach czystych; w grze jednoetapowej równowaga Nasha w strategiach mieszanych może okazać się lepszym wyborem.

Przykład gry koordynacyjnej Przegląd literatury Rysunek: Klasyczny przykład gry koordynacyjnej - wybór stron W powyższym przykładzie mamy dwa punkty równowagi w strategiach czystych. Problemem jest jednoczesny wybór strategii przez graczy.

Przykład gry koordynacyjnej Przegląd literatury Rysunek: Czysta gra koordynacyjna Dwa punkty równowagi. Tylko jedna pareto równowaga Nasha. Zakładając racjonalność graczy można przyjąć, iż wybiorą pierwszą strategię.

Przykład gry koordynacyjnej Przegląd literatury Rysunek: Gra koordynacyjna - wojna płci Dwa punkty równowagi. W powyższym przypadku istnieje konflikt interesów dwóch stron.

Przykład gry koordynacyjnej Przegląd literatury Rysunek: Gra koordynacyjna - uogólnienie W przypadku koordynacyjnej gry 2-osobowej spełnione są następujące warunki: A > B; D > C; a > c; d > b.

Przykład gry koordynacyjnej Przegląd literatury Przegląd literatury koncepcja punktu ogniskowego - Schelling, Thomas C. (1960, First Edition). The strategy of conflict, Cambridge: Harvard University Press; problem komunikacji w grach koordynacyjnych - R. Cooper, D. Dejong, R. Forsythe, T. Ross Communication in Coordination Games, The Quarterly Journal of Economics (1992) Vol. 107 (2), pp. 739-771; punkty ogniskowe w grach czysto koordynacyjnych - J. Mehta, Ch. Starmer, R. Sugden Focal Points in Pure Coordination Games An Experimenta Investigation, Theory and Decision (1994), Vol. 36 (2), pp 163-185;

Przykład gry koordynacyjnej Przegląd literatury Przegląd literatury II wybór punktu równowagi w grze n-osobowej - K. Youngse Equilibrium Selection in n-person Coordination Games, Games and Economic Behavior, 1996, Vol. 15, pp. 203 227. koncepcja rozwiązania opartego o grę fikcyjną - GW Brown Iterative solution of games by fictitious play, Activity analysis of production and allocation, (1951) rozwiązania oparte o grę fikcyjną (ang. fictitious play) gdzie ruch gracza wyznaczany jest w oparciu o szereg fikcyjnych decyzji - A. Sela, D. Herreiner Fictitious play in coordination games, International Journal of Game Theory (1999), Vol. 28, pp 189-197;

Przykład gry koordynacyjnej Przegląd literatury Przegląd literatury III artykuł wskazujący, że niektóre typy gier koordynacyjnych nie mogą zostać rozwiązane przy pomocy tzw. gry fikcyjnej - D. Foster On the Nonconvergence of Fictitious Play in Coordination Games, Games and Economic Behavior (1998), Vol. 25, pp 79-96; podejście oparte na kooperacji w grach iterowanych - V. Crawford, H. Haller Learning How to Cooperate: Optimal Play in Repeated Coordination Games, Econometrica, (1990), Vol. 58 (3), pp 571-595; interesująca koncepcja równowagi Nasha z filmu Piękny umysł - S. Anderson, M. Engers, A Beautiful blonde: a Nash coordination game.

Ogólny opis Podstawowy schemat DE Ewolucja różnicowa Ewolucja różnicowa jest algorytmem populacyjnym opracowanym przez R. Storna i K. Price a. 1 Stosowana najczęściej do optymalizacji funkcji ciągłych. 2 Adaptacyjny schemat mutacji. 3 Operatory genetyczne: Mutacja, Krzyżowanie. 4 Trzy populacje: Populacja rodziców; Populacja próbna; Populacja potomków.

Ogólny opis Podstawowy schemat DE Rysunek: Ewolucja różnicowa

Ogólny opis Podstawowy schemat DE Rysunek: Ewolucja różnicowa

Ogólny opis Podstawowy schemat DE 1 Mutacja : V ij = X r1j + F (X r2j X r3j) 2 Krzyżowanie : { Vi,j gdy RAND[0, 1) < CR, U i,j = w przeciwnym wypadku. 3 Selekcja : X i,j { Ui,t gdy f ( U X i,t+1 = i,t ) f ( X i,t ), X i,t w przeciwnym wypadku.

Genotyp osobnika Funkcja przystosowania Rysunek: Tworzenie genotypu osobnika

Genotyp osobnika Funkcja przystosowania Funkcja przystosowania W przypadku gier koordynacyjnych w strategii optymalnej wypłaty dla wszystkich stron są równe. f 1 = n n c u i u j ; i j i=1 j=1 gdzie u i oznacza wypłatę i-tego gracza, a c jest wartością stałą. Dodatkowa zależność dotycząca prawdopodobieństwa przedstawiona została poniżej: f 2 = n 1 m P(a ij ) i=1 j=1

Genotyp osobnika Funkcja przystosowania Funkcja przystosowania II W kolejnych iteracjach wartości genotypu powinny odpowiadać prawdopodobieństwom wyboru strategii optymalnych dla poszczególnych graczy. Dodana została także funkcja kary dla równowag czystych: { f3 + c if g[i] = 1, i, f 3 = w przeciwnym wypadku, f 3 gdzie g[i] jest i-tym genem w genotypie. Suma trzech powyższych funkcji to funkcja przystosowania: f = f 1 + c f 2 + f 3. c - wartość stała jest stosowana w celu zwiększenia wartości funkcji kary. Wartość funkcji przystosowania równa 0 to optimum globalne.

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Stosowany program GAMUT - narzędzie stosowane do generowania różnych typów gier stosowane powszechnie w teorii gier. Wartości parametrów wielkość populacji jest równa iloczynowi liczby graczy oraz liczby strategii; podstawowy schemat mutacji z wartością F = 0.7; krzyżowanie dwumianowe CR = 0.5; 10 różnych typów gier dla każdej wielkości problemu (3, 4 i 5 graczy); Każdy eksperyment został powtórzony 30 razy.

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wykres pudełkowy wartosci ɛ dla poszczególnych gier 3 - osobowych

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wykres pudełkowy wartosci ɛ dla poszczególnych gier 4 - osobowych

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Tablica: Wartosci wypłat dla poszczegególnych gier 3 - osobowych Gra 3 - osobowa Minimum Mediana Maksimum Średnia Odchylenie standardowe gra 1 0.449 0.680 0.901 0.668 0.151 gra 2 0.004 0.416 0.927 0.465 0.237 gra 3 0.077 0.561 0.839 0.554 0.231 gra 4 0.302 0.541 0.955 0.566 0.218 gra 5 0.582 0.647 0.902 0.678 0.093 gra 6 0.016 0.436 0.651 0.427 0.166 gra 7 0.258 0.439 0.803 0.475 0.139 gra 8 0.054 0.667 1 0.691 0.219 gra 9 0.235 0.395 0.674 0.413 0.124 gra 10 0.352 0.457 0.864 0.494 0.152

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Tablica: Wartosci wypłat dla poszczegególnych gier 4 - osobowych Gra 4 - osobowa Minimum Mediana Maksimum Średnia Odchylenie standardowe gra 1 0.223 0.301 0.717 0.323 0.099 gra 2 0.005 0.306 0.916 0.332 0.154 gra 3 0.018 0.395 0.785 0.408 0.222 gra 4 0.089 0.355 0.486 0.353 0.083 gra 5 0.001 0.427 0.709 0.417 0.152 gra 6 0.013 0.275 0.375 0.238 0.109 gra 7 0.033 0.308 0.6 0.3 0.138 gra 8 0.002 0.354 0.501 0.319 0.122 gra 9 0.052 0.310 0.644 0.345 0.165 gra 10 0.014 0.343 0.751 0.367 0.145

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wypłaty dla gier 3-osobowych

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Rysunek: Wypłaty dla gier 4-osobowych

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Podsumowanie Ewolucja różnicowa może być w prosty sposób dostosowana do wyszukiwania punktów równowag w grach kooperacyjnych. Ponadto, poprzez wielokrotne uruchomienie algorytmu możliwe jest wygenerowanie kilku różnych rozwiązań. W przypadku bardzo złożonych problemów algorytm ten pozwala na wygenerowanie rozwiązań przybliżonych, czyli ɛ-równowag Nasha. Do funkcji oceny możliwe jest też dodanie funkcji kary, która uniemożliwi pojawienie się rozwiązań w strategiach czystych, a nawet zagwarantuje, iż rozwiązanie będzie zawierało wszystkie strategie dostępne dla gracza - ɛ-well supported Nash.

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Dalsze badania ograniczenia kostkowe dla genotypu osobnika. Wartości genów w genotypie maleją w kolejnych iteracjach, dlatego można założyć, że ograniczenia kostkowe mogą się zmieniać; interesujące wydaje się być także sprawdzenie, czy koncepcja punktu ogniskowego w grach koordynacyjnych może stanowić alternatywę dla klasycznego rozwiązania - równowagi Nasha.

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Storn R. and Price K. Differential evolution - a simple and efficient heuristic for global optimization over continuous spaces. Journal of Global Optimization, Vol. 11, No. 4, 341 359, 1997. Sela, A. and Herreiner D. Fictitious play in coordination games. International Journal of Game Theory, Vol. 28, pp 189-197, 1999. Daskalakis C. Mehta A. and Papadimitriou Ch. A note on approximate Nash equilibria. Journal Theoretical Computer Science, Vol. 410, pp. 1581 1588, 2009 Etessami K. and Yannakakis M. On the Complexity of Nash Equilibria and Other Fixed Points(Extended Abstract). Proceedings of the 48th Annual IEEE Symposium on Foundations of Computer Science, pp. 113 123, 2007.

Narzędzia i ustawienia Wartości ɛ Wartości wypłat Dziękuję za uwagę