Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 1/4 Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów Krzysztof R. Apt CWI, Amsterdam Uniwersytet Amsterdamski
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 2/4 Plan Gra strategiczna. Najlepsza odpowiedź. Równowaga Nasha. Dobro społeczne. Społeczne optimum. Przykłady. Współzawodnictwo Cournota.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 3/4 Gry strategiczne: Definicja Gra strategiczna dla n > 1 graczy: Każdy gracz ma pewien zbiór strategii. Każdy gracz chce zmaksymalizować swój zysk (lub zminimalizować swoje koszty). Wszyscy gracze wybieraja swoje strategie jednocześnie. Następnie każdy gracz otrzymuje wypłatę (lub musi pokryć swoje koszty).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 4/4 Założenia Każdy gracz działa racjonalnie: jego celem jest zmaksymalizowanie swojej wypłaty (lub zminimalizowanie swoich kosztów). Zasady gry oraz założenie racjonalnego działania sa wspólna wiedza wszystkich graczy.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 5/4 Przykłady Dylemat Wi eźnia C D C 2, 2 0, 3 D 3, 0 1, 1 Walka Płci M B M 2, 1 0, 0 B 0, 0 1, 2 Orzeł czy Reszka O R O 1, 1 1, 1 R 1, 1 1, 1
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 6/4 Równowaga Nasha Weźmy jakaś grę. Załóżmy, że każdy gracz wybrał swoja strategię. Strategia gracza jest najlepsza odpowiedzia na wybór strategii przeciwników jeśli jest przynajmniej tak dobra jak każda inna strategia. Równowaga Nasha: kombinacja strategii graczy, w której każda strategia jest najlepsza odpowiedzia na wybór strategii przeciwników. Intuicja: W równowadze Nasha każdy gracz jest zadowolony ze swojego wyboru.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 7/4 Równowaga Nasha Załóżmy, że każdy gracz wybrał swoja strategię. Strategia gracza jest najlepsza odpowiedzia na wybór strategii przeciwników jeśli jest przynajmniej tak dobra jak każda inna strategia. Równowaga Nasha: kombinacja strategii graczy, w której każda strategia jest najlepsza odpowiedzia na wybór strategii przeciwników. Notacja: s i,s i S i; s,s, (s i,s i ) S 1... S n. s i jest najlepsza odpowiedzia na s i jeśli s i S i p i (s i,s i ) p i (s i,s i ). s jest równowaga Nasha jeśli dla każdego i s i S i p i (s i,s i ) p i (s i,s i ).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 8/4 Równowaga Nasha: Przykłady Dylemat Wi eźnia 1 równowaga Nasha C D C 2, 2 0, 3 D 3, 0 1, 1 Walka Płci 2 równowagi Nasha M B M 2, 1 0, 0 B 0, 0 1, 2 Orzeł czy Reszka brak równowagi Nasha O R O 1, 1 1, 1 R 1, 1 1, 1
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 9/4 Z Wikipedii: John Nash John Forbes Nash Jr (ur. 13 czerwca 1928). Amerykański matematyk i ekonomista. [...] Był współlaureatem nagrody Banku Szwecji im. Alfreda Nobla w dziedzinie ekonomii w 1994 roku. [...] Nash cierpiał na schizofrenię paranoidalna. [...] Historia jego życia została zekranizowana w 2001 roku w filmie Piękny umysł (A Beautiful Mind).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 10/4 Dodatkowe Pojęcia Dobro społeczne s: n j=1 p j(s). s jest społecznym optimum jeśli dobro społeczne s jest maksymalne.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 11/4 Przykład: Dylemat Więźnia C D C 2, 2 0, 3 D 3, 0 1, 1 1 równowaga Nasha: (D, D), 1 społeczne optimum: (C, C). Zauważ: dobro społeczne w równowadze Nasha: 2, dobro społeczne w społecznym optimum: 4.
Dylemat Więźnia w Praktyce Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 12/4
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 13/4 Współzawodnictwo Cournota Augustin Cournot (1838) jeden produkt, n > 1 firm decyduje jednocześnie o wysokości produkcji, cena maleje ze wzrostem produkcji globalnej.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 14/4 półzawodnictwo Cournota formalnie Modelowanie przy użyciu gier strategicznych. Załóżmy, że dla każdego gracza i jego zbiór strategii jest R +, jego funkcja wypłaty jest p i (s) := s i (a b gdzie a > c i b > 0. n j=1 s j ) cs i,
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 15/4 Uwagi Funkcja wypłaty: p i (s) := s i (a b gdzie a > c i b > 0. n j=1 s j ) cs i, Cena produktu: a b n j=1 s j. Ponieważ b > 0 cena rzeczywiście maleje ze wzrostem produkcji globalnej. Koszt produkcji jednego egzemplarza: c. Gdyby a c wypłaty byłyby zawsze ujemne.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 16/4 Analiza: Równowaga Nasha Dla danego i {1,...,n} i s i niech t := j i s j. p i (s i,t) = s i (a c bt bs i ) = bs 2 i + (a c bt)s i. Chcemy znaleźć maksimum p i (s i ). p i (s i) = 2bs i + a c bt. p i (s i) = 0 gdy s i = a c 2b 2 t. Czyli s jest równowaga Nasha gdy dla każdego i P s i = a c 2b j i s j 2. Ten system n liniowych równań ma dokładnie jedno rozwiazanie: s i = a c (n+1)b dla i {1,...,n}. Więc jest to jedyna równowaga Nasha.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 17/4 Analiza: Społeczne Optimum Niech t := n j=1 s j. Wówczas f(t) := n j=1 p j(s) = t(a c bt). Chcemy znaleźć maksimum f(t). f (t) = 0 gdy t = a c 2b.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 18/4 Wnioski Równowaga Nasha: gdy każde s i = a c (n+1)b. Wówczas cena produktu: a+nc n+1. Społeczne optimum: gdy n j=1 s j = a c 2b. Wówczas cena produktu: a+c 2. Ponieważ a > c więc a+c 2 > a+nc n+1. Czyli cena w społecznym optimum jest wyższa niż w równowadze Nasha. Gdy n wzrasta cena w równowadze Nasha, a+nc n+1, spada. Czyli zwiększone współzawodnictwo jest pożyteczne dla klientów. lim n a+nc n+1 = c. Czyli zwiększone współzawodnictwo prowadzi do zerowych zysków.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 19/4 Plan Tragedia wspólnot. Gry sieciowe. Przykłady.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 20/4 Tragedia Wspólnot Wspólne zasoby: dobra, z których każdy może za darmo korzystać, ale ich użycie przez jakakolwiek osobę ogranicza dostępność innym. Przykłady: zatłoczone (darmowe) drogi samochodowe, ryby w morzu, środowisko,..., Problem: Nadużycie takich wspólnych zasób prowadzi do ich zniszczenia. Ten problem nazywa się tragedia wspólnot (Hardin 81).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 21/4 Tragedia Wspólnot: Przykład (Gardner 95) n > 1 graczy, dwie strategie: 1 (użyj zasobu), 0 (nie użyj), funkcja wypłat: { 0.1 jeśli si = 0 p i (s) := F(m)/m jeśli s i = 1 gdzie m = n j=1 s j i F(m) := 1.1m 0.1m 2. Funkcja F jest tak skonstruowana, że F(m)/m maleje i szybko opada poniżej 0: F(9)/9 = 0.2, F(10)/10 = 0.1, F(11)/11 = 0.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 22/4 Przykład: Równowagi Nasha Załóżmy n < 10. { 0.1 jeśli si = 0 p i (s) := F(m)/m jeśli s i = 1 gdzie m = n j=1 s j i F(m) := 1.1m 0.1m 2. F(9)/9 = 0.2, F(10)/10 = 0.1, F(11)/11 = 0. Ponieważ n < 10 mamy m + 1 < 10, czyli F(m + 1)/(m + 1) > 0.1. A więc jeśli s i = 1 gracz i jest zadowolony. Jedyna równowaga Nasha: wszyscy gracze korzystaja ze wspólnego zasobu. Gdy n 10 jedyne równowagi Nasha: 9 lub 10 graczy korzysta ze wspólnego zasobu.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 23/4 Przykład: Społeczne Optimum p i (s) := { 0.1 jeśli si = 0 F(m)/m jeśli s i = 1 gdzie m = n j=1 s j i F(m) := 1.1m 0.1m 2. Załóżmy m spośród n graczy używa zasobu. Wówczas n j=1 p j(s) = 0.1(n m) + F(m). Ale f(m) = 0.1(n m) + F(m) = 0.1n + m 0.1m 2. Czyli f (m) = 1 0.2m, więc f (m) = 0 gdy m = 5. Społeczne optimum: 5ciu graczy korzysta ze wspólnego zasobu.
Gry Sieciowe: Przykład 5 kierowców. Każdy kierowca wybiera drogę z Katowic do Gliwic, Więcej kierowców wybiera tę sama drogę: większe opóźnienia. Uwaga: to sa gry z kosztami and nie z wypłatami. KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 24/4
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 25/4 Możliwy Rozwój Wydarzeń (1) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 26/4 Możliwy Rozwój Wydarzeń (2) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 27/4 Możliwy Rozwój Wydarzeń (3) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 28/4 Możliwy Rozwój Wydarzeń (4) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teraz każdy kierowca jest zadowolony.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 29/4 Jak znaleźliśmy równowagę Nasha? Dynamika najlepszej odpowiedzi ( Best response dynamics ). Wybierz sytuację poczatkow a : każdy gracz wybiera dowolna strategię. Niezadowolony gracz może zmienić swój wybór wybierajac najlepsza odpowiedź. Powtórz tę procedurę. Jeśli ta procedura się kończy to osiagnęliśmy równowagę Nasha. Twierdzenie (Rosenthal, 1973) W grach sieciowych dynamika najlepszej odpowiedzi zawsze prowadzi do równowagi Nasha.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 30/4 Inny Przykład Założenia: 4000 kierowców jedzie z A do B. Każdy kierowca ma 2 możliwości (strategie). U A T/100 45 45 B T/100 Problem: Znajdź równowagę Nasha (T = liczba kierowców). R
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 31/4 Równowaga Nasha U A T/100 45 45 B T/100 R Odpowiedź: 2000/2000. Czas jazdy: 2000/100 + 45 = 45 + 2000/100 = 65.
Dodaj szybka drogę z U do R. Paradoks Braessa Każdy kierowca ma teraz 3 możliwości (strategie): A - U - B, A - R - B, A - U - R - B. U T/100 A 0 45 45 B T/100 R Problem: Znajdź równowagę Nasha. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 32/4
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 33/4 Równowaga Nasha U T/100 A 0 45 45 B T/100 R Odpowiedź: Każdy kierowca wybierze drogę A - U - R - B. Dlaczego?: Droga A - U - R - B jest zawsze najlepsza odpowiedzia.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 34/4 Mała komplikacja U T/100 A 0 45 45 B T/100 R Czas jazdy: 4000/100 + 4000/100 = 80!
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 35/4 Czy to się zdarza? z Wikipedii ( Braess Paradox ): In Seoul, South Korea, a speeding-up in traffic around the city was seen when a motorway was removed as part of the Cheonggyecheon restoration project. In Stuttgart, Germany after investments into the road network in 1969, the traffic situation did not improve until a section of newly-built road was closed for traffic again. In 1990 the closing of 42nd street in New York City reduced the amount of congestion in the area. In 2008 Youn, Gastner and Jeong demonstrated specific routes in Boston, New York City and London where this might actually occur and pointed out roads that could be closed to reduce predicted travel times.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 36/4 Cena Stabilności Definicja CS: koszty społeczne najlepszej równowagi Nasha społeczne optimum Pytanie: Ile wynosi CS dla gier sieciowych?
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 37/4 Przykład n A B n - (parzysta) ilość graczy. x - ilość kierowców na dolnej drodze. Dwie równowagi Nasha 1/(n 1), z kosztem społecznym n + (n 1) 2. 0/n, z kosztem społecznym n 2. Społeczne optimum Weźmy f(x) = x x + (n x) n = x 2 n x + n 2. Chcemy znaleźć minimum f. f (x) = 2x n, więc f (x) = 0 jeśli x = n 2. x
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 38/4 Przykład n A B Najlepsza równowaga Nasha 1/(n 1), z kosztem społecznym n + (n 1) 2. Społeczne optimum f(x) = x 2 n x + n 2. Społeczne optimum = f( n 2 ) = 3 4 n2. x CS = (n + (n 1) 2 )/ 3 4 n2 = 4 3 lim n CS = 4 3. n+(n 1) 2 n 2.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 39/4 Cena Stabilności Twierdzenie (Roughgarden i Tárdos, 2002) Załóżmy, że funkcje opóźnień sa liniowe (n.p. T/100). Wówczas CS gier sieciowych jest 3 4. Dobra równowagę Nasha można osiagn ać przy użyciu dynamiki najlepszej odpowiedzi (best response dynamics). Niestety: czas niezbędny do osiagnięcia równowagi może być bardzo długi jest wykładnicza funkcja liczby strategii.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów p. 40/4 Referencje T. Roughgarden and E. Tardos, How bad is selfish routing?, Journal of the ACM, 49(2), pp. 236 259, 2002. Modeling Network Traffic using Game Theory. (Rozdział 8 z D. Easley and J. Kleinberg, Networks, Crowds, and Markets: Reasoning About a Highly Connected World. Cambridge University Press, 2010. ) www.cs.cornell.edu/home/kleinber/networks-book