TEORIA GIER - semestr zimowy 2011 Przykładowe rozwiązania 4. Gracz I, mąż, wychodzi pod wieczór z domu mówiąc, że idzie jeszcze popracować. W rzeczywistości dopiero zdecyduje, czy naprawdę pójdzie do pracy, czy spotka się z inną kobietą. Gracz II, żona, domyśla się tego i musi zdecydować, czy wysłać w ślad za mężem detektywa. Jeśli tego nie zrobi, nie dowie się niczego nowego i jej użyteczność wyniesie 0. Jeśli detektyw wyśledzi męża na spotkaniu z inną, użyteczność męża wyniesie 10, a żony 8. Jeśli mąż spotka się z inną, a żona nie dowie się o tym, użyteczność męża wyniesie 5. Użyteczność męża z pójścia do pracy wynosi p, przy czym 0 < p < 5. Za wynajęcie detektywa trzeba zapłacić c jednostek użyteczności. Detektyw jest lojalny wobec zleceniodawcy i na tyle sprawny, że mąż go nie zgubi. (a) Podać postać ekstensywną i normalną dwóch wersji tej gry: pierwszej z niepełną informacją i drugiej z pełną (w której mąż jest w stanie stwierdzić, czy detektyw go śledzi). (b) Przyjmując p = c = 2 wyznaczyć równowagi obu gier i podać wypłaty obu graczy w tych równowagach. (c) Jak droga musiałaby być praca detektywa, by gra z niepełną informacją miała równowagę w czystych strategiach? 5. Dwie firmy A i B konkurujące na pewnym rynku podejmują jednocześnie i niezależnie od siebie decyzję, czy rozpocząć kampanię negatywnej reklamy skierowanej przeciw konkurentowi. Obecnie każda z firm osiąga ze sprzedaży na tym rynku 10 i tak też pozostanie, jeżeli nikt nie zdecyduje się na rozpoczęcie kampanii. Prowadzenie kampanii kosztuje 15. Jeśli obie firmy prowadzą kampanię, podział rynku i dochody ze sprzedaży nie zmieniają się. Jeśli kampanię prowadzi tylko jedna firma, to jej konkurent zostaje wyeliminowany z rynku, a dochód ze sprzedaży produktu firmy, która pozostaje na rynku, wzrasta o 20 w przypadku firmy A i o r > 20 w przypadku firmy B. (a) Podać postać normalną i ekstensywną tej gry i wyznaczyć wszystkie jej równowagi Nasha. (b) Oznaczmy przez p(r) prawdopodobieństwo wyeliminowania z rynku firmy A w równowadze w strategiach mieszanych. Czy p jest rosnącą, czy malejącą funkcją zmiennej r? (c) Podać postać normalną i ekstensywną wersji tej gry z pełną informacją, w której firma A podejmuje decyzję jako pierwsza, a B decyduje znając już wybór konkurenta. (d) Czy w grze z pełną informacją korzystniej dla gracza jest decydować jako pierwszy, czy jako drugi? Uzasadnić odpowiedź.
Rozwiązanie 4 (a) W obu wersjach gry żona ma dwie strategie: wynająć detektywa (D) lub nie (ND). Mąż w wersji z niepełną informacją też ma 2 strategie: pójść do pracy (Pr) lub do innej (In), a w wersji z pełną informacją 4: Pr, In i dwie strategie warunkowe : (D Pr, ND In) oraz (D In, ND Pr). Pr In Postać normalna przy niepełnej informacji: Ż D c ; p 8 c ; 10 ND 0 ; p 0 ; 5 przy pełnej : Ż Pr In D Pr, ND In D In, ND Pr D c; p 8 c ; 10 c ; 5 8 c ; 10 ND 0 ; p 0 ; 5 0 ; 5 0 ; p Postać ekstensywna: Ż jako pierwsza wybiera między D a ND, następnie M wybiera między Pr a In. W wersji z niepełną informacją oba jego wierzchołki decyzyjne są w jednym zbiorze informacyjnym. Oczywiście, jak w każdym takim zadaniu, trzeba porządnie narysować drzewo, podać wypłaty, etykiety wierzchołków i łuków i zaznaczyć ew. zbiory informacyjne. (b) Z postaci normalnej gry z niepełną informacją widać od razu, że jeżeli c < 8, to żadna para czystych strategii nie jest równowagą (co od razu jest odpowiedzią na (c)). Jeśli c 8, to ND jest dominującą strategią żony i jest w równowadze z najlepszą odpowiedzią męża na ND, czyli strategią In. Równowaga w strategiach mieszanych przy c < 8: Ż wynajmuje detektywa z prawdopodobieństwem x D, M idzie do innej z prawdopodobieństwem y In gdzie y In jest tą wielkością, przy której Ż jest indyferentna między wyborem D a ND rozwiązaniem równania 8y In c = 0 ; y In = c, y 8 P r = 1 c ; 8 x D jest tą wielkością, przy której M jest indyferentny między wyborem Pr a In rozwiązaniem równania 10x D + 5(1 x D ) = p ; x D = 5 p, x 15 ND = p+10 ; 15 dla p = 2 mamy x D = 1, x 5 ND = 4. 5 Wypłaty w tej równowadze: Ż 0, M p (można darować sobie ich obliczanie, bo wiadomo, że muszą być równe (jednakowym) wypłatom każdej ze strategii czystych przeciw tym mieszanym strategiom równowagi). W grze z pełną informacją indukcja wstecz wyznacza jedyną równowagę doskonałą: (ND, (D In, ND Pr)) strategia męża w tej równowadze słabo dominuje każdą inną. Przy c < 8 nie ma innych równowag z tego samego powodu co w grze z niepełną informacją.
Rozwiązanie 5 (a) Postać normalna: Równowagi : A RN Nie RN 5 ; 5 15 ; 0 Nie 0 ; r 5 10 ; 10 (1) A prowadzi kampanię, B nie prowadzi z wypłatami A 15, B 0 (RN reklama negatywna). (2) A nie prowadzi kampanii, B prowadzi z wypłatami A 0, B r 5 (3) w strategiach mieszanych: A : prowadzi kampanię z prawdopodobieństwem a, B prowadzi kampanię z prawdopodobieństwem b gdzie a jest tą wielkością, przy której B jest indyferentny między prowadzeniem kampanii a nie rozwiązaniem równania 5a + (r 5)(1 a) = 0a + 10(1 a) ; a = r 15 r 10 ; b jest tą wielkością, przy której A jest indyferentny między prowadzeniem kampanii a nie rozwiązaniem równania 5b + 15(1 b) = 0b + 10(1 b) ; b = 1 2 ; wypłaty w tej równowadze: A 5, B 50 (najłatwiej je wyliczyć biorąc wypłaty r 10 strategii czystych przeciw mieszanej str. równowagi) Postać ekstensywna kolejno A i B wybierają akcje RN bądź Nie, drugi wybierający gracz ma niepełną informację oba jego wierzchołki decyzyjne są w jednym zbiorze informacyjnym. (b) p(r) jest prawdopodobieństwem, że B poprowadzi kampanię informacyjną, a A nie, a zatem p(r) = 1 (1 ) r 15 2 r 10 = 5 maleje przy rosnącym r. 2(r 10) (c) Gracz B ma teraz 4 strategie, a postać ekstensywna różni się od tej z (a) tym, że usunięto 2elementowy zbiór informacyjny. RN Nie To samo co A Inaczej niż A Postać normalna: A RN 5 ; 5 15 ; 0-5 ; -5 15 ; 0 Nie 0 ; r 5 10 ; 10 10 ; 10 0 ; r 5 (Strategia to samo co A gracza B jest zdominowana, a inaczej niż A słabo dominująca. W jedynej równowadze doskonałej A gra RN, a B gra inaczej niż A ). (d) W jedynej równowadze doskonałej gry z pełną informacją gracz wybierający jako pierwszy ma wyższą wypłatę niż wybierający jako drugi.
16. Gracz 1, napastnik, strzela karnego graczowi 2, bramkarzowi, i ma do wyboru 2 strategie: strzelać w lewy róg (bramki, widziany od strony boiska) lub w prawy. Bramkarz ma do wyboru 3 strategie: rzucić się w lewy róg (jak wyżej), rzucić się w prawy róg lub zaczekać na to, gdzie strzeli gracz 1. Napastnik na pewno trafi tam gdzie chce i wobec tego na pewno strzeli bramkę, gdy bramkarz rzuci się w przeciwny róg. Jeśli bramkarz od razu rzuci się w ten róg, w który strzela napastnik, obroni karnego z prawdopodobieństwem 0,4 przy strzale w lewy róg, a z prawdopodobieństwem 0,3 przy strzale w prawy róg. Jeżeli zaczeka, obroni strzał w każdy z rogów z prawdopodobieństwem o 0,1 mniejszym, niż gdyby od razu rzucił się w dany róg. (a) Podać macierz otrzymanej w tej sytuacji gry o sumie zerowej, w którą wypłatą gracza 1 jest prawdopodobieństwo strzelenia bramki. (b) Wyznaczyć wartość tej gry i strategie optymalne obu graczy. (c) Czy i ewentualnie jak zmieni się odpowiedź na pytanie (b), gdy gracz 1 ma dodatkowo trzecią strategię strzelania w środek bramki? (Bramkarz na pewno obroni taki strzał, gdy zaczeka, a na pewno nie obroni, gdy rzuci się w któryś z rogów). Uzasadnić odpowiedź. Roziwązanie (a) Przy ponumerowaniu strategii: gracza 1 : 1. L (strzela w lewy), 2. P (strzela w prawy) gracza 2 : 1. L (rzuca się w lewy), 2. P (rzuca się w prawy) 3. Cz (czeka) [ ] 0, 6 1 0, 7 macierzą wypłat gracza 1 jest. 1 0, 7 0, 8 (b) Gra oczywiście nie ma równowagi w strategiach czystych, a ponieważ jeden z graczy ma więcej niż 2 strategie, najprostszy algorytm szukania równowag dla gier 2 2 nie zadziała. Znajdziemy strategię optymalną gracza 1 wiemy z teorii, że w grach o sumie zerowej (bądź stałej) jest to strategia równowagi. a więc maksymalizująca (w takich grach) wypłatę gracza 1 przeciw najlepszej odpowiedzi gracza 2. Gracz 1 rozwiązuje więc (przy oznaczeniu x = x L, 1 x = x P ) problem max min(u 1((x, 1 x), L), u 1 ((x, 1 x), P), u 1 ((x, 1 x), Cz)) = x [0,1] max min(1 0, 4x, 0, 7 + 0, 3x, 0, 8 0, 1x). x [0,1] Można wyliczyć (a prościej: narysować) te obszary x, w których minimum w nawiasie jest realizowane przez pierwszą, drugą lub trzecią funkcję czyli strategie bramkarza. Rozwiązaniem jest x = 0, 25 ; wówczas [ ] 1 u 1 (x, P) = u 1 (x, Cz) = [0, 25 0, 75] = [0, 25 0, 75] 0, 7 [ ] 0, 6 u 1 (x, L) = [0, 25 0, 75] = 0, 9. 1 [ 0, 7 0, 8 ] = 0, 775, Optymalną strategią napastnika (x) jest więc strzał w lewy róg z prawdopodobieństwem 0,25, a w prawy z prawd. 0,75. Wartość gry wynosi 0,775.
Ponieważ najlepszymi odpowiedziami bramkarza na x są P i Cz, a L nie jest, strategia optymalna bramkarza jest tą strategią mieszaną używającą wyłącznie P i Cz, przy której napastnik jest indyferentny między strzałem w lewy a prawy róg bramki. Rozwiązaniem jest y L = 0, y P = 0, 25, y Cz = 0, 75. (Lub równoważnie: najbezpieczniejsza strategia bramkarza, przy czym wystarczy szukać wśród tych z y L = 0)., (c) Przeciw starej strategii optymalnej bramkarza, y, ta dodatkowa strategia daje napastnikowi oczekiwaną wypłatę 0,25, a więc nie obniża poziomu bezpieczeństwa bramkarza. Strategia optymalna bramkarza pozostaje bez zmian, a wobec tego strategia optymalna napastnika (jego najlepsza odpowiedź na y) i wartość gry też się nie zmienią. 12. W trzyosobowej grze konformiści gracze równocześnie podnoszą rękę. Jeśli wszyscy podniosą lewą lub wszyscy prawą, każdy otrzymuje wypłatę 0. Jeśli jeden z graczy podniesie inną rękę niż dwaj pozostali np. jako jedyny podniesie lewą to płaci po 1 zł obu pozostałym graczom. (a) Podać poziomy bezpieczeństwa wszystkich strategii czystych i mieszanych gracza 1. Jaka strategia jest najbezpieczniejsza? Czy układ, w którym wszyscy gracze używają swoich najbezpieczniejszych strategii, jest równowagą Nasha? (b) Znaleźć równowagę Nasha, w której gracze nie grają swoich najbezpieczniejszych strategii. Roziwązanie (a) Każdy z graczy ma dwie strategie czyste, L i P. Poziom bezpieczeństwa strategii to jej wypłata w najgorszym możliwym przypadku czyli wtedy, gdy obaj pozostali gracze zagrają drugą strategię czystą, czyli 2. Formalnie, poziom bezpieczeństwa dowolnej strategii x = (x L, x P ) gracza np. 1 (czystej lub mieszanej) to β(x) = min(u 1 (x, L, L), u 1 (x, L, P ), u 1 (x, P, L), u 1 (x, P, P )) czyli min(u 1 (x, L, L), u 1 (x, P, P )), bo u 1 (x, L, P ), u 1 (x, P, L) = 1 gdy dwaj gracze grają różne strategie czyste, trzeci zawsze wygrywa. Zaś u 1 (x, L, L) = 0x L 2x P, u 1 (x, P, P ) = 2x L + 0x P, a więc najbezpieczniejsza jest strategia maksymalizująca min( 2x L, 2x P ) x L = x P = 0, 5. (b) Wszyscy grają tę samą strategię czystą.
12. Trzy siostry dzielą między siebie trzy odziedziczone obiekty: mieszkanie, jacht i cenny obraz. Uzgodniono następującą procedurę podziału: najmłodsza siostra oznajmia, z którego obiektu rezygnuje, najstarsza zgodnie z tym przydziela jej jeden z dwóch innych obiektów, a na koniec spośród dwóch, których nie dostała najmłodsza, jeden wybiera dla siebie średnia siostra. Ostatni z obiektów zostaje dla najstarszej siostry. Każda z sióstr kieruje się tylko swą preferencją co do przypadającego jej dobra, nie interesując się tym, której przypadły inne obiekty. (a) Podać postać ekstensywną gry, w której wszystkie siostry najbardziej chciałyby dostać mieszkanie, ale najstarsza woli dostać jacht niż obraz, a obie pozostałe odwrotnie. (Można przyjąć dla każdego gracza wypłatę 2 za najbardziej preferowany obiekt, 1 za średni i 0 za najmniej preferowany). Znaleźć w tej grze dwie równowagi doskonałe, w których najmłodsza siostra rezygnuje z różnych obiektów. Która z tych dwóch jej strategii wydaje się Pani / Panu rozsądniejsza i dlaczego? (b) Pokazać, że gdy każda z sióstr najwyżej ceni sobie inny obiekt, to w równowadze doskonałej każda dostanie najbardziej preferowany. Opisać dokładnie strategie wszystkich trzech w tej równowadze. Roziwązanie (a) Opis drzewa: Zaczyna najmnłodsza siostra (Mł), wybiera jedną z 3 akcji: RM (rezygnuje z mieszkania), RJ i RO. Następnie najstarsza (St) wybiera jedną z 2 możliwych akcji: po RM są to J Mł (przydziela młodszej jacht) i O Mł, po RJ M Mł i O Mł, a po RO są to J Mł i M Mł. Następnie średnia (Śr) wybiera dla siebie jeden z 2 dostępnych obiektów np. po akcjach RM i O Mł wybiera pomiędzy J a M. Na końcu tej ścieżki Mł dostaje obraz, Śr mieszkanie, a St jacht. Gra jest z pełną informacją. Oczywiście trzeba narysować całe drzewo, poetykietować wszystkie łuki i wypisać wypłaty (lub lepiej podział obiektów) w każdym wierzchołku końcowym. Trzeba także zaznaczyć akcje wybierane w trakcie indukcji wstecz. Analiza przy preferencjach z p. (a) : Śr zawsze wybierze mieszkanie jeśli jest dostępne, a jeśli nie tj. jeśli St zagrała M Mł to obraz. Wiedząc to, St nigdy nie zagra J Mł, bo wtedy po optymalnej reakcji Śr sama zostanie z obrazem. Jeśli natomiast Mł sama zrezygnuje z jachtu, RJ, to St będzie indyferentna między przydzieleniem jej mieszkania bądź obrazu, bo w obu przypadkach zostanie jej jacht. Mł spodziewa się zatem M jeśli zagra RO, O jeśli zagra RM, a jeśli zagra RJ, to M lub O w zależności od tego, co wtedy zdecyduje St. Jeśli spodziewa się, że St po RJ wynierze M Mł, może zagrać RJ; jeśli spodziewa się O Mł, powinna zagrać RO. Są więc 3 równowagi doskonałe w czystych strategiach: (1) Mł : RO, Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J Mł a po RJ O Mł ; (2) Mł : RO, Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J Mł a po RJ M Mł ;
(3) Mł : RJ, Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J Mł a po RJ M Mł i w każdej z nich wynik (podział obiektów) jest taki sam. Wszystko to widać na drzewie gry w procesie indukcji wstecz. Dla Mł bezpieczniej jest zrezygnować z obrazu, bo wtedy w jedynej równowadze doskonałej podgry następującej po jej decyzji dostaje mieszkanie. Po RJ ryzykuje że spośród równowag doskonałych podgry może zostać rozegrana ta, w której dostanie obraz. (b) Załóżmy że najmłodsza siostra preferuje obraz, średnia mieszkanie, a najstarsza jacht. Wtedy: jeżeli Mł nie zagra RO, St zagra O Mł bo wtedy gwarantuje sobie J (Śr wybierze mieszkanie). Zatem w każdej równowadze doskonałej St zagra O Mł jeśli tylko może; jeżeli Mł zagra RO HGW, ale w takim wypadku Mł nie dostanie obrazu który dostałaby rezygnując z czegokolwiek innego, Czyli RO nie jest najlepszą odpowiedzią Mł na jakiekolwiek strategie równowagi dosk. a zatem nie trzeba dokładnie badać strategii równowagi w podgrze po RO. W każdej równowadze doskonałej Mł gra RM lub RJ, a St przydziela jej obraz i sama dostaje jacht.
13. Dwaj gracze targują się o podział sumy 19,99 zł. Pierwszą propozycję podziału składa gracz I. Jeśli gracz II ją odrzuci, to z sumy 19,99 ubywa 6 zł i gracz II składa propozycję podziału mniejszej sumy; jeśli ta z kolei zostanie odrzucona przez gracza I, to gra się kończy i obaj gracze dostają po 5,50 zł, a resztę zabiera arbiter. Przyjęcie którejkolwiek propozycji także kończy grę i wtedy następuje uzgodniony podział. Zakładamy, że legalne są tylko takie propozycje podziału, w których oferent otrzymuje całkowitą liczbę złotówek (czyli np. pierwsza propozycja gracza I musi być postaci: n zł 99 gr dla ciebie, 19 n zł dla mnie). Gracze nie dyskontują wypłat. Narysować fragment drzewa tej gry z co najmniej jedną gałęzią każdej możliwej długości. Znaleźć jej równowagę doskonałą i podać pełny opis tworzących ją strategii oraz otrzymany podział. Roziwązanie Opis drzewa: Zaczyna gracz I, wybiera jedną z 20 propozycji: (0, 19,99),..., (19, 0,99). Każdą z nich II może zaakceptować albo odrzucić. Gdy zaakceptuje (k, 19 k zł 99 gr), gra kończy się z tymi wypłatami, Gdy odrzuci, składa jedną z 14 kontrpropozycji: (0,99, 13),..., (13,99, 0). Jeśli I ją przyjmie, gra kończy się z tymi wypłatami; jeśli odrzuci, gra kończy się z wypłatami (5,50, 5,50). Informacja jest pełna nie ma nietrywialnych zbiorów informacyjnych. Oczywiście reprezentatywny fragment drzewa trzeba narysować, najlepiej istotny dla znajdowania równowagi. Trzeba też zaznaczyć akcje wybierane w trakcie indukcji wstecz. Analiza: Pierwszy etap indukcji wstecz: Jeśli gracz I odrzuci kontrprppozycję gracza II, otrzyma 5,50, a zatem odrzuci (0,99, 13),..., (4,99, 9), a przyjmie (5,99, 8),..., (13,99, 0). Wiedząc to, II spodziewa się, że po odrzuceniu pierwszej propozycji gracza I otrzyma 8 najwyższą z wypłat po optymalnej reakcji I. Wobec tego pójdzie na tę możliwość tj. odrzuci propozycję I i sam zaproponuje (5,99, 8) jeśli I zaoferuje mu mniej niż 8. Tzn. odrzuci (19, 0,99),..., (12, 7,99), a przyjmie (11, 8,99), (0, 19,99). Wiedząc to, I spodziewa się, że po odrzuceniu swej pierwszej propozycji otrzyma 5,99. Złoży więc najlepszą dla siebie ofertę spośród tych, które będą przyjęte i zarazam dadzą mu co najmniej 6. Jest nią oczywiście (11, 8,99). Równowaga doskonała: Gracz I proponuje (11, 8,99), zgadza się na propozycje II dające mu co najmniej 5,99 i odrzuca pozostałe. Gracz II przyjmuje propozycje I wtedy i tylko wtedy, gdy proponuje mu się co najmniej 8,99, a po ew. odrzuceniu proponuje podział (5,99, 8). Wypłaty w tej rówonowadze: : 11 zł dla I, 8,99 zł dla II. Przykład równowagi niedoskonałej: Każdy z graczy składa tylko propozycje (1,99 dla ciebie, reszta dla mnie), a przyjmuje tylko takie, w których oferuje mu się co najmniej 9,99 zł.