11. Gry Macierzowe - Strategie Czyste i Mieszane

11. Gry Macierzowe - Strategie Czyste i Mieszane W grze z doskonałą informacją, gracz nie powinien wybrać akcję w sposób losowy (o ile wypłaty z różnych decyzji nie są sobie równe). Z drugiej strony, gdy nie ma doskonałej informacji (np. gdy ruchy są symultaniczne, np. kamień-nożyczki-papier ), intuicyjnie czasami opłaca się graczowi być nieprzewidywalnym (czyli wybrać akcję losowo) Gdy strategia określa że pewien ruch ma zostać wybrany w sposób losowy jest to strategia mieszana. 1 / 32

Strategie Czyste i Mieszane Gra kamień-nożyczki-papier można przedstawić w następującej postaci macierzowej: K N P K (0,0) (1,-1) (-1,1) N (-1,1) (0,0) (1,-1) P (1,-1) (-1,1) (0,0) Intuicyjnie, w równowadze, obaj gracze wybierają dowolną akcję z prawdopodobieństwem 1/3. 2 / 32

Strategie Czyste i Mieszane Gdy strategia określa że gracz ma zawsze podjąć tę samą akcję w grze macierzowej, jest to strategia czysta. Zakładamy że gracze wybierają swoje akcje niezależnie od siebie (czyli nie ma komunikacji). 3 / 32

Strategie Czyste i Mieszane Zakładamy że w grze kamień-nożyczki-papier, gracz 1 wybiera kamień, nożyczki a papier z prawdopodobieństwami p K, p N a p P, odpowiednio. Gracz 2 wybiera kamień, nożyczki a papier z prawdopodobieństwami q K, q N a q P, odpowiednio. Rozkład pary podjętych akcji jest K N P K p K q K p K q N p K q P N p N q K p N q N p N q P P p P q K p P q N p P q P 4 / 32

Strategie Czyste i Mieszane Gdy gracze używają strategii mieszanych, oczekiwaną wypłatę się oblicza względem tego rozkładu łącznego. Więc np. R 1 (M 1, M 2 )=p K q K R 1 (K, K) + p K q N R 1 (K, N) + p K q P R 1 (K, P) + +p N q K R 1 (N, K) + p N q N R 1 (N, N) + p N q P R 1 (N, P) + +p P q K R 1 (P, K) + p P q N R 1 (P, N) + p P q P R 1 (P, P) =p K q N + p N q P + p P q K p N q K p P q N p K q P. 5 / 32

Czysta Równowaga Nasha Para akcji (A, B ) stanowi czystą równowagę Nasha gdy R 1 (A, B ) R 1 (A, B ); R 2 (A, B ) R 2 (A, B). dla dowolnej akcji A gracza 1 i dowolnej akcji B gracza 2. Więc para akcji stanowi czystą równowagę Nasha gdy nie opłaca się żadnemu graczowi jednostronnie zmienić akcję. Wartością gry odpowiadającą danej równowadze czystej jest wektor wypłat otrzymanych przy tych akcjach. 6 / 32

Mocna Równowaga Nasha Para akcja (A, B ) stanowi mocną równowagę Nasha gdy R 1 (A, B ) > R 1 (A, B ); R 2 (A, B ) > R 2 (A, B). dla dowolnej akcji A A gracza 1 i dowolnej akcji B B gracza 2. czyli para akcji stanowi mocną równowagę Nasha gdy każdy gracz tylko by stracił przy jednostronnej zmianie akcji. Każda równowaga Nasha, która nie jest mocna jest zwana słabą. 7 / 32

Mieszana Równowaga Nasha Para mieszanych strategii (M 1, M 2 ) stanowi mieszaną równowagę Nasha gdy R 1 (M 1, M 2 ) R 1 (A, M 2 ); R 2 (M 1, M 2 ) R 2 (M 1, B) dla dowolnej akcji (strategii czystej) A gracza 1 i dowolnej akcji (strategii czystej) B gracza 2. Należy zauważyć że gdy gracz 1 używa mieszanej strategii M przeciwko strategii mieszanej M 2 gracza 2, jego wypłata oczekiwana jest średnią ważoną z wartości oczekiwanych dla różnych akcji (R 1 (A, M 2 )), gdzie wagi są równe prawdopodbieństwu tego że dana akcja zostanie wybrana. 8 / 32

Mieszana Równowaga Nasha Wynika z tego że optymalną strategią przeciwko M 2 jest akcja (strategia czysta), która zapewnia największą wypłatę przeciwko M 2, czyli gdy nie opłaca graczowi zmienić strategię na żadną dowolną strategię czystą, wtedy nie opłaca graczowi zmienić strategię na żadną dowolną strategię mieszaną. 9 / 32

Twierdzenie Bishopa-Canningsa Nośnikiem strategii mieszanej M 1 jest zbiór akcji wybranych z dodatnim prawdopodobieństwem przy strategii M 1. Niech (M 1, M 2 ) będzie mieszaną równowagą Nasha gdzie nośnikiem strategii M 1 jest zbiór S. Wtedy R 1 (A, M 2 ) = R 1 (M 1, M 2 ), A S; R 1 (B, M 2 ) < R 1 (M 1, M 2 ), B / S. Jest to intuicyjne, bo gdy w równowadze gracz używa akcji A 1 i A 2, wypłaty oczekiwane z tych akcji muszą być sobie równe, bo inaczej gracz wybrałby jedną akcję, a nie drugą. Więc w równowadze każda akcja z nośnika strategii M 1 musi przynieść tę samą wypłatę oczekiwaną, która jest równa oczekiwanej wypłacie dla M 1 w równowadze. Więc każda równowaga mieszana jest słaba. 10 / 32

Równowagi Nasha - Wyniki Każda gra macierzowa posiada przynajmniej jedną równowagę Nasha. Gdy istnieje dokładnie jedna czysta równowaga Nasha gry macierzowe o wymiarze 2 2 (czyli gra, w której obaj gracze mają tylko 2 możliwe akcje), wtedy jest to jedyna równowaga Nasha. Gdy nie ma czystej równowagi Nasha lub istnieją dwie czyste równowagi Nasha takiej gry, wtedy zawsze istnieje równowaga mieszana. Można wyznaczyć mieszaną równowagę Nasha za pomocą twierdzenia Bishopa-Canningsa. 11 / 32

Gry Symetryczne Gra jest symetryczna gdy 1. Wszyscy gracze wybierają z tego samego zbioru strategii. 2. R 1 (A, B) = R 2 (B, A). Należy zauważyć że symetryczna gra Jastrząb-Gołąb spełnia te warunki. 12 / 32

Gry Symetryczne Jeżeli para strategii (A, B) jest czystą równowagą Nasha gry symetrycznej, wtedy (B, A) jest też czystą równowagą Nasha. Przy równowadze mieszanej gry symetrycznej wymiaru 2 2, obaj gracze korzystają z tej samej strategii. 13 / 32

Równowaga Nasha - Przykład 11.1 Wyznaczyć wszystkie równowagi Nasha oraz wartości następującej gry. J G J (-2,-3) (4,0) G (0,4) (3,1) 14 / 32

Przykład 11.1 15 / 32

Przykład 11.1 16 / 32

Przykład 11.1 17 / 32

Zalety Pojęcia Równowagi Nasha 1. Założenie że obaj gracze chcą zmaksymalizować swoją wypłatę (a nie przeskadzać drugiemu) wydaje się rozsądne. 2. Zwykle, się zakłada że gracze znają jakie są wypłaty drugiego gracza. Natomiast, aby wyznaczyć czyste równowagi Nasha, wystarczy znać preferencje drugiego gracza (czyli ranking wypłat, a nie dokładne wypłaty). 18 / 32

Wady Pojęcia Równowagi Nasha 1. Może istnieć kilka równowag Nasha i czasami trudno powiedzieć, która równowaga jest właściwa. 2. Aby wyznaczyć mieszaną równowagę Nasha, nie wystarczy znać same preferencje drugiego gracza. 3. Przy równowadze Nasha, każdy maksymalizuje swoją wypłatę przy strategii drugiego gracza, ale strategia drugiego gracza jest a priori (przed grą) nieznana. 19 / 32

Akcje Zdominowane przez Strategie Czyste Niech gracz 1 zawsze dostaje co najmniej tę samą wypłatę przy wyborze akcji A i co przy wyborze akcji A j, niezależnie od akcji wybranej przez gracza 2, oraz niech wypłata ta będzie ściśle większa przy jednej akcji gracza 2. Wtedy akcja A i dominuje akcję A j. czyli akcja A i dominuje akcję A j gdy R 1 (A i, B k ) R 1 (A j, B k ), k = 1, 2,..., n oraz dla pewnego k 0, R 1 (A i, B k0 ) > R 1 (A j, B k0 ). 20 / 32

Akcje Zdominowane przez Strategie Czyste Analogicznie, akcja B i dominuje akcję B j gdy R 2 (A k, B i ) R 2 (A k, B j ), k = 1, 2,..., m oraz dla pewnego k 0 R 2 (A k0, B i ) > R 2 (A k0, B j ). 21 / 32

Sukcesywne Usunięcie Akcji Zdominowanych Intuicyjnie, gracz nie powinien korzystać z akcji zdominowanej. Więc możemy usunąć akcję zdominowaną z macierzy opisującej grę bez wpływu na zbiór równowag Nasha. Należy zauważyć że akcja, która wcześniej nie była zdominowana, może zostać zdominowana po usunięciu strategii zdominowanych. Więc, usuwamy zdominowane strategie po kolei, aż nie ma już żadnych strategii zdominowanych w grze zredukowanej (zob. następny przykład). Należy zauważyć że gdy pewna akcja jest najlepszą odpowiedzią na pewną akcję drugiego gracza, wtedy nie może być ona zdominowana (aż gra zostanie zredukowana w jakiś sposób). 22 / 32

Dominacja w Sensie Wypłat Wektor wypłat (v 1, v 2 ) dominuje wektor wypłat (x 1, x 2 ) w sensie Pareto, gdy v 1 x 1, v 2 x 2 oraz przynajmniej jedna z tych nierówności jest ścisła. Równowaga Nasha 1 dominuje równowagę 2 w sensie Pareto, gdy żaden gracz nie woli równowagi 2 od równowagi 1 oraz przynajmniej jeden gracz woli równowagę 1 od równowagi 2. Równowaga Nasha pewnej gry jest dominująca w sensie wypłat, gdy ona dominuje wszystkie inne równowagi tej gry w sensie Pareto. 23 / 32

Przykład Rozważamy następującą grę A B A (4,4) (0,0) B (0,0) (2,2) Takie gry są zwane grami koordinacji, skoro każdy gracz chce wybrać tę samą strategię co drugi gracz. 24 / 32

Przykład Istnieją 3 równowagi Nasha 1. (A, A) - wartość (4,4). 2. (B, B) - wartość (2,2). 3. (1/3A + 2/3B, 1/3A + 2/3B) - wartość ( 4 3, 4 3 ). Pierwsza równowaga dominuje pozostałe dwie, a druga równowaga dominuje trzecią. (A, A) jest dominującą równowagą Nasha w sensie wypłat. 25 / 32

Dominacja w Sensie Ryzyka Zakładamy że istnieją dwie czyste równowagi Nasha (A 1, A 2 ) i (B 1, B 2 ) oraz równowaga mieszana (pa 1 + (1 p)b 1, qa 2 + (1 q)b 2 ). Wtedy miary ryzyka związane z akcjami A 1 i B 1 (akcje gracza 1) są q i 1 q (prawdopodobieństwa związane z strategią mieszaną gracza 2), odpowiednio. Miary ryzyka związane z akcjami A 2 i B 2 (akcje gracza 2) są p i 1 p (prawdopodobieństwa związane z strategią mieszaną gracza 1), odpowiednio. 26 / 32

Dominacja w Sensie Ryzyka Należy zauważyć że aby gracz wolał A 1 od B 1, wtedy gracz Player 2 musi grać A 2 z prawdopodobieństwem co najmniej q. Więc, im większe q, tym większa jest niepewność gracza 1 wobec zasadności wyboru A 1. Czyli można używać q jako miary ryzyka związanego z akcją A 1. 27 / 32

Dominacja w Sensie Ryzyka Równowaga Nasha (A 1, A 2 ) dominuje równowagę Nasha (B 1, B 2 ) w sensie ryzyka gdy q 0.5 i p 0.5, oraz przynajmniej jedna z tych nierówności jest ścisła. czyli ryzyko związane z akcją A 1 jest mniejsze niż ryzyko związane z B 1 oraz ryzyko związane z akcją A 2 jest mniejsze niż ryzyko związane z B 2. Analogicznie, równowaga Nasha (B 1, B 2 ) dominuje równowagę Nasha (A 1, A 2 ) w sensie ryzyka gdy q 0.5 i p 0.5, oraz przynajmniej jedna z tych nierówności jest ścisła. Gdy równowaga Nasha (A 1, A 2 ) dominuje równowagę Nasha (B 1, B 2 ) zarówno w sensie wypłat jak i w sensie ryzyka, wtedy oczekujemy że racjonalni gracze wybierają równowagę Nasha (A 1, A 2 ). 28 / 32

Przykład 11.2 Rozważamy następującą grę A B C A (4,4) (-10,0) (5,-2) B (0,-10) (2,2) (4,1) C (-2,5) (1,4) (7,2) i) Usunąć strategie zdominowane z tej gry. Wyznaczyć wszystkie równowagi Nasha tej gry. ii) Która równowaga jest dominująca w sensie wypłat? Która równowaga jest dominująca w sensie ryzyka? 29 / 32

Przykład 11.2 30 / 32

Przykład 11.2 31 / 32

Przykład 11.2 32 / 32