11. Gry Macierzowe - Strategie Czyste i Mieszane

Podobne dokumenty
10. Wstęp do Teorii Gier

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Gry o sumie niezerowej

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

2010 W. W. Norton & Company, Inc. Oligopol

1 S t r o n a. Teoria Gier Praca domowa 1 - rozwiązania

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

MODELOWANIE RZECZYWISTOŚCI

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

MODELOWANIE RZECZYWISTOŚCI

LEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

9 Funkcje Użyteczności

14. Ekonomia Behawioralna - Wady Klasycznej Teorii Gier

Mikroekonomia. O czym dzisiaj?

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Propedeutyka teorii gier

Elementy Modelowania Matematycznego

Elementy teorii gier

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

Plan. Prosty model aukcji: Aukcja drugiej ceny - równowaga Nasha w strategiach słabo dominujących Aukcja pierwszej ceny - równowaga Nasha

13. Teoriogrowe Modele Konkurencji Gospodarczej

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii

Teoria gier. Strategie stabilne ewolucyjnie Zdzisław Dzedzej 1

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek...

8. Podejmowanie Decyzji przy Niepewności

Aukcje groszowe. Podejście teoriogrowe

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

Teoria Gier. Piotr Kuszewski 2018L

Lista zadań. Równowaga w strategiach czystych

Daria Sitkowska Katarzyna Urbaniak

Strategie kwantowe w teorii gier

Gry wieloosobowe. Zdzisław Dzedzej

Dłuższy przykład: Dwie firmy, Zeus i Atena, produkują sprzęt muzyczny. Zeus jest większy, Atena jest ceniona za HF. Wprowadzają nowy produkt, np.

Elementy teorii gier. Badania operacyjne

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

Gry w postaci normalnej

6. Teoria Podaży Koszty stałe i zmienne

1. Które z następujących funkcji produkcji cechują się stałymi korzyściami ze skali? (1) y = 3x 1 + 7x 2 (2) y = x 1 1/4 + x 2

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek.

1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.

STRATEGIA PRZYBLIŻONA. Inna propozycja: szukanie optymalnej strategii metodą iteracyjną.

Schemat sprawdzianu. 25 maja 2010

4. Ubezpieczenie Życiowe

Hyper-resolution. Śmieciarki w Manncheim

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

Rozwiązania gier o charakterze kooperacyjnym

Optymalizacją wielokryterialną nazwiemy próbę znalezienia wektora zmiennych decyzyjnych: x = [x 1

Teoria gier w ekonomii - opis przedmiotu

GRY DWUOSOBOWE O SUMIE NIEZEROWEJ. Równowaga Nasha Rozwiązania niekooperacyjne

Tworzenie gier na urządzenia mobilne

Lista zadań. 1. Podaj wszystkie czyste równowagi Nasha. Zaznacz pary strategii, które są Pareto optymalne.

Pojęcia podstawowe. Teoria zbiorów przybliżonych i teoria gier. Jak porównać dwa porządki?

Oligopol. dobra są homogeniczne Istnieją bariery wejścia na rynek (rynek zamknięty) konsumenci są cenobiorcami firmy posiadają siłę rynkową (P>MC)

Czym jest użyteczność?

TEORIA GIER- semestr zimowy ZADANIA 3. Gry w postaci ekstensywnej

TEORIA GIER - semestr zimowy 2011

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

Model Bertranda. np. dwóch graczy (firmy), ustalają ceny (strategie) p 1 i p 2 jednocześnie

Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

4. Ubezpieczenie Życiowe

Jestem za, a nawet przeciw (Próba matematycznego modelowania sposobu myślenia Lecha Wałęsy)

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1

PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM. cz. 6. dr BOŻENA STARUCH

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Gry dwuosobowe o sumie zerowej i ich zastosowanie

Zaawansowane metody numeryczne

Mikroekonomia II: Kolokwium, grupa II

Czym zajmuje się teroia gier

Modele lokalizacyjne

GRY W POSTACI EKSTENSYWNEJ (rozwiniętej)

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

5.1 Stopa Inflacji - Dyskonto odpowiadające sile nabywczej

Klasyfikacja metodą Bayesa

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

Podejmowanie decyzji w warunkach niepełnej informacji. Tadeusz Trzaskalik

Tematy prac magisterskich i doktorskich

TEORIA GIER. Wspólna wiedza dotyczy nie tylko zachowań (reguł postępowania), ale i samej gry : każdy zna jej reguły i wypłaty (swoje i uczestników).

Przyk ladowe Kolokwium II. Mikroekonomia II. 2. Na lożenie podatku na produkty produkowane przez monopol w wysokości 10 z l doprowadzi do

TEORIA GIER WNE UW, jesień 2011 PLAN PRZEDMIOTU

Rachunek prawdopodobieństwa w grach losowych.

0 + 0 = 0, = 1, = 1, = 0.

Konstruktywne metody znajdowania równowag w dużych gospodarkach.

3.1 Analiza zysków i strat

Transkrypt:

11. Gry Macierzowe - Strategie Czyste i Mieszane W grze z doskonałą informacją, gracz nie powinien wybrać akcję w sposób losowy (o ile wypłaty z różnych decyzji nie są sobie równe). Z drugiej strony, gdy nie ma doskonałej informacji (np. gdy ruchy są symultaniczne, np. kamień-nożyczki-papier ), intuicyjnie czasami opłaca się graczowi być nieprzewidywalnym (czyli wybrać akcję losowo) Gdy strategia określa że pewien ruch ma zostać wybrany w sposób losowy jest to strategia mieszana. 1 / 32

Strategie Czyste i Mieszane Gra kamień-nożyczki-papier można przedstawić w następującej postaci macierzowej: K N P K (0,0) (1,-1) (-1,1) N (-1,1) (0,0) (1,-1) P (1,-1) (-1,1) (0,0) Intuicyjnie, w równowadze, obaj gracze wybierają dowolną akcję z prawdopodobieństwem 1/3. 2 / 32

Strategie Czyste i Mieszane Gdy strategia określa że gracz ma zawsze podjąć tę samą akcję w grze macierzowej, jest to strategia czysta. Zakładamy że gracze wybierają swoje akcje niezależnie od siebie (czyli nie ma komunikacji). 3 / 32

Strategie Czyste i Mieszane Zakładamy że w grze kamień-nożyczki-papier, gracz 1 wybiera kamień, nożyczki a papier z prawdopodobieństwami p K, p N a p P, odpowiednio. Gracz 2 wybiera kamień, nożyczki a papier z prawdopodobieństwami q K, q N a q P, odpowiednio. Rozkład pary podjętych akcji jest K N P K p K q K p K q N p K q P N p N q K p N q N p N q P P p P q K p P q N p P q P 4 / 32

Strategie Czyste i Mieszane Gdy gracze używają strategii mieszanych, oczekiwaną wypłatę się oblicza względem tego rozkładu łącznego. Więc np. R 1 (M 1, M 2 )=p K q K R 1 (K, K) + p K q N R 1 (K, N) + p K q P R 1 (K, P) + +p N q K R 1 (N, K) + p N q N R 1 (N, N) + p N q P R 1 (N, P) + +p P q K R 1 (P, K) + p P q N R 1 (P, N) + p P q P R 1 (P, P) =p K q N + p N q P + p P q K p N q K p P q N p K q P. 5 / 32

Czysta Równowaga Nasha Para akcji (A, B ) stanowi czystą równowagę Nasha gdy R 1 (A, B ) R 1 (A, B ); R 2 (A, B ) R 2 (A, B). dla dowolnej akcji A gracza 1 i dowolnej akcji B gracza 2. Więc para akcji stanowi czystą równowagę Nasha gdy nie opłaca się żadnemu graczowi jednostronnie zmienić akcję. Wartością gry odpowiadającą danej równowadze czystej jest wektor wypłat otrzymanych przy tych akcjach. 6 / 32

Mocna Równowaga Nasha Para akcja (A, B ) stanowi mocną równowagę Nasha gdy R 1 (A, B ) > R 1 (A, B ); R 2 (A, B ) > R 2 (A, B). dla dowolnej akcji A A gracza 1 i dowolnej akcji B B gracza 2. czyli para akcji stanowi mocną równowagę Nasha gdy każdy gracz tylko by stracił przy jednostronnej zmianie akcji. Każda równowaga Nasha, która nie jest mocna jest zwana słabą. 7 / 32

Mieszana Równowaga Nasha Para mieszanych strategii (M 1, M 2 ) stanowi mieszaną równowagę Nasha gdy R 1 (M 1, M 2 ) R 1 (A, M 2 ); R 2 (M 1, M 2 ) R 2 (M 1, B) dla dowolnej akcji (strategii czystej) A gracza 1 i dowolnej akcji (strategii czystej) B gracza 2. Należy zauważyć że gdy gracz 1 używa mieszanej strategii M przeciwko strategii mieszanej M 2 gracza 2, jego wypłata oczekiwana jest średnią ważoną z wartości oczekiwanych dla różnych akcji (R 1 (A, M 2 )), gdzie wagi są równe prawdopodbieństwu tego że dana akcja zostanie wybrana. 8 / 32

Mieszana Równowaga Nasha Wynika z tego że optymalną strategią przeciwko M 2 jest akcja (strategia czysta), która zapewnia największą wypłatę przeciwko M 2, czyli gdy nie opłaca graczowi zmienić strategię na żadną dowolną strategię czystą, wtedy nie opłaca graczowi zmienić strategię na żadną dowolną strategię mieszaną. 9 / 32

Twierdzenie Bishopa-Canningsa Nośnikiem strategii mieszanej M 1 jest zbiór akcji wybranych z dodatnim prawdopodobieństwem przy strategii M 1. Niech (M 1, M 2 ) będzie mieszaną równowagą Nasha gdzie nośnikiem strategii M 1 jest zbiór S. Wtedy R 1 (A, M 2 ) = R 1 (M 1, M 2 ), A S; R 1 (B, M 2 ) < R 1 (M 1, M 2 ), B / S. Jest to intuicyjne, bo gdy w równowadze gracz używa akcji A 1 i A 2, wypłaty oczekiwane z tych akcji muszą być sobie równe, bo inaczej gracz wybrałby jedną akcję, a nie drugą. Więc w równowadze każda akcja z nośnika strategii M 1 musi przynieść tę samą wypłatę oczekiwaną, która jest równa oczekiwanej wypłacie dla M 1 w równowadze. Więc każda równowaga mieszana jest słaba. 10 / 32

Równowagi Nasha - Wyniki Każda gra macierzowa posiada przynajmniej jedną równowagę Nasha. Gdy istnieje dokładnie jedna czysta równowaga Nasha gry macierzowe o wymiarze 2 2 (czyli gra, w której obaj gracze mają tylko 2 możliwe akcje), wtedy jest to jedyna równowaga Nasha. Gdy nie ma czystej równowagi Nasha lub istnieją dwie czyste równowagi Nasha takiej gry, wtedy zawsze istnieje równowaga mieszana. Można wyznaczyć mieszaną równowagę Nasha za pomocą twierdzenia Bishopa-Canningsa. 11 / 32

Gry Symetryczne Gra jest symetryczna gdy 1. Wszyscy gracze wybierają z tego samego zbioru strategii. 2. R 1 (A, B) = R 2 (B, A). Należy zauważyć że symetryczna gra Jastrząb-Gołąb spełnia te warunki. 12 / 32

Gry Symetryczne Jeżeli para strategii (A, B) jest czystą równowagą Nasha gry symetrycznej, wtedy (B, A) jest też czystą równowagą Nasha. Przy równowadze mieszanej gry symetrycznej wymiaru 2 2, obaj gracze korzystają z tej samej strategii. 13 / 32

Równowaga Nasha - Przykład 11.1 Wyznaczyć wszystkie równowagi Nasha oraz wartości następującej gry. J G J (-2,-3) (4,0) G (0,4) (3,1) 14 / 32

Przykład 11.1 15 / 32

Przykład 11.1 16 / 32

Przykład 11.1 17 / 32

Zalety Pojęcia Równowagi Nasha 1. Założenie że obaj gracze chcą zmaksymalizować swoją wypłatę (a nie przeskadzać drugiemu) wydaje się rozsądne. 2. Zwykle, się zakłada że gracze znają jakie są wypłaty drugiego gracza. Natomiast, aby wyznaczyć czyste równowagi Nasha, wystarczy znać preferencje drugiego gracza (czyli ranking wypłat, a nie dokładne wypłaty). 18 / 32

Wady Pojęcia Równowagi Nasha 1. Może istnieć kilka równowag Nasha i czasami trudno powiedzieć, która równowaga jest właściwa. 2. Aby wyznaczyć mieszaną równowagę Nasha, nie wystarczy znać same preferencje drugiego gracza. 3. Przy równowadze Nasha, każdy maksymalizuje swoją wypłatę przy strategii drugiego gracza, ale strategia drugiego gracza jest a priori (przed grą) nieznana. 19 / 32

Akcje Zdominowane przez Strategie Czyste Niech gracz 1 zawsze dostaje co najmniej tę samą wypłatę przy wyborze akcji A i co przy wyborze akcji A j, niezależnie od akcji wybranej przez gracza 2, oraz niech wypłata ta będzie ściśle większa przy jednej akcji gracza 2. Wtedy akcja A i dominuje akcję A j. czyli akcja A i dominuje akcję A j gdy R 1 (A i, B k ) R 1 (A j, B k ), k = 1, 2,..., n oraz dla pewnego k 0, R 1 (A i, B k0 ) > R 1 (A j, B k0 ). 20 / 32

Akcje Zdominowane przez Strategie Czyste Analogicznie, akcja B i dominuje akcję B j gdy R 2 (A k, B i ) R 2 (A k, B j ), k = 1, 2,..., m oraz dla pewnego k 0 R 2 (A k0, B i ) > R 2 (A k0, B j ). 21 / 32

Sukcesywne Usunięcie Akcji Zdominowanych Intuicyjnie, gracz nie powinien korzystać z akcji zdominowanej. Więc możemy usunąć akcję zdominowaną z macierzy opisującej grę bez wpływu na zbiór równowag Nasha. Należy zauważyć że akcja, która wcześniej nie była zdominowana, może zostać zdominowana po usunięciu strategii zdominowanych. Więc, usuwamy zdominowane strategie po kolei, aż nie ma już żadnych strategii zdominowanych w grze zredukowanej (zob. następny przykład). Należy zauważyć że gdy pewna akcja jest najlepszą odpowiedzią na pewną akcję drugiego gracza, wtedy nie może być ona zdominowana (aż gra zostanie zredukowana w jakiś sposób). 22 / 32

Dominacja w Sensie Wypłat Wektor wypłat (v 1, v 2 ) dominuje wektor wypłat (x 1, x 2 ) w sensie Pareto, gdy v 1 x 1, v 2 x 2 oraz przynajmniej jedna z tych nierówności jest ścisła. Równowaga Nasha 1 dominuje równowagę 2 w sensie Pareto, gdy żaden gracz nie woli równowagi 2 od równowagi 1 oraz przynajmniej jeden gracz woli równowagę 1 od równowagi 2. Równowaga Nasha pewnej gry jest dominująca w sensie wypłat, gdy ona dominuje wszystkie inne równowagi tej gry w sensie Pareto. 23 / 32

Przykład Rozważamy następującą grę A B A (4,4) (0,0) B (0,0) (2,2) Takie gry są zwane grami koordinacji, skoro każdy gracz chce wybrać tę samą strategię co drugi gracz. 24 / 32

Przykład Istnieją 3 równowagi Nasha 1. (A, A) - wartość (4,4). 2. (B, B) - wartość (2,2). 3. (1/3A + 2/3B, 1/3A + 2/3B) - wartość ( 4 3, 4 3 ). Pierwsza równowaga dominuje pozostałe dwie, a druga równowaga dominuje trzecią. (A, A) jest dominującą równowagą Nasha w sensie wypłat. 25 / 32

Dominacja w Sensie Ryzyka Zakładamy że istnieją dwie czyste równowagi Nasha (A 1, A 2 ) i (B 1, B 2 ) oraz równowaga mieszana (pa 1 + (1 p)b 1, qa 2 + (1 q)b 2 ). Wtedy miary ryzyka związane z akcjami A 1 i B 1 (akcje gracza 1) są q i 1 q (prawdopodobieństwa związane z strategią mieszaną gracza 2), odpowiednio. Miary ryzyka związane z akcjami A 2 i B 2 (akcje gracza 2) są p i 1 p (prawdopodobieństwa związane z strategią mieszaną gracza 1), odpowiednio. 26 / 32

Dominacja w Sensie Ryzyka Należy zauważyć że aby gracz wolał A 1 od B 1, wtedy gracz Player 2 musi grać A 2 z prawdopodobieństwem co najmniej q. Więc, im większe q, tym większa jest niepewność gracza 1 wobec zasadności wyboru A 1. Czyli można używać q jako miary ryzyka związanego z akcją A 1. 27 / 32

Dominacja w Sensie Ryzyka Równowaga Nasha (A 1, A 2 ) dominuje równowagę Nasha (B 1, B 2 ) w sensie ryzyka gdy q 0.5 i p 0.5, oraz przynajmniej jedna z tych nierówności jest ścisła. czyli ryzyko związane z akcją A 1 jest mniejsze niż ryzyko związane z B 1 oraz ryzyko związane z akcją A 2 jest mniejsze niż ryzyko związane z B 2. Analogicznie, równowaga Nasha (B 1, B 2 ) dominuje równowagę Nasha (A 1, A 2 ) w sensie ryzyka gdy q 0.5 i p 0.5, oraz przynajmniej jedna z tych nierówności jest ścisła. Gdy równowaga Nasha (A 1, A 2 ) dominuje równowagę Nasha (B 1, B 2 ) zarówno w sensie wypłat jak i w sensie ryzyka, wtedy oczekujemy że racjonalni gracze wybierają równowagę Nasha (A 1, A 2 ). 28 / 32

Przykład 11.2 Rozważamy następującą grę A B C A (4,4) (-10,0) (5,-2) B (0,-10) (2,2) (4,1) C (-2,5) (1,4) (7,2) i) Usunąć strategie zdominowane z tej gry. Wyznaczyć wszystkie równowagi Nasha tej gry. ii) Która równowaga jest dominująca w sensie wypłat? Która równowaga jest dominująca w sensie ryzyka? 29 / 32

Przykład 11.2 30 / 32

Przykład 11.2 31 / 32

Przykład 11.2 32 / 32