D. Miszczyńska, M.Miszczyński KBO UŁ GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO Gra w sensie niżej przedstawionym to zasady którymi kierują się decydenci. Zakładamy, że rezultatem gry jest wypłata, którą zgodnie z regułami gry przegrany płaci wygranemu. Przy czym rozważamy tylko gry w których bierze udział dwóch graczy i przegrana jednego jest wygraną drugiego. Ponadto dysponujemy tzw macierzą wypłat, która pozwala nam na określenie gry. I. DEFINICJE i TWIERDZENIA Konfliktowe gry dwuosobowe opisuje macierz wypłat ( a ) [ ] A mxn ij,b ij gdzie: aij - wygrana gracza I bij - wygrana gracza II Jeżeli suma wypłat jest równa zero, tj. aij + bij 0 to grę nazywamy dwuosobową grą macierzową o sumie wypłat zero. Macierz wypłat takiej gry jest więc następująca [( a, a )] A mxn ij ij W tej sytuacji macierz wypłat może opisywać tylko wygrane jednego z graczy. Przyjęto iż będzie to gracz I; zatem wygrane gracza II będą automatycznie liczbami przeciwnymi do wygranych gracza I.
D. Miszczyńska, M.Miszczyński KBO UŁ 2 Def. Macierz wypłat gry dwuosobowej o sumie wypłat zero ma postać A mxn [ a ] ij Elementy macierzy A są wygranymi gracza I i jednocześnie przegranymi gracza II. Def. Strategia mieszana Wektor wierszowy opisujący częstość stosowania poszczególnych strategii przez gracza I. X xm [ x x x m ] 2... gdzie: x i 0 dla i,2,...,m oraz m x i i Wektor kolumnowy opisujący częstość stosowania poszczególnych strategii przez gracza II Y nx y y 2... y n gdzie: y j 0 dla j,2,...,n oraz n y j j Def. Strategia czysta Jeżeli X lub Y są wersorami to nazywamy je strategiami czystymi.
D. Miszczyńska, M.Miszczyński KBO UŁ 3 Def. Funkcją wypłaty nazywamy oczekiwaną wygraną gracza I (nadzieję matematycznę wygranej gracza I) E ( X Y), XAY m i n j x a y i ij j Def. Rozwiązaniem gry nazywamy wektory [ x x L x ] X m 2 m i Y n y y M y 2 n oraz liczbę rzeczywistą v takie, że spełnione są warunki ( X ) E j v ( ), dla strategii czystych gracza II j,2,...,n E i,y v dla strategii czystych gracza I i,2,...,m Strategie X oraz Y nazywamy strategiami optymalnymi, a liczbę v wartością gry. Wartość gry v jest oczekiwaną wygraną (nadzieją matematyczną wygranej) gracza I jeżeli obaj gracze stosują swoje optymalne strategie mieszane X oraz Y, tj. E ( X, Y ) v Tw. (H.Kuhn'a o punkcie siodłowym w teorii gier) Oczekiwana wygrana (nadzieja matematyczna) gracza I stosującego dowolną strategię mieszaną X podczas gdy gracz II stosuje optymalną strategię Y nie przekracza wartości gry. I odwrotnie, oczekiwana wygrana gracza I stosującego optymalną strategię X podczas gdy gracz
D. Miszczyńska, M.Miszczyński KBO UŁ 4 II stosuje dowolną strategię mieszaną Y jest nie mniejsza niż wartość gry ( X, Y ) ( X, Y ) ( X, Y) E E E Tw. (twierdzenie minimaksowe von Neumana i Morgensterna - twierdzenie zasadnicze gier macierzowych) Dla każdej gry macierzowej istnieją i są sobie równe wielkości max min E ( X, Y) oraz min max E ( X, Y), które odpowiadają wartości X Y gry v, tj. Y X ( X Y) ( X Y) max min E, min max E, v X Y Y X Każda gra 2-osobowa o sumie wypłat zero ma zawsze rozwiązanie. Tw. (twierdzenie o liczbie stosowanych strategii) Niech m ( n ) oznacza liczbę strategii jaką używać będzie postępujący optymalnie gracz I (gracz II). Każdy z graczy postępując optymalnie używać będzie nie więcej strategii niż wynosi mniejsza z liczb m (liczba strategii gracza I) lub n (liczba strategii gracza II), tj. m min { m, n} { } oraz n min m, n Def. Dolna wartość gry (minimalna wygrana gracza I) Liczba rzeczywista v taka, że v i { a i } max { } gdzie a min i aij j
D. Miszczyńska, M.Miszczyński KBO UŁ 5 Dla dolnej wartości gry zachodzi { } ij v max min a v i j Def. Górna wartość gry (maksymalna przegrana gracza II) Liczba rzeczywista v taka, że v min j { a } j Dla górnej wartości gry zachodzi { } gdzie a j max aij { ij} v minmax a v j i Sposób określania dolnej ( v ) i górnej ( v ) wartości gry nosi nazwę zasady minimaksu, tj. zasady odzwierciedlającej ostrożne postępowanie obu graczy. [ 3] [ 2] A [ ] 2 3 5 aij v 2 4 0 0 4 5 v 3 2 v 3 i Def. Gra z punktem siodłowym jest to gra, w której dolna ( v ) i górna ( v ) wartości gry są sobie równe, tj. v v Def. Punkt siodłowy jest to ten z elementów macierzy wypłat [ ] A a ij, który wyznacza dolną ( v ) i górną ( v ) wartość gry w grze z punktem siodłowym.
D. Miszczyńska, M.Miszczyński KBO UŁ 6 Tw. (twierdzenie o rozwiązaniu gry z punktem siodłowym) Rozwiązaniem gry z punktem siodłowym jest para strategii czystych (wersorów) X i Y oraz wartość gry v v v [ ] [ 2] A X [ ] Y 3 2 5 v 2 0 4 0 0 [ ] 4 2 5 v v v 2 v 2 0 0 Def. Gra symetryczna. Grę nazywamy grą symetryczną jeżeli macierz wypłat tej gry jest macierzą skośno-symetryczną, tj. [ a a ] A m ij ji Tw. (twierdzenie o rozwiązaniu gry symetrycznej) W grze symetrycznej optymalne strategie obu graczy są identyczne, a wartość gry wynosi zero, tj. X Y oraz v0 0 5 3 3 2 / 0 A [ ] a X [ ] Y ij 5 0 2 5 v 2 2/ 0 3/ 0 5/ 0 3/ 0 3 2 0 2 5/ 0 3 5 2 v 0 v 2
D. Miszczyńska, M.Miszczyński KBO UŁ 7 Tw. (twierdzenie o dodaniu stałej do macierzy wypłat) Dla dwóch gier macierzowych A i B o macierzach wypłat A mxn [ a ij ] oraz B mxn [ b ij a ij + c] gdzie c R \ {0} i wartościach gry odpowiednio v A oraz v B zachodzą następujące związki:. optymalne strategie mieszane sa identyczne, tj. X A X oraz Y Y B A B 2. wartości gry różnią się o stałą c, tj. v v + c B A [ ] [ 2] A X [ ] Y 3 2 5 v A 2 A 0 A 4 0 0 [ ] 4 2 5 v v v 2 v A 2 A A A 0 0 [ ] [ 6] B A + [ ] X [ ] Y 7 6 9 4 v B 6 B 0 B 8 5 4 4 [ ] 8 6 9 v v v 6 v 6 v v + 4 2 + 4 6 B B A B B B 0 0
D. Miszczyńska, M.Miszczyński KBO UŁ 8 II. ROZWIĄZYWANIE GIER MACIERZOWYCH II.. Redukcja macierzy wypłat Redukcja macierzy polega na zastąpieniu wyjściowej macierzy A mxn ekwiwalentną macierzą A kxr gdzie zachodzi przynajmniej jeden z przypadków k<m lub r<n. Rozwiązania gry wyjściowej i ekwiwalentnej są identyczne. Def. Wiersz dominujący, zdominowany (strategia gracza I dominująca lub zdominowana) Mówimy, że wiersz t jest zdominowany przez wiersz s jeżeli a tj asj dla wszystkich j Wiersz s-ty nazywamy dominującym, a wiersz t-ty zdominowanym. Def. Kolumna dominująca, zdominowana (strategia gracza II dominująca lub zdominowana) Mówimy, że kolumna p jest zdominowana przez kolumnę r jeżeli a ip air dla wszystkich i Kolumnę r-tą nazywamy dominującą, a kolumnę p-tą zdominowaną.
D. Miszczyńska, M.Miszczyński KBO UŁ 9 Z wyjściowej macierzy A mxn usuwamy wszystkie wiersze i kolumny zdominowane. Odpowiadające im strategie nie będą używane przez optymalnie postępujących graczy, tj. odpowiednie częstości oraz y j będą równe zero. x i PRZYKŁAD A 4x5 2 2 3 2 3 4 5 2 4 5 0 5 2 0 4 2 2 z z z y 2 0 y 0 3 5 z z x 0 x 0 3 2 4 A 2x3 2 3 5 4 0
D. Miszczyńska, M.Miszczyński KBO UŁ 0 II.2. Graficzne rozwiązywanie gier macierzowych Jeżeli przed lub po redukcji wymiarów macierz wypłat ma dwa wiersze lub dwie kolumny (jest macierzą A 2 xn lub A mx2 ), to odpowiadającą jej grę można rozwiązać graficznie. Dla gry o macierzy wypłat A 2x 3 postępowanie wygląda następująco. [ ] [ 2] 2 3 5 A 2 x 3 v 2 4 0 0 4 3 5 2 v 3 v 3 Wektory strategii mieszanych obu graczy mają postać X x [ x ] 2 i Y y y y 2 3 Z założenia x + x2. Przyjmując x x mamy x2 x. Stąd X [ x x] Wyznaczamy oczekiwane wygrane gracza I, jeżeli gracz II stosuje swoje strategie czyste, tj. E[ j] Nanosimy otrzymane proste na układ xoy. X,. Oznaczać je będziemy krótko E j. Oś Ox ograniczymy do odcinka [0,] rozciągając go nieproporcjonalnie w stosunku do jednostek na osi Oy. Wystawiamy pomocniczą prostą o równaniu x. Oś Oy powiążemy z wygraną, tj. z funkcją wypłaty E[X,Y].
D. Miszczyńska, M.Miszczyński KBO UŁ 2 E E[ X, ] [ x x] 2x 4 4 + 3 E2 E[ X, 2] [ x x] 2x + 5 E3 E[ X, 3] [ x x] x 0 5 Zgodnie z zasadą minimaksu określamy dla każdej wartości x [0,] minimalną (gwarantowaną) wygraną. Będą to wartości wynikające z E, E2, E3. Największa z minimalnych dolnej obwiedni { } (gwarantowanych) wygranych występuje przy przecięciu E z E 2 E E 2 2x + 4 2x + x 3 / 4
D. Miszczyńska, M.Miszczyński KBO UŁ 2 Optymalna strategia mieszana dla gracza I ma więc postać X [ 3 / 4 / 4] Wartość wygranej przy x3/4 jest równa wartości gry v 5 / 2 E E 2 [ [ ] ] [ ] E 3 / 4 / 4, 2 3 / 4 + 4 5 / 2 [ ] E 3 / 4 / 4, 2 2 3 / 4 + 5 / 2 Gracz II nie powinien stosować żadnej swojej strategii, przy której wygrana optymalnie postępującego gracza I byłaby większa od wartości gry v5/2. Musi wyeliminować wszystkie strategie, dla których E[ j] Warunek taki spełnia strategia 3 ponieważ [ ] X, > 5 / 2. E X, 3 5 / 4 > 5 / 2. Zatem w optymalnej strategii mieszanej gracza II y 3 0. Aby określić pozostałe składowe wektora Y należy rozwiązać pomocniczy układ równań z def. y + y + y [ Y ] [ Y ] 2 3 E, 2y + 3y + 5y 5 / 2 2 3 E 2, 4y + y + 0y 5 / 2 2 3 Ponieważ y 3 0, to powyższy układ równań można zastąpić [ Y ] [ Y ] y + y 2 E, 2y + 3y 5 / 2 2 E 2, 4y + y 5 / 2 2
D. Miszczyńska, M.Miszczyński KBO UŁ 3 Wykorzystując dwa dowolnie wybrane równania powyższego układu otrzymamy y / 2 oraz y 2 / 2 Rozwiązanie omawianej gry o macierzy wypłat A 2 x 3 jest następujące X [ 3 / 4 / 4] i Y / 2 / 2 0 oraz v 5 / 2 Dla gier o macierzy wypłat A mx2 postępować będziemy podobnie. Rysunek dotyczył będzie gracza II, o którym należy pamiętać, że jest zainteresowany w minimalizacji warości gry v. Optymalne częstości w wektorze Y wyznaczymy tutaj analizując górną obwiednię { E, E 2,..., E m }, poszukując na niej minimalnej wartości gry (minimalnej przegranej gracza II). Dla gry o macierzy wypłat A 3x 2 postępowanie wygląda następująco. [ ] 2 A 3 x 2 4 v 5 0 0 5 [ 4] v 4 v 4 Wektory strategii mieszanych obu graczy mają tutaj postać X [ x x2 x3 ] i Y y y 2
D. Miszczyńska, M.Miszczyński KBO UŁ 4 + y2. Przyjmując y y 2 Z założenia y Y mamy y y. Stąd y y Wyznaczamy oczekiwane wygrane gracza II, jeżeli gracz I stosuje swoje strategie czyste, tj. E[ i,y ]. Oznaczać je będziemy krótko E i. y 2 y 2 y + E E[,Y ] [ ] y 2 2 4 5y 4 y + E E[,Y ] [ ] 3 5 0 y 3 y 5y E E[,Y ] [ ] E2 E3 5y + 4 5y y 2 / 5
D. Miszczyńska, M.Miszczyński KBO UŁ 5 Optymalna strategia mieszana dla gracza II ma więc postać Y 2 / 5 3 / 5 Wartość wygranej przy y2/5 jest równa wartości gry v2 E E 2 3 E E 2/ 5 2, 5 2 / 5+ 4 2 3/ 5 2/ 5 3, 5 2 / 5 2 3/ 5 Gracz I nie powinien stosować żadnej swojej strategii, przy której przegrana optymalnie postępującego gracza II byłaby mniejsza od wartości gry v2 (wygrana gracza I byłaby mniejsza od wartości gry!!!). Musi wyeliminować wszystkie strategie, dla których E[ i,y ] < 2. Warunek taki spełnia strategia ponieważ [ ] E, Y 8 / 5 < 2. Zatem w optymalnej strategii mieszanej gracza I x 0. Aby określić pozostałe składowe wektora X należy rozwiązać pomocniczy układ równań z def. x + x + x [ X, ] [ X, ] 2 3 E x x + 5x 2 2 3 E 2 2x + 4x + 0x 2 2 3
D. Miszczyńska, M.Miszczyński KBO UŁ 6 Ponieważ x 0, to powyższy układ równań można zastąpić [ X, ] [ X, ] x + x 2 3 E x + 5x 2 2 3 E 2 4x + 0x 2 2 3 Wykorzystując dwa dowolnie wybrane równania powyższego układu otrzymamy x 2 / 2 oraz x 3 / 2 Rozwiązanie omawianej gry jest następujące X [ 0 / 2 / 2] i Y 2 / 5 3 / 5 oraz v 2
D. Miszczyńska, M.Miszczyński KBO UŁ 7 II.4. Iteracyjne rozwiązywanie gier macierzowych Jedną z metod przybliżonego rozwiązywania gier jest metoda symulacyjna oparta na analizie skumulowanych wygranych. Omówimy ją na przykładzie. 2 3 5 A 2 x 3 v 2 4 0 v 3 2 v 3 Proces iteracyjny prowadzimy w tablicy do momentu, gdy wykonamy minimalną liczbę iteracji (np. 8). Po ich wykonaniu możemy zakończyć proces symulacji gry, gdy: otrzymamy błąd oszacowania wartości gry (ε) nie większy od założonego poziomu (np. ε 0.) osiągniemy maksymalną liczbę iteracji (np. 00) lub W kolumnie (k) odnotowuje się numer bieżącej iteracji, a w kolumnie (ε) błąd oszacowania wartości gry. W kolumnach (gracz II) odnotowuje się skumulowane wypłaty gracza II, a w kolumnach (gracz I) skumulowane wygrane gracza I.. Symulację rozpoczynamy od dodania do kolumn (gracz II) pierwszego wiersza macierzy wypłat. W kolumnach (gracz II) wybieramy najmniejszą skumulowaną wypłatę; jest to wypłata 2 odpowiadająca strategii gracza II. Do kolumn (gracz I) dodajemy zatem kolumnę macierzy wypłat A. W kolumnach (gracz I) wybieramy największą skumulowaną wygraną; jest to wygrana 4 odpowiadająca strategii 2 gracza I. Taki wybór powoduje, że w kolejnej (k2) iteracji do kolumn (gracz II) dodajemy wiersz 2 macierzy wypłat A. 2. W kolumnach (gracz II) wybieramy najmniejszą skumulowaną wypłatę; jest to wypłata 4 odpowiadająca strategii 2 gracza II. Do kolumn (gracz I) dodajemy zatem kolumnę 2 macierzy wypłat A. W kolumnach (gracz I) wybieramy największą skumulowaną wygraną; jest to wygrana 5 odpowiadająca strategii gracza I (wybór był tutaj niejednoznaczny; wybrano strategię o niższym numerze). W wyniku tego w kolejnej (k3) iteracji do kolumn (gracz II) dodajemy wiersz macierzy wypłat A.
D. Miszczyńska, M.Miszczyński KBO UŁ 8 W ten sposób przebiegają kolejne iteracje. Po 8 iteracjach wolno nam zakończyć proces obliczeniowy jeżeli błąd oszacowania wartości gry nie przekracza 0% (ε0.). Taka sytuacja ma miejsce dopiero po 0 iteracjach. Rozwiązanie gry uzyskujemy zliczając w kolumnach (gracz I) i (gracz II) krotność użycia każdej strategii. Dzieląc te krotności przez liczbę wykonanych iteracji otrzymamy oszacowania składowych wektorów X i Y. Przybliżone rozwiązanie gry uzyskane w wyniku symulacji jest następujące X [ 7 / 0 3 / 0] i Y / 2 / 2 0 2 3 5 A 2 x 3 4 0 oraz v 49 / 20 gracz II v gracz I v ε v iteracja strategia strategia 2 strategia 3 strategia strategia 2 k a a 2 a 3 a j / k a a 2 ai / k v v ( v v) 0 0 0 0 0 0 2 3 5 2 2 4 4 2 3 2 6 4 5 2 5 5 5/2 /2 9/4 3 8 7 0 7/3 8 6 8/3 /3 5/2 4 0 0 5 5/2 0 0 5/2 0 5/2 5 2 3 20 2/5 2 4 4/5 2/5 3/5 6 6 4 20 7/3 5 5 5/2 /6 /4 7 8 7 25 7/7 8 6 8/7 /7 5/2 8 20 20 30 5/2 20 20 5/2 0 5/2 9 22 23 35 22/9 22 24 24/9 2/9 23/9 + / 2 0 26 24 35 2/5 25 25 5/2 /0 49/20 krotność użycia 5 5 0 7 3 wartość gry częstość 5/0 5/0 0 7/0 3/0 49/20