D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO



Podobne dokumenty
D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Elementy teorii gier. Badania operacyjne

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

5. Rozwiązywanie układów równań liniowych

11. Gry Macierzowe - Strategie Czyste i Mieszane

Zaawansowane metody numeryczne

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

MODELOWANIE RZECZYWISTOŚCI

10. Wstęp do Teorii Gier

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

3. Macierze i Układy Równań Liniowych

MODELOWANIE RZECZYWISTOŚCI

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Gry o sumie niezerowej

Rozwiązywanie układów równań liniowych

Algebra liniowa. Macierze i układy równań liniowych

Metody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1

Układy równań liniowych. Krzysztof Patan

3. FUNKCJA LINIOWA. gdzie ; ół,.

Algebra WYKŁAD 3 ALGEBRA 1

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

Wyznaczanie strategii w grach

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

Daria Sitkowska Katarzyna Urbaniak

Układy równań liniowych. Ax = b (1)

1) 2) 3) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) 17) 18) 19) 20) 21) 22) 23) 24) 25)

Programowanie celowe #1

Funkcja kwadratowa. f(x) = ax 2 + bx + c = a

Wykład 5. Metoda eliminacji Gaussa

Spacery losowe generowanie realizacji procesu losowego

26 marzec, Łańcuchy Markowa z czasem ciągłym. Procesy Stochastyczne, wykład 7, T. Byczkowski, Procesy Stochastyczne, PPT, Matematyka MAP1136

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Rozdział 1 PROGRAMOWANIE LINIOWE

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

1. Liczby wymierne. x dla x 0 (wartością bezwzględną liczby nieujemnej jest ta sama liczba)

Funkcja kwadratowa. f(x) = ax 2 + bx + c,

0 + 0 = 0, = 1, = 1, = 0.

Analiza matematyczna i algebra liniowa Macierze

Funkcje liniowe i wieloliniowe w praktyce szkolnej. Opracowanie : mgr inż. Renata Rzepińska

Teoria. a, jeśli a < 0.

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne.

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.

Analiza numeryczna Kurs INP002009W. Wykłady 6 i 7 Rozwiązywanie układów równań liniowych. Karol Tarnowski A-1 p.

Metoda simpleks. Gliwice

PODSTAWY AUTOMATYKI. MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.

Gry dwuosobowe o sumie zerowej i ich zastosowanie

Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych

FUNKCJA KWADRATOWA. 1. Definicje i przydatne wzory. lub trójmianem kwadratowym nazywamy funkcję postaci: f(x) = ax 2 + bx + c

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Matematyka A kolokwium 26 kwietnia 2017 r., godz. 18:05 20:00. i = = i. +i sin ) = 1024(cos 5π+i sin 5π) =

UKŁADY RÓWNAŃ LINIOWYCH

13 Układy równań liniowych

Wykład 14. Elementy algebry macierzy

O MACIERZACH I UKŁADACH RÓWNAŃ

Rozdział 3 ZADANIE TRANSPORTOWE I PROBLEM KOMIWOJAŻERA

3. Wykład Układy równań liniowych.

Zaawansowane metody numeryczne

Metody numeryczne Wykład 4

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

Układy równań. Kinga Kolczyńska - Przybycień 22 marca Układ dwóch równań liniowych z dwiema niewiadomymi

Metody numeryczne I Równania nieliniowe

1 Macierze i wyznaczniki

= Zapiszemy poniższy układ w postaci macierzy. 8+$+ 2&=4 " 5 3$ 7&=0 5$+7&=4

Programowanie liniowe

STRATEGIA PRZYBLIŻONA. Inna propozycja: szukanie optymalnej strategii metodą iteracyjną.

WEKTORY I WARTOŚCI WŁASNE MACIERZY. = λ c (*) problem przybliżonego rozwiązania zagadnienia własnego dla operatorów w mechanice kwantowej

Geometria analityczna

Algebra liniowa z geometrią

Ekonomia matematyczna - 1.2

POD- I NADOKREŚLONE UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

Met Me ody numer yczne Wykład ykład Dr inż. Mic hał ha Łanc Łan zon Instyt Ins ut Elektr Elektr echn iki echn i Elektrot Elektr echn olo echn

1 Metody rozwiązywania równań nieliniowych. Postawienie problemu

METODY ROZWIĄZYWANIA RÓWNAŃ NIELINIOWYCH

; B = Wykonaj poniższe obliczenia: Mnożenia, transpozycje etc wykonuję programem i przepisuję wyniki. Mam nadzieję, że umiesz mnożyć macierze...

MATEMATYKA I SEMESTR ALK (PwZ) 1. Sumy i sumy podwójne : Σ i ΣΣ

Układy równań i nierówności liniowych

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

ALGEBRA LINIOWA. Wykład 2. Analityka gospodarcza, sem. 1. Wydział Zarządzania i Ekonomii Politechnika Gdańska

Egzamin ustny z matematyki semestr II Zakres wymaganych wiadomości i umiejętności

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Obóz Naukowy Olimpiady Matematycznej Gimnazjalistów

Redukcja dowolnego układu wektorów, redukcja w punkcie i redukcja do najprostszej postaci

METODY NUMERYCZNE. wykład. konsultacje: wtorek 10:00-11:30 środa 10:00-11:30. dr inż. Grażyna Kałuża pokój

Układy równań liniowych

Wstęp do metod numerycznych Uwarunkowanie Eliminacja Gaussa. P. F. Góra

Czym jest użyteczność?

INTERPOLACJA I APROKSYMACJA FUNKCJI

Z52: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania, zagadnienie brzegowe.

Schemat sprawdzianu. 25 maja 2010

Projekt Era inżyniera pewna lokata na przyszłość jest współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

"Bieda przeczy matematyce; gdy się ją podzieli na więcej ludzi, nie staje się mniejsza." Gabriel Laub

Transkrypt:

D. Miszczyńska, M.Miszczyński KBO UŁ GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO Gra w sensie niżej przedstawionym to zasady którymi kierują się decydenci. Zakładamy, że rezultatem gry jest wypłata, którą zgodnie z regułami gry przegrany płaci wygranemu. Przy czym rozważamy tylko gry w których bierze udział dwóch graczy i przegrana jednego jest wygraną drugiego. Ponadto dysponujemy tzw macierzą wypłat, która pozwala nam na określenie gry. I. DEFINICJE i TWIERDZENIA Konfliktowe gry dwuosobowe opisuje macierz wypłat ( a ) [ ] A mxn ij,b ij gdzie: aij - wygrana gracza I bij - wygrana gracza II Jeżeli suma wypłat jest równa zero, tj. aij + bij 0 to grę nazywamy dwuosobową grą macierzową o sumie wypłat zero. Macierz wypłat takiej gry jest więc następująca [( a, a )] A mxn ij ij W tej sytuacji macierz wypłat może opisywać tylko wygrane jednego z graczy. Przyjęto iż będzie to gracz I; zatem wygrane gracza II będą automatycznie liczbami przeciwnymi do wygranych gracza I.

D. Miszczyńska, M.Miszczyński KBO UŁ 2 Def. Macierz wypłat gry dwuosobowej o sumie wypłat zero ma postać A mxn [ a ] ij Elementy macierzy A są wygranymi gracza I i jednocześnie przegranymi gracza II. Def. Strategia mieszana Wektor wierszowy opisujący częstość stosowania poszczególnych strategii przez gracza I. X xm [ x x x m ] 2... gdzie: x i 0 dla i,2,...,m oraz m x i i Wektor kolumnowy opisujący częstość stosowania poszczególnych strategii przez gracza II Y nx y y 2... y n gdzie: y j 0 dla j,2,...,n oraz n y j j Def. Strategia czysta Jeżeli X lub Y są wersorami to nazywamy je strategiami czystymi.

D. Miszczyńska, M.Miszczyński KBO UŁ 3 Def. Funkcją wypłaty nazywamy oczekiwaną wygraną gracza I (nadzieję matematycznę wygranej gracza I) E ( X Y), XAY m i n j x a y i ij j Def. Rozwiązaniem gry nazywamy wektory [ x x L x ] X m 2 m i Y n y y M y 2 n oraz liczbę rzeczywistą v takie, że spełnione są warunki ( X ) E j v ( ), dla strategii czystych gracza II j,2,...,n E i,y v dla strategii czystych gracza I i,2,...,m Strategie X oraz Y nazywamy strategiami optymalnymi, a liczbę v wartością gry. Wartość gry v jest oczekiwaną wygraną (nadzieją matematyczną wygranej) gracza I jeżeli obaj gracze stosują swoje optymalne strategie mieszane X oraz Y, tj. E ( X, Y ) v Tw. (H.Kuhn'a o punkcie siodłowym w teorii gier) Oczekiwana wygrana (nadzieja matematyczna) gracza I stosującego dowolną strategię mieszaną X podczas gdy gracz II stosuje optymalną strategię Y nie przekracza wartości gry. I odwrotnie, oczekiwana wygrana gracza I stosującego optymalną strategię X podczas gdy gracz

D. Miszczyńska, M.Miszczyński KBO UŁ 4 II stosuje dowolną strategię mieszaną Y jest nie mniejsza niż wartość gry ( X, Y ) ( X, Y ) ( X, Y) E E E Tw. (twierdzenie minimaksowe von Neumana i Morgensterna - twierdzenie zasadnicze gier macierzowych) Dla każdej gry macierzowej istnieją i są sobie równe wielkości max min E ( X, Y) oraz min max E ( X, Y), które odpowiadają wartości X Y gry v, tj. Y X ( X Y) ( X Y) max min E, min max E, v X Y Y X Każda gra 2-osobowa o sumie wypłat zero ma zawsze rozwiązanie. Tw. (twierdzenie o liczbie stosowanych strategii) Niech m ( n ) oznacza liczbę strategii jaką używać będzie postępujący optymalnie gracz I (gracz II). Każdy z graczy postępując optymalnie używać będzie nie więcej strategii niż wynosi mniejsza z liczb m (liczba strategii gracza I) lub n (liczba strategii gracza II), tj. m min { m, n} { } oraz n min m, n Def. Dolna wartość gry (minimalna wygrana gracza I) Liczba rzeczywista v taka, że v i { a i } max { } gdzie a min i aij j

D. Miszczyńska, M.Miszczyński KBO UŁ 5 Dla dolnej wartości gry zachodzi { } ij v max min a v i j Def. Górna wartość gry (maksymalna przegrana gracza II) Liczba rzeczywista v taka, że v min j { a } j Dla górnej wartości gry zachodzi { } gdzie a j max aij { ij} v minmax a v j i Sposób określania dolnej ( v ) i górnej ( v ) wartości gry nosi nazwę zasady minimaksu, tj. zasady odzwierciedlającej ostrożne postępowanie obu graczy. [ 3] [ 2] A [ ] 2 3 5 aij v 2 4 0 0 4 5 v 3 2 v 3 i Def. Gra z punktem siodłowym jest to gra, w której dolna ( v ) i górna ( v ) wartości gry są sobie równe, tj. v v Def. Punkt siodłowy jest to ten z elementów macierzy wypłat [ ] A a ij, który wyznacza dolną ( v ) i górną ( v ) wartość gry w grze z punktem siodłowym.

D. Miszczyńska, M.Miszczyński KBO UŁ 6 Tw. (twierdzenie o rozwiązaniu gry z punktem siodłowym) Rozwiązaniem gry z punktem siodłowym jest para strategii czystych (wersorów) X i Y oraz wartość gry v v v [ ] [ 2] A X [ ] Y 3 2 5 v 2 0 4 0 0 [ ] 4 2 5 v v v 2 v 2 0 0 Def. Gra symetryczna. Grę nazywamy grą symetryczną jeżeli macierz wypłat tej gry jest macierzą skośno-symetryczną, tj. [ a a ] A m ij ji Tw. (twierdzenie o rozwiązaniu gry symetrycznej) W grze symetrycznej optymalne strategie obu graczy są identyczne, a wartość gry wynosi zero, tj. X Y oraz v0 0 5 3 3 2 / 0 A [ ] a X [ ] Y ij 5 0 2 5 v 2 2/ 0 3/ 0 5/ 0 3/ 0 3 2 0 2 5/ 0 3 5 2 v 0 v 2

D. Miszczyńska, M.Miszczyński KBO UŁ 7 Tw. (twierdzenie o dodaniu stałej do macierzy wypłat) Dla dwóch gier macierzowych A i B o macierzach wypłat A mxn [ a ij ] oraz B mxn [ b ij a ij + c] gdzie c R \ {0} i wartościach gry odpowiednio v A oraz v B zachodzą następujące związki:. optymalne strategie mieszane sa identyczne, tj. X A X oraz Y Y B A B 2. wartości gry różnią się o stałą c, tj. v v + c B A [ ] [ 2] A X [ ] Y 3 2 5 v A 2 A 0 A 4 0 0 [ ] 4 2 5 v v v 2 v A 2 A A A 0 0 [ ] [ 6] B A + [ ] X [ ] Y 7 6 9 4 v B 6 B 0 B 8 5 4 4 [ ] 8 6 9 v v v 6 v 6 v v + 4 2 + 4 6 B B A B B B 0 0

D. Miszczyńska, M.Miszczyński KBO UŁ 8 II. ROZWIĄZYWANIE GIER MACIERZOWYCH II.. Redukcja macierzy wypłat Redukcja macierzy polega na zastąpieniu wyjściowej macierzy A mxn ekwiwalentną macierzą A kxr gdzie zachodzi przynajmniej jeden z przypadków k<m lub r<n. Rozwiązania gry wyjściowej i ekwiwalentnej są identyczne. Def. Wiersz dominujący, zdominowany (strategia gracza I dominująca lub zdominowana) Mówimy, że wiersz t jest zdominowany przez wiersz s jeżeli a tj asj dla wszystkich j Wiersz s-ty nazywamy dominującym, a wiersz t-ty zdominowanym. Def. Kolumna dominująca, zdominowana (strategia gracza II dominująca lub zdominowana) Mówimy, że kolumna p jest zdominowana przez kolumnę r jeżeli a ip air dla wszystkich i Kolumnę r-tą nazywamy dominującą, a kolumnę p-tą zdominowaną.

D. Miszczyńska, M.Miszczyński KBO UŁ 9 Z wyjściowej macierzy A mxn usuwamy wszystkie wiersze i kolumny zdominowane. Odpowiadające im strategie nie będą używane przez optymalnie postępujących graczy, tj. odpowiednie częstości oraz y j będą równe zero. x i PRZYKŁAD A 4x5 2 2 3 2 3 4 5 2 4 5 0 5 2 0 4 2 2 z z z y 2 0 y 0 3 5 z z x 0 x 0 3 2 4 A 2x3 2 3 5 4 0

D. Miszczyńska, M.Miszczyński KBO UŁ 0 II.2. Graficzne rozwiązywanie gier macierzowych Jeżeli przed lub po redukcji wymiarów macierz wypłat ma dwa wiersze lub dwie kolumny (jest macierzą A 2 xn lub A mx2 ), to odpowiadającą jej grę można rozwiązać graficznie. Dla gry o macierzy wypłat A 2x 3 postępowanie wygląda następująco. [ ] [ 2] 2 3 5 A 2 x 3 v 2 4 0 0 4 3 5 2 v 3 v 3 Wektory strategii mieszanych obu graczy mają postać X x [ x ] 2 i Y y y y 2 3 Z założenia x + x2. Przyjmując x x mamy x2 x. Stąd X [ x x] Wyznaczamy oczekiwane wygrane gracza I, jeżeli gracz II stosuje swoje strategie czyste, tj. E[ j] Nanosimy otrzymane proste na układ xoy. X,. Oznaczać je będziemy krótko E j. Oś Ox ograniczymy do odcinka [0,] rozciągając go nieproporcjonalnie w stosunku do jednostek na osi Oy. Wystawiamy pomocniczą prostą o równaniu x. Oś Oy powiążemy z wygraną, tj. z funkcją wypłaty E[X,Y].

D. Miszczyńska, M.Miszczyński KBO UŁ 2 E E[ X, ] [ x x] 2x 4 4 + 3 E2 E[ X, 2] [ x x] 2x + 5 E3 E[ X, 3] [ x x] x 0 5 Zgodnie z zasadą minimaksu określamy dla każdej wartości x [0,] minimalną (gwarantowaną) wygraną. Będą to wartości wynikające z E, E2, E3. Największa z minimalnych dolnej obwiedni { } (gwarantowanych) wygranych występuje przy przecięciu E z E 2 E E 2 2x + 4 2x + x 3 / 4

D. Miszczyńska, M.Miszczyński KBO UŁ 2 Optymalna strategia mieszana dla gracza I ma więc postać X [ 3 / 4 / 4] Wartość wygranej przy x3/4 jest równa wartości gry v 5 / 2 E E 2 [ [ ] ] [ ] E 3 / 4 / 4, 2 3 / 4 + 4 5 / 2 [ ] E 3 / 4 / 4, 2 2 3 / 4 + 5 / 2 Gracz II nie powinien stosować żadnej swojej strategii, przy której wygrana optymalnie postępującego gracza I byłaby większa od wartości gry v5/2. Musi wyeliminować wszystkie strategie, dla których E[ j] Warunek taki spełnia strategia 3 ponieważ [ ] X, > 5 / 2. E X, 3 5 / 4 > 5 / 2. Zatem w optymalnej strategii mieszanej gracza II y 3 0. Aby określić pozostałe składowe wektora Y należy rozwiązać pomocniczy układ równań z def. y + y + y [ Y ] [ Y ] 2 3 E, 2y + 3y + 5y 5 / 2 2 3 E 2, 4y + y + 0y 5 / 2 2 3 Ponieważ y 3 0, to powyższy układ równań można zastąpić [ Y ] [ Y ] y + y 2 E, 2y + 3y 5 / 2 2 E 2, 4y + y 5 / 2 2

D. Miszczyńska, M.Miszczyński KBO UŁ 3 Wykorzystując dwa dowolnie wybrane równania powyższego układu otrzymamy y / 2 oraz y 2 / 2 Rozwiązanie omawianej gry o macierzy wypłat A 2 x 3 jest następujące X [ 3 / 4 / 4] i Y / 2 / 2 0 oraz v 5 / 2 Dla gier o macierzy wypłat A mx2 postępować będziemy podobnie. Rysunek dotyczył będzie gracza II, o którym należy pamiętać, że jest zainteresowany w minimalizacji warości gry v. Optymalne częstości w wektorze Y wyznaczymy tutaj analizując górną obwiednię { E, E 2,..., E m }, poszukując na niej minimalnej wartości gry (minimalnej przegranej gracza II). Dla gry o macierzy wypłat A 3x 2 postępowanie wygląda następująco. [ ] 2 A 3 x 2 4 v 5 0 0 5 [ 4] v 4 v 4 Wektory strategii mieszanych obu graczy mają tutaj postać X [ x x2 x3 ] i Y y y 2

D. Miszczyńska, M.Miszczyński KBO UŁ 4 + y2. Przyjmując y y 2 Z założenia y Y mamy y y. Stąd y y Wyznaczamy oczekiwane wygrane gracza II, jeżeli gracz I stosuje swoje strategie czyste, tj. E[ i,y ]. Oznaczać je będziemy krótko E i. y 2 y 2 y + E E[,Y ] [ ] y 2 2 4 5y 4 y + E E[,Y ] [ ] 3 5 0 y 3 y 5y E E[,Y ] [ ] E2 E3 5y + 4 5y y 2 / 5

D. Miszczyńska, M.Miszczyński KBO UŁ 5 Optymalna strategia mieszana dla gracza II ma więc postać Y 2 / 5 3 / 5 Wartość wygranej przy y2/5 jest równa wartości gry v2 E E 2 3 E E 2/ 5 2, 5 2 / 5+ 4 2 3/ 5 2/ 5 3, 5 2 / 5 2 3/ 5 Gracz I nie powinien stosować żadnej swojej strategii, przy której przegrana optymalnie postępującego gracza II byłaby mniejsza od wartości gry v2 (wygrana gracza I byłaby mniejsza od wartości gry!!!). Musi wyeliminować wszystkie strategie, dla których E[ i,y ] < 2. Warunek taki spełnia strategia ponieważ [ ] E, Y 8 / 5 < 2. Zatem w optymalnej strategii mieszanej gracza I x 0. Aby określić pozostałe składowe wektora X należy rozwiązać pomocniczy układ równań z def. x + x + x [ X, ] [ X, ] 2 3 E x x + 5x 2 2 3 E 2 2x + 4x + 0x 2 2 3

D. Miszczyńska, M.Miszczyński KBO UŁ 6 Ponieważ x 0, to powyższy układ równań można zastąpić [ X, ] [ X, ] x + x 2 3 E x + 5x 2 2 3 E 2 4x + 0x 2 2 3 Wykorzystując dwa dowolnie wybrane równania powyższego układu otrzymamy x 2 / 2 oraz x 3 / 2 Rozwiązanie omawianej gry jest następujące X [ 0 / 2 / 2] i Y 2 / 5 3 / 5 oraz v 2

D. Miszczyńska, M.Miszczyński KBO UŁ 7 II.4. Iteracyjne rozwiązywanie gier macierzowych Jedną z metod przybliżonego rozwiązywania gier jest metoda symulacyjna oparta na analizie skumulowanych wygranych. Omówimy ją na przykładzie. 2 3 5 A 2 x 3 v 2 4 0 v 3 2 v 3 Proces iteracyjny prowadzimy w tablicy do momentu, gdy wykonamy minimalną liczbę iteracji (np. 8). Po ich wykonaniu możemy zakończyć proces symulacji gry, gdy: otrzymamy błąd oszacowania wartości gry (ε) nie większy od założonego poziomu (np. ε 0.) osiągniemy maksymalną liczbę iteracji (np. 00) lub W kolumnie (k) odnotowuje się numer bieżącej iteracji, a w kolumnie (ε) błąd oszacowania wartości gry. W kolumnach (gracz II) odnotowuje się skumulowane wypłaty gracza II, a w kolumnach (gracz I) skumulowane wygrane gracza I.. Symulację rozpoczynamy od dodania do kolumn (gracz II) pierwszego wiersza macierzy wypłat. W kolumnach (gracz II) wybieramy najmniejszą skumulowaną wypłatę; jest to wypłata 2 odpowiadająca strategii gracza II. Do kolumn (gracz I) dodajemy zatem kolumnę macierzy wypłat A. W kolumnach (gracz I) wybieramy największą skumulowaną wygraną; jest to wygrana 4 odpowiadająca strategii 2 gracza I. Taki wybór powoduje, że w kolejnej (k2) iteracji do kolumn (gracz II) dodajemy wiersz 2 macierzy wypłat A. 2. W kolumnach (gracz II) wybieramy najmniejszą skumulowaną wypłatę; jest to wypłata 4 odpowiadająca strategii 2 gracza II. Do kolumn (gracz I) dodajemy zatem kolumnę 2 macierzy wypłat A. W kolumnach (gracz I) wybieramy największą skumulowaną wygraną; jest to wygrana 5 odpowiadająca strategii gracza I (wybór był tutaj niejednoznaczny; wybrano strategię o niższym numerze). W wyniku tego w kolejnej (k3) iteracji do kolumn (gracz II) dodajemy wiersz macierzy wypłat A.

D. Miszczyńska, M.Miszczyński KBO UŁ 8 W ten sposób przebiegają kolejne iteracje. Po 8 iteracjach wolno nam zakończyć proces obliczeniowy jeżeli błąd oszacowania wartości gry nie przekracza 0% (ε0.). Taka sytuacja ma miejsce dopiero po 0 iteracjach. Rozwiązanie gry uzyskujemy zliczając w kolumnach (gracz I) i (gracz II) krotność użycia każdej strategii. Dzieląc te krotności przez liczbę wykonanych iteracji otrzymamy oszacowania składowych wektorów X i Y. Przybliżone rozwiązanie gry uzyskane w wyniku symulacji jest następujące X [ 7 / 0 3 / 0] i Y / 2 / 2 0 2 3 5 A 2 x 3 4 0 oraz v 49 / 20 gracz II v gracz I v ε v iteracja strategia strategia 2 strategia 3 strategia strategia 2 k a a 2 a 3 a j / k a a 2 ai / k v v ( v v) 0 0 0 0 0 0 2 3 5 2 2 4 4 2 3 2 6 4 5 2 5 5 5/2 /2 9/4 3 8 7 0 7/3 8 6 8/3 /3 5/2 4 0 0 5 5/2 0 0 5/2 0 5/2 5 2 3 20 2/5 2 4 4/5 2/5 3/5 6 6 4 20 7/3 5 5 5/2 /6 /4 7 8 7 25 7/7 8 6 8/7 /7 5/2 8 20 20 30 5/2 20 20 5/2 0 5/2 9 22 23 35 22/9 22 24 24/9 2/9 23/9 + / 2 0 26 24 35 2/5 25 25 5/2 /0 49/20 krotność użycia 5 5 0 7 3 wartość gry częstość 5/0 5/0 0 7/0 3/0 49/20