1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów

Podobne dokumenty
1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów

Analiza decyzyjna(ad): tablica decyzyjna, klasyfikacja

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

11. Gry Macierzowe - Strategie Czyste i Mieszane

Elementy teorii gier. Badania operacyjne

Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 2

Czym jest użyteczność?

8. Podejmowanie Decyzji przy Niepewności

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

A. Kasperski, M. Kulej Badania Operacyjne- programowanie liniowe 1

Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1

Zagadnienie transportowe

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Optymalizacja decyzji

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Badania operacyjne. te praktyczne pytania, na które inne metody dają odpowiedzi jeszcze gorsze.

PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI

Wyznaczanie strategii w grach

Gry o sumie niezerowej

Wielokryteriowa optymalizacja liniowa

Programowanie liniowe

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Programowanie celowe #1

Standardowe zadanie programowania liniowego. Gliwice 1

Ubezpieczenia majątkowe

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Układy równań i nierówności liniowych

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Optymalizacją wielokryterialną nazwiemy próbę znalezienia wektora zmiennych decyzyjnych: x = [x 1

ZAGADNIENIE TRANSPORTOWE

Elementy Modelowania Matematycznego

ZAGADNIENIE TRANSPORTOWE(ZT)

PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM. cz. 6. dr BOŻENA STARUCH

Problemy oceny alternatyw w warunkach niepewności

Podejmowanie decyzji w warunkach niepełnej informacji. Tadeusz Trzaskalik

Metoda simpleks. Gliwice

Programowanie liniowe

10. Wstęp do Teorii Gier

Definicja problemu programowania matematycznego

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

O MACIERZACH I UKŁADACH RÓWNAŃ

Gry z naturą 1. Przykład

Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Metoda graficzna może być stosowana w przypadku gdy model zawiera dwie zmienne decyzyjne. Metoda składa się z dwóch kroków (zobacz pierwszy wykład):

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

Metody systemowe i decyzyjne w informatyce

Programowanie liniowe

Badania operacyjne i teorie optymalizacji

Programowanie liniowe całkowitoliczbowe. Tadeusz Trzaskalik

Weryfikacja hipotez statystycznych

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w

PROGRAMOWANIE KWADRATOWE

Programowanie liniowe. Tadeusz Trzaskalik

Rozdział 1 PROGRAMOWANIE LINIOWE

METODA SYMPLEKS. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski

TOZ -Techniki optymalizacji w zarządzaniu

Elementy Modelowania Matematycznego

Materiały wykładowe (fragmenty)

Rozwiązanie Ad 1. Model zadania jest następujący:

Krzywe Freya i Wielkie Twierdzenie Fermata

Programowanie liniowe

1 S t r o n a. Teoria Gier Praca domowa 1 - rozwiązania

ZAGADNIENIE DUALNE Rozważmy zagadnienie liniowe(zagadnienie to nazywamy prymalnym) o postaci kanonicznej:

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.

Daria Sitkowska Katarzyna Urbaniak

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

13 Układy równań liniowych

Gry dwuosobowe o sumie zerowej i ich zastosowanie

Programowanie nieliniowe

Baza w jądrze i baza obrazu ( )

9 Funkcje Użyteczności

Badania operacyjne egzamin

A. Kasperski, M. Kulej, Badania operacyjne, Wykład 4, Zagadnienie transportowe1

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

Wielokryteriowa optymalizacja liniowa cz.2

4. PROGRAMOWANIE LINIOWE

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Matematyka ubezpieczeń majątkowych r.

PROGRAMOWANIE NIELINIOWE

Teoria gier w ekonomii - opis przedmiotu

Wprowadzenie do badań operacyjnych - wykład 2 i 3

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Wykład z modelowania matematycznego. Zagadnienie transportowe.

Dualność w programowaniu liniowym

doc. dr Beata Pułska-Turyna Zarządzanie B506 mail: mgr Piotr J. Gadecki Zakład Badań Operacyjnych Zarządzania B 505.

Układy równań liniowych

Ekonomia matematyczna - 1.2

2010 W. W. Norton & Company, Inc. Oligopol

Mikroekonomia II: Kolokwium, grupa II

Transkrypt:

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 1 1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów Tablica decyzyjna. Niech a 1, a 2,...,a m -działania,strategie,alternatwydecyzyjne, θ 1, θ 2,...,θ n -stanynatury, X ij -pełnyopiskonsekwencjidladecydentapodjęciadziałania a i, gdyzaistniałstannatury θ j.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 2 Alternatywy Stany natury decyzyjne θ 1 θ 2... θ a 1 X 11 X 12... X 1n a 2 X 21 X 22... X 2n........... a m X m1 X m2... X mn Tab. 1: Ogólna postać tablicy decyzyjnej

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 3 Alternatywy Przykład 1. Stan natury decyzyjne jajko dobre jajko zepsute zbićjajkodomiski omletz6jaj niemaomletu i 5 jajek zniszczonych zbićjajkodo omletz6jaj omletz5jajek doinnegonaczynia inaczyniedoumycia inaczyniedoumycia wyrzucić jajko omlet z 6 jajek i jedno jajko zniszczone omlet z 5 jajek Tab. 2: Pełny opis konsekwencji problemu decyzyjnego przygotowanie omletu

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 4 W analizie decyzji stosuje się tablice decyzyjne w których zamiast pełnegoopisukonsekwencji X ij używasięmiarywartości konsekwencji v(x ij )oznaczanejdalejprzez v ij dla i = 1,...,m; j = 1,...,ninazywanejużytecznością.Miarata powinnaspełniaćwarunek,że v ij > v kl,gdydladecydentabardziej sprzyjającesąkonsekwencje X ij niżkonsekwencje X kl (mówisię również,żedecydentpreferujekonsekwencje X ij wstosunkudo konsekwencji X kl ).Tablicadecyzyjnawktórejkonsekwencjezostały zastąpione użytecznością(3):

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 5 Alternatywy Stany natury decyzyjne θ 1 θ 2... θ a 1 v 11 v 12... v 1n a 2 v 21 v 22... v 2n....... a m v m1 v m2... v mn Tab. 3: Postać ogólna tablicy decyzyjnej, w której konsekwencje zastąpiono użytecznością

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 6 1.1 Typy problemów decyzyjnych Problemy decyzyjne w warunkach pewności. Występuje tylko jeden stan natury, którego wystąpienie jest pewne- tablica decyzyjna ma tylko jedną kolumnę. Problemy decyzyjne w warunkach ryzyka. Znane jest prawdopodobieństwo wystąpienia każdego stanu natury. Dla dyskretnychstanównatury θ 1, θ 2,...,θ n prawdopodobieństwa ichwystąpieniaoznaczamyprzez P(θ 1 ), P(θ 2 ),...,P(θ n ). Problemy decyzyjne w warunkach niepewności. Znane są sposoby postępowania decydenta i potrafimy zidentyfikować wszystkie możliwe stany natury ale nie wiemy nic o prawdziwym stanie natury.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 7 1.1.1 Problemy w warunkach pewności Optymalną jest alternatywa o najbardziej sprzyjającej dla decydenta wartości użyteczności. 1.1.2 Problemy w warunkach ryzyka Racjonalne kryterium wyboru optymalnej decyzji polega na wyborze takiejalternatywydecyzyjnej a k,któramaksymalizuje(lub minimalizuje, gdy użyteczność jest kosztem) wartość średnią użyteczności tj. n j=1 P(θ j )v kj = m max i=1 n P(θ j )v ij j=1

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 8 Przykład 2. Sprzedawca truskawek kupuje na plantacji koszyczek truskawek za 3zł. a sprzedaje za 8zł. Sprzedany koszyk przynosi mu zatem 5zł. zysku a nie sprzedany stratę 3zł. Z doświadczenia wie, że dziennypopytmożewynosić10,11,12lub13koszyczków.z90 obserwacji, które zgromadził wie, że w 18 przypadkach dzienny popyt kształtowałsięnapoziomie10,w36napoziomie11,w27na poziomie12iw9napoziomie13koszyczków. a i -zakupnaplantacji 10 + (i 1)koszyczkówtruskawek, θ i -popyt dziennynapoziomie 10 + (i 1)(i = 1, 2, 3, 4)koszyczkówa użytecznością będzie dzienny zysk sprzedawcy, to tablicą decyzyjną jest tablica 4.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 9 Zysk θ 1 θ 2 θ 3 θ 4 EV (a i ) a 1 50 50 50 50 50 a 2 47 55 55 55 53.4 a 3 44 52 60 60 53.6 a 4 41 49 57 65 51.4 Rozkład 0.2 0.4 0.3 0.1 Tab. 4: Tablica decyzyjna sprzedawcy truskawek Wtejtablicy EV (a i )oznaczawartośćśredniąużyteczności alternatywy a i.decyzjąoptymalnąjestwybóralternatywy a 3,która dajemaksymalnyoczekiwanyzyskwynoszący EV (a 3 ) = 53.6. Niech X będzie dyskretną zmienną losową rozkładu stanów natury(tj. wielkości popytunatruskawki)przyjmującąwartości q, q + 1,..., Qorozkładzie P(x)dla x = q, q + 1,..., Qidystrybuancie F(x) = P(X x).wartośćśrednia

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 10 użytecznościalternatywy a i,jestwartościąśredniąfunkcjizmiennejlosowej X. Niech d(z), z = q, q + 1,..., Q-wartośćśredniazyskusprzedawcy,gdyzakupiłna plantacjizkoszyczkówtruskawek(tj. EV (a i ) = d(z),gdzie z = 10 + i 1, i = 1, 2, 3, 4), a-zyskjakiosiągasprzedawcazjednego sprzedanego koszyczka, b strata na jednym nie sprzedanym koszyczku(dla rozpatrywanegoprzykładu a = 5, b = 3).Załóżmy,żesprzedawcazakupił z 1 koszyczków(jego średni zysk wynosi d(z 1)). Dokupienie dodatkowo jednego koszyczkatruskawekprzyniesiestratę bjeślipopyt xbędzie x z 1. Prawdopodobieństwo tego zdarzenia wynosi P(X z 1). Natomiast przyniesie zysk ajeślipopyt xbędzie x > z 1.Tozdarzeniemaprawdopodobieństwo 1 F(z 1).Mamyzatemrekurencyjnywzór: d(z) = d(z 1) + a[1 F(z 1)] bf(z 1) Dla z = qmamy d(q) = aq. = d(z 1) + a (a + b)f(z 1) (z = q + 1, q + 2,..., Q.)

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 11 Dla sprzedawcy truskawek mamy: EV (a 1 ) = d(z = 10) = 5 10 = 50 EV (a 2 ) = d(11) = d(10) + 5 (5 + 3)F(10) = 50 + 5 8 2 10 = 53.4 EV (a 3 ) = d(12) = d(11) + 5 8F(11) = 58.4 8 6 10 = 53.6 EV (a 4 ) d(13) = d(12) + 5 8F(12) = 58.6 8 9 10 = 51.4 Optymalną strategię można również wyznaczyć wzorem analitycznym. Jeśli strategiąoptymalnąjestwybóralternatywypolegającejnazakupie k koszyczków, to z własności maksimum lokalnego mamy, że d(k ) d(k 1) F(k 1) a a + b d(k ) d(k a + 1) a + b F(k ) Stąd mamy F(k 1) a a + b F(k ) Wartość k spełniającatęnierównośćjestoptymalnądecyzją.tenostatnisposób wyznaczania alternatywy optymalnej jest najoszczędniejszy. Dla sprzedawcy

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 12 truskawek mamy a a + b = 5 3 + 5 = 0.425 i 0.4 = F(11) 0.625 F(12) = 0.9, czylioptymalnąalternatywąjestzakup12koszyczków (k = 12). Oczekiwana wartość pewnej informacji(evpi). Załóżmy, że sprzedawca może z całą pewnością przewidzieć zajście danego stanu natury(ma pewną prognozę odnośnie stanów natury). Wtedy powinien wybierać alterntywę a 1 dlastanu θ 1, a 2 dla θ 2, a 3 dla θ 3 i a 4 dla θ 4.Ponieważznarozkład prawdopodobieństwa stanów natury, to wartość oczekiwana użyteczności wyniesie wtedy: 50 0.2 + 55 0.4 + 60 0.3 + 65 0.1 = 56, 5. Bez znajomości tej prognozy wartość oczekiwana zysku wynosi 53,6. Różnica 56.5-53.6=2.9 definiuje oczekiwaną wartość pewnej informacji, czyli EVPI=2.9. Wartość tę możemy interpretować jako maksymalną kwotę, którą można wydać za pewną prognozę.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 13 1.1.3 Kryteria wyboru decyzji w warunkach niepewności Danajesttablicadecyzyjnadlaproblemuzfunkcjąużyteczności v ij (funkcją tą może być zysk lub koszt). Kryterium Walda- wybór alternatywy dla której najmniej sprzyjający rezultat jest dla decydenta najkorzystniejszy (maksymalizacjaminimalnegozysku,gdyużyteczność v ij jest zyskiem).dlakażdejalternatywy a i, i = 1,...,mwyznaczasię dwiewielkości:najbardziejsprzyjającydladecydentarezultat o i oraznajmniejsprzyjającyrezultat s i.jeśliużyteczność v ij jest zyskiem,to o i = max{v ij }oraz s i = min{v ij } j j

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 14 natomiast,gdyużyteczność v ij jestkosztem,to o i = min{v ij }oraz s i = max{v ij }. j j Decyzjąoptymalnąjestalternatywa a k taka,że lub s k = max i s i = max i min j {v ij }jeśli v ij jestnp.zyskiem s k = min i s i = min i max{v ij }jeśli v ij jestnp.kosztem j Kryterium to jest najbardziej konserwatywne- decydent wybiera alternatywę, w której najgorszy(najmniej sprzyjający) rezultat będzie dla niego najkorzystniejszy spośród wszystkich alternatyw. Nie wszyscy decydenci wykazują taką postawę względem ryzyka. Niektórzy decydenci mogą preferować alternatywy dla których najbardziej sprzyjający rezultat jest

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 15 najkorzystniejszytj,wybieraćalternatywę a k dlaktórej o k = max i o i = max i max{v ij.} j Kryterium Hurwicza- wybór alternatywy o najkorzystniejszej dla decydenta średniej ważonej z najmniej i najbardziej sprzyjającegorezultatu(maksymalizacja-gdy v ij jestzyskiemśredniej ważonej z najmniej i najbardziej sprzyjającego rezultatu).jeśli v ij jestzyskiem,todecyzjąoptymalnąjest alternatywa a k taka,że αs k +(1 α)o k = max{αs i +(1 α)o i } = max{α min{v ij }+(1 α) max{v ij }}, i i j j gdzie α jest współczynnikiem charakteryzującym decydenta. Dla α = 1 kryterium jest identyczne z kryterium Walda, czyli jest najbardziej zachowawczym, dla α = 0 mamy najbardziej optymistyczne kryterium. Wartości α z przedziału(0,1)

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 16 pozwalająnamodelowaniepostawpośrednich.jeśli v ij jest kosztem,todecyzjąoptymalnąjestalterntywa a k taka,że αs k +(1 α)o k = min{αs i +(1 α)o i } = min{α max{v ij }+(1 α) min{v ij }}. i i j j Kryterium Savage a- minimalizacja maksymalnego żalu. Na podstawietablicydecyzyjnej [v ij ]konstruujesięnowątablicę [r ij ]następująco: r ij = max m l=1 {v ij} v ij v ij min m l=1{v ij } jeśli v ij jestzyskiem, jeśli v ij jestkosztem. Element r ij tejtablicyjestróżnicąpomiędzyużytecznością najlepszej decyzji jaką należałoby podjąć przy wystąpieniu stanu θ j apodjętądecyzją(dla v ij zysku)imożebyćinterpretowany jako żal zniepodjęcianajlepszejdecyzji.wtablicy r ij do wyboru decyzji optymalnej stosuje się kryterium Walda(dla

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 17 kosztów).decyzjąoptymalnąjest a k takie,że s k = min{s i } = min{max{r ij }}. i i j Kryterium Laplace a(1825)- maksymalizacja(lub minimalizacja, gdy użyteczność jest kosztem) wartości średniej. Optymalną decyzjąjestwybórtakiejalternatywy a k,że n j=1 1 n v kj = max m { n i=1 j=1 1 n v ij}. Przykład 3. Ośrodek wczasowy przygotowuje zapasy żywności na nadchodzącyweekend.możliwestanynatury θ 1, θ 2, θ 3, θ 4 odpowiadają odpowiednio przyjazdowi 100, 150, 200 i 250 turystów. Alternatywy decyzyjnyme a 1, a 2, a 3, a 4 toprzygotowanie(zakup)zapasówdla odpowiednio100,150,200i250turystów.użyteczność v ij będąca kosztemzwiązanymzpodjęciemalternatywy a i iwystąpieniemstanu

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 18 θ j podanajestwtablicy5. v ij θ 1 θ 2 θ 3 θ 4 s i o i a 1 5 10 18 25 25 5 a 2 8 7 8 23 23 7 a 3 21 18 12 21 21 12 a 4 30 22 19 15 30 15 Tab. 5: Tablica decyzyjna dla ośrodka wczasowego Optymalną decyzją stosując kryterium Walda jest wybór alternatywy a 3,dlakryteriumHurwicza,gdywspółczynnik α = 0.5alternatywą optymalnąjest a 1 lub a 2.DlakryteriumSavage amusimynajpierw wyznaczyćtablicę r ij,którąpodanowtablicy6.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 19 r ij θ 1 θ 2 θ 3 θ 4 s i a 1 0 3 10 10 10 a 2 3 0 0 8 8 a 3 16 8 4 6 16 a 4 25 12 11 0 25 Tab.6:Tablicawartości [r ij ]dlaośrodkawczasowego Decyzjąoptymalnąjestwtymprzypadkuwybóralternatywy a 2.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 20 2 Drzewadecyzyjne 3 Gry dwuosobowe o sumie zerowej W poprzednio rozpatrywanych sytuacjach decyzyjnych na efekty działań decydenta miały wpływ stany natury. Obecnie zajmiemy się sytuacjami, gdy na działania decydenta ma wpływ nie natura, którą możemy traktować jako pasywnego oponenta lecz inny racjonalnie działający decydent. W teorii gier obu decydentów nazywamy graczami. Zajmować się będziemy tylko grami dwuosobowymi o sumie zerowej. W takich grach podejmowane przez obu graczy decyzje nazywane sa strategiami. Efekt(użyteczność) podjęcia strategii i przez jednego gracza, gdy drugi gracz wybrał strategię j nazywa się wypłatą i oznaczamyprzez [w ij ], i = 1,..., m; j = 1,..., n.wgrachosumiezerowypłata (wygrana) dla jednego gracza jest równa przegranej drugiego.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 21 Przykład4.Mamydwóchgraczy:gracza1igracza2.Każdyznich dysponuje trzema strategiami 1,2 i 3. Macierz wypłat podaje tabela 7 Macierz wypłat Gracz 2 Strategie 1 2 3 1 1 2 4 Gracz1 2 1 0 5 3 0 1-1 Tab.7:Macierzwypłatgry1 Macierz wypłat tej gry jest dość specyficzna i rozwiązanie otrzymamy wykorzystując koncepcję strategii zdominowanych. Mówimy, że strategia i jest zdominowana przez strategię k jeśli strategia k jest co najmniej tak dobra jak i(a czasami lepsza), bez względu na to, co zrobi oponent(drugi gracz). Formalnie

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 22 strategię i będziemy nazywać strategią zdominowaną przez strategię k, jeśli j=1,...,n w ij w kj oraz l w il < w kl. Natomiast k nazywamy strategią dominującą, jeśli: j=1,...,n w kj = max{w ij }. i Strategie, które nie są zdominowane przez inne strategie nazywamy strategiami niezdominowanymi. Racjonalnie działający decydent będzie dokonywał wyboru spośród strategii niezdominowanych. Strategia 3 jest dla gracza 1 zdominowaną przez strategię 1, gdyż bez względu na to jaką strategię wybierze gracz 2 wypłata gracza 1 jest przy wyborze strategii 3 nie niższa niż wypłata przy wyborze strategii 1. Zatem wiersz trzeci odpowiadający strategii zdominowanej możemy skreślić z macierzy wypłat. Zredukowana macierz wypłat jest podana w tablicy 8. 1 2 3 1 1 2 4 2 1 0 5 Tab. 8: Zredukowana macierz gry11

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 23 Ponieważ zakładamy racjonalność obu graczy, to gracz 2 też ma strategię zdominowaną 3. Jest ona zdominowana zarówno przez strategię 1 jak i przez strategię 2. Eliminujemy strategię 3 gracza 2 co daje macierz wypłat 9: 1 2 1 1 2 2 1 0 Tab. 9: Zredukowana macierz gry12 Teraz strategia 2 dla gracza 1 jest zdominowana przez strategię 1. Eliminując zdominowaną strategię mamy macierz wypłat podaną w tablicy 10: 1 2 1 1 2 Tab. 10: Zredukowana macierz gry13 Strategia 2 dla gracza 2 jet zdominowana przez strategię 1 zatem powinna być

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 24 wyeliminowana. Ostatecznie obaj gracze powinni wybierać strategie 1. Gracz 1 otrzyma wtedy wypłatę 1, ta wartość jest przegraną gracza 2. Jest to wartość gry. Jeśli wartość gry jest 0, to nazywa się grą sprawiedliwą(rozważana gra nie jest grą sprawiedliwą, gdyż jej wartość wynosi 1). Koncepcja zdominowanych strategii pozwala na redukcję wymiaru macierzy wypłat i w niektórych przypadkach pozwala wyznaczyć rozwiązanie gry. Jednak w większości przypadków potrzebujemy innego podejścia, które zaprezentjemy na dwu kolejnych przykładach.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 25 Przykład 5. Rozpatrzymy teraz grę o macierzy wypłat podanej w tablicy 11 Macierz wypłat Gracz 2 Strategie 1 2 3 Minimum 1-3 -2 6-3 Gracz1 2 2 0 2 0 max 3 5-2 -4-4 Maximum 5 0 6 min Tab.11:Macierzwypłatgry2

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 26 Wtejgrzegracz1stosującstrategię1możewygrać6alemożerównieżprzegrać 3(wypłata-3). Stosując strategię 3 może wygrać 5 ale może przegrać 4. Natomiast wstrategii2jegowygranabezwzględunatocozrobigracz2będzieconajmniej 0.Analizującstrategiedlagracza2mamy,żewstrategiach1i3jegomaksymalna przegrana wynosi odpowiednio 5 i 6. natomiast w strategii 2 tylko zero. Obaj gracze powinni zatem wybrać strategię 2, gdyż każdemu z nich zapewnia ona w najgorszym przypadku najlepszy wynik. Jest to tzw. kryterium minimaksowe standardowo proponowane w teorii gier do wyboru strategii optymalnej. Według tego kryterium gracz 1 powinien wybrać strategię,dla której minimalna wypłata jestnajwiększa(tj. max i min j {w ij })agracz2strategiędlaktórejmaksymalna wypłatagracza1jestjestnajmniejsza(tj. min i max j {w ij }).Wanalizowanym przykładzie strategią max min jest strategia 2 gracza 1 a strategią min max jest strategia 2 dla gracza 2.Wartość gry jest równa 0, czyli jest to gra sprawiedliwa. Wtejgrzetensamelementmacierzywypłat(w 22 = 0)jestjednocześniewartością max min i wartością min max, czyli mamy element, który jest najmniejszy w wierzsu i jednocześnie największy w kolumnie. Taki punkt, jesli istnieje, nazywa

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 27 się punktem siodłowym. Jesli gra ma punkt siodłowy, to obaj gracza powinni do wyboru strategii optymalnej stosować odpowiednio max min i min max strategie.jednakniekażdagraposiadapunktsiodłowy-takąjestnp.gra3.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 28 Macierz wypłat Gracz 2 Strategie 1 2 3 Minimum 1 0-2 2-2 max Gracz1 2 5 4-3 -3 3 2 3-4 -4 Maximum 5 4 2 min Tab.12:Gra3-niemapunktusiodłowego Wtejgrze max i min j w ij = 2 2 = min i max j w ij niesąrówneco oznacza, że gra nie posiada punktu siodłowego. W tej grze informacja

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 29 o tym jaką strategię wybierze jeden z graczy pozwala drugiemu poprawić swoją pozycję. Koncepcja rozwiazania optymalnego w tego typu grach oparta jest na pojęciu strategii miesznych, które charakteryzują się tym, że żaden z graczy nie może wydedukować jaką strategię użyje oponent. 3.1 Strategie mieszane dla gry bez punktu siodłowego Dla gier nie posiadających punktu siodłowego dla każdego z graczy wyznacza się rozkłady prawdopodobieństwa na zbiorach ich strategii. Niech: x i = prawdopodobieństwo,żegracz1użyjestrategiii(i = 1,...,m), y j = prawdopodobieństwo,żegracz2użyjestrategiij(j = 1,...,n),

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 30 gdzie m i=1 x n i = 1, j=1 y j = 1.Wartości x i, i = 1,...,moraz y j, j = 1...,nnazywamystrategiamimieszanyminatomiast oryginalne strategie strategiami czystymi. W trakcie gry każdy z graczy wybiera strategię czystą jednak powinien wybierać ją w pewienlosowysposóbzgodnyzrozkładem (x 1, x 2,...,x m )dlagracza 1irozkładem (y 1, y 2,...,y n )dlagracza2.np.jesli (x 1, x 2, x 3 ) = ( 1 2, 1 2, 0)a(y 1, y 2, y 3 ) = (0, 1 2, 1 2 ),togracz1nie powinien wybierać strategii czystej 3 a wybór strategii 2 lub 3 rozstrzygnąć rzucając monetą. Analogicznie gracz 2 nie powinien wybierać czystej strategii 1 a wybór pomiędzy strategiami 2 i 3 rozstrzygnąć rzucając monetą. Przy stosowaniu strategii mieszanych przez każdego z graczy oczekiwaną wygraną gracza 1 jest Oczekiwana wypłata gracza 1 = m i=1 n w ij x i y j, j=1

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 31 gdzie w ij jestwypłatąjeśligracz1używaczystejstrategii iagracz2używa czystej strategii j. W rozpatrywanej poprzednio grze 3 jeśli gracze 1 i 2 stosują odpowiedniostrategiemieszane (x 1, x 2, x 3 ) = ( 1 2, 1 2, 0)i(y 1, y 2, y 3 ) = (0, 1 2, 1 2 )to oczekiwanawypłatagracza1wynosi 1 4 ( 2 + 2 + 4 3) = 1 4.Minimaksowe (min max) ktyterium dla strategii mieszanych mówi, że gracz powinien wybierać strategię mieszaną, która minimalizuje jego maksymalne oczekiwane straty. Równoważnie, jeśli rozważamy wygraną gracza 1(a nie przegraną gracza 2 co jest równoważne) to kryterium to jest maksyminowe(max min), tj. maksymalizuje się minimalną oczekiwaną wypłatę gracza 1. Przez minimalną oczekiwaną wypłatę rozumie się najmniejszą możliwą wypłatę, którę można uzyskać przy dowolnej strategii miesznej, podjętej przez oponenta. Zatem mieszna strategia dla gracza 1 jest optymalną, jeśli minimalna oczekiwana wypłata jest maksymalna. Wartość tą oznaczamy przez w. Dla gracza 2 podobnie optymalną strategią mieszaną jest strategia, która minimalizuje maksymalną oczekiwaną wartość przegranej. Wartość tę oznacza się przez w. Dla gier nie posiadających punktu siodłowego jeśli tylko rozpatruje się czyste strategie, to nie ma rozwiązania stabilnego.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 32 Zachodzi wtedy nierówność w < w i gracze mogą zmieniać strategie, aby poprawić swoją pozycję. Dla strategii mieszanych koniecznym warunkiem, aby rozwiązanie optymalne było stabilne jest równość w = w. W grach o sumie zerowej ten warunek jest zawsze spełniony. Twierdzenie 1. Para strategii miesznych dla graczy jest optymalną dając stabilne rozwiązanie przy kryterium minimaksowym,(min max), gdy w = w = w.stosująctestrategieżadenzgraczyniemoże poprawić swojej pozycji zmieniając jednostronnie swoją strategię. 3.2 Zastosowanie programowania liniowego do wyznaczenia rozwiazania gry Rozwiązanie dowolnej gry w strategiach miesznych można wyznaczyć rozwiazując pewne zagadnienie programowania liniowego.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 33 Wyznaczanie optymalnej strategii mieszanej gracza 1. Oczekiwana wypłata gracza 1 = m i=1 n w ij x i y j, j=1 istrategia (x 1, x 1,...,x m )jestoptymalnąjeśli m i=1 n w ij x i y j w = w j=1 dlakażdejstrategii (y 1, y 2,...,y n )gracza2.tanierównośćmusi równieżzachodzićdlaczystychstrategiitj. (y 1, y 2,...,y n )takich,że jednawspółrzędna y j = 1aresztajestzerami.Zatemmamy: m w ij x i wdla j = 1,...,n. i=1

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 34 Co więcej ten zbiór nierówności implikuje wyjściową nierówność: n m y j ( w ij x i ) j=1 i=1 n y j w = w, i=1 ponieważ n j=1 y j = 1.Spełnienietychnnierównościjestrównoważne spełnieniuwyjściowejnierównościdlakażdejstrategii y 1, y 2,...,y n. Wyznaczenie optymalnej strategii może być zatem sprowadzone do

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 35 rozwiązania następującego zagadnienia programowania liniowego: x m+1 max w 11 x 1 + w 21 x 2 +, +w m1 x m x m+1 0 w 12 x 1 + w 22 x 2 +, +w m2 x m x m+1 0 w 1n x 1 + w 2n x 2 +, +w mn x m x m+1 0 x 1 + x 2 + + x m = 1 x i 0,dla i = 1, 2,...,m. Zmienna x m+1 zastępujenieznanąwartość wiwrozwiązaniu optymalnym będzie jej równa. Jednak na tę zmienną nie jest nałożony warunek nieujemności. Analogiczne rozumowanie prowadzi

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 36 do następującego modelu wyznaczania optymalnej strategii gracza2: y n+1 max w 11 y 1 + w 12 y 2 +, +w 1n y n y n+1 0 w 21 y 1 + w 22 y 2 +, +w 2n y n y n+1 0 w m1 y 1 + w m2 y 2 +, +w mn y n y n+1 0 y 1 + y 2 + + y n = 1 y i 0,dla i = 1, 2,...,n. Problem wyznaczenia optymalnej strategii mieszanej dla gracza 1 jest dualnym do problemu wyznaczania strategii optymalnej gracza 2. Z twierdzeńodualnościwiemy,żedlaoptymalnychrozwiązań x m+1 oraz y n+1tychzagadnieńmamy,że x m+1 = y n+1czyli x m+1 = y n+1.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 37 Zokreslenia w i wmamy,że w = x m+1oraz y n+1 = wskąd otrzymujemy równość w = w. Pozostaje jeszcze jeden element do rozpatrzenia. W podanych modelachliniowychzmienne x m+1, y n+1niesąnieujemne.jeślijest oczywiste,że w 0,tomożnastosowaćsympleks.Jeślitakniejest należy zastosować jedną z następujących modyfikacji: zamienić zmienną dowolną różnicą dwu zmiennych nieujemnych, zamienić rolami graczy tak, aby wypłata gracza 1 była nieujemna, dodać do macierzy wypłat pewną stałą(równą np. maksymalnej wartości modułów ujemnych wartości macierzy wypłat), tak aby wartość gry w była nieujemną- dodanie stałej nie może zmienić optymalnych strategii, a po rozwiązaniu gry modyfikujemy jej wartość o tę wielkość.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 38 Ostatni sposób jast najczęściej stosowany. Zastosujmy teraz programowanie liniowe do wyznaczenia optymalnych strategii mieszanych dla gry 3. Przyjmiemy, że wartość gry jest nieujemna tj. w 0(okaże się że tak rzeczywiście jest) czyli nie będziemy stosować modyfikacji macierzy wypłat. Przykład6.Wtejgrzestrategia3dlagracza1jestzdominowaną zatem powinna być wyeliminowana. Macierz wypłat po usunieciu strategii3gracza1jestpodanawtablicy13

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 39 Macierz wypłat Gracz 2 Strategie 1 2 3 1 0-2 2 Gracz1 2 5 4-3 Tab. 13: Gra 3 po wyeliminowaniu zdominowanej strategii 3.

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 40 Modeleliniowedlagracza1igracza2sąnastępujące: x 3 max 5x 2 x 3 0 2x 1 + 4x 2 x 3 0 2x 1 3x 2 x 3 0 x 1 + x 2 = 1 x 1, x 2 0. y 4 min 2y 2 + 2y 3 y 4 0 5y 1 + 4y 2 3y 3 y 4 0 y 1 + y 2 + y 3 = 1 y 1, y 2, y 3 0. Rozwiązując te modele otrzymujemy dla gracza 1 optymalną strategię mieszaną x 1 = 7 11, x 2 = 4 11 iwartośćgry w = x 3 = 2 11.Dlagracza2 mamy y1 = 0, y2 = 5 11, y 3 = 6 11 oraz w = y 4 = 2 11.Torozwiązanie można otrzymać z rozwiązania modelu dla gracza 1 dlatego wystarcza rozwiązać tylko jeden z tych modeli, aby otrzymać strategie optymalne dla obu graczy. Rozwiązania zostały otrzymane przy założeniu,że

A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 41 w 0.Jeśliniejestspełnionetozałożenie,tomodelmożeniemieć rozwiązania dopuszczalnego. Aby tego uniknąć dodajemy do macierzy wypłat stałą 3 i odpowiednio modyfikujemy ograniczaenia. Po rozwiązaniu tylko wartość gry zmnieszamy o 3.