1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów

Podobne dokumenty
1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów

Analiza decyzyjna(ad): tablica decyzyjna, klasyfikacja

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

A. Kasperski, M. Kulej Badania Operacyjne- programowanie liniowe 1

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

11. Gry Macierzowe - Strategie Czyste i Mieszane

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Elementy teorii gier. Badania operacyjne

PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI

Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?

Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 2

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Czym jest użyteczność?

8. Podejmowanie Decyzji przy Niepewności

ZAGADNIENIE TRANSPORTOWE(ZT)

Zagadnienie transportowe

Programowanie celowe #1

Wielokryteriowa optymalizacja liniowa

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

ZAGADNIENIE TRANSPORTOWE

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1

Wyznaczanie strategii w grach

Optymalizacja decyzji

Problemy oceny alternatyw w warunkach niepewności

Ubezpieczenia majątkowe

Gry o sumie niezerowej

Podejmowanie decyzji w warunkach niepełnej informacji. Tadeusz Trzaskalik

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Badania operacyjne i teorie optymalizacji

Gry z naturą 1. Przykład

Mikroekonomia II: Kolokwium, grupa II

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Standardowe zadanie programowania liniowego. Gliwice 1

Elementy Modelowania Matematycznego

Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:

Definicja problemu programowania matematycznego

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Układy równań i nierówności liniowych

Badania operacyjne. te praktyczne pytania, na które inne metody dają odpowiedzi jeszcze gorsze.

METODA SYMPLEKS. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski

Notatki do tematu Metody poszukiwania rozwiązań jednokryterialnych problemów decyzyjnych metody dla zagadnień liniowego programowania matematycznego

Metoda simpleks. Gliwice

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

Programowanie liniowe

Rozdział 1 PROGRAMOWANIE LINIOWE

Programowanie liniowe

10. Wstęp do Teorii Gier

Elementy Modelowania Matematycznego

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

A. Kasperski, M. Kulej, Badania operacyjne, Wykład 4, Zagadnienie transportowe1

Metody systemowe i decyzyjne w informatyce

Formy kwadratowe. Rozdział 10

Optymalizacją wielokryterialną nazwiemy próbę znalezienia wektora zmiennych decyzyjnych: x = [x 1

Wykład z modelowania matematycznego. Zagadnienie transportowe.

PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM. cz. 6. dr BOŻENA STARUCH

Metoda graficzna może być stosowana w przypadku gdy model zawiera dwie zmienne decyzyjne. Metoda składa się z dwóch kroków (zobacz pierwszy wykład):

Programowanie liniowe

Wielokryteriowa optymalizacja liniowa cz.2

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

Weryfikacja hipotez statystycznych

doc. dr Beata Pułska-Turyna Zarządzanie B506 mail: mgr Piotr J. Gadecki Zakład Badań Operacyjnych Zarządzania B 505.

Baza w jądrze i baza obrazu ( )

Krzywe Freya i Wielkie Twierdzenie Fermata

TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w

ZAGADNIENIE DUALNE Rozważmy zagadnienie liniowe(zagadnienie to nazywamy prymalnym) o postaci kanonicznej:

Programowanie liniowe całkowitoliczbowe. Tadeusz Trzaskalik

Podejmowanie decyzji w warunkach ryzyka. Tomasz Brzęczek Wydział Inżynierii Zarządzania PP

Programowanie liniowe

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

PROGRAMOWANIE KWADRATOWE

2010 W. W. Norton & Company, Inc. Oligopol

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Programowanie liniowe. Tadeusz Trzaskalik

Rozpoznawanie obrazów

TOZ -Techniki optymalizacji w zarządzaniu

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

O MACIERZACH I UKŁADACH RÓWNAŃ

Wnioskowanie bayesowskie

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

III. Układy liniowe równań różniczkowych. 1. Pojęcie stabilności rozwiązań.

Programowanie nieliniowe

Zadania 1. Czas pracy przypadający na jednostkę wyrobu (w godz.) M 1. Wyroby

RÓWNANIA RÓŻNICZKOWE WYKŁAD 2

Schemat programowania dynamicznego (ang. dynamic programming)

13 Układy równań liniowych

ZAGADNIENIA PROGRAMOWANIA LINIOWEGO

Rozwiązanie Ad 1. Model zadania jest następujący:

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne.

1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów

Transkrypt:

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 1 1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów W celu formalizacji i klasyfikacji problemów decyzyjnych wprowadzimy tzw tablicę decyzyjną. Niech decydent(lub grupa decydentów) ma osiągnąć pewien cel(np. zysk z uprawy swojego pola). Aby go osiągnąć podjmuje pewne działania, które nazywamy strategiami, alternatywami decyzyjnymi lub decyzjami. Zakładamy, żeilośćtychdziałańjest midziałaniateoznaczymy a 1, a 2,...,a m. Podejmując dane działanie jego wynik zależy od zewnętrznych dla decydenta n czynników, które nazywamy stanami natury i oznaczamyprzez θ 1, θ 2,...,θ n.pełnyopiskonsekwencjidla decydentapodjęciadziałania a i wsytuacji,gdywystąpistannatury θ j oznaczaćbędziemyprzez X ij izapisujesięwpostacinastępującej tablicy decyzyjnej:

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 2 Alternatywy Stany natury decyzyjne θ 1 θ 2... θ a 1 X 11 X 12... X 1n a 2 X 21 X 22... X 2n....... a m X m1 X m2... X mn Tab. 1: Ogólna postać tablicy decyzyjnej Przykład 1. Rozważmy osobę, która ma przygotować omlet z 6 jajek.właśniewbiłajużdomiski5jaj,któreokazałysiędobrymii zastanawia się co zrobić z szóstym jajkiem, które może być albo dobre albo zepsute. Tablica 2 podaje możliwe sposoby działania i opis konsekwencji tych działań.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 3 Alternatywy Stan natury decyzyjne jajko dobre jajko zepsute zbićjajkodomiski omletz6jaj niemaomletu i 5 jajek zniszczonych zbićjajkodo omletz6jaj omletz5jajek doinnegonaczynia inaczyniedoumycia inaczyniedoumycia wyrzucić jajko omlet z 6 jajek i jedno jajko zniszczone omlet z 5 jajek Tab. 2: Pełny opis konsekwencji problemu decyzyjnego przygotowanie omletu W analizie decyzji stosuje się tablice decyzyjne w których zamiast pełnegoopisukonsekwencji X ij używasięmiarywartości

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 4 konsekwencji v(x ij )oznaczanejdalejprzez v ij dla i = 1,...,m; j = 1,...,ninazywanejdalejużytecznością.Miarata powinnaspełniaćwarunek,że v ij > v kl,gdydladecydentabardziej sprzyjającesąkonsekwencje X ij niżkonsekwencje X kl (mówisię również,żedecydentpreferujekonsekwencje X ij wstosunkudo konsekwencji X kl ).Dlategodalejbędąużywanetablicedecyzyjnew których konsekwencje zostaną zastąpione użytecznością. Postać taką podano w tablicy 3.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 5 Alternatywy Stany natury decyzyjne θ 1 θ 2... θ a 1 v 11 v 12... v 1n a 2 v 21 v 22... v 2n........... a m v m1 v m2... v mn Tab. 3: Postać ogólna tablicy decyzyjnej, w której konsekwencje zastąpiono użytecznością 1.1 Typy problemów decyzyjnych Wyróżnia się trzy typy problemów decyzyjnych:

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 6 Problemy decyzyjne w warunkach pewności. Występuje tylko jeden stan natury, którego wystąpienie jest pewne- tablica decyzyjna ma tylko jedną kolumnę. Problemy decyzyjne w warunkach ryzyka. Znane jest prawdopodobieństwo wystąpienia każdego stanu natury. Dla dyskretnychstanównatury θ 1, θ 2,...,θ n prawdopodobieństwa ichwystąpieniaoznaczamyprzez P(θ 1 ), P(θ 2 ),...,P(θ n ). Problemy decyzyjne w warunkach niepewności. Znane są sposoby postępowania decydenta i potrafimy zidentyfikować wszystkie możliwe stany natury ale nie wiemy nic o prawdziwym stanie natury. W zależności od typu problemu decyzyjnego stosowane są różne kryteria wyboru decyzji optymalnej(rozwiązania optymalnego).

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 7 1.2 Kryteria wyboru decyzji w warunkach pewności W problemach w warunkach pewności decyzją optymalną jest alternatywa o najbardziej sprzyjającej dla decydenta wartości użyteczności(co sprowadza się do wyboru elementu maksymalnego lub minimalnego w tablicy decyzyjnej o jednej kolumnie). 1.3 Kryteria wyboru decyzji w problemach w warunkach ryzyka W problemach w warunkach ryzyka racjonalne kryterium wyboru optymalnej decyzji polega na wyborze takiej alternatywy decyzyjnej a k,któramaksymalizuje(lubminimalizuje,gdyużytecznośćjest

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 8 kosztem) wartość średnią użyteczności tj. n j=1 P(θ j )v kj = m max i=1 n P(θ j )v ij Przykład 2. Sprzedawca truskawek kupuje na plantacji koszyczek truskawek za 3zł. a sprzedaje za 8zł. Sprzedany koszyk przynosi mu zatem 5zł. zysku a nie sprzedany stratę 3zł. Z doświadczenia wie, że dziennypopytmożewynosić10,11,12lub13koszyczków.z90 obserwacji, które zgromadził wie, że w 18 przypadkach dzienny popyt kształtowałsięnapoziomie10,w36napoziomie11,w27na poziomie12iw9napoziomie13koszyczków.jeśliprzez a i oznaczymy alternatywę zakup na plantacji 10 + (i 1) koszyczków truskawek,przez θ i -popytdziennynapoziomie 10 + (i 1) (i = 1, 2, 3, 4)koszyczkówaużytecznościąbędziedziennyzysk sprzedawcy, to tablicą decyzyjną jest tablica 4. j=1

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 9 Zysk θ 1 θ 2 θ 3 θ 4 EV (a i ) a 1 50 50 50 50 50 a 2 47 55 55 55 53.4 a 3 44 52 60 60 53.6 a 4 41 49 57 65 51.4 Rozkład 0.2 0.4 0.3 0.1 Tab. 4: Tablica decyzyjna sprzedawcy truskawek Wtejtablicy EV (a i )oznaczawartośćśredniąużyteczności alternatywy a i.decyzjąoptymalnąjestwybóralternatywy a 3,która dajemaksymalnyoczekiwanyzyskwynoszący EV (a 3 ) = 53.6.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 10 Niech X będzie dyskretną zmienną losową rozkładu stanów natury (tj. wielkości popytu na truskawki w problemie sprzedawcy truskawek)przyjmującąwartości q, q + 1,...,Qorozkładzie P(x)dla x = q, q + 1,...,Qidystrybuancie F(x) = P(X x).wartość średniaużytecznościalternatywy a i,jestwartościąśredniąfunkcji zmiennejlosowej X.Oznaczmyprzez d(z), z = q, q + 1,...,Qwartość średnią zysku sprzedawcy, gdy zakupił na plantacji z koszyczków truskawek(tj. EV (a i ) = d(z),gdzie z = 10 + i 1, i = 1, 2, 3, 4). Oznaczmy przez a zysk jaki osiąga sprzedawca z jednego sprzedanego koszyczka a przez b stratę na jednym nie sprzedanym koszyczku(dla rozpatrywanego przykładu a = 5, b = 3). Załóżmy, że sprzedawca zakupił z 1koszyczków(jegośrednizyskwynosi d(z 1)). Dokupienie dodatkowo jednego koszyczka truskawek przyniesie stratę b jeśli popyt x będzie x z 1. Prawdopodobieństwo tego zdarzenia wynosi P(X z 1).Natomiastprzyniesiezysk ajeślipopyt x

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 11 będzie x > z 1.Tozdarzeniemaprawdopodobieństwo 1 F(z 1). Mamy zatem rekurencyjny wzór: d(z) = d(z 1) + a[1 F(z 1)] bf(z 1) = d(z 1) + a (a + b)f(z 1) (z = q + 1, q + 2,...,Q.) Dla z = qmamy d(q) = aq. Dla sprzedawcy truskawek mamy: EV (a 1 ) = d(z = 10) = 5 10 = 50 EV (a 2 ) = d(11) = d(10) + 5 (5 + 3)F(10) = 50 + 5 8 2 10 = 53.4 EV (a 3 ) = d(12) = d(11) + 5 8F(11) = 58.4 8 6 10 = 53.6 EV (a 4 ) d(13) = d(12) + 5 8F(12) = 58.6 8 9 10 = 51.4 Optymalną strategię można również wyznaczyć wzorem

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 12 analitycznym. Jeśli strategią optymalną jest wybór alternatywy polegającejnazakupie k koszyczków,tozwłasnościmaksimum lokalnego mamy, że d(k ) d(k 1) F(k 1) a a + b d(k ) d(k + 1) a a + b F(k ) Stąd mamy F(k 1) a a + b F(k ) Wartość k spełniającatęnierównośćjestoptymalnądecyzją.ten ostatni sposób wyznaczania alternatywy optymalnej jest najoszczędniejszy. Dla sprzedawcy truskawek mamy a a + b = 5 3 + 5 = 0.425 i 0.4 = F(11) 0.425 F(12) = 0.9, czylioptymalnąalternatywąjestzakup12koszyczków (k = 12).

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 13 W problmach w warunkach ryzyka wprowadza się pojęcie oczekiwanej wartości pewnej informacji(evpi). Sposób jej obliczania podamy na przykładzie problemu sprzedawcy truskawek. Załóżmy, że sprzedawca może z całą pewnością przewidzieć zajście danego stanu natury(ma pewną prognozę odnośnie stanów natury). Wtedypowinienwybieraćalterntywę a 1 dlastanu θ 1, a 2 dla θ 2, a 3 dla θ 3 i a 4 dla θ 4.Ponieważznarozkładprawdopodobieństwastanów natury, to wartość oczekiwana użyteczności wyniesie wtedy: 50 0.2 + 55 0.4 + 60 0.3 + 65 0.1 = 56, 5. Bez znajomości tej prognozy wartość oczekiwana zysku wynosi 53,6. Różnica 56.5-53.6=2.9 definiuje oczekiwaną wartość pewnej informacji, czyli EVPI=2.9. Wartość tę możemy interpretować jako maksymalną kwotę, którą można wydać za pewną prognozę.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 14 1.4 Kryteria wyboru decyzji w warunkach niepewności Danajesttablicadecyzyjnadlaproblemuzfunkcjąużyteczności v ij (funkcją tą może być zysk lub koszt). Kryterium Walda- wybór alternatywy dla której najmniej sprzyjający rezultat jest dla decydenta najkorzystniejszy (maksymalizacjaminimalnegozysku,gdyużyteczność v ij jest zyskiem).dlakażdejalternatywy a i, i = 1,...,mwyznaczasię dwiewielkości:najbardziejsprzyjającydladecydentarezultat o i oraznajmniejsprzyjającyrezultat s i.jeśliużyteczność v ij jest zyskiem,to o i = max{v ij }oraz s i = min{v ij } j j

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 15 natomiast,gdyużyteczność v ij jestkosztem,to o i = min{v ij }oraz s i = max{v ij }. j j Decyzjąoptymalnąjestalternatywa a k taka,że lub s k = max i s i = max i min j {v ij }jeśli v ij jestnp.zyskiem s k = min i s i = min i max{v ij }jeśli v ij jestnp.kosztem j Kryterium to jest najbardziej konserwatywne- decydent wybiera alternatywę, w której najgorszy(najmniej sprzyjający) rezultat będzie dla niego najkorzystniejszy spośród wszystkich alternatyw. Nie wszyscy decydenci wykazują taką postawę względem ryzyka. Niektórzy decydenci mogą preferować alternatywy dla których najbardziej sprzyjający rezultat jest

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 16 najkorzystniejszytj,wybieraćalternatywę a k dlaktórej o k = max i o i = max i max{v ij } j Większość decydentów wykazuje mniej skrajne postawy. Kryterium następne(hurwicza) zakłada, że postawę decydenta wykazywaną we wszystkich problemach można scharakteryzować przez pewien współczynnik(nazywany współczynnikiem ostrożności). Kryterium Hurwicza- wybór alternatywy o najkorzystniejszej dla decydenta średniej ważonej z najmniej i najbardziej sprzyjającegorezultatu(maksymalizacja-gdy v ij jestzyskiemśredniej ważonej z najmniej i najbardziej sprzyjającego rezultatu).jeśli v ij jestzyskiem,todecyzjąoptymalnąjest

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 17 alternatywa a k taka,że αs k +(1 α)o k = max{αs i +(1 α)o i } = max{α min{v ij }+(1 α) max{v ij }}, i i j j gdzie α jest współczynnikiem charakteryzującym decydenta. Dla α = 1 kryterium jest identyczne z kryterium Walda, czyli jest najbardziej zachowawczym, dla α = 0 mamy najbardziej optymistyczne kryterium. Wartości α z przedziału(0,1) pozwalająnamodelowaniepostawpośrednich.jeśli v ij jest kosztem,todecyzjąoptymalnąjestalterntywa a k taka,że αs k +(1 α)o k = min{αs i +(1 α)o i } = min{α max{v ij }+(1 α) min{v ij }}. i i j j Kryterium Savage a- minimalizacja maksymalnego żalu. Na podstawietablicydecyzyjnej [v ij ]konstruujesięnowątablicę [r ij ]następująco:

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 18 r ij = max m l=1 {v ij} v ij v ij min m l=1{v ij } jeśli v ij jestzyskiem, jeśli v ij jestkosztem. Element r ij tejtablicyjestróżnicąpomiędzyużytecznością najlepszej decyzji jaką należałoby podjąć przy wystąpieniu stanu θ j apodjętądecyzją(dla v ij zysku)imożebyćinterpretowany jako żal zniepodjęcianajlepszejdecyzji.wtablicy r ij do wyboru decyzji optymalnej stosuje się kryterium Walda(dla kosztów).decyzjąoptymalnąjest a k takie,że s k = min{s i } = min{max{r ij }}. i i j Kryterium Laplace a(1825)- maksymalizacja(lub minimalizacja, gdy użyteczność jest kosztem) wartości średniej. Optymalną

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 19 decyzjąjestwybórtakiejalternatywy a k,że n j=1 1 n v kj = max m { n i=1 j=1 1 n v ij}. Przykład 3. Ośrodek wczasowy przygotowuje zapasy żywności na nadchodzącyweekend.możliwestanynatury θ 1, θ 2, θ 3, θ 4 odpowiadają odpowiednio przyjazdowi 100, 150, 200 i 250 turystów. Alternatywy decyzyjnyme a 1, a 2, a 3, a 4 toprzygotowanie(zakup)zapasówdla odpowiednio100,150,200i250turystów.użyteczność v ij będąca kosztemzwiązanymzpodjęciemalternatywy a i iwystąpieniemstanu θ j podanajestwtablicy5.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 20 v ij θ 1 θ 2 θ 3 θ 4 s i o i a 1 5 10 18 25 25 5 a 2 8 7 8 23 23 7 a 3 21 18 12 21 21 12 a 4 30 22 19 15 30 15 Tab. 5: Tablica decyzyjna dla ośrodka wczasowego Optymalną decyzją stosując kryterium Walda jest wybór alternatywy a 3,dlakryteriumHurwicza,gdywspółczynnik α = 0.5alternatywą optymalnąjest a 4.DlakryteriumSavage amusimynajpierw wyznaczyćtablicę r ij,którąpodanowtablicy6.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 21 r ij θ 1 θ 2 θ 3 θ 4 s i a 1 0 3 10 10 10 a 2 3 0 0 8 8 a 3 16 8 4 6 16 a 4 25 12 11 0 25 Tab.6:Tablicawartości [r ij ]dlaośrodkawczasowego Decyzjąoptymalnąjestwtymprzypadkuwybóralternatywy a 2. 2 Drzewadecyzyjne Do analizy problemów decyzyjnych szczególnie w sytuacjach, gdy mamy do czynienia z decyzjami wieloetapowymi szczególnie stosuje

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 22 się tzw. drzewa decyzyjne. Ich definicję i zastosowanie podamy na przykładzie. Przykład 4. Inwestor T.B. Puckett nabył firmę produkującą materiały tekstylne. Teraz zastanawia się nad przyszłością tej firmy. Rozważa trzy warianty decyzji: 1. Rozbudować fabrykę i produkować lekkie, trwałe materiały, przeznaczone na rynek wojskowy, na którym nie ma dużej zagranicznej konkurencji. 2. Utrzymać ststus quo, nadal produkując materiały tekstylne, w której to branży istnieje ostra zagraniczna konkurencja. 3. Natychmiast sprzedać fabrykę. W przypadku wyboru jednego z pierwszych dwóch wariantów decyzji fabryka zostanie sprzedana po roku. Zysk ze sprzedaży fabryki po roku zależyodwarunkównarynkuzagranicznymiodlosówustawyo

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 23 embargu handlowym. Sytuacja decyzyjna jest przedstawiona w tabeli decyzyjnej 7. Decyzja Stany natury Dobre warunki na Złe warunki na rynku zagranicznym rynku zagranicznym Rozbudować 800000zł. 500000zł. Utrzymać stan obecny 1300000zł. -150000zł. Sprzedać natychmiast 320000zł. 320000zł. Tab. 7: Tablica decyzyja firmy Puckett Rozważany problem możemy zapisać w postaci drzewa decyzyjnego(rys. 2), w którym wyróżniamy węzły: decyzyjne (oznaczone kwadratem), losowe(oznaczone większymi kółkami) oraz

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 24 końcowe(oznaczone małymi kólłkami). Z węzła decyzyjnego 1 wychodzą3krawędziedowęzłówlosowych2,3i4.krawędziete oznaczają alternatywy decyzyjne. Z każdego węzła losowego wychodzą dwie krawędzie odpowiadające możliwym stanom natury tj. dobrym z prawdopodobieństem 0.7 i złym z prawdopodobieństwem 0,3 warunkom na rynkach zagranicznych. Węzły końcowe mają przypisane wartości zysku odpowiadającego sytuacji, gdy decydent podejmie jakąś decyzję i zajdzie określany stan natury. Liczby przy węzłach losowych są wartościami oczekiwanymi zysku przy wyborze przez decydenta odpowiedniej decyzji. Z drzewa decyzyjnego możemy odczytać, że decyzją optymalna dla pana Packetta jest wybór alternatywy zachować stan obecny, która daje mu oczekiwany zysk wynoszacy 865000zł.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 25 Dobre warunki(0.7) 710000zł. 800000zł. 2 Złe warunki(0.3) 500000zł. Rozbudować 1 Status quo Dobre warunki(0.7) 1700000zł. 3 865000zł. -150000zł. Złe warunki(0.3) Sprzedać Dobre warunki(0.7) 320000zł. 4 320000zł. 320000zł. Złe warunki(0.3)

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 26 Rozważymy teraz sytuację, gdy w problemie decyzyjnym oprócz danych prawdopodobieństw stanów, które nazywa się prawdopodobieństwami a priori dysponujemy dodatkowymi informacjami tzw. prawdopodobieństwami a posteriori. W rozważanym poprzednio problemie załóżmy, że pan Packett wynajął firmę kosultingową do opracowania raportu o politycznej i rynkowej sytuacji w przyszłości. Raport będzie albo pozytywny(p) albo negatywny(n), wskazując na dobre(g) albo złe(p) przyszłe warunki na rynku zagranicznym. Warunkowe prawdopodobieństwa uzyskania każdej z ocen stanu rynku przy danych stanach natury są następujące: Pr(P/g) = 0.7 Pr(N/g) = 0.3; Pr(P/p) = 0.2, Pr(N/p) = 0.8. Te prawdopodobieństwa warunkowe pozwalają wyznaczyć

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 27 (korzystając ze wzoru Bayes a) prawdopodobieństwa a posteriori. Pr(g/P) = = P r(p/g)p r(g) Pr(P/g)Pr(g) + Pr(P/p)Pr(p) (0.7)(0.7) (0.7)(0.7) + (0.2)(0.3) (1) (2) = 0.891 (3) P r(p/p) = 0.109 (4) Pr(g/N) = = P r(n/g)p r(g) Pr(N/g)Pr(g) + Pr(N/p)Pr(p) (0.3)(0.7) (0.3)(0.7) + (0.8)(0.3) (5) (6) = 0.467 (7) P r(p/n) = 0.533. (8) Znajomość tych prawdopodobieństw pozwala na skonstruowanie

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 28 drzewa decyzyjnego z prawdopodobieństwami a posteriori i przeprowadzenie analizy w celu wyznaczenia strategii optymalnej. Nowe drzewo decyzyjne ma węzeł początkowy(jest to węzeł losowy) 1, z którego wychodzą dwie krawędzie odpowiadającę dwóm możliwym stanom natury(raport pozytywny lub negatywny). Następniemamydwawęzłydecyzyjne2i3zktórychwychodząpo trzy krawędzie odpowiadające decyzjom, jakie decydent może podjąc. Krawędzieteprowadządowęzłówlosowych4,5,6,7,8i9,zkażegoz nich wychodzą po dwie krawędzie(odpowiadające dwóm stanom natury) do węzłów końcowych. Drzewo decyzyjne wraz wartościami oczekiwanych wypłat(zysku) dla węzłów podaje rys. 2.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 29 2 Pozytywny Pr(P)=0.55 1 1141850 916117.5 Rozbudowa Sprzedaz Status quo 767300 1141950 320000 4 5 6 Pr(g/P)=0.891 Pr(p/P)=0.109 Pr(g/P)=0.891 Pr(p/P)=0.109 Pr(g/P)=0.891 Pr(p/P)=0.109 800000 500000 1300000 150000 320000 320000 Pr(N)=0.45 Negatywny 640100 3 Rozbudowa Status quo 640000 527150 7 8 Pr(g/N)=0.467 Pr(p/N)=0.533 Pr(g/N)=0.467 Pr(p/N)=0.533 800000 500000 1300000 150000 Sprzedaz 320000zł. 9 Pr(g/N)=0.467 Pr(p/N)=0.533 320000 320000

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 30 Z analizy dzrzewa możemy odczytać strategię optymalną. Jeśli raport będzie pozytywny, to decydent powinien wybrać alternetywę Statu quo, która przyniesie mu największy oczekiwany zysk 1141950zł. Natomiast w przypadku otrzymania rapotru negatywnego powinien wybrać alternatywę Rozbudować, dla której oczekiwany zysk wynosi 640100zł. Takie postępowanie jest optymalne, decydent w ten sposób zapewnia sobie oczekiwany zysk wynoszący 916117.5zł. Bez dodatkowej informacji(znajomości prawdopodobieństw a posteriori) jego oczekiwany zysk wynosi tylko 865000zł. 3 Gry dwuosobowe o sumie zerowej W poprzednio rozpatrywanych sytuacjach decyzyjnych na efekty działań decydenta miały wpływ stany natury. Obecnie zajmiemy się sytuacjami, gdy na działania decydenta ma wpływ nie natura, którą

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 31 możemy traktować jako pasywnego oponenta lecz inny racjonalnie działający decydent. W teorii gier obu decydentów nazywamy graczami. Zajmować się będziemy tylko grami dwuosobowymi o sumie zerowej. W takich grach podejmowane przez obu graczy decyzje nazywane sa strategiami. Efekt(użyteczność) podjęcia strategii i przez jednego gracza, gdy drugi gracz wybrał strategię j nazywa się wypłatą i oznaczamy przez [w ij ], i = 1,...,m; j = 1,...,n.Wgrachosumiezerowypłata (wygrana) dla jednego gracza jest równa przegranej drugiego. Przykład5.Mamydwóchgraczy:gracza1igracza2.Każdyznich dysponuje trzema strategiami 1,2 i 3. Macierz wypłat podaje tabela 8

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 32 Macierz wypłat Gracz 2 Strategie 1 2 3 1 1 2 4 Gracz1 2 1 0 5 3 0 1-1 Tab.8:Macierzwypłatgry1 Macierz wypłat tej gry jest dość specyficzna i rozwiązanie otrzymamy wykorzystując koncepcję strategii zdominowanych. Mówimy, że strategia i jest zdominowana przez strategię k jeśli strategia k jest co najmniejtakdobrajak i(aczasamilepsza),bezwzględunato,co zrobi oponent(drugi gracz). Formalnie strategię i będziemy nazywać

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 33 strategią zdominowaną przez strategię k, jeśli j=1,...,n w ij w kj oraz l w il < w kl. Natomiast k nazywamy strategią dominującą, jeśli: j=1,...,n w kj = max{w ij }. i Strategie, które nie są zdominowane przez inne strategie nazywamy strategiami niezdominowanymi. Racjonalnie działający decydent będzie dokonywał wyboru spośród strategii niezdominowanych. Strategia 3 jest dla gracza 1 zdominowaną przez strategię 1, gdyż bez względu na to jaką strategię wybierze gracz 2 wypłata gracza 1 jest przy wyborze strategii 3 nie niższa niż wypłata przy wyborze strategii 1. Zatem wiersz trzeci odpowiadający strategii zdominowanej możemy skreślić z macierzy wypłat. Zredukowana macierz wypłat jest podana w tablicy 9.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 34 1 2 3 1 1 2 4 2 1 0 5 Tab. 9: Zredukowana macierz gry11 Ponieważ zakładamy racjonalność obu graczy, to gracz 2 też ma strategię zdominowaną 3. Jest ona zdominowana zarówno przez strategię1jakiprzezstrategię2.eliminujemystrategię3gracza2co daje macierz wypłat 10: 1 2 1 1 2 2 1 0 Tab. 10: Zredukowana macierz gry12

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 35 Teraz strategia 2 dla gracza 1 jest zdominowana przez strategię 1. Eliminując zdominowaną strategię mamy macierz wypłat podaną w tablicy 11: 1 2 1 1 2 Tab. 11: Zredukowana macierz gry13 Strategia 2 dla gracza 2 jet zdominowana przez strategię 1 zatem powinna być wyeliminowana. Ostatecznie obaj gracze powinni wybierać strategie 1. Gracz 1 otrzyma wtedy wypłatę 1, ta wartość jest przegraną gracza 2. Jest to wartość gry. Jeśli wartość gry jest 0, to nazywa się grą sprawiedliwą(rozważana gra nie jest grą sprawiedliwą, gdyż jej wartość wynosi 1). Koncepcja zdominowanych strategii pozwala na redukcję wymiaru macierzy wypłat i w

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 36 niektórych przypadkach pozwala wyznaczyć rozwiązanie gry. Jednak w większości przypadków potrzebujemy innego podejścia, które zaprezentjemy na dwu kolejnych przykładach. Przykład 6. Rozpatrzymy teraz grę o macierzy wypłat podanej w tablicy 12

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 37 Macierz wypłat Gracz 2 Strategie 1 2 3 Minimum 1-3 -2 6-3 Gracz1 2 2 0 2 0 max 3 5-2 -4-4 Maximum 5 0 6 min Tab.12:Macierzwypłatgry2 Wtejgrzegracz1stosującstrategię1możewygrać6alemoże

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 38 również przegrać 3(wypłata-3). Stosując strategię 3 może wygrać 5 ale może przegrać 4. Natomiast w strategii 2 jego wygrana bez względu natocozrobigracz2będzieconajmniej0.analizującstrategiedla gracza2mamy,żewstrategiach1i3jegomaksymalnaprzegrana wynosiodpowiednio5i6.natomiastwstrategii2tylkozero.obaj gracze powinni zatem wybrać strategię 2, gdyż każdemu z nich zapewnia ona w najgorszym przypadku najlepszy wynik. Jest to tzw. kryterium minimaksowe standardowo proponowane w teorii gier do wyboru strategii optymalnej. Według tego kryterium gracz 1 powinien wybrać strategię,dla której minimalna wypłata jest największa(tj. max i min j {w ij })agracz2strategiędlaktórej maksymalna wypłata gracza 1 jest jest najmniejsza(tj. min i max j {w ij }).Wanalizowanymprzykładziestrategią max minjest strategia2gracza1astrategią min maxjeststrategia2dlagracza 2.Wartośćgryjestrówna0,czylijesttograsprawiedliwa.Wtejgrze

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 39 tensamelementmacierzywypłat(w 22 = 0)jestjednocześnie wartością max min i wartością min max, czyli mamy element, który jest najmniejszy w wierzsu i jednocześnie największy w kolumnie. Taki punkt, jesli istnieje, nazywa się punktem siodłowym. Jesli gra ma punkt siodłowy, to obaj gracza powinni do wyboru strategii optymalnej stosować odpowiednio max min i min max strategie. Jednakniekażdagraposiadapunktsiodłowy-takąjestnp.gra3.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 40 Macierz wypłat Gracz 2 Strategie 1 2 3 Minimum 1 0-2 2-2 max Gracz1 2 5 4-3 -3 3 2 3-4 -4 Maximum 5 4 2 min Tab.13:Gra3-niemapunktusiodłowego W rozważanej poprzednio grze wartości

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 41 max i min j w ij = 2 2 = min i max j w ij niesąrównecooznacza,że gra nie posiada punktu siodłowego. W tej grze informacja o tym jaką strategię wybierze jeden z graczy pozwala drugiemu poprawić swoją pozycję. Koncepcja rozwiazania optymalnego w tego typu grach oparta jest na pojęciu strategii miesznych, które charakteryzują się tym, że żaden z graczy nie może wydedukować jaką strategię użyje oponent. 3.1 Strategie mieszane dla gry bez punktu siodłowego Dla gier nie posiadających punktu siodłowego dla każdego z graczy wyznacza się rozkłady prawdopodobieństwa na zbiorach ich strategii.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 42 Niech: x i = prawdopodobieństwo,żegracz1użyjestrategiii(i = 1,...,m), y j = prawdopodobieństwo,żegracz2użyjestrategiij(j = 1,...,n), gdzie m i=1 x n i = 1, j=1 y j = 1.Wartości x i, i = 1,...,moraz y j, j = 1...,nnazywamystrategiamimieszanyminatomiast oryginalne strategie strategiami czystymi. W trakcie gry każdy z graczy wybiera strategię czystą jednak powinien wybierać ją w pewienlosowysposóbzgodnyzrozkładem (x 1, x 2,...,x m )dlagracza 1irozkładem (y 1, y 2,...,y n )dlagracza2.np.jesli (x 1, x 2, x 3 ) = ( 1 2, 1 2, 0)a(y 1, y 2, y 3 ) = (0, 1 2, 1 2 ),togracz1nie powinien wybierać strategii czystej 3 a wybór strategii 2 lub 3 rozstrzygnąć rzucając monetą. Analogicznie gracz 2 nie powinien wybierać czystej strategii 1 a wybór pomiędzy strategiami 2 i 3 rozstrzygnąć rzucając monetą. Przy stosowaniu strategii mieszanych

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 43 przez każdego z graczy oczekiwaną wygraną gracza 1 jest m n Oczekiwana wypłata gracza 1 = w ij x i y j, gdzie w ij jestwypłatąjeśligracz1używaczystejstrategii iagracz2 używa czystej strategii j. W rozpatrywanej poprzednio grze 3 jeśli gracze 1 i 2 stosują odpowiednio strategie mieszane (x 1, x 2, x 3 ) = ( 1 2, 1 2, 0)i(y 1, y 2, y 3 ) = (0, 1 2, 1 2 )tooczekiwanawypłata gracza1wynosi 1 4 ( 2 + 2 + 4 3) = 1 4.Minimaksowe(min max) ktyterium dla strategii mieszanych mówi, że gracz powinien wybierać strategię mieszaną, która minimalizuje jego maksymalne oczekiwane straty. Równoważnie, jeśli rozważamy wygraną gracza 1(a nie przegraną gracza 2 co jest równoważne) to kryterium to jest maksyminowe(max min), tj. maksymalizuje się minimalną oczekiwaną wypłatę gracza 1. Przez minimalną oczekiwaną wypłatę rozumie się najmniejszą możliwą wypłatę, którę można uzyskać przy i=1 j=1

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 44 dowolnej strategii miesznej, podjętej przez oponenta. Zatem mieszna strategia dla gracza 1 jest optymalną, jeśli minimalna oczekiwana wypłata jest maksymalna. Wartość tą oznaczamy przez w. Dla gracza 2 podobnie optymalną strategią mieszaną jest strategia, która minimalizuje maksymalną oczekiwaną wartość przegranej. Wartość tę oznacza się przez w. Dla gier nie posiadających punktu siodłowego jeśli tylko rozpatruje się czyste strategie, to nie ma rozwiązania stabilnego. Zachodzi wtedy nierówność w < w i gracze mogą zmieniać strategie, aby poprawić swoją pozycję. Dla strategii mieszanych koniecznym warunkiem, aby rozwiązanie optymalne było stabilne jest równość w = w.wgrachosumiezerowejtenwarunekjestzawsze spełniony. Twierdzenie 1. Para strategii miesznych dla graczy jest optymalną dając stabilne rozwiązanie przy kryterium minimaksowym,(min max), gdy w = w = w.stosująctestrategieżadenzgraczyniemoże

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 45 poprawić swojej pozycji zmieniając jednostronnie swoją strategię. 3.2 Zastosowanie programowania liniowego do wyznaczenia rozwiazania gry Rozwiązanie dowolnej gry w strategiach miesznych można wyznaczyć rozwiazując pewne zagadnienie programowania liniowego. Rozważymy najpierw jak wyznaczyć optymalną strategię mieszaną gracza 1. Oczekiwana wypłata gracza 1 = m i=1 n w ij x i y j, j=1

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 46 istrategia (x 1, x 1,...,x m )jestoptymalnąjeśli m i=1 n w ij x i y j w = w j=1 dlakażdejstrategii (y 1, y 2,...,y n )gracza2.tanierównośćmusi równieżzachodzićdlaczystychstrategiitj. (y 1, y 2,...,y n )takich,że jednawspółrzędna y j = 1aresztajestzerami.Zatemmamy: m w ij x i wdla j = 1,...,n. i=1 Co więcej ten zbiór nierówności implikuje wyjściową nierówność: n m y j ( w ij x i ) j=1 i=1 n y j w = w, i=1

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 47 ponieważ n j=1 y j = 1.Spełnienietychnnierównościjestrównoważne spełnieniuwyjściowejnierównościdlakażdejstrategii y 1, y 2,...,y n. Wyznaczenie optymalnej strategii może być zatem sprowadzone do rozwiązania następującego zagadnienia programowania liniowego: x m+1 max w 11 x 1 + w 21 x 2 +, +w m1 x m x m+1 0 w 12 x 1 + w 22 x 2 +, +w m2 x m x m+1 0 w 1n x 1 + w 2n x 2 +, +w mn x m x m+1 0 x 1 + x 2 + + x m = 1 x i 0,dla i = 1, 2,...,m. Zmienna x m+1 zastępujenieznanąwartość wiwrozwiązaniu optymalnym będzie jej równa. Jednak na tę zmienną nie jest

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 48 nałożony warunek nieujemności. Analogiczne rozumowanie prowadzi do następującego modelu wyznaczania optymalnej strategii gracza2: y n+1 max w 11 y 1 + w 12 y 2 +, +w 1n y n y n+1 0 w 21 y 1 + w 22 y 2 +, +w 2n y n y n+1 0 w m1 y 1 + w m2 y 2 +, +w mn y n y n+1 0 y 1 + y 2 + + y n = 1 y i 0,dla i = 1, 2,...,n. Problem wyznaczenia optymalnej strategii mieszanej dla gracza 1 jest dualnym do problemu wyznaczania strategii opotymalnej gracza 2. Z twierdzeńodualnościwiemy,żedlaoptymalnychrozwiązań x m+1

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 49 oraz y n+1tychzagadnieńmamy,że x m+1 = y n+1czyli x m+1 = y n+1. Zokreslenia w i wmamy,że w = x m+1oraz y n+1 = wskąd otrzymujemy równość w = w. Pozostaje jeszcze jeden element do rozpatrzenia. W podanych modelachliniowychzmienne x m+1, y n+1niesąnieujemne.jeślijest oczywiste,że w 0,tomożnastosowaćsympleks.Jeślitakniejest należy zastosować jedną z następujących modyfikacji: zamienić zmienną dowolną różnicą dwu zmiennych nieujemnych, zamienić rolami graczy tak, aby wypłata gracza 1 była nieujemna, dodać do macierzy wypłat pewną stałą(równą np. maksymalnej wartości modułów ujemnych wartości macierzy wypłat), tak aby

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 50 wartość gry w była nieujemną- dodanie stałej nie może zmienić optymalnych strategii, a po rozwiązaniu gry modyfikujemy jej wartość o tę wielkość. Ostatni sposób jast najczęściej stosowany. Zastosujmy teraz programowanie liniowe do wyznaczenia optymalnych strategii mieszanych dla gry 3. Przyjmiemy, że wartość gry jest nieujemna tj. w 0(okaże się że tak rzeczywiście jest) czyli nie będziemy stosować modyfikacji macierzy wypłat. Przykład7.Wtejgrzestrategia3dlagracza1jestzdominowaną zatem powinna być wyeliminowana. Macierz wypłat po usunieciu strategii3gracza1jestpodanawtablicy14

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 51 Macierz wypłat Gracz 2 Strategie 1 2 3 1 0-2 2 Gracz1 2 5 4-3 Tab. 14: Gra 3 po wyeliminowaniu zdominowanej strategii 3.

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 52 Modeleliniowedlagracza1igracza2sąnastępujące: x 3 max 5x 2 x 3 0 2x 1 + 4x 2 x 3 0 2x 1 3x 2 x 3 0 x 1 + x 2 = 1 x 1, x 2 0. y 4 min 2y 2 + 2y 3 y 4 0 5y 1 + 4y 2 3y 3 y 4 0 y 1 + y 2 + y 3 = 1 y 1, y 2, y 3 0. Rozwiązując te modele otrzymujemy dla bgracza 1 optymalne strategie mieszane x 1 = 7 11, x 2 = 4 11 iwartośćgry w = x 3 = 2 11.Dlagracza2 mamy y1 = 0, y2 = 5 11, y 3 = 6 11 oraz w = y 4 = 2 11.Torozwiązanie można otrzymać z rozwiązania modelu dla gracza 1 dlatego wystarcza rozwiązać tylko jeden z tych modeli, aby otrzymać strategie optymalne dla obu graczy. Rozwiązania zostały otrzymane przy założeniu,że

A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 53 w 0.Jeśliniejestspełnionetozałożenie,tomodelmożeniemieć rozwiązania dopuszczalnego. Aby tego uniknąć dodajemy do macierzy wypłat stałą 3 i odpowiednio modyfikujemy ograniczaenia. Po rozwiązaniu tylko wartość gry zmnieszamy o 3.