A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger1 1 Analza decyz- tablca decyzyna, klasyfkaca problemów W celu formalzac klasyfkac problemów decyzynych wprowadzmy tzw tablcę decyzyną. Nech decydent(lub grupa decydentów) ma osągnąć pewen cel(np. zysk z uprawy swoego pola). Aby go osągnąć podmue pewne dzałana, które nazywamy strategam, alternatywam decyzynym lub decyzam. Zakładamy, żelośćtychdzałańest mdzałanateoznaczymy a 1,a 2,...,a m.podemuąc dane dzałane ego wynk zależy od zewnętrznych dla decydenta n czynnków, którenazywamystanamnaturyoznaczamyprzez θ 1,θ 2,...,θ n.pełnyopskonsekwencdladecydentapodęcadzałana a wsytuac,gdywystąpstannatury θ oznaczaćbędzemyprzez X zapsuesęwpostacnastępuącetablcydecyzyne: Alternatywy Stany natury decyzyne θ 1 θ 2... θ a 1 X 11 X 12... X 1n a 2 X 21 X 22... X 2n....... a m X m1 X m2... X mn Tab. 1: Ogólna postać tablcy decyzyne Przykład 1. Rozważmy osobę, która ma przygotować omlet z 6 aek. Właśne wbłaużdomsk5a,któreokazałysędobrymzastanawasęcozrobćz szóstym akem, które może być albo dobre albo zepsute. Tablca 2 podae możlwe sposoby dzałana ops konsekwenc tych dzałań. Alternatywy Stan natury decyzyne ako dobre ako zepsute zbćakodomsk omletz6a nemaomletu 5 aek znszczonych zbćakodo omletz6a omletz5aek donnegonaczyna naczynedoumyca naczynedoumyca wyrzucć ako omlet z 6 aek omlet z 5 aek edno ako znszczone Tab. 2: Pełny ops konsekwenc problemu decyzynego przygotowane omletu W analze decyz stosue sę tablce decyzyne w których zamast pełnego opsukonsekwenc X używasęmarywartośckonsekwenc v(x )oznaczane daleprzez v dla = 1,...,m; = 1,...,nnazywanedaleużytecznoścą.
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger2 Maratapownnaspełnaćwarunek,że v > v kl,gdydladecydentabardze sprzyaącesąkonsekwence X nżkonsekwence X kl (mówsęrówneż,żedecydentpreferuekonsekwence X wstosunkudokonsekwenc X kl ).Dlatego dale będą używane tablce decyzyne w których konsekwence zostaną zastąpone użytecznoścą. Postać taką podano w tablcy 3. Alternatywy Stany natury decyzyne θ 1 θ 2... θ a 1 v 11 v 12... v 1n a 2 v 21 v 22... v 2n....... a m v m1 v m2... v mn Tab. 3: Postać ogólna tablcy decyzyne, w które konsekwence zastąpono użytecznoścą 1.1 Typy problemów decyzynych Wyróżna sę trzy typy problemów decyzynych: Problemy decyzyne w warunkach pewnośc. Występue tylko eden stan natury, którego wystąpene est pewne- tablca decyzyna ma tylko edną kolumnę. Problemy decyzyne w warunkach ryzyka. Znane est prawdopodobeństwo wystąpena każdego stanu natury. Dla dyskretnych stanów natury θ 1,θ 2,...,θ n prawdopodobeństwachwystąpenaoznaczamyprzez P(θ 1 ),P(θ 2 ),...,P(θ n ). Problemy decyzyne w warunkach nepewnośc. Znane są sposoby postępowana decydenta potrafmy zdentyfkować wszystke możlwe stany natury ale ne wemy nc o prawdzwym stane natury. W zależnośc od typu problemu decyzynego stosowane są różne krytera wyboru decyz optymalne(rozwązana optymalnego). 1.2 Krytera wyboru decyz w warunkach pewnośc W problemach w warunkach pewnośc decyzą optymalną est alternatywa o nabardze sprzyaące dla decydenta wartośc użytecznośc(co sprowadza sę do wyboru elementu maksymalnego lub mnmalnego w tablcy decyzyne o edne kolumne).
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger3 1.3 Krytera wyboru decyz w problemach w warunkach ryzyka W problemach w warunkach ryzyka raconalne kryterum wyboru optymalne decyzpoleganawyborzetakealternatywydecyzyne a k,któramaksymalzue (lub mnmalzue, gdy użyteczność est kosztem) wartość średną użytecznośc t. n =1 P(θ )v k = m max =1 n P(θ )v Przykład 2. Sprzedawca truskawek kupue na plantac koszyczek truskawek za 3zł.asprzedaeza8zł.Sprzedanykoszykprzynosmuzatem5zł.zyskuane sprzedany stratę 3zł. Z dośwadczena we, że dzenny popyt może wynosć 10, 11,12lub13koszyczków.Z90obserwac,którezgromadzłwe,żew18przypadkachdzennypopytkształtowałsęnapozome10,w36napozome11,w 27napozome12w9napozome13koszyczków.Jeślprzez a oznaczymy alternatywęzakupnaplantac 10 + ( 1)koszyczkówtruskawek,przez θ -popytdzennynapozome 10 + ( 1)( = 1, 2, 3, 4)koszyczkówaużytecznoścą będze dzenny zysk sprzedawcy, to tablcą decyzyną est tablca 4. W te tablcy =1 Zysk θ 1 θ 2 θ 3 θ 4 EV (a ) a 1 50 50 50 50 50 a 2 47 55 55 55 53.4 a 3 44 52 60 60 53.6 a 4 41 49 57 65 51.4 Rozkład 0.2 0.4 0.3 0.1 Tab. 4: Tablca decyzyna sprzedawcy truskawek EV (a )oznaczawartośćśrednąużytecznoścalternatywy a.decyząoptymalnąestwybóralternatywy a 3,któradaemaksymalnyoczekwanyzyskwynoszący EV (a 3 ) = 53.6. Dla problemów decyzynych o duże lczbe alternatyw stanów natury wypsywane całe tablcy decyzyne możne być ucążlwe. Można podać metodę rekurencyną wyznaczana wartośc średne użytecznośc dla kolenych alternatyw. Opszemy e dę pokażemy e zastosowane dla rozpatrywanego przykładu. Nech X będze dyskretną zmenną losową rozkładu stanów natury(t. welkośc popytu na truskawk w probleme sprzedawcy truskawek) przymuącą wartośc q,q + 1,...,Qorozkładze P(x)dla x = q,q + 1,...,Qdystrybuance F(x) = P(X x).wartośćśrednaużytecznoścalternatywy a,estwartoścą średnąfunkczmennelosowe X.Oznaczmyprzez d(z),z = q,q + 1,...,Q wartość średną zysku sprzedawcy, gdy zakupł na plantac z koszyczków truskawek(t. EV (a ) = d(z),gdze z = 10+ 1, = 1, 2, 3, 4).Oznaczmyprzez azysk
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger4 ak osąga sprzedawca z ednego sprzedanego koszyczka a przez b stratę na ednymnesprzedanymkoszyczku(dlarozpatrywanegoprzykładu a = 5,b = 3).Załóżmy, że sprzedawca zakupł z 1 koszyczków(ego średn zysk wynos d(z 1)). Dokupene dodatkowo ednego koszyczka truskawek przynese stratę b eśl popyt xbędze x z 1.Prawdopodobeństwotegozdarzenawynos P(X z 1). Natomastprzynesezysk aeślpopyt xbędze x > z 1.Tozdarzenema prawdopodobeństwo 1 F(z 1). Mamy zatem rekurencyny wzór: d(z) = d(z 1) + a[1 F(z 1)] bf(z 1) = d(z 1) + a (a + b)f(z 1) (z = q + 1,q + 2,...,Q.) Dla z = qmamy d(q) = aq. Dla sprzedawcy truskawek mamy: EV (a 1 ) = d(z = 10) = 5 10 = 50 EV (a 2 ) = d(11) = d(10) + 5 (5 + 3)F(10) = 50 + 5 8 2 10 = 53.4 EV (a 3 ) = d(12) = d(11) + 5 8F(11) = 58.4 8 6 10 = 53.6 EV (a 4 ) d(13) = d(12) + 5 8F(12) = 58.6 8 9 10 = 51.4 Optymalną strategę można równeż wyznaczyć wzorem analtycznym. Jeśl strategąoptymalnąestwybóralternatywypolegaącenazakupe k koszyczków, to z własnośc maksmum lokalnego mamy, że d(k ) d(k 1) F(k 1) a a + b d(k ) d(k + 1) a a + b F(k ) Stąd mamy F(k 1) a a + b F(k ) Wartość k spełnaącatęnerównośćestoptymalnądecyzą.tenostatnsposób wyznaczana alternatywy optymalne est naoszczędneszy. Dla sprzedawcy truskawek mamy a a + b = 5 = 0.425 0.4 = F(11) 0.425 F(12) = 0.9, 3 + 5 czyloptymalnąalternatywąestzakup12koszyczków (k = 12). W problmach w warunkach ryzyka wprowadza sę poęce oczekwane wartośc pewne nformac(evpi). Sposób e oblczana podamy na przykładze problemu sprzedawcy truskawek. Załóżmy, że sprzedawca może z całą pewnoścą przewdzeć zaśce danego stanu natury(ma pewną prognozę odnośne stanów
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger5 natury).wtedypownenwyberaćalterntywę a 1 dlastanu θ 1, a 2 dla θ 2, a 3 dla θ 3 a 4 dla θ 4.Poneważznarozkładprawdopodobeństwastanównatury,towartość oczekwana użytecznośc wynese wtedy: 50 0.2 + 55 0.4 + 60 0.3 + 65 0.1 = 56, 5. Bez znaomośc te prognozy wartość oczekwana zysku wynos 53,6. Różnca 56.5-53.6=2.9 defnue oczekwaną wartość pewne nformac, czyl EVPI=2.9. Wartość tę możemy nterpretować ako maksymalną kwotę, którą można wydać za pewną prognozę. 1.4 Krytera wyboru decyz w warunkach nepewnośc Danaesttablcadecyzynadlaproblemuzfunkcąużytecznośc v (funkcątą może być zysk lub koszt). Kryterum Walda- wybór alternatywy dla które namne sprzyaący rezultat est dla decydenta nakorzystneszy(maksymalzaca mnmalnego zysku,gdyużyteczność v estzyskem).dlakażdealternatywy a, = 1,...,mwyznaczasędwewelkośc:nabardzesprzyaącydladecydentarezultat o oraznamnesprzyaącyrezultat s.jeślużyteczność v estzyskem,to o = max{v }oraz s = mn{v } natomast,gdyużyteczność v estkosztem,to o = mn{v }oraz s = max{v }. Decyząoptymalnąestalternatywa a k taka,że lub s k = max s k = mn s = max s = mn mn{v }eśl v estnp.zyskem max{v }eśl v estnp.kosztem Kryterum to est nabardze konserwatywne- decydent wybera alternatywę, w które nagorszy(namne sprzyaący) rezultat będze dla nego nakorzystneszy spośród wszystkch alternatyw. Ne wszyscy decydenc wykazuą taką postawę względem ryzyka. Nektórzy decydenc mogą preferować alternatywy dla których nabardze sprzyaący rezultat est nakorzystneszyt,wyberaćalternatywę a k dlaktóre o k = max o = max max{v }
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger6 Wększość decydentów wykazue mne skrane postawy. Kryterum następne(hurwcza) zakłada, że postawę decydenta wykazywaną we wszystkch problemach można scharakteryzować przez pewen współczynnk(nazywany współczynnkem ostrożnośc). Kryterum Hurwcza- wybór alternatywy o nakorzystnesze dla decydenta średne ważone z namne nabardze sprzyaącego rezultatu(maksymalzaca-gdy v estzyskem-średneważoneznamnenabardze sprzyaącegorezultatu).jeśl v estzyskem,todecyząoptymalnąest alternatywa a k taka,że αs k +(1 α)o k = max{αs +(1 α)o } = max{α mn{v }+(1 α) max{v }}, gdze α est współczynnkem charakteryzuącym decydenta. Dla α = 1 kryterum est dentyczne z kryterum Walda, czyl est nabardze zachowawczym, dla α = 0 mamy nabardze optymstyczne kryterum. Wartośc αzprzedzału(0,1)pozwalaąnamodelowanepostawpośrednch.jeśl v estkosztem,todecyząoptymalnąestalterntywa a k taka,że αs k +(1 α)o k = mn{αs +(1 α)o } = mn{α max{v }+(1 α) mn{v }}. Kryterum Savage a- mnmalzaca maksymalnego żalu. Na podstawe tablcydecyzyne [v ]konstruuesęnowątablcę [r ]następuąco: { max m r = l=1 {v } v eśl v estzyskem, v mn m l=1{v } eśl v estkosztem. Element r tetablcyestróżncąpomędzyużytecznoścąnalepszedecyzakąnależałobypodąćprzywystąpenustanu θ apodętądecyzą(dla v zysku)możebyćnterpretowanyako żal znepodęcanalepsze decyz.wtablcy r dowyborudecyzoptymalnestosuesękryterum Walda(dlakosztów).Decyząoptymalnąest a k take,że s k = mn{s } = mn{max{r }}. Kryterum Laplace a(1825)- maksymalzaca(lub mnmalzaca, gdy użyteczność est kosztem) wartośc średne. Optymalną decyzą est wybór takealternatywy a k,że n 1 n n v k = max m { 1 =1 n v }. =1 =1
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger7 Przykład 3. Ośrodek wczasowy przygotowue zapasy żywnośc na nadchodzący weekend.możlwestanynatury θ 1,θ 2,θ 3,θ 4 odpowadaąodpowednoprzyazdow 100,150,200250turystów.Alternatywydecyzynyme a 1,a 2,a 3,a 4 toprzygotowane(zakup) zapasów dla odpowedno 100, 150, 200 250 turystów. Użyteczność v będącakosztemzwązanymzpodęcemalternatywy a wystąpenemstanu θ podana est w tablcy 5. Optymalną decyzą stosuąc kryterum Walda est wybór v θ 1 θ 2 θ 3 θ 4 s o a 1 5 10 18 25 25 5 a 2 8 7 8 23 23 7 a 3 21 18 12 21 21 12 a 4 30 22 19 15 30 15 Tab. 5: Tablca decyzyna dla ośrodka wczasowego alternatywy a 3,dlakryterumHurwcza,gdywspółczynnk α = 0.5alternatywą optymalnąest a 4.DlakryterumSavage amusmynaperwwyznaczyćtablcę r,którąpodanowtablcy6.decyząoptymalnąestwtymprzypadkuwybór alternatywy a 2. r θ 1 θ 2 θ 3 θ 4 s a 1 0 3 10 10 10 a 2 3 0 0 8 8 a 3 16 8 4 6 16 a 4 25 12 11 0 25 Tab.6:Tablcawartośc [r ]dlaośrodkawczasowego 2 Drzewadecyzyne Do analzy problemów decyzynych szczególne w sytuacach, gdy mamy do czynena z decyzam weloetapowym szczególne stosue sę tzw. drzewa decyzyne. Ich defncę zastosowane podamy na przykładze. Przykład 4. T.B. Inwestor Puckett nabył frmę produkuącą materały tekstylne. Teraz zastanawa sę nad przyszłoścą te frmy. Rozważa trzy waranty decyz: 1. Rozbudować fabrykę produkować lekke, trwałe materały, przeznaczone na rynek woskowy, na którym ne ma duże zagranczne konkurenc. 2. Utrzymać ststus quo, nadal produkuąc materały tekstylne, w które to branży stnee ostra zagranczna konkurenca. 3. Natychmast sprzedać fabrykę.
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger8 Stany natury Dobre warunk na Złe warunk na Decyza rynku zagrancznym rynku zagrancznym Rozbudować 800000zł. 500000zł. Utrzymać stan obecny 1300000zł. -150000zł. Sprzedać natychmast 320000zł. 320000zł. Tab. 7: Tablca decyzya frmy Puckett W przypadku wyboru ednego z perwszych dwóch warantów decyz fabryka zostanesprzedanaporoku.zyskzesprzedażyfabrykporokuzależyodwarunkówna rynku zagrancznym od losów ustawy o embargu handlowym. Sytuaca decyzyna est przedstawona w tabel decyzyne 7. Rozważany problem możemy zapsać w postac drzewa decyzynego(rys. 2), w którym wyróżnamy węzły: decyzyne(oznaczone kwadratem), losowe(oznaczone wększym kółkam) oraz końcowe(oznaczone małym kólłkam). Z węzła decyzynego 1 wychodzą 3 krawędze do węzłów losowych 2, 3 4. Krawędze te oznaczaą alternatywy decyzyne. Z każdego węzła losowego wychodzą dwe krawędze odpowadaące możlwym stanom natury t. dobrym z prawdopodobeństem 0.7 złym z prawdopodobeństwem 0,3 warunkom na rynkach zagrancznych. Węzły końcowe maą przypsane wartośc zysku odpowadaącego sytuac, gdy decydent podeme akąś decyzę zadze określany stan natury. Lczby przy węzłach losowych są wartoścam oczekwanym zysku przy wyborze przez decydenta odpowedne decyz. Z drzewa decyzynego możemy odczytać, że decyzą optymalna dla pana Packetta est wybór alternatywy zachować stan obecny, która dae mu oczekwany zysk wynoszacy 865000zł. Rozważymy teraz sytuacę, gdy w probleme decyzynym oprócz danych prawdopodobeństw stanów, które nazywa sę prawdopodobeństwam a pror dysponuemy dodatkowym nformacam tzw. prawdopodobeństwam a posteror. W rozważanym poprzedno probleme załóżmy, że pan Packett wynaął frmę kosultngową do opracowana raportu o poltyczne rynkowe sytuac w przyszłośc. Raport będze albo pozytywny(p) albo negatywny(n), wskazuąc na dobre(g) albo złe(p) przyszłe warunk na rynku zagrancznym. Warunkowe prawdopodobeństwa uzyskana każde z ocen stanu rynku przy danych stanach natury są następuące: Pr(P/g) = 0.7 Pr(N/g) = 0.3; Pr(P/p) = 0.2, Pr(N/p) = 0.8. Te prawdopodobeństwa warunkowe pozwalaą wyznaczyć(korzystaąc ze wzoru
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger9 710000zł. 2 Dobre warunk(0.7) 800000zł. Rozbudować Złe warunk(0.3) 500000zł. 1 Status quo Dobre warunk(0.7) 3 865000zł. Złe warunk(0.3) 1700000zł. -150000zł. Sprzedać Dobre warunk(0.7) 320000zł. 4 320000zł. Złe warunk(0.3) 320000zł. Rys. 1: Drzewo decyzyne Puckett Bayes a) prawdopodobeństwa a posteror. Pr(g/P) = P r(p/g)p r(g) Pr(P/g)Pr(g) + Pr(P/p)Pr(p) (1) = (0.7)(0.7) (0.7)(0.7) + (0.2)(0.3) (2) = 0.891 (3) P r(p/p) = 0.109 (4) Pr(g/N) = P r(n/g)p r(g) Pr(N/g)Pr(g) + Pr(N/p)Pr(p) (5) = (0.3)(0.7) (0.3)(0.7) + (0.8)(0.3) (6) = 0.467 (7) P r(p/n) = 0.533. (8) Znaomość tych prawdopodobeństw pozwala na skonstruowane drzewa decyzynego z prawdopodobeństwam a posteror przeprowadzene analzy w celu
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger10 wyznaczena strateg optymalne. Nowe drzewo decyzyne ma węzeł początkowy(est to węzeł losowy) 1, z którego wychodzą dwe krawędze odpowadaącę dwóm możlwym stanom natury(raport pozytywny lub negatywny). Następne mamydwawęzłydecyzyne23zktórychwychodząpotrzykrawędzeodpowadaące decyzom, ake decydent może podąc. Krawędze te prowadzą do węzłów losowych 4,5,6,7,8 9, z każego z nch wychodzą po dwe krawędze(odpowadaące dwóm stanom natury) do węzłów końcowych. Drzewo decyzyne wraz wartoścam oczekwanych wypłat(zysku) dla węzłów podae rys. 2. 2 Pozytywny Pr(P)=0.55 1 1141850 916117.5 Rozbudowa Sprzedaz Status quo 767300 1141950 320000 4 Pr(p/P)=0.109 5 6 Pr(g/P)=0.891 Pr(g/P)=0.891 Pr(p/P)=0.109 Pr(g/P)=0.891 Pr(p/P)=0.109 800000 500000 1300000 150000 320000 320000 Pr(N)=0.45 Negatywny 640100 3 Rozbudowa Status quo 640000 527150 7 Pr(p/N)=0.533 8 Pr(g/N)=0.467 Pr(g/N)=0.467 Pr(p/N)=0.533 800000 500000 1300000 150000 Sprzedaz 320000zł. 9 Pr(g/N)=0.467 Pr(p/N)=0.533 320000 320000 Rys. 2: Drzewo decyzyne z prawdopodobeństwam a posteror Z analzy dzrzewa możemy odczytać strategę optymalną. Jeśl raport będze pozytywny, to decydent pownen wybrać alternetywę Statu quo, która przynese mu nawększy oczekwany zysk 1141950zł. Natomast w przypadku otrzymana rapotru negatywnego pownen wybrać alternatywę Rozbudować, dla które oczekwany zysk wynos 640100zł. Take postępowane est optymalne, decydent w ten sposób zapewna sobe oczekwany zysk wynoszący 916117.5zł. Bez dodatkowe nformac(znaomośc prawdopodobeństw a posteror) ego oczekwany zysk wynos tylko 865000zł.
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger11 3 Gry dwuosobowe o sume zerowe W poprzedno rozpatrywanych sytuacach decyzynych na efekty dzałań decydenta mały wpływ stany natury. Obecne zamemy sę sytuacam, gdy na dzałana decydenta ma wpływ ne natura, którą możemy traktować ako pasywnego oponenta lecz nny raconalne dzałaący decydent. W teor ger obu decydentów nazywamy graczam. Zamować sę będzemy tylko gram dwuosobowym o sume zerowe. W takch grach podemowane przez obu graczy decyze nazywane sa strategam. Efekt(użyteczność) podęca strateg przez ednego gracza, gdy drug gracz wybrał strategę nazywa sę wypłatą oznaczamy przez [w ], = 1,...,m; = 1,...,n.Wgrachosumezerowypłata(wygrana)dla ednego gracza est równa przegrane drugego. Przykład5.Mamydwóchgraczy:gracza1gracza2.Każdyznchdysponue trzema strategam 1,2 3. Macerz wypłat podae tabela 8 Macerz wypłat Gracz 2 Stratege 1 2 3 1 1 2 4 Gracz1 2 1 0 5 3 0 1-1 Tab.8:Macerzwypłatgry1 Macerz wypłat te gry est dość specyfczna rozwązane otrzymamy wykorzystuąc koncepcę strateg zdomnowanych. Mówmy, że stratega est zdomnowana przez strategę k eśl stratega k est co namne tak dobra ak (a czasam lepsza), bez względu na to, co zrob oponent(drug gracz). Formalne strategę będzemy nazywać strategą zdomnowaną przez strategę k, eśl =1,...,n w w k oraz l w l < w kl. Natomast k nazywamy strategą domnuącą, eśl: =1,...,n w k = max {w }. Stratege, które ne są zdomnowane przez nne stratege nazywamy strategam nezdomnowanym. Raconalne dzałaący decydent będze dokonywał wyboru spośród strateg nezdomnowanych. Stratega 3 est dla gracza 1 zdomnowaną przez strategę 1, gdyż bez względu na to aką strategę wyberze gracz 2 wypłatagracza1estprzywyborzestrateg3nenższanżwypłataprzywyborze strateg 1. Zatem wersz trzec odpowadaący strateg zdomnowane możemy skreślć z macerzy wypłat. Zredukowana macerz wypłat est podana w tablcy 9.
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger12 1 2 3 1 1 2 4 2 1 0 5 Tab. 9: Zredukowana macerz gry11 1 2 1 1 2 2 1 0 Tab. 10: Zredukowana macerz gry12 Poneważ zakładamy raconalność obu graczy, to gracz 2 też ma strategę zdomnowaną 3. Jest ona zdomnowana zarówno przez strategę 1 ak przez strategę 2. Elmnuemy strategę 3 gracza 2 co dae macerz wypłat 10: Teraz stratega 2 dla gracza 1 est zdomnowana przez strategę 1. Elmnuąc zdomnowaną strategęmamymacerzwypłatpodanąwtablcy11:stratega2dlagracza2et 1 2 1 1 2 Tab. 11: Zredukowana macerz gry13 zdomnowana przez strategę 1 zatem pownna być wyelmnowana. Ostateczne oba gracze pownn wyberać stratege 1. Gracz 1 otrzyma wtedy wypłatę 1, ta wartość est przegraną gracza 2. Jest to wartość gry. Jeśl wartość gry est 0, to nazywa sę grą sprawedlwą(rozważana gra ne est grą sprawedlwą, gdyż e wartość wynos 1). Koncepca zdomnowanych strateg pozwala na redukcę wymaru macerzy wypłat w nektórych przypadkach pozwala wyznaczyć rozwązane gry. Jednak w wększośc przypadków potrzebuemy nnego podeśca, które zaprezentemy na dwu kolenych przykładach. Przykład 6. Rozpatrzymy teraz grę o macerzy wypłat podane w tablcy 12 Wtegrzegracz1stosuącstrategę1możewygrać6alemożerówneżprzegrać 3(wypłata-3). Stosuąc strategę 3 może wygrać 5 ale może przegrać 4. Natomastwstrateg2egowygranabezwzględunatocozrobgracz2będzeco namne0.analzuącstrategedlagracza2mamy,żewstrategach13ego maksymalna przegrana wynos odpowedno 5 6. natomast w strateg 2 tylko zero. Oba gracze pownn zatem wybrać strategę 2, gdyż każdemu z nch zapewna ona w nagorszym przypadku nalepszy wynk. Jest to tzw. kryterum mnmaksowe standardowo proponowane w teor ger do wyboru strateg optymalne. Według tego kryterum gracz 1 pownen wybrać strategę,dla które mnmalnawypłataestnawększa(t. max mn {w })agracz2strategędlaktóremaksymalnawypłatagracza1estestnamnesza(t. mn max {w }).W analzowanym przykładze strategą max mn est stratega 2 gracza 1 a strategą
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger13 Macerz wypłat Gracz 2 Stratege 1 2 3 Mnmum 1-3 -2 6-3 Gracz1 2 2 0 2 0 max 3 5-2 -4-4 Maxmum 5 0 6 mn Tab.12:Macerzwypłatgry2 Macerz wypłat Gracz 2 Stratege 1 2 3 Mnmum 1 0-2 2-2 max Gracz1 2 5 4-3 -3 3 2 3-4 -4 Maxmum 5 4 2 mn Tab.13:Gra3-nemapunktusodłowego mn maxeststratega2dlagracza2.wartośćgryestrówna0,czylesttogra sprawedlwa.wtegrzetensamelementmacerzywypłat(w 22 = 0)estednocześne wartoścą max mn wartoścą mn max, czyl mamy element, który est namneszy w werzsu ednocześne nawększy w kolumne. Tak punkt, esl stnee, nazywa sę punktem sodłowym. Jesl gra ma punkt sodłowy, to oba gracza pownn do wyboru strateg optymalne stosować odpowedno max mn mn maxstratege.jednaknekażdagraposadapunktsodłowy-takąestnp. gra3. Wrozważanepoprzednogrzewartośc max mn w = 2 2 = mn max w nesąrównecooznacza,żegraneposadapunktusodłowego.wtegrzenformaca o tym aką strategę wyberze eden z graczy pozwala drugemu poprawć swoą pozycę. Koncepca rozwazana optymalnego w tego typu grach oparta est na poęcu strateg mesznych, które charakteryzuą sę tym, że żaden z graczy ne może wydedukować aką strategę użye oponent.
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger14 3.1 Stratege meszane dla gry bez punktu sodłowego Dla ger ne posadaących punktu sodłowego dla każdego z graczy wyznacza sę rozkłady prawdopodobeństwa na zborach ch strateg. Nech: x = prawdopodobeństwo,żegracz1użyestrateg( = 1,...,m), y = prawdopodobeństwo,żegracz2użyestrateg( = 1,...,n), gdze m =1 x = 1, n =1 y = 1.Wartośc x, = 1,...,moraz y, = 1...,n nazywamy strategam meszanym natomast orygnalne stratege strategam czystym. W trakce gry każdy z graczy wybera strategę czystą ednak pownenwyberaćąwpewenlosowysposóbzgodnyzrozkładem (x 1,x 2,...,x m )dla gracza1rozkładem (y 1,y 2,...,y n )dlagracza2.np.esl (x 1,x 2,x 3 ) = ( 1, 1, 0) 2 2 a (y 1,y 2,y 3 ) = (0, 1, 1),togracz1nepownenwyberaćstrategczyste3a 2 2 wybór strateg 2 lub 3 rozstrzygnąć rzucaąc monetą. Analogczne gracz 2 ne pownen wyberać czyste strateg 1 a wybór pomędzy strategam 2 3 rozstrzygnąć rzucaąc monetą. Przy stosowanu strateg meszanych przez każdego z graczy oczekwaną wygraną gracza 1 est m n Oczekwana wypłata gracza 1 = w x y, gdze w estwypłatąeślgracz1używaczystestrateg agracz2używa czyste strateg. W rozpatrywane poprzedno grze 3 eśl gracze 1 2 stosuąodpowednostrategemeszane (x 1,x 2,x 3 ) = ( 1 2, 1 2, 0)(y 1,y 2,y 3 ) = (0, 1 2, 1 2 ) tooczekwanawypłatagracza1wynos 1 4 ( 2 + 2 + 4 3) = 1 4.Mnmaksowe (mn max) ktyterum dla strateg meszanych mów, że gracz pownen wyberać strategę meszaną, która mnmalzue ego maksymalne oczekwane straty. Równoważne, eśl rozważamy wygraną gracza 1(a ne przegraną gracza 2 co est równoważne) to kryterum to est maksymnowe(max mn), t. maksymalzue sę mnmalną oczekwaną wypłatę gracza 1. Przez mnmalną oczekwaną wypłatę rozume sę namneszą możlwą wypłatę, którę można uzyskać przy dowolne strateg meszne, podęte przez oponenta. Zatem meszna stratega dla gracza 1 est optymalną, eśl mnmalna oczekwana wypłata est maksymalna. Wartość tą oznaczamy przez w. Dla gracza 2 podobne optymalną strategą meszaną est stratega, która mnmalzue maksymalną oczekwaną wartość przegrane. Wartość tę oznacza sę przez w. Dla ger ne posadaących punktu sodłowego eśl tylko rozpatrue sę czyste stratege, to ne ma rozwązana stablnego. Zachodz wtedy nerówność w < w gracze mogą zmenać stratege, aby poprawć swoą pozycę. Dla strateg meszanych konecznym warunkem, aby rozwązane optymalne było stablne est równość w = w. W grach o sume zerowe ten warunek est zawsze spełnony. Twerdzene 1. Para strateg mesznych dla graczy est optymalną daąc stablnerozwązaneprzykryterummnmaksowym,(mn max),gdy w = w = w. =1 =1
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger15 Stosuąc te stratege żaden z graczy ne może poprawć swoe pozyc zmenaąc ednostronne swoą strategę. 3.2 Zastosowane programowana lnowego do wyznaczena rozwazana gry Rozwązane dowolne gry w strategach mesznych można wyznaczyć rozwazuąc pewne zagadnene programowana lnowego. Rozważymy naperw ak wyznaczyć optymalną strategę meszaną gracza 1. Oczekwana wypłata gracza 1 = m n w x y, =1 =1 stratega (x 1,x 1,...,x m )estoptymalnąeśl m =1 n w x y w = w =1 dlakażdestrateg (y 1,y 2,...,y n )gracza2.tanerównośćmusrówneżzachodzć dlaczystychstrategt. (y 1,y 2,...,y n )takch,żeednawspółrzędna y = 1a reszta est zeram. Zatem mamy: m w x wdla = 1,...,n. =1 Co węce ten zbór nerównośc mplkue wyścową nerówność: n m y ( w x ) =1 =1 n y w = w, =1 poneważ n =1 y = 1.Spełnenetychnnerównoścestrównoważnespełnenu wyścowenerównoścdlakażdestrateg y 1,y 2,...,y n.wyznaczeneoptymalne strateg może być zatem sprowadzone do rozwązana następuącego zagadnena programowana lnowego: x m+1 max w 11 x 1 + w 21 x 2 +, +w m1 x m x m+1 0 w 12 x 1 + w 22 x 2 +, +w m2 x m x m+1 0 w 1n x 1 + w 2n x 2 +, +w mn x m x m+1 0 x 1 + x 2 + + x m = 1 x 0,dla = 1, 2,...,m.
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger16 Zmenna x m+1 zastępueneznanąwartość wwrozwązanuoptymalnymbędze e równa. Jednak na tę zmenną ne est nałożony warunek neuemnośc. Analogczne rozumowane prowadz do następuącego modelu wyznaczana optymalne strateg gracza2: y n+1 max w 11 y 1 + w 12 y 2 +, +w 1n y n y n+1 0 w 21 y 1 + w 22 y 2 +, +w 2n y n y n+1 0 w m1 y 1 + w m2 y 2 +, +w mn y n y n+1 0 y 1 + y 2 + + y n = 1 y 0,dla = 1, 2,...,n. Problem wyznaczena optymalne strateg meszane dla gracza 1 est dualnym do problemu wyznaczana strateg opotymalne gracza 2. Z twerdzeń o dualnośc wemy,żedlaoptymalnychrozwązań x m+1oraz y n+1tychzagadneńmamy,że x m+1 = y n+1czyl x m+1 = y n+1. Zokreslena w wmamy,że w = x m+1oraz y n+1 = wskądotrzymuemyrówność w = w. Pozostae eszcze eden element do rozpatrzena. W podanych modelach lnowychzmenne x m+1,y n+1nesąneuemne.jeślestoczywste,że w 0,to można stosować sympleks. Jeśl tak ne est należy zastosować edną z następuących modyfkac: zamenć zmenną dowolną różncą dwu zmennych neuemnych, zamenć rolam graczy tak, aby wypłata gracza 1 była neuemna, dodać do macerzy wypłat pewną stałą(równą np. maksymalne wartośc modułów uemnych wartośc macerzy wypłat), tak aby wartość gry w była neuemną- dodane stałe ne może zmenć optymalnych strateg, a po rozwązanu gry modyfkuemy e wartość o tę welkość. Ostatn sposób ast naczęśce stosowany. Zastosumy teraz programowane lnowe do wyznaczena optymalnych strateg meszanych dla gry 3. Przymemy, że wartość gry est neuemna t. w 0(okaże sę że tak rzeczywśce est) czyl ne będzemy stosować modyfkac macerzy wypłat. Przykład7.Wtegrzestratega3dlagracza1estzdomnowanązatempownna być wyelmnowana. Macerz wypłat po usunecu strateg 3 gracza 1 est podana wtablcy14modelelnowedlagracza1gracza2sąnastępuące:
A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger17 Macerz wypłat Gracz 2 Stratege 1 2 3 1 0-2 2 Gracz1 2 5 4-3 Tab. 14: Gra 3 po wyelmnowanu zdomnowane strateg 3. x 3 max 5x 2 x 3 0 2x 1 + 4x 2 x 3 0 2x 1 3x 2 x 3 0 x 1 + x 2 = 1 x 1, x 2 0. y 4 mn 2y 2 + 2y 3 y 4 0 5y 1 + 4y 2 3y 3 y 4 0 y 1 + y 2 + y 3 = 1 y 1, y 2, y 3 0. Rozwązuąc te modele otrzymuemy dla bgracza 1 optymalne stratege meszane x 1 = 7, 11 x 2 = 4 wartośćgry w = 11 x 3 = 2.Dlagracza2mamy 11 y 1 = 0, y2 = 5, 11 y 3 = 6 oraz w = 11 y 4 = 2.Torozwązanemożnaotrzymaćzrozwązana 11 modelu dla gracza 1 dlatego wystarcza rozwązać tylko eden z tych model, aby otrzymać stratege optymalne dla obu graczy. Rozwązana zostały otrzymane przy założenu,że w 0.Jeślneestspełnonetozałożene,tomodelmożenemeć rozwązana dopuszczalnego. Aby tego unknąć dodaemy do macerzy wypłat stałą 3 odpowedno modyfkuemy ogranczaena. Po rozwązanu tylko wartość gry zmneszamy o 3.