1.1 Analiza decyzji- tablica decyzyjna, klasyfikacja

Podobne dokumenty
1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

11/22/2014. Jeśli stała c jest równa zero to takie gry nazywamy grami o sumie zerowej.

RÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH

Zaawansowane metody numeryczne

Problem plecakowy (KNAPSACK PROBLEM).

n liczba zmiennych decyzyjnych c współczynniki funkcji celu a współczynniki przy zmienych decyzyjnych w warunkach

Algorytmy szukania równowag w grach dwumacierzowych

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Podstawowym założeniem teorii gier jest racjonalne działanie wszystkich podmiotów decyzyjnych (graczy).

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Badania operacyjne w logistyce i zarządzaniu produkcją

Instrukcja do ćwiczeń laboratoryjnych z przedmiotu: Badania operacyjne. Temat ćwiczenia: Problemy rozkroju materiałowego, zagadnienia dualne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Weryfikacja hipotez dla wielu populacji

Definicje ogólne

Sortowanie szybkie Quick Sort

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

QUASI- KLASYCZNA ANALIZA DECYZJI ZŁOŻONYCH

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Przykład 5.1. Kratownica dwukrotnie statycznie niewyznaczalna

SYSTEMY UCZĄCE SIĘ WYKŁAD 5. LINIOWE METODY KLASYFIKACJI. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

aij - wygrana gracza I bij - wygrana gracza II

MIKROEKONOMIA Prof. nadzw. dr hab. Jacek Prokop

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

ZASTOSOWANIE KLASYCZNEGO ALGORYTMU GENETYCZNEGO DO ROZWIĄZANIA ZBILANSOWANEGO ZAGADNIENIA TRANSPORTOWEGO

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

7. Wykład VII: Warunki Kuhna-Tuckera

ZAGADNIENIE TRANSPORTOWE

Zarządzanie ryzykiem w przedsiębiorstwie i jego wpływ na analizę opłacalności przedsięwzięć inwestycyjnych

Proces decyzyjny: 1. Sformułuj jasno problem decyzyjny. 2. Wylicz wszystkie możliwe decyzje. 3. Zidentyfikuj wszystkie możliwe stany natury.

Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 2

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Diagonalizacja macierzy kwadratowej

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

SZTUCZNA INTELIGENCJA

= σ σ. 5. CML Capital Market Line, Rynkowa Linia Kapitału

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Pattern Classification

Wykład 1 Zagadnienie brzegowe liniowej teorii sprężystości. Metody rozwiązywania, metody wytrzymałości materiałów. Zestawienie wzorów i określeń.

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Statystyka Inżynierska

Oligopol dynamiczny. Rozpatrzmy model sekwencyjnej konkurencji ilościowej jako gra jednokrotna z pełną i doskonalej informacją

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego

ASPEKT SYTUACJI STATUS QUO WE WSPOMAGANIU WIELOKRYTERIALNEGO WYBORU BAZUJĄCEGO NA TEORII GIER

65120/ / / /200

u u u( x) u, x METODA RÓŻNIC SKOŃCZONYCH, METODA ELEMENTÓW BRZEGOWYCH i METODA ELEMENTÓW SKOŃCZONYCH

ANALIZA WARIANCJI (ANOVA) Spis treści

Statystyka. Zmienne losowe

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem

Ubezpieczenia majątkowe

Funkcje i charakterystyki zmiennych losowych

ZASTOSOWANIE ZBIORÓW ROZMYTYCH W JEDNOETAPOWYM PROCESIE PODEJMOWANIA DECYZJI PRZEZ JEDNEGO DECYDENTA

8. Optymalizacja decyzji inwestycyjnych

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

-Macierz gęstości: stany czyste i mieszane (przykłady) -równanie ruchu dla macierzy gęstości -granica klasyczna rozkładów kwantowych

Laboratorium ochrony danych

6. ANALIZA POST-OPTYMALIZACYJNA analiza wrażliwości rozwiązania optymalnego


Podprzestrzenie macierzowe

Proces decyzyjny: 1. 6IRUPXáXMMDVQRSUREOHPGHF\]\MQ\ 2. :\OLF]ZV]\VWNLHPR*OLZHdecyzje. 3. =LGHQW\ILNXMZV]\VWNLHPR*OLZHstany natury.

I. Elementy analizy matematycznej

4. OPTYMALIZACJA WIELOKRYTERIALNA

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

Diagnostyka układów kombinacyjnych

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Poszukiwanie optymalnego wyrównania harmonogramu zatrudnienia metodą analityczną

Prawdopodobieństwo i statystyka r.

Grupowanie. Wprowadzenie. Metody hierarchiczne. Modele mieszane (mixture models) Metody najmniejszych kwadratów. Zastosowania

Plan wykładu. Sztuczne sieci neuronowe. Neuronu dyskretny. Neuron dyskretny (perceptron prosty)

Regulamin promocji upalne lato

XLI OLIMPIADA FIZYCZNA ETAP WSTĘPNY Zadanie teoretyczne

1. SPRAWDZENIE WYSTEPOWANIA RYZYKA KONDENSACJI POWIERZCHNIOWEJ ORAZ KONDENSACJI MIĘDZYWARSTWOWEJ W ŚCIANIE ZEWNĘTRZNEJ

Wstęp Funkcja pliki nagłówkowe i typ tablicowy. Wstęp Pliki nagłówkowe i typ tablicowy. Wstęp Funkcja fill_array() Wstęp. Notatki. Notatki.

Metoda wyznaczania najtańszych 1-diagnozowalnych struktur opiniowania diagnostycznego

Instytut Łączności. Praca statutowa nr

Regulamin promocji zimowa piętnastka

STATYSTYCZNA ANALIZA WYNIKÓW POMIARÓW

11/22/2014 STRATEGIE MIESZANE - MOTYWACJA. ROZWAśMY PRZYKŁAD:

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

1. Komfort cieplny pomieszczeń

1. Wstęp. 2. Macierz admitancyjna.

Wprowadzenie do Sieci Neuronowych Sieci rekurencyjne

Transkrypt:

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger1 ANALIZA DECYZJI(AD) 1.1 Analza decyz- tablca decyzyna, klasyfkaca problemów W celu formalzac klasyfkac problemów decyzynych wprowadzmy tzw tablcę decyzyną. Nech decydent(lub grupa decydentów) ma osągnąć pewen cel(np. zysk z uprawy swoego pola). Aby go osągnąć podmue pewne dzałana, które nazywamy strategam, alternatywam decyzynym lub decyzam. Zakładamy, żelośćtychdzałańest mdzałanateoznaczymy a 1,a 2,...,a m.podemuąc dane dzałane ego wynk zależy od zewnętrznych dla decydenta n czynnków, którenazywamystanamnaturyoznaczamyprzez θ 1,θ 2,...,θ n.pełnyopskonsekwencdladecydentapodęcadzałana a wsytuac,gdywystąpstannatury θ oznaczaćbędzemyprzez X zapsuesęwpostacnastępuącetablcydecyzyne: Alternatywy Stany natury decyzyne θ 1 θ 2... θ a 1 X 11 X 12... X 1n a 2 X 21 X 22... X 2n....... a m X m1 X m2... X mn Tab. 1.1: Ogólna postać tablcy decyzyne Przykład 1.1. Rozważmy osobę, która ma przygotować omlet z 6 aek. Właśne wbłaużdomsk5a,któreokazałysędobrymzastanawasęcozrobć z szóstym akem, które może być albo dobre albo zepsute. Tablca 1.2 podae możlwe sposoby dzałana ops konsekwenc tych dzałań. Alternatywy Stan natury decyzyne ako dobre ako zepsute zbćakodomsk omletz6a nemaomletu 5 aek znszczonych zbćakodo omletz6a omletz5aek donnegonaczyna naczynedoumyca naczynedoumyca wyrzucć ako omlet z 6 aek omlet z 5 aek edno ako znszczone Tab. 1.2: Pełny ops konsekwenc problemu decyzynego przygotowane omletu

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger2 W analze decyz stosue sę tablce decyzyne w których zamast pełnego opsukonsekwenc X używasęmarywartośckonsekwenc v(x )oznaczane daleprzez v dla = 1,...,m; = 1,...,nnazywanedaleużytecznoścą. Maratapownnaspełnaćwarunek,że v > v kl,gdydladecydentabardze sprzyaącesąkonsekwence X nżkonsekwence X kl (mówsęrówneż,żedecydentpreferuekonsekwence X wstosunkudokonsekwenc X kl ).Dlatego dale będą używane tablce decyzyne w których konsekwence zostaną zastąpone użytecznoścą. Postać taką podano w tablcy 1.3. Alternatywy Stany natury decyzyne θ 1 θ 2... θ a 1 v 11 v 12... v 1n a 2 v 21 v 22... v 2n....... a m v m1 v m2... v mn Tab. 1.3: Postać ogólna tablcy decyzyne, w które konsekwence zastąpono użytecznoścą Wyróżna sę trzy typy problemów decyzynych: Problemy decyzyne w warunkach pewnośc. Występue tylko eden stan natury, którego wystąpene est pewne- tablca decyzyna ma tylko edną kolumnę. Problemy decyzyne w warunkach ryzyka. Znane est prawdopodobeństwo wystąpena każdego stanu natury. Dla dyskretnych stanów natury θ 1,θ 2,...,θ n prawdopodobeństwachwystąpenaoznaczamyprzez P(θ 1 ),P(θ 2 ),...,P(θ n ). Problemy decyzyne w warunkach nepewnośc. Znane są sposoby postępowana decydenta potrafmy zdentyfkować wszystke możlwe stany natury ale ne wemy nc o prawdzwym stane natury. W zależnośc od typu problemu decyzynego stosowane są różne krytera wyboru decyz optymalne(rozwązana optymalnego). W problemach w warunkach pewnośc decyzą optymalną est alternatywa o nabardze sprzyaące dla decydenta wartośc użytecznośc(co sprowadza sę do wyboru elementu maksymalnego lub mnmalnego w tablcy decyzyne o edne kolumne). W problemach w warunkach ryzyka raconalne kryterum wyboru optymalne decyzpoleganawyborzetakealternatywydecyzyne a k,któramaksymalzue (lub mnmalzue, gdy użyteczność est kosztem) wartość średną użytecznośc t. n =1 P(θ )v k = m max =1 n P(θ )v =1

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger3 Przykład 1.2. Sprzedawca truskawek kupue na plantac koszyczek truskawek za3zł.asprzedaeza8zł.sprzedanykoszykprzynosmuzatem5zł.zyskuane sprzedany stratę 3zł. Z dośwadczena we, że dzenny popyt może wynosć 10, 11,12lub13koszyczków.Z90obserwac,którezgromadzłwe,żew18przypadkachdzennypopytkształtowałsęnapozome10,w36napozome11,w 27napozome12w9napozome13koszyczków.Jeślprzez a oznaczymy alternatywęzakupnaplantac 10 + ( 1)koszyczkówtruskawek,przez θ -popyt dzennynapozome 10 + ( 1)( = 1, 2, 3, 4)koszyczkówaużytecznoścąbędze dzenny zysk sprzedawcy, to tablcą decyzyną est tablca 1.4. W te tablcy Zysk θ 1 θ 2 θ 3 θ 4 EV (a ) a 1 50 50 50 50 50 a 2 47 55 55 55 53.4 a 3 44 52 60 60 53.6 a 4 41 49 57 65 51.4 Rozkład 0.2 0.4 0.3 0.1 Tab. 1.4: Tablca decyzyna sprzedawcy truskawek EV (a )oznaczawartośćśrednąużytecznoścalternatywy a.decyząoptymalnąestwybóralternatywy a 3,któradaemaksymalnyoczekwanyzyskwynoszący EV (a 3 ) = 53.6. Dla problemów decyzynych o duże lczbe alternatyw stanów natury wypsywane całe tablcy decyzyne możne być ucążlwe. Można podać metodę rekurencyną wyznaczana wartośc średne użytecznośc dla kolenych alternatyw. Opszemy e dę pokażemy e zastosowane dla rozpatrywanego przykładu. Nech X będze dyskretną zmenną losową rozkładu stanów natury(t. welkośc popytu na truskawk w probleme sprzedawcy truskawek) przymuącą wartośc q,q + 1,...,Qorozkładze P(x)dla x = q,q + 1,...,Qdystrybuance F(x) = P(X x).wartośćśrednaużytecznoścalternatywy a,estwartoścą średnąfunkczmennelosowe X.Oznaczmyprzez d(z),z = q,q + 1,...,Q wartość średną zysku sprzedawcy, gdy zakupł na plantac z koszyczków truskawek(t. EV (a ) = d(z),gdze z = 10+ 1, = 1, 2, 3, 4).Oznaczmyprzez azysk ak osąga sprzedawca z ednego sprzedanego koszyczka a przez b stratę na ednymnesprzedanymkoszyczku(dlarozpatrywanegoprzykładu a = 5,b = 3).Załóżmy, że sprzedawca zakupł z 1 koszyczków(ego średn zysk wynos d(z 1)). Dokupene dodatkowo ednego koszyczka truskawek przynese stratę b eśl popyt xbędze x z 1.Prawdopodobeństwotegozdarzenawynos P(X z 1). Natomastprzynesezysk aeślpopyt xbędze x > z 1.Tozdarzenema prawdopodobeństwo 1 F(z 1). Mamy zatem rekurencyny wzór: d(z) = d(z 1) + a[1 F(z 1)] bf(z 1) = d(z 1) + a (a + b)f(z 1) (z = q + 1,q + 2,...,Q.)

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger4 Dla z = qmamy d(q) = aq. Dla sprzedawcy truskawek mamy: EV (a 1 ) = d(z = 10) = 5 10 = 50 EV (a 2 ) = d(11) = d(10) + 5 (5 + 3)F(10) = 50 + 5 8 2 10 = 53.4 EV (a 3 ) = d(12) = d(11) + 5 8F(11) = 58.4 8 6 10 = 53.6 EV (a 4 ) d(13) = d(12) + 5 8F(12) = 58.6 8 9 10 = 51.4 Optymalną strategę można równeż wyznaczyć wzorem analtycznym. Jeśl strategąoptymalnąestwybóralternatywypolegaącenazakupe k koszyczków, to z własnośc maksmum lokalnego mamy, że d(k ) d(k 1) F(k 1) a a + b d(k ) d(k + 1) a a + b F(k ) Stąd mamy F(k 1) a a + b F(k ) Wartość k spełnaącatęnerównośćestoptymalnądecyzą.tenostatnsposób wyznaczana alternatywy optymalne est naoszczędneszy. Dla sprzedawcy truskawek mamy a a + b = 5 = 0.425 0.4 = F(11) 0.425 F(12) = 0.9, 3 + 5 czyloptymalnąalternatywąestzakup12koszyczków (k = 12). W problmach w warunkach ryzyka wprowadza sę poęce oczekwane wartośc pewne nformac(evpi). Sposób e oblczana podamy na przykładze problemu sprzedawcy truskawek. Załóżmy, że sprzedawca może z całą pewnoścą przewdzeć zaśce danego stanu natury(ma pewną prognozę odnośne stanów natury).wtedypownenwyberaćalterntywę a 1 dlastanu θ 1, a 2 dla θ 2, a 3 dla θ 3 a 4 dla θ 4.Poneważznarozkładprawdopodobeństwastanównatury,towartość oczekwana użytecznośc wynese wtedy: 50 0.2 + 55 0.4 + 60 0.3 + 65 0.1 = 56, 5. Bez znaomośc te prognozy wartość oczekwana zysku wynos 53,6. Różnca 56.5-53.6=2.9 defnue oczekwaną wartość pewne nformac, czyl EVPI=2.9. Wartość tę możemy nterpretować ako maksymalną kwotę, którą można wydać za pewną prognozę. Krytera wyboru decyz w warunkach nepewnośc Danaesttablcadecyzynadlaproblemuzfunkcąużytecznośc v (funkcątą może być zysk lub koszt).

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger5 1. Kryterum Walda- wybór alternatywy dla które namne sprzyaący rezultat est dla decydenta nakorzystneszy(maksymalzaca mnmalnego zysku,gdyużyteczność v estzyskem).dlakażdealternatywy a, = 1,..., m wyznacza sę dwe welkośc: nabardze sprzyaący dla decydenta rezultat o oraznamnesprzyaącyrezultat s.jeślużyteczność v est zyskem,to o = max{v }oraz s = mn{v } natomast,gdyużyteczność v estkosztem,to o = mn{v }oraz s = max{v }. Decyząoptymalnąestalternatywa a k taka,że s k = max s = max mn{v }eśl v estnp.zyskem lub s k = mn s = mn max{v }eśl v estnp.kosztem Kryterum to est nabardze konserwatywne- decydent wybera alternatywę, w które nagorszy(namne sprzyaący) rezultat będze dla nego nakorzystneszy spośród wszystkch alternatyw. Ne wszyscy decydenc wykazuą taką postawę względem ryzyka. Nektórzy decydenc mogą preferować alternatywy dla których nabardze sprzyaący rezultat est nakorzystneszyt,wyberaćalternatywę a k dlaktóre o k = max o = max max{v } Wększość decydentów wykazue mne skrane postawy. Kryterum następne(hurwcza) zakłada, że postawę decydenta wykazywaną we wszystkch problemach można scharakteryzować przez pewen współczynnk(nazywany współczynnkem ostrożnośc). 2. Kryterum Hurwcza- wybór alternatywy o nakorzystnesze dla decydenta średne ważone z namne nabardze sprzyaącego rezultatu (maksymalzaca-gdy v estzyskem-średneważoneznamnenabardzesprzyaącegorezultatu).jeśl v estzyskem,todecyząoptymalnąestalternatywa a k taka,że αs k +(1 α)o k = max{αs +(1 α)o } = max{α mn{v }+(1 α) max{v }}, gdze α est współczynnkem charakteryzuącym decydenta. Dla α = 1 kryterum est dentyczne z kryterum Walda, czyl est nabardze zachowawczym, dla α = 0 mamy nabardze optymstyczne kryterum. Wartośc

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger6 αzprzedzału(0,1)pozwalaąnamodelowanepostawpośrednch.jeśl v estkosztem,todecyząoptymalnąestalterntywa a k taka,że αs k +(1 α)o k = mn{αs +(1 α)o } = mn{α max{v }+(1 α) mn{v }}. 3. Kryterum Savage a- mnmalzaca maksymalnego żalu. Na podstawetablcydecyzyne [v ]konstruuesęnowątablcę [r ]następuąco: { max m r = l=1 {v } v eśl v estzyskem, v mn m l=1{v } eśl v estkosztem. Element r tetablcyestróżncąpomędzyużytecznoścąnalepszedecyzakąnależałobypodąćprzywystąpenustanu θ apodętądecyzą(dla v zysku)możebyćnterpretowanyako żal znepodęcanalepsze decyz.wtablcy r dowyborudecyzoptymalnestosuesękryterum Walda(dlakosztów).Decyząoptymalnąest a k take,że s k = mn{s } = mn{max{r }}. 4. Kryterum Laplace a(1825)- maksymalzaca(lub mnmalzaca, gdy użyteczność est kosztem) wartośc średne. Optymalną decyzą est wybór takealternatywy a k,że n 1 n n v k = max m { 1 =1 n v }. =1 Przykład 1.3. Ośrodek wczasowy przygotowue zapasy żywnośc na nadchodzący weekend.możlwestanynatury θ 1,θ 2,θ 3,θ 4 odpowadaąodpowednoprzyazdow 100,150,200250turystów.Alternatywydecyzynyme a 1,a 2,a 3,a 4 toprzygotowane(zakup) zapasów dla odpowedno 100, 150, 200 250 turystów. Użyteczność v będącakosztemzwązanymzpodęcemalternatywy a wystąpenemstanu θ podanaestwtablcy1.5.optymalnądecyząstosuąckryterumwaldaest =1 v θ 1 θ 2 θ 3 θ 4 s o a 1 5 10 18 25 25 5 a 2 8 7 8 23 23 7 a 3 21 18 12 21 21 12 a 4 30 22 19 15 30 15 Tab. 1.5: Tablca decyzyna dla ośrodka wczasowego wybóralternatywy a 3,dlakryterumHurwcza,gdywspółczynnk α = 0.5alternatywąoptymalnąest a 4.DlakryterumSavage amusmynaperwwyznaczyć tablcę r,którąpodanowtablcy1.6.decyząoptymalnąestwtymprzypadku wybóralternatywy a 2.

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger7 r θ 1 θ 2 θ 3 θ 4 s a 1 0 3 10 10 10 a 2 3 0 0 8 8 a 3 16 8 4 6 16 a 4 25 12 11 0 25 Tab.1.6:Tablcawartośc [r ]dlaośrodkawczasowego 1.2 Drzewadecyzyne 1.3 Gry dwuosobowe o sume zerowe W poprzedno rozpatrywanych sytuacach decyzynych na efekty dzałań decydenta mały wpływ stany natury. Obecne zamemy sę sytuacam, gdy na dzałana decydenta ma wpływ ne natura, którą możemy traktować ako pasywnego oponenta lecz nny raconalne dzałaący decydent. W teor ger obu decydentów nazywamy graczam. Zamować sę będzemy tylko gram dwuosobowym o sume zerowe. W takch grach podemowane przez obu graczy decyze nazywane sa strategam. Efekt(użyteczność) podęca strateg przez ednego gracza, gdy drug gracz wybrał strategę nazywa sę wypłatą oznaczamy przez [w ], = 1,...,m; = 1,...,n.Wgrachosumezerowypłata(wygrana)dla ednego gracza est równa przegrane drugego. Przykład1.4.Mamydwóchgraczy:gracza1gracza2.Każdyznchdysponue trzema strategam 1,2 3. Macerz wypłat podae tabela 1.7 Macerz wypłat Gracz 2 Stratege 1 2 3 1 1 2 4 Gracz1 2 1 0 5 3 0 1-1 Tab.1.7:Macerzwypłatgry1 Macerz wypłat te gry est dość specyfczna rozwązane otrzymamy wykorzystuąc koncepcę strateg zdomnowanych. Mówmy, że stratega est zdomnowana przez strategę k eśl stratega k est co namne tak dobra ak (a czasam lepsza), bez względu na to, co zrob oponent(drug gracz). Formalne strategę będzemy nazywać strategą zdomnowaną przez strategę k, eśl =1,...,n w w k oraz l w l < w kl.

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger8 Natomast k nazywamy strategą domnuącą, eśl: =1,...,n w k = max {w }. Stratege, które ne są zdomnowane przez nne stratege nazywamy strategam nezdomnowanym. Raconalne dzałaący decydent będze dokonywał wyboru spośród strateg nezdomnowanych. Stratega 3 est dla gracza 1 zdomnowaną przez strategę 1, gdyż bez względu na to aką strategę wyberze gracz 2 wypłatagracza1estprzywyborzestrateg3nenższanżwypłataprzywyborze strateg 1. Zatem wersz trzec odpowadaący strateg zdomnowane możemy skreślć z macerzy wypłat. Zredukowana macerz wypłat est podana w tablcy 1.8. Poneważ zakładamy raconalność obu graczy, to gracz 2 też ma strategę zdo- 1 2 3 1 1 2 4 2 1 0 5 Tab. 1.8: Zredukowana macerz gry11 mnowaną 3. Jest ona zdomnowana zarówno przez strategę 1 ak przez strategę 2. Elmnuemy strategę 3 gracza 2 co dae macerz wypłat 1.9: Teraz stratega 2 1 2 1 1 2 2 1 0 Tab. 1.9: Zredukowana macerz gry12 dla gracza 1 est zdomnowana przez strategę 1. Elmnuąc zdomnowaną strategęmamymacerzwypłatpodanąwtablcy1.10:stratega2dlagracza2et 1 2 1 1 2 Tab. 1.10: Zredukowana macerz gry13 zdomnowana przez strategę 1 zatem pownna być wyelmnowana. Ostateczne oba gracze pownn wyberać stratege 1. Gracz 1 otrzyma wtedy wypłatę 1, ta wartość est przegraną gracza 2. Jest to wartość gry. Jeśl wartość gry est 0, to nazywa sę grą sprawedlwą(rozważana gra ne est grą sprawedlwą, gdyż e wartość wynos 1). Koncepca zdomnowanych strateg pozwala na redukcę wymaru macerzy wypłat w nektórych przypadkach pozwala wyznaczyć rozwązane gry. Jednak w wększośc przypadków potrzebuemy nnego podeśca, które zaprezentemy na dwu kolenych przykładach. Przykład 1.5. Rozpatrzymy teraz grę o macerzy wypłat podane w tablcy 1.11

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger9 Macerz wypłat Gracz 2 Stratege 1 2 3 Mnmum 1-3 -2 6-3 Gracz1 2 2 0 2 0 max 3 5-2 -4-4 Maxmum 5 0 6 mn Tab. 1.11: Macerz wypłat gry 2 Wtegrzegracz1stosuącstrategę1możewygrać6alemożerówneżprzegrać 3(wypłata-3). Stosuąc strategę 3 może wygrać 5 ale może przegrać 4. Natomastwstrateg2egowygranabezwzględunatocozrobgracz2będzeconamne0.Analzuącstrategedlagracza2mamy,żewstrategach1 3 ego maksymalna przegrana wynos odpowedno 5 6. natomast w strateg2tylkozero.obagraczepownnzatemwybraćstrategę2,gdyżkażdemuz nch zapewna ona w nagorszym przypadku nalepszy wynk. Jest to tzw. kryterum mnmaksowe standardowo proponowane w teor ger do wyboru strateg optymalne. Według tego kryterum gracz 1 pownen wybrać strategę,dla które mnmalnawypłataestnawększa(t. max mn {w })agracz2strategędla któremaksymalnawypłatagracza1estestnamnesza(t. mn max {w }). W analzowanym przykładze strategą max mn est stratega 2 gracza 1 a strategą mn maxeststratega2dlagracza2.wartośćgryestrówna0,czylestto grasprawedlwa.wtegrzetensamelementmacerzywypłat(w 22 = 0)estednocześne wartoścą max mn wartoścą mn max, czyl mamy element, który est namneszy w werzsu ednocześne nawększy w kolumne. Tak punkt, esl stnee, nazywa sę punktem sodłowym. Jesl gra ma punkt sodłowy, to oba gracza pownn do wyboru strateg optymalne stosować odpowedno max mn mn maxstratege.jednaknekażdagraposadapunktsodłowy-takąestnp. gra3. Wtegrze max mn w = 2 2 = mn max w nesąrównecooznacza, że gra ne posada punktu sodłowego. W te grze nformaca o tym aką strategę wyberze eden z graczy pozwala drugemu poprawć swoą pozycę. Koncepca rozwazana optymalnego w tego typu grach oparta est na poęcu strateg mesznych, które charakteryzuą sę tym, że żaden z graczy ne może wydedukować aką strategę użye oponent.

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger10 Macerz wypłat Gracz 2 Stratege 1 2 3 Mnmum 1 0-2 2-2 max Gracz1 2 5 4-3 -3 3 2 3-4 -4 Maxmum 5 4 2 mn Tab.1.12:Gry3-nemapunktusodłowego 1.3.1 Stratege meszane dla gry bez punktu sodłowego Dla ger ne posadaących punktu sodłowego dla każdego z graczy wyznacza sę rozkłady prawdopodobeństwa na zborach ch strateg. Nech: x = prawdopodobeństwo,żegracz1użyestrateg( = 1,...,m), y = prawdopodobeństwo,żegracz2użyestrateg( = 1,...,n), gdze m =1 x = 1, n =1 y = 1.Wartośc x, = 1,...,moraz y, = 1...,n nazywamy strategam meszanym natomast orygnalne stratege strategam czystym. W trakce gry każdy z graczy wybera strategę czystą ednak pownenwyberaćąwpewenlosowysposóbzgodnyzrozkładem (x 1,x 2,...,x m )dla gracza1rozkładem (y 1,y 2,...,y n )dlagracza2.np.esl (x 1,x 2,x 3 ) = ( 1, 1, 0) 2 2 a (y 1,y 2,y 3 ) = (0, 1, 1),togracz1nepownenwyberaćstrategczyste3a 2 2 wybór strateg 2 lub 3 rozstrzygnąć rzucaąc monetą. Analogczne gracz 2 ne pownen wyberać czyste strateg 1 a wybór pomędzy strategam 2 3 rozstrzygnąć rzucaąc monetą. Przy stosowanu strateg meszanych przez każdego z graczy oczekwaną wygraną gracza 1 est Oczekwana wypłata gracza 1 = m =1 n w x y, gdze w estwypłatąeślgracz1używaczystestrateg agracz2używa czyste strateg. W rozpatrywane poprzedno grze 3 eśl gracze 1 2 stosuąodpowednostrategemeszane (x 1,x 2,x 3 ) = ( 1 2, 1 2, 0)(y 1,y 2,y 3 ) = (0, 1 2, 1 2 ) tooczekwanawypłatagracza1wynos 1 4 ( 2 + 2 + 4 3) = 1 4.Mnmaksowe (mn max) ktyterum dla strateg meszanych mów, że gracz pownen wyberać strategę meszaną, która mnmalzue ego maksymalne oczekwane straty. Równoważne, eśl rozważamy wygraną gracza 1(a ne przegraną gracza 2 co est równoważne) to kryterum to est maksymnowe(max mn), t. maksymalzue sę mnmalną oczekwaną wypłatę gracza 1. Przez mnmalną oczekwaną wypłatę rozume sę namneszą możlwą wypłatę, którę można uzyskać przy dowolne =1

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger11 strateg meszne, podęte przez oponenta. Zatem meszna stratega dla gracza 1 est optymalną, eśl mnmalna oczekwana wypłata est maksymalna. Wartość tą oznaczamy przez w. Dla gracza 2 podobne optymalną strategą meszaną est stratega, która mnmalzue maksymalną oczekwaną wartość przegrane. Wartość tę oznacza sę przez w. Dla ger ne posadaących punktu sodłowego eśl tylko rozpatrue sę czyste stratege, to ne ma rozwązana stablnego. Zachodz wtedy nerówność w < w gracze mogą zmenać stratege, aby poprawć swoą pozycę. Dla strateg meszanych konecznym warunkem, aby rozwązane optymalne było stablne est równość w = w. W grach o sume zerowe ten warunek est zawsze spełnony. Twerdzene 1.1. Para strateg mesznych dla graczy est optymalną daąc stablnerozwązaneprzykryterummnmaksowym,(mn max),gdy w = w = w. Stosuąc te stratege żaden z graczy ne może poprawć swoe pozyc zmenaąc ednostronne swoą strategę. Zastosowane programowana lnowego do wyznaczena rozwazana gry Rozwązane dowolne gry w strategach mesznych można wyznaczyć rozwazuąc pewne zagadnene programowana lnowego. Rozważymy naperw ak wyznaczyć optymalną strategę meszaną gracza 1. Oczekwana wypłata gracza 1 = m n w x y, =1 =1 stratega (x 1,x 1,...,x m )estoptymalnąeśl m =1 n w x y w = w =1 dlakażdestrateg (y 1,y 2,...,y n )gracza2.tanerównośćmusrówneżzachodzć dlaczystychstrategt. (y 1,y 2,...,y n )takch,żeednawspółrzędna y = 1a reszta est zeram. Zatem mamy: m w x wdla = 1,...,n. =1 Co węce ten zbór nerównośc mplkue wyścową nerówność: n m ( w x ) =1 =1 n y w = w, =1

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger12 poneważ n =1 y = 1.Spełnenetychnnerównoścestrównoważnespełnenu wyścowenerównoścdlakażdestrateg y 1,y 2,...,y n.wyznaczeneoptymalne strateg może być zatem sprowadzone do rozwązana następuącego zagadnena programowana lnowego: x m+1 max w 11 x 1 + w 21 x 2 +, +w m1 x m x m+1 0 w 12 x 1 + w 22 x 2 +, +w m2 x m x m+1 0 w 1n x 1 + w 2n x 2 +, +w mn x m x m+1 0 x 1 + x 2 + + x m = 1 x 0,dla = 1, 2,...,m. Zmenna x m+1 zastępueneznanąwartość wwrozwązanuoptymalnymbędze e równa. Jednak na tę zmenną ne est nałożony warunek neuemnośc. Analogczne rozumowane prowadz do następuącego modelu wyznaczana optymalne strateg gracza2: y n+1 max w 11 y 1 + w 12 y 2 +, +w 1n y n y n+1 0 w 21 y 1 + w 22 y 2 +, +w 2n y n y n+1 0 w m1 y 1 + w m2 y 2 +, +w mn y n y n+1 0 y 1 + y 2 + + y n = 1 y 0,dla = 1, 2,...,n. Problem wyznaczena optymalne strateg meszane dla gracza 1 est dualnym do problemu wyznaczana strateg opotymalne gracza 2. Z teerdzeń o dualnośc wemy,żedlaoptymalnychrozwązań x m+1oraz y n+1tychzagadneńmamy,że x m+1 = y n+1czyl x m+1 = y n+1. Zokreslena w wmamy,że w = x m+1oraz y n+1 = wskądotrzymuemyrówność w = w. Pozostae eszcze eden element do rozpatrzena. W podanych modelach lnowychzmenne x m+1,y n+1nesąneuemne.jeślestoczywste,że w 0,to można stosować sympleks. Jeśl tak ne est należy zastosować edną z następuących modyfkac: zamenć zmenną dowolną różncą dwu zmennych neuemnych, zamenć rolam graczy tak, aby wypłata gracza 1 była neuemna,

A. Kaspersk, M. Kule BO- Analza decyz, drzewa decyzyne, elementy teor ger13 dodać do macerzy wypłat pewną stałą(równą np. maksymalne wartośc modułów uemnych wartośc macerzy wypłat), tak aby wartość gry w była neuemną- dodane stałe ne może zmenć optymalnych strateg, a po rozwązanu gry modyfkuemy e wartość o tę welkość. Ostatn sposób ast naczęśce stosowany. Zastosumy teraz programowane lnowe do wyznaczena optymalnych strateg meszanych dla gry 3. Przymemy, że wartość gry est neuemna t. w 0(okaże sę że tak rzeczywśce est) czyl ne będzemy stosować modyfkac macerzy wypłat. Przykład1.6.Wtegrzestratega3dlagracza1estzdomnowanązatempownna być wyelmnowana. Macerz wypłat po usunecu strateg 3 gracza 1 est podanawtablcy1.13modelelnowedlagracza1gracza2sąnastępuące: Macerz wypłat Gracz 2 Stratege 1 2 3 1 0-2 2 Gracz1 2 5 4-3 Tab. 1.13: Gra 3 po wyelmnowanu zdomnowane strateg 3. x 3 max 5x 2 x 3 0 2x 1 + 4x 2 x 3 0 2x 1 3x 2 x 3 0 x 1 + x 2 = 1 x 1, x 2 0. y 4 mn 2y 2 + 2y 3 y 4 0 5y 1 + 4y 2 3y 3 y 4 0 y 1 + y 2 + y 3 = 1 y 1, y 2, y 3 0. Rozwązuąc te modele otrzymuemy dla bgracza 1 optymalne stratege meszane x 1 = 7, 11 x 2 = 4 wartośćgry w = 11 x 3 = 2.Dlagracza2mamy 11 y 1 = 0, y2 = 5, 11 y 3 = 6 oraz w = 11 y 4 = 2.Torozwązanemożnaotrzymaćzrozwązana 11 modelu dla gracza 1 dlatego wystarcza rozwązać tylko eden z tych model, aby otrzymać stratege optymalne dla obu graczy. Rozwązana zostały otrzymane przy założenu,że w 0.Jeślneestspełnonetozałożene,tomodelmożenemeć rozwązana dopuszczalnego. Aby tego unknąć dodaemy do macerzy wypłat stałą 3 odpowedno modyfkuemy ogranczaena. Po rozwązanu wartość tylko gry zmneszamy o 3.