Analiza decyzyjna(ad): tablica decyzyjna, klasyfikacja
|
|
- Grzegorz Kowalewski
- 8 lat temu
- Przeglądów:
Transkrypt
1 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe1 Analiza decyzyjna(ad): tablica decyzyjna, klasyfikacja problemów W celu formalizacji i klasyfikacji problemów decyzyjnych wprowadzimy tzw tablicę decyzyjną. Niech decydent(lub grupa decydentów) ma osiągnąć pewien cel(np. zysk z uprawy swojego pola). Aby go osiągnąć podjmuje pewne działania, które nazywamy strategiami, alternatywami decyzyjnymi lub decyzjami. Zakładamy, żeilośćtychdziałańjest midziałaniateoznaczymy a 1,a 2,...,a m.podejmując dane działanie jego wynik zależy od zewnętrznych dla decydenta n czynników, którenazywamystanaminaturyioznaczamyprzez θ 1,θ 2,...,θ n.pełnyopiskonsekwencjidladecydentapodjęciadziałaniaa i wsytuacji,gdywystąpistannatury θ j oznaczaćbędziemyprzez X ij izapisujesięwpostacinastępującejtablicydecyzyjnej: Alternatywy Stany natury decyzyjne θ 1 θ 2... θ a 1 X 11 X X 1n a 2 X 21 X X 2n a m X m1 X m2... X mn Tab. 1: Ogólna postać tablicy decyzyjnej Przykład 1. Rozważmy osobę, która ma przygotować omlet z 6 jajek. Właśnie wbiłajużdomiski5jaj,któreokazałysiędobrymiizastanawiasięcozrobićz szóstym jajkiem, które może być albo dobre albo zepsute. Tablica 2 podaje możliwe sposoby działania i opis konsekwencji tych działań. Alternatywy Stan natury decyzyjne jajko dobre jajko zepsute zbićjajkodomiski omletz6jaj niemaomletu i 5 jajek zniszczonych zbićjajkodo omletz6jaj omletz5jajek doinnegonaczynia inaczyniedoumycia inaczyniedoumycia wyrzucić jajko omlet z 6 jajek omlet z 5 jajek i jedno jajko zniszczone Tab. 2: Pełny opis konsekwencji problemu decyzyjnego przygotowanie omletu W analizie decyzji stosuje się tablice decyzyjne w których zamiast pełnego opisukonsekwencji X ij używasięmiarywartościkonsekwencji v(x ij )oznaczanej dalejprzez v ij dla i = 1,...,m;j = 1,...,ninazywanejdalejużytecznością.
2 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe2 Miaratapowinnaspełniaćwarunek,że v ij > v kl,gdydladecydentabardziej sprzyjającesąkonsekwencje X ij niżkonsekwencje X kl (mówisięrównież,żedecydentpreferujekonsekwencje X ij wstosunkudokonsekwencji X kl ).Dlatego dalej będą używane tablice decyzyjne w których konsekwencje zostaną zastąpione użytecznością. Postać taką podano w tablicy 3. Alternatywy Stany natury decyzyjne θ 1 θ 2... θ a 1 v 11 v v 1n a 2 v 21 v v 2n a m v m1 v m2... v mn Tab. 3: Postać ogólna tablicy decyzyjnej, w której konsekwencje zastąpiono użytecznością Typy problemów decyzyjnych Wyróżnia się trzy typy problemów decyzyjnych: Problemy decyzyjne w warunkach pewności. Występuje tylko jeden stan natury, którego wystąpienie jest pewne- tablica decyzyjna ma tylko jedną kolumnę. Problemy decyzyjne w warunkach ryzyka. Znane jest prawdopodobieństwo wystąpienia każdego stanu natury. Dla dyskretnych stanów natury θ 1,θ 2,...,θ n prawdopodobieństwaichwystąpieniaoznaczamyprzezp(θ 1 ),P(θ 2 ),...,P(θ n ). Problemy decyzyjne w warunkach niepewności. Znane są sposoby postępowania decydenta i potrafimy zidentyfikować wszystkie możliwe stany natury ale nie wiemy nic o prawdziwym stanie natury. W zależności od typu problemu decyzyjnego stosowane są różne kryteria wyboru decyzji optymalnej(rozwiązania optymalnego). Kryteria wyboru decyzji w warunkach pewności W problemach w warunkach pewności decyzją optymalną jest alternatywa o najbardziej sprzyjającej dla decydenta wartości użyteczności(co sprowadza się do wyboru elementu maksymalnego lub minimalnego w tablicy decyzyjnej o jednej kolumnie).
3 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe3 Kryteria wyboru decyzji w problemach w warunkach ryzyka W problemach w warunkach ryzyka racjonalne kryterium wyboru optymalnej decyzjipoleganawyborzetakiejalternatywydecyzyjnej a k,któramaksymalizuje (lub minimalizuje, gdy użyteczność jest kosztem) wartość średnią użyteczności tj. n j=1 P(θ j )v kj = m max i=1 n P(θ j )v ij Przykład 2. Sprzedawca truskawek kupuje na plantacji koszyczek truskawek za 3zł.asprzedajeza8zł.Sprzedanykoszykprzynosimuzatem5zł.zyskuanie sprzedany stratę 3zł. Z doświadczenia wie, że dzienny popyt może wynosić 10, 11,12lub13koszyczków.Z90obserwacji,którezgromadziłwie,żew18przypadkachdziennypopytkształtowałsięnapoziomie10,w36napoziomie11,w 27napoziomie12iw9napoziomie13koszyczków.Jeśliprzez a i oznaczymy alternatywęzakupnaplantacji 10 + (i 1)koszyczkówtruskawek,przez θ i -popytdziennynapoziomie 10 + (i 1)(i = 1,2,3,4)koszyczkówaużytecznością będzie dzienny zysk sprzedawcy, to tablicą decyzyjną jest tablica 4. W tej tablicy j=1 Zysk θ 1 θ 2 θ 3 θ 4 EV(a i ) a a a a Rozkład Tab. 4: Tablica decyzyjna sprzedawcy truskawek EV(a i )oznaczawartośćśredniąużytecznościalternatywy a i.decyzjąoptymalnąjestwybóralternatywy a 3,któradajemaksymalnyoczekiwanyzyskwynoszący EV(a 3 ) = Niech X będzie dyskretną zmienną losową rozkładu stanów natury(tj. wielkości popytu na truskawki w problemie sprzedawcy truskawek) przyjmującą wartości q,q + 1,...,Qorozkładzie P(x)dla x = q,q + 1,...,Qidystrybuancie F(x) = P(X x).wartośćśredniaużytecznościalternatywy a i,jestwartością średniąfunkcjizmiennejlosowej X.Oznaczmyprzez d(z),z = q,q + 1,...,Q wartość średnią zysku sprzedawcy, gdy zakupił na plantacji z koszyczków truskawek(tj. EV(a i ) = d(z),gdzie z = 10+i 1,i = 1,2,3,4).Oznaczmyprzez azysk jaki osiąga sprzedawca z jednego sprzedanego koszyczka a przez b stratę na jednymniesprzedanymkoszyczku(dlarozpatrywanegoprzykładu a = 5,b = 3).Załóżmy, że sprzedawca zakupił z 1 koszyczków(jego średni zysk wynosi d(z 1)). Dokupienie dodatkowo jednego koszyczka truskawek przyniesie stratę b jeśli popyt
4 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe4 xbędzie x z 1.Prawdopodobieństwotegozdarzeniawynosi P(X z 1). Natomiastprzyniesiezysk ajeślipopyt xbędzie x > z 1.Tozdarzeniema prawdopodobieństwo 1 F(z 1). Mamy zatem rekurencyjny wzór: d(z) = d(z 1)+a[1 F(z 1)] bf(z 1) = d(z 1)+a (a+b)f(z 1) (z = q +1,q +2,...,Q.) Dla z = qmamy d(q) = aq. Dla sprzedawcy truskawek mamy: EV(a 1 ) = d(z = 10) = 5 10 = 50 EV(a 2 ) = d(11) = d(10)+5 (5+3)F(10) = = 53.4 EV(a 3 ) = d(12) = d(11)+5 8F(11) = = 53.6 EV(a 4 ) d(13) = d(12)+5 8F(12) = = 51.4 Optymalną strategię można również wyznaczyć wzorem analitycznym. Jeśli strategiąoptymalnąjestwybóralternatywypolegającejnazakupie k koszyczków, to z własności maksimum lokalnego mamy, że d(k ) d(k 1) F(k 1) a a+b d(k ) d(k +1) a a+b F(k ) Stąd mamy F(k 1) a a+b F(k ) Wartość k spełniającatęnierównośćjestoptymalnądecyzją.tenostatnisposób wyznaczania alternatywy optymalnej jest najoszczędniejszy. Dla sprzedawcy truskawek mamy a a+b = = i 0.4 = F(11) F(12) = 0.9, czylioptymalnąalternatywąjestzakup12koszyczków (k = 12). W problmach w warunkach ryzyka wprowadza się pojęcie oczekiwanej wartości pewnej informacji(evpi). Sposób jej obliczania podamy na przykładzie problemu sprzedawcy truskawek. Załóżmy, że sprzedawca może z całą pewnością przewidzieć zajście danego stanu natury(ma pewną prognozę odnośnie stanów natury).wtedypowinienwybieraćalterntywę a 1 dlastanu θ 1, a 2 dla θ 2, a 3 dla θ 3 i a 4 dla θ 4.Ponieważznarozkładprawdopodobieństwastanównatury,towartość oczekiwana użyteczności wyniesie wtedy: = 56,5.
5 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe5 Bez znajomości tej prognozy wartość oczekiwana zysku wynosi 53,6. Różnica =2.9 definiuje oczekiwaną wartość pewnej informacji, czyli EVPI=2.9. Wartość tę możemy interpretować jako maksymalną kwotę, którą można wydać za pewną prognozę. Kryteria wyboru decyzji w warunkach niepewności Danajesttablicadecyzyjnadlaproblemuzfunkcjąużyteczności v ij (funkcjątą może być zysk lub koszt). Kryterium Walda- wybór alternatywy dla której najmniej sprzyjający rezultat jest dla decydenta najkorzystniejszy(maksymalizacja minimalnego zysku,gdyużyteczność v ij jestzyskiem).dlakażdejalternatywy a i, i = 1,...,mwyznaczasiędwiewielkości:najbardziejsprzyjającydladecydentarezultat o i oraznajmniejsprzyjającyrezultat s i.jeśliużyteczność v ij jestzyskiem,to o i = max{v ij }oraz s i = min{v ij } j j natomiast,gdyużyteczność v ij jestkosztem,to o i = min{v ij }oraz s i = max{v ij }. j j Decyzjąoptymalnąjestalternatywa a k taka,że s k = max i s i = max i min j {v ij }jeśli v ij jestnp.zyskiem lub s k = mins i = minmax{v ij }jeśli v ij jestnp.kosztem i i j Kryterium to jest najbardziej konserwatywne- decydent wybiera alternatywę, w której najgorszy(najmniej sprzyjający) rezultat będzie dla niego najkorzystniejszy spośród wszystkich alternatyw. Nie wszyscy decydenci wykazują taką postawę względem ryzyka. Niektórzy decydenci mogą preferować alternatywy dla których najbardziej sprzyjający rezultat jest najkorzystniejszytj,wybieraćalternatywę a k dlaktórej o k = maxo i = max max{v ij } i i j Większość decydentów wykazuje mniej skrajne postawy. Kryterium następne(hurwicza) zakłada, że postawę decydenta wykazywaną we wszystkich problemach można scharakteryzować przez pewien współczynnik(nazywany współczynnikiem ostrożności).
6 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe6 Kryterium Hurwicza- wybór alternatywy o najkorzystniejszej dla decydenta średniej ważonej z najmniej i najbardziej sprzyjającego rezultatu(maksymalizacja-gdy v ij jestzyskiem-średniejważonejznajmniejinajbardziej sprzyjającegorezultatu).jeśli v ij jestzyskiem,todecyzjąoptymalnąjest alternatywa a k taka,że αs k +(1 α)o k = max{αs i +(1 α)o i } = max{αmin{v ij }+(1 α)max{v ij }}, i i j j gdzie α jest współczynnikiem charakteryzującym decydenta. Dla α = 1 kryterium jest identyczne z kryterium Walda, czyli jest najbardziej zachowawczym, dla α = 0 mamy najbardziej optymistyczne kryterium. Wartości αzprzedziału(0,1)pozwalająnamodelowaniepostawpośrednich.jeśli v ij jestkosztem,todecyzjąoptymalnąjestalterntywa a k taka,że αs k +(1 α)o k = min{αs i +(1 α)o i } = min{αmax{v ij }+(1 α)min{v ij }}. i i j j Kryterium Savage a- minimalizacja maksymalnego żalu. Na podstawie tablicydecyzyjnej [v ij ]konstruujesięnowątablicę [r ij ]następująco: r ij = { max m l=1 {v ij } v ij jeśli v ij jestzyskiem, v ij min m l=1{v ij } jeśli v ij jestkosztem. Element r ij tejtablicyjestróżnicąpomiędzyużytecznościąnajlepszejdecyzjijakąnależałobypodjąćprzywystąpieniustanu θ j apodjętądecyzją(dla v ij zysku)imożebyćinterpretowanyjako żal zniepodjęcianajlepszej decyzji.wtablicy r ij dowyborudecyzjioptymalnejstosujesiękryterium Walda(dlakosztów).Decyzjąoptymalnąjest a k takie,że s k = min{s i } = min{max{r ij }}. i i j Kryterium Laplace a(1825)- maksymalizacja(lub minimalizacja, gdy użyteczność jest kosztem) wartości średniej. Optymalną decyzją jest wybór takiejalternatywy a k,że n 1 n n v kj = max m { 1 i=1 n v ij}. j=1 Przykład 3. Ośrodek wczasowy przygotowuje zapasy żywności na nadchodzący weekend.możliwestanynatury θ 1,θ 2,θ 3,θ 4 odpowiadająodpowiednioprzyjazdowi 100,150,200i250turystów.Alternatywydecyzyjnyme a 1,a 2,a 3,a 4 toprzygotowanie(zakup) zapasów dla odpowiednio 100, 150, 200 i 250 turystów. Użyteczność v ij będącakosztemzwiązanymzpodjęciemalternatywy a i iwystąpieniemstanu θ j podana jest w tablicy 5. Optymalną decyzją stosując kryterium Walda jest wybór j=1
7 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe7 v ij θ 1 θ 2 θ 3 θ 4 s i o i a a a a Tab. 5: Tablica decyzyjna dla ośrodka wczasowego r ij θ 1 θ 2 θ 3 θ 4 s i a a a a Tab.6:Tablicawartości [r ij ]dlaośrodkawczasowego alternatywy a 3,dlakryteriumHurwicza,gdywspółczynnik α = 0.5alternatywą optymalnąjest a 4.DlakryteriumSavage amusimynajpierwwyznaczyćtablicę r ij,którąpodanowtablicy6.decyzjąoptymalnąjestwtymprzypadkuwybór alternatywy a 2. Drzewa decyzyjne- DD Do analizy problemów decyzyjnych szczególnie w sytuacjach, gdy mamy do czynienia z decyzjami wieloetapowymi szczególnie stosuje się tzw. drzewa decyzyjne. Ich definicję i zastosowanie podamy na przykładzie. Przykład 4. Inwestor T.B. Puckett nabył firmę produkującą materiały tekstylne. Teraz zastanawia się nad przyszłością tej firmy. Rozważa trzy warianty decyzji: 1. Rozbudować fabrykę i produkować lekkie, trwałe materiały, przeznaczone na rynek wojskowy, na którym nie ma dużej zagranicznej konkurencji. 2. Utrzymać ststus quo, nadal produkując materiały tekstylne, w której to branży istnieje ostra zagraniczna konkurencja. 3. Natychmiast sprzedać fabrykę. W przypadku wyboru jednego z pierwszych dwóch wariantów decyzji fabryka zostaniesprzedanaporoku.zyskzesprzedażyfabrykiporokuzależyodwarunkówna rynku zagranicznym i od losów ustawy o embargu handlowym. Sytuacja decyzyjna jest przedstawiona w tabeli decyzyjnej 7. Rozważany problem możemy zapisać w postaci drzewa decyzyjnego(rys.), w którym wyróżniamy węzły: decyzyjne(oznaczone kwadratem), losowe(oznaczone
8 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe8 Stany natury Dobre warunki na Złe warunki na Decyzja rynku zagranicznym rynku zagranicznym Rozbudować zł zł. Utrzymać stan obecny zł zł. Sprzedać natychmiast zł zł. Tab. 7: Tablica decyzyja firmy Puckett większymi kółkami) oraz końcowe(oznaczone małymi kólłkami). Z węzła decyzyjnego1wychodzą3krawędziedowęzłówlosowych2,3i4.krawędzieteoznaczają alternatywy decyzyjne. Z każdego węzła losowego wychodzą dwie krawędzie odpowiadające możliwym stanom natury tj. dobrym z prawdopodobieństem 0.7 i złym z prawdopodobieństwem 0,3 warunkom na rynkach zagranicznych. Węzły końcowe mają przypisane wartości zysku odpowiadającego sytuacji, gdy decydent podejmie jakąś decyzję i zajdzie określany stan natury. Liczby przy węzłach losowych są wartościami oczekiwanymi zysku przy wyborze przez decydenta odpowiedniej decyzji. Z drzewa decyzyjnego możemy odczytać, że decyzją optymalna dla pana Packetta jest wybór alternatywy zachować stan obecny, która daje mu oczekiwany zysk wynoszacy zł. Rozważymy teraz sytuację, gdy w problemie decyzyjnym oprócz danych prawdopodobieństw stanów, które nazywa się prawdopodobieństwami a priori dysponujemy dodatkowymi informacjami tzw. prawdopodobieństwami a posteriori. W rozważanym poprzednio problemie załóżmy, że pan Packett wynajął firmę kosultingową do opracowania raportu o politycznej i rynkowej sytuacji w przyszłości. Raport będzie albo pozytywny(p) albo negatywny(n), wskazując na dobre(g) albo złe(p) przyszłe warunki na rynku zagranicznym. Warunkowe prawdopodobieństwa uzyskania każdej z ocen stanu rynku przy danych stanach natury są następujące: Pr(P/g) = 0.7 Pr(N/g) = 0.3; Pr(P/p) = 0.2, Pr(N/p) = 0.8. Te prawdopodobieństwa warunkowe pozwalają wyznaczyć(korzystając ze wzoru
9 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe9 Dobre warunki(0.7) zł zł. Rozbudować 2 Złe warunki(0.3) zł. 1 Status quo zł. Dobre warunki(0.7) 3 Złe warunki(0.3) zł zł. Sprzedać Dobre warunki(0.7) zł zł. 4 Złe warunki(0.3) zł. Rys. 1: Drzewo decyzyjne Puckett Bayes a) prawdopodobieństwa a posteriori. P r(p/g)p r(g) Pr(g/P) = Pr(P/g)Pr(g)+Pr(P/p)Pr(p) (1) (0.7)(0.7) = (0.7)(0.7) +(0.2)(0.3) (2) = (3) Pr(p/P) = (4) P r(n/g)p r(g) Pr(g/N) = Pr(N/g)Pr(g)+Pr(N/p)Pr(p) (5) (0.3)(0.7) = (0.3)(0.7) +(0.8)(0.3) (6) = (7) Pr(p/N) = (8)
10 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe10 Znajomość tych prawdopodobieństw pozwala na skonstruowanie drzewa decyzyjnego z prawdopodobieństwami a posteriori i przeprowadzenie analizy w celu wyznaczenia strategii optymalnej. Nowe drzewo decyzyjne ma węzeł początkowy(jest to węzeł losowy) 1, z którego wychodzą dwie krawędzie odpowiadającę dwóm możliwym stanom natury(raport pozytywny lub negatywny). Następnie mamydwawęzłydecyzyjne2i3zktórychwychodząpotrzykrawędzieodpowiadające decyzjom, jakie decydent może podjąc. Krawędzie te prowadzą do węzłów losowych 4,5,6,7,8 i 9, z każego z nich wychodzą po dwie krawędzie(odpowiadające dwóm stanom natury) do węzłów końcowych. Drzewo decyzyjne wraz wartościami oczekiwanych wypłat(zysku) dla węzłów podaje rys Pozytywny Pr(P)=0.55 Rozbudowa Status quo Sprzedaz Pr(g/P)=0.891 Pr(p/P)=0.109 Pr(g/P)=0.891 Pr(p/P)=0.109 Pr(g/P)=0.891 Pr(p/P)= Pr(N)=0.45 Negatywny Rozbudowa Status quo 7 8 Pr(g/N)=0.467 Pr(p/N)=0.533 Pr(g/N)=0.467 Pr(p/N)= Sprzedaz zł. 9 Pr(g/N)=0.467 Pr(p/N)= Rys. 2: Drzewo decyzyjne z prawdopodobieństwami a posteriori Z analizy dzrzewa możemy odczytać strategię optymalną. Jeśli raport będzie pozytywny, to decydent powinien wybrać alternetywę Status quo, która przy-
11 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe11 niesie mu największy oczekiwany zysk zł. Natomiast w przypadku otrzymania rapotru negatywnego powinien wybrać alternatywę Rozbudować, dla której oczekiwany zysk wynosi zł. Takie postępowanie jest optymalne, decydent w ten sposób zapewnia sobie oczekiwany zysk wynoszący zł. Bez tej dodatkowej informacji(znajomości prawdopodobieństw a posteriori ) jego oczekiwany zysk wynosi tylko zł. Gry dwuosobowe o sumie zerowej W poprzednio rozpatrywanych sytuacjach decyzyjnych na efekty działań decydenta miały wpływ stany natury. Obecnie zajmiemy się sytuacjami, gdy na działania decydenta ma wpływ nie natura, którą możemy traktować jako pasywnego oponenta lecz inny racjonalnie działający decydent. W teorii gier obu decydentów nazywamy graczami. Zajmować się będziemy tylko grami dwuosobowymi o sumie zerowej. W takich grach podejmowane przez obu graczy decyzje nazywane sa strategiami. Efekt(użyteczność) podjęcia strategii i przez jednego gracza, gdy drugi gracz wybrał strategię j nazywa się wypłatą i oznaczamy przez [w ij ], i = 1,...,m; j = 1,...,n.Wgrachosumiezerowypłata(wygrana)dla jednego gracza jest równa przegranej drugiego. Przykład5.Mamydwóchgraczy:gracza1igracza2.Każdyznichdysponuje trzema strategiami 1,2 i 3. Macierz wypłat podaje tabela 8 Macierz wypłat Gracz 2 Strategie Gracz Tab.8:Macierzwypłatgry1 Macierz wypłat tej gry jest dość specyficzna i rozwiązanie otrzymamy wykorzystując koncepcję strategii zdominowanych. Mówimy, że strategia i jest zdominowana przez strategię k jeśli strategia k jest co najmniej tak dobra jak i(a czasami lepsza), bez względu na to, co zrobi oponent(drugi gracz). Formalnie strategię i będziemy nazywać strategią zdominowaną przez strategię k, jeśli j=1,...,n w ij w kj oraz l w il < w kl. Natomiast k nazywamy strategią dominującą, jeśli: j=1,...,n w kj = max i {w ij }.
12 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe12 Strategie, które nie są zdominowane przez inne strategie nazywamy strategiami niezdominowanymi. Racjonalnie działający decydent będzie dokonywał wyboru spośród strategii niezdominowanych. Strategia 3 jest dla gracza 1 zdominowaną przez strategię 1, gdyż bez względu na to jaką strategię wybierze gracz 2 wypłatagracza1jestprzywyborzestrategii3nieniższaniżwypłataprzywyborze strategii 1. Zatem wiersz trzeci odpowiadający strategii zdominowanej możemy skreślić z macierzy wypłat. Zredukowana macierz wypłat jest podana w tablicy 9. Ponieważ zakładamy racjonalność obu graczy, to gracz 2 też ma strategię zdomi Tab. 9: Zredukowana macierz gry11 nowaną 3. Jest ona zdominowana zarówno przez strategię 1 jak i przez strategię 2. Eliminujemy strategię 3 gracza 2 co daje macierz wypłat 10: Teraz strategia Tab. 10: Zredukowana macierz gry12 dla gracza 1 jest zdominowana przez strategię 1. Eliminując zdominowaną strategięmamymacierzwypłatpodanąwtablicy11:strategia2dlagracza2jet Tab. 11: Zredukowana macierz gry13 zdominowana przez strategię 1 zatem powinna być wyeliminowana. Ostatecznie obaj gracze powinni wybierać strategie 1. Gracz 1 otrzyma wtedy wypłatę 1, ta wartość jest przegraną gracza 2. Jest to wartość gry. Jeśli wartość gry jest 0, to nazywa się grą sprawiedliwą(rozważana gra nie jest grą sprawiedliwą, gdyż jej wartość wynosi 1). Koncepcja zdominowanych strategii pozwala na redukcję wymiaru macierzy wypłat i w niektórych przypadkach pozwala wyznaczyć rozwiązanie gry. Jednak w większości przypadków potrzebujemy innego podejścia, które zaprezentjemy na dwu kolejnych przykładach. Przykład 6. Rozpatrzymy teraz grę o macierzy wypłat podanej w tablicy 12 Wtejgrzegracz1stosującstrategię1możewygrać6alemożerównieżprzegrać 3(wypłata-3). Stosując strategię 3 może wygrać 5 ale może przegrać 4. Natomiastwstrategii2jegowygranabezwzględunatocozrobigracz2będzieco
13 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe13 Macierz wypłat Gracz 2 Strategie Minimum Gracz max Maximum min Tab.12:Macierzwypłatgry2 Macierz wypłat Gracz 2 Strategie Minimum max Gracz Maximum min Tab.13:Gra3-niemapunktusiodłowego najmniej0.analizującstrategiedlagracza2mamy,żewstrategiach1i3jego maksymalna przegrana wynosi odpowiednio 5 i 6. natomiast w strategii 2 tylko zero. Obaj gracze powinni zatem wybrać strategię 2, gdyż każdemu z nich zapewnia ona w najgorszym przypadku najlepszy wynik. Jest to tzw. kryterium minimaksowe standardowo proponowane w teorii gier do wyboru strategii optymalnej. Według tego kryterium gracz 1 powinien wybrać strategię,dla której minimalnawypłatajestnajwiększa(tj. max i min j {w ij })agracz2strategiędlaktórejmaksymalnawypłatagracza1jestjestnajmniejsza(tj. min i max j {w ij }).W analizowanym przykładzie strategią max min jest strategia 2 gracza 1 a strategią minmaxjeststrategia2dlagracza2.wartośćgryjestrówna0,czylijesttogra sprawiedliwa.wtejgrzetensamelementmacierzywypłat(w 22 = 0)jestjednocześnie wartością max min i wartością min max, czyli mamy element, który jest najmniejszy w wierzsu i jednocześnie największy w kolumnie. Taki punkt, jesli istnieje, nazywa się punktem siodłowym. Jesli gra ma punkt siodłowy, to obaj gracza powinni do wyboru strategii optymalnej stosować odpowiednio max min i minmaxstrategie.jednakniekażdagraposiadapunktsiodłowy-takąjestnp. gra3. Wrozważanejpoprzedniogrzewartościmax i min j w ij = 2 2 = min i max j w ij
14 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe14 niesąrównecooznacza,żegranieposiadapunktusiodłowego.wtejgrzeinformacja o tym jaką strategię wybierze jeden z graczy pozwala drugiemu poprawić swoją pozycję. Koncepcja rozwiazania optymalnego w tego typu grach oparta jest na pojęciu strategii miesznych, które charakteryzują się tym, że żaden z graczy nie może wydedukować jaką strategię użyje oponent. Strategie mieszane dla gry bez punktu siodłowego Dla gier nie posiadających punktu siodłowego dla każdego z graczy wyznacza się rozkłady prawdopodobieństwa na zbiorach ich strategii. Niech: x i = prawdopodobieństwo,żegracz1użyjestrategiii(i = 1,...,m), y j = prawdopodobieństwo,żegracz2użyjestrategiij(j = 1,...,n), gdzie m i=1 x i = 1, n j=1 y j = 1.Wartości x i,i = 1,...,moraz y j,j = 1...,n nazywamy strategiami mieszanymi natomiast oryginalne strategie strategiami czystymi. W trakcie gry każdy z graczy wybiera strategię czystą jednak powinienwybieraćjąwpewienlosowysposóbzgodnyzrozkładem (x 1,x 2,...,x m )dla gracza1irozkładem (y 1,y 2,...,y n )dlagracza2.np.jesli (x 1,x 2,x 3 ) = ( 1, 1,0) 2 2 a (y 1,y 2,y 3 ) = (0, 1, 1),togracz1niepowinienwybieraćstrategiiczystej3a 2 2 wybór strategii 2 lub 3 rozstrzygnąć rzucając monetą. Analogicznie gracz 2 nie powinien wybierać czystej strategii 1 a wybór pomiędzy strategiami 2 i 3 rozstrzygnąć rzucając monetą. Przy stosowaniu strategii mieszanych przez każdego z graczy oczekiwaną wygraną gracza 1 jest Oczekiwana wypłata gracza 1 = m n w ij x i y j, i=1 j=1 gdzie w ij jestwypłatąjeśligracz1używaczystejstrategii iagracz2używa czystej strategii j. W rozpatrywanej poprzednio grze 3 jeśli gracze 1 i 2 stosująodpowiedniostrategiemieszane (x 1,x 2,x 3 ) = ( 1 2, 1 2,0)i(y 1,y 2,y 3 ) = (0, 1 2, 1 2 ) tooczekiwanawypłatagracza1wynosi 1 4 ( ) = 1 4.Minimaksowe (min max) ktyterium dla strategii mieszanych mówi, że gracz powinien wybierać strategię mieszaną, która minimalizuje jego maksymalne oczekiwane straty. Równoważnie, jeśli rozważamy wygraną gracza 1(a nie przegraną gracza 2 co jest równoważne) to kryterium to jest maksyminowe(max min), tj. maksymalizuje się minimalną oczekiwaną wypłatę gracza 1. Przez minimalną oczekiwaną wypłatę rozumie się najmniejszą możliwą wypłatę, którę można uzyskać przy dowolnej strategii miesznej, podjętej przez oponenta. Zatem mieszna strategia dla gracza 1 jest optymalną, jeśli minimalna oczekiwana wypłata jest maksymalna. Wartość tą oznaczamy przez w. Dla gracza 2 podobnie optymalną strategią mieszaną jest strategia, która minimalizuje maksymalną oczekiwaną wartość przegranej. Wartość tę oznacza się przez w. Dla gier nie posiadających punktu siodłowego jeśli
15 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe15 tylko rozpatruje się czyste strategie, to nie ma rozwiązania stabilnego. Zachodzi wtedy nierówność w < w i gracze mogą zmieniać strategie, aby poprawić swoją pozycję. Dla strategii mieszanych koniecznym warunkiem, aby rozwiązanie optymalnebyłostabilnejestrówność w = w.wgrachosumiezerowejtenwarunek jest zawsze spełniony. Twierdzenie 1. Para strategii miesznych dla graczy jest optymalną dając stabilnerozwiązanieprzykryteriumminimaksowym,(minmax),gdy w = w = w. Stosując te strategie żaden z graczy nie może poprawić swojej pozycji zmieniając jednostronnie swoją strategię. Zastosowanie programowania liniowego do wyznaczenia rozwiązania gry Rozwiązanie dowolnej gry w strategiach miesznych można wyznaczyć rozwiazując pewne zagadnienie programowania liniowego. Rozważymy najpierw jak wyznaczyć optymalną strategię mieszaną gracza 1. Oczekiwana wypłata gracza 1 = m n w ij x i y j, i=1 j=1 istrategia (x 1,x 1,...,x m )jestoptymalnąjeśli m i=1 n w ij x i y j w = w j=1 dlakażdejstrategii(y 1,y 2,...,y n )gracza2.tanierównośćmusirównieżzachodzić dlaczystychstrategiitj. (y 1,y 2,...,y n )takich,żejednawspółrzędna y j = 1a reszta jest zerami. Zatem mamy: m w ij x i wdla j = 1,...,n. i=1 Co więcej ten zbiór nierówności implikuje wyjściową nierówność: n m y j ( w ij x i ) j=1 i=1 n y j w = w, i=1 ponieważ n j=1 y j = 1.Spełnienietychnnierównościjestrównoważnespełnieniu wyjściowejnierównościdlakażdejstrategiiy 1,y 2,...,y n.wyznaczenieoptymalnej strategii może być zatem sprowadzone do rozwiązania następującego zagadnienia
16 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe16 programowania liniowego: x m+1 max w 11 x 1 +w 21 x 2 +,+w m1 x m x m+1 0 w 12 x 1 +w 22 x 2 +,+w m2 x m x m+1 0 w 1n x 1 +w 2n x 2 +,+w mn x m x m+1 0 x 1 +x 2 + +x m = 1 x i 0,dla i = 1,2,...,m. Zmienna x m+1 zastępujenieznanąwartość wiwrozwiązaniuoptymalnymbędzie jej równa. Jednak na tę zmienną nie jest nałożony warunek nieujemności. Analogiczne rozumowanie prowadzi do następującego modelu wyznaczania optymalnej strategii gracza2: y n+1 max w 11 y 1 +w 12 y 2 +,+w 1n y n y n+1 0 w 21 y 1 +w 22 y 2 +,+w 2n y n y n+1 0 w m1 y 1 +w m2 y 2 +,+w mn y n y n+1 0 y 1 +y 2 + +y n = 1 y i 0,dla i = 1,2,...,n. Problem wyznaczenia optymalnej strategii mieszanej dla gracza 1 jest dualnym do problemu wyznaczania strategii opotymalnej gracza 2. Z twierdzeń o dualności wiemy,żedlaoptymalnychrozwiązań x m+1oraz y n+1tychzagadnieńmamy,że x m+1 = y n+1czyli x m+1 = y n+1. Zokreslenia wi wmamy,że w = x m+1oraz y n+1 = wskądotrzymujemyrówność w = w. Pozostaje jeszcze jeden element do rozpatrzenia. W podanych modelach liniowychzmienne x m+1,y n+1niesąnieujemne.jeślijestoczywiste,że w 0,to można stosować sympleks. Jeśli tak nie jest należy zastosować jedną z następujących modyfikacji: zamienić zmienną dowolną różnicą dwu zmiennych nieujemnych, zamienić rolami graczy tak, aby wypłata gracza 1 była nieujemna, dodać do macierzy wypłat pewną stałą(równą np. maksymalnej wartości modułów ujemnych wartości macierzy wypłat), tak aby wartość gry w była nieujemną- dodanie stałej nie może zmienić optymalnych strategii, a po rozwiązaniu gry modyfikujemy jej wartość o tę wielkość.
17 A. Kasperski, M. Kulej, BO: Analiza decyzji, drzewa decyzyjnie, gry dwuosobowe17 Ostatni sposób jast najczęściej stosowany. Zastosujmy teraz programowanie liniowe do wyznaczenia optymalnych strategii mieszanych dla gry 3. Przyjmiemy, żewartośćgryjestnieujemnatj. w 0(okażesiężetakrzeczywiściejest)czyli nie będziemy stosować modyfikacji macierzy wypłat. Przykład7.Wtejgrzestrategia3dlagracza1jestzdominowanązatempowinna być wyeliminowana. Macierz wypłat po usunieciu strategii 3 gracza 1 jest podana wtablicy14modeleliniowedlagracza1igracza2sąnastępujące: Macierz wypłat Gracz 2 Strategie Gracz Tab. 14: Gra 3 po wyeliminowaniu zdominowanej strategii 3. x 3 max 5x 2 x 3 0 2x 1 +4x 2 x 3 0 2x 1 3x 2 x 3 0 x 1 +x 2 = 1 x 1, x 2 0. y 4 min 2y 2 +2y 3 y 4 0 5y 1 +4y 2 3y 3 y 4 0 y 1 +y 2 +y 3 = 1 y 1, y 2, y 3 0. Rozwiązując te modele otrzymujemy dla bgracza 1 optymalne strategie mieszane x 1 = 7, 11 x 2 = 4 iwartośćgry w = 11 x 3 = 2.Dlagracza2mamy 11 y 1 = 0, y2 = 5, 11 y 3 = 6 oraz w = 11 y 4 = 2.Torozwiązaniemożnaotrzymaćzrozwiązania 11 modelu dla gracza 1 dlatego wystarcza rozwiązać tylko jeden z tych modeli, aby otrzymać strategie optymalne dla obu graczy. Rozwiązania zostały otrzymane przy założeniu,że w 0.Jeśliniejestspełnionetozałożenie,tomodelmożeniemieć rozwiązania dopuszczalnego. Aby tego uniknąć dodajemy do macierzy wypłat stałą 3 i odpowiednio modyfikujemy ograniczaenia. Po rozwiązaniu tylko wartość gry zmnieszamy o 3.
1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów
A. Kasperski, M. Kulej BO- Analiza decyzji, drzewa decyzyjnie 1 1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów W celu formalizacji i klasyfikacji problemów decyzyjnych wprowadzimy tzw tablicę
1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów
A. Kasperski, M. Kulej- AD, drzewa decyzyjne, teoria gier 1 1 Analiza decyzji- tablica decyzyjna, klasyfikacja problemów Tablica decyzyjna. Niech a 1, a 2,...,a m -działania,strategie,alternatwydecyzyjne,
Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.
GRY (część 1) Zastosowanie: Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony. Najbardziej znane modele: - wybór strategii marketingowych przez konkurujące ze sobą firmy
D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO
D. Miszczyńska, M.Miszczyński KBO UŁ GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO Gra w sensie niżej przedstawionym to zasady którymi kierują się decydenci. Zakładamy, że rezultatem gry jest wypłata,
TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ
TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ Definicja gry o sumie zerowej Powiemy, że jest grą o
Teoria gier. wstęp. 2011-12-07 Teoria gier Zdzisław Dzedzej 1
Teoria gier wstęp 2011-12-07 Teoria gier Zdzisław Dzedzej 1 Teoria gier zajmuje się logiczną analizą sytuacji, gdzie występują konflikty interesów, a także istnieje możliwość kooperacji. Zakładamy zwykle,
A. Kasperski, M. Kulej Badania Operacyjne- programowanie liniowe 1
A. Kasperski, M. Kulej Badania Operacyjne- programowanie liniowe ZAGADNIENIE DUALNE Z każdym zagadnieniem liniowym związane jest inne zagadnienie nazywane dualnym. Podamy teraz teraz jak budować zagadnienie
11. Gry Macierzowe - Strategie Czyste i Mieszane
11. Gry Macierzowe - Strategie Czyste i Mieszane W grze z doskonałą informacją, gracz nie powinien wybrać akcję w sposób losowy (o ile wypłaty z różnych decyzji nie są sobie równe). Z drugiej strony, gdy
Elementy teorii gier. Badania operacyjne
2016-06-12 1 Elementy teorii gier Badania operacyjne Plan Przykład Definicja gry dwuosobowej o sumie zerowej Macierz gry Strategie zdominowane Mieszane rozszerzenie gry Strategie mieszane Rozwiązywanie
Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.
TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą
TEORIA GIER W NAUKACH SPOŁECZNYCH Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą Przypomnienie Gry w postaci macierzowej i ekstensywnej Gry o sumie zerowej i gry o sumie niezerowej Kryterium dominacji
Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?
/9/ Zagadnienie transportowe Optymalizacja w procesach biznesowych Wykład --9 Plan wykładu Przykład zagadnienia transportowego Sformułowanie problemu Własności zagadnienia transportowego Metoda potencjałów
Czym jest użyteczność?
Czym jest użyteczność? W teorii gier: Ilość korzyści (czy też dobrobytu ), którą gracz osiąga dla danego wyniku gry. W ekonomii: Zdolność dobra do zaspokajania potrzeb. Określa subiektywną przyjemność,
TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ
TEORI GIER W EKONOMII WYKŁD 5: GRY DWUOSOOWE KOOPERCYJNE O SUMIE NIESTŁEJ dr Robert Kowalczyk Katedra nalizy Nieliniowej Wydział Matematyki i Informatyki UŁ Gry dwumacierzowe Skończoną grę dwuosobową o
Wyznaczanie strategii w grach
Wyznaczanie strategii w grach Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Definicja gry Teoria gier i konstruowane na jej podstawie programy stanowią jeden z głównych
Zagadnienie transportowe
9//9 Zagadnienie transportowe Optymalizacja w procesach biznesowych Wykład Plan wykładu Przykład zagadnienia transportowego Sformułowanie problemu Własności zagadnienia transportowego Metoda potencjałów
PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI
Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 5 PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI 5.2. Ćwiczenia komputerowe
8. Podejmowanie Decyzji przy Niepewności
8. Podejmowanie Decyzji przy Niepewności Wcześniej, losowość (niepewność) nie była brana pod uwagę (poza przypadkiem ubezpieczenia życiowego). Na przykład, aby brać pod uwagę ryzyko że pożyczka nie zostanie
Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 2
Przedsiębiorczość i Podejmowanie Ryzyka Zajęcia 2 Reguły podejmowania decyzji w warunkach niepewności Wybór spośród A1, A2,, Am alternatyw (decyzji dopuszczalnych, opcji, działań), gdzie relatywna użyteczność
ZAGADNIENIE TRANSPORTOWE(ZT)
A. Kasperski, M. Kulej BO Zagadnienie transportowe 1 ZAGADNIENIE TRANSPORTOWE(ZT) Danychjest pdostawców,którychpodażwynosi a 1, a 2,...,a p i q odbiorców,którychpopytwynosi b 1, b 2,...,b q.zakładamy,że
Programowanie celowe #1
Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem
TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ
TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ Gry dwuosobowe z kooperacją Przedstawimy
ZAGADNIENIE TRANSPORTOWE
ZAGADNIENIE TRANSPORTOWE ZT jest specyficznym problemem z zakresu zastosowań programowania liniowego. ZT wykorzystuje się najczęściej do: optymalnego planowania transportu towarów, przy minimalizacji kosztów,
Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego
Instytut Informatyki Uniwersytetu Śląskiego Wykład 4 - Gry o sumie zero Gry o sumie zero Dwuosobowe gry o sumie zero (ogólniej: o sumie stałej) były pierwszym typem gier dla których podjęto próby ich rozwiązania.
Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe
Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe Teorię gier można określić jako teorię podejmowania decyzji w szczególnych warunkach. Zajmuje się ona logiczną analizą sytuacji konfliktu
Standardowe zadanie programowania liniowego. Gliwice 1
Standardowe zadanie programowania liniowego 1 Standardowe zadanie programowania liniowego Rozważamy proces, w którym zmiennymi są x 1, x 2,, x n. Proces poddany jest m ograniczeniom, zapisanymi w postaci
Wielokryteriowa optymalizacja liniowa
Wielokryteriowa optymalizacja liniowa 1. Przy decyzjach złożonych kierujemy się zwykle więcej niż jednym kryterium. Postępowanie w takich sytuacjach nie jest jednoznaczne. Pojawiło się wiele sposobów dochodzenia
D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1
D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe Gra w sensie niżej przedstawionym to zasady którymi kierują się decydenci. Zakładamy, że rezultatem gry jest wypłata, którą zgodnie
Optymalizacja decyzji
Optymalizacja decyzji Dr hab. inż Adam Kasperski, prof. PWr. Pokój 509, budynek B4 adam.kasperski@pwr.edu.pl Materiały do zajęć będa dostępne na stronie www.ioz.pwr.wroc.pl/pracownicy/kasperski Forma zaliczenia
Badania operacyjne. te praktyczne pytania, na które inne metody dają odpowiedzi jeszcze gorsze.
BADANIA OPERACYJNE Badania operacyjne Badania operacyjne są sztuką dawania złych odpowiedzi na te praktyczne pytania, na które inne metody dają odpowiedzi jeszcze gorsze. T. Sayty 2 Standardowe zadanie
Gry o sumie niezerowej
Gry o sumie niezerowej Równowagi Nasha 2011-12-06 Zdzisław Dzedzej 1 Pytanie Czy profile równowagi Nasha są dobrym rozwiązaniem gry o dowolnej sumie? Zaleta: zawsze istnieją (w grach dwumacierzowych, a
Programowanie liniowe
Badania operacyjne Problem Model matematyczny Metoda rozwiązania Znaleźć optymalny program produkcji. Zmaksymalizować 1 +3 2 2 3 (1) Przy ograniczeniach 3 1 2 +2 3 7 (2) 2 1 +4 2 12 (3) 4 1 +3 2 +8 3 10
Podejmowanie decyzji w warunkach niepełnej informacji. Tadeusz Trzaskalik
Podejmowanie deczji w warunkach niepełnej informacji Tadeusz Trzaskalik 5.. Wprowadzenie Słowa kluczowe Niepełna informacja Stan natur Macierz wpłat Podejmowanie deczji w warunkach rzka Podejmowanie deczji
Elementy Modelowania Matematycznego
Elementy Modelowania Matematycznego Wykład 6 Metoda simpleks Spis treści Wstęp Zadanie programowania liniowego Wstęp Omówimy algorytm simpleksowy, inaczej metodę simpleks(ów). Jest to stosowana w matematyce
Problemy oceny alternatyw w warunkach niepewności
Problemy oceny alternatyw w warunkach niepewności Statystyczne metody oceny alternatyw Rozpatrzmy sytuacje, w których decyzja pociąga za sobą korzyść lub stratę Tę sytuację nazywać będziemy problemem decyzyjnym,
METODA SYMPLEKS. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski
METODA SYMPLEKS Maciej Patan Uniwersytet Zielonogórski WSTĘP Algorytm Sympleks najpotężniejsza metoda rozwiązywania programów liniowych Metoda generuje ciąg dopuszczalnych rozwiązań x k w taki sposób,
Modele i narzędzia optymalizacji w systemach informatycznych zarządzania
Politechnika Poznańska Modele i narzędzia optymalizacji w systemach informatycznych zarządzania Joanna Józefowska POZNAŃ 2010/11 Spis treści Rozdział 1. Gry dwuosobowe i gry z naturą............... 5
Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami
Teoria gier Teoria gier jest częścią teorii decyzji (czyli gałęzią matematyki). Teoria decyzji - decyzje mogą być podejmowane w warunkach niepewności, ale nie zależą od strategicznych działań innych Teoria
Definicja problemu programowania matematycznego
Definicja problemu programowania matematycznego minimalizacja lub maksymalizacja funkcji min (max) f(x) gdzie: x 1 x R n x 2, czyli: x = [ ] x n przy ograniczeniach (w skrócie: p.o.) p.o. g i (x) = b i
Układy równań i nierówności liniowych
Układy równań i nierówności liniowych Wiesław Krakowiak 1 grudnia 2010 1 Układy równań liniowych DEFINICJA 11 Układem równań m liniowych o n niewiadomych X 1,, X n, nazywamy układ postaci: a 11 X 1 + +
Badania operacyjne i teorie optymalizacji
Badania operacyjne i teorie optymalizacji dr Zbigniew Karwacki Wydział Ekonomiczno-Socjologiczny Katedra Badań Operacyjnych Centrum Informatyczno-Ekonometryczne pok. E-137 Środa, 16.30-18.00 zakarwacki@uni.lodz.pl
Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:
Elementy teorii gier Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik: wylosowanie karty w kolorze czerwonym (kier lub karo) oznacza wygraną
Programowanie liniowe
Programowanie liniowe Maciej Drwal maciej.drwal@pwr.wroc.pl 1 Problem programowania liniowego min x c T x (1) Ax b, (2) x 0. (3) gdzie A R m n, c R n, b R m. Oznaczmy przez x rozwiązanie optymalne, tzn.
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym
A. Kasperski, M. Kulej, Badania operacyjne, Wykład 4, Zagadnienie transportowe1
A. Kasperski, M. Kulej, Badania operacyjne, Wykład 4, Zagadnienie transportowe ZAGADNIENIE TRANSPORTOWE(ZT) Danychjest pdostawców,którychpodażwynosi a,a 2,...,a p i qodbiorców, którychpopytwynosi b,b 2,...,b
Metoda simpleks. Gliwice
Sprowadzenie modelu do postaci bazowej Sprowadzenie modelu do postaci bazowej Przykład 4 Model matematyczny z Przykładu 1 sprowadzić do postaci bazowej. FC: ( ) Z x, x = 6x + 5x MAX 1 2 1 2 O: WB: 1 2
Gry z naturą 1. Przykład
Gry z naturą 1 Gry z naturą to gry dwuosobowe, w których przeciwnikiem jest natura. Przeciwnik ten nie jest zainteresowany wynikiem gry, a więc grę rozwiązuje się z punktu widzenia jednego z graczy. Optymalną
Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego
Instytut Informatyki Uniwersytetu Śląskiego Wykład 2 - Gry o sumie zero Gry o sumie zero Dwuosobowe gry o sumie zero (ogólniej: o sumie stałej) były pierwszym typem gier dla których podjęto próby ich rozwiązania.
Programowanie liniowe
Programowanie liniowe Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW wykład z algebry liniowej Warszawa, styczeń 2010 Mirosław Sobolewski (UW) Warszawa, 2009 1 / 15 Homo oeconomicus=
Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością. 04.01.2012r.
mgr inż. Anna Skowrońska-Szmer Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością 04.01.2012r. 1. Cel prezentacji 2. Biznesplan podstawowe pojęcia 3. Teoria gier w
O MACIERZACH I UKŁADACH RÓWNAŃ
O MACIERZACH I UKŁADACH RÓWNAŃ Problem Jak rozwiązać podany układ równań? 2x + 5y 8z = 8 4x + 3y z = 2x + 3y 5z = 7 x + 8y 7z = Definicja Równanie postaci a x + a 2 x 2 + + a n x n = b gdzie a, a 2, a
Wykład z modelowania matematycznego. Zagadnienie transportowe.
Wykład z modelowania matematycznego. Zagadnienie transportowe. 1 Zagadnienie transportowe zostało sformułowane w 1941 przez F.L.Hitchcocka. Metoda rozwiązania tego zagadnienia zwana algorytmem transportowymópracowana
Programowanie nieliniowe
Rozdział 5 Programowanie nieliniowe Programowanie liniowe ma zastosowanie w wielu sytuacjach decyzyjnych, jednak często zdarza się, że zależności zachodzących między zmiennymi nie można wyrazić za pomocą
Elementy Modelowania Matematycznego
Elementy Modelowania Matematycznego Wykład 12 Teoria gier II Spis treści Wstęp Oligopol, cła oraz zbrodnia i kara Strategie mieszane Analiza zachowań w warunkach dynamicznych Indukcja wsteczna Gry powtarzane
TOZ -Techniki optymalizacji w zarządzaniu
TOZ -Techniki optymalizacji w zarządzaniu Wykład dla studentów II roku studiów II stopnia na kierunku Zarządzanie Semestr zimowy 2009/2010 Wykładowca: prof. dr hab. inż. Michał Inkielman Wykład 2 Optymalizacja
Ubezpieczenia majątkowe
Funkcje użyteczności a składki Uniwersytet Przyrodniczy we Wrocławiu Instytut Nauk Ekonomicznych i Społecznych 2016/2017 Funkcja użyteczności Niech ω wielkość majątku decydenta wyrażona w j.p., u (ω) stopień
TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w
TEORIA GIER GRA DEFINICJA (VON NEUMANN, MORGENSTERN) Gra składa się z zestawu reguł określających możliwości wyboru postępowania jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w
Mikroekonomia II: Kolokwium, grupa II
Mikroekonomia II: Kolokwium, grupa II Prowadząca: Martyna Kobus 2012-06-11 Piszemy 90 minut. Sprawdzian jest za 70 punktów. Jest 10 pytań testowych, każde za 2 punkty (łącznie 20 punktów za test) i 3 zadania,
Optymalizacją wielokryterialną nazwiemy próbę znalezienia wektora zmiennych decyzyjnych: x = [x 1
1 Optymalizacją wielokryterialną nazwiemy próbę znalezienia wektora zmiennych decyzyjnych: x = [x 1,x 2,,x k ], który spełnia warunki ograniczające: g i (x) 0 (i = 1 m), h i (x) = 0 (i = 1 p) oraz optymalizuje
Notatki do tematu Metody poszukiwania rozwiązań jednokryterialnych problemów decyzyjnych metody dla zagadnień liniowego programowania matematycznego
Notatki do tematu Metody poszukiwania rozwiązań jednokryterialnych problemów decyzyjnych metody dla zagadnień liniowego programowania matematycznego część III Analiza rozwiązania uzyskanego metodą simpleksową
Rozdział 1 PROGRAMOWANIE LINIOWE
Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 1 PROGRAMOWANIE LINIOWE 1.2 Ćwiczenia komputerowe Ćwiczenie 1.1 Wykorzystując
PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM. cz. 6. dr BOŻENA STARUCH
PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM cz. 6 dr BOŻENA STARUCH bostar@matman.uwm.edu.pl Optymalizacja wielokryterialna Optymalizacją wielokryterialną nazwiemy próbę znalezienia
10. Wstęp do Teorii Gier
10. Wstęp do Teorii Gier Definicja Gry Matematycznej Gra matematyczna spełnia następujące warunki: a) Jest co najmniej dwóch racjonalnych graczy. b) Zbiór możliwych dezycji każdego gracza zawiera co najmniej
Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje
Egzamin z Wstępu do Teorii Gier 19 styczeń 2016, sala A9, g. 11.40-13.10 Wykładowca: dr Michał Lewandowski Instrukcje 1) Egzamin trwa 90 minut. 2) Proszę wyraźnie zapisać swoje imię, nazwisko oraz numer
Wielokryteriowa optymalizacja liniowa cz.2
Wielokryteriowa optymalizacja liniowa cz.2 Metody poszukiwania końcowych rozwiązań sprawnych: 1. Metoda satysfakcjonujących poziomów kryteriów dokonuje się wyboru jednego z kryteriów zadania wielokryterialnego
Formy kwadratowe. Rozdział 10
Rozdział 10 Formy kwadratowe Rozważmy rzeczywistą macierz symetryczną A R n n Definicja 101 Funkcję h : R n R postaci h (x) = x T Ax (101) nazywamy formą kwadratową Macierz symetryczną A występującą w
Programowanie liniowe
Programowanie liniowe Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW wykład z algebry liniowej Warszawa, styczeń 2015 Mirosław Sobolewski (UW) Warszawa, 2015 1 / 16 Homo oeconomicus=
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
ZAGADNIENIE DUALNE Rozważmy zagadnienie liniowe(zagadnienie to nazywamy prymalnym) o postaci kanonicznej:
A Kasperski, M Kulej Badania Operacyjne- programowanie liniowe 1 ZAGADNIENIE DUALNE Rozważmy zagadnienie liniowe(zagadnienie to nazywamy prymalnym) o postaci kanonicznej: max z = c 1 x 1 + c 2 x 2 + +
Programowanie liniowe. Tadeusz Trzaskalik
Programowanie liniowe Tadeusz Trzaskalik .. Wprowadzenie Słowa kluczowe Model matematyczny Cel, środki, ograniczenia Funkcja celu funkcja kryterium Zmienne decyzyjne Model optymalizacyjny Układ warunków
2010 W. W. Norton & Company, Inc. Oligopol
2010 W. W. Norton & Company, Inc. Oligopol Oligopol Monopol jedna firma na rynku. Duopol dwie firmy na rynku. Oligopol kilka firm na rynku. W szczególności decyzje każdej firmy co do ceny lub ilości produktu
Rozdział 3 ZADANIE TRANSPORTOWE I PROBLEM KOMIWOJAŻERA
Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 3 ZADANIE TRANSPORTOWE I PROBLEM KOMIWOJAŻERA 3.2. Ćwiczenia komputerowe
PROGRAMOWANIE KWADRATOWE
PROGRAMOWANIE KWADRATOWE Programowanie kwadratowe Zadanie programowania kwadratowego: Funkcja celu lub/i co najmniej jedno z ograniczeń jest funkcją kwadratową. 2 Programowanie kwadratowe Nie ma uniwersalnej
doc. dr Beata Pułska-Turyna Zarządzanie B506 mail: mgr Piotr J. Gadecki Zakład Badań Operacyjnych Zarządzania B 505.
doc. dr Beata Pułska-Turyna Zakład Badań Operacyjnych Zarządzanie B506 mail: turynab@wz.uw.edu.pl mgr Piotr J. Gadecki Zakład Badań Operacyjnych Zarządzania B 505. Tel.: (22)55 34 144 Mail: student@pgadecki.pl
Baza w jądrze i baza obrazu ( )
Przykład Baza w jądrze i baza obrazu (839) Znajdź bazy jądra i obrazu odwzorowania α : R 4 R 3, gdzie α(x, y, z, t) = (x + 2z + t, 2x + y 3z 5t, x y + z + 4t) () zór ten oznacza, że α jest odwzorowaniem
Krzywe Freya i Wielkie Twierdzenie Fermata
Krzywe Freya i Wielkie Twierdzenie Fermata Michał Krzemiński 29 listopad 2006 Naukowe Koło Matematyki Politechnika Gdańska 1 1 Krzywe algebraiczne Definicja 1.1 Krzywą algebraiczną C nad ciałem K nazywamy
Schemat programowania dynamicznego (ang. dynamic programming)
Schemat programowania dynamicznego (ang. dynamic programming) Jest jedną z metod rozwiązywania problemów optymalizacyjnych. Jej twórcą (1957) był amerykański matematyk Richard Ernest Bellman. Schemat ten
ZAGADNIENIA PROGRAMOWANIA LINIOWEGO
ZAGADNIENIA PROGRAMOWANIA LINIOWEGO Maciej Patan Uniwersytet Zielonogórski WSTĘP często spotykane w życiu codziennym wybór asortymentu produkcji jakie wyroby i w jakich ilościach powinno produkować przedsiębiorstwo
I. KARTA PRZEDMIOTU CEL PRZEDMIOTU
I. KARTA PRZEDMIOTU 1. Nazwa przedmiotu: SYSTEMY WSPOMAGANIA DECYZJI. Kod przedmiotu: Ecs 3. Jednostka prowadząca: Wydział Mechaniczno-Elektryczny. Kierunek: Mechatronika 5. Specjalność: Techniki Komputerowe
Programowanie liniowe całkowitoliczbowe. Tadeusz Trzaskalik
Programowanie liniowe całkowitoliczbowe Tadeusz Trzaskalik .. Wprowadzenie Słowa kluczowe Rozwiązanie całkowitoliczbowe Założenie podzielności Warunki całkowitoliczbowości Czyste zadanie programowania
Metoda graficzna może być stosowana w przypadku gdy model zawiera dwie zmienne decyzyjne. Metoda składa się z dwóch kroków (zobacz pierwszy wykład):
może być stosowana w przypadku gdy model zawiera dwie zmienne decyzyjne. Metoda składa się z dwóch kroków (zobacz pierwszy wykład): 1 Narysuj na płaszczyźnie zbiór dopuszczalnych rozwiazań. 2 Narysuj funkcję
13 Układy równań liniowych
13 Układy równań liniowych Definicja 13.1 Niech m, n N. Układem równań liniowych nad ciałem F m równaniach i n niewiadomych x 1, x 2,..., x n nazywamy koniunkcję równań postaci a 11 x 1 + a 12 x 2 +...
Podejmowanie decyzji w warunkach ryzyka. Tomasz Brzęczek Wydział Inżynierii Zarządzania PP
Podejmowanie decyzji w warunkach ryzyka Tomasz Brzęczek Wydział Inżynierii Zarządzania PP Ryzyko decyzyjne. Przez ryzyko decyzyjne rozumiemy zmienność wyniku decyzji przedsiębiorstwa spowodowaną losowością
BADANIA OPERACYJNE pytania kontrolne
DUALNOŚĆ 1. Podać twierdzenie o dualności 2. Jaka jest zależność pomiędzy funkcjami celu w zadaniu pierwotnym i dualnym? 3. Prawe strony ograniczeń zadania pierwotnego, w zadaniu dualnym są 4. Współczynniki
Elementy Modelowania Matematycznego
Elementy Modelowania Matematycznego Wykład 8 Programowanie nieliniowe Spis treści Programowanie nieliniowe Zadanie programowania nieliniowego Zadanie programowania nieliniowego jest identyczne jak dla
Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak
Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych Mikroekonomia w zadaniach Gry strategiczne mgr Piotr Urbaniak Teoria gier Dział matematyki zajmujący się badaniem optymalnego zachowania w
Elementy teorii gier
Elementy teorii gier. Podaj wszystkie czyste równowagi Nasha. Zaznacz pary strategii, które są Pareto optymalne. U 2,3-2,7 D 6,-5 0,- U 2,3-2,7 D 6,-5 3,5 2. Pewien ojciec ma dwóch synów. Umierając zostawia
1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.
Rozdział 4 Uczenie się w grach Na dzisiejszym wykładzie robimy krok w tył w stosunku do tego, o czym mówiliśmy przez ostatnie tygodnie. Dotychczas mówiliśmy o dowolnych grach wieloetapowych, dziś opowiem
ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania
ZADANIE 1/GRY Zadanie: Dwaj producenci pewnego wyrobu sprzedają swe wyroby na rynku, którego wielkość jest stała. Aby zwiększyć swój udział w rynku (przejąć część klientów konkurencyjnego przedsiębiorstwa),
Rozpoznawanie obrazów
Rozpoznawanie obrazów Ćwiczenia lista zadań nr 5 autorzy: A. Gonczarek, J.M. Tomczak Przykładowe problemy Klasyfikacja binarna Dla obrazu x zaproponowano dwie cechy φ(x) = (φ 1 (x) φ 2 (x)) T. Na obrazie
Wprowadzenie do badań operacyjnych - wykład 2 i 3
Wprowadzenie do badań operacyjnych - wykład 2 i 3 Hanna Furmańczyk 14 listopada 2008 Programowanie liniowe (PL) - wszystkie ograniczenia muszą być liniowe - wszystkie zmienne muszą być ciągłe n j=1 c j
Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f
Zadanie. W kolejnych latach t =,,,... ubezpieczony charakteryzujący się parametrem ryzyka Λ generuje N t szkód. Dla danego Λ = λ zmienne N, N, N,... są warunkowo niezależne i mają (brzegowe) rozkłady Poissona:
Zadania 1. Czas pracy przypadający na jednostkę wyrobu (w godz.) M 1. Wyroby
Zadania 1 Przedsiębiorstwo wytwarza cztery rodzaje wyrobów: A, B, C, D, które są obrabiane na dwóch maszynach M 1 i M 2. Czas pracy maszyn przypadający na obróbkę jednostki poszczególnych wyrobów podany
Układy równań liniowych
Układy równań liniowych Niech K będzie ciałem. Niech n, m N. Równanie liniowe nad ciałem K z niewiadomymi (lub zmiennymi) x 1, x 2,..., x n K definiujemy jako formę zdaniową zmiennej (x 1,..., x n ) K
Gry dwuosobowe o sumie zerowej i ich zastosowanie
Uniwersytet Łódzki Wydział Matematyki i Informatyki Joanna Sujka Nr albumu: 314325 Gry dwuosobowe o sumie zerowej i ich zastosowanie Praca magisterska na kierunku MATEMATYKA w zakresie TEORII GIER Praca
Procesy stochastyczne WYKŁAD 2-3. Łańcuchy Markowa. Łańcuchy Markowa to procesy "bez pamięci" w których czas i stany są zbiorami dyskretnymi.
Procesy stochastyczne WYKŁAD 2-3 Łańcuchy Markowa Łańcuchy Markowa to procesy "bez pamięci" w których czas i stany są zbiorami dyskretnymi. 2 Łańcuchem Markowa nazywamy proces będący ciągiem zmiennych
Dłuższy przykład: Dwie firmy, Zeus i Atena, produkują sprzęt muzyczny. Zeus jest większy, Atena jest ceniona za HF. Wprowadzają nowy produkt, np.
Dłuższy przykład: Dwie firmy, Zeus i Atena, produkują sprzęt muzyczny. Zeus jest większy, Atena jest ceniona za HF. Wprowadzają nowy produkt, np. kula wyłożona głośnikami od wewnątrz. Popyt jest nieznany:
1 Macierze i wyznaczniki
1 Macierze i wyznaczniki 11 Definicje, twierdzenia, wzory 1 Macierzą rzeczywistą (zespoloną) wymiaru m n, gdzie m N oraz n N, nazywamy prostokątną tablicę złożoną z mn liczb rzeczywistych (zespolonych)
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
MODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN Szkoła Wyższa Psychologii Społecznej d.wojcik@nencki.gov.pl dwojcik@swps.edu.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/