Podejmowanie decyzji w warunkach niepewności W stronę teorii decyzji 2011-12-29 Zdzisław Dzedzej 1
2011-12-29 Zdzisław Dzedzej 2
Rybołówstwo na Jamajce W.C. Davenport, Jamaican fishing: a game theory analysis, w I.Rouse (ed.), Papers in Caribbean Anthropology #59, Yale Univ. Press 1960, s. 3-11. Łowiska wewnętrzne leżały w odległości 8-24 km od brzegu; wszystkie zewnętrzne znajdowały się dalej. Ze względu na ukształtowanie dna morza oraz przebieg linii brzegowej w wodach zewnętrznych łowisk regularnie wzbudzały się bardzo silne prądy, tak w kierunku zachodnim, jak i wschodnim. Pojawianie się prądów [ ] nie było w żaden widoczny sposób powiązane z pogodą lub stanem morza w okolicy. Na łowiskach wewnętrznych prądy te były w zasadzie nieodczuwalne 2011-12-29 Zdzisław Dzedzej 3
Analiza strategii Dowódcy łodzi mogli stosować trzy strategie: wewnętrzną ( w) wszystkie kosze na łowiskach wewnętrznych zewnętrzną ( z) wszystkie kosze na łowiskach zewnętrznych pośrednią (p) część koszy na wewnętrznych, część na zewnętrznych Ponieważ dopłynięcie do łowisk zewnętrznych było czasochłonne, załogi stosujące strategie z i p ustawiały mniej koszy. Aktywność prądów przynosiła szkody: boje były przesuwane, kosze uszkadzane, ryby ginęły wskutek zmian temperatury. Połowy na łowiskach zewnętrznych dawały lepsze ryby (większe i różnych gatunków). W odpowiedniej ilości mogłyby wyprzeć te z wewnętrznych łowisk. Do wypływania na łowiska zewnętrzne potrzebne były lepsze łodzie. Rybacy łowiący na wewnętrznych łowiskach często kupują używane łodzie od tych, którzy łowią dalej. 2011-12-29 Zdzisław Dzedzej 4
Tabela gry Wypłaty odpowiadają średniemu dochodowi w funtach sterlingach, uzyskiwanemu przez dowódcę łodzi w ciągu miesiąca. Dane zbierano, zanim zdecydowano się na analizę narzędziami teorii gier! Możemy potraktować tabelę jako macierz gry 3 2, wyznaczyć optymalną strategię rybaków i porównać ją z rzeczywistym postępowaniem mieszkańców wioski. Prądy aktyw ne Prądy nieak tywne W 17,3 11,5 Z -4,4 20,6 P 5,2 17,0 5 Zdzisław Dzedzej 2011-12-29
Rozwiązanie gry 20 20 Rozwiązując odpowiednią podgrę 2 2 znajdujemy optymalną strategię rybaków: 15 w 0,67w+0,33p Optymalna strategia prądów: Akt 0,31 + nieakt 0,69. p Wartość gry wynosi 13,3. 0 5 z z Rzeczywiste obserwacje zachowań rybaków: 69% stosowało strategię w, zaś 31% strategię p.!!! Wniosek: społeczność wioski skutecznie zaadoptowała się do lokalnych warunków naturalnych i ekonomicznych. -5-5 6 Zdzisław Dzedzej 2011-12-29
Krytyka Przez długi czas analiza Davenporta była przyjęta bez zastrzeżeń i cytowana szeroko. W 1969 Kozelka, 1970 Read, Read wskazali, że przeciwnikiem rybaków jest zjawisko przyrodnicze, Czyli gracz nieracjonalny, zatem nie zmieniający strategii. Znając mieszaną strategię prądów 0,25A+0,75 NA powinni maksymalizować swoją wartość oczekiwaną: W: 0,25 17,3+0,75 11,5=12,95 Z: 0,25 (-4,4)+0,75 20,6=14,35 P: 0,25 5,2+0,75 17,0=14,05 Zatem wszyscy rybacy powinni łowić na łowiskach zewnętrznych! Bagnato w 1974 zaproponował wyjaśnienie zachowań rybaków tym, że Z jest zbyt ryzykowna. Jeśli w którymś roku aktywność wynosi np. 35%, to wartości oczekiwane wyniosą odpowiednio 13,53, 11,85 i 12,87. Zakładając,że minimalny poziom dochodów wynosi np. ok. 13 funtów miesięcznie, strategia minimaksowa go zapewnia nawet w okresie zwiększonej aktywności prądów. 2011-12-29 Zdzisław Dzedzej 7
Literatura W.C. Davenport, Jamaican fishing: a game theory analysis, w I.Rouse (ed.), Papers in Caribbean Anthropology #59, Yale Univ. Press 1960, s. 3-11. R. Bagnato, A reinterpretation of Davenport s game theory analysis, American Anthropologist 76(1974), 65-66. R. Kozelka, A Bayesian approach to Jamaican fishing, w Buchler, Nutini (ed.), Game Theory in Behavioral Sciences, Univ. of Pittsburgh Press 1969. D. C. Read, C.E. Read, A critique of Davenport s game theory analysis, American Anthropologist 72(1970), s. 351-355. 2011-12-29 Zdzisław Dzedzej 8
Gry przeciw Naturze Krytyka ekspertów 2011-12-29 Zdzisław Dzedzej 9
Dwa typy gier Jeżeli znamy rozkład prawdopodobieństwa strategii nieracjonalnego przeciwnika, ale nie jesteśmy go całkowicie pewni, to możemy przeprowadzić analizę wrażliwości czyli sprawdzenie, czy wybór zmieni się, gdy zastosujesz inne uważane za możliwe rozkłady prawdopodobieństw. Drugi typ, gdy nie jesteśmy w stanie sensownie przypisać strategiom Natury żadnych konkretnych prawdopodobieństw 2011-12-29 Zdzisław Dzedzej 10
Przykład gry macierzowej Rozważmy grę, w której my jesteśmy Wierszem, a Kolumną jest gracz nieracjonalny, to znaczy rozkład prawdopodobieństwa jego zachowań jest całkowicie niepewny (nazwiemy go Naturą). W poprzednim przykładzie mieliśmy tego typu sytuację w krótkim okresie czasu Znając prawdopodobieństwa, możemy stosować kryterium wartości oczekiwanej do znalezienia najlepszej odpowiedzi. A B C D A 2 2 0 1 B 1 1 1 1 C 0 4 0 0 D 1 3 0 0 2011-12-29 Zdzisław Dzedzej 11
Ekspert nr 1 P. S. de Laplace (1812): Wybierz wiersz z najwyższą średnią wypłat ( równoważnie z najwyższą sumą wypłat). Zasada braku dostatecznej racji Sumy wynoszą odpowiednio 5,4,4,4, zatem należy wybrać wiersz A 2011-12-29 Zdzisław Dzedzej 12
Ekspert nr 2 A. Wald (1950): Dla każdego wiersza wyznacz minimalną wypłatę i wybierz wiersz z największym minimum. To kryterium maksyminowe daje strategię różną od rozwiązania w sensie teorii gier. Możemy je nazwać kryterium pesymistów. Daje B 2011-12-29 Zdzisław Dzedzej 13
Ekspert nr 3 L. Hurwicz (~ 1950): Wybierz współczynnik optymizmu 0 α 1, oblicz dla wierszy α max +(1- α) min i wybierz ten wiersz gdzie to jest największe. Staramy się maksymalizować najwyższą możliwą wypłatę U nas np. gdy α=¾, mamy dla A 1,5, dla B 1,0, dla C 3,0, dla D 2,25. Zatem należy wybrać strategię C. 2011-12-29 Zdzisław Dzedzej 14
Ekspert nr 4 L. J. Savage (1954) Wyznacz maksima wierszy w macierzy strat. Wyznacz wiersz, którego maksimum jest najmniejsze. Zasada minimalizacji maksymalnej straty. Wybierz D, żebyś nie żałował za bardzo. 2011-12-29 Zdzisław Dzedzej 15
Kryterium minimalizacji strat Tworzymy macierz strat: Wartość w tabelce odpowiada różnicy między maksymalnej w kolumnie a odpowiednią wartością w oryginalnej macierzy Otrzymujemy dolną macierz i stosujemy kryterium Savage a: Z liczb 2, 3, 2, 1 najmniesza jest ostatnia, co daje wybór : D. Argument psychologiczny: minimalizujemy poczucie straty A B C D A 2 2 0 1 B 1 1 1 1 C 0 4 0 0 D 1 3 0 0 A B C D A 0 2 1 0 B 1 3 0 0 C 2 0 1 1 D 1 1 1 1 2011-12-29 Zdzisław Dzedzej 16
Referencje ekspertów Pierre Simon de Laplace, Theorie Analitique des Probabilites, Paris 1812. Abraham Wald, Statistical Decision Functions, Wiley 1950. Leonid Hurwicz, laureat nagrody Nobla z ekonomii, 2007 L. J. Savage, The Foundations of Statstics, Wiley 1954. 2011-12-29 Zdzisław Dzedzej 17
Metoda aksjomatyczna Spróbujemy sformalizować warunki, jakie powinny spełniać dobre metody gry przeciwko Naturze w postaci aksjomatów. Źródło: J. Milnor, Games against Nature, w: Thrall i in. (ed.) Decision Processes, Wiley 1954. 18 2011-12-29 Zdzisław Dzedzej
Aksjomaty oczywiste Aksjomat 1. Symetryczność. Zamiana kolejności wierszy lub kolumn nie powinna mieć wpływu na wybór najlepszej strategii. Aksjomat 2. Silna Dominacja. Jeśli każda wypłata w wierszu X jest większa niż odpowiadająca jej wypłata w wierszu Y, kryterium nie powinno wskazać na Y. Aksjomat 3. Liniowość. Wybrana strategia nie powinna się zmienić, jeśli wszystkie wartości w macierzy zostaną pomnożone przez dodatnią stałą, bądź też zostanie do nich dodana jakaś stała. Wszystkie kryteria spełniają aksjomaty 1-3. 2011-12-29 Zdzisław Dzedzej 19
Aksjomat 4. Duplikacja kolumny. Wybrana strategia nie powinna się zmienić, gdy do macierzy dodamy kolumnę identyczną z jedną z istniejących uprzednio kolumn. Dany stan Natury nie będzie bardziej prawdopodobny tylko dlatego, że go dwukrotnie wymienimy. Kryteria Walda, Savage a i Hurwicza spełniają aksjomat 4, ale kryterium Laplace a nie (wystarczy zduplikować kolumnę B, a kryterium to wskaże na strategię C zamiast strategii A ). 2011-12-29 Zdzisław Dzedzej 20
Aksjomat 5. Niezmienniczość względem premii. Wybrana strategia nie ulegnie zmianie, jeżeli do każdej wypłaty w jednej z kolumn dodać stałą. Ta premia (lub kara) ze strony Natury nie zależy od wyboru naszej strategii, więc nie powinna wpływać na naszą decyzję. Kryteria Laplace a i Savage a są zgodne z aksomatem 5. Kryterium Walda nie (dodaj 2 w kolumnie C i 1 w kolumnie D, a kryterium wskaże strategię A). Kryterium Hurwicza po dodaniu 4 do kolumny C wskaże B, czyli też nie spełnia aksjomatu 5. 2011-12-29 Zdzisław Dzedzej 21
Kryterium Walda i aksjomat 5 A B C D A 2 2 2 1 B 1 1 3 1 C 0 4 2 0 D 1 3 2 0 Górna macierz po dodaniu 2 w kolumnie C, kryterium Walda wskaże A lub B ( przedtem było tylko B) Po dodaniu 1 w kolumnie D Wald wskaże tylko A Przekupny, czy co? A B C D A 2 2 2 2 B 1 1 3 2 C 0 4 2 1 D 1 3 2 1 2011-12-29 Zdzisław Dzedzej 22
Kryterium Hurwicza i aksjomat 5 A B C D A 2 2 4 1 B 1 1 5 1 C 0 4 4 0 Po dodaniu 4 do kolumny C dla α=¾ A: 4 ¾+¼ 1=13/4 B: 5.¾+¼= 4 C: 4 ¾+0=3 : D też Lepsze B Trzeba mu było więcej zaproponować?! D 1 3 4 0 2011-12-29 Zdzisław Dzedzej 23
Aksjomat 6. Dodanie wiersza. Jeśli kryterium wskazuje strategię wiersza X w danej grze, to po dodaniu wiersza Z powinno wskazać X lub Z. Uzasadnienie : jeśli uważaliśmy X za najlepszą z dotychczasowych możliwości, to odkrycie nowej strategii nie powinno tego zmienić. Kryteria Laplace a, Walda i Hurwicza spełniają 6. Kryterium Savage a łamie 6 ( po dodaniu wiersza 0003) wskaże A 2011-12-29 Zdzisław Dzedzej 24
Kryterium Savage a i aksjomat 6 Macierz po dodaniu wiersza A B C D A 2 2 0 1 B 1 1 1 1 C 0 4 0 0 E 0 0 0 3 D 1 3 0 0 Macierz strat A B C D A 0 2 1 2 B 1 3 0 2 C 2 0 1 3 E 2 4 1 0 D 1 1 1 3 2011-12-29 Zdzisław Dzedzej 25
Komentarz J. Milnor [1953] podaje 10 aksjomatów oraz dowód twierdzenia, że nie istnieje kryterium spełniające je wszystkie. Poprawniej byłoby nazywać je postulatami. Aksjomaty niespełniane przez poszczególne metody można traktować jako pewne zastrzeżenia. Np.. Nie stosuj metody Laplace a, gdy rozróżnienie stanów Natury nie jest jednoznaczne, Walda i Hurwicza, gdy nie jesteśmy pewni co do wartości wypłat dla różnych stanów, Savage a, gdy nie wiemy które strategie są dla nas dostępne, itp 2011-12-29 Zdzisław Dzedzej 26
Zadanie Stan gospodarki Sprawdż, jaką decyzję wskaże każde z kryteriów z wybranym przez ciebie współczynnikiem optymizmu. Problem decyzyjny polega na ustaleniu strategii firmy, gdy wypłaty ( w mln ) są uzależnione od kierunku zmian sytuacji ekonomicznej w danym okresie. Utrzymaj poziom produkcji Silny wzrost Umiarko wany wzrost Umiarko wana recesja 3 2 2 0 lekko zwiększ 4 2 0 0 Silna recesja Znacznie zwiększ 6 2 0-2 Zmień profil produkcji 1 1 2 2 2011-12-29 Zdzisław Dzedzej 27
Leonid Hurwicz Regents Professor Emeritus Leo Hurwicz received his LL.M. from Warsaw University - Poland in 1938. He teaches in the areas of theory, welfare economics, public economics, mechanisms and institutions, and mathematical economics. Professor Hurwicz's current research includes comparison and analysis of systems and techniques of economic organization, welfare economics, game-theoretic implementation of social choice goals, and modeling economic institutions. 2011-12-29 Zdzisław Dzedzej 28
2011-12-29 Zdzisław Dzedzej 29