N-osobowy dylemat więźnia Krzysztof Balas Jakub Kolecki Politechnika Gdańska 17 listopada 2011
Plan prezentacji 1 Gra 2 Klasyczny dylemat więźnia Historia Opowieść Podejście do problemu Analiza 3 N-osobowy dylemat więźnia Opis zagadnienia Funkcja charakterystyczna w odniesieniu do dylematu Rozwiązanie i wnioski Przykłady Zastosowania 4 Uogólnienie zagadnienia i wyniki przeprowadzonych eksperymentów
Eksperyment Stwórzcie 5-osobowe grupy i zagrajcie 10 razy w grę: Decyzja gracza ilu pozostałych graczy gra C 0 1 2 3 4 C -2-1 0 1 2 D -1 0 1 2 3 Zapisujcie za każdym razem decyzje i wypłaty. Na koniec obliczcie łączne wypłaty wszystkich graczy i dla każdego porównajcie jej wysokość z liczbą przypadków, w których zagrał C.
Historia Dylemat więźnia wymyślili dwaj pracownicy RAND Corporation: Melvin Dresher i Merrill Flood w 1950 roku. Albert W. Tucker sformalizował jego zasady.
Opowieść Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić?
Podejście do problemu Możliwe wyniki gry: Więzień B milczy Więzień B zeznaje Więzień A milczy Obaj skazani na 6 miesięcy Więzień A: 10 lat, Więzień B: wolny Więzień A zeznaje Więzień A: wolny, Obaj skazani na 5 lat Więzień B: 10 lat
Przykładowa macierz wypłat: Współpracuj Oszukuj Współpracuj 3,3 0,5 Oszukuj 5,0 1,1
Analiza Ogólna postać dylematu: gdzie: T- pokusa zdrady R- nagroda za współpracę P- kara za zdradę S- wypłata oszukanego Współpracuj Oszukuj Współpracuj R,R S,T Oszukuj T,S P,P T > R > P > S (1)
Analiza: Równowaga Nasha Oszukuj jest strategią ściśle dominującą: niezależnie od tego co robi przeciwnik, zawsze bardziej opłaca się oszukiwać niż współpracować. Racjonalny gracz będzie tylko oszukiwał i jedyną równowagą Nasha jest punkt (Oszukuj, Oszukuj). W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali.
N-osobowy dylemat więźnia N-osobowym dylematem więźnia nazywamy każdą grę, w której każdy z N graczy ma dwie strategie. Jedna z nich jest ściśle dominująca, lecz jeżeli wszyscy gracze wybiorą tą strategię to uzyskają niższe wypłaty, niż wybierając strategię zdominowaną.
Gra 3-osobowa Rysunek: Tabela wypłat dla 3-osobowego dylematu więźnia Gra symetryczna Strategia D dominuje C dla każdego gracza DDD - punkt równowagi CCC dominuje DDD w sensie Pareto
Gra 3-osobowa N = 3 > 2 pozawala na nawiązywanie współpracy: Rysunek: Tabela wypłat przy koalicji Kolumny i Warstwy gra posiada punkt siodłowy
Gra w postaci funkcji charakterystycznej Grą w postaci funkcji charakterystycznej nazywamy grę opisywaną przez N - zbiór graczy oraz ν : 2 N R. ν(s) określa łączną wygraną koalicji S (zakładamy, że S gra najoptymalniej, w najmniej korzystnych warunkach). Grę nazywamy superaddytywną, jeżeli ν(s T ) ν(s) + ν(t )
Gra 3-osobowa Funkcje charakterystyczna związana z opisywanym przypadkiem przyjmuje następujące wartości: ν( ) = 0 ν(w ) = ν(k) = ν(l) = 1 ν(wk) = ν(wl) = ν(kl) = 3 ν(wkl) = 0
Wnioski z dylematu więźnia Wnioski cięgnięte z funkcji charakterystycznych mogą być mylące Dążenie do współpracy w niektórych sytuacjach bywa ryzykowne Najcenniejszą cechą jest oportunizm, cnota może być karana Powyższe wniostki dotyczą N-osobowej wersji gry o sumie niezerowej i jej funkcji charakterystycznej.
Przykład z pastuszkami Wyobraźmy sobie grupę farmerów użytkujących wspólne pastwisko. Każdy z nich zastanawia się czy nie wypasać dodatkowej krowy. Korzyścią będzie dochód przynoszony przez kolejną krowę. Strata wynika z tego, że nadmiernie eksploatowane pastwisko może ograniczyć swą produktywność. Jest to strata, która rozłoży się po równo na wszystkich i każdy z nich straci na tym niewiele. Ponieważ korzyść odniesiona przez pojedynczego farmera jest większa niż jego strata, racjonalne postępowanie polega na wypasaniu większej liczby krów. Podobnie postępują inni farmerzy i w końcu nadmiernie eksploatowane pastwisko przestaje komukolwiek przynosić korzyści.
Przykladowa macierz wypłat: Liczba krów Zysk z jednej Zysk łącznie 10 1000 10000 11 900 9900 12 800 9600 13 700 9100 14 600 8400 15 500 7500 16 400 6400 17 300 5100 18 200 3600 19 100 1900 20 0 0
Odniesienie do rzeczywistości Interakcje w społeczeństwie jak i w przyrodzie charakteryzują się podobnymi wypłatami jak w dylemacie więźnia. 1 Nauki społeczne Ekonomia Polityka Socjologia
Odniesienie do rzeczywistości Interakcje w społeczeństwie jak i w przyrodzie charakteryzują się podobnymi wypłatami jak w dylemacie więźnia. 1 Nauki społeczne Ekonomia Polityka Socjologia 2 Nauki biologiczne Etologia (zachowania zwierząt) Biologia ewolucyjna (pochodzenie gatunków)
Przykłady z życia 1 Politologia Wyścig zbrojeń
Przykłady z życia 1 Politologia Wyścig zbrojeń 2 Demografia Przeludnienie
Przykłady z życia 1 Politologia Wyścig zbrojeń 2 Demografia Przeludnienie 3 Środowisko Wyczerpywanie się zapasów naturalnych Zanieczyszczenie środowiska
Przykłady z życia 1 Politologia Wyścig zbrojeń 2 Demografia Przeludnienie 3 Środowisko Wyczerpywanie się zapasów naturalnych Zanieczyszczenie środowiska 4 Sport Kolarstwo Gwałtowne tracenie wagi Doping
Przykłady z życia 1 Politologia Wyścig zbrojeń 2 Demografia Przeludnienie 3 Środowisko Wyczerpywanie się zapasów naturalnych Zanieczyszczenie środowiska 4 Sport Kolarstwo Gwałtowne tracenie wagi Doping 5 Rozrywka Wstawanie z miejsc w czasie koncertu rockowego
Znaczenie zjawiska Model n-osobowego Dylematu Więźnia ma zasadnicze znaczenie dla rozważań nad problemami gospodarczymi. Rozwiązaniem takich problemów może być zgoda wszystkich na zbiorowy przymus. Byłoby to dla wszystkich przymuszanych opłacalnym wyjściem.
Uogólnienia i przeprowadzone eksperymenty Wyniki naszej gry: kooperator dezerter grupa kooperatorów -5,7 4,4 grupa indywidualistów - -3,7 Udowodniono, że więźniowie uczą się Wartości wypłat przy nieskończonej liczbie iteracji rosną do ustalonego poziomu
Uogólnienia zagadnienia 1 Iterowany dylemat więźnia Wielokrotne rozegranie gry z jednym przeciwnikiem Możliwość tworzenia strategii zależnych od ruchów przeciwnika 2 Dylemat podróznika rozszerzenie dylematu więźnia polegające na zwiększeniu liczby możliwych strategii
Straffin Philip D. Game Theory and Strategy ; Macy Michael, Flache Alexander, Learning Dynamics in Social Dilemmas;