Konflikt i Kooperacja O modelowaniu ludzkich zachowań na gruncie Teorii Gier Karol Wawrzyniak Zespól Systemów Złożonych Centrum Informatyczne Świerk (www.cis.gov.pl), Narodowe Centurm Badań Jądrowych (www.ncbj.gov.pl) Complex Systems Team
PLAN WYKLADU Dlaczego potrzebujemy teorii gier? Przykłady systemów złożonych Krótkie wprowadzenie do klasycznej teorii gier Krótkie wprowadzenie do gier ewolucyjnych Przedstawienie jak ww. użyć do rozwiązywania rzeczywistych problemów Pytania na zrozumienie
SYSTEMY ZLOZONE JAKO GRY
RYS HISTORYCZNY Theory of Games and Economic Bahaviour, John von Neumman & Oskar Morgenstein Gra uproszczony matematyczny model sytuacji konfliktu i kooperacji. Potrzebujemy informacji na temat: liczby graczy, możliwości postępowania każdego z nich (strategii), reguł gry: informacji jaką mają gracze, możliwości porozumiewania, wyników otrzymanych w zależności od zastosowanych strategii, oceny tych wyników przez graczy (użyteczności), itd..
DYLEMAT UCZNIA Kasia i Piotr palili razem papierosy w szkolnej toalecie. Wychowawczyni podejrzewa, że takie zdarzenie miało miejsce ale nie jest tego pewna. Dochodzi do przesłuchania. Jeśli jedno się przyzna dostanie nagrodę (+1), a drugie surową karę (-2) Jeśli oboje się przyznają, dostaną łagodną karę (-1) Jeśli oboje się nie przyznają, to unikną kary (0)
Piotr Piotr Piotr DYLEMAT UCZNIA Kasia zaprzeczam sypię Kasia zaprzeczam sypię Zaprzeczam 0-2 Zaprzeczam 0 1 Sypię 1-1 Sypię -2-1 Wypłaty dla Piotra Wypłaty dla Kasi Kasia zaprzeczam sypię Jaki wybór jest najlepszy z Punktu widzenia jednostki? Zaprzeczam 0 / 0-2 / 1 Sypię 1 / -2-1 / -1 Jaki wybór jest najlepszy z punktu widzenia obu osób? Macierz wypłat
DYLEMAT UCZNIA GRAFICZNIE Strategie mieszane Czy żałuję wyboru? ZS Wypłata Kasi 1 ZZ Optymalność w sensie Pareto: Wynik gry jest nieoptymalny jeśli gra ma inny wynik dający obu graczom wyższe wypłaty lub jednemu taką samą, a drugiemu wyższą wypłatę. -2 SS -1-1 -2 1Wypłata Piotra SZ Czy znalezione rozwiązanie jest optymalne? Które rozwiązanie z waszej perspektywy jest optymalne? WIELOBOK WYPŁAT
SCHEMAT ARBITRAZOWY Wypłata Kasi Aksjomaty: ZS -2 SS -1 1 ZZ -1 1Wypłata Piotra - Racjonalność - Niezależność od przekształceń liniowych - Symetria - Niezależność od alternatywnych rozwiązań -2 SZ WIELOBOK WYPŁAT Rozwiązaniem jest punkt maksymalizujący wartość iloczynu (x-x0)(y-y0)
DYLEMAT UCZNIA A NAGODA NOBLA Przykład dylemat ucznia jest w rzeczywistości znany jako dylemat więźnia. John Nash udowodnił, że w grach o sumie niezerowej jest co najmniej jedna równowaga, gdzie gracze nie mogą polepszyć swojej sytuacji, jeśli strategie pozostałych graczy zostaną bez zmian. Jaką strategię byśmy przyjęli w przypadku iterowanego dylematu więźnia?
EXPERYMENT AXELRODA 1984 - turniej dla programów komputerowych (iterowany dylemat więźnia) Najlepsza strategia - wet za wet; Współpraca w pierwszej rundzie, a w każdej kolejnej robienie tego co przeciwnik robił w poprzedniej. (4 linie kodu) Cechy najlepszych strategii: przyjazność, mściwość, skłonność do wybaczania Axelrod wywnioskował, że dbanie wyłącznie o własne zyski można często najlepiej realizować będąc przyjaznym i wybaczającym.
TEAM SYTUACJA KONFLIKTU Przykład z życia: Mr M poprzedni pracodawca TEAM zespół ludzi w którym byłem informatykiem Konflikt na linii Szef TEAM-u i Szef Wszystkich Szefów, czyli Mr N. twardo MR N miękko twardo -6 / -10 2 / -4 średnio miękko -1 / 3-3 / 5 0 / 0-1 / -1
SYTUACJA KONFLIKTU CZAS FAZA 1 FAZA 2 Twardo (-6/-10) Postać ekstensywna Twardo Średnio Miękko Miękko Twardo Miękko Twardo (2/-4) (-1/3) (0/0) (-3/5) Miękko (-1/3)
CZLOWIEK RACJONALNY - Gra ultimatum Dwaj gracze muszą podzielić pomiędzy siebie pewną kwotę. Tylko pierwszy gracz ma możliwość zadecydowania o proporcjach podziału Drugi gracz może zaproponowaną proporcję zaakceptować lub nie. Jeśli drugi zaakceptuje proporcję to obaj gracze dostają kwoty wynikające z podziału. Jeśli drugi nie zaakceptuje propozycji to gracze nie dostają żadnej kwoty
GRA ULTIMATUM Gracz 1 0 PLN 5 PLN X PLN Gracz 2 Akceptuje Odrzuca 5 PLN X, X PLN 0 PLN, 0 PLN
KLASYKA A RZECZYWISTOSC Założenie o racjonalności Założenie o znajomości reguł gry Gry rozgrywane w rzeczywistym świecie wykazują znaczny stopień komplikacji. rynki finansowe ruch drogowy kolonie zwierząt internet
CO BADAMY W CST Badania podstawowe dotyczące m.in. teorii gier, teorii optymalizacji, systemów wieloagentowych Modele rzeczywistych systemów socjotechnicznych (rynki i sieci energetyczne, sieci społecznościowe) Detekcja i predykcja anomalii w systemach złożonych (rynki, sieci społecznościowe, internet, zagadnienia transportowe, itd.)
MNIEJSZOSC VS WIEKSZOSC Czasem lepiej być w większości Czasem lepiej być w mniejszości
Który stan gry jest optymalny dla populacji? Trzy reżimy zachowań: Losowe, Kooperacyjne, Tłumne GRY MNIEJSZOSCIOWE Założenie o wnioskowaniu indukcyjnym Przykład - El Farol Bar, Dwie opcje do wyboru: 1) pójść do baru, 2) bawić się w domu. 101 Imprezowiczów 50 miejsc w barze
MODELE SYSTEMOW Przykład: rynki energetyczne podział rynków na strefy Jaki będzie profil zachowania graczy, przy zmienionych strefach?
ANOMALIE Detekcja i predykcja anomalii w systemach złożonych Anomalie: zaburzenia pogodowe, zaburzenia w ruchu lotniczym, ataki hakerów, propagacja skrajnych poglądów w społeczeństwie, nieproporcjonalne przepływy pieniężne na rynkach, korki na drogach itd. Większość z tych systemów może być postrzega jako sieć oddziałujących z sobą elementów. Istnieje pewne prawo, któremu działanie systemu powinno podlegać.
JAK POROWNAC SYSTEMY system referencyjny zgodny z prawem podstawowym. system rzeczywisty na ogół niezgodny z prawem podstawowym. REFERENCE SYSTEM REAL SYSTEM CHECK SIMILARITY DISTANCE PROBABILITY OF ANOMALY ESCALATION Eskalacja anomalii może prowadzić do przejścia fazowego. Przejście fazowe jest związane z permanentnym lub czasowym zniszczeniem dotychczas znanych regół gry.
PRZYKLAD~A Sieć energetyczna Energia elektryczna nie może być przechowywana jest konsumowana w czasie krótszym niż sekunda po jej wytworzeniu. Obciążenie sieci jest wynikiem zrównania podaży i popytu oraz możliwości przesyłowych infrastruktury. Większa moc => gorętsze linie energetyczne => fizyczne wydłużenie linii => przebicie => automatyczne systemy ochrony linii energetycznych odcinają linię => możliwy efekt domina => blackout. Nie każda anomalia prowadzi do blackoutu (przejścia fazowego), ale każda wpływa na jego prawdopodobieństwo.
PRZYKLAD~B Sieć Internet BGP backbone Fundamentalne prawo: TCP handshake. Anomalia: Pakiet SYN jest wysyłany ze sfabrykowanym adresem źródłowym IP i z adresem docelowym atakowanego serwera Serwer, którego adres był sfabrykowany dostaje SYN-ACK-a ale go ignoruje (nigdy nie incjował transmisji). Nie istnieją mechanizmy pozwalające rozpoznać systemowi docelowemu, że adres źródłowy jest sfabrykowany. Odsyła SYN-ACK-a i rezerwuje bufory. Tablice ARP, bufory w hoscie docelowym, bufory w routerach pośredniczących są zalewane sfabrykowanym ruchem i przepełniane. Następuje kolizja i odrzucenie pakietów
PODSUMOWANIE System złożony Klasyczna teoria gier i jej założenia Dwie postacie gry Ewolucyjna teoria gier i jej założenia Szerokie pole zastosowań
DZIEKUJE ZA UWAGE Karol Wawrzyniak: kwawrzyn@cis.gov.pl Complex Systems Team: http://www.cis.gov.pl/cst Minority Games: http://agf.statsolutions.eu