TEORIA GIER I PRAKTYKA NEGOCJACJI: SYMULACJE W OPARCIU O GRĘ PLANSZOWĄ DYPLOMACJA Teoria gier statycznych Strategie zdominowane Iterowane wykreślanie Gry o sumie zerowej vs niezerowej, dylemat więźnia, chicken Równowaga Nasha [bonus: Schemat arbitrażowy Nasha] Teoria gier dynamicznych Przetarg ultymatywny, przetarg naprzemiennych ofert Zaufanie, oszustwo, reputacja [bonus: gry z niepełną informacją] Stosunki międzynarodowe: teoria neorealistyczna
Negocjacje BATNA Stosunek do ryzyka Cierpliwość Style negocjacji Określanie i powiększanie obszaru zainteresowań stron Reputacja/zaufanie Emocje, zdrada, reputacja. Etyka w negocjacjach.
JAK ZALICZYĆ ZAJĘCIA? Udział w grze dyplomacja online (30 punktów). o Do 20 punktów zdobyć można za samą aktywność. 5 punktów kary za każdy przegapiony lub nonsensowny ruch. o Do 10 punktów będzie można zdobyć w zależności od wyników. Zwycięzca każdej partii dostanie 10/k punktów, gdzie k będzie liczbą gier, które uda się danemu studentowi ukończyć w ciągu semestru, a pozostali dostaną punkty w proporcji do liczby baz posiadanych na koniec partii (w szczególności gracze wyeliminowani wcześniej zero). Egzamin końcowy (40 punktów) Prace domowe/kartkówki/aktywność na zajęciach (20 punktów)
PIERWSZA WOJNA ŚWIATOWA https://www.youtube.com/watch?v=-3ujj5kxili https://www.youtube.com/watch?v=cqfdnmc7 VAc (i następne części)
Wykaz używanych skrótów i oznaczeń dyplomacyjnych Reguły gry: https://www.wizards.com/avalonhill/rules/diplo macy.pdf A armia F flota AT, DE, FR, GB, IT, RU, TR skróty krajów Używamy trzyliterowych, pisanych małą literą skrótów nazw, np. ber=berlin mun>ber ruch z Monachium do Berlina H holds (jednostka zostaje w miejscu) S supports (jednostka wspiera w obronie lub ataku), np. bur S (par>gas)
GRY W POSTACI NORMALNEJ DEFINICJA Gra G = (N, S 1,..., S n, u 1,..., u n ) N = {1, 2,..., n} zbiór graczy, S 1, S 2,..., S n zbiory strategii; S i zbiór strategii gracza i, u 1, u 2,..., u n funkcje wypłaty; u i : S R to funkcja wypłaty gracza i. Założenia: racjonalność wspólna wiedza graczy o grze: gracz i 1 wie, że gracz i 2 wie, że... gracz i k zna wszystkie zbiory strategii i funkcję wypłat analogiczne wspólna wiedza graczy o ich racjonalności każdy z graczy dokonuje jednokrotnego wyboru swojej strategii, nie wiedząc jak wybierają inni.
STRATEGIE I WYPŁATY W DYPLOMACJI (UWAGA: do odwołania ignorujemy negocjacje) N = (Austria,, Turcja) u i (s 1, s 2,..., s n ) = 1 gdy i wygrał i 0 w przeciwnym przypadku. Pojedyncza strategia danego gracza s i to przepis co ma robić dla każdej możliwej dotychczasowej historii gry. Nawet jeśli ograniczono liczbę lat gry (i np. wygrywają wszyscy, który do tego czasu nie zostali wyeliminowani), zbiór S i jest gargantuiczny. Np. przyjmując dla uproszczenia, że wiosną 1914 każda jednostka ma cztery możliwe ruchy, mamy 4 22 1,8 10 13 historii pierwszego ruchu. Przyjmując, że jesienią 1914 znów cztery możliwe ruchy, mamy około 4 1,8 1013 możliwych planów działania jesienią dla pojedynczej jednostki. Zatem typowy gracz (dysponujący trzema jednostkami) ma około 4 3 (4 1,8 1013 ) 3 strategii już w (mało interesującej) grze ograniczonej do jednego roku (o ile zapomnimy o ucieczkach i uzupełnieniach). Ta liczba w rozwinięciu dziesiętnym nie zmieści nam się na slajdach.
STRATEGIE I AKCJE Ogromna liczba strategii jest dość typowa dla gier dynamicznych (podobnie w szachach). Dużo łatwiej rozważać zbiór AKCJI gracza i po danej historii H, oznaczany A i (H). W grach statycznych (jednoczesnych), takich jak np. jednokrotna gra papier-nożyce-kamień, zbiór akcji i zbiór strategii są tożsame, bo jedyna możliwa historia jest pusta.
Możliwe akcje Francuzów (jeśli nie mają więcej jednostek niż widać. Uwaga: zawsze przyjmujemy, że jednostki widoczną mapą nie mają wpływu): (par>bre, bur>bel) (par>bre, bur>gas) (par>bre, bur S (par>gas)) [nie wszystkie akcje mają jakikolwiek sens]
ANALIZA POJEDYNCZEGO RUCHU Na razie skupimy się na zbiorach akcji. Będziemy traktować pojedynczy ruch tak, jakby był całą grą. Jeśli tak naprawdę gra się po nim nie kończy, to skąd mamy wiedzieć jakie są wypłaty? Powinniśmy używać prawdopodobieństw końcowego sukcesu, ale nawet tego nie znamy nawet w przybliżeniu (z wyjątkiem niektórych przypadków, gdy jest ono bliskie 0). Naturalną uproszczoną funkcją wypłat jest ta przypisująca dla każdej kombinacji akcji graczy ich zmiany w posiadanej liczbie baz. A więc u Niemcy = 2 gdy Niemcy po tym ruchu stracą dwie bazy itp. UWAGA 1: To ma jakiś sens raczej w zastosowaniu do ruchu jesiennego. UWAGA 2: W praktyce nie zawsze im więcej baz w krótkim okresie tym lepiej. A na pewno użyteczność nie rośnie liniowo.
UWAGA 3: Tak naprawdę zdecydowanie nie jest wszystko jedno, które bazy mamy i gdzie stoją nasze jednostki
PRZYKŁAD Austria\Rosja gal>bud gal>vie gal coś innego [co nie daje szans zdobycia bazy] bud>vie 1;1 0;0 0;0 bud>gal lub bud holds lub 0;0 1;1 0;0 bud sup. sth. bud>gdzieś indziej [gdzie nie ma szans zdobycia bazy] 1;1 1;1 0;0
UWAGA 1: zakładamy, że działania innych jednostek nie mają wpływu na tę interakcję. W szczególności jeśli AT i RU mają inne jednostki, to wiersze i kolumny powyższej macierzy nie odpowiadają dostępnym graczom akcjom (ale takie rozbicie na osobne gry bez wzajemnego wpływu jest b. wygodne) UWAGA 2: jak widać, czasem warto kolapsować różne możliwe akcje, które (dla ustalonej akcji przeciwnika) dają te same efekty
Uwaga: nie należy zbyt pochopnie definiować strategii i wrzucać zbyt wiele do kategorii inne, które można pominąć Przyjmijmy, że RU i IT są w sojuszu i można ich traktować jako jednego gracza. Czy AT może obronić wszystkie swoje bazy? Ponieważ ma tylko dwie armie, nie może skierować armii do wszystkich baz. Na oko wystarczy rozważać następujące strategie (pozostałe nie będą lepsze): AT\RU+IT ven>tri, gal>vie ven>tri, gal>bud bud H, vie>tri 1;1 0;0 vie H, bud>tri 0;0 1;1 vie H, bud H 1;1 1;1
Ostatnia strategia AT nigdy nie da lepszego efektu niż pierwsza, a czasem da gorszy. Pierwsza i druga są równie dobre: AT ocali bazę jeśli zgadnie co zrobią RU+IT (albo inaczej mówiąc RU+IT bazę zdobędą jeśli zgadną co zrobi AT). A może AT może zrobić jeszcze coś innego?
Armie AT wzajemnie się blokują, więc bez wsparcia nie można wejść do żadnej z ich baz! Czy RU+IT mają na to dobrą odpowiedź? Tak! gal>vie w połączeniu z ven S (vie>tri)! (albo analogicznie dla bud). Więc dostajemy macierz gry: AT\RU+IT ven>tri, gal>vie ven>tri, gal>bud gal>vie, ven S (vie>tri) gal>bud, ven S (bud>tri) bud H, vie>tri 1;1 0;0 1;1 0;0 vie H, bud>tri 0;0 1;1 0;0 1;1 vie>tri, 0;0 0;0 1;1 1;1 bud>tri vie H, bud H 1;1 1;1 0;0 0;0
DOMINACJA Niech S i oznacza zbiór strategii łącznych innych graczy poza graczem i. Powiemy, że strategia s i S i dominuje strategie s i jeżeli dla każdej s i S i zachodzi u i (s i, s i ) > u i (s i, s i ). Czyli s i zawsze da lepszy efekt niż s i Gdy zastąpimy znak > znakiem (lecz dla przynajmniej jednej s i nierówność będzie ostra) otrzymujemy definicję słabej dominacji. Czyli nigdy s i nie opłaci nam się lepiej niż s i, a dla przynajmniej jednej kombinacji strategii pozostałych opłaci się gorzej. Nie należy używać strategii ściśle zdominowanych. Ale użycie słabo zdominowanych może mieć pewien sens, zob. niżej: (G,L) daje obydwu graczom lepszy efekt niż (D,P) i nie mają powodu od swojej strategii odstąpić, o ile nie spodziewają się odstąpienia przeciwnika. L P G 1;1 1;1 D 1; 1 0;0
ITEROWANE USUWANIE STRATEGII (SŁABO) ZDOMINOWANYCH IE(W)DS Jeśli inny gracz ma strategię (słabo) zdominowaną, to można o niej zapomnieć wykreślić ją z macierzy gry. Wtedy może się okazać, że któraś z naszych strategii staje się zdominowana itd. Takie postępowanie może znacznie ułatwić analizę gry.
PRZYKŁAD WYKREŚLANIA SŁABO ZDOMINOWANYCH Austria\Rosja gal>bud gal>vie gal coś innego [co nie daje szans zdobycia bazy] bud>vie 1;1 0;0 0;0 bud>gal lub bud holds lub bud sup. 0;0 1;1 0;0 sth. bud>gdzieś indziej [gdzie nie ma szans zdobycia bazy] 1;1 1;1 0;0
IEWDS: PRZYKŁAD Austriacy mogą próbować zdobyć dwie bazy: rum i bul. Ale (con>bul, aeg>gre) słabo dominuje każdą inną strategię TR i sev>rum słabo dominuje każdą inną strategię RU. Więc można zapomnieć o szansie zdobycia dwóch baz. Po wykreśleniu stosownych wierszy i kolumn atak na rum ze wsparciem (dający gwarancję zdobycia jednej) słabo dominuje każdą inną opcję AT.
DEFINICJA: Strategia s i gracza i jest jego najlepszą odpowiedzią na łączną strategie s i pozostałych graczy, (ozn. s i = BR i (s i )) jeżeli dla każdej innej strategii s i S i zachodzi u i (s i, s i ) u i (s i, s i ). Uwaga 1. Jeżeli s i = BR i (s i ), to s i nie może być zdominowana (ale może słabo). DEFINICJA: Układ strategii (strategia łączna) s = (s 1, s 2,... s n ) jest równowagą Nasha gry G = (N, S 1,..., S n, u 1,..., u n ) jeżeli dla każdego i = 1, 2,... n mamy s i = BR i (s i ), czyli dla każdego i i każdej s i S i u i (s 1,, s i 1, s i, s i+1, s n ) u i (s 1,, s i, s n ). Uwaga 2. Strategie w równowadze nie mogą zostać usunięte w procesie IEDS (ale mogą w IEWDS) Problemy z równowagą Nasha 1. Nie zawsze istnieje 2. Gdy istnieje, bywa nieoptymalna w sensie Pareto 3. W tej samej grze może być ich wiele
AT\RU+IT ven>tri, gal>vie ven>tri, gal>bud gal>vie, ven S (vie>tri) gal>bud, ven S (bud>tri) bud H, vie>tri 1;1* 0*;0 1;1* 0*;0 vie H, bud>tri 0*;0 1;1* 0*;0 1;1* vie>tri, bud>tri 0*;0 0*;0 1;1* 1;1* vie H, bud H 1;1* 1;1* 0*;0 0*;0 Wypłaty odpowiadające BR danego gracza oznaczono gwiazdką. Ponieważ nie ma dwóch gwiazdek dla tej samej pary strategii nie ma równowagi Nasha.
IT\AT tri>ven tri>alb ven>tri 0*;0* 1; 0,8 ven>pie 0,8;1 0,2;0,2 (uwaga: przyjmujemy, że jednostki gdzieś indziej mogą coś zdziałać, ale nie od razu zdobyć bazę. To coś ma, przyjmijmy arbitralnie, wartość 0,2) Wybór strategii dominujących prowadzi do jedynej równowagi, w której wypłaty są Paretozdominowane przez wypłaty osiągane dla pewnej nie-równowagowej kombinacji strategii. Tego typu sytuację nazywamy czasem dylematem więźnia.
GRY O SUMIE ZEROWEJ Gra (N, S 1,..., S n, u 1,..., u n ) jest grą o sumie stałej, jeśli istnieje taka stała C, że dla każdej strategii łącznej (s 1,..., s n ) S zachodzi Σ i u i (s 1,..., s n ) = C. Częściej mówi się o grach o sumie zerowej, co na jedno wychodzi, bo odjęcie stałej od wszystkich wypłat danej osoby nie zmienia gry. W dwuosobowych grach o sumie zerowej nie ma miejsca na współpracę zysk innego gracza jest tożsamy z moją stratą. Są to gry ściśle konkurencyjne. Dla innych gier ważne negocjacje!
Dotychczas rozważaliśmy głównie gry o sumie zerowej. Cała gra w dyplomację, o ile jest tylko jeden zwycięzca, jest taką grą. Lokalny konflikt także, jeśli wszystkie bazy są już zajęte i jedynym celem jest maksymalizacja liczby baz. Ale na początku są i bazy neutralne. DE\GB nth>hol nth>bel ruh>hol 0;0 1;1 ruh>bel 1;1 0;0 gra (anty)koordynacji w ogóle nie ma konfliktu
GB\RU nwy H nwy>swe nth>nwy 0;1 1;1 coś innego 0;1 0;1 Rosji jest wszystko jedno co się zdarzy, ale GB nie zmienna suma.
Właściwości równowag w grach o sumie zerowej Gdy (s 1, s 2 ), (r 1, r 2 ) są równowagami takiej gry, to u 1 (s 1, s 2 ) (r 1, s 2 ) (bo s 1 jest BR 1 (s 2 )) u 1 (r 1, s 2 )= u 2 (r 1, s 2 ) u 2 (r 1, r 2 ) = u 1 (r 1, r 2 ) (bo r 2 jest BR 2 (r 1 )) u 1 (r 1, r 2 ) (s 1, r 2 ) (bo r 1 jest BR 1 (r 2 )) u 1 (s 1, r 2 )= u 2 (s 1, r 2 ) u 2 (s 1, s 2 ) = u 1 (s 1, s 2 ) (bo s 2 jest BR 2 (s 1 )) i stąd u 1 (s 1, s 2 ) = u 1 (r 1, r 2 ) i oczywiście u 2 (s 1, s 2 ) = u 2 (r 1, r 2 ) (wszystkie równowagi są równie dobre), (s 1, r 2 ), (r 1, s 2 ) też są równowagami ( równowagi są wymienne ), W grach ściśle konkurencyjnych te wielkość wypłatę gracza 1 w równowadze nazwiemy wartością gry.
STRATEGIE MIESZANE Strategia mieszana to wybór strategii w sposób losowy. Gdy S i jest zbiorem strategii gracza i w grze G, to zbiorem jego strategii mieszanych jest S i * : zbiór wszystkich rozkładów prawdopodobieństwa na S i. Będziemy rozważać tylko gry ze skończoną liczbą strategii, wówczas przez σ i,k oznaczymy prawdopodobieństwo użycia przez gracza i jego strategii nr k. Elementy S i będziemy nazywać strategiami czystymi. Nośnik strategii mieszanej to zbiór strategii czystych wybieranych z dodatnim prawdopodobieństwem. Oczekiwana wypłata ze strategii mieszanej będzie średnią z wypłat ze strategii czystych, ważoną ich prawdopodobieństwami.
Austria\Rosja q: gal>bud (1 q): gal>vie p: bud>vie 1;1 0;0 (1 p): bud>gal 0;0 1;1 [p, q to prawd. zagrania danej strategii] Wypłata RU: pq+(1 p)(1 q) Kiedy gracz zechce grać jakąś strategię czystą z dodatnim prawdopodobieństwem? Kiedy żadna inna strategia czysta nie przynosi mu średnio rzecz biorąc więcej. Załóżmy, że p=0,7. Wówczas gal>bud przyniesie średnio 0,7, a gal>vie średnio 0,3. Więc RU nie zechce mieszać jedyną BR jest gal>bud. Ale BR AT (gal>bud)=bud>gal, a BR RU (bud>gal)=gal>vie itd. Stąd wnioskujemy jak szukać równowag w strategiach mieszanych.
ZNAJDOWANIE RÓWNOWAG W STRATEGIACH MIESZANYCH Krok pierwszy: ustalić nośniki. Krok drugi: rozwiązać układ nierówności na σ i,k by żadna strategia czysta należąca do nośnika nie dawała mniej niż jakaś inna strategia czysta. W naszym przypadku EU RU (gal>bud)=p= (1 p)=eu RU (gal>vie), stąd p=0,5 I analogicznie q=0,5 Ale nie zawsze mieszać należy z równymi prawdopodobieństwami. Np. przyjmijmy, że RU woli pozyskać bud niż vie, bo obok ma bazę w rum, więc zdoła bud utrzymać. Natomiast jeśli zdobędzie vie, to ocenia, że z pr. 0,5 szybko straci go na rzecz Niemiec.
AT\RU q: gal>bud (1 q): gal>vie p: bud>vie 1;1 0;0 (1 p): bud>gal 0;0 1;0,5 W wyliczeniu q nic się nie zmienia Rosja nadal rzuca uczciwą monetą. Ale AT już nie! EU RU (gal>bud) = p = 0,75(1 p)=eu RU (gal>vie), stąd p=2/3. To jest nieintuicyjne przy zmianie wypłat RU zachowanie zmienia tylko AT. Uwaga: Niektóre strategie (nawet jeśli nie są zdominowane) mogą nie należeć do nośnika równowagowej strategii mieszanej. To główna trudność w szukaniu równowag w strategiach mieszanych w większych grach. TWIERDZENIE NASHA: Każda gra skończona ma równowagę Nasha (być może w strategiach mieszanych).