O pewnej modyfikacji arbitrażu Nasha w dwuosobowych grach macierzowych

Podobne dokumenty
TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Gry o sumie niezerowej

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

11. Gry Macierzowe - Strategie Czyste i Mieszane

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Teoria Gier. Schemat arbitrażowy Nasha Zdzisław Dzedzej

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Notatki przygotowawcze dotyczące inwersji na warsztaty O geometrii nieeuklidesowej hiperbolicznej Wrocław, grudzień 2013

10. Wstęp do Teorii Gier

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

LI Olimpiada Matematyczna Rozwiązania zadań konkursowych zawodów stopnia trzeciego 3 kwietnia 2000 r. (pierwszy dzień zawodów)

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek...

2010 W. W. Norton & Company, Inc. Oligopol

3. Macierze i Układy Równań Liniowych

LVIII Olimpiada Matematyczna

1 S t r o n a. Teoria Gier Praca domowa 1 - rozwiązania

Algebra liniowa z geometrią

LX Olimpiada Matematyczna

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Geometria analityczna

Teoria gier w ekonomii - opis przedmiotu

MATEMATYKA DLA CIEKAWSKICH. Twierdzenie Pitagorasa inaczej cz. 2

MODELOWANIE RZECZYWISTOŚCI

GRY DWUOSOBOWE O SUMIE NIEZEROWEJ. Równowaga Nasha Rozwiązania niekooperacyjne

Teoria gier. Strategie stabilne ewolucyjnie Zdzisław Dzedzej 1

Programowanie liniowe

Tworzenie gier na urządzenia mobilne

Krzywa uniwersalna Sierpińskiego

0 + 0 = 0, = 1, = 1, = 0.

XII Olimpiada Matematyczna Juniorów Zawody stopnia pierwszego część korespondencyjna (1 września 2016 r. 17 października 2016 r.)

Rozkład figury symetrycznej na dwie przystające

V Konkurs Matematyczny Politechniki Białostockiej

W. Guzicki Próbna matura, grudzień 2014 r. poziom rozszerzony 1

1 Wartości własne oraz wektory własne macierzy

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Zadania przygotowawcze do konkursu o tytuł NAJLEPSZEGO MATEMATYKA KLAS PIERWSZYCH I DRUGICH POWIATU BOCHEŃSKIEGO rok szk. 2017/2018.

Schemat sprawdzianu. 25 maja 2010

========================= Zapisujemy naszą funkcję kwadratową w postaci kanonicznej: 2

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie:

Konkurencja i kooperacja w dwuosobowych grach strategicznych. Anna Lamek

Geometria. Rozwiązania niektórych zadań z listy 2

Daria Sitkowska Katarzyna Urbaniak

Teoretyczne podstawy programowania liniowego

6. Liczby wymierne i niewymierne. Niewymierność pierwiastków i logarytmów (c.d.).

Internetowe Ko³o M a t e m a t yc z n e

Elementy Modelowania Matematycznego

domykanie relacji, relacja równoważności, rozkłady zbiorów

V Konkurs Matematyczny Politechniki Białostockiej

Internetowe Ko³o M a t e m a t yc z n e

PLANIMETRIA CZYLI GEOMETRIA PŁASZCZYZNY CZ. 1

UWAGI O CIĄGU SKOKÓW LICZB MILNORA. 1. Wstęp Rozważać będziemy izolowaną osobliwość niezdegenerowaną dwóch zmiennych (1) f = a αβ x α y β

Wyznaczanie strategii w grach

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

13. Teoriogrowe Modele Konkurencji Gospodarczej

Kolorowanie płaszczyzny, prostych i okręgów

Propedeutyka teorii gier

ALGEBRA z GEOMETRIA, ANALITYCZNA,

Wykład 14. Elementy algebry macierzy

Mikroekonomia. O czym dzisiaj?

X Olimpiada Matematyczna Gimnazjalistów

Własności wyznacznika

Wykład 16. P 2 (x 2, y 2 ) P 1 (x 1, y 1 ) OX. Odległość tych punktów wyraża się wzorem: P 1 P 2 = (x 1 x 2 ) 2 + (y 1 y 2 ) 2

III. Układy liniowe równań różniczkowych. 1. Pojęcie stabilności rozwiązań.

Przykładowe rozwiązania zadań. Próbnej Matury 2014 z matematyki na poziomie rozszerzonym

Spis treści. Definicje prawdopodobieństwa. Częstościowa definicja prawdopodobieństwa. Wnioskowanie_Statystyczne_-_wykład

MODELOWANIE RZECZYWISTOŚCI

V Międzyszkolny Konkurs Matematyczny

Matura 2011 maj. Zadanie 1. (1 pkt) Wskaż nierówność, którą spełnia liczba π A. x + 1 > 5 B. x 1 < 2 C. x D. x 1 3 3

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

Strategie kwantowe w teorii gier

TEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne.

a 11 a a 1n a 21 a a 2n... a m1 a m2... a mn x 1 x 2... x m ...

VII Olimpiada Matematyczna Gimnazjalistów

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Zadania otwarte krótkiej odpowiedzi na dowodzenie

( ) Arkusz I Zadanie 1. Wartość bezwzględna Rozwiąż równanie. Naszkicujmy wykresy funkcji f ( x) = x + 3 oraz g ( x) 2x

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

GEOMETRIA ANALITYCZNA. Poziom podstawowy

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

Arkusz maturalny nr 2 poziom podstawowy ZADANIA ZAMKNIĘTE. Rozwiązania. Wartość bezwzględna jest odległością na osi liczbowej.

Obóz Naukowy Olimpiady Matematycznej Gimnazjalistów

XI Olimpiada Matematyczna Gimnazjalistów

FUNKCJA LINIOWA - WYKRES

Czym jest użyteczność?

Podstawowe pojęcia geometryczne

Oligopol. Jest to rynek, na którym niewielka liczba firm zachowuje się w sposób b strategiczny i ają niezależnie od siebie, ale uwzględniaj

LXIII Olimpiada Matematyczna

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Zbiory wypukłe i stożki

13 Układy równań liniowych

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

1. Wykład NWD, NWW i algorytm Euklidesa.

Transkrypt:

M. Łazarz 1, K. Siemieńczuk 2 Uniwersytet Wrocławski O pewnej modyfikacji arbitrażu Nasha w dwuosobowych grach macierzowych Streszczenie. W pracy analizuje się rozwiązanie arbitrażowe Nasha w dwuosobowych grach o sumie niezerowej. W paragrafach 1-3 przedstawiono podstawowe pojęcia teorii gier i omówiono zwięźle ideę kooperacji w sensie Nasha. W rozdziale 4 dyskutuje się założenia jakie muszą być spełnione, aby arbitraż Nasha doszedł do skutku, oraz wprowadza się pojęcie słabej kooperacji oraz rozwiązania na gruncie słabej kooperacji. Zarysowano związek pomiędzy wielobokiem wypłat gry a zbiorem rozwiązań osiągalnych strategiami mieszanymi oraz zaproponowano aksjomaty teorii sprawiedliwego rozwiązania na gruncie słabej kooperacji. W końcu odnotowano kilka problemów otwartych. Słowa kluczowe: teoria gier, dwuosobowa gra o sumie niezerowej, rozwiązanie arbitrażowe Nasha, wielobok wypłat, słaba kooperacja, rozwiązanie osiągalne. 1 Marcin Łazarz adiunkt w Katedrze Logiki i Metodologii Nauk Uniwersytetu Wrocławskiego. 2 Krzysztof Siemieńczuk doktorant w Katedrze Logiki i Metodologii Nauki na Wydziale Nauk Społecznych Uniwersytetu Wrocławskiego. 1

1. Gry o sumie niezerowej. W pracy rozważamy dwuosobowe gry o niepełnym konflikcie, zwane też grami o sumie niezerowej, czyli macierze n m, których elementami są pary liczb (a,b). Przykład dwuosobowej gry rozmiaru 2 2 znajduje się poniżej. C D A (7,3) (4,6) B (8,2) (3,3) Gra 1 Gracz pierwszy (Wiersz) ma dwie czyste strategie A i B, gracz drugi (Kolumna) ma również dwie strategie C i D. Jeśli Wiersz zdecyduje się zagrać B, zaś Kolumna C, to gra zakończy się rezultatem BC równym (8,2) co oznacza, że wygraną Wiersza jest 8 (np. dolarów), a wygraną Kolumny jest 2 (dolary). Łatwo zauważyć, że strategia C Kolumny jest zdominowana przez strategię D, zatem zgodnie z tzw. kryterium dominacji (por. [3], s. 7) Kolumna nigdy nie będzie grać C, a przez to Wierszowi opłaca się bardziej zagrać A i w rezultacie gra skończy się wynikiem AD. Rezultat AD znajduje się w równowadze, tzn. dopóki jeden gracz gra strategię zawierającą AD, najbardziej korzystnym dla drugiego jest również grać tę strategię, do której należy AD. John Nash w [2] udowodnił, że każda dwuosobowa gra o sumie niezerowej (i skończonej liczbie strategii) posiada równowagę w strategiach czystych bądź mieszanych. Przykład gry, która nie posiada równowagi w strategiach czystych, ale posiada równowagę w strategiach mieszanych znajduje się poniżej. C D A (1,3) (4,0) p B (2,1) (3,5) 1 p q 1 q Gra 2 Rezultat w równowadze osiąga się poprzez znalezienie tzw. strategii wyrównujących wypłaty przeciwnika (por. [3], s. 85). Dla przykładu, w grze 2 Wiersz szuka takiej liczby p z przedziału [0,1], że grając strategią A z prawdopodobieństwem p, zaś strategią B z prawdopodobieństwem 1 p, (symbolicznie: (pa, (1 p)b)), wypłata Kolumny jest taka sama bez względu na jej strategię. Wiersz znajduje liczbę p rozwiązując równanie 3 p + 1 (1 p) = 0 p + 5 (1 p), czyli p = 4 7. Analogicznie Kolumna rozwiązując równanie 2

1 q + 4 (1 q) = 2 q + 3 (1 q), oblicza prawdopodobieństwo q = 1 2, z jakim winna grać swoją czystą strategią C, co zagwarantuje jej, że Wiersz nic nie zyska na ewentualnej zmianie swojej strategii. Jeśli obydwaj gracze grają swoje strategie wyrównujące to Wiesz uzyska wypłatę [1 4 7 + 2 3 7 ] 1 2 + [4 4 7 + 3 3 7 ] 1 2 = 5 2, Kolumna zaś [3 1 2 + 0 1 2 ] 4 7 + [1 1 2 + 5 1 2 ] 3 7 = 15 7. Rozwiązanie ( 5 2, 15 7 ) znajduje się w równowadze; jest to tzw. mieszana równowaga Nasha. 2. Racjonalność indywidualna versus racjonalność grupowa. Równowagi Nasha nie mogą być uznane za uniwersalne rozwiązania gier o sumie niezerowej z dwóch powodów: po pierwsze, może istnieć kilka równowag, które nie są ekwiwalentne, i po drugie, nawet gdy istnieje dokładnie jedna równowaga może ona być nieoptymalna w sensie Pareto. Obydwie wady zilustrujemy na przykładowych grach 3 i 4. C D C D A (0,2) ( 2, 2) A (0,0) ( 2,1) B ( 2, 2) (2,0) B (1, 2) ( 1, 1) Gra 3: Walka płci Gra 4: Dylemat więźnia Gra 3 ma dwie równowagi: AC oraz BD, nie są to jednak równowagi ekwiwalentne ponieważ pierwsza jest bardziej korzystna dla Kolumny, druga zaś dla Wiersza. Gracze więc nie wiedzą do jakiej równowagi dążyć, a jeśli zdecydują się dążyć do korzystniejszej (ze swojego punktu widzenia) równowagi, rezultatem gry będzie BC, więc najgorszy możliwy wynik. Podobnie, jeśli oboje postąpią altruistycznie (będą dążyć do równowagi korzystnej dla drugiego gracza) osiągną równie zły wynik AD. W grze 4, strategia Wiersza B dominuje A, i podobnie strategia Kolumny D dominuje C, zatem jedyną równowagą jest BD. Rezultat ten nie jest jednak optymalny w sensie Pareto: mówimy, że wynik (c,d) jest lepszy w sensie Pareto od wyniku (a,b), gdy: (a < c oraz b d) lub (a c oraz b < d), zaś wynik jest optymalny w sensie Pareto, gdy nie istnieje wynik od niego lepszy (w sensie Pareto). Widzimy zatem, że równowaga BD nie jest optymalna w sensie Pareto: wynikiem lepszym jest AC. Zasada Pareto, która głosi, że tylko wyniki Pareto-optymalne mogą być uznane za rozwiązanie gry, traktuje racjonalność z punktu widzenia grupy, dlatego nie dziwi 3

fakt, że wchodzi w oczywisty konflikt z kryterium dominacji ujmującym racjonalność z punktu widzenia jednostki. Traktując czyste rozwiązania jako punkty dwuwymiarowej płaszczyzny i umieszczając je w układzie współrzędnych otrzymujemy tzw. wielobok wypłat. Poniższe rysunki przedstawiają wieloboki wypłat gier 3 i 4. Widać na nich jak daleko od zbioru punktów Pareto-optymalnych ( północno-wschodni brzeg wieloboku; linia pogrubiona) znajdują się równowagi Nasha (okręgi). 3. Schemat arbitrażowy Nasha. Jak widzieliśmy równowagi Nasha na ogół nie dają rozwiązań Pareto-optymalnych, przez co nie mogą zostać uznane za rozwiązanie gier o sumie niezerowej. W teorii gier rozważa się inne strategie, które często prowadzą do lepszych wyników (np. tzw. strategie bezpieczne lub optymalne strategie gróźb, por. [3], s. 141), choć zdarza się, że i one nie dają Pareto-optymalnych wyników. Ta nieefektywność rozwiązań niekooperacyjnych skłania do poszukiwania rozwiązań kompromisowych (Paretooptymalnych), wypracowanych na drodze porozumienia stron. To, który wynik zostanie zaakceptowany przez strony, zależy w głównej mierze od pozycji strategicznej graczy, czyli od tzw. punktu status quo, który określa wartości jakie gracze są w stanie uzyskać grając niekooperacyjnie. Negocjacje zatem dotyczyć będą tylko takich wyników Paretooptymalnych, które są lepsze od punktu status quo (ich ogół nazywa się zbiorem negocjacyjnym). W przypadku załamania rozmów gracze wracają do swoich niekooperacyjnych strategii, a więc i do wypłat określonych przez status quo. Wróćmy do gry 3. Zauważmy, że nie tylko wielobok wypłat jest symetryczny względem prostej o równaniu y = x, ale również sama gra jest symetryczna, zatem musi być tak, że punkt status quo SQ (należący do wieloboku) ma współrzędne (x, x), czyli leży na prostej y = x. Negocjacje zatem dotyczyć będą tych punktów Pareto-optymalnych, które są lepsze od punktu SQ. Na poniższych rysunkach przedstawiono równowagi Nasha (okręgi) 4

zbiory punktów Pareto-optymalnych (linia średniej grubości) oraz zbiory negocjacyjne (najgrubsza linia) wyznaczone przez punkt SQ. Wybór kompromisowego rozwiązania jest właściwie nowym konfliktem. Przykładowo w sytuacji przedstawionej na rysunku po lewej stronie jest raczej pewne, że gracze nie zaakceptują ani AC (faworyzację Kolumny oprotestuje Wiersz), ani BD (faworyzację Wiersza oprotestuje Kolumna). Potrzebne jest więc jakieś pośrednie rozwiązanie sprawiedliwe dla obydwu stron. Przeczucie mówi, że takim rozwiązaniem w omawianej grze jest połowa odcinka łączącego punkty AC i BD czyli punkt (1,1). Aby zrealizować w praktyce ten wynik, gracze mogą umówić się, że od dziś Wiersz grać będzie kolejno A, B, A, B,, zaś Kolumna C, D, C, D,, przez co wynikami będą AC, BD, AC, BD, co średnio daje wypłatę równą 1 na każdą rozgrywkę. Zapewne tego typu intuicja towarzyszyła Nashowi, gdy podawał on aksjomaty sprawiedliwego rozwiązania gry. Uściślijmy nasze rozważania. Niech G będzie dwuosobową grą macierzową o sumie niezerowej. Niech W będzie wielobokiem wypłat generowanym przez tę macierz, czyli uwypukleniem wszystkich punktów macierzy G. Przykładowo dla następującej gry 2 2 C D A (x,x) (y,y) B (z,z) (t,t) Gra 5 wielobok wypłat W to zbiór wszystkich punktów (α, β), które można przedstawić w postaci: (α, β) = λ 1 (x,x) + λ 2 (y,y) + λ 3 (z,z) + λ 4 (t,t) dla pewnych dodatnich λ 1, λ 2, λ 3, λ 4 takich, że λ 1 + λ 2 + λ 3 + λ 4 = 1. Ponadto, niech SQ będzie dowolnym ale ustalonym punktem status quo. Parę (W, SQ) nazywa się schematem arbitrażowym. Centralnym problemem jest: jak wyznaczyć rozwiązanie N lepsze w sensie Pareto od SQ takie, aby było uznane przez obydwóch graczy za sprawiedliwe? 5

Nash w pracy [1] (por. też [3], s. 135) podaje aksjomaty jakie powinno spełniać każde sprawiedliwe rozwiązanie. Aksjomaty te wiążą trzy pojęcia: wielobok, punkt status quo oraz rozwiązanie. Aksjomat 1. Rozwiązanie N powinno być Pareto-optymalne i być lepsze od SQ. Aksjomat 2. Jeśli rozwiązaniem schematu arbitrażowego (W, SQ) jest N oraz współrzędne Wiersza lub Kolumny zostaną przekształcone przez rosnącą funkcję liniową tak, że powstanie nowy wielobok Wʹ oraz nowy punkt SQʹ, to rozwiązaniem schematu arbitrażowego (Wʹ, SQʹ) jest punkt Nʹ powstały z N przez takie samo przekształcenie. Aksjomat 3. Jeżeli wielobok W jest symetryczny względem prostej o równaniu y = x + b oraz SQ leży na tej prostej, to rozwiązanie N należy do tej prostej. Aksjomat 4. Jeśli rozwiązaniem schematu arbitrażowego (W, SQ) jest N oraz dany jest wielobok Wʹ zawarty w W, przy czym punkty SQ, N należą do Wʹ, to rozwiązaniem schematu arbitrażowego (Wʹ, SQ) jest N. Nash w [1] udowodnił następujące Twierdzenie. Niech będzie dany schemat arbitrażowy (W, SQ), gdzie SQ = (s, q). Istnieje i to dokładnie jedno należące do W rozwiązanie N = (a, b) nie gorsze niż SQ i spełniające aksjomaty 1 4. Co więcej, rozwiązanie to maksymalizuje iloczyn (x s) (y q), dla x, y takich, że x s i y q. Na rysunku przedstawiono procedurę znajdywania punktu N: z punktu SQ poprowadzić półproste: pionową na północ i poziomą na wschód ; krawędź wieloboku, która nie jest rozłączna ze zbiorem negocjacyjnym przedłużyć w razie potrzeby, tak by przecięła się z poprowadzonymi z SQ półprostymi; powstał trójkąt prostokątny; jeśli środek przeciwprostokątnej tego trójkąta należy do zbioru negocjacyjnego, to jest to właśnie N. C D A (6,2) (0,1) B (2,4) (7,0) 6

4. Silna i słaba kooperacja. Rozwiązanie arbitrażowe Nasha oparte jest na formie silnej kooperacji, której najważniejsze komponenty wymieniamy poniżej: (1) graczami muszą być bądź pojedyncze istoty inteligentne, bądź grupy ściśle skomunikowane wewnętrznie i zhierarchizowane, tak by kooperacja z przeciwnikiem i późniejsze egzekwowanie umowy przebiegało bez zakłóceń, (2) od graczy wymaga się by zaprzestali rywalizacji i zasiedli do pokojowej rozmowy, która ma zaowocować racjonalnym i sprawiedliwym wynikiem, (3) zrealizowanie uzgodnionego wyniku wymaga dokładnego zaplanowania działania oraz przechowywania historii rozgrywek jako podstawy działania w przyszłości. Punkt (1) nakłada dwojakie mocne ograniczenia: po pierwsze wymaganie by graczami były jednostki inteligentne, czyli po prostu ludzie, ignoruje zjawisko kooperacji w świecie zwierzęcym. Stanowisko tego typu zdaje się sugerować, że kooperacja jest oparta na rozumowaniu, co jest nienaturalne biorąc pod uwagę choćby zadziwiające i rozległe formy współpracy występujące w społeczeństwach owadów i innych prymitywnych zwierząt (por. [4]). Po drugie, duże grupy społeczne na ogół są w wielu kwestiach podzielone i źle skomunikowane wewnętrznie, nie mówiąc już o występowaniu tam jakiejkolwiek hierarchii. Założenie, że taka grupa dokona racjonalnej umowy z przeciwnikiem równie rozproszonym i trudnym do zidentyfikowania wydaje się nierealne w praktyce. Główny zarzut wobec punktu (2) dotyczy możliwości komunikacji w sytuacjach ekstremalnych, np. w stanie wojny. Nieprawdopodobieństwem wydaje się założenie, że w trakcie trwania wojny strony dokonują rozejmu po to by racjonalnie na drodze dyskusji wybrać rozwiązanie sprawiedliwe. Z drugiej strony nawet podczas wojny może znaleźć się miejsce na odrobinę kooperacji polegającej na przestrzeganiu ustalonych zasad takich jak np. oszczędzanie cywilów i jeńców. Wypełnianie tych zasad można jak się wydaje postrzegać jako formę subtelnej kooperacji, której zadaniem nie jest jednak zahamowanie konfliktu lecz niedopuszczenie do jego eskalacji. Nawet jeżeli punkt (2) uda się zrealizować, pozostaje jeszcze kwestia wykonania zobowiązania, które ma prowadzić do zaakceptowanego przez strony wyniku. W przypadku gry 3, scenariusz ten był prosty: polegał na naprzemiennym graniu strategii czystych, jednak w praktyce algorytm osiągania porozumienia może być o wiele bardziej skomplikowany. Każdy ruch musi być logiczną konsekwencją ruchów poprzednich, zatem strony konfliktu muszą gromadzić historię gry, co z praktycznego punktu widzenia może okazać się wręcz niemożliwe, jeśli w rozgrywkach bierze udział dużo rozproszonych jednostek. 7

Nierealność dopełnienia warunków (1) (3) przeanalizujemy na przykładzie gier, w których graczami są duże grupy, takie jak np. kibice zwaśnionych drużyn piłkarskich, powiedzmy Wisły i Cracovii. Mało prawdopodobne wydaje się tutaj realizacja punktu (1) ze względu na fundamentalną rolę emocji, które są podstawą tego konfliktu. Gotowość na racjonalne podejmowanie decyzji jest dodatkowo utrudniona przez brak ścisłej organizacji i komunikacji w obrębie jednej grupy oraz brak niekwestionowanych liderów. Warunek (2) wydaje się jeszcze mniej prawdopodobny ze względu na brak komunikacji pomiędzy grupami (na wojnie nie rozmawia się z wrogiem) jak i wątpliwą wolę zakończenia konfliktu. Problem z warunkiem (3) polega natomiast na tym, że nie da się ustalić dokładnego scenariusza postępowania w przyszłości jako, że do rozgrywek między kibicami (tj. do starć) dochodzi sporadycznie, przypadkowo i spontanicznie Niedopełnienie któregoś z warunków (1) (3) nie przekreśla jeszcze ostatecznie jakiejś słabszej formy kooperacji, choć przekreśla arbitraż w sensie Nasha. Łatwo sobie wyobrazić, że wspomniane grupy kibiców mimo, że nie są zainteresowane racjonalnym zakończeniem sporu i nie mają zamiaru komunikować się z wrogą ekipą, mogą zachowywać jakąś formę kooperacji, która gwarantuje względną równowagę (niepogłębianie się konfliktu). Kooperacja może tu polegać na przestrzeganiu wspólnych zasad, np. nie używaniu broni ostrej, rozejm na czas rozgrywek reprezentacji czy też wspólne zwalczanie jakieś innej grupy kibiców. Kooperacja tego typu nie jest oparta ani na porozumieniu ani tym bardziej na żadnym scenariuszu, ale raczej na formalnych zasadach akceptowanych przez obydwie strony. Taką formę kooperacji nazwiemy tutaj słabą kooperacją. Powyższe intuicje ujmiemy ściśle dla dwuosobowych gier o sumie niezerowej rozmiaru 2 2, choć wszystkie definicje łatwo uogólnić na dowolną grę macierzową. Rozważmy grę 5. C D A (x,x) (y,y) p B (z,z) (t,t) 1 p q 1 q Gra 5 Niech W będzie wielobokiem wypłat generowanym przez tę grę, zaś SQ ustalonym punktem status quo. Powiemy, że gracze słabo kooperują, wtedy gdy ustalają pewne strategie mieszane i zobowiązują się je stosować: Wiersz zobowiązuje się grać pewną strategią (pa, (1 p)b), zaś Kolumna strategią (qc, (1 q)d). W rezultacie osiągają wynik (α, β) taki, że 8

α = [x p + z (1 p)] q + [y p + t (1 p)] (1 q), β = [X q + Y (1 q)] p + [Z q + T (1 q)] (1 p). Wynik (α, β) nazwiemy osiągalnym (proporcjami p,q [0,1]), zaś O niech oznacza zbiór wszystkich punktów osiągalnych. W nawiązaniu do tego, że wyniki osiągalne są uzyskiwane na drodze słabej kooperacji nazwiemy je słabymi rozwiązaniami. Jeżeli mocna kooperacja jest z jakiegoś powodu niemożliwa, słaba kooperacja może prowadzić do o wiele bardziej atrakcyjnych dla obydwu graczy wyników, niż jakiejkolwiek inna strategia niekooperacyjna. Jednak aby tak było, wynik słabej kooperacji powinien posiadać podobne jak w teorii Nasha własności, musi być on przede wszystkim w jakimś sensie sprawiedliwy. Jak się przekonamy, wymóg by rozwiązanie należało do zbioru O mocno kłóci się z aksjomatyką Nasha, powstaje więc problem co jest sprawiedliwym rozwiązaniem na gruncie słabej kooperacji. Zanim do tej kwestii przejdziemy, odnotujmy prosty Fakt. O W. Dowód. Niech (α, β) O. Istnieją zatem p,q [0,1] takie, że α = xpq + yp(1 q) + z(1 p)q + t(1 p)(1 q), β = Xpq + Yp(1 q) + Z(1 p)q + T(1 p)(1 q), a zatem kładąc λ 1 = pq, λ 2 = p(1 q), λ 3 = (1 p)q, λ 4 = (1 p)(1 q), łatwo sprawdzić, że liczby λ 1, λ 2, λ 3, λ 4 są dodatnie oraz λ 1 + λ 2 + λ 3 + λ 4 = 1. Fakt. Inkluzja odwrotna na ogół nie zachodzi. Dowód. Kontrprzykładu dostarcza rozwiązanie arbitrażowe Nasha w grze 3. W paragrafie 3 uzasadniliśmy, że naturalnym jest założenie, że punkt status quo leży na osi symetrii wieloboku. Przyjmijmy, że tak właśnie jest. Łatwo zauważyć, że z aksjomatów 1 i 3 wynika, że rozwiązaniem Nasha jest wtedy punkt (1,1), który należy oczywiście do W. Jak się jednak przekonamy nie należy on do O. Istotnie, przypuśćmy nie wprost, że istnieją p,q [0,1] takie, że punkt (1,1) jest tymi proporcjami osiągalny, tzn.: [0 p + ( 2) (1 p)] q + [( 2) p + 2 (1 p)] (1 q) = 1, [2 q + ( 2) (1 q)] p + [( 2) q + 0 (1 q)] (1 p) = 1. Po uproszczeniu powyższy układ równań przedstawia się tak: 6pq 4p 4q = 1, 6pq 2p 2q = 1. 9

Wyznaczając z pierwszego równania p = (4q 1)/(6q 4) (przy założeniu, że q 2 3 ), i podstawiając do drugiego, otrzymujemy równanie kwadratowe 2q 2 2q + 1 = 0, które jak łatwo sprawdzić nie posiada rozwiązań. Podobnie dla szczególnego przypadku dla q = 2 3 układ równań jest sprzeczny. Rozwiązanie Nasha (1, 1) nie może być zatem osiągnięte na gruncie słabej kooperacji. ( 3 ) Wniosek. Zbiór O jest wypukły wtedy i tylko wtedy, gdy W = O. Dowód. ( ) Udowodniono, że O W. Łatwo sprawdzić, że wierzchołki wieloboku W należą do O (każdy wierzchołek jest rezultatem gry w czystych strategiach), zatem skoro O jest wypukły to każda krawędź W jest zawarta w O. Ustalmy teraz dowolny punkt x należący do wnętrza wieloboku W. Biorąc wówczas jakąkolwiek prostą zawierającą x, prosta ta (wobec wypukłości W) wyznacza dokładnie dwa punkty, powiedzmy a i b, leżące na krawędziach wieloboku W. Ale właśnie dlatego, że punkty te leżą na krawędziach wieloboku W, należą one również do O, co z wypukłości O oznacza, że cały odcinek od a do b zawiera się w O, w szczególności więc x należy do O. ( ) Jeśli W = O to O jest oczywiście wypukły, bo W jest. Poniższe rysunki obrazują zbiory punktów osiągalnych w przykładowych grach rozmiaru 2 2. ( 4 ) ( 3 ) Straffin w [3], s. 87 zdaje się sugerować, że każdy punkt wieloboku jest wynikiem zastosowania jakichś strategii mieszanych, co jak widzieliśmy, nie jest prawdą. Pisze on: Gdy już wyznaczymy punkty odpowiadające wynikom w strategiach czystych, wynikom w strategiach mieszanych odpowiadają punkty należące do wieloboku ograniczonego łamaną łączącą wyniki w strategiach czystych (na przykład wynikowi 1 2 AA + 1 2 BB odpowiada punkt leżący w połowie odcinka łączącego AA z BB). ( 4 ) Jedynie gry pierwsza, czwarta i piąta (licząc od lewej strony) mają taki sam wielobok wypłat W jak zbiór punktów osiągalnych O. 10

11

Jeszcze trudniej sytuacja przedstawia się w grach rozmiaru 2 3. Analizując powyższe rysunki widzimy, że zbiór punktów Pareto-optymalnych ( północno-wschodni brzeg wieloboku wypłat) na ogół nie zawiera się w O; wyjątkami są wierzchołki wieloboku wypłat, które odpowiadają wynikom w strategiach czystych. Rozwiązanie Nasha nie może być na ogół rozwiązaniem na gruncie słabej kooperacji, gdyż po prostu nie należy do O. Powstaje zatem problem jak zmodyfikować aksjomaty Nasha, aby (a) wskazywały one dokładnie jedno rozwiązanie, (b) należące do O (słabe), (c) o którym można by powiedzieć, że jest sprawiedliwe. Rozważmy następującą modyfikację aksjomatyki Nasha: Aksjomat 1 O. Słabe rozwiązanie S powinno być Pareto-optymalne i być lepsze od SQ. 12

Aksjomat 2 O. Jeśli słabym rozwiązaniem schematu (O, SQ) jest S oraz współrzędne Wiersza lub Kolumny zostaną przekształcone przez rosnącą funkcję liniową tak, że powstanie nowa figura Oʹ oraz nowy punkt SQʹ, to słabym rozwiązaniem schematu (Oʹ, SQʹ) jest punkt Sʹ powstały z S przez takie samo przekształcenie. Aksjomat 3 O. Jeżeli figura O jest symetryczna względem prostej o równaniu y = x + b oraz SQ leży na tej prostej, to słabe rozwiązanie S należy do tej prostej. Aksjomat 4 O. Jeśli słabym rozwiązaniem schematu (O, SQ) jest S oraz dana jest figura Oʹ zawarta w O, przy czym punkty SQ, S należą do Oʹ, to słabym rozwiązaniem schematu (Oʹ, SQ) jest S. Aksjomaty 2 O i 4 O nie budzą raczej kontrowersji ponieważ nie są związane z kształtem figury O, w szczególności ich sens nie zmienia się kiedy figura O nie jest wypukła. Aksjomaty 1 O i 3 O są zaś w sposób oczywisty sprzeczne: rozważmy zbiór punktów osiągalnych O gry takiej jak poniżej. Figura O jest symetryczna względem prostej o równaniu y = x, więc z aksjomatu 3 O wynikałoby, że słabym rozwiązaniem S jest jakiś punkt należący do tej prostej. Widać jednak, że żaden z tych punktów (wśród nich C jest najlepszy) nie jest Pareto-optymalny (punkty A i B są lepsze), skąd sprzeczność z aksjomatem 1 O. Aksjomat 1 O lub aksjomat 3 O musi wobec tego zostać odrzucony. Za uznaniem aksjomatu 3 O (więc odrzuceniem aksjomatu 1 O ) przemawia dość poważny argument, który w grach w pełni symetrycznych każe wybierać rozwiązanie symetryczne. W omawianej grze takim kandydatem jest punkt C. Zauważmy, że chociaż A jest lepszy od C dla obydwu 13

graczy, to jednak faworyzuje Kolumnę, co z pewnością oprotestuje Wiersz. Tak samo, B jest lepszy od C dla obydwu graczy, jednak faworyzuje Wiersza, tym razem zaprotestuje więc Kolumna. Najlepszym zatem kandydatem na słabe rozwiązanie, czyniącym zadość sprawiedliwości jest oczywiście punkt C. To, że jest tak bardzo odległy od wyników Paretooptymalnych (w szczególności od N) wyraża dobitnie jak wielki jest koszt braku mocnej kooperacji! Aksjomaty 2 O, 3 O i 4 O nie wyznaczają w sposób jednoznaczny sprawiedliwego słabego rozwiązania schematu (O, SQ). Rozważmy osłabienie aksjomatu 1 O oraz wzmocnienie aksjomatu 3 O : Aksjomat 1 OO. Słabe rozwiązanie S powinno być lepsze od SQ. Aksjomat 3 OO. Jeżeli figura O jest symetryczna względem prostej o równaniu y = x + b oraz SQ leży na tej prostej to słabym rozwiązaniem S jest najlepszy w sensie Pareto punkt należący do tej prostej. Problem, którego nie potrafimy rozstrzygnąć, to czy aksjomaty 1 OO, 2 O, 3 OO i 4 O wyznaczają jedyne rozwiązanie. Zaprezentowane podejście generuje również inne dość trudne problemy, przede wszystkim: co trzeba założyć o grze, aby dowieść, że W = O? Nieco łatwiejszym zdaje się być pytanie: co trzeba założyć o grze, aby dowieść, że N O? Literatura: [1] J. Nash, The Bargaining Problem, Econometrica 18, No. 2 (Apr., 1950), s. 155-162. [2] J. Nash, Non-Cooperative Games, The Annals of Mathematics, Second Series, Vol. 54, No. 2, (Sep., 1951), s. 286-295. [3] Ph. Strafiin, Teoria gier, przeł. J. Haman, Wydawnictwo Naukowe Scholar, Warszawa 2001. [4] E. O. Wilson, Socjobiologia, przeł. M. Siemieński, Wydawnictwo Zysk i S-ka, Poznań 2000. 14

Summary On some modification of the Nash Arbitration Scheme in two-person matrix games Abstract. In the paper we analyze the Nash Arbitration Scheme in two-person non-zero-sum games. In sections 1-3 we present the basic concepts of game theory and we briefly discuss the idea of cooperation in the sense of Nash. In section 4 we consider which assumptions have to be fulfilled to apply Nash Arbitration Scheme, and we introduce the notions of weak cooperation and solution on the basis of weak cooperation. We outline the connection between the payoff polygon of a game and the set of outcomes obtainable by mixed strategies, and we propose axioms of theory of fair solution on the basis of weak cooperation. Finally, we remark a couple of open problems. Key words: game theory, two-person non-zero-sum game, Nash s solution point, payoff polygon, weak cooperation, obtainable solution. 15