Gry o sumie niezerowej

Podobne dokumenty
TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

Czym jest użyteczność?

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

TEORIA GIER W NAUKACH SPOŁECZNYCH. Drzewka gry, indukcja wsteczna, informacja

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

11. Gry Macierzowe - Strategie Czyste i Mieszane

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Gry wieloosobowe. Zdzisław Dzedzej

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

GRY DWUOSOBOWE O SUMIE NIEZEROWEJ. Równowaga Nasha Rozwiązania niekooperacyjne

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

MODELOWANIE RZECZYWISTOŚCI

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

MODELOWANIE RZECZYWISTOŚCI

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

10. Wstęp do Teorii Gier

Daria Sitkowska Katarzyna Urbaniak

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

Teoria Gier. Schemat arbitrażowy Nasha Zdzisław Dzedzej

TEORIA GIER WPROWADZENIE. Czesław Mesjasz

Teoria gier w ekonomii - opis przedmiotu

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Elementy teorii gier. Badania operacyjne

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Propedeutyka teorii gier

2010 W. W. Norton & Company, Inc. Oligopol

Wprowadzenie do teorii gier

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Teoria Gier. Piotr Kuszewski 2018L

Hyper-resolution. Śmieciarki w Manncheim

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

LEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.

TEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

OPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie

Teoria gier. Łukasz Balbus Anna Jaśkiewicz

Schemat sprawdzianu. 25 maja 2010

TEORIA GIER WNE UW, jesień 2011 PLAN PRZEDMIOTU

Plan. Prosty model aukcji: Aukcja drugiej ceny - równowaga Nasha w strategiach słabo dominujących Aukcja pierwszej ceny - równowaga Nasha

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1

STRATEGIA PRZYBLIŻONA. Inna propozycja: szukanie optymalnej strategii metodą iteracyjną.

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Optymalizacją wielokryterialną nazwiemy próbę znalezienia wektora zmiennych decyzyjnych: x = [x 1

1 S t r o n a. Teoria Gier Praca domowa 1 - rozwiązania

PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM. cz. 6. dr BOŻENA STARUCH

Wykład Ćwiczenia Laboratoriu m ,5 1,5 WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI CELE PRZEDMIOTU

Strategie kwantowe w teorii gier

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w

O pewnej modyfikacji arbitrażu Nasha w dwuosobowych grach macierzowych

Tworzenie gier na urządzenia mobilne

Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:

Teoria gier. Strategie stabilne ewolucyjnie Zdzisław Dzedzej 1

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

Mikroekonomia. O czym dzisiaj?

Wyznaczanie strategii w grach

TEORIA GIER. Wspólna wiedza dotyczy nie tylko zachowań (reguł postępowania), ale i samej gry : każdy zna jej reguły i wypłaty (swoje i uczestników).

Gry w postaci normalnej

PRZEWODNIK PO PRZEDMIOCIE

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

Tworzenie gier na urządzenia mobilne

1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.

NASH I JEGO HISTORIA

Macierze. Rozdział Działania na macierzach

14. Ekonomia Behawioralna - Wady Klasycznej Teorii Gier

Praca powstała w ramach zajęć Ekonomia Eksperymentalna

Rozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm

Gra EGZAMIN. Damian Wróbel, student III roku Wydział Fizyki i Informatyki Stosowanej AGH

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek...

Elementy Modelowania Matematycznego

Konkurencja i kooperacja w dwuosobowych grach strategicznych. Anna Lamek

a 11 a a 1n a 21 a a 2n... a m1 a m2... a mn x 1 x 2... x m ...

ur. 28 Czerwca 1928 w Bluefield w Wirginii, matematyk i ekonomista, profesor Uniwersytetu Princeton

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

Matematyk Ci powie, co łączy Eugeniusza Oniegina i gry hazardowe

Dłuższy przykład: Dwie firmy, Zeus i Atena, produkują sprzęt muzyczny. Zeus jest większy, Atena jest ceniona za HF. Wprowadzają nowy produkt, np.

TEORIA GIER - semestr zimowy 2011

Teoria gier. Gry powtarzane i ruchy strategiczne w stronę kooperacji Zdzisław Dzedzej 1

1. S³owo wstêpne Geologia gospodarcza g³ówne aspekty problematyki badawczej Zakres, treœæ i cel rozprawy...

; B = Wykonaj poniższe obliczenia: Mnożenia, transpozycje etc wykonuję programem i przepisuję wyniki. Mam nadzieję, że umiesz mnożyć macierze...

Gry dwuosobowe o sumie zerowej i ich zastosowanie

1 Macierze i wyznaczniki

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne.

Historia ekonomii. Mgr Robert Mróz. Mikroekonomia w XX wieku

Punkty równowagi w grach koordynacyjnych

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa

Elementy teorii gier

3. Macierze i Układy Równań Liniowych

Kwartalnik Filozoficzny, tom XL, 2012, zeszyt 1 MAGDALENA ADAMUS. (Kraków)

Nazwa przedmiotu. pierwsza

1. Które z następujących funkcji produkcji cechują się stałymi korzyściami ze skali? (1) y = 3x 1 + 7x 2 (2) y = x 1 1/4 + x 2

Analiza numeryczna Lista nr 3 (ćwiczenia) x x 2 n x.

Transkrypt:

Gry o sumie niezerowej Równowagi Nasha 2011-12-06 Zdzisław Dzedzej 1

Pytanie Czy profile równowagi Nasha są dobrym rozwiązaniem gry o dowolnej sumie? Zaleta: zawsze istnieją (w grach dwumacierzowych, a także dla dużej klasy innych gier niekooperacyjnych) W grach antagonistycznych ich znajomość jest wskazówką dla graczy: wystarczy wybierać strategie prowadzące do równowagi. Na razie zakładamy zakaz komunikowania się 2011-12-06 Zdzisław Dzedzej 2

Przykład 1 A B A (2, 3) (3, 2) B (1, 0) (0,1) 2011-12-06 Zdzisław Dzedzej 3

W grze Wiersza A dominuje B Wiedząc o tym, Kolumna zagra A Profil (A,A) jest równowagą czystą Nasha Można używać diagramu przesunięć oraz kryterium dominacji (indywidualna racjonalność graczy) 2011-12-06 Zdzisław Dzedzej 4

Przykład 2 A B A (2, 4) (1, 0) B (3, 1) (0,4) 2011-12-06 Zdzisław Dzedzej 5

Nie ma czystej równowagi Nasha Szukamy strategii wyrównującej Wiersza w grze Kolumny W: pa+(1-p)b? K A: 4p+1(1-p) = 0p+4(1-p) : B Stąd W : 3/7A+4/7B Podobnie K : 1/2A+1/2B po analizie gry Wiersza To daje równowagę Nasha z wynikiem (3/2, 16/7) Zauważmy, że (A,A) dałoby wynik lepszy dla obu graczy 2011-12-06 Zdzisław Dzedzej 6

Przykład 3 A B A (1, 1) (2, 5) B (5, 2) (-1,-1) 2011-12-06 Zdzisław Dzedzej 7

Są dwie czyste równowagi Nasha Profile (B, A) oraz (A, B) sa równowagami, ale dają różne wypłaty: BA jest lepsza dla Wiersza, AB dla Kolumny Jeśli obaj wybiorą strategie prowadzące do preferowanych przez siebie równowag, to wyjdzie BB najgorszy możliwy wynik na dodatek nie będący równowagą. Wniosek: równowagi nie są wymienne ani równoważne, a ich zbiór nie jest prostokątny. 2011-12-06 Zdzisław Dzedzej 8

Przykład 4 A B A (3, 3) (-1, 5) B (5,-1) (0, 0) 2011-12-06 Zdzisław Dzedzej 9

Komentarz W przykładzie 4 jest jedyna równowaga Nasha: Czysta BB powstaje ze ścisłych dominacji dla obu graczy Lepszy wynik byłby, gdyby obaj gracze wybrali A Wniosek: nie można przenieść pojęcia rozwiązania gry z gier macierzowych na dwumacierzowe bez zmian. 2011-12-06 Zdzisław Dzedzej 10

Profil Pareto -optymalny DEF: Profil jest nieoptymalny w sensie Pareto, jeśli istnieje inny profil dający wszystkim co najmniej te same wypłaty, a przynajmniej jednemu wyższą. 2011-12-06 Zdzisław Dzedzej 11

Kryterium Pareto Racjonalność grupowa: Tylko profil optymalny w sensie Pareto może być akceptowalny jako kandydat na rozwiązanie gry. Uwaga: kryterium dominacji interpretuje się jako racjonalność indywidualną. 2011-12-06 Zdzisław Dzedzej 12

Przykład 1 A B A (2, 3) (3, 2) B (1, 0) (0,1) 2011-12-06 Zdzisław Dzedzej 13

Kol Przykład 1 3 AA Równowaga Nasha AB 1 BA 1 3 W 2011-12-06 Zdzisław Dzedzej 14

Przykład 2 A B A (2, 4) (1, 0) B (3, 1) (0,4) 2011-12-06 Zdzisław Dzedzej 15

Kol Przykład 2 AA 3 Równowaga Nasha 1 AB 1 3 W 2011-12-06 Zdzisław Dzedzej 16

Przykład 3 A B A (1, 1) (2, 5) B (5, 2) (-1,-1) 2011-12-06 Zdzisław Dzedzej 17

Kol Przykład 3 5 AB BA 2 AA 2 5 W 2011-12-06 Zdzisław Dzedzej 18

Przykład 4 A B A (3, 3) (-1, 5) B (5,-1) (0, 0) 2011-12-06 Zdzisław Dzedzej 19

Kol Przykład 4 3 AA Równowaga Nasha 1 AB 1 3 W 2011-12-06 Zdzisław Dzedzej 20

Gry rozwiązywalne DEF: Gra dwuosobowa jest rozwiązywalna w ścisłym sensie, jeśli Posiada przynajmniej jedną równowagę Nasha optymalną w sensie Pareto, Jeśli takich równowag jest więcej, to są one ekwiwalentne i wymienne. 2011-12-06 Zdzisław Dzedzej 21

Drugi warunek oznacza, że dają równe wypłaty, a także: gdy obaj gracze zagrają dowolne swoje strategie będące składowymi punktu równowagi, to otrzymamy punkt równowagi. Z naszych przykładów tylko 1 jest rozwiązywalna w ścisłym sensie 2 ma równowagę nieoptymalną, w 3 równowagi optymalne nie są wymienne ani ekwiwalentne, w 4 równowaga też nie jest optymalna (ekstremalnie!) 2011-12-06 Zdzisław Dzedzej 22

Strategie bezpieczeństwa DEF: Strategia optymalna Wiersza (Kolumny) w grze Wiersza (Kolumny) nazywa się strategią bezpieczeństwa Wiersza (Kolumny). Odpowiednia wartość wypłaty gracza nazywa się jego poziomem bezpieczeństwa 2011-12-06 Zdzisław Dzedzej 23

Jeszcze raz Przykład 2 W grze Wiersza jest punkt siodłowy AB A B Zatem strategia A gwarantuje poziom co najmniej 1 To jest poziom bezpieczeństwa Wiersza A 2 1 B 3 0 2011-12-06 Zdzisław Dzedzej 24

Jeszcze raz Przykład 2 W grze Kolumny jej strategia bezpieczeństwa to 4/7A +3/7B, która daje poziom co najmniej 16/7 To jest poziom bezpieczeństwa Kolumny A B A 4 0 B 1 4 2011-12-06 Zdzisław Dzedzej 25

Analiza Jeśli obaj gracze zagrają swoje strategie bezpieczeństwa, otrzymamy profil 4/7AA+3/7AB To daje wypłaty (11/7, 16/7) Nie jest to wynik paretooptymalny ani nie jest to równowaga Równowaga : [3/7A+4/7B, 1/2A+1/2B] daje wypłaty (3/2, 16/7) Jeśli Kolumna przewiduje, że Wiersz gra strategię bezpieczeństwa, to powinna zagrać najlepszą odpowiedź ( strategia kontrbezpieczna) A i wygrać 4. Podobnie Wiersz ma strategię kontrbezpieczną B 2011-12-06 Zdzisław Dzedzej 26

Strategia Wiersza Strategia Kolumny Wypłata Wiersza Wypłata Kolumny Bezp A Bezp. 4/7A+3/7B 1,57 2,29 Bezp A Kontrb. A 2,00 4,00 Kontrb. B Bezp. 4/7A+3/7B 1,71 2,29 Kontrb. B Kontrb. A 3,00 1,00 2011-12-06 Zdzisław Dzedzej 27

Uwagi Strategie bezpieczeństwa są nazywane także maksyminowymi ( od sposobu obliczania poziomów bezpieczeństwa). Średnia wypłata gracza w punkcie równowagi jest co najmniej taka, jak poziom bezpieczeństwa. 2011-12-06 Zdzisław Dzedzej 28

Przykład 5 Równowagi : BB nieoptymalna AC Pareto-optymalna To nie są ich strategie bezpieczeństwa Ćwiczenie: wykonaj odp. Diagramy i rys. A B C A B C (0, -1) (0, 2) (2, 3) (0, 0) (2, 1) (1,-1) (2, 2) (1, 4) (1, -1) 2011-12-06 Zdzisław Dzedzej 29

Przykład 6! 2011-12-06 Zdzisław Dzedzej 30

Teoria użyteczności Kiedy próbujemy zastosować teorię gier do rzeczywistych przykładów, konieczna jest analiza procesu przypisywania wartości liczbowych wypłat. Podstawy teorii użyteczności stworzyli von Neumann i Morgenstern. Jakie właściwości wypłat są konieczne dla sensowności wniosków z modelu. 2011-12-06 Zdzisław Dzedzej 31

Przypadek 1- jest punkt siodłowy To znaczy,że Wiersz przedkłada go nad inne w jego kolumnie, zaś każdy w jego wierszu uważa za lepszy. Zatem wymagamy jedynie, aby liczby reprezentowały uporządkowanie wyników od najbardziej do najmniej preferowanego przez Wiersza (odwrotnie dla kolumny). Życzymy sobie by porządek wynikający z preferencji Wiersza był liniowy. Aby grę można było uznać za grę o sumie zerowej, porządek preferencji Kolumny powinien być odwrotny do preferencji Wiersza. 2011-12-06 Zdzisław Dzedzej 32

Przykład A B A 6 1 B 5 4 Punkt siodłowy BB Jeżeli przekształcimy wartości wypłat przez funkcję rosnącą, punkt siodłowy zostanie w tym samym miejscu Zachowają się też wszystkie dominacje C 2 3 2011-12-06 Zdzisław Dzedzej 33

Skala porządkowa DEF: Skalę, na której większa wartość reprezentuje bardziej preferowany wynik (znaczenie ma tylko uporządkowanie wartości) nazywamy skalą porządkową. Użyteczności wyznaczone zgodnie z taką zasadą nazywamy użytecznościami porządkowymi. 2011-12-06 Zdzisław Dzedzej 34

Przypadek 2 nie ma punktu siodłowego Tutaj trzeba posługiwać się strategiami mieszanymi Skala, na której można interpretować proporcje między różnicami różnych wartości nazywamy skalą interwałową. Liczby oddające preferencje mierzone na skali interwałowej nazywamy użytecznościami interwałowymi. A B A a b B c d Gdy a>b i d>c, to optymalną strategią Wiersza jest strategia Mieszana, ale wtedy proporcja Różnic d-c i a-b musi być interpretowalna 2011-12-06 Zdzisław Dzedzej 35

Loterie Aby rozwiązanie gry w strategiach mieszanych miało sens, liczby wpisane w macierz gry powinny być użytecznościami interwałowymi. Niech możliwymi wynikami będą u, x, w, v kolejności wg preferencji Wiersza. Chcemy tak przypisać liczby wynikom, by proporcje między różnicami użyteczności wynikały z preferencji Wiersza: Zadajemy Wierszowi pytania o stosunek do loterii : 2011-12-06 Zdzisław Dzedzej 36

u>v niech u=100, v=0 Pytamy Wiersza : czy woli x na pewno, czy loterię gdzie u z prawdopodobieństwem ½ i v też. Jeśli woli x to umieszczamy je w przedziale (50,100). Czy woli x czy loterię 1/2v,3/4u Jeśli woli loterię, to x jest w (50,75), itd. Aż do odpowiedzi, że są równie korzystne. Zgodność oznacza, że położenie wyników ilustruje preferencje Wiersza w stosunku do loterii,np. x=60 ~ 4/10v,6/10u 2011-12-06 Zdzisław Dzedzej 37

Kolumna Aby gra miała sumę zerową, preferencje Kolumny powinny być dokładnie odwrotne do Wiersza. Jednak zmieniając punkty końcowe i zachowując proporcje (tzn. Ustawiając wartości wg wartości funkcji liniowej rosnącej) dostajemy równoważną skalę interwałową. Wniosek: Niektóre gry o sumie niezerowej są równoważne grom o sumie zerowej 2011-12-06 Zdzisław Dzedzej 38

Przykład 7 Górna gra nie ma sumy zerowej ani stałej, ale stosując do użyteczności wiersza funkcję G(x)=½(x-17) otrzymamy dolną grę. A B A (27,-5) (17, 0) B (19,-1) (23,-3) A B A (5,-5) (0,0) B (1,-1) (3,-3) 2011-12-06 Zdzisław Dzedzej 39

Użyteczności Kolumny u ż 5 y t e c z n o ś c i -5 5 15 AB A B 20 BA 2 0 BB AA Użyteczności Wiersza 2011-12-06 Zdzisław Dzedzej 40

Źródła J. von Neumann, O. Morgenstern, Theory of Games and Economic Behavior 1944 I.N. Herstein, J. Milnor, An axiomatic approach to measurable utility, Econometrica 21(1953), 291-297 Ph. Straffin, Teoria Gier, W-wa 2004 2011-12-06 Zdzisław Dzedzej 41

Typowe błędy 1. Odwrócenie przyczynowości : Jeśli ktoś przedkłada jakąś propozycję nad inną, to oznacza, że ta propozycja ma wyższą użyteczność. 2. Racjonalność : Jeśli mając do wyboru jedną z dwóch propozycji osoba wybiera tę o niższej użyteczności, to znaczy, że postępuje nieracjonalnie. 2011-12-06 Zdzisław Dzedzej 42

3. Dodawanie użyteczności : Możemy określić, jaka propozycja jest społecznie najbardziej pożądana, sumując użyteczności różnych osób (Bentham i utylitaryści XIX w.). 4. Międzyosobowe porównywanie użyteczności : Jeśli dany wynik ma dla jednego z graczy wyższą użyteczność niż dla drugiego, to jest on przez pierwszego gracza bardziej pożądany niż przez drugiego. 2011-12-06 Zdzisław Dzedzej 43

John Milnor 2011-12-06 Zdzisław Dzedzej 44

John von Neumann 2011-12-06 Zdzisław Dzedzej 45

Oskar Morgenstern 2011-12-06 Zdzisław Dzedzej 46

John F. Nash 80 lat 2011-12-06 Zdzisław Dzedzej 47

POBUDKA!!! Idziemy do domu. 2011-12-06 Zdzisław Dzedzej 48

2011-12-06 Zdzisław Dzedzej 49