GRY W POSTACI EKSTENSYWNEJ (rozwiniętej)



Podobne dokumenty
LEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Tworzenie gier na urządzenia mobilne

10. Wstęp do Teorii Gier

Elementy Modelowania Matematycznego

2010 W. W. Norton & Company, Inc. Oligopol

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

11. Gry Macierzowe - Strategie Czyste i Mieszane

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

Teoria Gier. Piotr Kuszewski 2018L

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Czym zajmuje się teroia gier

13. Teoriogrowe Modele Konkurencji Gospodarczej

Propedeutyka teorii gier

TEORIA GIER- semestr zimowy ZADANIA 3. Gry w postaci ekstensywnej

TEORIA GIER - semestr zimowy 2011

Czym zajmuje się teroia gier

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Uniwersytet Warszawski Mikroekonomia zaawansowana Studia zaoczne dr Olga Kiuila LEKCJA 7

Teoria gier w ekonomii - opis przedmiotu

MODELOWANIE RZECZYWISTOŚCI

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

Uniwersytet Warszawski Mikroekonomia zaawansowana Studia zaoczne dr Olga Kiuila LEKCJA 9

Wprowadzenie do teorii gier

Oligopol. Jest to rynek, na którym niewielka liczba firm zachowuje się w sposób b strategiczny i ają niezależnie od siebie, ale uwzględniaj

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

1. Które z następujących funkcji produkcji cechują się stałymi korzyściami ze skali? (1) y = 3x 1 + 7x 2 (2) y = x 1 1/4 + x 2

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

TEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii

Gry o sumie niezerowej

Oligopol. dobra są homogeniczne Istnieją bariery wejścia na rynek (rynek zamknięty) konsumenci są cenobiorcami firmy posiadają siłę rynkową (P>MC)

Wyznaczanie strategii w grach

Modele lokalizacyjne

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek...

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Mikroekonomia II Semestr Letni 2014/2015 Ćwiczenia 4, 5 & 6. Technologia

Aukcje groszowe. Podejście teoriogrowe

MODELOWANIE RZECZYWISTOŚCI

Model Bertranda. np. dwóch graczy (firmy), ustalają ceny (strategie) p 1 i p 2 jednocześnie

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

Strategie kwantowe w teorii gier

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Analiza cen duopolu Stackelbera

Mikroekonomia. O czym dzisiaj?

Mikroekonomia II: Kolokwium, grupa II

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

1 S t r o n a. Teoria Gier Praca domowa 1 - rozwiązania

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

5. Utarg krańcowy (MR) można zapisać jako: A)

Hyper-resolution. Śmieciarki w Manncheim

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

Algorytmiczne aspekty teorii gier: Wykład 5

TEORIA GIER. Wspólna wiedza dotyczy nie tylko zachowań (reguł postępowania), ale i samej gry : każdy zna jej reguły i wypłaty (swoje i uczestników).

Elementy teorii gier

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

LEKCJA 8. Miara wielkości barier wejścia na rynek = różnica między ceną dla której wejście na rynek nie następuje a min AC.

Plan. Prosty model aukcji: Aukcja drugiej ceny - równowaga Nasha w strategiach słabo dominujących Aukcja pierwszej ceny - równowaga Nasha

Graf. Definicja marca / 1

Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!

Schemat sprawdzianu. 25 maja 2010

6. Teoria Podaży Koszty stałe i zmienne

Lista zadań. Równowaga w strategiach czystych

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Gry w postaci normalnej

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Zacznijmy od przypomnienia czym są i jak wyglądają gry jednoczesne oraz sekwencyjne w zapisie ekstensywnym.

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

Bisymulacja. Niezawodność systemów współbieżnych i obiektowych. Grzegorz Maj Grzegorz Maj Bisymulacja

Korzystając z własności metryki łatwo wykazać, że dla dowolnych x, y, z X zachodzi

a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek.

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

LEKCJA 11. Koszty wejścia na rynek Model Spence a. Czy monopolista może zyskownie zamknąć rynek przy wykorzystaniu zdolności produkcyjnych?

12. Funkcja popytu jest liniowa. Poniższa tabela przedstawia cztery punkty na krzywej popytu:

5. Jeśli funkcja popytu na bilety do kina ma postać: q = 122-7P, to całkowity utarg ze sprzedaży biletów jest maksymalny, gdy cena wynosi:

4. Utarg krańcowy (MR) można zapisać jako: A)

Elementy teorii gier. Badania operacyjne

MODELE STRUKTUR RYNKOWYCH

Elementy Modelowania Matematycznego

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

8. Jeśli funkcja popytu na bilety do kina ma postać: q = 356-3P, to całkowity utarg ze sprzedaży biletów jest maksymalny, gdy cena wynosi:

Dr inż. Robert Wójcik, p. 313, C-3, tel Katedra Informatyki Technicznej (K-9) Wydział Elektroniki (W-4) Politechnika Wrocławska

Digraf. 13 maja 2017

Ryszard Rapacki, Piotr Maszczyk, Mariusz Próchniak

i=7 X i. Zachodzi EX i = P(X i = 1) = 1 2, i {1, 2,..., 11} oraz EX ix j = P(X i = 1, X j = 1) = 1 7 VarS 2 2 = 14 3 ( 5 2 =

Każde pytanie zawiera postawienie problemu/pytanie i cztery warianty odpowiedzi, z których tylko jedna jest prawidłowa.

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

Oligopol wieloproduktowy

Rozdział 6. Ciągłość. 6.1 Granica funkcji

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

1. S³owo wstêpne Geologia gospodarcza g³ówne aspekty problematyki badawczej Zakres, treœæ i cel rozprawy...

Elementy modelowania matematycznego

Indukcja matematyczna. Zasada minimum. Zastosowania.

Transkrypt:

GRY W POSTACI EKSTENSYWNEJ (rozwiniętej) Gra w postaci ekstensywnej formalny opis wszystkich możliwych przebiegów gry, z uwzględnieniem struktury czasowej, możliwości wielokrotnego podejmowania decyzji przez gracza. Podobnie jak dla gier w postaci normalnej, zakładamy wspólnąwiedzęgraczyogrze(=ozasadachgryiwypąatach), racjonalność graczy i wspólną wiedzę o racjonalności, DEFINICJA: (N,W,(W 1,...,W n,w 0,W K ),I,(u 1,...,u n ),P) przy czym N={1,2,...,n} zbiórgraczy, W=(W,E) drzewogry(grafskierowanyspójnybezcykli); W wierzchołki(sytuacje w grze), E łuki(przejściamiędzynimi), W 1,W 2,...,W n rozbiciezbioruwnazbiorydecyzyjnegraczy: W=W 1... W n W 0 W K. W j zbiórwierzchołkówwktórychdecyzję(owyborzeakcji)podejmuje gracz j, W K zbiórwierzchołkówkońcowych(liści), W 0 zbiórwierzchołkówwktórychnastępujeposunięcielosowe Oznaczmyponadto:A zbiórakcji nazwłuków, A(w) zbiór akcji odpowiadających łukom wychodzącym z wierzch. w, I strukturainformacyjna rozbiciekażdegozezbioróww 1,...,W n na zbioryinformacyjne (W j =I j,1... I j,kj ), u 1,u 2,...,u n funkcjewypłaty; u i :W K R funkcjawypłatygraczai.

P rodzina rozkładów prawdopodobieństwa wyników posunięć losowych: dlakażdegow W 0 P w rozkładnaa(w) ( a AP w (a) 0, P w (a)=1). a A(w) Znaczenie struktury informacyjnej modelowanie niewiedzy gracza: podejmując decyzję w wierzchołkach należących do zbioru informacyjnego J W j graczjwietylko,żeznajdujesięwktórymśzpunktówzbioruj, aleniewie,wktórym. Wobec tego musi zachodzić: W grach z pełną informacją w,w I j,k A(w)=A(w )(=A(I j,k )). w każdej chwili każdy gracz zna cały dotychczasowy przebieg gry = są to gry, w których wszystkie zbiory inf. są jednoelementowe (szachy, Go, inne gry planszowe, gry typu NIM,...) W grach z niepełną informacją możliwe są sytuacje, w których aktualnie decydujący gracz nie zna całej dotychczasowej historii gry = są to gry z co najmniej jednym nietrywialnym zbiorem informacyjnym (większość gier karcianych, gry z równoczesnymi decyzjami,...). Uwaga. Postać ekstensywna z niepełną informacją nadaje się także do modelowania gier z jednoczesnymi decyzjami graczy. Gryzpełnąpamięcią: Jeżelipewienciągakcjia 1,...a l graczajpoprzedza pewienwierzchołekw I j,k,topoprzedzateżkażdyinnywierzchołekz I j,k. Strategiawgrzewpostaciekstensywnej funkcjas j :W j Atakaże (1) w W j s j (w) A(w), (2)w,w I j,k s j (w)=s j (w ). = kompletny plan rozegrania całej gry. (Uwaga:musibyćokreślonanawszystkichwierzchołkachzW j!) Strategiełączne jakwpostacinormalnej,s=(s 1,s 2,...,s n ).

Stwierdzenie: 1.Wgrzeekstensywnejbezposunięćlosowych(W 0 = )każdastrategia łącznas=(s 1,s 2,...,s n )wyznaczajednoznaczniewierzchołekkońcowy w(s)wktórymgranapewnosięskończygdygraczeużyjątychstrategii s 1,s 2,...,s n. 2.Wgrzeekstensywnejzposunięciamilosowymi(W 0 )każdastrategia łącznaswyznaczaloterięl(s)nazbiorzew K wierzchołkówkońcowych; P s (w) Pzakończeniagrywwgdyużytesąstrategiezs. 3. Można zatem określić wypłaty każdego gracza: u j (s)=u j (w(s))wgrzebezposunięćlosowych, u j (s)=e P(s) u j (w)wgrzezposunięciamilosowymi i w ten sposób uzyskać postać normalną dowolnej gry w postaci ekstensywnej. Wobec tego dla gier w postaci ekstensywnej można określić pojęcia: dominacji i słabej dominacji poziomu bezpieczeństwa najlepszej odpowiedzi równowagi Nasha jako odpowiednie obiekty z postaci normalnej danej gry. Podgra gry w postaci ekstensywnej todowolnepoddrzewow =(W,E )drzewaw (=dowolnywierzchołekwicałaczęśćdrzewawnastępującapow)onastępującej własności: j,k I j,k I(W) (I j,k W (I j,k W = )) (tzn.w nieprzecina zbiorówinformacyjnychwyjściowejgry) przy czym wypłaty i prawdopodobieństwa w podgrze oraz jej struktura informacyjna są odziedziczone z wyjściowej gry. Uwaga. Każda strategia(czysta lub mieszana) w grze wyznacza strategię w dowolnej jej podgrze(przez obcięcie).

Równowaga doskonała: RównowagaNasha(s 1,s 2,...,s n )wgrzewpostaciekstensywnejjestdoskonała, jeśli po obcięciu do dowolnej podgry wyznacza w tej podgrze równowagę. ANALIZA GIER EKSTENSYWNYCH Stwierdzenie: Niech T będzie dowolnym podzbiorem zbioru wierzchołków końcowychw K wpewnejdwuosobowejgrzeskończonejzpełnąinformacjąibez posunięć losowych. Wtedy albo gracz1mastrategięs 1 gwarantującąmu,żegrazakończysięwzbiorzet ( s 2 w(s 1,s 2 ) T),albo gracz2mastrategięs 2 gwarantującąmu,żegraniezakończysięwt ( s 1 w(s 1,s 2 ) T). Dowód przez indukcję względem długości najkrótszej ścieżki. (Drugi krok indukcyjny: gracz decydujący jako pierwszy, np. 1, albo ma decyzję prowadzącą do podgry w której ma strategię gwarantującą zakończenie w T, albonie). Dowód efektywny przez indukcję wstecz: każdemu wierzchołkowi drzewa, w kolejności rosnącej długości najdłuższej ścieżki wychodzącej z danego wierzchołka, przypisujemy etykietę: tjeżelinależydot, albo wszystkie jego bezpośrednie następniki mają etykietę t, lubjeślinależydow 1 imabezpośredninastępnikzetykietąt; tjeżelinależydow K \T, albo wszystkie jego bezpośrednie następniki mają etykietę t, lubjeślinależydow 2 imabezpośredninastępnikzetykietą t. Strategiagracza1(2):ZkażdegowierzchołkawW 1 (ww 2 )przechodźdo wierzchołkazetykietąt(z t)jeślitylkosięda;jeślisięnieda,przechodź dokądkolwiek. Wniosek(Klasyczne twierdzenie Zermelo): W dwuosobowej grze skończonej z pełną informacją bez posunięć losowych, której jedynymi wynikami mogą być wygrana gracza 1 lub wygrana gracza 2, któryś z graczy ma strategię wygrywającą.

(dowód wziąć jako T zbiór wierzchołków w których wygrywa gracz 1). Jeżeli zaś jedynymi wynikami mogą być wygrana gracza 1, wygrana gracza 2 lubremis,to: albo któryś z graczy ma strategię wygrywającą, albo obaj gracze mają strategie zapewniające im co najmniej remis. Współczesne twierdzenie Zermelo: W każdej grze skończonej z pełną informacją istnieje równowaga doskonała w czystych strategiach. Jeżeli dodatkowo w grze nie ma posunięć losowych, a funkcja wypłaty każdego gracza jest różnowartościowa, to ta równowaga jest wyznaczona jednoznacznie. Dowód przez indukcję wstecz która pozwala ją od razu znaleźć. Krok algorytmu: Każdemu wierzchołkowi v po którym następują tylko liście, przypisujemy: łuk prowadzący do liścia z największą wypłatą gracza(j) decydującego w tym wierzchołku(jeśli jest więcej do dowolnego wybranego), wypłaty graczy w tym najlepszym liściu jeśliv W j, oczekiwanewypłatygraczywnastępującychpovliściach jeśliv W 0, po czym przycinamy drzewo w wierzchołku v. PozakończeniuprzebiegukażdemuwierzchołkowispozaW 0 przypisanyjest wychodzący z niego łuk, a więc każdemu graczowi strategia. Przypisane są też wypłaty jakich należy się spodziewać jeżeli gracze będą dalej grać racjonalnie(= strategie w równowadze doskonałej podgry startującej z tego wierzchołka). Tu korzysta się ze wspólnej wiedzy o racjonalności(podobnie jak w IESD). Strategie mieszane w grach w postaci ekstensywnej TwierdzenieKuhna:Każdastrategiamieszanaσ i graczaiwgrzewpostaci ekstensywnej jest równoważna pewnej strategii postępowania postaci τ i :W i R takiejżeτ(w i ) (A(w i )), tzn. przy każdej strategii łącznej pozostałych graczy prowadzi do tych samych wierzchołkówcoτ i : σ j w W k P (σj,σ j )(w)=p (τj,σ j )(w)

PRZYKŁADY ZASTOSOWANIA W ORGANIZACJI RYNKU limitcapacity rozbudowa mocy produkcyjnych dla przeciwdziałania wejścia konkurencji sekwencyjne wejście na rynek monopolistyczny duopol von Stackelberga. DUOPOL v. STACKELBERGA Jak w duopolu Cournota: gracze=producencitegosamegowyrobu,q 1,q 2 [0,M] wielkościprodukcji, u i (q 1,q 2 )=(p(q) C i )q i =zysk,gdzie: Q=q 1 +q 2 łącznaprodukcja,c i kosztjednostkowygraczai, p(q) cena wyznaczona przez odwrotną funkcję popytu Różnica w stosunku do duopolu Counota: gra jest z pełną informacją najpierwwielkośćprodukcjiq 1 wybieragracz1( lider ), potemgracz2( naśladowca )wybieraq 2 znającq 1. Strategie: gracza1 [0,M],gracza2 funkcjef:[0,m] [0,M]. Równowaga Stackelberga równowaga doskonała tej gry: f(q 1 ) = NO 2 (q 1 )=argmax q2 [0,M]u 2 (q 1,q 2 ), q 1 = argmax q1 [0,M]u 1 (q 1,NO 2 (q 1 )). Przykład:liniowekosztyiodwrotnafunkcjapopytu,p=60 Q: (jakwduopolucournota)no 2 (q 1 )= 0 jeśliq 1 60 C 2 60 C 2 2 q 1 2 jeśliq 1 60 C 2 inaścieżcerównowagidoskonałejdostajemynp.przyc 1 =24 dlac 2 =C 1 =24: 0 q NO 2 (q 1 )= 1 36 18 q 1 2 q 1 36,q 1 =18,q 2 =NO 2 (q 1 )=9; dlac 2 =32: q 1 =22, q 2 =3; dlac 2 =40: q 1 =20, q 2 =0 (wtychdwóchprzypadkachliderprodukujewięcejniżjegoq mon =18aby zmusić gracza 2 do ograniczenia lub zaprzestania produkcji); przyc 1 =24,C 2 42: q 1 =q mon =18(optimummonopolisty), q 2 =0.

GRY PRZETARGU (targowania się) Dwaj gracze dzielą pomiędzy siebie dobro( ciasto ) początkowej wielkości 1, naprzemiennieskładającpropozycjepodziału:(k 1,k 2 )gdziek 1 +k 2 =1; gracz odrzucający propozycję musi następnie złożyć własną. Pierwsza przyjęta propozycja kończy grę. Wynikgry:(a,b,t);t N czas,a,b otrzymaneczęściciasta (wstosunkudojegoaktualnejwielkości zawszea+b=1). Założenia: ciasto jest pożądane: u 1 (k 1,k 2,t)>u 1 (k 1 ǫ,k 2 +ǫ,t) oraz u 2 (k 1,k 2,t)<u 2 (k 1 ǫ,k 2 +ǫ,t) dladowolnychk 1,k 2 itorazǫ>0 czasjestcenny: u i (k 1,k 2,t)>u i (k 1,k 2,t+1). Modelowanie tego: np. u i (k 1,k 2,t)=w t k i gdzie(w t ) ciągmalejący,w 1 =1( ciastaubywazczasem ); u i (k 1,k 2,t)=δ t 1 i k i gdzieδ 1,δ 2 ]0,1[ współczynnikidyskontagraczy1i2 miaryniecierpliwości ( ciasto się starzeje ). Przetarg Stahla ograniczony w czasie: w zadanym z góry momencie T przy braku porozumienia pozostałe ciasto zostajepodzielonewustalonychzgóryproporcjachk 1,K 2,K 1 +K 2 =1. Ta gra jest skończona i rozwiązuje się ją stosując zwykłą indukcję wstecz.

Przetarg Rubinsteina bez ograniczenia czasu trwania: możliwe są nieskończone ścieżki wieczna niezgoda z wynikiem (0, 0, ) takimżeu i (0,0, )=0. Oznaczamy: x (t) =(x (t) 1,x (t) 2) propozycjagracza1złożonawnieparzystejchwilit y (t) =(y (t) 1,y (t) 2) propozycjagracza1złożonawparzystejchwilit Wynik gry: (x (t) 2 =1 x (t) 1,y (t) 2 =1 y (t) 1). W(s 1,s 2 )=(k 1,k 2,t) gdzie:t numerpierwszejprzyjętejpropozycji,(k 1,k 2 ) tapropozycja(gracza 1lub2),albo(0,0, )gdytakiejpropozycjiniema. W modelu Rubinsteina: każdypodziałciasta(a,1 a)jestpodziałemwrównowadzenasha strategie prowadzące do tego podziału: gracz1 s 1 :Zawszeproponuję(a,1 a),na(y (t) wtedyitylkogdyy (t) 1 a gracz2 s 2 :Zawszeproponuję(a,1 a),na(x (t) wtedyitylkogdyx (t) 2 1 a. 1,y (t) 1,x (t) 2)zgadzamsię 2)zgadzamsię żadnazpowyższychrównowagniejestdoskonała wmodeluzdyskontem: jeślib>0,tos 2 niejestnajlepsząodp.gracza2nas 1 wpodgrzenastępującejpopropozycjix (1) =(x (1) 1,x (1) 2)gdziex (t) 2 ]δ 2 b,b[(dlaczego?) jeślib=0,tos 1 niejestnajlepsząodp.gracza1nas 2 wpodgrzenastępującejpoodrzuceniuprzezgracza2propozycjix (1) =(x (1) 1,x (1) 2)i zaproponowaniu(y (2) 1,y (2) 2 )takiegożegdziey (2) 1 ]δ 1,1[. jedyną równowagą doskonałą modelu z dyskontem jest para strategii: s 1 :Zawszeproponujępodział(x 1,x 2 ), Zgadzamsięnapropozycje(y 1,y 2 ) y 1 δ 1 x 1 ; s 2 :Zawszeproponujępodział(y 1,y 2 ), Zgadzamsięnapropozycje(x 1,x 2 ) x 2 δ 2 y 2 gdzie:y 1 =δ 1 x 1,x 2 =δ 2 y 2.

Rozwiązanie tego układu równań: Np.przyδ 1 = 5 6,δ 2= 4 5 x 1 = 1 δ 2 1 δ 1 δ 2, x 2 = δ 2(1 δ 1 ) 1 δ 1 δ 2, y 1 = δ 1(1 δ 2 ) 1 δ 1 δ 2, y 2 = 1 δ 1 1 δ 1 δ 2. x 1 = 3 5,x 2= 2 5,y 1=y 2 = 1 2 iwgrzewktórejpierwsząpropozycjęskładagracz1,dostanieon60%ciasta. Statyka porównawcza: Przyustalonymδ 1 :gdyδ 2 rośnie,y 2 ix 2 rosną cierpliwośćjestopłacalna.

GRY Z NIEKOMPLETNĄ INFORMACJĄ (gry bayesowskie ) Niekompletna informacja (nie mylić z niepełną informacją!) niepewność jednego lub więcej graczy dotycząca gry. Można zawsze sprowadzić ją do niepewności funkcji wypłat innych graczy. Przykład: Gracze = { Monopolista, Konkurent } Strategie: M: buduje nową dużą linię produkcyjną lub nie, K:wchodzinarynekmonopolistylubnie. Jeśli M nie buduje, K wchodząc odbierze mu część zysków; jeślibuduje,zarabianatym7 c(gdziec kosztbudowy)iwraziewejścia konkurenta obniża jego zyski o 4. Wojna cenowa kosztuje go dodatkowo 2. Monopolistaznaswój typ c,konkurentgoniezna i stąd gra jest z niekompletną informacją. Przyjmiemyżemonopolistamożemiećalboniski,albowysokikoszt:c n <c w. KnieznakosztówM;wieżegra(jakogracz2)jednązgier: M K W NW B 9 c w ; 2 13 c w ;0 NB 4;2 6;0 M K W NW B 9 c n ; 2 13 c n ;0 NB 4;2 6;0 aleniewie,którą. Wersjanajprostsza:c n =4,c w =9: każdy typ monopolisty ma strategię dominującą( słaby NB, mocny B)

i wobec tego przy założeniu racjonalności gracza M strategia W skutkuje dla gracza K loterią ( 2,p NK ;2,p WK ) p K prawdopodobieństwożekosztymsąniskie/wysokie. TęloterięgraczKporównujezpewnąwypłatą0dlastrategiiNWiwybierze strategięwzależnościodswejocenyp NK ip WK, stąd równowaga: M mocny B,M słaby NB, KWjeżelip NK <0,5,Nwpp. Wersjaniecotrudniejsza:c n =6,c w =9. Teraz tylko słaby M ma strategię dominującą i wobec tego K ocenia prawdopodobieństwo nadziania się na strategię B tak: stąd równowagi: przykażdymp NK : (NB,NB,W) przyp NK 1 2 : (B,NB,NW) p B =p NK y NK,B, (( 1 przyp NK 1 2 :,1 1 ) ( 1,NB, 2p NK 2p NK 2 2)),1 (kolejno strategie: mocnego monopolisty, słabego monopolisty, konkurenta). Przy tych strategiach łącznych: strategia każdego typu M jest jego najlepszą odpowiedzią na strategię K, strategia K jest jego najlepszą odpowiedzią na loterię na strategiach M z P wyliczonymi na podstawie prawdopodobieństw wystąpienia poszczególnych typów M i strategii(być może mieszanych) tych typów i to jest ogólne pojęcie równowagi w grach z niekompletną informacją.

DEFINICJA. Gra w postaci normalnej z niekompletną informacją: gdzie (N,A 1,...,A n,θ 1,...,Θ n,u 1,...,u n,p 1,...,p n ) N={1,2,...,n} zbiórgraczy, A i zbiórdostępnychakcjigraczai, Θ i zbiórmożliwychtypówgraczai, u i :Θ i A R funkcjawypłatygraczai,zależnatakżeodjegotypu, p i rozkładprawdopodobieństwanaθ i ; p i (θ i ) ocenagraczaiprawdopodobieństwawystępowaniaukładutypów θ i.(możezależećodθ i ). Strategia(czysta)graczai:dowolnafunkcjas i :Θ i A i. DEFINICJA.Strategiałączna(s 1,s 2,...s n )jest bayesowską równowagąnashatakiejgry,jeżeli i θ i Θ i a i A i E pi u i (θ i,s 1,...s i (θ i ),...s n ) E pi u i (θ i,s 1,...a i,...s n ). Równowaga w grze z niekompletną informacją jest rozdzielającajeżeli i=1,2,...n θ i,θ i Θ is i θi s i θ i (różne typy tego samego gracza wybierają różne strategie), grupującajeżeli i=1,2,...n θ i,θ i Θ i s i θi =s i θ i (wszystkie typy tego samego gracza wybierają tę samą strategie). (Oczywiście możliwe są też przypadki pośrednie).

Gry w postaci ekstensywnej z niekompletną informacją Podobnie jak gry w postaci normalnej z niekompletną informacją: każdyzgraczy(i)możebyćjednegoztypówθ i,1,...θ i,k Θ i, każdytypθ i maswójrozkładprawdopodobieństwaq i naθ i zbiorze możliwych typów pozostałych graczy. Strategia(czysta)graczaj dowolnafunkcjas j :W j Θ j Atakaże 1. w W j s j (w,θ j ) A(w), 2.w,w I j,k s j (w,θ j )=s j (w,θ j ). Podejście Harsányi ego Grę z niekompletną informacją(czy to w postaci normalnej, czy ekstensywnej) przekształcamy do postaci ekstensywnej z niepełną, ale kompletną informacją, która rozpoczyna się posunięciem losowym obsadzeniem ról, czyli wyznaczeniem typów wszystkich graczy. Jesttomożliwezawszegdyrozkładyp 1,p 2,...,p n sązgodne,tzn.istniejetaki rozkładpnaθ 1... Θ n żedlakażdegoip i jestjegorozkładembrzegowym naθ i : p i (θ i =(t 1,...,t i 1,t i+1,...t n ))=P((θ i =(t 1,...,t i 1,t i+1,...t n ) (θ i =t i )), i wtedy rozkładem wyników tego posunięcia losowego jest P. DEFINICJA.Strategiałączna(s 1,s 2,...s n )orazukładocenprawdopodobieństw(q 1,q 2,...q n )sąbayesowskąrównowagądoskonałągryekstensywnej, jeżelidlakażdegograczaiikażdegojegozbioruinformacyjnegoj W i 1.rozkładq i (J)nawierzchołkachwzbiorzeJjestwyznaczonyprzezrozkład początkowyp i istrategiegraczy(s 1,s 2,...s n )zgodniezwzorembayesa ( bayesowskie uaktualnianie ocen ), 2.strategias i prowadzidowyboruwtymzbiorzeakcjis i (J),któraprzy ocenieprawdopodobieństwq i nazbiorzejjestnajlepsząodpowiedziąna strategie(s 1,...,s i 1,s i+1,...s n )(sekwencyjnaracjonalność).

Przykład- prosty wariant modelu Spence a rynku pracy Gracze={1-Pracownik,2-Pracodawca } Typygracza1:Θ 1 = {Wybitny,Przeciętny }; P(θ 1 =W)=µ W, P(θ 1 =P)=µ P =1 µ W. Strategie: 1: zdobywa dyplom uniwersytecki(d) lub nie(nd), 2: zatrudnia gracza 1 na stanowisku szeregowym(sz) lub kierowniczym(k). Koszt zdobycia dyplomu: c P dlagracza1typup,c W <c P dlagraczatypuw. Płaca:p K nastanowiskukierowniczym,p Sz <p K naszeregowym. LOS P µ P W µ W 1 1 ND ND 2 D Sz K Sz K D p Sz p K p Sz p K z Sz p Sz z K,P p K z Sz p Sz z K,W p K Sz K 2 Sz K p Sz c P z Sz p Sz p K c P z K,P p K p Sz c W z Sz p Sz p K c W z K,W p K Wartość(brutto) pracownika dla pracodawcy: nastanowiskuszniezależnieodtypupracownikaz Sz, nakierowniczymz K,W jeślipracownikjesttypuw,z K,P jeślijesttypup, z K,P p K <z Sz p Sz <z K,W p K.

Możliwe równowagi w tym przykładzie: 1. Rozdzielająca w której dyplom uzyskują tylko pracownicy typu W: 1:W D,P ND ; 2:D K,ND Sz. Tarównowagawystępujegdyp K c W p Sz p K c P, iwtedywgórnymzbiorzeinf.(nd)q 2 (W)=0,q 2 (P)=1 awdolnym(d)q 2 (W)=1,q 2 (P)=0. 2. Grupująca w której żaden typ gracza 1 nie zdobywa dyplomu: 1:zawszeND ; 2:D cokolwiek,nd Sz występujegdyp K c W p Sz iz Sz p Sz µ P z K,P +µ W z K,W p K (tzn. pracownika losowo wybranego z całej populacji lepiej zatrudnić jako SzniżjakoK).Wzbiorzeinf.NDmamyq 2 (W)=µ W,q 2 (P)=µ P,w D dowolneprzyktórychakcja2wtymzbiorzejestsekwencyjnieracj. 3. Grupująca w której żaden typ gracza 1 nie zdobywa dyplomu: 1:zawszeND ; 2:D cokolwiek,nd K występujegdyp K c W p Sz iz Sz p Sz µ P z K,P +µ W z K,W p K (pracownika losowo wybranego z całej populacji lepiej zatrudnić jako K). Oceny jak w równowadze(2) 4. Grupująca w której każdy typ gracza 1 zdobywa dyplom: 1:zawszeD ; 2:D K,ND Sz występujegdyp K c P p Sz iz Sz p Sz µ P z K,P +µ W z K,W p K. Ocenygracza2:wzbiorzeinf.Dq 2 (W)=µ W,q 2 (P)=µ P, wnd dowolneprzyktórychakcjaszwtymzbiorzejestsekwencyjnie racjonalna. W tym modelu w równowadze rozdzielającej uzyskanie dyplomu stanowi sygnał wysokiej wartości dla pracodawcy.

GRY POWTARZANE Idea: Gry powtarzane modelują długotrwałą interakcję tych samych graczy. Polegają na wielokrotnym rozgrywaniu przez nich tej samej gry w postaci normalnej(gry etapowej). Przed każdą rozgrywką, oprócz pierwszej, gracze znają całą dotychczasową historię gry. Oznaczmy:G=(A 1,A 2,u 1,u 2 ) graetapowa (wprzypadku2-osobowym). Wówczas:historiawchwilit Ntodowolnyciąg: h t =((a (1) 1,a (1) 2 ),...,(a (t 1) 1,a (t 1) 2 )) par użytych dotychczas akcji(= strategii w grze etapowej), H t zbiórwszystkichmożliwychhistoriiwchwilit. Graskończeniepowtarzana(Trazy)G T tograwktórej strategiegraczytodowolnefunkcjes i : T t=1 H t A i, każdaparastrategiiwyznaczawkażdymmomencietakcjegraczya (t) (lubloterienazbiorzeakcjijeżelis i (h t ) A i \A i), 1,a (t) 2 wypłata gracza to średnia jego wypłat ze wszystkich etapów rozgrywki: u i (s 1,s 2 )= 1 T T t=1 u i (a (t) 1,a (t) 2). GranieskończeniepowtarzanaG δ tograwktórej strategiegraczytodowolnefunkcjes i : t=1 H t A i, każdaparastrategiiwyznaczawkażdymmomencietakcjegraczy jakw grach skończenie powtarzanych, wypłata gracza to suma zdyskontowanych wypłat z etapów rozgrywki: u i (s 1,s 2 )=(1 δ) t=1 δ t 1 u i (a (t) 1,a (t) 2)] gdzie δ ]0, 1[ czynnik dyskontujący(wspólny dla obu graczy). 16