GRY W POSTACI EKSTENSYWNEJ (rozwiniętej)

GRY W POSTACI EKSTENSYWNEJ (rozwiniętej) Gra w postaci ekstensywnej formalny opis wszystkich możliwych przebiegów gry, z uwzględnieniem struktury czasowej, możliwości wielokrotnego podejmowania decyzji przez gracza. Podobnie jak dla gier w postaci normalnej, zakładamy wspólnąwiedzęgraczyogrze(=ozasadachgryiwypąatach), racjonalność graczy i wspólną wiedzę o racjonalności, DEFINICJA: (N,W,(W 1,...,W n,w 0,W K ),I,(u 1,...,u n ),P) przy czym N={1,2,...,n} zbiórgraczy, W=(W,E) drzewogry(grafskierowanyspójnybezcykli); W wierzchołki(sytuacje w grze), E łuki(przejściamiędzynimi), W 1,W 2,...,W n rozbiciezbioruwnazbiorydecyzyjnegraczy: W=W 1... W n W 0 W K. W j zbiórwierzchołkówwktórychdecyzję(owyborzeakcji)podejmuje gracz j, W K zbiórwierzchołkówkońcowych(liści), W 0 zbiórwierzchołkówwktórychnastępujeposunięcielosowe Oznaczmyponadto:A zbiórakcji nazwłuków, A(w) zbiór akcji odpowiadających łukom wychodzącym z wierzch. w, I strukturainformacyjna rozbiciekażdegozezbioróww 1,...,W n na zbioryinformacyjne (W j =I j,1... I j,kj ), u 1,u 2,...,u n funkcjewypłaty; u i :W K R funkcjawypłatygraczai.

P rodzina rozkładów prawdopodobieństwa wyników posunięć losowych: dlakażdegow W 0 P w rozkładnaa(w) ( a AP w (a) 0, P w (a)=1). a A(w) Znaczenie struktury informacyjnej modelowanie niewiedzy gracza: podejmując decyzję w wierzchołkach należących do zbioru informacyjnego J W j graczjwietylko,żeznajdujesięwktórymśzpunktówzbioruj, aleniewie,wktórym. Wobec tego musi zachodzić: W grach z pełną informacją w,w I j,k A(w)=A(w )(=A(I j,k )). w każdej chwili każdy gracz zna cały dotychczasowy przebieg gry = są to gry, w których wszystkie zbiory inf. są jednoelementowe (szachy, Go, inne gry planszowe, gry typu NIM,...) W grach z niepełną informacją możliwe są sytuacje, w których aktualnie decydujący gracz nie zna całej dotychczasowej historii gry = są to gry z co najmniej jednym nietrywialnym zbiorem informacyjnym (większość gier karcianych, gry z równoczesnymi decyzjami,...). Uwaga. Postać ekstensywna z niepełną informacją nadaje się także do modelowania gier z jednoczesnymi decyzjami graczy. Gryzpełnąpamięcią: Jeżelipewienciągakcjia 1,...a l graczajpoprzedza pewienwierzchołekw I j,k,topoprzedzateżkażdyinnywierzchołekz I j,k. Strategiawgrzewpostaciekstensywnej funkcjas j :W j Atakaże (1) w W j s j (w) A(w), (2)w,w I j,k s j (w)=s j (w ). = kompletny plan rozegrania całej gry. (Uwaga:musibyćokreślonanawszystkichwierzchołkachzW j!) Strategiełączne jakwpostacinormalnej,s=(s 1,s 2,...,s n ).

Stwierdzenie: 1.Wgrzeekstensywnejbezposunięćlosowych(W 0 = )każdastrategia łącznas=(s 1,s 2,...,s n )wyznaczajednoznaczniewierzchołekkońcowy w(s)wktórymgranapewnosięskończygdygraczeużyjątychstrategii s 1,s 2,...,s n. 2.Wgrzeekstensywnejzposunięciamilosowymi(W 0 )każdastrategia łącznaswyznaczaloterięl(s)nazbiorzew K wierzchołkówkońcowych; P s (w) Pzakończeniagrywwgdyużytesąstrategiezs. 3. Można zatem określić wypłaty każdego gracza: u j (s)=u j (w(s))wgrzebezposunięćlosowych, u j (s)=e P(s) u j (w)wgrzezposunięciamilosowymi i w ten sposób uzyskać postać normalną dowolnej gry w postaci ekstensywnej. Wobec tego dla gier w postaci ekstensywnej można określić pojęcia: dominacji i słabej dominacji poziomu bezpieczeństwa najlepszej odpowiedzi równowagi Nasha jako odpowiednie obiekty z postaci normalnej danej gry. Podgra gry w postaci ekstensywnej todowolnepoddrzewow =(W,E )drzewaw (=dowolnywierzchołekwicałaczęśćdrzewawnastępującapow)onastępującej własności: j,k I j,k I(W) (I j,k W (I j,k W = )) (tzn.w nieprzecina zbiorówinformacyjnychwyjściowejgry) przy czym wypłaty i prawdopodobieństwa w podgrze oraz jej struktura informacyjna są odziedziczone z wyjściowej gry. Uwaga. Każda strategia(czysta lub mieszana) w grze wyznacza strategię w dowolnej jej podgrze(przez obcięcie).

Równowaga doskonała: RównowagaNasha(s 1,s 2,...,s n )wgrzewpostaciekstensywnejjestdoskonała, jeśli po obcięciu do dowolnej podgry wyznacza w tej podgrze równowagę. ANALIZA GIER EKSTENSYWNYCH Stwierdzenie: Niech T będzie dowolnym podzbiorem zbioru wierzchołków końcowychw K wpewnejdwuosobowejgrzeskończonejzpełnąinformacjąibez posunięć losowych. Wtedy albo gracz1mastrategięs 1 gwarantującąmu,żegrazakończysięwzbiorzet ( s 2 w(s 1,s 2 ) T),albo gracz2mastrategięs 2 gwarantującąmu,żegraniezakończysięwt ( s 1 w(s 1,s 2 ) T). Dowód przez indukcję względem długości najkrótszej ścieżki. (Drugi krok indukcyjny: gracz decydujący jako pierwszy, np. 1, albo ma decyzję prowadzącą do podgry w której ma strategię gwarantującą zakończenie w T, albonie). Dowód efektywny przez indukcję wstecz: każdemu wierzchołkowi drzewa, w kolejności rosnącej długości najdłuższej ścieżki wychodzącej z danego wierzchołka, przypisujemy etykietę: tjeżelinależydot, albo wszystkie jego bezpośrednie następniki mają etykietę t, lubjeślinależydow 1 imabezpośredninastępnikzetykietąt; tjeżelinależydow K \T, albo wszystkie jego bezpośrednie następniki mają etykietę t, lubjeślinależydow 2 imabezpośredninastępnikzetykietą t. Strategiagracza1(2):ZkażdegowierzchołkawW 1 (ww 2 )przechodźdo wierzchołkazetykietąt(z t)jeślitylkosięda;jeślisięnieda,przechodź dokądkolwiek. Wniosek(Klasyczne twierdzenie Zermelo): W dwuosobowej grze skończonej z pełną informacją bez posunięć losowych, której jedynymi wynikami mogą być wygrana gracza 1 lub wygrana gracza 2, któryś z graczy ma strategię wygrywającą.

(dowód wziąć jako T zbiór wierzchołków w których wygrywa gracz 1). Jeżeli zaś jedynymi wynikami mogą być wygrana gracza 1, wygrana gracza 2 lubremis,to: albo któryś z graczy ma strategię wygrywającą, albo obaj gracze mają strategie zapewniające im co najmniej remis. Współczesne twierdzenie Zermelo: W każdej grze skończonej z pełną informacją istnieje równowaga doskonała w czystych strategiach. Jeżeli dodatkowo w grze nie ma posunięć losowych, a funkcja wypłaty każdego gracza jest różnowartościowa, to ta równowaga jest wyznaczona jednoznacznie. Dowód przez indukcję wstecz która pozwala ją od razu znaleźć. Krok algorytmu: Każdemu wierzchołkowi v po którym następują tylko liście, przypisujemy: łuk prowadzący do liścia z największą wypłatą gracza(j) decydującego w tym wierzchołku(jeśli jest więcej do dowolnego wybranego), wypłaty graczy w tym najlepszym liściu jeśliv W j, oczekiwanewypłatygraczywnastępującychpovliściach jeśliv W 0, po czym przycinamy drzewo w wierzchołku v. PozakończeniuprzebiegukażdemuwierzchołkowispozaW 0 przypisanyjest wychodzący z niego łuk, a więc każdemu graczowi strategia. Przypisane są też wypłaty jakich należy się spodziewać jeżeli gracze będą dalej grać racjonalnie(= strategie w równowadze doskonałej podgry startującej z tego wierzchołka). Tu korzysta się ze wspólnej wiedzy o racjonalności(podobnie jak w IESD). Strategie mieszane w grach w postaci ekstensywnej TwierdzenieKuhna:Każdastrategiamieszanaσ i graczaiwgrzewpostaci ekstensywnej jest równoważna pewnej strategii postępowania postaci τ i :W i R takiejżeτ(w i ) (A(w i )), tzn. przy każdej strategii łącznej pozostałych graczy prowadzi do tych samych wierzchołkówcoτ i : σ j w W k P (σj,σ j )(w)=p (τj,σ j )(w)

PRZYKŁADY ZASTOSOWANIA W ORGANIZACJI RYNKU limitcapacity rozbudowa mocy produkcyjnych dla przeciwdziałania wejścia konkurencji sekwencyjne wejście na rynek monopolistyczny duopol von Stackelberga. DUOPOL v. STACKELBERGA Jak w duopolu Cournota: gracze=producencitegosamegowyrobu,q 1,q 2 [0,M] wielkościprodukcji, u i (q 1,q 2 )=(p(q) C i )q i =zysk,gdzie: Q=q 1 +q 2 łącznaprodukcja,c i kosztjednostkowygraczai, p(q) cena wyznaczona przez odwrotną funkcję popytu Różnica w stosunku do duopolu Counota: gra jest z pełną informacją najpierwwielkośćprodukcjiq 1 wybieragracz1( lider ), potemgracz2( naśladowca )wybieraq 2 znającq 1. Strategie: gracza1 [0,M],gracza2 funkcjef:[0,m] [0,M]. Równowaga Stackelberga równowaga doskonała tej gry: f(q 1 ) = NO 2 (q 1 )=argmax q2 [0,M]u 2 (q 1,q 2 ), q 1 = argmax q1 [0,M]u 1 (q 1,NO 2 (q 1 )). Przykład:liniowekosztyiodwrotnafunkcjapopytu,p=60 Q: (jakwduopolucournota)no 2 (q 1 )= 0 jeśliq 1 60 C 2 60 C 2 2 q 1 2 jeśliq 1 60 C 2 inaścieżcerównowagidoskonałejdostajemynp.przyc 1 =24 dlac 2 =C 1 =24: 0 q NO 2 (q 1 )= 1 36 18 q 1 2 q 1 36,q 1 =18,q 2 =NO 2 (q 1 )=9; dlac 2 =32: q 1 =22, q 2 =3; dlac 2 =40: q 1 =20, q 2 =0 (wtychdwóchprzypadkachliderprodukujewięcejniżjegoq mon =18aby zmusić gracza 2 do ograniczenia lub zaprzestania produkcji); przyc 1 =24,C 2 42: q 1 =q mon =18(optimummonopolisty), q 2 =0.

GRY PRZETARGU (targowania się) Dwaj gracze dzielą pomiędzy siebie dobro( ciasto ) początkowej wielkości 1, naprzemiennieskładającpropozycjepodziału:(k 1,k 2 )gdziek 1 +k 2 =1; gracz odrzucający propozycję musi następnie złożyć własną. Pierwsza przyjęta propozycja kończy grę. Wynikgry:(a,b,t);t N czas,a,b otrzymaneczęściciasta (wstosunkudojegoaktualnejwielkości zawszea+b=1). Założenia: ciasto jest pożądane: u 1 (k 1,k 2,t)>u 1 (k 1 ǫ,k 2 +ǫ,t) oraz u 2 (k 1,k 2,t)<u 2 (k 1 ǫ,k 2 +ǫ,t) dladowolnychk 1,k 2 itorazǫ>0 czasjestcenny: u i (k 1,k 2,t)>u i (k 1,k 2,t+1). Modelowanie tego: np. u i (k 1,k 2,t)=w t k i gdzie(w t ) ciągmalejący,w 1 =1( ciastaubywazczasem ); u i (k 1,k 2,t)=δ t 1 i k i gdzieδ 1,δ 2 ]0,1[ współczynnikidyskontagraczy1i2 miaryniecierpliwości ( ciasto się starzeje ). Przetarg Stahla ograniczony w czasie: w zadanym z góry momencie T przy braku porozumienia pozostałe ciasto zostajepodzielonewustalonychzgóryproporcjachk 1,K 2,K 1 +K 2 =1. Ta gra jest skończona i rozwiązuje się ją stosując zwykłą indukcję wstecz.

Przetarg Rubinsteina bez ograniczenia czasu trwania: możliwe są nieskończone ścieżki wieczna niezgoda z wynikiem (0, 0, ) takimżeu i (0,0, )=0. Oznaczamy: x (t) =(x (t) 1,x (t) 2) propozycjagracza1złożonawnieparzystejchwilit y (t) =(y (t) 1,y (t) 2) propozycjagracza1złożonawparzystejchwilit Wynik gry: (x (t) 2 =1 x (t) 1,y (t) 2 =1 y (t) 1). W(s 1,s 2 )=(k 1,k 2,t) gdzie:t numerpierwszejprzyjętejpropozycji,(k 1,k 2 ) tapropozycja(gracza 1lub2),albo(0,0, )gdytakiejpropozycjiniema. W modelu Rubinsteina: każdypodziałciasta(a,1 a)jestpodziałemwrównowadzenasha strategie prowadzące do tego podziału: gracz1 s 1 :Zawszeproponuję(a,1 a),na(y (t) wtedyitylkogdyy (t) 1 a gracz2 s 2 :Zawszeproponuję(a,1 a),na(x (t) wtedyitylkogdyx (t) 2 1 a. 1,y (t) 1,x (t) 2)zgadzamsię 2)zgadzamsię żadnazpowyższychrównowagniejestdoskonała wmodeluzdyskontem: jeślib>0,tos 2 niejestnajlepsząodp.gracza2nas 1 wpodgrzenastępującejpopropozycjix (1) =(x (1) 1,x (1) 2)gdziex (t) 2 ]δ 2 b,b[(dlaczego?) jeślib=0,tos 1 niejestnajlepsząodp.gracza1nas 2 wpodgrzenastępującejpoodrzuceniuprzezgracza2propozycjix (1) =(x (1) 1,x (1) 2)i zaproponowaniu(y (2) 1,y (2) 2 )takiegożegdziey (2) 1 ]δ 1,1[. jedyną równowagą doskonałą modelu z dyskontem jest para strategii: s 1 :Zawszeproponujępodział(x 1,x 2 ), Zgadzamsięnapropozycje(y 1,y 2 ) y 1 δ 1 x 1 ; s 2 :Zawszeproponujępodział(y 1,y 2 ), Zgadzamsięnapropozycje(x 1,x 2 ) x 2 δ 2 y 2 gdzie:y 1 =δ 1 x 1,x 2 =δ 2 y 2.

Rozwiązanie tego układu równań: Np.przyδ 1 = 5 6,δ 2= 4 5 x 1 = 1 δ 2 1 δ 1 δ 2, x 2 = δ 2(1 δ 1 ) 1 δ 1 δ 2, y 1 = δ 1(1 δ 2 ) 1 δ 1 δ 2, y 2 = 1 δ 1 1 δ 1 δ 2. x 1 = 3 5,x 2= 2 5,y 1=y 2 = 1 2 iwgrzewktórejpierwsząpropozycjęskładagracz1,dostanieon60%ciasta. Statyka porównawcza: Przyustalonymδ 1 :gdyδ 2 rośnie,y 2 ix 2 rosną cierpliwośćjestopłacalna.

GRY Z NIEKOMPLETNĄ INFORMACJĄ (gry bayesowskie ) Niekompletna informacja (nie mylić z niepełną informacją!) niepewność jednego lub więcej graczy dotycząca gry. Można zawsze sprowadzić ją do niepewności funkcji wypłat innych graczy. Przykład: Gracze = { Monopolista, Konkurent } Strategie: M: buduje nową dużą linię produkcyjną lub nie, K:wchodzinarynekmonopolistylubnie. Jeśli M nie buduje, K wchodząc odbierze mu część zysków; jeślibuduje,zarabianatym7 c(gdziec kosztbudowy)iwraziewejścia konkurenta obniża jego zyski o 4. Wojna cenowa kosztuje go dodatkowo 2. Monopolistaznaswój typ c,konkurentgoniezna i stąd gra jest z niekompletną informacją. Przyjmiemyżemonopolistamożemiećalboniski,albowysokikoszt:c n <c w. KnieznakosztówM;wieżegra(jakogracz2)jednązgier: M K W NW B 9 c w ; 2 13 c w ;0 NB 4;2 6;0 M K W NW B 9 c n ; 2 13 c n ;0 NB 4;2 6;0 aleniewie,którą. Wersjanajprostsza:c n =4,c w =9: każdy typ monopolisty ma strategię dominującą( słaby NB, mocny B)

i wobec tego przy założeniu racjonalności gracza M strategia W skutkuje dla gracza K loterią ( 2,p NK ;2,p WK ) p K prawdopodobieństwożekosztymsąniskie/wysokie. TęloterięgraczKporównujezpewnąwypłatą0dlastrategiiNWiwybierze strategięwzależnościodswejocenyp NK ip WK, stąd równowaga: M mocny B,M słaby NB, KWjeżelip NK <0,5,Nwpp. Wersjaniecotrudniejsza:c n =6,c w =9. Teraz tylko słaby M ma strategię dominującą i wobec tego K ocenia prawdopodobieństwo nadziania się na strategię B tak: stąd równowagi: przykażdymp NK : (NB,NB,W) przyp NK 1 2 : (B,NB,NW) p B =p NK y NK,B, (( 1 przyp NK 1 2 :,1 1 ) ( 1,NB, 2p NK 2p NK 2 2)),1 (kolejno strategie: mocnego monopolisty, słabego monopolisty, konkurenta). Przy tych strategiach łącznych: strategia każdego typu M jest jego najlepszą odpowiedzią na strategię K, strategia K jest jego najlepszą odpowiedzią na loterię na strategiach M z P wyliczonymi na podstawie prawdopodobieństw wystąpienia poszczególnych typów M i strategii(być może mieszanych) tych typów i to jest ogólne pojęcie równowagi w grach z niekompletną informacją.

DEFINICJA. Gra w postaci normalnej z niekompletną informacją: gdzie (N,A 1,...,A n,θ 1,...,Θ n,u 1,...,u n,p 1,...,p n ) N={1,2,...,n} zbiórgraczy, A i zbiórdostępnychakcjigraczai, Θ i zbiórmożliwychtypówgraczai, u i :Θ i A R funkcjawypłatygraczai,zależnatakżeodjegotypu, p i rozkładprawdopodobieństwanaθ i ; p i (θ i ) ocenagraczaiprawdopodobieństwawystępowaniaukładutypów θ i.(możezależećodθ i ). Strategia(czysta)graczai:dowolnafunkcjas i :Θ i A i. DEFINICJA.Strategiałączna(s 1,s 2,...s n )jest bayesowską równowagąnashatakiejgry,jeżeli i θ i Θ i a i A i E pi u i (θ i,s 1,...s i (θ i ),...s n ) E pi u i (θ i,s 1,...a i,...s n ). Równowaga w grze z niekompletną informacją jest rozdzielającajeżeli i=1,2,...n θ i,θ i Θ is i θi s i θ i (różne typy tego samego gracza wybierają różne strategie), grupującajeżeli i=1,2,...n θ i,θ i Θ i s i θi =s i θ i (wszystkie typy tego samego gracza wybierają tę samą strategie). (Oczywiście możliwe są też przypadki pośrednie).

Gry w postaci ekstensywnej z niekompletną informacją Podobnie jak gry w postaci normalnej z niekompletną informacją: każdyzgraczy(i)możebyćjednegoztypówθ i,1,...θ i,k Θ i, każdytypθ i maswójrozkładprawdopodobieństwaq i naθ i zbiorze możliwych typów pozostałych graczy. Strategia(czysta)graczaj dowolnafunkcjas j :W j Θ j Atakaże 1. w W j s j (w,θ j ) A(w), 2.w,w I j,k s j (w,θ j )=s j (w,θ j ). Podejście Harsányi ego Grę z niekompletną informacją(czy to w postaci normalnej, czy ekstensywnej) przekształcamy do postaci ekstensywnej z niepełną, ale kompletną informacją, która rozpoczyna się posunięciem losowym obsadzeniem ról, czyli wyznaczeniem typów wszystkich graczy. Jesttomożliwezawszegdyrozkładyp 1,p 2,...,p n sązgodne,tzn.istniejetaki rozkładpnaθ 1... Θ n żedlakażdegoip i jestjegorozkładembrzegowym naθ i : p i (θ i =(t 1,...,t i 1,t i+1,...t n ))=P((θ i =(t 1,...,t i 1,t i+1,...t n ) (θ i =t i )), i wtedy rozkładem wyników tego posunięcia losowego jest P. DEFINICJA.Strategiałączna(s 1,s 2,...s n )orazukładocenprawdopodobieństw(q 1,q 2,...q n )sąbayesowskąrównowagądoskonałągryekstensywnej, jeżelidlakażdegograczaiikażdegojegozbioruinformacyjnegoj W i 1.rozkładq i (J)nawierzchołkachwzbiorzeJjestwyznaczonyprzezrozkład początkowyp i istrategiegraczy(s 1,s 2,...s n )zgodniezwzorembayesa ( bayesowskie uaktualnianie ocen ), 2.strategias i prowadzidowyboruwtymzbiorzeakcjis i (J),któraprzy ocenieprawdopodobieństwq i nazbiorzejjestnajlepsząodpowiedziąna strategie(s 1,...,s i 1,s i+1,...s n )(sekwencyjnaracjonalność).

Przykład- prosty wariant modelu Spence a rynku pracy Gracze={1-Pracownik,2-Pracodawca } Typygracza1:Θ 1 = {Wybitny,Przeciętny }; P(θ 1 =W)=µ W, P(θ 1 =P)=µ P =1 µ W. Strategie: 1: zdobywa dyplom uniwersytecki(d) lub nie(nd), 2: zatrudnia gracza 1 na stanowisku szeregowym(sz) lub kierowniczym(k). Koszt zdobycia dyplomu: c P dlagracza1typup,c W <c P dlagraczatypuw. Płaca:p K nastanowiskukierowniczym,p Sz <p K naszeregowym. LOS P µ P W µ W 1 1 ND ND 2 D Sz K Sz K D p Sz p K p Sz p K z Sz p Sz z K,P p K z Sz p Sz z K,W p K Sz K 2 Sz K p Sz c P z Sz p Sz p K c P z K,P p K p Sz c W z Sz p Sz p K c W z K,W p K Wartość(brutto) pracownika dla pracodawcy: nastanowiskuszniezależnieodtypupracownikaz Sz, nakierowniczymz K,W jeślipracownikjesttypuw,z K,P jeślijesttypup, z K,P p K <z Sz p Sz <z K,W p K.

Możliwe równowagi w tym przykładzie: 1. Rozdzielająca w której dyplom uzyskują tylko pracownicy typu W: 1:W D,P ND ; 2:D K,ND Sz. Tarównowagawystępujegdyp K c W p Sz p K c P, iwtedywgórnymzbiorzeinf.(nd)q 2 (W)=0,q 2 (P)=1 awdolnym(d)q 2 (W)=1,q 2 (P)=0. 2. Grupująca w której żaden typ gracza 1 nie zdobywa dyplomu: 1:zawszeND ; 2:D cokolwiek,nd Sz występujegdyp K c W p Sz iz Sz p Sz µ P z K,P +µ W z K,W p K (tzn. pracownika losowo wybranego z całej populacji lepiej zatrudnić jako SzniżjakoK).Wzbiorzeinf.NDmamyq 2 (W)=µ W,q 2 (P)=µ P,w D dowolneprzyktórychakcja2wtymzbiorzejestsekwencyjnieracj. 3. Grupująca w której żaden typ gracza 1 nie zdobywa dyplomu: 1:zawszeND ; 2:D cokolwiek,nd K występujegdyp K c W p Sz iz Sz p Sz µ P z K,P +µ W z K,W p K (pracownika losowo wybranego z całej populacji lepiej zatrudnić jako K). Oceny jak w równowadze(2) 4. Grupująca w której każdy typ gracza 1 zdobywa dyplom: 1:zawszeD ; 2:D K,ND Sz występujegdyp K c P p Sz iz Sz p Sz µ P z K,P +µ W z K,W p K. Ocenygracza2:wzbiorzeinf.Dq 2 (W)=µ W,q 2 (P)=µ P, wnd dowolneprzyktórychakcjaszwtymzbiorzejestsekwencyjnie racjonalna. W tym modelu w równowadze rozdzielającej uzyskanie dyplomu stanowi sygnał wysokiej wartości dla pracodawcy.

GRY POWTARZANE Idea: Gry powtarzane modelują długotrwałą interakcję tych samych graczy. Polegają na wielokrotnym rozgrywaniu przez nich tej samej gry w postaci normalnej(gry etapowej). Przed każdą rozgrywką, oprócz pierwszej, gracze znają całą dotychczasową historię gry. Oznaczmy:G=(A 1,A 2,u 1,u 2 ) graetapowa (wprzypadku2-osobowym). Wówczas:historiawchwilit Ntodowolnyciąg: h t =((a (1) 1,a (1) 2 ),...,(a (t 1) 1,a (t 1) 2 )) par użytych dotychczas akcji(= strategii w grze etapowej), H t zbiórwszystkichmożliwychhistoriiwchwilit. Graskończeniepowtarzana(Trazy)G T tograwktórej strategiegraczytodowolnefunkcjes i : T t=1 H t A i, każdaparastrategiiwyznaczawkażdymmomencietakcjegraczya (t) (lubloterienazbiorzeakcjijeżelis i (h t ) A i \A i), 1,a (t) 2 wypłata gracza to średnia jego wypłat ze wszystkich etapów rozgrywki: u i (s 1,s 2 )= 1 T T t=1 u i (a (t) 1,a (t) 2). GranieskończeniepowtarzanaG δ tograwktórej strategiegraczytodowolnefunkcjes i : t=1 H t A i, każdaparastrategiiwyznaczawkażdymmomencietakcjegraczy jakw grach skończenie powtarzanych, wypłata gracza to suma zdyskontowanych wypłat z etapów rozgrywki: u i (s 1,s 2 )=(1 δ) t=1 δ t 1 u i (a (t) 1,a (t) 2)] gdzie δ ]0, 1[ czynnik dyskontujący(wspólny dla obu graczy). 16