Hyper-resolution. Śmieciarki w Manncheim

Hyper-resolution Hyper-resolution Algorytm repeat NGi NGi NGj NGi nowe Nogoods, które da się wywieść z NGi if NGi then NGi NGi NGi roześlij NGi do wszystkich sąsiadów if NGi then stop end until NGi nie uległo zmianie Uproszczone rozwiązanie przykładu z tylko dwoma kolorami: A = r A = b, B = r B = b, C = r C = b NG A = { (A = r B = r), (A = b B = b), (A = r C = r), (A = b C = b)} (analogicznie NG B i NG C ) A (A = r A = b) (A = r B = r) (A = b C = b) (B = r C = b) B (B = r B = b) (B = r C = b) (B = b C = b) (C = b) C (C = r C = b) (C = b) (A = r C = r) (A = r) A (A = r A = b) (A = r) (A = b B = b) (B = b) B (B = r B = b) (B = b) (B = r C = r) (C = r) C (C = r C = b) (C = r) (C = b) Śmieciarki w Manncheim Śmieciarki w Manncheim b c C δ A B a { vi,j A B C a 1 1 6 b 4 6 3 c 6 8 1 1 i j xi,j = 0 wpp max xi,jvi,j i,j p.o. xi,j = 1 i xi,j = 1 j i j W zasadzie x i,j powinno być zmienną binarną, ale akurat w problemie przydziału to nie jest konieczne (optimum jest zawsze dla całkowitych wartości x i,j )

Nieszczęśliwe śmieciarki na Manchattanie Nieszczęśliwe śmieciarki na Manchattanie b c C A B a vi,j A B C a 1 1 6 b 4 6 3 c 6 8 1 Równowaga konkurencyjna (i, j) S k vi,j pj vi,k pk S rozwiązanie (zbiór przypisań), p j cena wysypiska (ile komuś opłaca się dopłacić, żeby nie jechać na kolejne) Algorytm aukcyjny Zmienne globalne Algorytm aukcyjny S pj = 0 Algorytm dla agenta i repeat if mam przypisanie then nic nie rób j arg maxk{vi,k pk} b (vi,j pj) maxk j{vi,k pk} if (i, j) S then S S\{(i, j)} S S {(i, j)} pj pj + b until S nie jest rozwiązaniem Uwagi 1 Algorytm wymaga wykonywania w sekcji krytycznej 2 W pewnych sytuacjach (gdy b = 0) może się nie skończyć. Zmiana algorytmu, żeby się kończył jest opisana w książce. Przykład: S = p a = p b = p c = 0 i = A j arg max{ 1, 4, 6} j = a b = ( 1) ( 4) = 3 S = {(A, a)} p a = 3 i = B j arg max{ 1 3, 6, 8} j = a b = ( 4) ( 6) = 2 S = {(B, a)}p a = 3 + 2 = 5 i = C j arg max{ 6 5, 3, 1} j = c b = ( 1) ( 3) = 2 S = {(B, a), (C, c)} p c = 2 i = A j arg max{ 1 5, 4, 6 2} j = b b = ( 4) ( 6) = 2 S = {(B, a), (C, c), (A, b)}

Alicja Co ma zrobić Alicja? Alicja 50 50 100 40% 75% 60% 25% dyskoteka, kino, grzyb; Alicja, Bartek, Cecylia A=d A=k B = d B = k B = d B = k C = d 15 150 50 10 C = k 10 100 75 15 E(U(A = d)) = 51,75 E(U(A = k)) = 46,75 U(A = g) = 50 Preferencje Preferencje 1 o1 o2 2 o1 o2 3 o1 o2 Loteria [p1 : o1, p2 : o2,... pk : ok] O skończony zbiór wyników; o 1, o 2 O. i p i = 1. Zakładamy, że loteria też jest dopuszczalnym wynikiem (rozszerzamy )

Aksjomaty Aksjomaty zupełność o1 o2 o1 o2 o1 o2 przechodniość o1 o2 o2 o3 o1 o3 pompa do pieniędzy zastępowalność [p : o1, p3 : o3,..., pk : ok] [p : o2, p3 : o3,..., pk : ok] rozkładalność oi O : Pl1 (oi) = Pl2(oi) l1 l2 no fun in gambling monotoniczność o1 o2 p > q [p : o1, 1 p : o2] [q : o1, 1 q : o2] ciągłość o1 o2 o3 p : o2 [p : o1, 1 p : o3] Twierdzenie (von Neumann i Morgenstern, 1944) 1 u(o1) u(o2) o1 o2 2 u([p1 : o1,..., pn : on]) = n i=1 piu(oi) Pompa do pieniędzy: o 1, o 2, o 3 to posiadanie trzech różnych przedmiotow. Jeżeli preferencje są nieprzechodnie o 1 o 2, o 2 o 3 i o 3 o 1, to opłaca się w kółko wymieniać przedmioty No fun in gambling: [p : o 1, 1 p : [q : o 2, 1 q : o 3 ]] [p : o 1, (1 p)q : o 2, (1 p)(1 q) : o 3 ] (nie liczy się liczba loterii, liczy się tylko prawdopodobieństwo) Gry w postaci normalnej Gry w postaci normalnej Definicja Trójka (N, A, u) taka, że: N to zbiór n graczy A = A1 A2... An to zbiór akcji u = (u1,..., un) to użyteczności ui : Ai R Elementy A nazywamy profilami akcji

Gry koordynacyjne (common-payoff game, pure coordination game, team game) Gry koordynacyjne (common-payoff game, pure coordination game, team game) u1 u2... un 3.09.1967 w Szwecjii zmieniono ruch z lewostronnego na prawostronny. Strategie czyste pojedyncza akcja mieszane rozkład prawdopodobieństwa nad zbiorem akcji: si = [p1, p2,..., p Ai ] Strategie Średnia użyteczność strategii mieszanej ui (s) = X a A ui (a) n Y sj (aj ) j=1 Każdemu profilowi a przypisujemy prawdopodobieństwo równe iloczynowi prawdopodobieństw akcji w nim zawartych i liczymy średnią użyteczność po wszystkich akcjach w A

Optymalność strategii Optymalność strategii Dominacja w sensie Pareto s s i ui(s) ui(s ) j uj(s) > uj(s ) Optymalność w sensie Pareto s jest optymalna wtw s s s Które (czyste) strategie są optymalne? s dominuje s jeżeli dla każdego gracza jest niegorsze, a dla chociaż jednego lepsze. Najlepsza odpowiedź ui(si, s i) ui(si, s i) Profil (s1,..., sn) taki, że si jest najlepszą odpowiedzią na s i dla wszystkich graczy Obliczyć równowagę Nasha 2, 1 0, 0 0, 0 1, 2 s i to profil bez strategii gracza i

Najlepsza odpowiedź ui(si, s i) ui(si, s i) Profil (s1,..., sn) taki, że si jest najlepszą odpowiedzią na s i dla wszystkich graczy Obliczyć równowagę Nasha 2, 1 0, 0 0, 0 1, 2 s c = [ : p c, : 1 p c ] s z = [ : p z, : 1 p z ] u z (sz, s c ) u z (s z, s c ) n u z (s z, s c ) = u z (a) s j (a) = u z (a z, a c )s z (a z )s c (a c ) = a A j=1 (a z,a c ) A u z (, )s z ( )s c ( ) + u z (, )s z ( )s c ( ) + u z (, )s z ( )s c ( ) + u z (, )s z ( )s c ( ) = 5p z p c 20p z (1 p c ) 0(1 p z )p c 15(1 p z )(1 p c ) = 5p z 15 + 15p c 5pz 15 + 15p c 5p z 15 + 15p c pz = 0 Analogicznie dla czerwonego pc = 0, a więc równwagą Nasha jest czysy profil (, ). Najlepsza odpowiedź ui(si, s i) ui(si, s i) Profil (s1,..., sn) taki, że si jest najlepszą odpowiedzią na s i dla wszystkich graczy Obliczyć równowagę Nasha 2, 1 0, 0 0, 0 1, 2 s c = [ : p c, : 1 p c ] s z = [ : p z, : 1 p z ] u c (s c, s z ) = u c ((a c, a z ))u c (a c )u z (a z ) = (a c,a z ) A 2p c p z + 0p c (1 p z ) + 0(1 p c )p z + (1 p c )(1 p z ) = 3p c p z p c p z + 1 du c dp z = 3p c 1 du c dp z = 0 p c = 1 3 Badamy w zerze i na krańcach przedziału: u c ([0, 1], s z ) = 1 p z, a więc najmniejsza wartość to 0 u c ([1, 0], s z ) = 3p z 1, a więc najmniejsza wartość to 1 u c ([ 1 3, 2 3 ], s z) = 6 9, a więc najmniejsza wartość to 6 9 W takim razie sc = [ : 1, : 2 ]. Analogiczny rachunek dla gracza zielonego 3 3 prowadzi do wniosku, że sz = [ : 2, : 1 ] 3 3