Hyper-resolution. Śmieciarki w Manncheim

Podobne dokumenty
Gry o sumie niezerowej

11. Gry Macierzowe - Strategie Czyste i Mieszane

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Plan. Prosty model aukcji: Aukcja drugiej ceny - równowaga Nasha w strategiach słabo dominujących Aukcja pierwszej ceny - równowaga Nasha

Matematyka dyskretna - wykład - część Podstawowe algorytmy kombinatoryczne

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

MODELOWANIE RZECZYWISTOŚCI

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych

zdarzenie losowe - zdarzenie którego przebiegu czy wyniku nie da się przewidzieć na pewno.

MODELOWANIE RZECZYWISTOŚCI

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

Punkty równowagi w grach koordynacyjnych

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

2010 W. W. Norton & Company, Inc. Oligopol

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

Aukcje groszowe. Podejście teoriogrowe

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

LEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.

Ciągłość funkcji f : R R

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Pojęcia podstawowe. Teoria zbiorów przybliżonych i teoria gier. Jak porównać dwa porządki?

Zadania z analizy matematycznej - sem. I Granice funkcji, asymptoty i ciągłość

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

Ośrodkowość procesów, proces Wienera. Ośrodkowość procesów, proces Wienera Procesy Stochastyczne, wykład, T. Byczkowski,

Propedeutyka teorii gier

Rozwiązania gier o charakterze kooperacyjnym

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

Load balancing games

Prawdopodobieństwo i statystyka

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

TEORIA GIER WNE UW, jesień 2011 PLAN PRZEDMIOTU

Tworzenie gier na urządzenia mobilne

Wyznaczanie strategii w grach

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Schemat sprawdzianu. 25 maja 2010

Pochodne funkcji wraz z zastosowaniami - teoria

PRZEWODNIK PO PRZEDMIOCIE

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

Matematyka dyskretna

zaznaczymy na osi liczbowej w ten sposób:

Strategie kwantowe w teorii gier

Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:

GRY W POSTACI EKSTENSYWNEJ (rozwiniętej)

Mikroekonomia. O czym dzisiaj?

P(F=1) F P(C1 = 1 F = 1) P(C1 = 1 F = 0) P(C2 = 1 F = 1) P(C2 = 1 F = 0) P(R = 1 C2 = 1) P(R = 1 C2 = 0)

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Matematyka dyskretna

Teoria Gier. Piotr Kuszewski 2018L

Elementy Modelowania Matematycznego

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

Prawdopodobieństwo i statystyka

Badania operacyjne egzamin

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

Ekstrema globalne funkcji

Wykład 6. Metoda eliminacji Gaussa: Eliminacja z wyborem częściowym Eliminacja z wyborem pełnym

10. Wstęp do Teorii Gier

Optymalizacja. Przeszukiwanie lokalne

Zadanie 1 Przygotuj algorytm programu - sortowanie przez wstawianie.

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Aukcje Bayesa. Piotr Sankowski Uniwersytet Warszawski Warszawa p. 1/54

Optymalizacja. Przeszukiwanie tabu

TEORIA GIER WPROWADZENIE. Czesław Mesjasz

1. Które z następujących funkcji produkcji cechują się stałymi korzyściami ze skali? (1) y = 3x 1 + 7x 2 (2) y = x 1 1/4 + x 2

3.4. Przekształcenia gramatyk bezkontekstowych

Logika dla socjologów

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

F t+ := s>t. F s = F t.

Optymalizacja. Symulowane wyżarzanie

Semafory. - aktywne oczekiwanie =GRGDWNRZ\PZVSDUFLHPVSU]WRZ\P 6SHFMDOQDLQVWUXNFMDPDV]\QRZDUHDOL]XMFDDWRPRZ\]DSLVL odczyt, np.

Elementy teorii gier

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Teoria gier. Łukasz Balbus Anna Jaśkiewicz

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

Metody Rozmyte i Algorytmy Ewolucyjne

Prawdopodobieństwo i statystyka

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Strategie ewolucyjne (ang. evolu4on strategies)

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

ZASTOSOWANIE ZASADY MAKSIMUM PONTRIAGINA DO ZAGADNIENIA

Mikroekonomia. Wykład 3

Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 2

Optymalizacja. Przeszukiwanie tabu

Wprowadzenie do teorii gier

Teoria popytu. Popyt indywidualny konsumenta

Elementy teorii gier. Badania operacyjne

OPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

Gry w postaci normalnej

Transkrypt:

Hyper-resolution Hyper-resolution Algorytm repeat NGi NGi NGj NGi nowe Nogoods, które da się wywieść z NGi if NGi then NGi NGi NGi roześlij NGi do wszystkich sąsiadów if NGi then stop end until NGi nie uległo zmianie Uproszczone rozwiązanie przykładu z tylko dwoma kolorami: A = r A = b, B = r B = b, C = r C = b NG A = { (A = r B = r), (A = b B = b), (A = r C = r), (A = b C = b)} (analogicznie NG B i NG C ) A (A = r A = b) (A = r B = r) (A = b C = b) (B = r C = b) B (B = r B = b) (B = r C = b) (B = b C = b) (C = b) C (C = r C = b) (C = b) (A = r C = r) (A = r) A (A = r A = b) (A = r) (A = b B = b) (B = b) B (B = r B = b) (B = b) (B = r C = r) (C = r) C (C = r C = b) (C = r) (C = b) Śmieciarki w Manncheim Śmieciarki w Manncheim b c C δ A B a { vi,j A B C a 1 1 6 b 4 6 3 c 6 8 1 1 i j xi,j = 0 wpp max xi,jvi,j i,j p.o. xi,j = 1 i xi,j = 1 j i j W zasadzie x i,j powinno być zmienną binarną, ale akurat w problemie przydziału to nie jest konieczne (optimum jest zawsze dla całkowitych wartości x i,j )

Nieszczęśliwe śmieciarki na Manchattanie Nieszczęśliwe śmieciarki na Manchattanie b c C A B a vi,j A B C a 1 1 6 b 4 6 3 c 6 8 1 Równowaga konkurencyjna (i, j) S k vi,j pj vi,k pk S rozwiązanie (zbiór przypisań), p j cena wysypiska (ile komuś opłaca się dopłacić, żeby nie jechać na kolejne) Algorytm aukcyjny Zmienne globalne Algorytm aukcyjny S pj = 0 Algorytm dla agenta i repeat if mam przypisanie then nic nie rób j arg maxk{vi,k pk} b (vi,j pj) maxk j{vi,k pk} if (i, j) S then S S\{(i, j)} S S {(i, j)} pj pj + b until S nie jest rozwiązaniem Uwagi 1 Algorytm wymaga wykonywania w sekcji krytycznej 2 W pewnych sytuacjach (gdy b = 0) może się nie skończyć. Zmiana algorytmu, żeby się kończył jest opisana w książce. Przykład: S = p a = p b = p c = 0 i = A j arg max{ 1, 4, 6} j = a b = ( 1) ( 4) = 3 S = {(A, a)} p a = 3 i = B j arg max{ 1 3, 6, 8} j = a b = ( 4) ( 6) = 2 S = {(B, a)}p a = 3 + 2 = 5 i = C j arg max{ 6 5, 3, 1} j = c b = ( 1) ( 3) = 2 S = {(B, a), (C, c)} p c = 2 i = A j arg max{ 1 5, 4, 6 2} j = b b = ( 4) ( 6) = 2 S = {(B, a), (C, c), (A, b)}

Alicja Co ma zrobić Alicja? Alicja 50 50 100 40% 75% 60% 25% dyskoteka, kino, grzyb; Alicja, Bartek, Cecylia A=d A=k B = d B = k B = d B = k C = d 15 150 50 10 C = k 10 100 75 15 E(U(A = d)) = 51,75 E(U(A = k)) = 46,75 U(A = g) = 50 Preferencje Preferencje 1 o1 o2 2 o1 o2 3 o1 o2 Loteria [p1 : o1, p2 : o2,... pk : ok] O skończony zbiór wyników; o 1, o 2 O. i p i = 1. Zakładamy, że loteria też jest dopuszczalnym wynikiem (rozszerzamy )

Aksjomaty Aksjomaty zupełność o1 o2 o1 o2 o1 o2 przechodniość o1 o2 o2 o3 o1 o3 pompa do pieniędzy zastępowalność [p : o1, p3 : o3,..., pk : ok] [p : o2, p3 : o3,..., pk : ok] rozkładalność oi O : Pl1 (oi) = Pl2(oi) l1 l2 no fun in gambling monotoniczność o1 o2 p > q [p : o1, 1 p : o2] [q : o1, 1 q : o2] ciągłość o1 o2 o3 p : o2 [p : o1, 1 p : o3] Twierdzenie (von Neumann i Morgenstern, 1944) 1 u(o1) u(o2) o1 o2 2 u([p1 : o1,..., pn : on]) = n i=1 piu(oi) Pompa do pieniędzy: o 1, o 2, o 3 to posiadanie trzech różnych przedmiotow. Jeżeli preferencje są nieprzechodnie o 1 o 2, o 2 o 3 i o 3 o 1, to opłaca się w kółko wymieniać przedmioty No fun in gambling: [p : o 1, 1 p : [q : o 2, 1 q : o 3 ]] [p : o 1, (1 p)q : o 2, (1 p)(1 q) : o 3 ] (nie liczy się liczba loterii, liczy się tylko prawdopodobieństwo) Gry w postaci normalnej Gry w postaci normalnej Definicja Trójka (N, A, u) taka, że: N to zbiór n graczy A = A1 A2... An to zbiór akcji u = (u1,..., un) to użyteczności ui : Ai R Elementy A nazywamy profilami akcji

Gry koordynacyjne (common-payoff game, pure coordination game, team game) Gry koordynacyjne (common-payoff game, pure coordination game, team game) u1 u2... un 3.09.1967 w Szwecjii zmieniono ruch z lewostronnego na prawostronny. Strategie czyste pojedyncza akcja mieszane rozkład prawdopodobieństwa nad zbiorem akcji: si = [p1, p2,..., p Ai ] Strategie Średnia użyteczność strategii mieszanej ui (s) = X a A ui (a) n Y sj (aj ) j=1 Każdemu profilowi a przypisujemy prawdopodobieństwo równe iloczynowi prawdopodobieństw akcji w nim zawartych i liczymy średnią użyteczność po wszystkich akcjach w A

Optymalność strategii Optymalność strategii Dominacja w sensie Pareto s s i ui(s) ui(s ) j uj(s) > uj(s ) Optymalność w sensie Pareto s jest optymalna wtw s s s Które (czyste) strategie są optymalne? s dominuje s jeżeli dla każdego gracza jest niegorsze, a dla chociaż jednego lepsze. Najlepsza odpowiedź ui(si, s i) ui(si, s i) Profil (s1,..., sn) taki, że si jest najlepszą odpowiedzią na s i dla wszystkich graczy Obliczyć równowagę Nasha 2, 1 0, 0 0, 0 1, 2 s i to profil bez strategii gracza i

Najlepsza odpowiedź ui(si, s i) ui(si, s i) Profil (s1,..., sn) taki, że si jest najlepszą odpowiedzią na s i dla wszystkich graczy Obliczyć równowagę Nasha 2, 1 0, 0 0, 0 1, 2 s c = [ : p c, : 1 p c ] s z = [ : p z, : 1 p z ] u z (sz, s c ) u z (s z, s c ) n u z (s z, s c ) = u z (a) s j (a) = u z (a z, a c )s z (a z )s c (a c ) = a A j=1 (a z,a c ) A u z (, )s z ( )s c ( ) + u z (, )s z ( )s c ( ) + u z (, )s z ( )s c ( ) + u z (, )s z ( )s c ( ) = 5p z p c 20p z (1 p c ) 0(1 p z )p c 15(1 p z )(1 p c ) = 5p z 15 + 15p c 5pz 15 + 15p c 5p z 15 + 15p c pz = 0 Analogicznie dla czerwonego pc = 0, a więc równwagą Nasha jest czysy profil (, ). Najlepsza odpowiedź ui(si, s i) ui(si, s i) Profil (s1,..., sn) taki, że si jest najlepszą odpowiedzią na s i dla wszystkich graczy Obliczyć równowagę Nasha 2, 1 0, 0 0, 0 1, 2 s c = [ : p c, : 1 p c ] s z = [ : p z, : 1 p z ] u c (s c, s z ) = u c ((a c, a z ))u c (a c )u z (a z ) = (a c,a z ) A 2p c p z + 0p c (1 p z ) + 0(1 p c )p z + (1 p c )(1 p z ) = 3p c p z p c p z + 1 du c dp z = 3p c 1 du c dp z = 0 p c = 1 3 Badamy w zerze i na krańcach przedziału: u c ([0, 1], s z ) = 1 p z, a więc najmniejsza wartość to 0 u c ([1, 0], s z ) = 3p z 1, a więc najmniejsza wartość to 1 u c ([ 1 3, 2 3 ], s z) = 6 9, a więc najmniejsza wartość to 6 9 W takim razie sc = [ : 1, : 2 ]. Analogiczny rachunek dla gracza zielonego 3 3 prowadzi do wniosku, że sz = [ : 2, : 1 ] 3 3