Wprowadzenie do teorii gier

Podobne dokumenty
Wprowadzenie do teorii gier

TEORIA GIER W EKONOMII WYKŁAD 1: GRY W POSTACI EKSTENSYWNEJ I NORMALNEJ

Tworzenie gier na urządzenia mobilne

dr inż. Cezary Wiśniewski Płock, 2006

N-osobowy dylemat więźnia

Tworzenie gier na urządzenia mobilne

REGULAMIN TURNIEJU SPORTOWEJ GRY KARCIANEJ KANASTA W RAMACH I OGÓLNOPOLSKIEGO FESTIWALU GIER UMYSŁOWYCH 55+ GORZÓW WLKP R.

Teoria Gier i Korki Samochodowe

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Bazy danych. Andrzej Łachwa, UJ, /15

Harmonogramowanie projektów Zarządzanie czasem

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Podstawowe działania w rachunku macierzowym

WNIOSEK O ZORGANIZOWANIE STAŻU. Wnioskuję o skierowanie... bezrobotnego(-ych) do odbycia stażu według specyfikacji:

Konkurencja i kooperacja w dwuosobowych grach strategicznych. Anna Lamek

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

Zadania. SiOD Cwiczenie 1 ;

Możemy zapewnić pomoc z przeczytaniem lub zrozumieniem tych informacji. Numer dla telefonów tekstowych. boroughofpoole.

Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

REGULAMIN SPRZEDAŻY DREWNA w Drawieńskim Parku Narodowym

Bioinformatyka Laboratorium, 30h. Michał Bereta

40. Międzynarodowa Olimpiada Fizyczna Meksyk, lipca 2009 r. ZADANIE TEORETYCZNE 2 CHŁODZENIE LASEROWE I MELASA OPTYCZNA

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie

1. Od kiedy i gdzie należy złożyć wniosek?

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Teorie w badaniach socjologicznych. Kod Punktacja ECTS* 4. Dr hab.

ZARZĄDZENIE Nr 18/2009 WÓJTA GMINY KOŁCZYGŁOWY z dnia 4 maja 2009 r.

Zaawansowana adresacja IPv4

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

POWIATOWY URZĄD PRACY

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 5

DE-WZP JJ.3 Warszawa,

Zagospodarowanie magazynu

Warunki Oferty PrOmOcyjnej usługi z ulgą

Podstawa prawna: Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych (t. j. Dz. U. z 2000r. Nr 54, poz. 654 ze zm.

Modele biznesowe wyszukiwarek internetowych w teorii i praktyce Paweł Bedyński, Łukasz Kidziński

Nowe funkcjonalności

GĄSKI, GMINA MIELNO, 650M OD MORZA 58 DZIAŁEK BUDOWLANYCH I REKREACYJNYCH

UCHWAŁA... Rady Miejskiej w Słupsku z dnia...

KARTA OCENY ZGODNOŚCI Z LSR

Zasady udzielania zaliczek

NUMER IDENTYFIKATORA:

Zapisy na kursy B i C

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

Reforma emerytalna. Co zrobimy? SŁOWNICZEK

ZMIANY W EMERYTURACH Z FUNDUSZU UBEZPIECZEŃ SPOŁECZNYCH OD DNIA R.

1. S³owo wstêpne Geologia gospodarcza g³ówne aspekty problematyki badawczej Zakres, treœæ i cel rozprawy...

Elementy cyfrowe i układy logiczne

Turniej Piłkarski. Copa Manufaktura 2006

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

REGULAMIN REKRUTACJI UCZNIÓW/SŁUCHACZY DO ZESPOŁU SZKÓŁ TECHNICZNYCH I OGÓLNOKSZTAŁCĄCYCH IM. KAZIMIERZA WIELKIEGO W BUSKU-ZDROJU

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Tytuł. Autor. Dział. Innowacyjne cele edukacyjne. Czas. Przebieg. Etap 1 - Wprowadzenie z rysem historycznym i dyskusją

WYŚCIG ORTOGRAFICZNY INSTRUKCJA. gra edukacyjna dla 2-3 osób rekomendowany wiek: od lat 7

20PLN dla pierwszych 50 sztuk oraz 15PLN dla dalszych. Zysk ze sprzedaży biurka wynosi 40PLN dla pierwszych 20 sztuk oraz 50PLN dla dalszych.

Instrukcja montażu aparatu w obudowie meblowej

Metoda LBL (ang. Layer by Layer, pol. Warstwa Po Warstwie). Jest ona metodą najprostszą.


UCHWAŁA Nr XIX/170/2012 RADY MIEJSKIEJ w KOZIENICACH z dnia 29 marca 2012 r.

enova Workflow Obieg faktury kosztowej

Teoria gier w ekonomii - opis przedmiotu

REGULAMIN NABORU NA WOLNE STANOWISKA URZĘDNICZE. w III Liceum Ogólnokształcącym. im. M. Kopernika w Olsztynie

U Z A S A D N I E N I E

Jak korzystać z Group Tracks w programie Cubase na przykładzie EWQLSO Platinum (Pro)

Druk nr 1013 Warszawa, 9 lipca 2008 r.

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. Specyfikacja warunków zamówienia

PORADNIK: Jak przyznaćstypendiumwprogramie Stypendia św. Mikołaja

2.Prawo zachowania masy

Edycja geometrii w Solid Edge ST

Przygotowały: Magdalena Golińska Ewa Karaś

KOMISJA WSPÓLNOT EUROPEJSKICH. Wniosek DECYZJA RADY

TAJEMNICA BANKOWA I OCHRONA DANYCH OSOBOWYCH W PRAKTYCE BANKOWEJ

KARTA INFORMACYJNA USŁUGI PRZYZNANIE DODATKU AKTYWIZACYJNEGO

REGULAMIN KONTROLI ZARZĄDCZEJ W MIEJSKO-GMINNYM OŚRODKU POMOCY SPOŁECZNEJ W TOLKMICKU. Postanowienia ogólne

Gorlice: kurs podatkowa księga przychodów i rozchodów - księgowość komputerowa

Budowanie współpracy z organizacjami pozarządowymi. Agnieszka Wróblewska

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

Zasady dotyczące podatku u źródła pobieranego w Luksemburgu, mające zastosowanie do dywidendy wypłacanej akcjonariuszom PEGAS NONWOVENS S.A.

Warsztat naukowca a problem formatu informacji bibliograficznej generowanej przez systemy informacyjne. Remigiusz Sapa IINiB UJ

I. 2) RODZAJ ZAMAWIAJĄCEGO:

PROGRAM LIFELONG LEARNING ERASMUS

Wynagrodzenia informatyków w 2015 roku - zaproszenie do badania

U C H W A Ł A SENATU RZECZYPOSPOLITEJ POLSKIEJ

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

jest częściowe pokrycie wydatków związanych z wychowaniem dziecka, w tym z opieką nad nim i zaspokojeniem jego potrzeb życiowych.

ELemENtY gry 14 ORDERÓW To dodatkowe punkty, które można zdobyć po spełnieniu określonego warunku. Na przykład: za pierwszy ukończony komiks Tytusa.

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

PROGRAM STYPENDIALNY GMINY DOBRZYCA

PODSTAWY DZIAŁANIA UKŁADÓW CYFROWYCH

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

Projekty uchwał na Zwyczajne Walne Zgromadzenie Akcjonariuszy zwołane na dzień 10 maja 2016 r.

Praca za granicą. Emerytura polska czy zagraniczna?

Strategia rozwoju sieci dróg rowerowych w Łodzi w latach

Projekty uchwał na Nadzwyczajne Walne Zgromadzenie i3d S.A. z siedzibą w Gliwicach zwołane na dzień 10 grudnia 2013 r.:

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007

Regulamin konkursu Konkurs z Lokatą HAPPY II edycja

Transkrypt:

Instytut Informatyki Uniwersytetu Śląskiego Wykład 1

1 Klasyfikacja gier 2 Gry macierzowe, macierz wypłat, strategie czyste i mieszane 3 Twierdzenie o minmaksie, drzewa gry 4 Punkty równowagi w grach o sumie zerowej 5 Gry dwuosobowe o sumie niezerowej 6 Równowagi Nasha 7 Gry dwuosobowe negocjacyjne 8 Gry wielosobowe 9 Gry z naturą

Teoria gier zajmuje sie badaniem optymalnego zachowania w przypadku przeciwstawnych interesów i okreslana jest jako matematyczna teoria konfliktu. minimum dwóch uczestników gry; zbiór zasad, według których postępują uczestnicy gry; wynik gry, który określony jest przez kombinacje sposobów postępowania uczestników gry; uczestnicy są racjonalni i dążą do maksymalizacji zysków.

Podstawy teorii gier: E. Borel, Sur les jeux ou interviennent le hasard et l habilit e des joueurs, the English translation [Elements of the Theory of Probability. Prentice-Hall, 1924. J. von Neumann, Zur theorie der gesellschaftsspiele. Mathematische Annalen - Contributions to the Theory of Games, Vol. 4:13 42, 1928. O. Mergenstern, J. von Neumann. Theory of Games and Economic Behavior. Princeton University Press, 1944. J. Nash, Non-Cooperative Games, The Annals of Mathematics Second Series, Vol. 54, No. 2 (Sep., 1951), pp. 286-295.

Zastosowanie teorii gier: ekonomia, J. Aubin. Mathematical Methods of Game and Economic Theory. North-Holland Publ. CO., 1979. nauki społeczne, P. Ordeshook. Game theory and political theory. Cambridge University Press, 1986. biologia, Selten R. Hammerstein, P. Handbook of game theory. University of Bonn, 1994. sztuczna inteligencja, M. Tennenholtz. Game Theory and Artificial Intelligence. Springer Berlin/Heidelberg, 2002.

handel elektroniczny, Games at Work-Agent-Mediated E-Commerce Simulation, 2000. sieci komputerowe, Mackenzie A. Menon R. Dasilva L. Hicks J. Reed J. Gilles R. Neel, J. Using game theory to analyze wireless ad hoc networks. IEEE Communications Surveys and Tutorials, Vol. 7:46 56, 2005. sieci transportowe, David Easley and Jon Kleinberg. Reasoning about a Highly Connected World. Cambridge University Press, 2010. i wiele więcej..

Rysunek: Podział gier

Jeden z możliwych podziałów gier: kolejność podejmowania decyzji: gry w postaci strategicznej i ekstensywnej; posiadana wiedza: gry z pełną informacją oraz gry z niepełną informacją; liczba graczy: gry 2-osobowe, gry n-osobowe (n 3); zbiór dostępnych akcji: gry nieskończone (kontinuum akcji), gry ze skończonym zbiorem strategii; możliwość tworzenia koalicji: gry kooperacyjne, gry niekooperacyjne; powtarzalność: gry iterowane oraz gry jednoetapowe.

Czas podejmowania decyzji Gry w postaci strategicznej (normalnej) sytuacje, w których gracze podejmują decyzje jednocześnie; zysk graczy obliczany jest na podstawie macierzy wypłat; wielkość macierzy wypłat zależy bezpośrednio od liczby graczy oraz od liczby strategii czystych dostępnych dla graczy; Gry w postaci ekstensywnej (drzewiastej) decyzje graczy podejmowane są sekwencyjnie; wypłaty graczy ustalane na podstawie drzewa gry; każdy z graczy w danej chwili zna wszystkie możliwe ruchy.

Formalnie gra w postaci normalnej: Γ = N, {A i }, M, i = 1, 2,..., n gdzie: N = {1, 2,..., n} jest zbiorem graczy; {A i } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ 1, µ 2,..., µ n } to zbiór funkcji wypłat dla graczy.

Rysunek: Przykład prostej gry dwuosobowej

Rysunek: Wielosobowa gra w postaci strategicznej w programie GAMBIT 4 graczy; każdy z graczy po 2 strategie; każda komórka macierzy to wypłata gracza przy okreśonych strategiach pozostałych graczy;

Przez a = ( a 1,..., a n ) oznaczmy profil strategii mieszanych wszystkich graczy, określany dalej jako układ strategii. a i = ( a 1,..., a i 1, a i+1,..., a n ), będzie układem strategii z wyłączeniem gracza i. Mieszana strategia gracza i określana jest jako: a i = (P(a i1 ), P(a i2 ),..., P(a im )), gdzie P(a i1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i, natomiast a i oznacza tutaj dyskretny rozkład prawdopodobieństwa nad zbiorem strategii.

Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. gdzie: i - oznacza i-tego gracza; i, j µ i (a) µ i (a ij, a i ), j - jest numerem strategii danego gracza; µ i (a) - wypłata i-tego gracza dla profilu strategii a; µ i (a ij, a i ) - wypłata i gracza stosującego strategię j przeciwko a i.

strategie B1 B2 A1 1, 4 0, 6 A2 4, 1-1, -1 Tablica: Prosta gra 2-osobowa Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. Rysunek: Graficzna reprezentacja równowagi Nasha

Rysunek: Równowaga Nasha a złożoność problemu

Rysunek: Przykłady gier w postaci normalnej dla różnej liczby graczy. a) gra 2-osobowa; b) gra 3-osobowa; c) gra 4-osobowa

Gra w postaci ekstensywnej formalnie: N = {1, 2,..., n} - zbiór graczy; G = (W, E) - drzewo gry (graf skierowany bez cykli) W - wierzchołki (sytuacje w grze); E - łuki (przejścia między sytuacjami w grze); często wyróżnia się też zbiór wierzchołków końcowych (liści).

Dowolną grę dla dwóch (i więcej) graczy taką jak szachy, kółko i krzyżyk, go, warcaby można zapisać w postaci ekstensywnej. algorytm min-max: pomaga znaleźć najlepszy ruch, pracując od końca gry. Na każdym kroku zakłada, że gracz A próbuje zmaksymalizować szanse na wygraną gracza A, podczas gdy w następnym ruchu gracz B stara się zminimalizować szanse na wygraną gracza A; algorytm alfa-beta - algorytm stosowany do redukcji liczby węzłów, które muszą zostać sprawdzone w algorytmie min-max.

Rysunek: Algorytm min-max

Rysunek: Algorytm alfa-beta

Gry z pełną informacją: każdy z graczy zna w pełni zasady gry, funkcje wypłat oraz zbiory mozliwych strategii wszystkich pozostałych graczy; założenie o racjonalności graczy, gdzie każdy z uczestników dąży do maksymalizacji zysku; gracze w każdej chwili posiadają pełną informację o poprzednich decyzjach innych graczy; grę ekstensywną można przekształcić w grę w postaci normalnej (i na odwrót);

Rysunek: Wielosobowa gra w postaci ekstensywnej

Inne typy równowag w teorii gier: równowaga Nasha; ɛ równowaga Nasha - zwana także ɛ równowagą; równowaga skorelowana - bardziej ogólna niż Nash; równowaga Pareto - równowaga Nasha z najwyższą wypłatą dla graczy; Trembling hand equilibrium - równowaga drżącej ręki - założenie, że gracz może przez nieuwagę zagrać strategię z zerowym prawdopodobieństwem wyboru; idealna równowaga w podgrach - w grach w postaci ekstensywnej; ɛ-well supported Nash - ɛ równowaga, w której każda strategia ma niezerowe prawdopodobieństwo wyboru.

Gry z niepełną informacją: określane także jako gry bayesowskie; dla gier strategicznych w przypadku informacji niepełnej definiowana jest jawnie dodatkowa funkcja prawdopodobieństwa, która w zależności od wartości określa końcową wypłatę graczy; często przyjmuje się, że gry strategiczne z niepełną informacją posiadają więcej niż jedną macierz wypłat; dla gier w postaci ekstensywnej brak pełnej informacji zaznaczony jest jako zbiory informacyjne.

Rysunek: Gra w postaci ekstensywnej z niepełną informacją

Możliwość tworzenia koalicji graczy: gry koalicyjne akcje przypisywane sa grupom (koalicjom) graczy; ze zbioru graczy możliwe jest wyszczególnienie podzbiorów graczy współpracujących ze sobą; wartość Shapleya - wartość zysku pojedynczego gracza w koalicji; gry niekooperacyjne interesy graczy w grach niekooperacyjnych nie muszą być przeciwstawne (gry o sumie niezerowej); założenie o racjonalności graczy (w przypadku gracza nieracjonalnego każda strategia ma takie samo prawdopodobieństwo wyboru);

Rysunek: Gra z elementami kooperacji dwóch graczy Dwóch graczy: każdy ma do wyboru jedną z trzech strategii. nieustępliwa: gracz jedzie drogą główną i żąda przejazdu; elastyczna: gracz jedzie drogą główną w przypadku pierwszeństwa przejazdu. W przeciwnym razie przepuszcza gracza B; wycofanie się: gracz jedzie dłuższą drogą.

Gry z kontinuum graczy stosowane do przedstawiania sytuacji wolnorynkowych; zbiór graczy reprezentowany przed odcink [0, 1]; koncepcja strategii stabilnej ewolucyjnie; Rysunek: Przykład gry ze strategią stabilną ewolucyjnie. Popularny Jastrząb-gołąb

Gry o nieskończonym zbiorze strategii są uogólnieniem gier skończonych: jeden z najpopularniejszych przykładów tego typu gier to duopol Cournota; gry na kwadracie, gdzie każdy z graczy posiada kontinuum strategii czystych; strategia mieszana dla gier na kwadracie to dystrybuanta funkcji;

Dziękuję za uwagę.