Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!



Podobne dokumenty
Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy

Wyznaczanie strategii w grach

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Algorytmy dla gier dwuosobowych

MODELOWANIE RZECZYWISTOŚCI

Tworzenie gier na urządzenia mobilne

MODELOWANIE RZECZYWISTOŚCI

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

10. Wstęp do Teorii Gier

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Wprowadzenie do teorii gier

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

3. MINIMAX. Rysunek 1: Drzewo obrazujące przebieg gry.

WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI

Sztuczna Inteligencja i Systemy Doradcze

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Mateusz Topolewski. Świecie, 8 grudnia 2014

Regionalne Koło Matematyczne

Teoria gier. Katarzyna Koman Maria Koman. Politechnika Gdaoska Wydział Fizyki Technicznej i Matematyki Stosowanej

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Algorytmy ewolucyjne (3)

Dłuższy przykład: Dwie firmy, Zeus i Atena, produkują sprzęt muzyczny. Zeus jest większy, Atena jest ceniona za HF. Wprowadzają nowy produkt, np.

Wykład 7 i 8. Przeszukiwanie z adwersarzem. w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach

5.9 Modyfikacja gry Kółko i krzyżyk

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

LEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Algorytmy z powrotami. Algorytm minimax

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Każdy węzeł w drzewie posiada 3 pola: klucz, adres prawego potomka i adres lewego potomka. Pola zawierające adresy mogą być puste.

ZASADY GRY. Zawartość:

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

Partition Search i gry z niezupełną informacją

Teoria gier. Jakub Cisło. Programowanie z pasją maja 2019

Metody przeszukiwania

Gra planszowa stwarza jeszcze więcej możliwości!

Luty 2001 Algorytmy (4) 2000/2001

SID Wykład 4 Gry Wydział Matematyki, Informatyki i Mechaniki UW

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

11. Gry Macierzowe - Strategie Czyste i Mieszane

Elementy teorii gier

Konkurencja i współpraca w procesie podejmowania decyzji

Elementy teorii gier. Badania operacyjne

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

CZYM JEST SZTUCZNA INTELIGENCJA? REPREZENTACJA WIEDZY SZTUCZNA INTELIGENCJA PROJEKTOWANIE ALGORYTMÓW I METODY SZTUCZNEJ INTELIGENCJI

Adam Meissner. SZTUCZNA INTELIGENCJA Gry dwuosobowe

TEORIA GIER. Wspólna wiedza dotyczy nie tylko zachowań (reguł postępowania), ale i samej gry : każdy zna jej reguły i wypłaty (swoje i uczestników).

Sztuczna inteligencja

Gry o sumie niezerowej

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Algorytmy i Struktury Danych, 2. ćwiczenia

Wysokość drzewa Głębokość węzła

ZASADY PROGRAMOWANIA KOMPUTERÓW ZAP zima 2014/2015. Drzewa BST c.d., równoważenie drzew, kopce.

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?

ZAGADNIENIE TRANSPORTOWE

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

Lista zadań. Równowaga w strategiach czystych

Drzewo binarne BST. LABORKA Piotr Ciskowski

Wybrane podstawowe rodzaje algorytmów

Ruletka czy można oszukać kasyno?

Internetowe Ko³o M a t e m a t yc z n e

Drzewa BST i AVL. Drzewa poszukiwań binarnych (BST)

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne

EGZAMIN MAGISTERSKI, Biomatematyka

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

Zagadnienie transportowe (badania operacyjne) Mgr inż. Aleksandra Radziejowska AGH Akademia Górniczo-Hutnicza w Krakowie

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

Heurystyczne przeszukiwanie grafów gier dwuosobowych

SCENARIUSZE ZAJĘĆ KLASA 1 DIDASKO Ewa Kapczyńska, Krystyna Tomecka

Czym zajmuje się teroia gier

Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH

ELEMENTY GRY. 26 kart (2 talie, w każ dej z nich znajduje się po jednym z trzynastu duchów). 17 żetonów punktów

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

3. Macierze i Układy Równań Liniowych

Pora na gry planszowe

Gry w postaci normalnej

Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:

Kolejka priorytetowa. Często rozważa się kolejki priorytetowe, w których poszukuje się elementu minimalnego zamiast maksymalnego.

Wprowadzenie do teorii gier Ryszard Paweł Kostecki

2010 W. W. Norton & Company, Inc. Oligopol

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.

Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku.

PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI

Dwaj gracze na przemian kładą jednakowe monety na stole tak, aby na siebie nie nachodziły Przegrywa ten, kto nie może dołożyć monety

Jacques Zeimet /3

Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych

Transkrypt:

Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), 2-osobowe(np. szachy, warcaby, go, itp.), wieloosobowe(np. brydż, giełda, itp.); wygraną/przegraną: o sumie zerowej(suma wygranych jest dokładnie równa sumie przegranych), o sumie niezerowej(np. dylemat więźnia, lotto, itp.); współpracę: kooperacyjne(np. gospodarka), niekooperacyjne(np. ucieczka-pościg, itp.); rolę losowości: całkiem losowe(np. lotto, ruletka, itp.), częściowo losowe(np. brydż, itp.), deterministyczne(np. szachy, itp.); wiedzę graczy o stanie. Wykład7,31III2010,str.2 Odróżniać losowość od wiedzy graczy o stanie! pełna wiedza niepełna wiedza graczy o stanie graczy o stanie determinizm szachy okręty gryzkostką losowość (np. chińczyk) brydż Do opisu gry potrzeba: specyfikacji graczy, określenia ich celów, opisu dostępnej informacji, specyfikacji ich strategii.

Prosta gra macierzowa, 2-osobowa, o sumie zerowej: gracze wykonują ruchy jednocześnie; macierz wypłat dla A(skoro suma zerowa, wystarczy podać, ile wygrywa jeden gracz, drugi przegrywa tyle samo): ruchy gracza B b 1 b 2... b k ruchy gracza A a2 a1... an u 11 u 12... u 1k u 21 u 22... u 2k............ u n1 u n2... u nk u ij R dla i,j [1..n] [1..k] Wykład7,31III2010,str.4 Prosta gra macierzowa, 2-osobowa, o sumie zerowej: PAPIER, KAMIEŃ, NOŻYCE gracze wykonują ruchy jednocześnie; macierzwypłatdlaa: A B papier kamień nożyce papier 0 1 1 kamień 1 0 1 nożyce 1 1 0

Prosta gra macierzowa, 2-osobowa, o sumie niezerowej: DYLEMAT WIĘŹNIA gracze wykonują ruchy jednocześnie; macierz wypłat: A B współpraca zdrada współpraca 3 3 zdrada 0 20 20 0 10 10 Strategia optymalna: zawsze zdradzać. Dygresja polityczno-ewolucyjna Wykład7,31III2010,str.6 Mantra liberalna: Niech każdy dba o swój interes, wtedy interes wspólny sam o siebie zadba. W sytuacji dylematu więźnia(np. w sprawach globalnych, jak wpływ na klimat) interesy jednostkowe nie składają się w interes wspólny... Problem ewolucjonistów: Skąd w przyrodzie biorą się zachowania altruistyczne? Geny osobnika, który poświęca się dla bliźniego/grupy/społeczności, powinnyzanikać,botojestgorszastrategiagryniżegoizm...

Dygresja polityczno-ewolucyjna Hipotetyczna odpowiedź: Iterowany dylemat więźnia: Gramy wiele razy i w każdej rozgrywce bierzemy pod uwagę zachowanie przeciwnika/partnera w poprzednich rozgrywkach. Jeśli liczba rozgrywek nie jest z góry ograniczona, to strategią lepszą od pełnego egoizmu jest wet za wet : na początku współpracować, w następnych turach robić tak, jak poprzednio zrobił przeciwnik; cojakiśczas(losowo) darowaćwinę pójśćnawspółpracęmimo że przeciwnik zdradził. Być może liberalny ład społeczny może działać na zasadzie iterowanego dylematu więźnia... Być może altruizm powstaje z iterowanego dylematu więźnia... Wykład7,31III2010,str.8 Gra w zapałki(minimax): Gracze kolejno biorą zkupkipo1lub2 zapałki. Kto weźmie ostatnią przegrywa. Wygrana czerwonego: 1; zielonego: 0. 5 4 3 3 2 2 1 2 0 1 1 1 1 0 1 1 0 0 1 0 0 0 0 0-1 0-1 -2-1 -2-1 -2-1 -2-1 -2-1 -2-1 -1-2 -1-1 -1 0 1 0 1 1 1 0 1 1 1 1 Czerwony zainteresowany jest maksymalizacją wyniku. Zielony zainteresowany jest minimalizacją wyniku. 1 0 0 0

Strategia minimax : minimax stosuje się do gier 2-osobowych, w których gracze wykonują ruchy na przemian; jeden z nich zainteresowany jest minimalizacją a drugi maksymalizacją wyniku; oceniasięwszystkiepozycjewpełnymdrzewiegry począwszyod liści i skończywszy na korzeniu: najpierw na liściach wpisuje się wyniki zakończonych rozgrywek; potem na każdym wierzchołku wewnętrznym wpisuje się minimum lub maximum(zależnie od tego, który gracz ma ruch) ocen dzieci tego wierzchołka; w każdej pozycji gracz powinien wykonać ruch prowadzący do pozycji o najniższej lub najwyższej(zależnie od tego, który z nich) ocenie. Wykład7,31III2010,str.10 Funkcja oceny pozycji w strategii minimax : int ocena(stan_planszy pl, int czyj_ruch){ if(gra_zakonczona(pl, czyj_ruch)) return wielkosc_wyplaty(pl, czyj_ruch); else{ int i, min, max, oc; Stan_planszy pl1; min=infty;max=-infty; for(i in zbior_mozliwych_ruchow(pl,czyj_ruch)){ wykonaj_ruch(&pl1, pl, i); oc=ocena(pl1,(czyj_ruch==max?min:max)); if(oc>max) max=oc; if(oc<min) min=oc; if(czyj_ruch == MAX) return max; else return min; } } }

-1 1-1 1 Wygrana krzyżyka: 1; kółka:-1. Krzyżyk zainteresowany jest maksymalizacją. Kółko zainteresowane jest minimalizacją. Drzewa nawet prostych gier są na ogół olbrzymie, a minimax trzeba zacząć od liści, więc wydaje się, że potrzebne jest całe drzewo. Wykład7,31III2010,str.12 Heurystyczna ocena pozycji: budujemy fragment drzewa gry o takiej wysokości, na jaką nas stać; liście tego fragmentu są wewnętrznymi węzłami całego drzewa, więc niemapewności,ktownichwygrywa; stosujemy jakąś heurystyczną ocenę pozycji na liściach tego fragmentu; propagujemy na cały fragment ocenę z liści stosując zwykły minimax; wybieramy ruch wg minimaxu; usuwamy oceny; przy następnym ruchu budujemy nowy fragment drzewa sięgający głębiej i oceniamy jak wyżej.

Gra w zapałki: Heureza: (liczba zapałek) mod 3 Czerwony: jak najwyższa ocena Zielony: jak najniższa ocena Uwaga: Dlatejgrytakaheurezaniema sensu; to tylko taka sobie ilustracja działania algorytmu. Z pktu widzenia Czerwonego: 1.biorę2zapałki;isadzę,żeZielonyweźmie2; 2.biorę1zapałkę;isadzę,żeZielonyweźmie2; 3... 8-1 -2 7 6-1 -2-1 -2 6 5 5 4-1 -2 3 2 1 0-1 -2-1 -2 2 1 1 0 2 1 1 0 Wykład7,31III2010,str.14 Przycinanie α-β: 1-1 -1 ruch ma kółko, zainteresowany minimalizacją; topoddrzewoniebędziegrało,bo ma wyższą ocenę niż sąsiednie. W takiej sytuacji tego poddrzewa można w ogóle nie rozpatrywać. 1

Przycinanie α-β: a b b? min max A B C Jeślia b,todrzewacnietrzebaprzeglądać, bo gracz min nie pozwoli tam wejść, wybierze poddrzewo A.