Podręcznik. Teoria gier (J. Von Neumann, 1928)



Podobne dokumenty
MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 5

Programowanie Ewolucyjne

TEORIA GIER W EKONOMII WYKŁAD 1: GRY W POSTACI EKSTENSYWNEJ I NORMALNEJ

N-osobowy dylemat więźnia

dr inż. Cezary Wiśniewski Płock, 2006

Algorytmy graficzne. Podstawy kompresji danych fragment wykładu. Marcin Wilczewski

KASA EDUKACYJNA INSTRUKCJA. WARIANT I - dla dzieci młodszych

WOJEWÓDZKI KONKURS MATEMATYCZNY DLA SZKÓŁ PODSTAWOWYCH W ROKU SZKOLNYM 2012/2013

1 Granice funkcji. Definicja 1 (Granica w sensie Cauchy ego). Mówimy, że liczba g jest granicą funkcji f(x) w punkcie x = a, co zapisujemy.

W. Guzicki Zadanie 23 z Informatora Maturalnego poziom rozszerzony 1

Zagadnienia transportowe

I. LOGICZNE STRUKTURY DRZEWIASTE

KONKURSY MATEMATYCZNE. Treść zadań

Dziedziczenie : Dziedziczenie to nic innego jak definiowanie nowych klas w oparciu o już istniejące.

6. Projektowanie składu chemicznego stali szybkotn cych o wymaganej twardo ci i odporno ci na p kanie

PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

STA T T A YSTYKA Korelacja

Zadania z parametrem

Temat: Mnożenie liczby całej przez ułamek. Obliczanie ułamka z danej liczby.

Matematyka:Matematyka I - ćwiczenia/granice funkcji

Programowanie dynamiczne

Podejmowanie decyzji. Piotr Wachowiak

Ćwiczenie nr 2 Zbiory rozmyte logika rozmyta Rozmywanie, wnioskowanie, baza reguł, wyostrzanie

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

1. Rozwiązać układ równań { x 2 = 2y 1

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

EGZAMIN DYPLOMOWY, część II, Biomatematyka

SEAL OF EXCELENCE TOP 10 OBSCURE GAMES. The Dice Tower. The Dice Tower

29. TRZY W LINII CZYLI O POSZUKIWANIU ZWIĄZKÓW

Podstawowe działania w rachunku macierzowym

Temat: Co to jest optymalizacja? Maksymalizacja objętości naczynia prostopadłościennego za pomocą arkusza kalkulacyjngo.

Symulowane Wyżarzanie. Algorytmy metaheurystyczne Wykład 5. Piotr Syga

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

Statystyki opisowe. Marcin Zajenkowski. Marcin Zajenkowski () Statystyki opisowe 1 / 57

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

ROZWIĄZANIA ZADAŃ Zestaw P3 Odpowiedzi do zadań zamkniętych

Załącznik nr 2 Testy logiczne służące sprawdzeniu jakości danych uczestników projektów współfinansowanych z EFS

PREFABRYKOWANE STUDNIE OPUSZCZANE Z ŻELBETU ŚREDNICACH NOMINALNYCH DN1500, DN2000, DN2500, DN3200 wg EN 1917 i DIN V

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

Rozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu

Program szkoleniowy Efektywni50+ Moduł III Standardy wymiany danych

W tym elemencie większość zdających nie zapisywała za pomocą równania reakcji procesu zobojętniania tlenku sodu mianowanym roztworem kwasu solnego.

TEST WIADOMOŚCI: Równania i układy równań

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

2.Prawo zachowania masy

LOGISTYKA DYSTRYBUCJI ćwiczenia 5 ZAPASY ROZPROSZONE ZARZĄDZANIE ZAPASAMI WIELU LOKALIZACJI

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

TWIERDZENIE PITAGORASA

Łączność na polu walki (problem przydziału częstotliwości UKF)

Wykład 1 Tomasz Żak Instytut Matematyki i Informatyki C-11, pok. 313, zak

REGULAMIN RADY RODZICÓW

Zadania. SiOD Cwiczenie 1 ;

BINGO LOTTO INSTRUKCJA. zabawka i gra rekomendowany wiek: od lat 5 liczba graczy: 2-18

22 PRĄD STAŁY. CZĘŚĆ 1

SCRIBA JUNIOR SCRIBA JUNIOR I

METODY SZTUCZNEJ INTELIGENCJI W ROZWI ZYWANIU ZADA OPTYMALIZACJI

Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

REGULAMIN RADY RODZICÓW SZKOŁY PODSTAWOWEJ NR 6 IM. ROMUALDA TRAUGUTTA W LUBLINIE. Postanowienia ogólne

Roczne zeznanie podatkowe 2015

Ogólna charakterystyka kontraktów terminowych

POWIATOWY URZĄD PRACY

PROCEDURA OCENY RYZYKA ZAWODOWEGO. w Urzędzie Gminy Mściwojów

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

Lekcja 173, 174. Temat: Silniki indukcyjne i pierścieniowe.

MODEL KLASYCZNY A MODEL KEYNESOWSKI

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

Bazy danych. Andrzej Łachwa, UJ, /15

Przygotowały: Magdalena Golińska Ewa Karaś

AGAJĄCA REFLEKSU GRA IMPREZOWA DLA 1 5 GRACZY OD 3 ROKU Ż

Lepsze samopoczucie to lepsze oceny. Jaka jest korzyść dla dziecka?

Pierwsza na świecie platforma społecznościowa z programem RevShare

Witamy w przedszkolu

STEROWNIK BIOLOGICZNYCH OCZYSZCZALNI ŚCIEKÓW

Tytuł. Autor. Dział. Innowacyjne cele edukacyjne. Czas. Przebieg. Etap 1 - Wprowadzenie z rysem historycznym i dyskusją

PODSTAWY DZIAŁANIA UKŁADÓW CYFROWYCH

KLAUZULE ARBITRAŻOWE

Wykład 1. Strategie a struktury organizacyjne

Paweł Selera, Prawo do odliczenia i zwrotu podatku naliczonego w VAT, Wolters Kluwer S.A., Warszawa 2014, ss. 372

Instrukcja montażu i obsługi Schodowego Czujnika Ruchu SCR-2

Podstawowe oddziaływania w Naturze

Wprowadzenie do teorii gier

Regulamin Stypendium. Fundacji Rodziny Maciejko

FORUM ZWIĄZKÓW ZAWODOWYCH

Projektowanie bazy danych

KARTA OCENY ZGODNOŚCI OPERACJI z Lokalną Strategią Rozwoju Obszarów Rybackich. Wniosek dotyczy działania : Ocena kryteriów zgodności z LSROR

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM

Poniżej przedstawiono przykłady zestawień wyników pomiarów i analiz z wartościami granicznymi i dopuszczalnymi: Przykład 1

Regulamin Rady Rodziców. przy Gimnazjum w Jasienicy. Postanowienia ogólne

SCENARIUSZ LEKCJI WYCHOWAWCZEJ: AGRESJA I STRES. JAK SOBIE RADZIĆ ZE STRESEM?

s n = a k (2) lim s n = S, to szereg (1) nazywamy zbieżnym. W przeciwnym przypadku mówimy, że szereg jest rozbieżny.

OFERTA WYKŁADÓW, WARSZTATÓW I LABORATORIÓW DLA UCZNIÓW KLAS IV- VI SZKÓŁ PODSTAWOWYCH, GIMNAZJALNYCH I ŚREDNICH

Matematyka ubezpieczeń majątkowych r.

MATEMATYKA 9. INSTYTUT MEDICUS Kurs przygotowawczy do matury i rekrutacji na studia medyczne Rok 2017/2018 FUNKCJE WYKŁADNICZE, LOGARYTMY

USTAWA. z dnia 26 czerwca 1974 r. Kodeks pracy. 1) (tekst jednolity)

Regulamin Rady Rodziców

Transkrypt:

MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN d.wojcik@nencki.gov.pl tel. 5892 424 http://www.neuroinf.pl/members/danek/swps/ Iwo Białynicki-Birula Iwona Białynicka-Birula ISBN: 83-7255-103-0 Data wydania: 6 maja 2002 Podręcznik Dylemat więźnia (A. Tucker, 1950) Siedzisz w więzieniu oskarżony o zbrodnię popełnioną wspólnie z drugim więźniem. Prokurator proponuje wam układ: Jeżeli obaj nie przyznacie się do winy, dostaniecie po roku; jeżeli obaj się przyznacie, dostaniecie po 10 lat. Jeżeli jeden się przyzna, a drugi nie, to ten pierwszy w nagrodę wyjdzie na wolność, a drugi skazany zostanie na 20 lat. Nie masz możliwości kontaktu z kompanem, do tego nie macie do siebie zaufania. Co zrobić? Analiza strategii Macierz gry, inaczej macierz wypłat, zawiera wyniki gry w zależności od strategii przyjętych przez graczy. Teoria gier (J. Von Neumann, 1928) Teoria gier dostarcza modeli matematycznych do podejmowania decyzji w sytuacjach konfliktowych Konflikt może oznaczać konflikt interesów stron, np. w socjologii lub ekonomii, ale także konflikt wojenny Jej celem jest znajdowanie optymalnych strategii w sytuacji konfliktowej Gra i strategia Grą nazywamy taką procedurę, której uczestnicy mają możliwość podejmowania decyzji (dokonywania wyboru) Ciąg wszystkich wyborów podjętych w trakcie gry od jej początku do samego końca nazywamy strategią.

Przykłady strategii W dylemacie więźnia każdy gracz (więzień) ma dwie strategie W grze w kółko i krzyżyk na planszy 3 na 3 mamy już prawie 9*7*5*3=945 strategii W grze w szachy tych strategii jest bardzo dużo: jeżeli w typowej partii gracz wykonuje ok. 30 ruchów i za każdym razem ma średnio 10 wyborów, to daje 10 30 różnych strategii. Nawet jeżeli większość z nich jest na pierwszy rzut oka nierozsądna, i tak zostaje ogromna liczba strategii do przeanalizowania. Analiza strategii Macierz gry, inaczej macierz wypłat, zawiera wyniki gry w zależności od strategii przyjętych przez graczy. Strategia dominująca; tutaj: przyznanie się do winy Iterowany dylemat więźnia Turnieje Axelroda Algorytmy genetyczne wybierające strategię Program Axelrod Gry o sumie zerowej Gry dwuosobowe, w których suma wypłat w każdym polu macierzy wypłat wynosi 0. Większość dwuosobowych gier towarzyskich można przedstawić jako gry o sumie zerowej Von Neumann udowodnił, że wszystkie gry o sumie zerowej są rozwiązywalne, to znaczy dla każdej z nich istnieje optymalna strategia. Przykład gry o sumie zerowej Teleturniej Gwiazdy intelektu Bierze udział Tata, Mama, Staś i Nel Kategorie: Kino, Piosenka, Sport, Telewizja W finale Rodzina wybiera jednego przedstawiciela, a prezenter jedną kategorię. Prezenter nie chce, żeby Rodzina wygrała nagrodę, Rodzina chce wygrać. Kogo rodzina powinna wystawić i jaką kategorię pytań powinien wybrać prezenter, żeby zmaksymalizować swoje szanse? Ranking rodziny

Analiza sytuacji od strony Rodziny Analiza sytuacji od strony Prezentera Analiza sytuacji Wybieramy Tatę: jeżeli kategoria Kino, to szansa wygrania 30% Wybieramy Mamę: jeżeli kategoria Sport, to szansa wygrania 30% Wybieramy Stasia: jeżeli kategoria Piosenka, to szansa wygrania 60% Wybieramy Nel: jeżeli kategoria Piosenka, to szansa wygrania 20% Wybieramy Stasia! Wybieram Kino: jeżeli wystawią Mamę, to mają 80% szans by wygrać Wybieram Piosenkę: jeżeli wystawią Stasia, to mają 60% szans by wygrać Wybieram Sport: jeżeli wystawią Tatę, to mają 90% szans by wygrać Wybieram Telewizję: jeżeli wystawią Stasia, to mają 90% szans by wygrać Wybieram piosenkę! Rodzina wybiera największą wartość α i Prezenter wybiera najmniejszą wartość β i Zasada minimaksu =max i min j a ij =min j max i a ij Wartości α i β noszą nazwę dolnej i górnej granicy gry Punkt siodłowy Jak grać kiedy granice gry są różne? Rozważmy inną tabelę gry: Tym razem dolna i górna granica gry są różne: α=40% < β=50% Strategia mieszana Von Neumann udowodnił, że każda gra o sumie zerowej posiada rozwiązanie, ale optymalna jest na ogół strategia mieszana. Strategia mieszana oznacza losowy wybór strategii z pewnym prawdopodobieństwem p i Rodzina wystawia kandydata z prawdopodobieństwem p i (i=m,t,s,n), prezenter wybiera jedną z dyscyplin z prawdopodobieństwem q j (j=k,p,s,t).

Strategia mieszana Średnia wygrana rodziny wynosi: j = p 1 a 1 j p 2 a 2 j p 3 a 3 j p 4 a 4 j Średnia przegrana prezentera wynosi: i =q 1 a j1 q 2 a j2 q 3 a j3 q 4 a j4 Idealnie byłoby, gdyby średnia wygrana rodziny nie zależała od decyzji prezentera. Von Neumann pokazał, że można tak wybrać p i i q j, że α j = α, β i = β, co więcej α = β =ν Innymi słowy gra posiada rozwiązanie mieszane Zredukowany przykład Wystarczy ograniczyć się do Taty i Mamy, Kina i Piosenki: Daje nam to układ równań do rozwiązania W wyniku dostajemy: Inne typy gier Stan równowagi Nasha: taki układ strategii graczy, że żaden gracz nie może poprawić swojej sytuacji, jeżeli wszyscy pozostali utrzymają swoją strategię Każda gra skończona ma przynajmniej jeden stan równowagi Nasha Ewolucja Długotrwałe poddawanie populacji mechanizmom ewolucji powoduje stopniowe udoskonalanie należących do niej osobników Kilka pojęć Osobnik jednostka posiadająca cechy odróżniające ją od innych zakodowane w genach Genotyp ciąg symboli kodujący kompletny zestaw cech osobnika Fenotyp zbiór cech osobnika odpowiadający danemu genotypowi Populacja zbiór osobników (fenotypów) żyjących w pewnym środowisku, oddziałujących na siebie i rozmnażających się Mechanizmy ewolucji Wariacja mechanizm powodujący zwiększenie różnorodności populacji: Mutacja przypadkowa częściowa zmiana genotypu danego osobnika Krzyżowanie (rekombinacja) powstawanie nowego genotypu na skutek połączenia dwóch już istniejących w populacji genotypów Selekcja - mechanizm powodujący zmniejszenie różnorodności populacji: Selekcja naturalna wymieranie osobników gorzej przystosowanych do środowiska Selekcja płciowa lepiej przystosowane osobniki mają więcej potomstwa

Algorytmy genetyczne Algorytmy wykorzystujące ideę doboru naturalnego, procesy krzyżowania i mutacji. Rozwiązują problemy optymalizacyjne polegające na znalezieniu w danej populacji osobnika najlepszego pod jakimś względem. Do określania stopnia przystosowania osobnika służy funkcja celu, zwana też funkcją przystosowania. Cechy algorytmów genetycznych Nie przetwarzają bezpośrednio parametrów zadania lecz ich zakodowaną postać Prowadzą poszukiwania rozpoczynając od pewnej populacji danych początkowych Korzystają tylko z funkcji celu Stosują probabilistyczne, a nie deterministyczne reguły wyboru Przykład: maksymalizacja funkcji Rozważmy algorytm genetyczny szukający maksimum funkcji: Program Holland f x =1 x 2 1 1 x x 0,1 Schemat algorytmu Fenotyp: każdy osobnik ma jedną cechę liczbę z przedziału 0 do 1 Genotyp: binarny kod liczby długości n, zatem od 0 do 2 n -1. Zamieniamy na liczbę od 0 do 1 dzieląc przez 2 n. Dla każdego takiego osobnika możemy policzyć wartość f, czyli jego przystosowanie Kodowanie fenotypu Selekcja twarda 1.Zaczynamy od jednego osobnika z losowym genotypem 2.Mutujemy osobnika zmieniając każdy z 32 bitów genotypu z prawdop. 1/32 3.Liczymy funkcję przystosowania dla obu osobników i wyrzucamy gorszego 4.Wracamy do punktu 2.

Rozwiązanie analityczne Maksimum funkcji: f x =1 x 2 1 1 x Jest tam, gdzie zeruje się jej pochodna: f' x = 1 2 1 1 x 2=0 Zatem x= 2 1 To daje fenotyp: 0110101000001001111001 100110011111110011101111001101 Selekcja miękka Przeszukiwanie wszystkich fenotypów jest powolne 2 32 możliwości Algorytm genetyczny może być znacznie szybszy, chyba że trafi w lokalne maksimum, np. 0,5=1000000000000000000000000... Selekcja miękka: w dużej populacji słabsze osobniki mogą przeżywać i rozmnażać się, lecz przeżywają lub rozmnażają się z mniejszym prawdopodobieństwem niż osobniki lepiej przystosowane Inne zastosowania a. genetycznych Można je stosować także kiedy nie ma konkretnej funkcji przystosowania, np. w iterowanym dylemacie więźnia Program Axelrod Modelowanie społeczeństwa Użyte programy Źródła Axelrod Holland Pasteur Schelling http://www.wiw.pl/modelowanie/