Kurs z NetLogo - część 4.



Podobne dokumenty
Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

Tworzenie gier na urządzenia mobilne

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

Elementy Modelowania Matematycznego

11. Gry Macierzowe - Strategie Czyste i Mieszane

MODELOWANIE RZECZYWISTOŚCI

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

25. NIE TYLKO WORECZKI CZYLI O ROZUMIENIU SYSTEMU DZIESIĘTNEGO, CZ. I

MODELOWANIE RZECZYWISTOŚCI

MATEMATYCZNE METODY WSPOMAGANIA PROCESÓW DECYZYJNYCH

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Tematy prac magisterskich i doktorskich

Uczenie ze wzmocnieniem aplikacje

Punkty równowagi w grach koordynacyjnych

Matematyk Ci powie, co łączy Eugeniusza Oniegina i gry hazardowe

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH INŻYNIERSKICH 2-go STOPNIA STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2018/19.

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

ODWZOROWANIE RZECZYWISTOŚCI

XXII Konferencja SNM. Porozmawiajmy o walorach dydaktycznych SET Game

34. NIE TYLKO WORECZKI CZYLI O ROZUMIENIU SYSTEMU DZIESIĘTNEGO, CZ. II

Instrukcja obsługi programu

Teoria gier. Łukasz Balbus Anna Jaśkiewicz

Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 1

Uczenie ze wzmocnieniem aplikacje

Wykład Ćwiczenia Laboratoriu m ,5 1,5 WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI CELE PRZEDMIOTU

2010 W. W. Norton & Company, Inc. Oligopol

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa

Strategie kwantowe w teorii gier

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

1 S t r o n a. Teoria Gier Praca domowa 1 - rozwiązania

Matematyka stosowana w kształceniu szkolnym w obiektywie diagnoz Połowy drogi

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Studia magisterskie uzupełniające Kierunek: Ekonomia. Specjalność: Ekonomia Menedżerska

Propedeutyka teorii gier

Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych

INFORMATYKA. PLAN STUDIÓW NIESTACJONARNYCH 2-go STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM A K L S P

-Teoria gier zajmuje się logiczną analizą sytuacji konfliktu i kooperacji

Mikołaj Kania Waldemar Korłub Jakub Krajewski

Zasady działania botów w grach MMO, sposoby ochrony przed nimi i omijania zabezpieczeń

5. Wprowadzenie do prawdopodobieństwa Wprowadzenie Wyniki i zdarzenia Różne podejścia do prawdopodobieństwa Zdarzenia wzajemnie wykluczające się i

Żeby wygrać, trzeba grać?

Gry o sumie niezerowej

Jacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH 2-go STOPNIA (W UKŁADZIE SEMESTRALNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM A K L S P

10. Wstęp do Teorii Gier

Projekt z Jakości Oprogramowania Aplikacja dla Przetargów Publicznych. Jarosław Kuchta

CogGGP - kognitywnie inspirowany agent GGP - opis architektury

Elementy modelowania matematycznego

ROZKŁAD MATERIAŁU NAUCZANIA KLASA 1, ZAKRES PODSTAWOWY

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

Informatyka szkolna z perspektywy uczelni

EKONOMIA MENEDŻERSKA. Wykład 5 Oligopol. Strategie konkurencji a teoria gier. 1 OLIGOPOL. STRATEGIE KONKURENCJI A TEORIA GIER.

Konferencja NOWE MEDIA W EDUKACJI

TEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii

PROGRAM AUTORSKI KOŁA INFORMATYCZNEGO UCZNIÓW SZKOŁY PODSTAWOWEJ

Gry społecznościowe. wykład 0. Joanna Kołodziejczyk. 24 lutego Joanna Kołodziejczyk Gry społecznościowe 24 lutego / 11

REFERAT PRACY DYPLOMOWEJ Temat pracy: SUDOKU - Algorytmy tworzenia i rozwiązywania

13. Teoriogrowe Modele Konkurencji Gospodarczej

33. NIE TYLKO WORECZKI CZYLI O ROZUMIENIU SYSTEMU DZIESIĘTNEGO, CZ. I

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Dobór metod nauczania zależy od:

ROZKŁAD MATERIAŁU NAUCZANIA KLASA 2, ZAKRES PODSTAWOWY

Mikroekonomia. O czym dzisiaj?

Specjalność Optymalizacja Decyzji Menedżerskich. Katedra Badań Operacyjnych Uniwersytetu Łódzkiego

Plan. Zakres badań teorii optymalizacji. Teoria optymalizacji. Teoria optymalizacji a badania operacyjne. Badania operacyjne i teoria optymalizacji

Moduł I. Problemy rozwoju i samorealizacji człowieka 40 godz. (10 wykłady, 10 ćwiczenia audytoryjne, 20 ćwiczeń laboratoryjne).

INFORMATYKA PLAN STUDIÓW NIESTACJONARNYCH 2-GO STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2014/15

Sprzężenia na rynku edukacyjnym próba weryfikacji symulacyjnej

Podstawy Sztucznej Inteligencji (PSZT)

Transformacja wiedzy w budowie i eksploatacji maszyn

Zadanie 1 - MŁODZIKI

Modelowanie Preferencji a Ryzyko. Dlaczego w dylemat więźnia warto grać kwantowo?

Grafika komputerowa i wizualizacja

Egzamin z Wstępu do Teorii Gier. 19 styczeń 2016, sala A9, g Wykładowca: dr Michał Lewandowski. Instrukcje

Teoria gier a ewolucja. Paweł Kliber (UEP)

Wartość Shapleya w grach koalicyjnych

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013

PRZEWODNIK PO PRZEDMIOCIE

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Kompetencje kluczowe gimnazjalistów w świetle wyników egzaminu gimnazjalnego w 2012 i 2013 roku

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

SPOTKANIE 11: Reinforcement learning

11/22/2014. Jeśli stała c jest równa zero to takie gry nazywamy grami o sumie zerowej.

Hyper-resolution. Śmieciarki w Manncheim

1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.

INFORMATYKA PLAN STUDIÓW NIESTACJONARNYCH 2-GO STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2015/16

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Narzędzia AI. Jakub Wróblewski Pokój SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE)

Systemy Agentowe główne cechy. Mariusz.Matuszek WETI PG

Modele bezpieczeństwa logicznego i ich implementacje w systemach informatycznych / Aneta Poniszewska-Marańda. Warszawa, 2013.

9. ILE TO KOSZTUJE CZYLI OD ZAGADKI DO ZADANIA TEKSTOWEGO, CZ. III

Transkrypt:

Kurs z NetLogo - część 4. Mateusz Zawisza Zakład Wspomagania i Analizy Decyzji Instytut Ekonometrii Szkoła Główna Handlowa Seminarium Wieloagentowe Warszawa, 10.01.2011

Agenda spotkań z NetLogo 15. listopada 2010 29. listopada 2010 Praca z gotowym modelem z biblioteki NetLogo zapoznanie się z elementami interejsu użytkownika symulacji, np. przycisków, wykresów, suwaków 13. grudnia 2010 Budowa własnego modelu: pisanie procedur w jezyku NetLogo tworzenie elementów interfejsu użytkownika symulacji 10. stycznia 2011 (poniedziałek, godz. 18.45, 5C-C) Techniczne aspekty uczenia się agentów Poznanie algorytmu Fictitious Play Implementacja Fictitious Play na przykładzie gry koordynacyjnej w NetLogo

Cechy modelu wieloagentowego za Gilbert (2008) Ontologiczne odwzorowanie Możliwość modelowania obiektów świata rzeczywistego (np. przedsiębiorstw) w spsób bezpośredni poprzez tworzenie odpowiednich klasy obiektów, a nie przy pomocy np. równań matematycznych Heterogeniczni agenci Reprezentacja środowiska przykładem środowiska jest grid, a więc lokalizacja agentów, ale także wszystkie publicznie dostępne informacje, np. ceny Interakcje agentów Ograniczona racjonalność agenci nie maksymalizuja swojej funkcji dobrobytu explicite, ale posługują się prostymi regułami decyzyjnymi Uczenie się agentów

Czym jest model uczenia? Na model uczenia się składaja się dwa procesy: proces zbierania danych potrzebnych do podjęcia decyzji, tj. jakie informacje sa zbierane i w jaki sposóbaktualizowane? proces decyzyjny warunkowany zebrana informacja Warunek uczenia się agentów: gra musi być grana wielokrotnie jeśli gra jest pojedyńcza, nie ma mowy o uczeniu się

Po co potrzebujemy algorymów uczenia się agentów? za Fudenberg, Levine (1998) Tradycyjna Teoria Gier koncentruje się na wyszukiwaniu równowag Nasha, niewiele mówiac jak gracze maja osiagać konkretne stany równowagowe, szczególnie gdy równowagi sa liczne, a gracze nie sa hiperracjonalni Teoria uczenia się pozwala na objaśnienie wielu równowag, jako wynik długotrwałego procesu uczenia się agentów o ograniczonych zdolnościach poznawczych Algorytmy uczenia się pozwalaja skupić się tylko na tych równowagach, do których zbiega proces uczenia się i uznać pozostałe równowagi jako nieciekawe

Sposoby modelowania uczenia się za Gilbert (2008) indywidualne - przez własne doświadczenie ewolucyjne/populacyjne - poprzez proces umierania i rodzenia - najlepsze gatunki sa promowane w wyniku ewolucji społeczne - gracze naśladuja lub sa uczeni przez innych graczy, a także dziela się wiedza z innymi graczami

Model na dziś populacja N graczy w każdym okresie t = 0, 1,..., T max gracze sa dobierani w pary i graja następujac a grę koordynacyjna A B A 1,1 0,0 B 0,0 1,1 w okresie stratowym t = 0 każdemu graczowi i przypisywana jest jedna z dwóch strategii: A lub B

Proces uczenia Fictitious Play Wagi przywiazywane do strategi i zasada ich aktualizacji każdry z graczy przywiazuje określona wagę do strategii A i B: η ia (t) i η ib (t). w okresie t = 0 wagi sa inicjowane na zero, tj. η ia (0) = 0 i η ib (0) = 0. w okresie t + 1 wagi sa aktualizowane zgodnie z tym co zagrał przeciwnik i-tego gracza - gracz j η ia (t + 1) = η ib (t + 1) = { ηia (t)+1 dla s j (t) = A η ia (t) dla s j (t) = B { ηib (t)+1 dla s j (t) = B η ib (t) dla s j (t) = A

Proces uczenia Fictitious Play Subiektywne prawdopopodobieństwa rozkładu strategi w populacji wyobrażenie i-tego gracza o rozkładzie strategii granych w populacji w okresie t, określone jest przez µ ia (t) i µ ib (t) µ ia = µ ib = η ia (t) η ia (t)+η ib (t) η ib (t) η ia (t)+η ib (t)

Proces uczenia Fictitious Play Reguły decyzyjne wyboru strategii Oczekiwana wypłata z grania strategii A równa jest 1µ ia + 0µ ib = µ ia. Analogicznie, wypłata z grania strategii B wynosi: µ ib. Ponieważ µ ia +µ ib = 1, to reguła decyzyjna maksymalizujaca wypłatę ma postać: dla gracza, grajacego dotychczas A: { B gdy µib (t) > 0.5 s i (t) = A wpp. dla gracza, grajacego dotychczas B: { A gdy µia (t) > 0.5 s i (t) = B wpp.