Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych
|
|
- Anatol Stefaniak
- 5 lat temu
- Przeglądów:
Transkrypt
1 Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW 5 IV 2017 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
2 Plan 1 Security Games 2 Elementy teorii gier 3 Mixed-UCT 4 Wyniki 5 Problemy Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
3 Security Games Obrońcy i atakujący Asymetria graczy Różne rodzaje przestrzeni Zwykle obrońca ma większą przestrzeń decyzyjną Brak jednolitej definicji Zazwyczaj równowaga Stackelberga Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
4 Cele Metoda dobrze działająca z grami wielokrokowymi Metoda dobrze skalująca się z rozmiarem gry Metoda łatwa do dostosowania do różnych modeli gry Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
5 Postać normalna gry o sumie (nie)zerowej Macierz wypłat gracza P1 P1/P2 a b c d A B C U P1 (A, b) = 4 U P2 (A, b) = 4 Macierz wypłat gracza P2 P1/P2 a b c d A B C U P2 (A, b) = 3 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
6 Postać normalna gry o sumie (nie)zerowej Macierz wypłat gracza P1 P1/P2 a b c d A B C U P1 (A, b) = 4 U P2 (A, b) = 4 Macierz wypłat gracza P2 P1/P2 a b c d A B C U P2 (A, b) = 3 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
7 Strategia mieszana E H T H 1 1 T 1 1 O H T H 1 1 T 1 1 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
8 Równowaga Stackelberga Asymetryczni gracze: Leader, Follower Follower zna strategię Leadera w momencie wyboru swojej strategii. (Ale niekoniecznie wykonuje ruch po leaderze). Follower rozstrzyga remisy (swojej wypłaty) na korzyść Leadera Gra Equilibrium Obrońca Pr. U D 0.4 D D2 3 A1 A2 D D Atakujący Pr. U A U D 1 A A A1 A2 D D Zaburzone equilirbium Obrońca Pr. U D 0.39 D D2 15 Atakujący Pr. R A U D 0 A A Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
9 Równowaga Stackelberga Asymetryczni gracze: Leader, Follower Follower zna strategię Leadera w momencie wyboru swojej strategii. (Ale niekoniecznie wykonuje ruch po leaderze). Follower rozstrzyga remisy (swojej wypłaty) na korzyść Leadera Gra A1 A2 D D A1 A2 D D Dwupoziomowy problem optymalizacyjny arg max π d Π d U d (π d, R a (π d )) R a (π d ) = arg max πa Π a U a (π d, π a ) funkcja schodkowa Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
10 Gra na grafie i generator budynków Każdy z graczy operuje jednostkami chodzącymi po grafie Obaj wykonują ruch jednocześnie Nie widzą siebie nawzajem Przykładowa gra Generator budynków 1: A(5,-1) D(3,-12) 0: A(20,-1) D(3,-15) 4:A(-1) 3:A(-1) 10:A(-1) 9:A(-1) 11 1 D(-9) A(10) 2 D(-6) A(3) : A(-1), : A(30,-1) D(5,-10) 5:A(-1) 6:A(-1) 7:A(-1) Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
11 MCTS i UCT Próbkowanie losowe Wykorzystanie tylko symulacji gry Oszacowanie wypłaty Licznik odwiedzin Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
12 Mixed-UCT I Cele Znaleźć dobre przybliżenie strategi leadera w stanie równowagowym (w sensie wypłaty) Problemy Skrócić czas obliczeń w stosunku do metod dokładnych UCT wymaga gry z pełną informacją UCT podaje w wyniku pojedynczy ruch Equilibrium Stackelberga zaskakuje Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
13 Mixed-UCT II Zarys Zainicjuj strategię atakującego Ucz I2-UCT gry przeciw bieżącemu atakującemu Przekształć drzewo UCT w strategię Zwróć najlepszą z napotkanych strategii obrońcy Uaktualnij strategię atakującego Oblicz optymalną odpowiedź atakującego nie Warunki stopu tak I2UCT Jak wyliczać strategię obrońcy? Jak wyliczać odpowiedź atakującego? Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
14 Stan równowagowy Stackelberga (raz jeszcze) Defender Pr. Move E(R D ) 0.4 D D2 3 Attacker Pr. Move E(R A ) E(R D ) 1 A A Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
15 Uzyskiwanie strategii mieszanej v1: FullTree = p = 0.02 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
16 Uzyskiwanie strategii mieszanej v2: BestPathFreq 0.1 c Sekwencje Liczniki a 1, a 2, a 3, b 1, b 2, b 3, c c 1, c 2, c 3, c podbij licznik Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
17 Uśrednianie atakującego Strategia atakującego jest średnią najlepszych odpowiedzi z h poprzednich iteracji MILP U R t sc R t sc R t sc R t sc R t R a b c d a b c d game Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
18 MILP: metoda do porównań MILP max q,z,a i X i X j Q R ijz ij s.t. j Q z ij = 1 ( i X ) j Q z i,j 1 ( j Q ) q j i X z ij 1 j Q q j = 1 ( j Q ) 0 (a i X C ij( h Q z ih)) ( j Q ) (a i X C ij( h Q z ih)) (1 q j )M z ij [0, 1] q j {0, 1} a R Złożoność X liczba strategii (sekwencji) obrońcy, Q liczba strategii (sekwencji) atakującego Solvery: O( X Q ) zmiennych, w tym Q binarnych. O( X + Q ) ograniczeń Gurobi 6.5 SCIP 3.1 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
19 FullTree Mixed-UCT Uniform MILP Game Payoff Time Payoff Payoff Time Score mean sd [s] [s] % % % % % % % % % % % % % % % % % % % % % % % mean % Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
20 Czas obliczeń Mixed-UCT a x + bx 2 MILP cd x time[s] number of rounds Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
21 BestPath Mixed-UCT Uniform MILP Game Payoff Time Payoff Payoff Score mean sd mean Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
22 Przebiegi I Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
23 Przebiegi II Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
24 Przebiegi III Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
25 Przebiegi IV Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
26 Przebiegi V Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
27 Przebiegi VI Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
28 Przebiegi VII Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
29 Wnioski Działa dobrze w większości przypadków Skaluje się lepiej niż MILP Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
30 Minima lokalne Gra 15: A(-1) 11: A(-1) 3: A(-1) 7: A(-1) 6: A(-1) 12: A(-1) 4: A(-1) Metoda prawie deterministyczna Podąża w kierunku najlepszej wypłaty przy danym przeciwniku 14: A(-1) 10: A(-1) 0: A(-1) 9: A(-1) 5: A(-1) 13: A(-1) 8: A(-1) 1: A(-3,6) D(2,-9) Wypłata obrońcy 2: A(-3,8) D(2,-6) % ochrony celu 2 Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
31 Zatrzymywanie obliczeń Kryterium stopu? Restarty? Zmienne parametry uczenia? Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
32 * Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
33 (Koniec) Jan Karwowski (MiNI) Mixed-UCT 5 IV / 31
Zastosowanie metody UCT i drzewa strategii behawioralnej do aproksymacji stanu równowagowego Stackelberga w grach wielokrokowych
Zastosowanie metody UCT i drzewa strategii behawioralnej do aproksymacji stanu równowagowego Stackelberga w grach wielokrokowych Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział
Bardziej szczegółowoPorównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT
Porównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW
Bardziej szczegółowoSecurity Games: zastosowanie UCT na tle dotychczasowych podejść do problemu
Security Games: zastosowanie UCT na tle dotychczasowych podejść do problemu Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW 14 X 2014 Jan
Bardziej szczegółowoMetody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.
Bardziej szczegółowo10. Wstęp do Teorii Gier
10. Wstęp do Teorii Gier Definicja Gry Matematycznej Gra matematyczna spełnia następujące warunki: a) Jest co najmniej dwóch racjonalnych graczy. b) Zbiór możliwych dezycji każdego gracza zawiera co najmniej
Bardziej szczegółowoTeoria gier. wstęp. 2011-12-07 Teoria gier Zdzisław Dzedzej 1
Teoria gier wstęp 2011-12-07 Teoria gier Zdzisław Dzedzej 1 Teoria gier zajmuje się logiczną analizą sytuacji, gdzie występują konflikty interesów, a także istnieje możliwość kooperacji. Zakładamy zwykle,
Bardziej szczegółowoPODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI
Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 5 PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI 5.2. Ćwiczenia komputerowe
Bardziej szczegółowoD. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO
D. Miszczyńska, M.Miszczyński KBO UŁ GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO Gra w sensie niżej przedstawionym to zasady którymi kierują się decydenci. Zakładamy, że rezultatem gry jest wypłata,
Bardziej szczegółowoModelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.
GRY (część 1) Zastosowanie: Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony. Najbardziej znane modele: - wybór strategii marketingowych przez konkurujące ze sobą firmy
Bardziej szczegółowoTworzenie gier na urządzenia mobilne
Katedra Inżynierii Wiedzy Teoria podejmowania decyzji w grze Gry w postaci ekstensywnej Inaczej gry w postaci drzewiastej, gry w postaci rozwiniętej; formalny opis wszystkich możliwych przebiegów gry z
Bardziej szczegółowoHyper-resolution. Śmieciarki w Manncheim
Hyper-resolution Hyper-resolution Algorytm repeat NGi NGi NGj NGi nowe Nogoods, które da się wywieść z NGi if NGi then NGi NGi NGi roześlij NGi do wszystkich sąsiadów if NGi then stop end until NGi nie
Bardziej szczegółowoTeoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami
Teoria gier Teoria gier jest częścią teorii decyzji (czyli gałęzią matematyki). Teoria decyzji - decyzje mogą być podejmowane w warunkach niepewności, ale nie zależą od strategicznych działań innych Teoria
Bardziej szczegółowoTeoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.
Liceum Ogólnokształcące nr XIV we Wrocławiu 5 maja 2009 1 2 Podobieństwa i różnice do gier o sumie zerowej Równowaga Nasha I co teraz zrobimy? 3 Idee 1 Grać będą dwie osoby. U nas nazywają się: pan Wiersz
Bardziej szczegółowoTeoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego
Instytut Informatyki Uniwersytetu Śląskiego Wykład 5 - Równowagi w grach n-osobowych Figure: Podział gier Definicje Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy definiowana jest jako:
Bardziej szczegółowoDeep Learning na przykładzie Deep Belief Networks
Deep Learning na przykładzie Deep Belief Networks Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW 20 V 2014 Jan Karwowski (MiNI) Deep Learning
Bardziej szczegółowoWyznaczanie strategii w grach
Wyznaczanie strategii w grach Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Definicja gry Teoria gier i konstruowane na jej podstawie programy stanowią jeden z głównych
Bardziej szczegółowoSpacery losowe generowanie realizacji procesu losowego
Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z
Bardziej szczegółowoTEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ
TEORI GIER W EKONOMII WYKŁD 5: GRY DWUOSOOWE KOOPERCYJNE O SUMIE NIESTŁEJ dr Robert Kowalczyk Katedra nalizy Nieliniowej Wydział Matematyki i Informatyki UŁ Gry dwumacierzowe Skończoną grę dwuosobową o
Bardziej szczegółowoLEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.
LEKCJA 4 Gry dynamiczne z pełną (kompletną) i doskonałą informacją Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności. Czy w dowolnej grze dynamicznej lepiej być graczem,
Bardziej szczegółowoSkowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością. 04.01.2012r.
mgr inż. Anna Skowrońska-Szmer Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością 04.01.2012r. 1. Cel prezentacji 2. Biznesplan podstawowe pojęcia 3. Teoria gier w
Bardziej szczegółowoTEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.
TEORIA GIER W NAUKACH SPOŁECZNYCH Równowagi Nasha. Rozwiązania niekooperacyjne. Przypomnienie Gra o sumie zerowej Kryterium dominacji Kryterium wartości oczekiwanej Diagram przesunięć Równowaga Can a Round
Bardziej szczegółowoPodstawy Sztucznej Inteligencji (PSZT)
Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Przeszukiwanie Przeszukiwanie przestrzeni stanów Motywacja Rozwiązywanie problemów: poszukiwanie sekwencji operacji prowadzącej do celu poszukiwanie
Bardziej szczegółowoPropedeutyka teorii gier
Propedeutyka teorii gier AUTORZY: KAROLINA STOLARCZYK, WIKTOR SZOPIŃSKI, KONRAD TOMASZEK, MATEUSZ ZAKRZEWSKI WYDZIAŁ MINI POLITECHNIKA WARSZAWSKA ROK AKADEMICKI 2016/2017, SEMESTR LETNI KRÓTKI KURS HISTORII
Bardziej szczegółowoGry w postaci normalnej
Gry w postaci normalnej Rozgrzewka Przykład 1. (Dylemat więźnia) Dwóch przestępców, którzy zorganizowali napad na bank, zostało tymczasowo aresztowanych i czeka ich rozprawa. Jeżeli obaj będa zeznawać
Bardziej szczegółowoPOŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI
POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI mgr inż. Karol Walędzik k.waledzik@mini.pw.edu.pl prof. dr hab. inż. Jacek
Bardziej szczegółowoWykład 7 i 8. Przeszukiwanie z adwersarzem. w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach
(4g) Wykład 7 i 8 w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach P. Kobylański Wprowadzenie do Sztucznej Inteligencji 177 / 226 (4g) gry optymalne decyzje w grach algorytm
Bardziej szczegółowoWstęp do programowania
Wstęp do programowania Złożoność obliczeniowa, poprawność programów Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk(Wydział Fizyki) WP w. XII Jesień 2013 1 / 20 Złożoność obliczeniowa Problem Ile czasu
Bardziej szczegółowo1. S³owo wstêpne Geologia gospodarcza g³ówne aspekty problematyki badawczej Zakres, treœæ i cel rozprawy...
Spis treœci Streszczenie... 11 Summary... 13 1. S³owo wstêpne... 15 1.1. Geologia gospodarcza g³ówne aspekty problematyki badawczej... 16 1.2. Zakres, treœæ i cel rozprawy... 17 2. Zarys teorii decyzji...
Bardziej szczegółowoGry o sumie niezerowej
Gry o sumie niezerowej Równowagi Nasha 2011-12-06 Zdzisław Dzedzej 1 Pytanie Czy profile równowagi Nasha są dobrym rozwiązaniem gry o dowolnej sumie? Zaleta: zawsze istnieją (w grach dwumacierzowych, a
Bardziej szczegółowo13. Teoriogrowe Modele Konkurencji Gospodarczej
13. Teoriogrowe Modele Konkurencji Gospodarczej Najpierw, rozważamy model monopolu. Zakładamy że monopol wybiera ile ma produkować w danym okresie. Jednostkowy koszt produkcji wynosi k. Cena wynikająca
Bardziej szczegółowo11. Gry Macierzowe - Strategie Czyste i Mieszane
11. Gry Macierzowe - Strategie Czyste i Mieszane W grze z doskonałą informacją, gracz nie powinien wybrać akcję w sposób losowy (o ile wypłaty z różnych decyzji nie są sobie równe). Z drugiej strony, gdy
Bardziej szczegółowoTeoria gier w ekonomii - opis przedmiotu
Teoria gier w ekonomii - opis przedmiotu Informacje ogólne Nazwa przedmiotu Teoria gier w ekonomii Kod przedmiotu 11.9-WZ-EkoP-TGE-S16 Wydział Kierunek Wydział Ekonomii i Zarządzania Ekonomia Profil ogólnoakademicki
Bardziej szczegółowoMODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN d.wojcik@nencki.gov.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/ Podręcznik Iwo Białynicki-Birula Iwona
Bardziej szczegółowoTEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ
TEORIA GIER W EKONOMII dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ Informacje Ogólne (dr Robert Kowalczyk) Wykład: Poniedziałek 16.15-.15.48 (sala A428) Ćwiczenia:
Bardziej szczegółowoMODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN Szkoła Wyższa Psychologii Społecznej d.wojcik@nencki.gov.pl dwojcik@swps.edu.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/
Bardziej szczegółowoStochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych
Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski Warszawa 10 listopada 2016 Proseminarium licencjackie
Bardziej szczegółowoAdam Meissner. SZTUCZNA INTELIGENCJA Gry dwuosobowe
Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej Adam Meissner Adam.Meissner@put.poznan.pl http://www.man.poznan.pl/~ameis SZTUCZNA INTELIGENCJA Gry dwuosobowe Literatura [1] Sterling
Bardziej szczegółowoAukcje groszowe. Podejście teoriogrowe
Aukcje groszowe Podejście teoriogrowe Plan działania Aukcje groszowe Budowa teorii Sprawdzenie teorii Bibliografia: B. Platt, J. Price, H. Tappen, Pay-to-Bid Auctions [online]. 9 lipca 2009 [dostęp 3.02.2011].
Bardziej szczegółowoModelowanie motywów łańcuchami Markowa wyższego rzędu
Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy
Bardziej szczegółowo2010 W. W. Norton & Company, Inc. Oligopol
2010 W. W. Norton & Company, Inc. Oligopol Oligopol Monopol jedna firma na rynku. Duopol dwie firmy na rynku. Oligopol kilka firm na rynku. W szczególności decyzje każdej firmy co do ceny lub ilości produktu
Bardziej szczegółowoRozwiązania gier o charakterze kooperacyjnym
13 października 2008 Część 1 Część 1: Kooperacja Kooperacja Postać normalna gry Definicja gry Grą w postaci normalnej nazywamy układ (S 1, S 2, W 1, W 2 ), gdzie S i zbiór strategii i-tego gracza (i =
Bardziej szczegółowoProgramowanie liniowe całkowitoliczbowe. Tadeusz Trzaskalik
Programowanie liniowe całkowitoliczbowe Tadeusz Trzaskalik .. Wprowadzenie Słowa kluczowe Rozwiązanie całkowitoliczbowe Założenie podzielności Warunki całkowitoliczbowości Czyste zadanie programowania
Bardziej szczegółowoAlgorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski
Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów Adam Żychowski Definicja problemu dwóch graczy: P 1 (minimalizator) oraz P 2 (maksymalizator) S 1, S 2 zbiory strategii graczy
Bardziej szczegółowoUniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3
LEKCJA 3 Wybór strategii mieszanej nie jest wyborem określonych decyzji, lecz pozornie sztuczną procedurą która wymaga losowych lub innych wyborów. Gracze mieszają nie dlatego że jest im obojętna strategia,
Bardziej szczegółowoDiagnozowanie sieci komputerowej na podstawie opinii diagnostycznych o poszczególnych komputerach sieci
Diagnozowanie sieci komputerowej na podstawie opinii diagnostycznych o poszczególnych komputerach sieci Diagnozowanie systemu, w tym przypadku, pojmowane jest jako metoda określania stanu niezawodnościowego
Bardziej szczegółowoTEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą
TEORIA GIER W NAUKACH SPOŁECZNYCH Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą Przypomnienie Gry w postaci macierzowej i ekstensywnej Gry o sumie zerowej i gry o sumie niezerowej Kryterium dominacji
Bardziej szczegółowoKurs z NetLogo - część 4.
Kurs z NetLogo - część 4. Mateusz Zawisza Zakład Wspomagania i Analizy Decyzji Instytut Ekonometrii Szkoła Główna Handlowa Seminarium Wieloagentowe Warszawa, 10.01.2011 Agenda spotkań z NetLogo 15. listopada
Bardziej szczegółowoData Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowoTeoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!
Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), 2-osobowe(np. szachy, warcaby, go, itp.), wieloosobowe(np. brydż, giełda, itp.); wygraną/przegraną:
Bardziej szczegółowoKolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w
Metoda Simpleks Jak wiadomo, problem PL z dowolną liczbą zmiennych można rozwiązać wyznaczając wszystkie wierzchołkowe punkty wielościanu wypukłego, a następnie porównując wartości funkcji celu w tych
Bardziej szczegółowoTEORIA GIER WPROWADZENIE. Czesław Mesjasz
TEORIA GIER WPROWADZENIE Czesław Mesjasz 2010 1 GENEZA TEORII GIER Próby budowy matematycznych modeli konfliktów i negocjacji podejmowane były już przez A. Cournota, F. Edgewortha i F. Zeuthena. Koncepcje
Bardziej szczegółowoModele optymalizacyjne wspomagania decyzji wytwórców na rynku energii elektrycznej
Modele optymalizacyjne wspomagania decyzji wytwórców na rynku energii elektrycznej mgr inż. Izabela Żółtowska Promotor: prof. dr hab. inż. Eugeniusz Toczyłowski Obrona rozprawy doktorskiej 5 grudnia 2006
Bardziej szczegółowoOGRAĆ BUKMACHERA. DLACZEGO JEST TO MOŻLIWE? KAMIL STUPAK SKN BUSINESS ANALYTICS SGH
OGRAĆ BUKMACHERA. DLACZEGO JEST TO MOŻLIWE? KAMIL STUPAK SKN BUSINESS ANALYTICS SGH PODSTAWOWE DEFINICJE KURS oferowana przez bukmachera stopa zwrotu z pojedynczego zakładu, w Europie wyrażana najczęściej
Bardziej szczegółowoTypy algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Typy algorytmów losowych ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Typy algorytmów losowych Las Vegas - zawsze daje prawidłowa odpowiedź (różny czas działania). Przykład: RandQuicksort ALP520
Bardziej szczegółowoMateriał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak
Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych Mikroekonomia w zadaniach Gry strategiczne mgr Piotr Urbaniak Teoria gier Dział matematyki zajmujący się badaniem optymalnego zachowania w
Bardziej szczegółowoTeoria gier. Wykład7,31III2010,str.1. Gry dzielimy
Wykład7,31III2010,str.1 Gry dzielimy Wykład7,31III2010,str.1 Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), Wykład7,31III2010,str.1 Gry
Bardziej szczegółowoAnaliza stanów gry na potrzeby UCT w DVRP
Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527 Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza
Bardziej szczegółowoPrzykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna
Przykład Postać ekstensywna Postać normalna Na poczatku gry dwaj gracze wkładaja do puli po 1$. Następnie, gracz 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony.
Bardziej szczegółowoAlgorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Bardziej szczegółowoWprowadzenie do teorii gier
Instytut Informatyki Uniwersytetu Śląskiego Wykład 1 1 Klasyfikacja gier 2 Gry macierzowe, macierz wypłat, strategie czyste i mieszane 3 Punkty równowagi w grach o sumie zerowej 4 Gry dwuosobowe oraz n-osobowe
Bardziej szczegółowoTeoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego
Instytut Informatyki Uniwersytetu Śląskiego Wykład 4 - Gry o sumie zero Gry o sumie zero Dwuosobowe gry o sumie zero (ogólniej: o sumie stałej) były pierwszym typem gier dla których podjęto próby ich rozwiązania.
Bardziej szczegółowoTeoria Gier. Piotr Kuszewski 2018L
Teoria Gier Piotr Kuszewski 2018L Tematyka wykładów plan akcji Wykład I John von Neumann Trochę historii Czym jest gra i strategia Użyteczność Jak wyeliminować niektóre strategie Wykład II John Nash Równowaga
Bardziej szczegółowoElementy teorii wyboru publicznego. Marek Oramus
Elementy teorii wyboru publicznego Marek Oramus Prowadzący Marek Oramus marek.oramus@uek.krakow.pl tel. 12 293 58-40 Konsultacje: Czwartki 10:00-11:00 + do ustalenia Rakowicka 16, pok. 22 Wprowadzenie
Bardziej szczegółowoUstalona a preferowana kolejność ruchów w grze pojedynczej
kolejność ruchów w grze pojedynczej Sylwester Laskowski Przeanalizowano dwuosobowe gry o sumie niezerowej pod kątem preferowanej dla graczy kolejności ruchów, ich związku z faktem istnienia lub nieistnienia
Bardziej szczegółowoStrategie kwantowe w teorii gier
Uniwersytet Jagielloński adam.wyrzykowski@uj.edu.pl 18 stycznia 2015 Plan prezentacji 1 Gra w odwracanie monety (PQ penny flip) 2 Wojna płci Definicje i pojęcia Równowagi Nasha w Wojnie płci 3 Kwantowanie
Bardziej szczegółowoTeoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego
Instytut Informatyki Uniwersytetu Śląskiego Wykład 2 - Gry o sumie zero Gry o sumie zero Dwuosobowe gry o sumie zero (ogólniej: o sumie stałej) były pierwszym typem gier dla których podjęto próby ich rozwiązania.
Bardziej szczegółowoGry kwantowe na łańcuchach spinowych
Gry kwantowe na łańcuchach spinowych Jarosław Miszczak we współpracy z Piotrem Gawronem i Zbigniewem Puchałą Instytut Informatyki Teoretycznej i Stosowanej PAN w Gliwicach J.A.M., Z. Puchała, P. Gawron
Bardziej szczegółowoTEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w
TEORIA GIER GRA DEFINICJA (VON NEUMANN, MORGENSTERN) Gra składa się z zestawu reguł określających możliwości wyboru postępowania jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w
Bardziej szczegółowoPODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM. cz. 6. dr BOŻENA STARUCH
PODSTAWY WSPOMAGANIA PODEJMOWANIA DECYZJI W ZARZĄDZANIU BEZPIECZEŃSTWEM cz. 6 dr BOŻENA STARUCH bostar@matman.uwm.edu.pl Optymalizacja wielokryterialna Optymalizacją wielokryterialną nazwiemy próbę znalezienia
Bardziej szczegółowoOPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie
Poznań, 1.10.2016 r. Dr Grzegorz Paluszak OPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie I. Informacje ogólne 1. Nazwa modułu : Teoria gier 2. Kod modułu : 1 TGw
Bardziej szczegółowoLista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie
Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Jarosław Kotowicz Instytut Matematyki Uniwersytet w
Bardziej szczegółowoModele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11
Modele DSGE Jerzy Mycielski Maj 2008 Jerzy Mycielski () Modele DSGE Maj 2008 1 / 11 Modele DSGE DSGE - Dynamiczne, stochastyczne modele równowagi ogólnej (Dynamic Stochastic General Equilibrium Model)
Bardziej szczegółowoLista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym
Lista 5 Zadania na zastosowanie nierównosci Markowa i Czebyszewa. Zadanie 1. Niech zmienna losowa X ma rozkład jednostajny na odcinku [0, 1]. Korzystając z nierówności Markowa oszacować od góry prawdopodobieństwo,
Bardziej szczegółowoStochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów
Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski Warszawa 14
Bardziej szczegółowoTemat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe
Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe Teorię gier można określić jako teorię podejmowania decyzji w szczególnych warunkach. Zajmuje się ona logiczną analizą sytuacji konfliktu
Bardziej szczegółowoMikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez
Bardziej szczegółowoKonkurencja i kooperacja w dwuosobowych grach strategicznych. Anna Lamek
Konkurencja i kooperacja w dwuosobowych grach strategicznych Anna Lamek Plan prezentacji Ujęcie kooperacji i konkurencji w teorii gier Nowe podejście CoCo value CoCo value dla gier bayesowskich Uzasadnienie
Bardziej szczegółowoMAGICIAN. czyli General Game Playing w praktyce. General Game Playing
MAGICIAN czyli General Game Playing w praktyce General Game Playing 1 General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej w ramach AAAI National Conference
Bardziej szczegółowoAlgorytmy mrówkowe w dynamicznych problemach transportowych
y w dynamicznych problemach transportowych prof. dr hab Jacek Mandziuk MiNI, PW 3 czerwca 2013 Cel pracy Zbadanie zachowania algorytmu go zwykłego oraz z zaimplementowanymi optymalizacjami dla problemów
Bardziej szczegółowoRozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych Piotr Modliński Wydział Geodezji i Kartografii PW 13 stycznia 2012 P. Modliński, GiK PW Rozw.
Bardziej szczegółowoTEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ
TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ Definicja gry o sumie zerowej Powiemy, że jest grą o
Bardziej szczegółowoRachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.
Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne. 6.2. Centralne Twierdzenie Graniczne Katarzyna Rybarczyk-Krzywdzińska semestr zimowy 2015/2016 Słabe prawo wielkich liczb przypomnienie Słabe
Bardziej szczegółowoDane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik:
Elementy teorii gier Dane są następujące reguły gry losowej: losujemy jedną kartę z pełnej talii (bez jokerów) i sprawdzamy wynik: wylosowanie karty w kolorze czerwonym (kier lub karo) oznacza wygraną
Bardziej szczegółowoJacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa
Jacek Skorupski pok. 251 tel. 234-7339 jsk@wt.pw.edu.pl http://skorupski.waw.pl/mmt prezentacje ogłoszenia konsultacje: poniedziałek 16 15-18, sobota zjazdowa 9 40-10 25 Udział w zajęciach Kontrola wyników
Bardziej szczegółowoGRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils
GRA Przykład 1) Zbiór graczy n = 2 myśliwych I= {1,,n} 2) Zbiór strategii S = {polować na jelenia, gonić zająca} S = {1,,m} 3) Wypłaty jeleń - zając - 10 utils 3 utils U i : S n R i=1,,n J Z J Z J 5 0
Bardziej szczegółowoRozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Bardziej szczegółowoPunkty równowagi w grach koordynacyjnych
Uniwersytet Śląski w Katowicach, Instytut Informatyki ul. Będzińska 39 41-200 Sosnowiec 9 grudnia 2014, Chorzów 1 Motywacja 2 3 4 5 6 Wnioski i dalsze badania Motywacja 1 są klasą gier, w których istnieje
Bardziej szczegółowoTeoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami
Teoria gier Teoria gier jest częścią teorii decyzji (czyli gałęzią matematyki). Teoria decyzji - decyzje mogą być podejmowane w warunkach niepewności, ale nie zależą od strategicznych działań innych Teoria
Bardziej szczegółowoLista zadań. Równowaga w strategiach czystych
Lista zadań Równowaga w strategiach czystych 1. Podaj wszystkie czyste równowagi Nasha. Podaj definicję Pareto optymalności i znajdź pary strategii, które są Pareto optymalne. U 2,3-2,7 D 6,-5 0,-1 (b)
Bardziej szczegółowoRównoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami
Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy
Bardziej szczegółowoSieć Hopfielda. Sieci rekurencyjne. Ewa Adamus. ZUT Wydział Informatyki Instytut Sztucznej Inteligencji i Metod Matematycznych.
Sieci rekurencyjne Ewa Adamus ZUT Wydział Informatyki Instytut Sztucznej Inteligencji i Metod Matematycznych 7 maja 2012 Jednowarstwowa sieć Hopfielda, z n neuronami Bipolarna funkcja przejścia W wariancie
Bardziej szczegółowoSTRATEGIA PRZYBLIŻONA. Inna propozycja: szukanie optymalnej strategii metodą iteracyjną.
STRATEGIA PRZYBLIŻONA Ogólna strategia rozwiązywania gier NxN może być trudna obliczeniowo. Np. sprawdzenie otrzymanej mieszanej strategii wyrównującej : czy wszystkie strategie przeciwnika dają te same
Bardziej szczegółowoTEORIA GIER HISTORIA TEORII GIER. Rok 1944: powszechnie uznana data narodzin teorii gier. Rok 1994: Nagroda Nobla z dziedziny ekonomii
TEORIA GIER HISTORIA TEORII GIER Rok 1944: powszechnie uznana data narodzin teorii gier Monografia: John von Neumann, Oskar Morgenstern Theory of Games and Economic Behavior (Teoria gier i postępowanie
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy oólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK
Bardziej szczegółowoAlgorytmy i Struktury Danych, 2. ćwiczenia
Algorytmy i Struktury Danych, 2. ćwiczenia 2015-10-09 Spis treści 1 Szybkie potęgowanie 1 2 Liczby Fibonacciego 2 3 Dowód, że n 1 porównań jest potrzebne do znajdowania minimum 2 4 Optymalny algorytm do
Bardziej szczegółowoWykład na Politechnice Krakowskiej w dniu 18 stycznia 2012 r. ZADAŃ I ALGORYTMÓW W OPTYMALIZACJI DYSKRETNEJ
Wykład na Politechnice Krakowskiej w dniu 18 stycznia 2012 r. ZŁOŻONOŚĆ OBLICZENIOWA ZADAŃ I ALGORYTMÓW W OPTYMALIZACJI DYSKRETNEJ dr hab. Krzysztof SZKATUŁA, prof. PAN Instytut Badań Systemowych PAN Uniwersytet
Bardziej szczegółowoStruktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott
Struktury danych i złożoność obliczeniowa Wykład 7 Prof. dr hab. inż. Jan Magott Problemy NP-zupełne Transformacją wielomianową problemu π 2 do problemu π 1 (π 2 π 1 ) jest funkcja f: D π2 D π1 spełniająca
Bardziej szczegółowoUniwersytet Warszawski Mikroekonomia zaawansowana Studia zaoczne dr Olga Kiuila LEKCJA 7
LEKCJA 7 ZDOLNOŚCI PRODUKCYJNE Inwestując w kapitał trwały zwiększamy pojemność produkcyjną (czyli maksymalną wielkość produkcji) i tym samym możemy próbować wpływać na decyzje konkurencyjnych firm. W
Bardziej szczegółowoTechnologie Informacyjne
POLITECHNIKA KRAKOWSKA - WIEiK - KATEDRA AUTOMATYKI Technologie Informacyjne www.pk.edu.pl/~zk/ti_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 3: Wprowadzenie do algorytmów i ich
Bardziej szczegółowodr inż. Cezary Wiśniewski Płock, 2006
dr inż. Cezary Wiśniewski Płock, 26 Gra z naturą polega na tym, że przeciwnikiem jest osoba, zjawisko naturalne, obiekt itp. nie zainteresowany wynikiem gry. Strategia, którą podejmie przeciwnik ma charakter
Bardziej szczegółowo