Security Games: zastosowanie UCT na tle dotychczasowych podejść do problemu

Podobne dokumenty
Porównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT

Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych

Zastosowanie metody UCT i drzewa strategii behawioralnej do aproksymacji stanu równowagowego Stackelberga w grach wielokrokowych

Tworzenie gier na urządzenia mobilne

Analiza stanów gry na potrzeby UCT w DVRP

Gry o sumie niezerowej

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 3

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Wprowadzenie do teorii gier

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Optymalizacja konstrukcji

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

10. Wstęp do Teorii Gier

Tworzenie gier na urządzenia mobilne

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

Poszukiwanie formy. 1) Dopuszczalne przemieszczenie pionowe dla kombinacji SGU Ciężar własny + L1 wynosi 40mm (1/500 rozpiętości)

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

Algorytmiczne Aspekty Teorii Gier Rozwiązania zadań

Algorytmy mrówkowe. H. Bednarz. Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Inteligentne systemy informatyczne

Wykład Ćwiczenia Laboratoriu m ,5 1,5 WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI CELE PRZEDMIOTU

Ustalona a preferowana kolejność ruchów w grze pojedynczej

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II

LEKCJA 4. Gry dynamiczne z pełną (kompletną) i doskonałą informacją. Grą dynamiczną jest każda gra w której gracze wykonują ruchy w pewnej kolejności.

Badania operacyjne egzamin

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

Metody przeszukiwania

TEORIA GIER W EKONOMII. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Punkty równowagi w grach koordynacyjnych

Elementy teorii gier. Badania operacyjne

Problem skoczka szachowego i inne cykle Hamiltona na szachownicy n x n

Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?

Gry w postaci normalnej

Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!

Propedeutyka teorii gier

Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Tworzenie gier na urządzenia mobilne

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Wyznaczanie strategii w grach

KAROLINA KUJAWA DIONIZY KNAPIK. Teaching Games for Understanding

Kolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w

Load balancing games

Problem komiwojażera ACO. Zagadnienie optymalizacyjne, polegające na znalezieniu minimalnego cyklu Hamiltona w pełnym grafie ważonym.

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Algorytmika Problemów Trudnych

Kształtowanie szybkości Starty w parach ze strzałem. U 14 U 16

Daria Sitkowska Katarzyna Urbaniak

Lista 1. Procesy o przyrostach niezależnych.

Teoria gier. Łukasz Balbus Anna Jaśkiewicz

Teoria gier. Strategie stabilne ewolucyjnie Zdzisław Dzedzej 1

Podejście memetyczne do problemu DCVRP - wstępne wyniki. Adam Żychowski

Algorytmy mrówkowe (optymalizacja kolonii mrówek, Ant Colony optimisation)

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

2010 W. W. Norton & Company, Inc. Oligopol

Schemat programowania dynamicznego (ang. dynamic programming)

LOGISTYKA ZAOPATRZENIA I PRODUKCJI ĆWICZENIA 13 ROZMIESZCZENIE STANOWISK (LAYOUT)

Zaawansowane algorytmy i struktury danych

Matematyka od zaraz zatrudnię

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Matematyka dyskretna

TEORIA GIER W NAUKACH SPOŁECZNYCH. Drzewka gry, indukcja wsteczna, informacja

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

Heurystyczne metody przeszukiwania

Przepisy Futbolu Ośmioosobowego Polska Liga Futbolu Amerykańskiego. sezon 2018

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV

Modele lokalizacyjne

Algorytmy ewolucyjne NAZEWNICTWO

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Konkurencja i kooperacja w dwuosobowych grach strategicznych. Anna Lamek

Problemy Decyzyjne Markowa

1. Opierał się wyłącznie na strategiach czystych, a, jak wiadomo, gra może mieć jedyne równowagi w strategiach mieszanych.

Elementy Modelowania Matematycznego

Programowanie celowe #1

Sztuczna Inteligencja i Systemy Doradcze

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

Schemat sprawdzianu. 25 maja 2010

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

1. Algorytmy przeszukiwania. Przeszukiwanie wszerz i w głąb.

Teoria gier. mgr Przemysław Juszczuk. Wykład 5 - Równowagi w grach n-osobowych. Instytut Informatyki Uniwersytetu Śląskiego

Teoria gier a ewolucja. Paweł Kliber (UEP)

Poziom przedmiotu: II stopnia. Liczba godzin/tydzień: 2W, 2L, 1C PRZEWODNIK PO PRZEDMIOCIE

Czym jest użyteczność?

11. Gry Macierzowe - Strategie Czyste i Mieszane

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

Ograniczona racjonalność w grach

Metody SI w grach komputerowych Gra Policjanci i złodziej (Algorytmy przeszukiwania grafów)

Zagadnienie transportowe

STRATEGIA PRZYBLIŻONA. Inna propozycja: szukanie optymalnej strategii metodą iteracyjną.

TEORIA GIER WPROWADZENIE. Czesław Mesjasz

Transkrypt:

Security Games: zastosowanie UCT na tle dotychczasowych podejść do problemu Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW 14 X 2014 Jan Karwowski (MiNI) UCT w SG 14 X 2014 1 / 26

1 Teoria gier 2 Istniejące rozwiązania 3 Zastosowanie UCT 4 Literatura Jan Karwowski (MiNI) UCT w SG 14 X 2014 2 / 26

Security Games Zastosowania Zabezpieczenie lotnisk przed zamachami Zabezpieczenie ruchomych celów Zabezpieczenie zasobów przed kradzieżą Model miejsca rozgrywki Zbiór miejsc, bez zadanych relacji przestrzennych Graf Przestrzeń ciągła Gracze Broniący Atakujący (jeden lub wielu) Jan Karwowski (MiNI) UCT w SG 14 X 2014 3 / 26

Pursuer-Evader Game Gracze Ścigany Ścigający cel: znalezienie się w tym samym miejscu i czasie co Ścigany Grają przeciw sobie Czas gry może nie być ściśle określony Może się rozgrywać na grafie (znalezienie się w tym samym wierzchołku) lub w przestrzeni ciągłej (znalezienie się bliżej niż ɛ w pewnej metryce) Jan Karwowski (MiNI) UCT w SG 14 X 2014 4 / 26

Pursuer-Evader Game Przykład (Example 3) Kobieta pływa w jeziorze w kształcie koła z szybkością v l. Mężczyzna, który chciałby przeszkodzić kobiecie, niestety nie umie pływać. Może on biegać dookoła jeziora z szybkością v m. Kobieta biega szybciej ob mężczyzny i jeśli wyjdzie z wody, ten nie ma szans jej dogonić. Kobieta chce w końcu opuścić jezioro i jednocześnie nie chce spotkać się z mężczyzną. Każde z nich wykonuje zmiany kierunku swojego ruchu, aby osiągnąć swój cel. T. Basar and G. J. Olsder. Dynamic Noncooperative Game Theory. Academic Press Inc., 1982 Jan Karwowski (MiNI) UCT w SG 14 X 2014 5 / 26

Gra macierzowa Dwóch graczy Dwie macierze A wypłaty pierwszego gracza, B drugiego Wiersze macierzy etykietowane są ruchem (sekwencją ruchów) pierwszego gracza Kolumny etykietowane ruchem (sekwencją) drugiego gracza Jeśli gra o sumie zerowej, to A = B Jan Karwowski (MiNI) UCT w SG 14 X 2014 6 / 26

Gra Stackelberga Wypłaty Gra nie ma sumy zerowej! Gracze Leader Follower Równowaga Stackelberga Follower zna taktykę leadera Follower gra w pełni racjonalnie, maksymalizując swoją wygraną Potrzeba rozwiązania Dyskretno-ciągłego problemu optymalizacji liniowej (MILP) Jan Karwowski (MiNI) UCT w SG 14 X 2014 7 / 26

Security Games Niewspółpracujący ze sobą gracze Bardzo często gra typu Pursuer-Evader Rozwiązania często bazują na modelu Stackelberga Celem jest znalezienie możliwie najlepszej strategii dla broniącego Niepełna informacja Jan Karwowski (MiNI) UCT w SG 14 X 2014 8 / 26

1 Teoria gier 2 Istniejące rozwiązania 3 Zastosowanie UCT 4 Literatura Jan Karwowski (MiNI) UCT w SG 14 X 2014 9 / 26

Wdrożone rozwiązania ARMOR Assistant for Randomized Monitoring over Routes planowanie rejonów patroli na lotnisku LAX (2007) [2] IRIS Inteligent Randomization in Scheduling rozmieszczanie tajnych agentów w rejsowych samolotach (2009) [2] PROTECT Port Resilience Operational/Tactical Enforcement to Combat Terrorism planowanie patroli US Coast Guard (2011) [4] Jan Karwowski (MiNI) UCT w SG 14 X 2014 10 / 26

Model ARMOR (LAX) Planowanie punktów kontrolnych na drogach dojazdowych do lotniska Planowanie patroli z psami na terenie terminali Gra Stackelberga Abstrakcyjna przestrzeń punktów, nie uwzględnia rozmieszczenia przestrzennego lotniska Arbitralnie dobrane wypłaty dla atakujących i broniących w zależności od rozkładu lotów w danej godzinie Modyfikacje problemu optymalizacyjnego Jan Karwowski (MiNI) UCT w SG 14 X 2014 11 / 26

Ograniczona racjonalność ruchów przeciwnika Problem W rzeczywistych warunkach bojowych atakujący są pod dużą presją psychiczną i ich zachowanie może nie być do końca racjonalne. Przeczy to założeniu Równowagi Stackelberga, że ruchy Followera są optymalne. Ponadto w rzeczywistości nie jest prawdziwe założenie, że Follower zna pełną strategię Broniącego. QR Quantal Response [3] wypłaty widziane przez przeciwnika są zaburzone o niewielki losowy składnik Systematyczne zaburzenia (wartości oczekiwanych) wypłat związane z ograniczeniami i zaburzeniami percepcji Systematyczne zaburzenia optymalizowanych funkcji Jan Karwowski (MiNI) UCT w SG 14 X 2014 12 / 26

1 Teoria gier 2 Istniejące rozwiązania 3 Zastosowanie UCT 4 Literatura Jan Karwowski (MiNI) UCT w SG 14 X 2014 13 / 26

Definicja gry I G = (V, E) graf skierowany, V zbiór, E V V T V cele S V, S T = wierzchołki startowe atakujących τ {1, 2,...} bieżący krok czasowy gry a A atakujący, zbiór atakujących u U jednostki, którymi dysponuje gracz broniący S zbiór wszystkich możliwych stanów gry R A : A T S Z + wypłata za skuteczny atak na cel P D : A T S Z kara dla broniącego, za nieskuteczną obronę celu R D : A V S Z + wypłata broniącego za złapanie atakującego P A : A V S Z kara atakującego za bycie złapanym Jan Karwowski (MiNI) UCT w SG 14 X 2014 14 / 26

Definicja gry II p : V N S [0, 1] prawdopodobieństwo, że atakujący zostanie złapany, jeśli na tym samym wierzchołku jest zadana liczba obrońców Czas Dyskretne jednostki czasu W każdym kroku czasowym jednostki atakujące i broniące mogą przejść jedną krawędź wychodzącą z wierzchołka i znaleźć się w jej drugim końcu Po dokonaniu jednoczesnych przesunięć atakujących i broniących następuje sprawdzenie czy atakujący i broniący znajdują się na tym samym wierzchołku i sprawdzenie, czy atakujący został złapany Jan Karwowski (MiNI) UCT w SG 14 X 2014 15 / 26

Definicja gry III Uwagi Wypłaty mogą się różnić w zależności od stanu gry Atakujący może mieć różną liczbę jednostek (ograniczoną lub nie) Do obrony celów potrzeba więcej jednostek niż ma do dyspozycji broniący Jan Karwowski (MiNI) UCT w SG 14 X 2014 16 / 26

Stan gry S S L D : U V położenia jednostek obrony D D : U V 0 cele przemieszczeń jednostek obrony L A : A {(i, v) i N v V } położenia jednostek atakujących (ich liczba na planszy może się zmieniać) D A : A {(i, v) i N v V } cele przemieszczeń atakujących Opcjonalnie: historia incydentów Informacje charakterystyczne dla danej gry, np. rozkład lotów Nie jest to gra o pełnej informacji. Każdy z graczy widzi jakąś funkcję stanu gry, która nie zawiera wszystkich elementów stanu, w szczególności bieżących pozycji przeciwnika. Jan Karwowski (MiNI) UCT w SG 14 X 2014 17 / 26

Zastosowanie UCT Nieskończona gra Koniec, gdy f (div, τ) będzie odpowiednio duże. div liczba odwiedzonych stanów w tej rozgrywce (różnorodność rozgrywki). Aktualnie: f (div, t) = 3 div + log t Wypłaty w różnych momentach Aktualizowanie wypłat w węźle według malejącej funkcji odległości czasowej od wypłaty Węzły etykietowane stanem gry widzianym przez broniącego Ruchami w grze są polecenia zmiany ustawienia jednostek Jan Karwowski (MiNI) UCT w SG 14 X 2014 18 / 26

Ruchy obrońcy I Wariant 1 Broniący może wykonywać następujące ruchy (dodatkowo jest ograniczenie na wykonalność, ruch przesunięcia można wykorzystać tylko gdy jest jednostka obrony, którą można w ten sposób przesunąć): Zleć przesunięcie jednostki z wierzchołka v i do v j, j i. Zakończ przesunięcia i czekaj na kolejny krok czasowy. W przypadku, gdy w punkcie jest więcej niż jeden patrol, przesuwany jest ten o niższym numerze porządkowym. Jan Karwowski (MiNI) UCT w SG 14 X 2014 19 / 26

Ruchy obrońcy II Wariant 2* Wariant podobny do Wariantu 1, z tym że przesunięcie definiowane jest dla jednostki o konkretnym numerze. Dostępne ruchy: Zleć przesunięcie jednostki u i do wierzhołka v j. Zakończ przesunięcia i czekaj na kolejny krok czasowy. Ruch przesunięcia jest dopuszczalny tylko gdy jednostka nie dostała rozkazu przesunięcia do tego punktu w tym kroku czasowym. Jan Karwowski (MiNI) UCT w SG 14 X 2014 20 / 26

Ruchy obrońcy III Wariant 3 Jest dostępna tylko jedna rodzina ruchów, wykonanie ruchu powoduje przesunięcie kroku czasowego. Ruch polega na zleceniu nowego oczekiwanego ustawienia jednostek obrony.. Za decyzję które jednostki będą przesuwane będzie odpowiedzialny prosty algorytm (przy założeniu, że jednostek obrony jest kilka, można założyć że jesteśmy w stanie dla tej wielkości rozwiązać problemy NP-trudne). Do rozważenia: Minimalizacja czasu kiedy ostatnia jednostka dotrze na miejsce Minimalizacja liczby przesuwanych jednostek Minimalizacja sumarycznego czasu przemieszczania się wszystkich Jan Karwowski (MiNI) UCT w SG 14 X 2014 21 / 26

Potrzeba istnienia przeciwnika UCT w fazie nauki musi rozegrać wiele gier z przeciwnikiem. Przeciwnik Zbieranie częstości pojawiania się obrońców w poszczególnych wierzchołkach Ograniczanie racjonalności Systematyczne Losowe Można użyć wielu przeciwników w jednej rozgrywce. Jan Karwowski (MiNI) UCT w SG 14 X 2014 22 / 26

Problemy Wiele ruchów w kroku czasowym: czy dopuścić zmianę celu jednostki (2)? Karanie za zbyt wiele ruchów w kroku? Jak i z czym porównywać wyniki? Jan Karwowski (MiNI) UCT w SG 14 X 2014 23 / 26

1 Teoria gier 2 Istniejące rozwiązania 3 Zastosowanie UCT 4 Literatura Jan Karwowski (MiNI) UCT w SG 14 X 2014 24 / 26

Literatura I [1] T. Basar and G. J. Olsder. Dynamic Noncooperative Game Theory. Academic Press Inc., 1982. [2] Manish Jain et al. Software assistants for randomized patrol planning for the lax airport police and the federal air marshal service. In: Interfaces 40.4 (2010), pp. 267 290. [3] Richard D. McKelvey and Thomas R. Palfrey. Quantal Response Equilibria for Normal Form Games. In: Games and Economic Behavior 10.1 (1995), pp. 6 38. issn: 0899-8256. doi: http://dx.doi.org/10.1006/game.1995.1023. url: http://www.sciencedirect.com/science/article/pii/ S0899825685710238. Jan Karwowski (MiNI) UCT w SG 14 X 2014 25 / 26

Literatura II [4] Eric Shieh et al. PROTECT: A deployed game theoretic system to protect the ports of the United States. In: Proceedings of the 11th International Conference on Autonomous Agents and Multiagent Systems-Volume 1. International Foundation for Autonomous Agents and Multiagent Systems. 2012, pp. 13 20. Jan Karwowski (MiNI) UCT w SG 14 X 2014 26 / 26