Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Podobne dokumenty
Wyznaczanie strategii w grach

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

Elementy teorii gier. Badania operacyjne

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Tworzenie gier na urządzenia mobilne

Badania operacyjne egzamin

MODELOWANIE RZECZYWISTOŚCI

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Teoria gier. dr Przemysław Juszczuk. Wykład 2 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego

11. Gry Macierzowe - Strategie Czyste i Mieszane

MODELOWANIE RZECZYWISTOŚCI

Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!

Algorytmy zrandomizowane

Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Sprzedaż online. Piotr Sankowski Uniwersytet Warszawski Warszawa p. 1/40

Gry o sumie niezerowej

TEORETYCZNE PODSTAWY INFORMATYKI

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

Typy algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

1 Macierze i wyznaczniki

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Grafy (3): drzewa. Wykłady z matematyki dyskretnej dla informatyków i teleinformatyków. UTP Bydgoszcz

Wyznaczniki. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 6. Wykład z algebry liniowej Warszawa, listopad 2013

TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w

Kompresja bezstratna. Entropia. Kod Huffmana

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Skowrońska-Szmer. Instytut Organizacji i Zarządzania Politechniki Wrocławskiej Zakład Zarządzania Jakością r.

Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?

Metody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II

Problem straŝaka w drzewach. Agnieszka Skorupka Matematyka Stosowana FTiMS

10. Wstęp do Teorii Gier

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne, gry konfliktowe 1

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Bisymulacja. Niezawodność systemów współbieżnych i obiektowych. Grzegorz Maj Grzegorz Maj Bisymulacja

Programowanie liniowe

ALGORYTMY I STRUKTURY DANYCH

Zaawansowane metody numeryczne

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

Matematyka dyskretna - 7.Drzewa

Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

TEORIA GIER W EKONOMII WYKŁAD 6: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE DOWOLNEJ

TEORIA GIER W NAUKACH SPOŁECZNYCH. Równowagi Nasha. Rozwiązania niekooperacyjne.

Gry w postaci normalnej

Algorytmy Równoległe i Rozproszone Część V - Model PRAM II

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Wykład 2. Drzewa zbalansowane AVL i 2-3-4

Materiał dydaktyczny dla nauczycieli przedmiotów ekonomicznych. Mikroekonomia. w zadaniach. Gry strategiczne. mgr Piotr Urbaniak

Daria Sitkowska Katarzyna Urbaniak

Poprawność semantyczna

EGZAMIN - Wersja A. ALGORYTMY I STRUKTURY DANYCH Lisek89 opracowanie kartki od Pani dr E. Koszelew

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Programowanie liniowe

) a j x j b; x j binarne (j N) całkowitoliczbowe; przyjmujemy (bez straty ogólności): c j > 0, 0 <a j b (j N), P n

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Analiza numeryczna Lista nr 3 (ćwiczenia) x x 2 n x.

Rachunek prawdopodobieństwa- wykład 2

Wstęp do programowania. Drzewa. Piotr Chrząstowski-Wachtel

Formy kwadratowe. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 14. wykład z algebry liniowej Warszawa, styczeń 2017

Algorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące.

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Schemat programowania dynamicznego (ang. dynamic programming)

Spacery losowe generowanie realizacji procesu losowego

Programowanie liniowe całkowitoliczbowe

Programowanie liniowe

Zadania do Rozdziału X

Teoria obliczeń i złożoność obliczeniowa

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Nierówność Krafta-McMillana, Kodowanie Huffmana

zadaniem programowania liniowego całkowitoliczbowego. nazywamy zadaniem programowania liniowego 0-1. Zatem, w

Optymalizacja decyzji

Programowanie liniowe metoda sympleks

Zagadnienie transportowe

Przepustowość kanału, odczytywanie wiadomości z kanału, poprawa wydajności kanału.

Algorytmy Równoległe i Rozproszone Część III - Układy kombinacyjne i P-zupełność

Podstawy Informatyki. Metody dostępu do danych

Wyk lad 4 Macierz odwrotna i twierdzenie Cramera

Programowanie liniowe całkowitoliczbowe. Tadeusz Trzaskalik

A. Kasperski, M. Kulej Badania Operacyjne- programowanie liniowe 1

Zastosowania wyznaczników

1 Wartości własne oraz wektory własne macierzy

Programowanie liniowe

Wstęp do metod numerycznych Eliminacja Gaussa Równania macierzowe. P. F. Góra

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Gry dwuosobowe o sumie zerowej i ich zastosowanie

5. Rozwiązywanie układów równań liniowych

Programowanie liniowe metoda sympleks

Procesy stochastyczne

Algebra liniowa z geometrią

PROGRAMOWANIE SIECIOWE. METODA ŚCIEŻKI KRYTYCZNEJ

Programowanie dynamiczne i algorytmy zachłanne

Elementy teorii informacji i kodowania

Algorytmiczna teoria grafów

Podstawy Informatyki. Wykład 6. Struktury danych

Transkrypt:

Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu. Udowodnienie oszacowań dolnych jest łatwiejsze dla algorytmów deterministycznych niż losowych, dlatego spróbujemy wyprowadzić zwiazek pomiędzy tymi wielkościami korzystajac z twierdzeń teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Gra w unikanie trójkata Dwaj gracze dodaja na zmianę krawędzie do pustego grafu. Przegrywa ten, kto pierwszy utworzy trójkat. ALP520 - Wykład z Algorytmów Probabilistycznych p.3

Gra w unikanie trójkata I 0 0 1 1 0 0 0 1 0 1 wygrana I gracza 0 przegrana I gracza ALP520 - Wykład z Algorytmów Probabilistycznych p.3

Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem ALP520 - Wykład z Algorytmów Probabilistycznych p.4

Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND ALP520 - Wykład z Algorytmów Probabilistycznych p.4

Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR ALP520 - Wykład z Algorytmów Probabilistycznych p.4

Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR liście otrzymuja etykiety 1 lub 0; 1 oznacza wygrana dla pierwszego gracza, 0 przegrana dla pierwszego gracza. ALP520 - Wykład z Algorytmów Probabilistycznych p.4

Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR liście otrzymuja etykiety 1 lub 0; 1 oznacza wygrana dla pierwszego gracza, 0 przegrana dla pierwszego gracza. ogólnie: dowolne wartości rzeczywiste, pierwszy gracz chce zmaksymalizować (MAX zamiast OR), a drugi zminimalizować (MIN zamiast AND) wartość gry ALP520 - Wykład z Algorytmów Probabilistycznych p.4

Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR liście otrzymuja etykiety 1 lub 0; 1 oznacza wygrana dla pierwszego gracza, 0 przegrana dla pierwszego gracza. ogólnie: dowolne wartości rzeczywiste, pierwszy gracz chce zmaksymalizować (MAX zamiast OR), a drugi zminimalizować (MIN zamiast AND) wartość gry jeśli danych jest k możliwości w każdym ruchu, to drzewo ma stopień k. ALP520 - Wykład z Algorytmów Probabilistycznych p.4

Przykład drzewa gry? AND OR AND OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.5

Przykład drzewa gry? AND OR AND OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 CEL: majac dane wartości dla liści oblicz drzewo gry, tzn. oblicz wartość etykiety dla korzenia. ALP520 - Wykład z Algorytmów Probabilistycznych p.5

Przykład drzewa gry 1 1 1 AND OR 1 0 1 1 AND 1 1 0 1 1 1 1 1 OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 CEL: majac dane wartości dla liści oblicz drzewo gry, tzn. oblicz wartość etykiety dla korzenia. ALP520 - Wykład z Algorytmów Probabilistycznych p.5

Przykład drzewa gry 1 1 1 AND OR 1 0 1 1 AND 1 1 0 1 1 1 1 1 OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 CEL: majac dane wartości dla liści oblicz drzewo gry, tzn. oblicz wartość etykiety dla korzenia. Inaczej: Oblicz wartość funkcji boolowskiej postaci (((x 1 x 2 ) (x 3 x 4 )) ((x 5 x 6 ) (x 7 x 8 ))) (((x 9 x 10 ) (x 11 x 12 )) ((x 13 x 14 ) (x 15 x 16 ))). ALP520 - Wykład z Algorytmów Probabilistycznych p.5

Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? ALP520 - Wykład z Algorytmów Probabilistycznych p.6

Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? Rozważmy drzewo T 2,k (drzewo binarne, każdy liść w odległości 2k od korzenia). ALP520 - Wykład z Algorytmów Probabilistycznych p.6

Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? Rozważmy drzewo T 2,k (drzewo binarne, każdy liść w odległości 2k od korzenia). Dowolny algorytm deterministyczny wymaga w najgorszym przypadku odczytania wszystkich 2 2k = 4 k liści. ALP520 - Wykład z Algorytmów Probabilistycznych p.6

Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? Rozważmy drzewo T 2,k (drzewo binarne, każdy liść w odległości 2k od korzenia). Dowolny algorytm deterministyczny wymaga w najgorszym przypadku odczytania wszystkich 2 2k = 4 k liści. Zadanie. Znajdź przykład ciagu wartości dla liści drzewa gry T 2,k, dla którego dowolny algorytm deterministyczny wymaga odczytania wszystkich 4 k liści w celu wyznaczenia wartości dla korzenia. ALP520 - Wykład z Algorytmów Probabilistycznych p.6

Losowo? Obserwacja. Rozważmy wierzchołek AND i jego dwa liście. Jeśli wartość dla tego wierzchołka będzie 0, to co najmniej jeden z jego potomków musi zawierać 0. W najgorszym przypadku dla alg. deterministycznego ( który przeglada liście w ustalonym porzadku) 0 może wystapić na drugim miejscu, co wymaga 2 kroków ( odczytania 2 liści). 0 AND 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7

Losowo? Jak przechytrzyć przeciwnika? 0 AND 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7

Losowo? Jak przechytrzyć przeciwnika? Przegladać te 2 liście w losowym porzadku (z pr. 2 1) 0 AND 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7

Losowo? Jak przechytrzyć przeciwnika? Przegladać te 2 liście w losowym porzadku (z pr. 2 1) Wartość oczekiwana liczby kroków dla ciagu 0 AND 1 0 : 2 1 1 + 1 2 2 = 3 2 < 2. 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7

Losowo? Jak przechytrzyć przeciwnika? Przegladać te 2 liście w losowym porzadku (z pr. 2 1) Wartość oczekiwana liczby kroków dla ciagu 0 AND 1 0 : 2 1 1 + 1 2 2 = 3 2 < 2. 1 0 Brak zysku dla ciagu 1 1, ale jeśli jakieś drzewo osiaga wartość 1 dla korzenia, to każdy wew. wierzchołek AND musi mieć obu potomków OR o wartościach 1, a wtedy zyskujemy. ALP520 - Wykład z Algorytmów Probabilistycznych p.7

Algorytm A obliczania drzewa gry 1. Rozpocznij od korzenia. 2. Wybierz jednego z jego potomków losowo ( z prawd. 1 2 ) i postępuj rekurencyjnie. 3. Jeśli poddrzewo wierzchołka AND zwraca 1, to przejdź do drugiego poddrzewa. 4. Jeśli poddrzewo wierzchołka AND zwraca 0, to zwróć 0 w tym wierzchołku. (Analogicznie dla OR.) ALP520 - Wykład z Algorytmów Probabilistycznych p.8

Algorytm A obliczania drzewa gry 1. Rozpocznij od korzenia. 2. Wybierz jednego z jego potomków losowo ( z prawd. 1 2 ) i postępuj rekurencyjnie. 3. Jeśli poddrzewo wierzchołka AND zwraca 1, to przejdź do drugiego poddrzewa. 4. Jeśli poddrzewo wierzchołka AND zwraca 0, to zwróć 0 w tym wierzchołku. (Analogicznie dla OR.) Twierdzenie. Dla dowolnego drzewa T 2,k wartość oczekiwana liczby kroków algorytmu losowego A jest równa co najwyżej 3 k. ALP520 - Wykład z Algorytmów Probabilistycznych p.8

Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k ALP520 - Wykład z Algorytmów Probabilistycznych p.9

Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k k = 1 zadanie na ćwiczenia ALP520 - Wykład z Algorytmów Probabilistycznych p.9

Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k k = 1 zadanie na ćwiczenia Założenie dla k 1 : EN k 1 3 k 1. ALP520 - Wykład z Algorytmów Probabilistycznych p.9

Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k k = 1 zadanie na ćwiczenia Założenie dla k 1 : EN k 1 3 k 1. Teza dla k : EN k 3 k. ALP520 - Wykład z Algorytmów Probabilistycznych p.9

Analiza algorytmu A - indukcja Teza dla k : EN k 3 k. T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.9

Indukcja -cd. Rozpatrzmy drzewo T, którego poddrzewami sa dwie kopie drzewa T 2,k 1 (potomkami korzenia T sa korzenie drzew T 2,k 1 ). T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.10

Indukcja -cd. Rozpatrzmy drzewo T, którego poddrzewami sa dwie kopie drzewa T 2,k 1 (potomkami korzenia T sa korzenie drzew T 2,k 1 ). Niech k(t) oznacza wartość obliczona w korzeniu drzewa T. Możliwe sa następujace przypadki: T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.10

Indukcja -cd. Rozpatrzmy drzewo T, którego poddrzewami sa dwie kopie drzewa T 2,k 1 (potomkami korzenia T sa korzenie drzew T 2,k 1 ). Niech k(t) oznacza wartość obliczona w korzeniu drzewa T. Możliwe sa następujace przypadki: k(t) = 1 k(t) = 0 T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.10

Indukcja -cd. ALP520 - Wykład z Algorytmów Probabilistycznych p.11

Indukcja -cd. k(t) = 1: co najmniej jedno z poddrzew k(t 2,k 1 ) = 1 i wartość oczekiwana liczby kroków jest równa co najwyżej 1 2 3k 1 + 2 12 3k 1 = 3 2 3k 1 (dla 01 i 10) lub 3 k 1 (dla 11). ALP520 - Wykład z Algorytmów Probabilistycznych p.11

Indukcja -cd. k(t) = 1: co najmniej jedno z poddrzew k(t 2,k 1 ) = 1 i wartość oczekiwana liczby kroków jest równa co najwyżej 1 2 3k 1 + 2 12 3k 1 = 3 2 3k 1 (dla 01 i 10) lub 3 k 1 (dla 11). k(t) = 0: dla obu poddrzew k(t 2,k 1 ) = 0, i wartość oczekiwana wynosi co najwyżej 2 3 k 1. ALP520 - Wykład z Algorytmów Probabilistycznych p.11

Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. ALP520 - Wykład z Algorytmów Probabilistycznych p.12

Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. ALP520 - Wykład z Algorytmów Probabilistycznych p.12

Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. k(t 2,k ) = 0: w co najmniej jednym poddrzewie musiało wystapić 0. ALP520 - Wykład z Algorytmów Probabilistycznych p.12

Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. k(t 2,k ) = 0: w co najmniej jednym poddrzewie musiało wystapić 0. Niech p będzie prawdopodobieństwem wyboru 0. Wtedy EN k 2p 3 k 1 + (1 p)( 3 2 3k 1 + 2 3 k 1 ) 3 k, ponieważ p 1 2. ALP520 - Wykład z Algorytmów Probabilistycznych p.12

Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. k(t 2,k ) = 0: w co najmniej jednym poddrzewie musiało wystapić 0. Niech p będzie prawdopodobieństwem wyboru 0. Wtedy EN k 2p 3 k 1 + (1 p)( 3 2 3k 1 + 2 3 k 1 ) 3 k, ponieważ p 1 2. Wniosek. Powyższy algorytm losowy ma średni czas ograniczony przez n log 4 3 n 0.793. ALP520 - Wykład z Algorytmów Probabilistycznych p.12

Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.13

Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). ALP520 - Wykład z Algorytmów Probabilistycznych p.13

Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). Nożyczki Papier Kamień Nożyczki 0 1-1 Papier -1 0 1 Kamień 1-1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.13

Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). Nożyczki Papier Kamień Nożyczki 0 1-1 Papier -1 0 1 Kamień 1-1 0 M macierz wypłat M ij wartość, jaka gracz K płaci graczowi W, jeśli W wybierze strategię i, a K strategię j. ALP520 - Wykład z Algorytmów Probabilistycznych p.13

Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). Nożyczki Papier Kamień Nożyczki 0 1-1 Papier -1 0 1 Kamień 1-1 0 M macierz wypłat M ij wartość, jaka gracz K płaci graczowi W, jeśli W wybierze strategię i, a K strategię j. Jest to przykład gry dwuosobowej o sumie zerowej ( suma wypłat =0). Gracz W chce zmaksymalizować wygrana, a gracz K chce ja zminimalizować. ALP520 - Wykład z Algorytmów Probabilistycznych p.13

Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. ALP520 - Wykład z Algorytmów Probabilistycznych p.14

Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. jeśli W wybierze optymalna strategię, to jego wygrana wynosi co najmniej U W = max i min j M ij. ALP520 - Wykład z Algorytmów Probabilistycznych p.14

Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. jeśli W wybierze optymalna strategię, to jego wygrana wynosi co najmniej U W = max i min j M ij. Analogicznie dla K, wygrana wynosi co najwyżej U K = min j max i M ij. ALP520 - Wykład z Algorytmów Probabilistycznych p.14

Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. jeśli W wybierze optymalna strategię, to jego wygrana wynosi co najmniej U W = max i min j M ij. Analogicznie dla K, wygrana wynosi co najwyżej U K = min j max i M ij. U W = 1, U K = 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.14

Wygrane i strategie Fakt. max i min j M ij min j max i M ij ALP520 - Wykład z Algorytmów Probabilistycznych p.15

Wygrane i strategie Fakt. max i min j M ij min j max i M ij Dowód. Niech i 0 : max i min j M ij = min j M i0 j min j max i M ij, ponieważ M i0 j max i M ij. ALP520 - Wykład z Algorytmów Probabilistycznych p.15

Wygrane i strategie Fakt. max i min j M ij min j max i M ij Dowód. Niech i 0 : max i min j M ij = min j M i0 j min j max i M ij, ponieważ M i0 j max i M ij. Jeśli U W = U K = U, to gra ma punkt siodłowy (rozwiazanie). Odpowiadajace mu strategie graczy nazywamy strategiami czystymi (polegajacymi na wyborze konkretnego wiersza lub, odpowiednio, kolumny). ALP520 - Wykład z Algorytmów Probabilistycznych p.15

Wygrane i strategie Fakt. max i min j M ij min j max i M ij Dowód. Niech i 0 : max i min j M ij = min j M i0 j min j max i M ij, ponieważ M i0 j max i M ij. Jeśli U W = U K = U, to gra ma punkt siodłowy (rozwiazanie). Odpowiadajace mu strategie graczy nazywamy strategiami czystymi (polegajacymi na wyborze konkretnego wiersza lub, odpowiednio, kolumny). ALP520 - Wykład z Algorytmów Probabilistycznych p.15

Inny przykład Nożyczki Papier Kamień Nożyczki 0 1 2 Papier -1 0 1 Kamień -2-1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.16

Inny przykład Nożyczki Papier Kamień Nożyczki 0 1 2 Papier -1 0 1 Kamień -2-1 0 Oblicz U W i U K. ALP520 - Wykład z Algorytmów Probabilistycznych p.16

Strategie losowe (mieszane). ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Gracz W wybiera rozkład prawdopodobieństwa (schemat losowy) p = (p 1,p 2,...,p n ), gdzie p i to prawdopodobieństwo wyboru strategii (wiersza) i. ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Gracz W wybiera rozkład prawdopodobieństwa (schemat losowy) p = (p 1,p 2,...,p n ), gdzie p i to prawdopodobieństwo wyboru strategii (wiersza) i. Gracz K wybiera rozkład prawdopodobieństwa (schemat losowy) q = (q 1,q 2,...,q n ), gdzie q i to prawdopodobieństwo wyboru strategii (kolumny) i. ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Gracz W wybiera rozkład prawdopodobieństwa (schemat losowy) p = (p 1,p 2,...,p n ), gdzie p i to prawdopodobieństwo wyboru strategii (wiersza) i. Gracz K wybiera rozkład prawdopodobieństwa (schemat losowy) q = (q 1,q 2,...,q n ), gdzie q i to prawdopodobieństwo wyboru strategii (kolumny) i. Wygrana jest zmienna losowa o wartości oczekiwanej: E[ wygranej ] = p T Mq = n n p i M ij q j. i=1 j=1 ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o zerowej sumie i macierzy wypłat M V W = max p min q p T Mq = min q max p p T Mq = V K. ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o zerowej sumie i macierzy wypłat M V W = max p min q p T Mq = min q max p p T Mq = V K. Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń o separacji z geometrii analitycznej. Jest to też szczególny przypadek twierdzenia dualnego w zagadnieniu programowania liniowego. ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o zerowej sumie i macierzy wypłat M V W = max p min q p T Mq = min q max p p T Mq = V K. Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń o separacji z geometrii analitycznej. Jest to też szczególny przypadek twierdzenia dualnego w zagadnieniu programowania liniowego. Wniosek. Gra ma punkt siodłowy (istnieja optymalne strategie mieszane lub czyste dla obu graczy). ALP520 - Wykład z Algorytmów Probabilistycznych p.17

Twierdzenie Loomisa ALP520 - Wykład z Algorytmów Probabilistycznych p.18

Twierdzenie Loomisa Jeśli p jest ustalone, to p T Mq jest funkcja liniowa zależna od q, która przyjmuje wartość minimalna dla q j = 1, gdzie j odpowiada najmniejszemu współczynnikowi (analogicznie dla q). Wtedy prawdziwa jest uproszczona wersja powyższego twierdzenia: ALP520 - Wykład z Algorytmów Probabilistycznych p.18

Twierdzenie Loomisa Jeśli p jest ustalone, to p T Mq jest funkcja liniowa zależna od q, która przyjmuje wartość minimalna dla q j = 1, gdzie j odpowiada najmniejszemu współczynnikowi (analogicznie dla q). Wtedy prawdziwa jest uproszczona wersja powyższego twierdzenia: Twierdzenie (Loomisa). W dowolnej grze dwuosobowej o zerowej sumie i macierzy M max p min j p T Me j = min q max i e T i Mq, gdzie e j jest wektorem jednostkowym z 1 na pozycji j. ALP520 - Wykład z Algorytmów Probabilistycznych p.18

Metoda Yao ALP520 - Wykład z Algorytmów Probabilistycznych p.19

Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.19

Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. Gracz K - projektant algorytmów Las Vegas. Gracz W - malkontent wybierajacy najgorszy zbiór danych wejściowych. Wypłata K dla W miara złożoności algorytmu (czas działania). K chce zminimalizować czas działania, W daży do zmaksymalizowania wypłaty. ALP520 - Wykład z Algorytmów Probabilistycznych p.19

Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. Gracz K - projektant algorytmów Las Vegas. Gracz W - malkontent wybierajacy najgorszy zbiór danych wejściowych. Wypłata K dla W miara złożoności algorytmu (czas działania). K chce zminimalizować czas działania, W daży do zmaksymalizowania wypłaty. Twierdzenia von Neumanna i Loomisa w języku algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.19

Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. Gracz K - projektant algorytmów Las Vegas. Gracz W - malkontent wybierajacy najgorszy zbiór danych wejściowych. Wypłata K dla W miara złożoności algorytmu (czas działania). K chce zminimalizować czas działania, W daży do zmaksymalizowania wypłaty. Twierdzenia von Neumanna i Loomisa w języku algorytmów losowych. Π problem o sk. zb. danych wejściowych I (ustalonego rozmiaru) i sk. zb. algorytmów deterministycznych A. ALP520 - Wykład z Algorytmów Probabilistycznych p.19

Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na ALP520 - Wykład z Algorytmów Probabilistycznych p.20

Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. ALP520 - Wykład z Algorytmów Probabilistycznych p.20

Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. Wniosek (z tw. vn. i L.). max p min q E[C(I p, A q )] = min q max p E[C(I p, A q )] C DIST = max p min q min E[C(I p, A)] = A A max I I E[C(I, A q)] = C RAND. ALP520 - Wykład z Algorytmów Probabilistycznych p.20

Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. Wniosek (z tw. vn. i L.). max p min q E[C(I p, A q )] = min q max p E[C(I p, A q )] C DIST = max p min q C DIST złożoność średniego przypadku C RAND złożoność losowa min E[C(I p, A)] = A A max I I E[C(I, A q)] = C RAND. ALP520 - Wykład z Algorytmów Probabilistycznych p.20

Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. Wniosek (z tw. vn. i L.). max p min q E[C(I p, A q )] = min q max p E[C(I p, A q )] C DIST = max p min q C DIST złożoność średniego przypadku C RAND złożoność losowa min E[C(I p, A)] = A A max I I E[C(I, A q)] = C RAND. ALP520 - Wykład z Algorytmów Probabilistycznych p.20

Zasada minimaksowa Yao Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A, min E[C(I p,a)] max E[C(I,A q)]. A A I I ALP520 - Wykład z Algorytmów Probabilistycznych p.21

Zasada minimaksowa Yao Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A, Interpretacja: min E[C(I p,a)] max E[C(I,A q)]. A A I I Średni czas najlepszego algorytmu deterministycznego (najszybszego w odniesieniu do danego rozkładu p na zbiorze danych wejściowych I) jest ograniczeniem dolnym na oczekiwany czas działania najlepszego algorytmu losowego dla ustalonego problemu. ALP520 - Wykład z Algorytmów Probabilistycznych p.21

Zastosowanie zasady minimaksowej Yao Cel: udowodnić ograniczenie dolne na C RAND problemu Π ALP520 - Wykład z Algorytmów Probabilistycznych p.22

Zastosowanie zasady minimaksowej Yao Cel: udowodnić ograniczenie dolne na C RAND problemu Π wybrać dowolny rozkład prawdopodobieństwa p na zbiorze danych wejściowych ALP520 - Wykład z Algorytmów Probabilistycznych p.22

Zastosowanie zasady minimaksowej Yao Cel: udowodnić ograniczenie dolne na C RAND problemu Π wybrać dowolny rozkład prawdopodobieństwa p na zbiorze danych wejściowych udowodnić ograniczenie dolne na średni czas działania każdego algorytmu deterministycznego dla tego problemu i rozkładu p ALP520 - Wykład z Algorytmów Probabilistycznych p.22