Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu. Udowodnienie oszacowań dolnych jest łatwiejsze dla algorytmów deterministycznych niż losowych, dlatego spróbujemy wyprowadzić zwiazek pomiędzy tymi wielkościami korzystajac z twierdzeń teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Gra w unikanie trójkata Dwaj gracze dodaja na zmianę krawędzie do pustego grafu. Przegrywa ten, kto pierwszy utworzy trójkat. ALP520 - Wykład z Algorytmów Probabilistycznych p.3
Gra w unikanie trójkata I 0 0 1 1 0 0 0 1 0 1 wygrana I gracza 0 przegrana I gracza ALP520 - Wykład z Algorytmów Probabilistycznych p.3
Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem ALP520 - Wykład z Algorytmów Probabilistycznych p.4
Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND ALP520 - Wykład z Algorytmów Probabilistycznych p.4
Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR ALP520 - Wykład z Algorytmów Probabilistycznych p.4
Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR liście otrzymuja etykiety 1 lub 0; 1 oznacza wygrana dla pierwszego gracza, 0 przegrana dla pierwszego gracza. ALP520 - Wykład z Algorytmów Probabilistycznych p.4
Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR liście otrzymuja etykiety 1 lub 0; 1 oznacza wygrana dla pierwszego gracza, 0 przegrana dla pierwszego gracza. ogólnie: dowolne wartości rzeczywiste, pierwszy gracz chce zmaksymalizować (MAX zamiast OR), a drugi zminimalizować (MIN zamiast AND) wartość gry ALP520 - Wykład z Algorytmów Probabilistycznych p.4
Definicja drzewa gry pełne drzewo binarne z ustalonym korzeniem wierzchołki wewnętrzne drzewa w odległości parzystej od korzenia otrzymuja etykietę AND wierzchołki wewnętrzne drzewa w odległości nieparzystej od korzenia otrzymuja etykietę OR liście otrzymuja etykiety 1 lub 0; 1 oznacza wygrana dla pierwszego gracza, 0 przegrana dla pierwszego gracza. ogólnie: dowolne wartości rzeczywiste, pierwszy gracz chce zmaksymalizować (MAX zamiast OR), a drugi zminimalizować (MIN zamiast AND) wartość gry jeśli danych jest k możliwości w każdym ruchu, to drzewo ma stopień k. ALP520 - Wykład z Algorytmów Probabilistycznych p.4
Przykład drzewa gry? AND OR AND OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.5
Przykład drzewa gry? AND OR AND OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 CEL: majac dane wartości dla liści oblicz drzewo gry, tzn. oblicz wartość etykiety dla korzenia. ALP520 - Wykład z Algorytmów Probabilistycznych p.5
Przykład drzewa gry 1 1 1 AND OR 1 0 1 1 AND 1 1 0 1 1 1 1 1 OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 CEL: majac dane wartości dla liści oblicz drzewo gry, tzn. oblicz wartość etykiety dla korzenia. ALP520 - Wykład z Algorytmów Probabilistycznych p.5
Przykład drzewa gry 1 1 1 AND OR 1 0 1 1 AND 1 1 0 1 1 1 1 1 OR 0 1 1 0 0 0 1 1 0 1 0 1 1 1 0 1 CEL: majac dane wartości dla liści oblicz drzewo gry, tzn. oblicz wartość etykiety dla korzenia. Inaczej: Oblicz wartość funkcji boolowskiej postaci (((x 1 x 2 ) (x 3 x 4 )) ((x 5 x 6 ) (x 7 x 8 ))) (((x 9 x 10 ) (x 11 x 12 )) ((x 13 x 14 ) (x 15 x 16 ))). ALP520 - Wykład z Algorytmów Probabilistycznych p.5
Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? ALP520 - Wykład z Algorytmów Probabilistycznych p.6
Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? Rozważmy drzewo T 2,k (drzewo binarne, każdy liść w odległości 2k od korzenia). ALP520 - Wykład z Algorytmów Probabilistycznych p.6
Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? Rozważmy drzewo T 2,k (drzewo binarne, każdy liść w odległości 2k od korzenia). Dowolny algorytm deterministyczny wymaga w najgorszym przypadku odczytania wszystkich 2 2k = 4 k liści. ALP520 - Wykład z Algorytmów Probabilistycznych p.6
Analiza drzewa gry Pytanie: Jaka jest maksymalna liczba odczytanych liści niezbędna do obliczenia drzewa gry (wyznaczenia wartości dla korzenia)? Rozważmy drzewo T 2,k (drzewo binarne, każdy liść w odległości 2k od korzenia). Dowolny algorytm deterministyczny wymaga w najgorszym przypadku odczytania wszystkich 2 2k = 4 k liści. Zadanie. Znajdź przykład ciagu wartości dla liści drzewa gry T 2,k, dla którego dowolny algorytm deterministyczny wymaga odczytania wszystkich 4 k liści w celu wyznaczenia wartości dla korzenia. ALP520 - Wykład z Algorytmów Probabilistycznych p.6
Losowo? Obserwacja. Rozważmy wierzchołek AND i jego dwa liście. Jeśli wartość dla tego wierzchołka będzie 0, to co najmniej jeden z jego potomków musi zawierać 0. W najgorszym przypadku dla alg. deterministycznego ( który przeglada liście w ustalonym porzadku) 0 może wystapić na drugim miejscu, co wymaga 2 kroków ( odczytania 2 liści). 0 AND 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7
Losowo? Jak przechytrzyć przeciwnika? 0 AND 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7
Losowo? Jak przechytrzyć przeciwnika? Przegladać te 2 liście w losowym porzadku (z pr. 2 1) 0 AND 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7
Losowo? Jak przechytrzyć przeciwnika? Przegladać te 2 liście w losowym porzadku (z pr. 2 1) Wartość oczekiwana liczby kroków dla ciagu 0 AND 1 0 : 2 1 1 + 1 2 2 = 3 2 < 2. 1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.7
Losowo? Jak przechytrzyć przeciwnika? Przegladać te 2 liście w losowym porzadku (z pr. 2 1) Wartość oczekiwana liczby kroków dla ciagu 0 AND 1 0 : 2 1 1 + 1 2 2 = 3 2 < 2. 1 0 Brak zysku dla ciagu 1 1, ale jeśli jakieś drzewo osiaga wartość 1 dla korzenia, to każdy wew. wierzchołek AND musi mieć obu potomków OR o wartościach 1, a wtedy zyskujemy. ALP520 - Wykład z Algorytmów Probabilistycznych p.7
Algorytm A obliczania drzewa gry 1. Rozpocznij od korzenia. 2. Wybierz jednego z jego potomków losowo ( z prawd. 1 2 ) i postępuj rekurencyjnie. 3. Jeśli poddrzewo wierzchołka AND zwraca 1, to przejdź do drugiego poddrzewa. 4. Jeśli poddrzewo wierzchołka AND zwraca 0, to zwróć 0 w tym wierzchołku. (Analogicznie dla OR.) ALP520 - Wykład z Algorytmów Probabilistycznych p.8
Algorytm A obliczania drzewa gry 1. Rozpocznij od korzenia. 2. Wybierz jednego z jego potomków losowo ( z prawd. 1 2 ) i postępuj rekurencyjnie. 3. Jeśli poddrzewo wierzchołka AND zwraca 1, to przejdź do drugiego poddrzewa. 4. Jeśli poddrzewo wierzchołka AND zwraca 0, to zwróć 0 w tym wierzchołku. (Analogicznie dla OR.) Twierdzenie. Dla dowolnego drzewa T 2,k wartość oczekiwana liczby kroków algorytmu losowego A jest równa co najwyżej 3 k. ALP520 - Wykład z Algorytmów Probabilistycznych p.8
Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k ALP520 - Wykład z Algorytmów Probabilistycznych p.9
Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k k = 1 zadanie na ćwiczenia ALP520 - Wykład z Algorytmów Probabilistycznych p.9
Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k k = 1 zadanie na ćwiczenia Założenie dla k 1 : EN k 1 3 k 1. ALP520 - Wykład z Algorytmów Probabilistycznych p.9
Analiza algorytmu A - indukcja Niech N k -liczba kroków algorytmu (liczba odczytanych liści) dla drzewa T 2,k k = 1 zadanie na ćwiczenia Założenie dla k 1 : EN k 1 3 k 1. Teza dla k : EN k 3 k. ALP520 - Wykład z Algorytmów Probabilistycznych p.9
Analiza algorytmu A - indukcja Teza dla k : EN k 3 k. T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.9
Indukcja -cd. Rozpatrzmy drzewo T, którego poddrzewami sa dwie kopie drzewa T 2,k 1 (potomkami korzenia T sa korzenie drzew T 2,k 1 ). T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.10
Indukcja -cd. Rozpatrzmy drzewo T, którego poddrzewami sa dwie kopie drzewa T 2,k 1 (potomkami korzenia T sa korzenie drzew T 2,k 1 ). Niech k(t) oznacza wartość obliczona w korzeniu drzewa T. Możliwe sa następujace przypadki: T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.10
Indukcja -cd. Rozpatrzmy drzewo T, którego poddrzewami sa dwie kopie drzewa T 2,k 1 (potomkami korzenia T sa korzenie drzew T 2,k 1 ). Niech k(t) oznacza wartość obliczona w korzeniu drzewa T. Możliwe sa następujace przypadki: k(t) = 1 k(t) = 0 T T 2,k 1 T 2,k 1 T 2,k 1 T 2,k 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.10
Indukcja -cd. ALP520 - Wykład z Algorytmów Probabilistycznych p.11
Indukcja -cd. k(t) = 1: co najmniej jedno z poddrzew k(t 2,k 1 ) = 1 i wartość oczekiwana liczby kroków jest równa co najwyżej 1 2 3k 1 + 2 12 3k 1 = 3 2 3k 1 (dla 01 i 10) lub 3 k 1 (dla 11). ALP520 - Wykład z Algorytmów Probabilistycznych p.11
Indukcja -cd. k(t) = 1: co najmniej jedno z poddrzew k(t 2,k 1 ) = 1 i wartość oczekiwana liczby kroków jest równa co najwyżej 1 2 3k 1 + 2 12 3k 1 = 3 2 3k 1 (dla 01 i 10) lub 3 k 1 (dla 11). k(t) = 0: dla obu poddrzew k(t 2,k 1 ) = 0, i wartość oczekiwana wynosi co najwyżej 2 3 k 1. ALP520 - Wykład z Algorytmów Probabilistycznych p.11
Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. ALP520 - Wykład z Algorytmów Probabilistycznych p.12
Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. ALP520 - Wykład z Algorytmów Probabilistycznych p.12
Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. k(t 2,k ) = 0: w co najmniej jednym poddrzewie musiało wystapić 0. ALP520 - Wykład z Algorytmów Probabilistycznych p.12
Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. k(t 2,k ) = 0: w co najmniej jednym poddrzewie musiało wystapić 0. Niech p będzie prawdopodobieństwem wyboru 0. Wtedy EN k 2p 3 k 1 + (1 p)( 3 2 3k 1 + 2 3 k 1 ) 3 k, ponieważ p 1 2. ALP520 - Wykład z Algorytmów Probabilistycznych p.12
Indukcja -cd. Teraz jesteśmy gotowi do analizy drzewa T 2,k. k(t 2,k ) = 1: dla obu poddrzew k(t) = 1 i EN k 2 32 3k 1 = 3 k. k(t 2,k ) = 0: w co najmniej jednym poddrzewie musiało wystapić 0. Niech p będzie prawdopodobieństwem wyboru 0. Wtedy EN k 2p 3 k 1 + (1 p)( 3 2 3k 1 + 2 3 k 1 ) 3 k, ponieważ p 1 2. Wniosek. Powyższy algorytm losowy ma średni czas ograniczony przez n log 4 3 n 0.793. ALP520 - Wykład z Algorytmów Probabilistycznych p.12
Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.13
Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). ALP520 - Wykład z Algorytmów Probabilistycznych p.13
Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). Nożyczki Papier Kamień Nożyczki 0 1-1 Papier -1 0 1 Kamień 1-1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.13
Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). Nożyczki Papier Kamień Nożyczki 0 1-1 Papier -1 0 1 Kamień 1-1 0 M macierz wypłat M ij wartość, jaka gracz K płaci graczowi W, jeśli W wybierze strategię i, a K strategię j. ALP520 - Wykład z Algorytmów Probabilistycznych p.13
Teoria gier jeszcze raz ale inaczej Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych. Gra w kamień, papier i nożyczki. Gracze: K (grajacy kolumnami) i W (grajacy wierszami). Nożyczki Papier Kamień Nożyczki 0 1-1 Papier -1 0 1 Kamień 1-1 0 M macierz wypłat M ij wartość, jaka gracz K płaci graczowi W, jeśli W wybierze strategię i, a K strategię j. Jest to przykład gry dwuosobowej o sumie zerowej ( suma wypłat =0). Gracz W chce zmaksymalizować wygrana, a gracz K chce ja zminimalizować. ALP520 - Wykład z Algorytmów Probabilistycznych p.13
Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. ALP520 - Wykład z Algorytmów Probabilistycznych p.14
Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. jeśli W wybierze optymalna strategię, to jego wygrana wynosi co najmniej U W = max i min j M ij. ALP520 - Wykład z Algorytmów Probabilistycznych p.14
Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. jeśli W wybierze optymalna strategię, to jego wygrana wynosi co najmniej U W = max i min j M ij. Analogicznie dla K, wygrana wynosi co najwyżej U K = min j max i M ij. ALP520 - Wykład z Algorytmów Probabilistycznych p.14
Wygrana w grze Jeśli jest to gra o zerowej informacji ( gracze nie znaja swoich strategii), to jeśli W wybiera strategię i, to gwarantowana wygrana wynosi min j M ij, niezależnie od strategii K. jeśli W wybierze optymalna strategię, to jego wygrana wynosi co najmniej U W = max i min j M ij. Analogicznie dla K, wygrana wynosi co najwyżej U K = min j max i M ij. U W = 1, U K = 1 ALP520 - Wykład z Algorytmów Probabilistycznych p.14
Wygrane i strategie Fakt. max i min j M ij min j max i M ij ALP520 - Wykład z Algorytmów Probabilistycznych p.15
Wygrane i strategie Fakt. max i min j M ij min j max i M ij Dowód. Niech i 0 : max i min j M ij = min j M i0 j min j max i M ij, ponieważ M i0 j max i M ij. ALP520 - Wykład z Algorytmów Probabilistycznych p.15
Wygrane i strategie Fakt. max i min j M ij min j max i M ij Dowód. Niech i 0 : max i min j M ij = min j M i0 j min j max i M ij, ponieważ M i0 j max i M ij. Jeśli U W = U K = U, to gra ma punkt siodłowy (rozwiazanie). Odpowiadajace mu strategie graczy nazywamy strategiami czystymi (polegajacymi na wyborze konkretnego wiersza lub, odpowiednio, kolumny). ALP520 - Wykład z Algorytmów Probabilistycznych p.15
Wygrane i strategie Fakt. max i min j M ij min j max i M ij Dowód. Niech i 0 : max i min j M ij = min j M i0 j min j max i M ij, ponieważ M i0 j max i M ij. Jeśli U W = U K = U, to gra ma punkt siodłowy (rozwiazanie). Odpowiadajace mu strategie graczy nazywamy strategiami czystymi (polegajacymi na wyborze konkretnego wiersza lub, odpowiednio, kolumny). ALP520 - Wykład z Algorytmów Probabilistycznych p.15
Inny przykład Nożyczki Papier Kamień Nożyczki 0 1 2 Papier -1 0 1 Kamień -2-1 0 ALP520 - Wykład z Algorytmów Probabilistycznych p.16
Inny przykład Nożyczki Papier Kamień Nożyczki 0 1 2 Papier -1 0 1 Kamień -2-1 0 Oblicz U W i U K. ALP520 - Wykład z Algorytmów Probabilistycznych p.16
Strategie losowe (mieszane). ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Gracz W wybiera rozkład prawdopodobieństwa (schemat losowy) p = (p 1,p 2,...,p n ), gdzie p i to prawdopodobieństwo wyboru strategii (wiersza) i. ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Gracz W wybiera rozkład prawdopodobieństwa (schemat losowy) p = (p 1,p 2,...,p n ), gdzie p i to prawdopodobieństwo wyboru strategii (wiersza) i. Gracz K wybiera rozkład prawdopodobieństwa (schemat losowy) q = (q 1,q 2,...,q n ), gdzie q i to prawdopodobieństwo wyboru strategii (kolumny) i. ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Gracz W wybiera rozkład prawdopodobieństwa (schemat losowy) p = (p 1,p 2,...,p n ), gdzie p i to prawdopodobieństwo wyboru strategii (wiersza) i. Gracz K wybiera rozkład prawdopodobieństwa (schemat losowy) q = (q 1,q 2,...,q n ), gdzie q i to prawdopodobieństwo wyboru strategii (kolumny) i. Wygrana jest zmienna losowa o wartości oczekiwanej: E[ wygranej ] = p T Mq = n n p i M ij q j. i=1 j=1 ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o zerowej sumie i macierzy wypłat M V W = max p min q p T Mq = min q max p p T Mq = V K. ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o zerowej sumie i macierzy wypłat M V W = max p min q p T Mq = min q max p p T Mq = V K. Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń o separacji z geometrii analitycznej. Jest to też szczególny przypadek twierdzenia dualnego w zagadnieniu programowania liniowego. ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Strategie losowe (mieszane). Niech V W i V K oznaczaja gwarantowane średnie wypłaty dla graczy W i K. Wtedy zachodzi znane w teorii gier twierdzenie: Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o zerowej sumie i macierzy wypłat M V W = max p min q p T Mq = min q max p p T Mq = V K. Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń o separacji z geometrii analitycznej. Jest to też szczególny przypadek twierdzenia dualnego w zagadnieniu programowania liniowego. Wniosek. Gra ma punkt siodłowy (istnieja optymalne strategie mieszane lub czyste dla obu graczy). ALP520 - Wykład z Algorytmów Probabilistycznych p.17
Twierdzenie Loomisa ALP520 - Wykład z Algorytmów Probabilistycznych p.18
Twierdzenie Loomisa Jeśli p jest ustalone, to p T Mq jest funkcja liniowa zależna od q, która przyjmuje wartość minimalna dla q j = 1, gdzie j odpowiada najmniejszemu współczynnikowi (analogicznie dla q). Wtedy prawdziwa jest uproszczona wersja powyższego twierdzenia: ALP520 - Wykład z Algorytmów Probabilistycznych p.18
Twierdzenie Loomisa Jeśli p jest ustalone, to p T Mq jest funkcja liniowa zależna od q, która przyjmuje wartość minimalna dla q j = 1, gdzie j odpowiada najmniejszemu współczynnikowi (analogicznie dla q). Wtedy prawdziwa jest uproszczona wersja powyższego twierdzenia: Twierdzenie (Loomisa). W dowolnej grze dwuosobowej o zerowej sumie i macierzy M max p min j p T Me j = min q max i e T i Mq, gdzie e j jest wektorem jednostkowym z 1 na pozycji j. ALP520 - Wykład z Algorytmów Probabilistycznych p.18
Metoda Yao ALP520 - Wykład z Algorytmów Probabilistycznych p.19
Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.19
Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. Gracz K - projektant algorytmów Las Vegas. Gracz W - malkontent wybierajacy najgorszy zbiór danych wejściowych. Wypłata K dla W miara złożoności algorytmu (czas działania). K chce zminimalizować czas działania, W daży do zmaksymalizowania wypłaty. ALP520 - Wykład z Algorytmów Probabilistycznych p.19
Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. Gracz K - projektant algorytmów Las Vegas. Gracz W - malkontent wybierajacy najgorszy zbiór danych wejściowych. Wypłata K dla W miara złożoności algorytmu (czas działania). K chce zminimalizować czas działania, W daży do zmaksymalizowania wypłaty. Twierdzenia von Neumanna i Loomisa w języku algorytmów losowych. ALP520 - Wykład z Algorytmów Probabilistycznych p.19
Metoda Yao Zastosowanie twierdzeń minimaksowych do oszacowania złożoności algorytmów losowych. Gracz K - projektant algorytmów Las Vegas. Gracz W - malkontent wybierajacy najgorszy zbiór danych wejściowych. Wypłata K dla W miara złożoności algorytmu (czas działania). K chce zminimalizować czas działania, W daży do zmaksymalizowania wypłaty. Twierdzenia von Neumanna i Loomisa w języku algorytmów losowych. Π problem o sk. zb. danych wejściowych I (ustalonego rozmiaru) i sk. zb. algorytmów deterministycznych A. ALP520 - Wykład z Algorytmów Probabilistycznych p.19
Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na ALP520 - Wykład z Algorytmów Probabilistycznych p.20
Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. ALP520 - Wykład z Algorytmów Probabilistycznych p.20
Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. Wniosek (z tw. vn. i L.). max p min q E[C(I p, A q )] = min q max p E[C(I p, A q )] C DIST = max p min q min E[C(I p, A)] = A A max I I E[C(I, A q)] = C RAND. ALP520 - Wykład z Algorytmów Probabilistycznych p.20
Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. Wniosek (z tw. vn. i L.). max p min q E[C(I p, A q )] = min q max p E[C(I p, A q )] C DIST = max p min q C DIST złożoność średniego przypadku C RAND złożoność losowa min E[C(I p, A)] = A A max I I E[C(I, A q)] = C RAND. ALP520 - Wykład z Algorytmów Probabilistycznych p.20
Metoda Yao I I, A A, zbiorze I. C(I,A) czas działania algorytmu A na p rozkład prawdopodobieństwa na zbiorze I, q rozkład prawd. na zbiorze A (algorytm losowy LV) I p losowy zbiór danych wejściowych odpowiadajacy p i A q losowy algorytm odpowiadajacy q. Wniosek (z tw. vn. i L.). max p min q E[C(I p, A q )] = min q max p E[C(I p, A q )] C DIST = max p min q C DIST złożoność średniego przypadku C RAND złożoność losowa min E[C(I p, A)] = A A max I I E[C(I, A q)] = C RAND. ALP520 - Wykład z Algorytmów Probabilistycznych p.20
Zasada minimaksowa Yao Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A, min E[C(I p,a)] max E[C(I,A q)]. A A I I ALP520 - Wykład z Algorytmów Probabilistycznych p.21
Zasada minimaksowa Yao Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A, Interpretacja: min E[C(I p,a)] max E[C(I,A q)]. A A I I Średni czas najlepszego algorytmu deterministycznego (najszybszego w odniesieniu do danego rozkładu p na zbiorze danych wejściowych I) jest ograniczeniem dolnym na oczekiwany czas działania najlepszego algorytmu losowego dla ustalonego problemu. ALP520 - Wykład z Algorytmów Probabilistycznych p.21
Zastosowanie zasady minimaksowej Yao Cel: udowodnić ograniczenie dolne na C RAND problemu Π ALP520 - Wykład z Algorytmów Probabilistycznych p.22
Zastosowanie zasady minimaksowej Yao Cel: udowodnić ograniczenie dolne na C RAND problemu Π wybrać dowolny rozkład prawdopodobieństwa p na zbiorze danych wejściowych ALP520 - Wykład z Algorytmów Probabilistycznych p.22
Zastosowanie zasady minimaksowej Yao Cel: udowodnić ograniczenie dolne na C RAND problemu Π wybrać dowolny rozkład prawdopodobieństwa p na zbiorze danych wejściowych udowodnić ograniczenie dolne na średni czas działania każdego algorytmu deterministycznego dla tego problemu i rozkładu p ALP520 - Wykład z Algorytmów Probabilistycznych p.22