Czym jest użyteczność? W teorii gier: Ilość korzyści (czy też dobrobytu ), którą gracz osiąga dla danego wyniku gry. W ekonomii: Zdolność dobra do zaspokajania potrzeb. Określa subiektywną przyjemność, pożytek lub zadowolenie płynące z konsumowanych (ew. posiadanych) dóbr. 2
Funkcja użyteczności Odwzorowanie przypisujące liczby rzeczywiste elementom uporządkowanego zbioru preferencji danego gracza. preferencja a -> 3 preferencja b -> 2 preferencja c -> Wartości przypisywanych liczb są dowolne tzn. nie jest istotne to, że wartość przypisywana preferencji a jest trzy razy większa od wartości przypisywanej preferencji c. 3
Skala porządkowa Skala, na której większa wartość reprezentuje bardziej preferowany wynik, ale na tej zasadzie, że znaczenie ma jedynie uporządkowanie wartości, nazywamy skalą porządkową. Wartości wyznaczone zgodnie z tą zasadą na podstawie preferencji nazywamy użytecznościami porządkowymi. 4
Przykład Wyobraźmy sobie, że małżeństwo: Pan Wiersz i Pani Kolumna posiadają pewne preferencje spędzania wolnego czasu. Poprosiliśmy ich o ich uporządkowanie od najbardziej do najmniej korzystnego (z możliwością określenia dwóch wyników jako równie korzystnych). 5
Pan Wiersz uwielbia gotować (u), lubi też, choć mniej, oglądać telewizję (w), mniej istotne jest dla niego chodzenie do kina (x), a jeszcze mniej do teatru (z). Pan Wiersz nie cierpi sprzątania (y), a jeszcze gorsze dla niego jest prasowanie (v). Możemy to przedstawić następująco: u>w>x>z>y>v Pani Kolumna natomiast to istne przeciwieństwo Pana Wiersza. Jej preferencje wyglądają następująco: v>y>z>x>w>u 6
Opisany przypadek nazywany jest grą o sumie zerowej (preferencje Pani Kolumny stanowią odwrotność uporządkowania Pana Wiersza). W grach o sumie zerowej występuje zależność: tyle ile jedno z nich wygra drugie musi przegrać. Zakładamy również, że nasza gra ma punkt siodłowy (taki wyraz macierzy, który jest największy w kolumnie i najmniejszy w wierszu) 7
Pani Kolumna Pan Wiersz u v w x C y z Do zaprezentowanych preferencji przyporządkujmy wartości. Gra 3 x 2 Pan Wiersz ma do wyboru 3 strategie (, i C). Pani Kolumna 2 strategie ( i ). Pani Kolumna Pan Wiersz 6 5 4 C 2 3 8
Pan Wiersz C Pani Kolumna 6 5 4 2 3 6 4 2 4 punkt siodłowy Zwróćmy uwagę, że gra będzie miała punkt siodłowy, i to w tym samym miejscu, także wtedy, gdy przekształcimy wartości preferencji przez jakąkolwiek funkcję niezmieniającą ich uporządkowania (tzn. dowolną funkcję rosnącą) 9
Przykład 2 Gdy gra nie ma punktu siodłowego, by ją rozwiązać, trzeba posłużyć się strategiami mieszanymi Pan Wiersz Pani Kolumna a b c d różnice d-c a-b Jeżeli a>b i d>c, optymalną strategią Wiersza jest strategia mieszana d-c (d-c) + (a-b) ; a-b (d-c) + (a-b)
Skala interwałowa (przedziałowa) Skala przy której można interpretować nie tylko uporządkowanie wartości, ale także proporcje pomiędzy różnicami różnych wartości Liczby oddające preferencje mierzone na skali interwałowej nazywamy użytecznościami kardynalnymi. Proporcje pomiędzy różnicami użyteczności poszczególnych wyników wynikają z preferencji gracza.
Przykład 3 Prosimy Pana Wiersza o uporządkowanie (u,v,w,x) wg swoich preferencji, w wyniku czego otrzymujemy układ: u>x>w>v gdzie v ma wartość, a u wartość. Następnie pytamy co Pan Wiersz by wolał: Uzyskać na pewno x czy wziąć udział w loterii, w której szanse na wygranie u = 5%, a prawdopodobieństwo uzyskania v = 5%? 2
Jeśli Wiersz woli x od loterii, oznacza to, że przypisuje x wartość większą niż średnia wartości v i u (czyli x > (5%u+5%v) w związku z czym x > 5). v np. tu x 5 u Następnie pytamy czy Pan Wiersz wolałby x na pewno czy loterię ¼ v i ¾ u ¼ v i ¾ u = 75 Pan wiersz woli loterię, czyli: np. tu v x 5 75 u 3
v w 2 4 x 6 8 u 4
Przykład 3 dla Pani Kolumny by gra była grą o sumie zerowej, niezbędnym warunkiem jest to, aby preferencja Pani Kolumny była dokładnie odwrotna niż preferencja Pana Wiersza. Jeśli warunek ten jest spełniony, a jako punkty krańcowe skali wybierzemy - jako użyteczność u i jako v, to gra będzie o sumie zerowej. Użyteczności kardynalne Pani Kolumny wyglądają następująco: u - -8 x -6-4 w -2 v 5
Punkty końcowe skali użyteczności kardynalnych można zawsze wybierać dowolnie i nie będzie miało to wpływu na niesione przez nie informacje. Ponadto użyteczności możemy pomnożyć przez dowolną funkcję rosnącą, niezmieniającą uporządkowania wartości użyteczności. 6
Przykład 4 Pewne gry o sumie niezerowej możemy przekształcić w gry o sumie zerowej mnożąc użyteczności kardynalne przez funkcję liniową rosnącą Pan Wiersz Pani Kolumna (27,-5) (7,) (9,-) (23,-3) Pan Wiersz Pani Kolumna (5,-5) (,) (,-) (3,-3) Funkcja przez którą mnożyliśmy wartości to: g(x) = ½ (x-7) 7
Sprawdzanie czy gra jest grą o sumie zerowej Gra jest grą o sumie zerowej jeśli wszystkie użyteczności zaznaczone na układzie współrzędnych tworzą prostą o ujemnym nachyleniu. 3 2 - -2-3 -4-5 -6 5 5 2 25 3 8
łędy Odwrócenie przyczynowości Racjonalność Dodawanie użyteczności Międzyosobowe porównywanie użyteczności 9
łąd (Odwrócenie przyczynowości) Jeśli ktoś przedkłada jakaś propozycję albo jakiś wybór nad inne, znaczy to, że propozycja ta ma wyższą użyteczność. Propozycji przypisywana jest wyższa użyteczność niż propozycji dlatego, ponieważ dana osoba wskazała, że mając do wyboru i, wybiera. Wskazanie to nie musi wynikać z wartości użyteczności. 2
łąd 2 (Racjonalność) Jeśli mając do wyboru jedną z dwóch propozycji, osoba wybiera tę o niższej użyteczności, znaczy to, że postępuje nieracjonalnie. Możemy jedynie wtedy stwierdzić, że wybór tej osoby jest niezgodny z jej deklaracjami wyborów, na podstawie których określiliśmy jej użyteczności. Użyteczności te mogły przecież od tamtego czasu ulec zmianie (np. dana osoba zmienia zdanie) albo preferencji tej osoby nie da się przedstawić w postaci użyteczności kardynalnych. 2
łąd 3 (Dodawanie użyteczności) Możemy określić, jaka propozycja jest społecznie najbardziej pożądana, sumując użyteczności różnych osób. Dla osoby : = 2 i = Dla osoby 2: = 5 i = 2 Społecznie więc (2) jest lepsze od (7) Jednak nie uwzględniamy faktu, że użyteczności można przekształcić taką funkcją rosnącą, która tę relację by odwróciła. 22
łąd 4 (Międzyosobowe porównywanie użyteczności) Jeśli dany wynik ma dla jednego z graczy wyższą użyteczność niż dla drugiego, to jest on przez pierwszego gracza pożądany bardziej niż przez drugiego. Ponieważ użyteczności można przekształcać przez dowolne funkcje liniowe, nie można porównywać wartości użyteczności dla dwóch różnych osób. Użyteczności to indywidualne decyzje danej osoby i jej wybory. 23
Zadanie Jeśli użyteczności Wiersza wynoszą v=, w=2, x=6 i u=, t jakie będą jego preferencje w następujących sytuacjach wyboru: a) x lub ¾ w, ¼ u b) x lub ½ w, ½ u c) ½ w, ½ x lub ½ v, ½ u d) w, x lub u, v 24
Zadanie 2 Dla gry Pan Wiersz Pani Kolumna r s t u Dysponujemy następującymi informacjami o preferencjach graczy: Wiersz przekłada t nad s, s nad r i r nad u. Wiersz jest indyferentny wobec s i loterii t, r. Wiersz jest indyferentny wobec r i loterii ½ s, ½ u. Pozostałe preferencje Wiersza są zgodne z powyższymi. Preferencje Kolumny są odwrotne do preferencji Wiersza. a) Jak gracze powinni rozegrać grę? b) Gdyby Wiersz mógł wybrać pomiędzy s na pewno a rozgrywaniem powyższej gry, co by wybrał? 25
Zadanie 3 Wiersz i Kolumna rozgrywają grę Pani Kolumna Pan Wiersz u v w x Użyteczności dla Wiersza wynoszą u=, w=2, x=6, u=, a dla Pani kolumny są dokładnie przeciwne. a) Jaka jest optymalna strategia dla Kolumny? 26
27
Co to właściwie znaczy? Gry przeciwko Naturze, to gra, w której udział bierze dwóch graczy i, przy czym drugiego gracza, załóżmy nazywamy tu Naturą. Przyjmuje się, że obaj gracze mają określony zbiór strategii, z których mogą wybrać jedną. Zakłada się, że gracz nie wie nic o macierzy wypłat Natury, i nie wie jaką strategię on wybierze. Nie zna nawet rozkładu prawdopodobieństwa wyboru poszczególnych strategii przez gracza. Gracz przez wybór strategii współdecyduje o naszych wypłatach, ale sam z siebie nie jest zainteresowany wynikiem gry. 28
Wyobraźmy sobie, że gramy następującą grę przeciwko Naturze: Ty C D 2 Natura C 2 4 3 D W celu rozwiązania tej gry można zastosować pewne kryteria decyzyjne: Laplace a Walda Hurwicza Savage a 29
Kryterium Laplace a Wybierz wiersz z najwyższą średnią wypłat (co jest tożsame z wybraniem wiersza o największej sumie wypłat). 3
Przykład Stosując kryterium Laplace a wybierz strategię, która będzie najlepsza. Ty C D 2 Natura C 2 4 3 D suma 5 4 4 4 Ponieważ sumy dla poszczególnych wierszy naszej macierzy gry wynoszą odpowiednio 5, 4, 4, 4, według kryterium Laplace a powinniśmy wybrać strategię. 3
Kryterium Walda Wyznacz dla każdego wiersza minimalną wartość wypłaty i wybierz wiersz o najwyższym minimum. 32
Przykład 2 Stosując kryterium Walda wybierz strategię, która będzie najlepsza. Ty C D 2 Natura C 2 4 3 D minimum Ponieważ w naszej macierzy minima wierszy wynoszą,,,, zgodnie z kryterium Walda powinniśmy wybrać strategię. 33
Kryterium Hurwicza Wybierz współczynnik optymizmu α z przedziału od do. Dla każdego wiersza oblicz wartość α[maksimum wiersza]+(-α)[minimum wiersza] i wybierz wiersz, w którym wartość takiej średniej ważonej jest największa. 34
Przykład 3 Stosując kryterium Hurwicza, wybierz strategię, która będzie najlepsza. Wybierzmy dla przykładu α=3/4. Obliczenia dla naszej macierzy przedstawiają się następująco: Powinniśmy zatem wybrać strategię C. 35
Kryterium Savage a Wyznacz maksima wierszy w macierzy strat. Wybierz wiersz, którego maksimum jest najmniejsze. Macierz strat każda wartość z odpowiada różnicy pomiędzy odpowiednią wartością z oryginalnej macierzy a największą wartością w danej kolumnie. 36
Przykład 4 Stosując kryterium Savage a, wybierz strategię, która będzie najlepsza. Tworzymy macierz strat Ty C D 2-2 = 2 Natura C 2 3 D maksimum 2 3 2 Savage a doradziłby nam wybór strategii D, gwarantującej, że nigdy nie uzyskamy wypłaty o więcej niż gorszej od tego, co moglibyśmy uzyskać, znając z góry decyzję Naury. 37
Tak więc mamy cztery możliwe sposoby podejmowania decyzji w grach przeciwko Naturze i przykład, w którym każdy z nich prowadzi do innej decyzji. Co należy w tej sytuacji zrobić? Jedna z dróg prowadzi do zastanowienia się, która z metod bardziej do nas przemawia. Czy wolelibyśmy raczej wysoką średnią wypłat, pewność, że najgorsze nie będzie najgorsze, szansę na uzyskanie naprawdę najlepszego czy też gwarancję, że nie poczujemy się nazbyt stratni? Można też starać się wybrać jedną z metod w bardziej subtelny sposób. Określmy warunki, czyli aksjomaty, jakie powinny spełniać dobre metody rozgrywania gry przeciwko Naturze i sprawdźmy, które z metod spełniają poszczególne z nich. Na takiej podstawie możemy dokonać oceny metod i wybrać taką, która spełnia aksjomaty uważane przez nas za najważniejsze. 38
ksjomaty ksjomat. Symetryczność. Zamiana kolejności wierszy lub kolumn nie powinna mieć wpływu na wybór najlepszej strategii. ksjomat 2. Silna dominacja. Jeśli każda wypłata w wierszu X jest większa niż odpowiadająca jej wypłata w wierszu Y, kryterium podejmowania decyzji nie powinno wskazać na strategię Y. ksjomat 3. Liniowość. Wybrana strategia nie powinna się zmienić, jeśli wszystkie wartości w macierzy zostaną pomnożone przez dodatnią stałą, bądź też zostanie do nich dodana jakaś stała. 39
ksjomaty ksjomat 4. Duplikacja kolumny. Wybrana strategia nie powinna się zmienić, gdy do macierzy dodamy kolumnę identyczną z jedną z istniejących poprzednio kolumn. (niezgodne z k. Laplace a) ksjomat 5. Niezmienniczość względem premii. Wybrana strategia nie ulegnie zmianie, jeżeli do każdej wypłaty w jednej z kolumn dodać stałą. (niezgodne z k. Walda i Hurwicza) ksjomat 6. Dodanie wiersza. Załóżmy, że kryterium wskazuje strategię X jako najlepszą w pewnej grze przeciwko Naturze. Jeżeli do gry doda się nowy wiersz Z, to kryterium to powinno wskazać na strategię X lub strategię Z, a nigdy na którąś z pozostałych. (niezgodne z k. Savage a) 4
Zadanie Sprawdź, jaką strategię wskaże graczowi każde z kryteriów (Laplace a, Walda, Hurwicza z wybranym przez ciebie współczynnikiem optymizmu, Savage a). C D 3 4 6 2 2 2 C 2 2 D -2 2 4
Zadanie 2 Wykaż, że kryterium Walda łamie aksjomat 5 (niezmienniczość względem premii), badając skutki dodania 2 do każdej wartości w kolumnie C oraz do każdej wartości w kolumnie D w omawianym wcześniej przykładzie. Wykaż, że kryterium Hurwicza łamie aksjomat 5, badając skutki dodania odpowiedniej premii do którejś z kolumny macierzy (przyjmij α=3/4). 42
Zadanie 3 Wykaż, że kryterium Savage a łamie aksjomat 6 (dodanie wiersza), badając skutki dodania do macierzy z przykładu omawianego wcześniej wiersza E: 3 43