Znajdowanie strategii w grach z niepełną informacją przez ewolucję sieci neuronowych, na przykładzie pokera Texas Hold em ze stałym limitem

Wielkość: px
Rozpocząć pokaz od strony:

Download "Znajdowanie strategii w grach z niepełną informacją przez ewolucję sieci neuronowych, na przykładzie pokera Texas Hold em ze stałym limitem"

Transkrypt

1 Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Marek Kiszkis Nr albumu: Znajdowanie strategii w grach z niepełną informacją przez ewolucję sieci neuronowych, na przykładzie pokera Texas Hold em ze stałym limitem Praca licencjacka na kierunku MATEMATYKA Praca wykonana pod kierunkiem dra hab. Dominika Ślęzaka Instytut Matematyki Zakład Logiki Matematycznej Maj 2012

2 Oświadczenie kierującego pracą Potwierdzam, że niniejsza praca została przygotowana pod moim kierunkiem i kwalifikuje się do przedstawienia jej w postępowaniu o nadanie tytułu zawodowego. Data Podpis kierującego pracą Oświadczenie autora (autorów) pracy Świadom odpowiedzialności prawnej oświadczam, że niniejsza praca dyplomowa została napisana przeze mnie samodzielnie i nie zawiera treści uzyskanych w sposób niezgodny z obowiązującymi przepisami. Oświadczam również, że przedstawiona praca nie była wcześniej przedmiotem procedur związanych z uzyskaniem tytułu zawodowego w wyższej uczelni. Oświadczam ponadto, że niniejsza wersja pracy jest identyczna z załączoną wersją elektroniczną. Data Podpis autora (autorów) pracy

3 Streszczenie Praca jest opisem badań mających na celu znajdowanie strategii w grach z niepełną informacją przez ewolucję sieci neuronowych o ustalonej strukturze. Przedstawiony jest stan badań w tym temacie i wyniki eksperymentów przeprowadzonych w ramach pracy. Słowa kluczowe systemy decyzyjne, sieci neuronowe, algorytmy ewolucyjne, gry, strategie Dziedzina pracy (kody wg programu Socrates-Erasmus) 11.0 Matematyka, Informatyka 11.4 Sztuczna inteligencja Klasyfikacja tematyczna 91A35 Decision theory for games 92B20 Neural networks, artificial life and related topics 91A60 Probabilistic games; gambling Tytuł pracy w języku angielskim Finding robust strategies in imperfect information games with evolutionary neural networks, on the example of Fixed-Limit Texas Hold em

4

5 Spis treści Wstęp Struktura pracy Podstawowe pojęcia Gry Sieci neuronowe Algorytmy ewolucyjne Poker i strategie w pokerze Texas Hold em ze stałym limitem Texas Hold em bez limitu Strategie w pokerze Texas Hold em ze stałym limitem Strategie oparte na wiedzy (knowledge-based) Strategie oparte na symulacji rozgrywki Strategie przybliżające równowagę Nasha Strategie wykorzystujące słabości Inne podejścia Poprzednie prace Klasyfikacja wzorców zachowań w pokerze bez limitu: podejście ewolucyjne head-start [4] Opis modelu agenta Opis ewolucji Problemy z pracą Agenci pokera Texas Hold em bez limitu tworzeni przez ewolucję sieci neuronowych [9] Opis modelu agenta Problemy z pracą Znajdowanie silnych strategii pokera Texas Hold em przy użyciu ko-ewolucji Pareto i deterministycznego zagęszczania [10] Opis modelu agenta Opis ewolucji Zalety pracy Problemy z pracą Porównanie wyników Widoczne problemy Kosztowna symulacja Ciężko się dobrze porównać

6 4. Zakres eksperymentów Wyniki eksperymentów Opis eksperymentów Rezultaty Słabe wyniki Wnioski i praca na przyszłość

7 Wstęp Gry są coraz bardziej popularnym tematem badań. Nie powinno to nikogo dziwić wszak pojawiają się one w wielu dziedzinach nauki; na przykład w ekonomii, biologii, czy oczywiście, informatyce. Logicy już dawno zauważyli wartość gier i poza klasycznymi ich zastosowaniami w logice, jak gry Ehrenfeuchta Fraïsségo, nauczyli się wykorzystywać teorię gier do dziedzin, wydawałoby się, z grami niezwiązanych: modelowania systemów wieloagentowych czy obliczeń interaktywnych. A na styku teorii gier i projektowania algorytmów mamy algorytmiczną teorię gier. Chyba każdy z nas nieustannie w coś gra; czy to dla rozrywki i przyjemności, czy jako trening umysłu, wreszcie grają ludzie dla pieniędzy. Mamy tysiące istniejących gier do wyboru; wymyślamy też własne. Grać można samemu, we dwoje, lub z wieloma innymi graczami. Można nawet i z komputerem. Programy komputerowe grające w szachy grają, już od jakiegoś czasu, na poziomie przynajmniej porównywalnym z najlepszymi (ludzkimi) graczami na świecie. Łatwe gry można przy użyciu komputera rozwiązać, tzn. znaleźć strategię wygrywającą (jeśli istnieje), co pozwoli wygrać z każdym przeciwnikiem. Coraz więcej naukowców próbuje tworzyć wciąż lepsze programy (agentów) do gry w szachy, scrabble, pokera czy go. Koncepcyjnie, zasada działania takiego agenta jest prosta: wykonywać jak najlepsze ruchy. Niech agent przeszuka przestrzeń stanów gry i wybiera te ruchy, które są najlepsze. Tak naprawdę, używamy algorytmu minimax [13]. Jeśli przestrzeń stanów jest zbyt duża, stosujemy heurystyki, alfa-beta obcięcia. Ale co jeśli nie możemy tak po prostu przeszukać przestrzeni stanów? Jest tak na przykład w przypadku gier z niepełną informacją lub gier z elementem losowości. Do takich gier należy chociażby poker, brydż sportowy czy nawet scrabble, a prostym przykładem gry z niepełną informacją są statki. Nie mając pełnej informacji o stanie gry, nie możemy bezmyślnie użyć mocy obliczeniowej komputera do przejrzenia wszystkich możliwych stanów. Tworząc agenta do takiej gry, przed twórcą pojawia się jeden znaczny problem: skąd program komputerowy ma czerpać wiedzę? Jak go nauczyć grać? Szczególnie jeśli twórca programu nie jest ekspertem w tej dziedzinie. Weźmy brydża dojście do pewnego poziomu profesjonalizmu zajmuje przecież wiele lat. Istnieją setki książek na temat brydża, tysiące ludzi poświęca na jego naukę całe życie. Nie sposób przerobić tak wielkich ilości materiału, a nawet jeśli ma się tę wiedzę jak podzielić się nią z programem komputerowym? Może inne podejście byłoby bardziej odpowiednie? Na przykład: niech program sam się uczy. Niech przejrzy zapisy wszystkich dostępnych partii brydża i wywnioskuje, jakie ruchy są dobre w jakich sytuacjach. Niech uczy się też na swoich błędach i dopasowuje swoją strategię w miarę potrzeb. Ale to nadal wydaje się trudne do zrealizowania. Przeprowadzenie wystarczająco dużej ilości rozgrywek z graczami ludzkimi zajęłoby zbyt długo; ciężko też czasem jednoznacznie ocenić czy pojedynczy ruch jest zły czy dobry. Jest to wręcz niemożliwe, gdy nie znamy ogólnej strategii agenta. Należałoby więc raczej oceniać strategię jako całość. W tej pracy skupimy się na jeszcze całkiem innym podejściu do tego problemu: użyciu 5

8 algorytmów ewolucyjnych. Podejście to jest używane np. w [11], [10]. Idea jest prosta na początku tworzona jest populacja graczy. Następnie, przez wiele pokoleń, odbywa się ich ewolucja, w której przeżywają najlepsi gracze. Oni też rozmnażają się tworząc nowych agentów. Spodziewamy się, że w wyniku takiej ewolucji, stopniowo w miarę upływu czasu będziemy uzyskiwali coraz lepszych agentów; a dzięki technikom mającym na celu urozmaicenie populacji, sprawdzimy wiele możliwych strategii. Jednymi z ważniejszych pytań, na które powinniśmy sobie odpowiedzieć wybierając takie podejście, są np.: Jak reprezentować (modelować) strategie (agentów)? Od jakich agentów zaczynamy ewolucję? Jak mierzyć jakość agentów? Jak "rozmnażać" agentów? Kiedy powinniśmy zakończyć obliczenia? Skupiamy się na jednej grze pokerze Texas Hold em ze stałym limitem. Należy jednak podkreślić, że prezentowane tu podejście daje się z powodzeniem uogólnić na inne gry - jeśli tylko umiemy w satysfakcjonujący sposób odpowiedzieć na pytania postawione powyżej. Naszym celem jest zbadanie, do jakich wyników prowadzi podejście pokrótce opisane powyżej; poker został wybrany z powodu istniejącej już na ten temat literatury i prowadzonych badań próbujących stosować podejścia tego typu Struktura pracy Struktura niniejszej pracy jest następująca: Rozdział 1 opisuje postawowe pojęcia używane w tej pracy, z zakresu teorii gier, sieci neuronowych i algorytmów ewolucyjnych. Rozdział 2 jest wprowadzeniem w tematykę pokera. Opisujemy w nim zasady gry w pokera Texas Hold em ze stałym limitem i strategie w pokerze. Rozdział 3 jest analizą poprzednich prac traktujących o obliczaniu strategii gry w pokera przez ewolucję sieci neuronowych. Rozdział 4 opisuje zakres przeprowadzonych przez nas eksperymentów. W Rozdziale 5 prezentujemy wyniki tychże eksperymentów. Rozdział 6 zawiera wnioski i sugeruje prace na przyszłość w tym temacie. Głównym celem naszej pracy było poprawienie wyników Noble a [10]. Wyniki przeprowadzonych eksperymentów pokazują, że rzeczywiście udało się tego dokonać. Wykazaliśmy, że nawet niewielkie zmiany w matematycznym modelu strategii czy w stosowanych algorytmach mogą prowadzić do dużo lepszych wyników. Należy jednak zaznaczyć, że równie małe zmiany mogą też odnieść zgoła przeciwny skutek i doprowadzić do powstania szczególnie słabych strategii. Cała trudność polega więc na tym, żeby przewidzieć, jakie zmiany mogą polepszyć wyniki, a jakie - pogorszyć. Odpowiedzi na to pytanie szukaliśmy właśnie w ramach tej pracy. 6

9 Rozdział 1 Podstawowe pojęcia W tym rozdziale opiszemy pojęcia używane w pracy: podstawowe pojęcia teorii gier, sieci neuronowe i algorytmy ewolucyjne Gry Definicja 1 (Strategia) Strategia to opis zachowań gracza, definiujący jego działanie w każdej możliwej sytuacji (stanie gry). Na ogół, decyzja nie jest wybierana jednoznacznie, ale raczej obliczane są prawdopodobieństwa z jakimi agent wykonuje każdy ruch. Dzięki podejmowaniu każdej z decyzji z pewnym niezerowym prawdopodobieństwem, nawet najprostsza strategia nie jest całkowicie przewidywalna. Strategie dzielimy na statyczne i dynamiczne, w zależności od tego, czy zmieniają się w trakcie gry. Będziemy utożsamiać graczy z ich strategiami. Definicja 2 (Równowaga Nasha) Rozważmy grę, w której bierze udział n graczy o ustalonych strategiach. Jeśli żadnemu z graczy nie opłaca się zmienić strategii (przy ustalonych strategiach przeciwników), powiemy, że strategie te są w równowadze Nasha. Innymi słowy, strategie są w równowadze Nasha jeśli każdy gracz gra optymalnie w stosunku do danych przeciwników. Kolejnym kryterium podziału strategii jest możliwość odniesienia przewagi nad innymi graczami. Strategie przybliżające równowagę Nasha mają na celu jak najlepszą grę z najgorszym (dla nas) możliwym przeciwnikiem. Ich głównym celem jest nie przegrać. Z drugiej strony są strategie maksymalne, tj. wykorzystujące możliwie najbardziej słabości przeciwników. Zauważmy jednak, że oddalając się od równowagi Nasha, strategie maksymalne przejawiają pewne słabości, przez co same stają się podatne na wykorzystanie przez innych graczy. Rozważmy teraz elementy pewnego uniwersum U. Załóżmy, że mamy m kryteriów oceny jakości elementów U; czyli jakość oceniamy funkcją f : U R m. Kryteria oceny są, z założenia, nieporównywalne. Przyjmijmy też, dla ułatwienia, że większe wartości f oznaczają lepszą ocenę. Definicja 3 (Pareto dominacja) Niech û, ˆv U, f(û) = (u 1, u 2,..., u m ), f(ˆv) = (v 1, v 2,..., v m ). Powiemy że û Pareto-dominuje ˆv, wtedy i tylko wtedy gdy i : u i v i. 7

10 Nieformalnie mówiąc, û dominuje ˆv jeśli jest od niego lepszy przy każdym kryterium oceny. Zauważmy, że jeżeli û nie dominuje ˆv ani ˆv nie dominuje û, to dla pewnego j mamy u j > v j, i dla pewnego k mamy u k < v k, czyli û i ˆv są nieporównywalne. Definicja 4 (Front Pareto) Dla danego zbioru U U, frontem Pareto zbioru U nazywamy zbiór wszystkich elementów z U, które nie są zdominowane (w sensie Pareto) przez żaden inny element z U Sieci neuronowe Definicja 5 (Sieć neuronowa) (Sztuczną) siecią neuronową z jedną warstwą ukrytą, o wejściach X = {x 1, x 2,..., x n }, neuronach ukrytych Y = {y 1, y 2,..., y m } i wyjściach Z = {z 1, z 2,... z k }, z funkcją aktywacji h : R R, nazywamy parę funkcji f 1 : X Y R, f 2 : Y Z R. Funkcje te nazywamy wagami krawędzi sieci neuronowej. Definicja 6 Wartością [z] wyjścia z sieci neuronowej zdefiniowanej tak jak powyżej jest gdzie gdzie [x] R oznacza wartość wejścia x. ( ) [z] = h [y] f 2 (y, z) y Y ( ) [y] = h [x] f 1 (x, y) x X Należy wspomnieć, że nie ma chyba uniwersalnej definicji sieci neuronowej. Istnieją modele znacznie bardziej skomplikowane niż zdefiniowany powyżej, taka definicja jednak wystarcza w naszym przypadku. Obszerniejszy opis sieci neuronowych można znaleźć np. w [14]. Przykład 1 (Sieć neuronowa) Poniżej przedstawiamy przykładową sieć neuronową o trzech wejściach, dwóch neuronach ukrytych i jednym wyjściu. Dla jasności, pominięte zostały zerowe wagi. x y 1 x z y x 3 x 1+ x. Taka funkcja akty- Przyjmijmy że funkcja aktywacji jest zdefiniowana jako h(x) = wacji została użyta w pracy Noble a [10]. 8

11 Dla sieci neuronowej z powyższego przykładu, dla [x 1 ] = 0.11, [x 2 ] = 0.6, [x 3 ] = 0.26 mamy [y 1 ] = h([x 1 ] 0.32) = h(0.0352) = 0.034, [y 2 ] = h([x 2 ] ( 0.17) + [x 3 ] 1.09) = h( ) = h(0.1814) = i wreszcie [z 1 ] = h([y 1 ] ( 0.42) + [y 2 ] 0.72) = h( ) = h(0.0962) = Należy wspomnieć tutaj o jednej szczególnej własności sieci neuronowych. Jeśli traktujemy sieć neuronową jako aproksymację funkcji wielu zmiennych, to prawdziwe jest Twierdzenie 1 (Cybenko) Użycie dwóch warstw ukrytych umożliwia osiągnięcie dowolnej dokładności aproksymacji dowolnej funkcji, przy dostatecznie dużej liczbie neuronów ukrytych. A przy pewnych założeniach na aproksymowaną funkcję wystarczy jedna warstwa ukryta: Twierdzenie 2 (Cybenko, Hornik et al.) Dowolna ciągła nieliniowa funkcja może być zaproksymowana z żądaną dokładnością za pomocą sieci neuronowej z jedną warstwą ukrytą zawierającą dostatecznie dużo neuronów ukrytych. Dowody tych twierdzeń można znaleźć w [3] i [6]. Problemem jest jednak to, że powyższe twierdzenia są niekonstruktywne. Dzięki nim wiemy, że dowolną funkcję możemy aproksymować pewną siecią, nie wiemy jednak jaką. Co prawda istnieją pewne dobre praktyki sugerujące strukturę sieci odpowiednią dla danego problemu. Na przykład uznaje się, że liczba neuronów w warstwie ukrytej powinna być równa mniej więcej pierwiastkowi z iloczynu liczby neuronów wejściowych i wyjściowych. Dokładniejszy opis można znaleźć np. w [8] czy [16]. Należy jednak pamiętać, że są to jedynie wskazówki i nie ma żadnej gwarancji, że zastosowanie tych rad będzie prowadzić do osiągnięcia dobrych wyników w każdym problemie. Sieć która dobrze aproksymuje daną funkcję może mieć dowolnie wiele neuronów ukrytych. Nie jest znany żaden sposób na obliczanie takich sieci. Z pomocą przychodzą nam algorytmy ewolucyjne Algorytmy ewolucyjne Historia algorytmów ewolucyjnych sięga połowy XX wieku [1]. Idea działania takich algorytmów jest prosta - mają służyć do symulowania procesu ewolucji biologicznej. Algorytmy ewolucyjne mogą być użyte do przeszukiwania przestrzeni rozwiązań pewnego problemu w celu znalezienia optymalnego (lub prawie optymalnego) rozwiązania, zwłaszcza tam gdzie inne metody zawodzą (np. przestrzeń rozwiązań jest zbyt duża). Rozwiązania problemu traktujemy jako osobników w procesie ewolucji. Zarys działania algorytmu ewolucyjnego wygląda następująco: 1. Wylosowanie początkowej populacji osobników 2. Proces ewolucji, w którym w każdym pokoleniu następuje: (a) Ocena obecnej populacji (selekcja) (b) Najlepiej ocenione osobniki biorą udział w reprodukcji poprzez krzyżowania (wytworzenie nowego elementu na podstawie dwóch wybranych) i mutacje (drobne losowe zmiany w pojedynczym osobniku) (c) W populacji zostają nowe osobniki i te najlepsze z poprzedniego pokolenia. Osobniki o słabej ocenie są odrzucane. 9

12 3. Ewolucja kończy się, gdy zostaną spełnione pewne warunki końcowe, np. przeminięcie określonej liczby pokoleń lub uzyskanie osobników o odpowiednio wysokiej ocenie. Obszerniejszy opis algorytmów ewolucyjnych można znaleźć w [5]. W tej pracy chcemy modelować strategie do gry w pokera przez sieci neuronowe (o ustalonej strukturze) i dokonywać ewolucji tych strategii za pomocą algorytmu ewolucyjnego opisanego powyżej. Należy wspomnieć, że takie podejście było badane już od długiego czasu; obszerne prace na ten temat można znaleźć np. w [7] czy [15]. W naszym zastosowaniu, ewolucja sieci neuronowych nie będzie zmieniać struktury sieci: liczba warstw i neuronów ukrytych pozostaje ta sama. Mutacje wprowadzają losowe zmiany w połączeniach między neuronami, a w wyniku krzyżowania dwóch sieci (rodziców) powstaje sieć, w której waga każdego połączenia między neuronami jest średnią z wag odpowiednich połączeń u rodziców. 10

13 Rozdział 2 Poker i strategie w pokerze 2.1. Texas Hold em ze stałym limitem W tym podrozdziale opiszemy pokrótce zasady gry w Pokera Texas Hold em ze stałym limitem (Fixed-Limit Texas Hold em). Obszerniejsze opisy zasad znajdują się w źródłach, np. [17]. Rozgrywka składa się z wielu rozdań, w których uczestniczy od 2 do 10 graczy. Dopuszcza się zmiany graczy (przyjście nowego gracza lub opuszczenie stolika przez obecnego gracza), ale tylko pomiędzy rozdaniami (skład nie może zmieniać się podczas rozdania). W każdym rozdaniu jeden z graczy jest rozdającym (dealer), a dwóch kolejnych (na lewo od rozdającego, zgodnie z ruchem wskazówek zegara) wnosi do puli wymuszone stawki: tzw. małą ciemną i dużą ciemną. Następnie każdemu z graczy rozdawane są po dwie karty, poczynając od gracza na lewo od rozdającego i rozdając zgodnie z ruchem wskazówek zegara. Są to tzw. zakryte karty (hole cards), widoczne tylko ich właścicielom. W tym momencie zaczyna się pierwsza runda licytacji (pre-flop). W każdej z czterech rund licytacji, każdy z graczy ma do wyboru trzy możliwości: spasować (fold) Gracz który spasuje, traci wszystkie żetony, które wniósł do puli w tym rozdaniu i nie bierze już udziału w dalszej części rozdania. sprawdzić (call) Gracz może wyrównać wartość obecnego zakładu, wnosząc do puli odpowiednią ilość żetonów podbić stawkę (raise) Gracz może podbić wartość obecnego zakładu. W wersji pokera ze stałym limitem, można podbijać tylko o ustalone stawki, np. $1 w pierwszych dwóch rundach i $2 w kolejnych trzech rundach. Każdą rundę licytacji zaczyna gracz na lewo od gracza który wniósł dużą ciemną, a licytacja postępuje zgodnie z ruchem wskazówek zegara. Runda kończy się, jeśli wysokość zakładu zostanie ustalona przez graczy (po tym jak żaden z graczy nie ma zamiaru podbijać, czyli gdy wszyscy sprawdzą lub spasują). W wersji pokera ze stałym limitem mamy też dodatkowe ograniczenie: w jednej rundzie licytacji żaden gracz nie może podbić więcej niż trzy razy. Po pierwszej rundzie licytacji, rozdawany jest flop: trzy karty wspólne (community cards), widoczne dla każdego z graczy. Dochodzi wtedy do drugiej tury licytacji, w której biorą udział wszyscy gracze którzy dotychczas nie spasowali, i ponownie licytując, ustalają wysokość 11

14 zakładu. Ponownie, kiedy wszyscy aktywni gracze wniosą do puli taką samą ilość żetonów, wykładana jest czwarta karta (turn). Na tych samych zasadach dochodzi do trzeciej rundy licytacji, po której wykładana jest piąta karta (river), po czym ma miejsce ostatnia runda licytacji. Po ostatniej rundzie licytacji następuje wyłożenie kart w celu wyłonienia zwycięzcy. Wygrywa (i zdobywa wszystkie żetony z puli) ten z graczy, który z pięciu kart wspólnych i (swoich) dwóch zakrytych ułoży najlepszy układ. Zwycięzca może też zostać wyłoniony wcześniej, jeśli w którymkolwiek momencie wszyscy poza jednym graczem spasują. Możliwymi układami kart są, od najmocniejszego: Poker (5 kolejnych kart w jednym kolorze; np. 4 karo 8 karo) Kareta (4 karty tej samej wartości) Full (trójka i para) Kolor (5 kart w tym samym kolorze) Strit (5 kolejnych kart nie w kolorze) Trójka (3 karty tej samej wartości) Dwie pary Para Wysoka karta Jeśli więcej niż jeden gracz ma ten sam układ (np. karetę), wygrywa ten, który ma najwyższe karty. W przypadku remisu, pula jest dzielona pomiędzy zwycięzców. Nie będziemy tutaj wchodzić w szczegóły zasad, można je znaleźć w źródłach. Celem gry jest zdobycie jak największej liczby żetonów w całej rozgrywce Texas Hold em bez limitu Należy tutaj wspomnieć także o innej, bardziej popularnej odmianie pokera Texas Hold em: wersji bez limitu. Od opisanej powyżej różni się tylko tym, że stawki można podbijać dowolnie wysoko; gracz może nawet wnieść do puli wszystkie swoje żetony (tzw. wejście za wszystko, all in). Mimo że coraz więcej graczy wybiera wersję bez limitu, nie będziemy się nią zajmować, z kilku powodów. Po pierwsze, decyzja do podjęcia jest trudniejsza: jest więcej możliwych decyzji niż tylko pas, sprawdzenie, podbicie. Po drugie wydaje się, że nawet drobna zmiana strategii może mieć drastyczny wpływ na wynik, dużo większy niż w wersji ze stałym limitem. Nawet jeden zły ruch (np. wejście all-in w złym momencie) może zepsuć całą dobrą grę. Wersję bez limitu, jako trudniejszą, zostawiamy na przyszłe badania. Reszta naszych rozważań dotyczy tylko wersji pokera Texas Hold em ze stałym limitem Strategie w pokerze Texas Hold em ze stałym limitem W kontekście pokera ze stałym limitem, strategia (patrz definicja 1) odwzorowuje stan gry w jedną z trzech decyzji jaką podejmuje agent: pas, sprawdzenie, podbicie. 12

15 Strategie gry w pokera, zwłaszcza te zrealizowane w postaci programu komputerowego, są często określane mianem pokerbotów. Badania nad nimi są prowadzone już od długiego czasu. Pokrótce opiszemy teraz różne podejścia do pokerbotów prezentowane w publikacjach naukowych. Należy pamiętać, że przedstawiona tu lista możliwych podejść zdecydowanie nie jest kompletna, nie staramy się też opisywać ich zbyt szczegółowo. Dokładniejszy opis można znaleźć w [12], a niezmiernie dokładny przegląd w [2] Strategie oparte na wiedzy (knowledge-based) Do stworzenia strategii opartej na wiedzy potrzebny jest znawca tematu pokera. Taki znawca stara się zaprojektować wygrywającą strategię, korzystając ze swojej wiedzy i doświadczenia. Najprostszym przykładem jest zestaw pewnych reguł: np. jeśli masz parę asów, zawsze podbijaj albo jeśli obie twoje karty są niższe niż 9 i pewien gracz podbił, to spasuj. Trochę bardziej wyrafinowane jest użycie pewnych wskaźników opisujących np. siłę ręki gracza czy ryzyko jakie trzeba podjąć żeby pozostać w grze. Problemy są łatwe do zauważenia: jest niezwykle trudne stworzyć niesprzeczny zbiór reguł pokrywający wszystkie przypadki w grze. Dlatego, pokerboty tego typu często utożsamiają ze sobą zbyt wiele istotnie różnych stanów gry, podejmując w nich tę samą decyzję. Strategie powstałe w wyniku takiego podejścia są poza tym statyczne, a to może być wykorzystane przez innych graczy Strategie oparte na symulacji rozgrywki W tym podejściu staramy się przejrzeć drzewo gry w celu znalezienia najlepszego ruchu. W przeciwieństwie do tradycyjnego algorytmu minimax, drzewo gry przeglądamy losowo (ponieważ nie umiemy przewidzieć optymalnych ruchów pozostałych graczy, ani tego jakie karty zostaną rozdane). Symulujemy tak przebieg rozgrywki aż do wyłożenia kart, kiedy możemy ocenić ile żetonów wygramy lub przegramy, gdy gra potoczy się w ten sposób. Przeprowadzając taką losową symulację wiele razy, możemy estymować wartość oczekiwaną wygranej w zależności od decyzji podjętej na początku. Strategie powstałe w wyniku tego podejścia niestety (wbrew być może intuicji) nie są o wiele lepsze niż strategie oparte na wiedzy, potrafią wygrywać tylko ze słabymi, niedostosowującymi się przeciwnikami Strategie przybliżające równowagę Nasha W tym podejściu, przy pomocy rozważań z teorii gier, starano się obliczać strategie grające jak najlepiej z każdym możliwym przeciwnikiem. Powstałe w wyniku tego strategie, nawet jeśli nie przegrywają z dobrymi graczami, minimalnie wygrywają ze słabymi Strategie wykorzystujące słabości Kolejną kategorię tworzą strategie zupełnie z przeciwnego bieguna: starające się jak najbardziej wykorzystywać słabości przeciwników. Ważną cechą wspólną takich strategii jest modelowanie przeciwnika. Podejmują one decyzje na podstawie oczekiwanych decyzji innych graczy, które są przewidywane dzięki modelowaniu przeciwników. Modelowanie przeciwników można realizować na wiele różnych sposobów. Prostym przykładem modelu przeciwnika są statystyki mówiące np. jak często podejmuje on poszczególne 13

16 decyzje. Bardziej wyrafinowane podejście mogłoby przeanalizować zapisy rozgrywek dostępnych online i pogrupować strategie tam napotkane na podstawie, ogólnie mówiąc, stylu gry następnie starać się dopasować przeciwnika do znanych już modeli Inne podejścia Oczywiście, stosowane są też inne podejścia. Przykładem może być użycie sieci bayesowskich albo wnioskowanie z przypadków (case-based reasoning), w którym staramy się zapamiętywać wszystkie sytuacje napotkane w dotychczasowych grach, razem z najlepszymi ruchami w tych sytuacjach. Kiedy mamy do podjęcia nową decyzję (w nowej sytuacji), porównujemy ten przypadek z przypadkami napotkanymi wcześniej, wybierając ruch np. przy użyciu algorytmu k najbliższych sąsiadów. Na szczególną uwagę zasługuje jednak, według nas, jeszcze inne podejście, zaproponowane przez Noble a [10]. Jest to zastosowanie sieci neuronowych i algorytmów ewolucyjnych. Strategie przedstawiamy jako sieci neuronowe, które jako wejścia mają podłączone informacje na temat obecnego stanu gry (a być może także o przebiegu wcześniejszych rozgrywek z tymi samymi graczami), a wyjściami są relatywne prawdopodobieństwa podjęcia każdej z decyzji. Jednak wbrew, być może, oczekiwaniom, nie uczymy tych sieci na żadnych danych treningowych. Uczenie odbywa się poprzez ewolucję strategii. Idea ewolucji została pokrótce opisana w sekcji 1.3, szczegółowy opis jest zamieszczony w sekcji 3.3. Zastanówmy się, jakie są konsekwencje przyjęcia tego podejścia do problemu. Znaną własnością sieci neuronowych jest to, że neurony w warstwach pośrednich reprezentują pewne cechy stanu gry. Sieci uczą się obliczać te cechy, a na podstawie ich wartości podejmowana jest decyzja. Nie ma tu znaczenia czy sieci są uczone metodą propagacji wstecznej, czy w wyniku ewolucji: niestety, nie wiemy jakie cechy reprezentują te neurony. Spodziewamy się, że w wyniku ewolucji powstaną dobre strategie. Jednak wiemy że ciężko zrozumieć jak naprawdę działa taka sieć neuronowa, zwłaszcza gdy ma wiele wejść, wiele neuronów i połączeń między nimi. Musimy więc pogodzić się np. z tym, że nie będziemy umieli delikatnie zmienić otrzymanej strategii żeby poprawić jej działanie w przypadkach z którymi nie radzi sobie zbyt dobrze. Ale z drugiej strony nie wymaga to praktycznie żadnej wiedzy z dziedziny pokera. Strategie walczą między sobą, dosyć łatwo też ocenić która z nich jest lepsza. Nowe strategie powstają same w wyniku ewolucji. W przypadku, gdy ewolucja zaczyna się od losowych sieci, do stworzenia dobrych strategii wystarczy sama znajomość zasad pokera. Niestety, sieci neuronowe w tym przypadku są ciężkie do uczenia klasyczną metodą propagacji wstecznej. Wynika to stąd, że nie zawsze wiadomo jak stwierdzić, czy podjęta decyzja jest dobra czy zła. Ciężko ocenić jakość pojedynczej decyzji, np. kiedy agent gra zgodnie ze swoją taktyką, której nie znamy bądź nie rozumiemy. Nie jest to wielki problem w naszym przypadku chcemy, by uczenie odbywało się przez ewolucję. Dzięki temu omijamy wspomnianą wadę pokerbotów jako sieci neuronowych. Wydaje się więc, że tworzenie strategii pokera za pomocą algorytmów ewolucyjnych jest idealnym tematem do badań. Poprzednie prace z tego tematu pokazują, że w wyniku takiego podejścia powstają zaskakująco dobre strategie. W tej pracy chcielibyśmy potwierdzić zasadność tego podejścia w ogólności. Dokładniej zaś, chcemy pójść dalej i poprawić rezultaty pracy Noble a [10]. 14

17 Rozdział 3 Poprzednie prace Niniejszy rozdział przedstawia poprzednie publikacje mające szczególne znaczenie dla tej pracy. Wszystkie z nich próbują obliczać strategie gry w pokera za pomocą algorytmów ewolucyjnych. Każdą wymienioną pracę oceniamy pod względem następujących kryteriów: Reprezentacja strategii Modelowanie przeciwników Sposób oceniania agentów Wiarygodność oceny agentów Optymalizacje parametrów 3.1. Klasyfikacja wzorców zachowań w pokerze bez limitu: podejście ewolucyjne head-start [4] Opis modelu agenta Warto zauważyć, że autorzy skupiają się na wersji pokera Texas Hold em bez limitu, co jak zauważyliśmy jest trudniejszym wariantem pokera. Praca jest godna uwagi, mimo że nie modeluje strategii jako sieci neuronowe. Agenci rozważani w pracy podejmują jedną z pięciu możliwych decyzji (pas, sprawdzenie, małe / średnie / duże podbicie) na podstawie trzech czynników wynikających z przebiegu gry i z obecnego jej stanu: siły ręki, agresywności przeciwników i ryzyka. Te własności zasługują na krótkie wyjaśnienie. Siła ręki jest zdefiniowana jako prawdopodobieństwo zdarzenia "moja ręka jest najlepsza ze wszystkich przy stole", przy założeniu, że wszystkie karty przeciwników zostały wylosowane z rozkładem jednostajnym. Ryzyko jest to wartość starająca się opisać, jak bardzo ryzykowna jest (dla danego agenta) dalsza gra, czyli przynajmniej wyrównanie obecnej stawki. Jest ono wyliczane tylko na podstawie dwóch wartości: ilości żetonów w puli i wysokości obecnej stawki. 15

18 Agresywność Przy każdym ruchu przeciwnika jest przewidywana siła jego ręki. Konkretnie, agent sprawdza przy jakiej sile ręki on podjąłby taką samą decyzję (przy ustalonym ryzyku). Następnie, agresywność decyzji jest zdefiniowana jako różnica między estymowaną siłą ręki a wartością oczekiwaną siły ręki przeciwnika, przy założeniu że jego ręka jest wylosowana z rozkładu jednostajnego. Agresywność gracza jest wyliczana z agresywności podejmowanych przez niego decyzji. Zauważmy - wartość ta opisuje więc jak bardzo agresywny przeciwnik wydaje się być dla danego agenta. Agresywność nie jest używana bezpośrednio jako czynnik decyzyjny. Zamiast tego, siła ręki gracza jest odpowiednio modyfikowana przy uwzględnieniu średniej agresywności przeciwników. Warto zauważyć, że w przeciwieństwie do sieci neuronowych, estymowane własności stanu gry (siła ręki i ryzyko) są tu zdefiniowane explicite i wyliczane według ustalonych wzorów. Tej własności sieci neuronowe nie mają; starają się jedynie, w pewien sposób przy pomocy neuronów w warstwie pośredniej, uchwycić pewne cechy stanu gry (nie wiadomo tak naprawdę jakie). Oba czynniki (siła ręki, ryzyko) zostały znormalizowane do przedziału [0, 1]. Strategie są reprezentowane jako krotki funkcji [0, 1] 2 [0, 1], mówiące dla danej siły ręki i ryzyka z jakim (relatywnie) prawdopodobieństwem powinna być podjęta jaka akcja. Dokładniej, dla każdej możliwej decyzji d { pas, sprawdzenie, małe podbicie, średnie podbicie, duże podbicie } mamy osobną funkcję f d [0, 1] 2 [0, 1]. W każdym momencie, dla danego ryzyka r i siły ręki hs, agent podejmuje decyzję d z prawdopodobieństwem Opis ewolucji f d(r,hs) Σ d f d (r,hs). Na takich strategiach odbywała się ewolucja, która jednak została opisana niezbyt szczegółowo: nie wiemy ilu osobników znajdowało się w populacji, ile generacji składało się na proces ewolucji, ile gier / rozdań odbywało się w jednej generacji itd. Wiemy jednak, że autorzy rozważyli trzy różne typy agentów: data-driven, scratch i head-start (nazwy tak jak użyte w pracy), oznaczające odpowiednio: agentów nauczonych na danych treningowych bez użycia ewolucji, agentów wyewoluowanych z losowych funkcji i agentów wyewoluowanych z agenta data-driven. Eksperymenty pokazały, że strategie head-start najlepiej radziły sobie z każdym rodzajem przeciwników (tj. z agentami innych typów, z prostymi strategiami typu "zawsze pas" lub losową, a także z ludźmi), co nie powinno być zaskoczeniem dla czytelnika Problemy z pracą Problemów z tą pracą jest kilka, część z nich zauważyli sami autorzy. Przede wszystkim: Reprezentacja strategii Jedynymi czynnikami branymi pod uwagę przy podejmowaniu decyzji jest wspomniane już ryzyko i siła ręki gracza. W rezultacie, strategia jest opisana przez funkcję [0, 1] 2 [0, 1] 5. Wydaje się, że te informacje mogą być niewystarczające do podejmowania odpowiednich decyzji; zbyt dużo informacji o stanie gry jest pomijanych (np. potencjał ręki, czyli szanse na to że w następnej fazie gry siła ręki się polepszy, obecna faza gry, ilość graczy) lub ich znaczenie jest zmniejszone (np. duża agresywność pojedynczego gracza nie będzie właściwie zauważona). To może powodować, że zbyt wiele różnych sytuacji (w których oczekiwalibyśmy różnych 16

19 decyzji) zostanie utożsamionych i potraktowanych tak samo. Widać to na przykładzie agentów scratch, tj. ewoluowanych z losowych strategii: funkcje opisujące takich agentów są niezwykle proste. Taka reprezentacja strategii ma jedną zaletę: można łatwo przedstawić graficznie agenta i jest szansa na zrozumienie jego działania, co w przypadku sieci neuronowych jest praktycznie niemożliwe. Wydaje się jednak, że zaleta ta nie rekompensuje wad tak ubogiej reprezentacji. Modelowanie przeciwników Jedynym co można zakwalifikować jako modelowanie przeciwnika, jest ocena jego agresywności, która następnie jest mimo wszystko "gubiona" przez potraktowanie jej jako części oceny siły ręki. Nie są brane pod uwagę czynniki takie jak rozkład poszczególnych decyzji u przeciwników czy nawet decyzje podjęte przez nich w trakcie obecnego rozdania. Sposób oceniania agentów Agenci są oceniani według miejsca, które zajęli w rozgrywkach, a więc pojedynczą liczbą. Taki sposób nawet jeśli ocenia w pewien sposób czy agent A jest lepszy czy gorszy od B, nie ocenia tego jak bardzo jest on lepszy lub gorszy. Mogłoby to być akceptowalne w przypadku pokera Hold em ze stałym limitem, jednak w wersji bez limitu zyski lub straty mogą być ogromne. Wydaje się, że informacja na temat zysków / strat agenta w trakcie turnieju byłaby lepszym wyznacznikiem jego jakości. W szczególności agent, który często wygrywa minimalnie, ale od czasu do czasu przegrywa wszystkie swoje pieniądze przy takim sposobie oceniania dostaje wysoką ocenę; być może np. agent który często minimalnie przegrywa, ale od czasu do czasu bardzo znacząco wygrywa, powinien zostać oceniony lepiej. W pracy znajdujemy, że niewiarygodnie prymitywna strategia "zawsze pas" wcale nie wygląda źle na tle agentów wytworzonych w procesie ewolucji, co z jednej strony świadczy o jakości wyewoluowanych agentów, z drugiej jednak strony - gdyby wyniki przedstawić w postaci zysków / strat, nikt nie zwróciłby uwagi na taką strategię. Wiarygodność oceny agentów Właściwie wszystkie przeprowadzone eksperymenty porównują agentów powstałych w pracy między sobą. Jest zaledwie wspomniane, że agenci grali też przeciwko autorom. Brak jednak szczegółowych porównań np. z graczami on-line, lub z referencyjnymi strategiami innymi niż "zawsze pas" czy losową (więc na przykład z agentami powstałymi w innych pracach). W rezultacie ciężko jest obiektywnie ocenić jakość powstałych agentów. Optymalizacja parametrów Zostało przeprowadzonych bardzo niewiele eksperymentów sprawdzających np. inne funkcje liczące ryzyko czy agresywność, inne definicje małego / średniego / dużego zakładu, a nawet parametry samej ewolucji jak np. ilość generacji, ilość osobników w populacji czy częstość / rodzaj mutacji. Jest ewidentne, że nawet małe zmiany parametrów potencjalnie mogłyby prowadzić do lepszych wyników. 17

20 3.2. Agenci pokera Texas Hold em bez limitu tworzeni przez ewolucję sieci neuronowych [9] Ta publikacja opisuje wyniki prac kontynuowanych przez dwóch członków zespołu pracującego nad pracą wspomnianą powyżej. Widać jednak istotny postęp, w szczególności: Strategie są reprezentowane jako sieci neuronowe Rozważone są dodatkowe mechanizmy mające wspomagać ewolucję agentów: ko-ewolucja i galeria najlepszych wyników (hall of fame) Opis modelu agenta Strategie są reprezentowane przez sieci neuronowe o ustalonej strukturze: 35 neuronów wejściowych, 20 ukrytych, 5 wyjściowych - odpowiadających tym samym decyzjom co w poprzedniej pracy. Wejściami dla sieci są: ilość żetonów w puli, obecna wysokość zakładu, ilość przeciwników, odsetek wygrywających rąk, i dla każdego przeciwnika: ilość jego żetonów oraz jego całkowita i chwilowa agresywność. Aby obliczyć odsetek wygrywających rąk, wielokrotnie przeprowadzana jest symulacja wszystkich pozostałych kart. Dla każdego przypadku (po wylosowaniu przyszłych kart), można łatwo ocenić czy dana ręka wygra, zremisuje czy przegra jeśli dojdzie do pokazania kart. Odsetek wygrywających rąk ma być kompromisem pomiędzy siłą ręki a jej potencjałem. Agresywność gracza jest średnią z agresywności jego decyzji, gdzie pas ma agresywność 0, sprawdzenie - 1, a podbicie - x/bet jeśli agent podbił o x przy minimalnej wartości zakładu bet. Chwilowa agresywność jest liczona jako średnia agresywność z ostatnich 10 rozdań. Zostały więc rozwiązane problemy poprzedniej pracy: uboga reprezentacja strategii i prymitywne modelowanie przeciwników Problemy z pracą Reprezentacja strategii Wydaje się, że struktura sieci jest nietypowa (patrz sekcja 1.2 i [8], [16]): aż 25 neuronów pośrednich przy 35 wejściowych. Ponadto, w wejściach sieci nadal brakuje ważnych informacji o grze, np. ilości pozostałych żetonów, pozycji gracza. Być może zasadne byłoby też osobne wejście sieci na siłę ręki i osobne na jej potencjał, zamiast jednego na odsetek wygrywających rąk; są to współczynniki łatwe do obliczenia, znane i używane w środowisku pokerowym. Wiarygodność oceny agentów Podobnie jak w poprzedniej pracy, agenci są oceniani według miejsca zajętego w turnieju, co nie mówi nic o zyskach / stratach. Pomijając ten fakt, agenci są porównywani z najlepszymi agentami wyewoluowanymi z poprzedniej pracy (najlepszy data-driven, najlepszy head start i najlepszy scratch) oraz z następującymi strategiami referencyjnymi: zawsze pas, zawsze sprawdzaj, zawsze podbijaj, zawsze sprawdzaj lub podbijaj (50% szans na każdą z decyzji). Jest ewidentne, że takie referencyjne strategie mają mało wspólnego z rzeczywistością - można zaryzykować stwierdzenie, że nikt nie gra w pokera używając takich strategii. Z takimi przeciwnikami najlepsi wyewoluowani agenci zajmują średnio 3 miejsce w turnieju (agenci są oceniani w ten sam sposób co w poprzedniej pracy - średnie miejsce zajęte w turnieju). Niestety, trzeba przyznać - taki sposób przedstawienia wyników nie mówi zbyt wiele. 18

Odmiany Gry. Rozpoczęcie gry

Odmiany Gry. Rozpoczęcie gry Odmiany Gry Limit: każda runda ma określony wcześniej limit podbicia, Pot-Limit: w każdej rundzie gracz nie może postawić więcej niż wartość puli znajdującej się na stole, No-Limit: w każdej chwili można

Bardziej szczegółowo

Rachunek prawdopodobieństwa w grach losowych.

Rachunek prawdopodobieństwa w grach losowych. Rachunek prawdopodobieństwa w grach losowych. Lista zawiera kilkadziesiąt zadań dotyczących różnych gier z użyciem kart i kości, w tym tych najbardziej popularnych jak brydż, tysiąc itp. Kolejne zadania

Bardziej szczegółowo

Algorytmy genetyczne

Algorytmy genetyczne Algorytmy genetyczne Motto: Zamiast pracowicie poszukiwać najlepszego rozwiązania problemu informatycznego lepiej pozwolić, żeby komputer sam sobie to rozwiązanie wyhodował! Algorytmy genetyczne służą

Bardziej szczegółowo

Partition Search i gry z niezupełną informacją

Partition Search i gry z niezupełną informacją MIMUW 21 stycznia 2010 1 Co to jest gra? Proste algorytmy 2 Pomysł Algorytm Przykład użycia 3 Monte Carlo Inne spojrzenie Definicja Co to jest gra? Proste algorytmy Grą o wartościach w przedziale [0, 1]

Bardziej szczegółowo

Algorytm genetyczny (genetic algorithm)-

Algorytm genetyczny (genetic algorithm)- Optymalizacja W praktyce inżynierskiej często zachodzi potrzeba znalezienia parametrów, dla których system/urządzenie będzie działać w sposób optymalny. Klasyczne podejście do optymalizacji: sformułowanie

Bardziej szczegółowo

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II Ćwiczenia: Ukryte procesy Markowa lista kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II dr Jarosław Kotowicz Zadanie. Dany jest łańcuch Markowa, który może przyjmować wartości,,...,

Bardziej szczegółowo

Porównywanie populacji

Porównywanie populacji 3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski

Bardziej szczegółowo

Programowanie celowe #1

Programowanie celowe #1 Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem

Bardziej szczegółowo

Wyszukiwanie binarne

Wyszukiwanie binarne Wyszukiwanie binarne Wyszukiwanie binarne to technika pozwalająca na przeszukanie jakiegoś posortowanego zbioru danych w czasie logarytmicznie zależnym od jego wielkości (co to dokładnie znaczy dowiecie

Bardziej szczegółowo

10. Wstęp do Teorii Gier

10. Wstęp do Teorii Gier 10. Wstęp do Teorii Gier Definicja Gry Matematycznej Gra matematyczna spełnia następujące warunki: a) Jest co najmniej dwóch racjonalnych graczy. b) Zbiór możliwych dezycji każdego gracza zawiera co najmniej

Bardziej szczegółowo

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ TEORI GIER W EKONOMII WYKŁD 5: GRY DWUOSOOWE KOOPERCYJNE O SUMIE NIESTŁEJ dr Robert Kowalczyk Katedra nalizy Nieliniowej Wydział Matematyki i Informatyki UŁ Gry dwumacierzowe Skończoną grę dwuosobową o

Bardziej szczegółowo

Luty 2001 Algorytmy (4) 2000/2001

Luty 2001 Algorytmy (4) 2000/2001 Mając dany zbiór elementów, chcemy znaleźć w nim element największy (maksimum), bądź najmniejszy (minimum). We wszystkich naturalnych metodach znajdywania najmniejszego i największego elementu obecne jest

Bardziej szczegółowo

11. Gry Macierzowe - Strategie Czyste i Mieszane

11. Gry Macierzowe - Strategie Czyste i Mieszane 11. Gry Macierzowe - Strategie Czyste i Mieszane W grze z doskonałą informacją, gracz nie powinien wybrać akcję w sposób losowy (o ile wypłaty z różnych decyzji nie są sobie równe). Z drugiej strony, gdy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Patrycja Prokopiuk. Zastosowanie rachunku prawdopodobieństwa w Pokerze Pięciokartowym

Patrycja Prokopiuk. Zastosowanie rachunku prawdopodobieństwa w Pokerze Pięciokartowym Patrycja Prokopiuk Zastosowanie rachunku prawdopodobieństwa w Pokerze Pięciokartowym Wrocław 7 maja 04 Spis treści Wstęp........................................ Objaśnienie obliczeń................................

Bardziej szczegółowo

W. Guzicki Próbna matura, grudzień 2014 r. poziom rozszerzony 1

W. Guzicki Próbna matura, grudzień 2014 r. poziom rozszerzony 1 W. Guzicki Próbna matura, grudzień 01 r. poziom rozszerzony 1 Próbna matura rozszerzona (jesień 01 r.) Zadanie 18 kilka innych rozwiązań Wojciech Guzicki Zadanie 18. Okno na poddaszu ma mieć kształt trapezu

Bardziej szczegółowo

użytkownika 1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania

użytkownika 1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania 1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania 6 Część czwarta dokumentacja techniczna i dokumentacja użytkownika

Bardziej szczegółowo

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k. Funkcje wymierne Jerzy Rutkowski Teoria Przypomnijmy, że przez R[x] oznaczamy zbiór wszystkich wielomianów zmiennej x i o współczynnikach rzeczywistych Definicja Funkcją wymierną jednej zmiennej nazywamy

Bardziej szczegółowo

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Autoreferat do rozprawy doktorskiej OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Michał Mazur Gliwice 2016 1 2 Montaż samochodów na linii w

Bardziej szczegółowo

1. Liczby naturalne, podzielność, silnie, reszty z dzielenia

1. Liczby naturalne, podzielność, silnie, reszty z dzielenia 1. Liczby naturalne, podzielność, silnie, reszty z dzielenia kwadratów i sześcianów przez małe liczby, cechy podzielności przez 2, 4, 8, 5, 25, 125, 3, 9. 26 września 2009 r. Uwaga: Przyjmujemy, że 0 nie

Bardziej szczegółowo

METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu

METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu Kamil Figura Krzysztof Kaliński Bartek Kutera METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu Porównanie metod uczenia z rodziny TD z algorytmem Layered Learning na przykładzie gry w warcaby i gry w anty-warcaby

Bardziej szczegółowo

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce.

Teoria Gier - wojna, rybołówstwo i sprawiedliwość w polityce. Liceum Ogólnokształcące nr XIV we Wrocławiu 5 maja 2009 1 2 Podobieństwa i różnice do gier o sumie zerowej Równowaga Nasha I co teraz zrobimy? 3 Idee 1 Grać będą dwie osoby. U nas nazywają się: pan Wiersz

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.

Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony. GRY (część 1) Zastosowanie: Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony. Najbardziej znane modele: - wybór strategii marketingowych przez konkurujące ze sobą firmy

Bardziej szczegółowo

Maciej Piotr Jankowski

Maciej Piotr Jankowski Reduced Adder Graph Implementacja algorytmu RAG Maciej Piotr Jankowski 2005.12.22 Maciej Piotr Jankowski 1 Plan prezentacji 1. Wstęp 2. Implementacja 3. Usprawnienia optymalizacyjne 3.1. Tablica ekspansji

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Priorytetyzacja przypadków testowych za pomocą macierzy

Priorytetyzacja przypadków testowych za pomocą macierzy Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.

Bardziej szczegółowo

Automatyczny dobór parametrów algorytmu genetycznego

Automatyczny dobór parametrów algorytmu genetycznego Automatyczny dobór parametrów algorytmu genetycznego Remigiusz Modrzejewski 22 grudnia 2008 Plan prezentacji Wstęp Atrakcyjność Pułapki Klasyfikacja Wstęp Atrakcyjność Pułapki Klasyfikacja Konstrukcja

Bardziej szczegółowo

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. zajecia.jakubw.pl/nai Literatura: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym. WNT, Warszawa 997. PODSTAWOWE ZAGADNIENIA TECHNICZNE AI

Bardziej szczegółowo

Programowanie genetyczne, gra SNAKE

Programowanie genetyczne, gra SNAKE STUDENCKA PRACOWNIA ALGORYTMÓW EWOLUCYJNYCH Tomasz Kupczyk, Tomasz Urbański Programowanie genetyczne, gra SNAKE II UWr Wrocław 2009 Spis treści 1. Wstęp 3 1.1. Ogólny opis.....................................

Bardziej szczegółowo

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO. Rzeczywistość (istniejąca lub projektowana).. Model fizyczny. 3. Model matematyczny (optymalizacyjny): a. Zmienne projektowania

Bardziej szczegółowo

Ruletka czy można oszukać kasyno?

Ruletka czy można oszukać kasyno? 23 stycznia 2017 Ruletka czy można oszukać kasyno? M. Dworak, K. Maraj, S. Michałowski Plan prezentacji Podstawy ruletki System dwójkowy (Martingale) Czy system rzeczywiście działa? 1/22 Podstawy ruletki

Bardziej szczegółowo

Zajęcia nr. 3 notatki

Zajęcia nr. 3 notatki Zajęcia nr. 3 notatki 22 kwietnia 2005 1 Funkcje liczbowe wprowadzenie Istnieje nieskończenie wiele funkcji w matematyce. W dodaktu nie wszystkie są liczbowe. Rozpatruje się funkcje które pobierają argumenty

Bardziej szczegółowo

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa

Bardziej szczegółowo

Algorytmy sztucznej inteligencji

Algorytmy sztucznej inteligencji www.math.uni.lodz.pl/ radmat Przeszukiwanie z ograniczeniami Zagadnienie przeszukiwania z ograniczeniami stanowi grupę problemów przeszukiwania w przestrzeni stanów, które składa się ze: 1 skończonego

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU) SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU) 1. Opis problemu - ocena końcowa projektu Projekt jako nowe, nietypowe przedsięwzięcie wymaga właściwego zarządzania. Podjęcie się realizacji

Bardziej szczegółowo

0 + 0 = 0, = 1, = 1, = 0.

0 + 0 = 0, = 1, = 1, = 0. 5 Kody liniowe Jak już wiemy, w celu przesłania zakodowanego tekstu dzielimy go na bloki i do każdego z bloków dodajemy tak zwane bity sprawdzające. Bity te są w ścisłej zależności z bitami informacyjnymi,

Bardziej szczegółowo

8. Neuron z ciągłą funkcją aktywacji.

8. Neuron z ciągłą funkcją aktywacji. 8. Neuron z ciągłą funkcją aktywacji. W tym ćwiczeniu zapoznamy się z modelem sztucznego neuronu oraz przykładem jego wykorzystania do rozwiązywanie prostego zadania klasyfikacji. Neuron biologiczny i

Bardziej szczegółowo

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania Struktury i Algorytmy Wspomagania Decyzji Zadanie projektowe 2 Czas realizacji: 6 godzin Maksymalna liczba

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

3a. Wstęp: Elementarne równania i nierówności

3a. Wstęp: Elementarne równania i nierówności 3a. Wstęp: Elementarne równania i nierówności Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie zima 2017/2018 Grzegorz Kosiorowski (Uniwersytet Ekonomiczny 3a. Wstęp: w Krakowie) Elementarne równania

Bardziej szczegółowo

Programowanie w Baltie klasa VII

Programowanie w Baltie klasa VII Programowanie w Baltie klasa VII Zadania z podręcznika strona 127 i 128 Zadanie 1/127 Zadanie 2/127 Zadanie 3/127 Zadanie 4/127 Zadanie 5/127 Zadanie 6/127 Ten sposób pisania programu nie ma sensu!!!.

Bardziej szczegółowo

Zestaw do gry w pokera

Zestaw do gry w pokera Zestaw do gry w pokera Zasady Podstawy Taktyka Wprowadzenie do gry Tchibo GmbH D-22290 Hamburg 71872AB6X6III Zasady gry w pokera Talia kart Talia składa się z 52 kart. Występują 4 kolory po 13 kart. Do

Bardziej szczegółowo

Zadania laboratoryjne i projektowe - wersja β

Zadania laboratoryjne i projektowe - wersja β Zadania laboratoryjne i projektowe - wersja β 1 Laboratorium Dwa problemy do wyboru (jeden do realizacji). 1. Water Jug Problem, 2. Wieże Hanoi. Water Jug Problem Ograniczenia dla każdej z wersji: pojemniki

Bardziej szczegółowo

6.4 Podstawowe metody statystyczne

6.4 Podstawowe metody statystyczne 156 Wstęp do statystyki matematycznej 6.4 Podstawowe metody statystyczne Spóbujemy teraz w dopuszczalnym uproszczeniu przedstawić istotę analizy statystycznej. W szczególności udzielimy odpowiedzi na postawione

Bardziej szczegółowo

Projekt Sieci neuronowe

Projekt Sieci neuronowe Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego Ewaluacja biegłości językowej Od pomiaru do sztuki pomiaru Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego Tomasz Żółtak Instytut Badań Edukacyjnych oraz

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

AiSD zadanie trzecie

AiSD zadanie trzecie AiSD zadanie trzecie Gliwiński Jarosław Marek Kruczyński Konrad Marek Grupa dziekańska I5 5 czerwca 2008 1 Wstęp Celem postawionym przez zadanie trzecie było tzw. sortowanie topologiczne. Jest to typ sortowania

Bardziej szczegółowo

Aukcje groszowe. Podejście teoriogrowe

Aukcje groszowe. Podejście teoriogrowe Aukcje groszowe Podejście teoriogrowe Plan działania Aukcje groszowe Budowa teorii Sprawdzenie teorii Bibliografia: B. Platt, J. Price, H. Tappen, Pay-to-Bid Auctions [online]. 9 lipca 2009 [dostęp 3.02.2011].

Bardziej szczegółowo

Algorytmy genetyczne

Algorytmy genetyczne 9 listopada 2010 y ewolucyjne - zbiór metod optymalizacji inspirowanych analogiami biologicznymi (ewolucja naturalna). Pojęcia odwzorowujące naturalne zjawiska: Osobnik Populacja Genotyp Fenotyp Gen Chromosom

Bardziej szczegółowo

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je. Problem porządkowania zwanego również sortowaniem jest jednym z najważniejszych i najpopularniejszych zagadnień informatycznych. Dane: Liczba naturalna n i ciąg n liczb x 1, x 2,, x n. Wynik: Uporządkowanie

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Kto jeszcze gra w domino?

Kto jeszcze gra w domino? Mirosław Dąbrowski Kto jeszcze gra w domino? Domino, choć wciąż jeszcze można jego zestawy kupić w sklepach z zabawkami, nie należy już chyba do bardzo popularnych dziecięcych rozrywek. Szkoda, bo gra

Bardziej szczegółowo

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN Szkoła Wyższa Psychologii Społecznej d.wojcik@nencki.gov.pl dwojcik@swps.edu.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/

Bardziej szczegółowo

Gra dla 2-4 graczy w wieku 8-108 lat

Gra dla 2-4 graczy w wieku 8-108 lat Autor gry: Michael Ferch Ilustracje: Maciej Szymanowicz Gra dla 2-4 graczy w wieku 8-108 lat A to heca! Zwierzaki opuściły gospodarstwo i postanowiły pohasać po łące. Zadaniem graczy będzie łapanie zwierząt

Bardziej szczegółowo

Systemy uczące się Lab 4

Systemy uczące się Lab 4 Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego

Bardziej szczegółowo

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,

Bardziej szczegółowo

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

Zad. 3: Układ równań liniowych

Zad. 3: Układ równań liniowych 1 Cel ćwiczenia Zad. 3: Układ równań liniowych Wykształcenie umiejętności modelowania kluczowych dla danego problemu pojęć. Definiowanie właściwego interfejsu klasy. Zwrócenie uwagi na dobór odpowiednich

Bardziej szczegółowo

Liczba graczy: 2 4 Wiek graczy: 10+ Czas gry: min

Liczba graczy: 2 4 Wiek graczy: 10+ Czas gry: min Autorzy gry: Eilif Svensson i Kristian A. Østby Ilustracje: Kwanchai Moriya Liczba graczy: 2 4 Wiek graczy: 10+ Czas gry: 20 30 min ELEMENTY GRY 72 karty profesji Po 18 kart w każdym z 4 kolorów. Karty

Bardziej szczegółowo

Recenzja pracy doktorskiej mgr Tomasza Świsłockiego pt. Wpływ oddziaływań dipolowych na własności spinorowego kondensatu rubidowego

Recenzja pracy doktorskiej mgr Tomasza Świsłockiego pt. Wpływ oddziaływań dipolowych na własności spinorowego kondensatu rubidowego Prof. dr hab. Jan Mostowski Instytut Fizyki PAN Warszawa Warszawa, 15 listopada 2010 r. Recenzja pracy doktorskiej mgr Tomasza Świsłockiego pt. Wpływ oddziaływań dipolowych na własności spinorowego kondensatu

Bardziej szczegółowo

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych

Bardziej szczegółowo

Przykładowe rozwiązania

Przykładowe rozwiązania Przykładowe rozwiązania Poniższy dokument zawiera przykładowe rozwiązania zadań z I etapu I edycji konkursu (2014 r.). Rozwiązania w formie takiej jak przedstawiona niżej uzyskałyby pełną liczbę punktów

Bardziej szczegółowo

Metody probabilistyczne klasyfikatory bayesowskie

Metody probabilistyczne klasyfikatory bayesowskie Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych First Prev Next Last Go Back Full Screen Close Quit Metody probabilistyczne klasyfikatory bayesowskie Wykład 8 Marcin

Bardziej szczegółowo

RAPORT z diagnozy umiejętności matematycznych

RAPORT z diagnozy umiejętności matematycznych RAPORT z diagnozy umiejętności matematycznych przeprowadzonej w klasach czwartych szkoły podstawowej 1 Analiza statystyczna Wskaźnik Liczba uczniów Liczba punktów Łatwość zestawu Wyjaśnienie Liczba uczniów,

Bardziej szczegółowo

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

komputery? Andrzej Skowron, Hung Son Nguyen  Instytut Matematyki, Wydział MIM, UW Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,

Bardziej szczegółowo

Scenariusz zajęć. Moduł VI. Projekt Gra logiczna zgadywanie liczby

Scenariusz zajęć. Moduł VI. Projekt Gra logiczna zgadywanie liczby Scenariusz zajęć Moduł VI Projekt Gra logiczna zgadywanie liczby Moduł VI Projekt Gra logiczna zgadywanie liczby Cele ogólne: przypomnienie i utrwalenie poznanych wcześniej poleceń i konstrukcji języka

Bardziej szczegółowo

Wstęp do Informatyki zadania ze złożoności obliczeniowej z rozwiązaniami

Wstęp do Informatyki zadania ze złożoności obliczeniowej z rozwiązaniami Wstęp do Informatyki zadania ze złożoności obliczeniowej z rozwiązaniami Przykład 1. Napisz program, który dla podanej liczby n wypisze jej rozkład na czynniki pierwsze. Oblicz asymptotyczną złożoność

Bardziej szczegółowo

Optymalizacja ciągła

Optymalizacja ciągła Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej

Bardziej szczegółowo

Faza Określania Wymagań

Faza Określania Wymagań Faza Określania Wymagań Celem tej fazy jest dokładne określenie wymagań klienta wobec tworzonego systemu. W tej fazie dokonywana jest zamiana celów klienta na konkretne wymagania zapewniające osiągnięcie

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Łańcuchy Markowa: zagadnienia graniczne. Ukryte modele Markowa. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ KLASYFIKACJA STANÓW Stan i jest osiągalny

Bardziej szczegółowo

Gry o sumie niezerowej

Gry o sumie niezerowej Gry o sumie niezerowej Równowagi Nasha 2011-12-06 Zdzisław Dzedzej 1 Pytanie Czy profile równowagi Nasha są dobrym rozwiązaniem gry o dowolnej sumie? Zaleta: zawsze istnieją (w grach dwumacierzowych, a

Bardziej szczegółowo

Programowanie genetyczne - gra SNAKE

Programowanie genetyczne - gra SNAKE PRACOWNIA Z ALGORYTMÓW EWOLUCYJNYCH Tomasz Kupczyk, Tomasz Urbański Programowanie genetyczne - gra SNAKE II UWr Wrocław 2009 Spis treści 1. Wstęp 3 1.1. Ogólny opis.....................................

Bardziej szczegółowo

Granice ciągów liczbowych

Granice ciągów liczbowych Granice ciągów liczbowych Obliczyć z definicji granicę ciągu o wyrazie, gdzie jest pewną stałą liczbą. Definicja: granicą ciągu jest liczba, jeśli Sprawdzamy, czy i kiedy granica rozpatrywanego ciągu wynosi

Bardziej szczegółowo

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN d.wojcik@nencki.gov.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/ Podręcznik Iwo Białynicki-Birula Iwona

Bardziej szczegółowo

Organizacja informacji

Organizacja informacji Organizacja informacji 64 CZYTANIE ARTYKUŁU Z GAZETY To zadanie ma nauczyć jak: wybierać tematy i rozpoznawać słowa kluczowe; analizować tekst, aby go zrozumieć i pamiętać; przygotowywać sprawozdanie;

Bardziej szczegółowo

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,

Bardziej szczegółowo

Obliczanie procentu danej liczby i liczby na podstawie jej. procentu jako umiejętności kluczowe w pracy doradcy. inwestycyjnego.

Obliczanie procentu danej liczby i liczby na podstawie jej. procentu jako umiejętności kluczowe w pracy doradcy. inwestycyjnego. 1 Obliczanie procentu danej liczby i liczby na podstawie jej procentu jako umiejętności kluczowe w pracy doradcy inwestycyjnego. Czas trwania zajęć: ok. 40 minut Kontekst w jakim wprowadzono doświadczenie:

Bardziej szczegółowo

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami

Teoria gier matematyki). optymalności decyzji 2 lub więcej Decyzja wpływa na wynik innych graczy strategiami Teoria gier Teoria gier jest częścią teorii decyzji (czyli gałęzią matematyki). Teoria decyzji - decyzje mogą być podejmowane w warunkach niepewności, ale nie zależą od strategicznych działań innych Teoria

Bardziej szczegółowo

Temat: Sieci neuronowe oraz technologia CUDA

Temat: Sieci neuronowe oraz technologia CUDA Elbląg, 27.03.2010 Temat: Sieci neuronowe oraz technologia CUDA Przygotował: Mateusz Górny VIII semestr ASiSK Wstęp Sieci neuronowe są to specyficzne struktury danych odzwierciedlające sieć neuronów w

Bardziej szczegółowo

Wykład 4. Określimy teraz pewną ważną klasę pierścieni.

Wykład 4. Określimy teraz pewną ważną klasę pierścieni. Wykład 4 Określimy teraz pewną ważną klasę pierścieni. Twierdzenie 1 Niech m, n Z. Jeśli n > 0 to istnieje dokładnie jedna para licz q, r, że: m = qn + r, 0 r < n. Liczbę r nazywamy resztą z dzielenia

Bardziej szczegółowo

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ

TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ. dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ TEORIA GIER W EKONOMII WYKŁAD 2: GRY DWUOSOBOWE O SUMIE ZEROWEJ dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ Definicja gry o sumie zerowej Powiemy, że jest grą o

Bardziej szczegółowo

Wnioskowanie bayesowskie

Wnioskowanie bayesowskie Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,

Bardziej szczegółowo

Matematyk Ci powie, co łączy Eugeniusza Oniegina i gry hazardowe

Matematyk Ci powie, co łączy Eugeniusza Oniegina i gry hazardowe Matematyk Ci powie, co łączy Eugeniusza Oniegina i gry hazardowe Empik każdego inspiruje inaczej Aleksander Puszkin (1799 1837) Andrey (Andrei) Andreyevich Markov (1856 1922) Wśród 20 tysięcy początkowych

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

LABORATORIUM Z FIZYKI

LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)

Bardziej szczegółowo

3.5. Podejście socjotechniczne do problemów organizacji

3.5. Podejście socjotechniczne do problemów organizacji 3.5. Podejście socjotechniczne do problemów organizacji 3.5.1. Postępowanie Aby sprostać wymaganiom skutecznego rozwiązywania problemów organizacji, postępowanie badawcze powinno spełniać następujące warunki:

Bardziej szczegółowo

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa Kampus Ochota 18 kwietnia 2015 Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski Andrey (Andrei)

Bardziej szczegółowo

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą

TEORIA GIER W NAUKACH SPOŁECZNYCH. Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą TEORIA GIER W NAUKACH SPOŁECZNYCH Gry macierzowe, rybołówstwo na Jamajce, gry z Naturą Przypomnienie Gry w postaci macierzowej i ekstensywnej Gry o sumie zerowej i gry o sumie niezerowej Kryterium dominacji

Bardziej szczegółowo

Tworzenie gier na urządzenia mobilne

Tworzenie gier na urządzenia mobilne Katedra Inżynierii Wiedzy Teoria podejmowania decyzji w grze Gry w postaci ekstensywnej Inaczej gry w postaci drzewiastej, gry w postaci rozwiniętej; formalny opis wszystkich możliwych przebiegów gry z

Bardziej szczegółowo

Metody Optymalizacji: Przeszukiwanie z listą tabu

Metody Optymalizacji: Przeszukiwanie z listą tabu Metody Optymalizacji: Przeszukiwanie z listą tabu Wojciech Kotłowski Instytut Informatyki Politechniki Poznańskiej email: imię.nazwisko@cs.put.poznan.pl pok. 2 (CW) tel. (61)665-2936 konsultacje: wtorek

Bardziej szczegółowo

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych Algorytm Genetyczny zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych Dlaczego Algorytmy Inspirowane Naturą? Rozwój nowych technologii: złożone problemy obliczeniowe w

Bardziej szczegółowo