Jak oceniać, gdy nic nie wiemy?

Podobne dokumenty

General Game Playing. Aktualnie stosowane algorytmy i metody konstrukcji agentów

Dwaj gracze na przemian kładą jednakowe monety na stole tak, aby na siebie nie nachodziły Przegrywa ten, kto nie może dołożyć monety

MAGICIAN: GUIDED UCT. Zastosowanie automatycznie generowanej funkcji oceny w GGP

Algorytmy dla gier dwuosobowych

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

MAGICIAN: A GGP Agent. Analiza zależności w opisie reguł gier GGP

Propozycje tematów zadań

Sztuczna Inteligencja i Systemy Doradcze

UCT. Wybrane modyfikacje i usprawnienia

TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w

Wykład 7 i 8. Przeszukiwanie z adwersarzem. w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach

Partition Search i gry z niezupełną informacją

MAGICIAN: GUIDED UCT. Ekstrakcja uniwersalnej funkcji ewaluacyjnej z rezultatów symulacji UCT

Porównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT

TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

Oszacowanie złożoności problemu rozgrywki w otwarte karty w brydżu

POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI

Instrukcja obsługi programu

Rozrywka z komputerem - portal KURNIK.PL

Uczenie ze wzmocnieniem aplikacje

Quizuj z YouTube. Elżbieta Straszak Tomasz Karoń

Tworzenie gier na urządzenia mobilne

Metoda ewolucyjnego doboru współczynników funkcji oceniającej w antywarcabach

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

Tworzenie gier na urządzenia mobilne

ramki witraży. 40 kostek (8 x 5 kolorów czerwony, żółty, zielony, niebieski, fioletowy) 12 znaczników uznania.

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Wprowadzenie do teorii gier

SID Wykład 4 Gry Wydział Matematyki, Informatyki i Mechaniki UW

WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI

Dodatkowo planowane jest przeprowadzenie oceny algorytmów w praktycznym wykorzystaniu przez kilku niezależnych użytkowników ukończonej aplikacji.

Każdemu z uczestników gry rozdajemy co najmniej 9 (dziewięć) kart ze stosu z zielonym i niebieskim brzegiem:

Instytut Badań Systemowych Polskiej Akademii Nauk. Streszczenie rozprawy doktorskiej

B.VII USTALANIE KOLEJNOŚCI MIEJSC W TURNIEJACH PZSZACH. q Ustalanie kolejności miejsc (PZSzach) Część B.VII str. 1

Σ. MiNI/MatLic/AiPP/ /Kolokwium-IB (20)

ELEMENTY GRY. 21 kart prezentów. 7 płytek gejsz. 7 żetonów przychylności gejsz. 8 znaczników akcji (po 4 znaczniki dla każdego gracza)

Powiatowy Turniej FIFA18 REGULAMIN. STOWARZYSZENIE ESPORT POLSKA

ELEMENTY GRY. 21 kart prezentów. 7 płytek gejsz. 7 żetonów przychylności gejsz. 8 znaczników akcji (po 4 znaczniki dla każdego gracza)

Kurs z NetLogo - część 4.

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

MODELOWANIE RZECZYWISTOŚCI

Przebieg gry podczas budowania Tutaj chodzi o zastosowanie Elementów Budowli i zdobycie Żetonów Budowy.

Gra Labirynt Zajęcia 5

Gamification. (gryzacja, gryfikacja, grywalizacja, a może gamifikacja?)

Temat 1: Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

Mikroekonomia. O czym dzisiaj?

ZADANIE 1/GRY. Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

Gra: Partnerstwo biznesowe

Technologie, które. ..zmienią świat edukacji? Bartłomiej Polakowski, PwC CEE Learning Methods Manager.

Competence analysis of trainers and educators and confirmation of Strategic Management Virtual Game topics. Polish version

Uczenie maszynowe end-to-end na przykładzie programu DeepChess. Stanisław Kaźmierczak

Programowanie genetyczne, gra SNAKE

Algorytmy z powrotami. Algorytm minimax

Automat stanów w General Game Playing. Gajusz Chmiel

Technologie cyfrowe semestr letni 2018/2019

Przygotowanie gry dla uczniów

Jak powstawał Wielki Mistrz

Algorytmiczne aspekty teorii gier: Wykład 5

Młodzi internauci - od paradygmatu ryzyka do paradygmatu szans. prof. UAM dr hab. Jacek Pyżalski Uniwersytet im. A. Mickiewicza w Poznaniu

Adam Meissner. SZTUCZNA INTELIGENCJA Gry dwuosobowe

Sztuczna inteligencja stan wiedzy, perspektywy rozwoju i problemy etyczne. Piotr Bilski Instytut Radioelektroniki i Technik Multimedialnych

Propensity Score Matching

Przykład. 1 losuje kartę z potasowanej talii, w której połowa kart ma kolor czarny a połowa czerwony. Postać ekstensywna Postać normalna

ATOLL. Wykonali: Aleksandra Kuchta, Łukasz Wójcik, Sztuczna Inteligencja, Semestr trzeci, Kierunek Informatyka, Wydział Informatyki i Zarządzania,

Bisymulacja. Niezawodność systemów współbieżnych i obiektowych. Grzegorz Maj Grzegorz Maj Bisymulacja

3. MINIMAX. Rysunek 1: Drzewo obrazujące przebieg gry.

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania

Dłuższy przykład: Dwie firmy, Zeus i Atena, produkują sprzęt muzyczny. Zeus jest większy, Atena jest ceniona za HF. Wprowadzają nowy produkt, np.

Inspiracje kognitywne w procesie analizy pozycji szachowej

Metody selekcji cech

The Sims 3: Po Zmroku

Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych

Czy gry komputerowe szkodzą naszym dzieciom?

160 kart: 111 liter 49 zadań

NBA Live 2004 Poradnik GRY-OnLine. Nieoficjalny poradnik GRY-OnLine do gry. NBA Live. autor: Krzysztof Bakterria Mielnik

Budowa modeli klasyfikacyjnych o skośnych warunkach

Rachunki trudne i nudne? Nie muszą, mogą być ciekawe!

IINSTRUKCJA. Gra dla 2-4 graczy w wieku lat

Punkty równowagi w grach koordynacyjnych

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Nie graj w gry! Naucz swoje programy robić to za Ciebie.

T Z A A R G I P F. Kris Burm. Deutsch... 3 English... 7 Français Italiano Nederlands Español Polski... 27

AI i ML w grach. Przegląd zagadnień i inspiracje systemów human-like

Uczenie ze wzmocnieniem aplikacje

Programowanie Funkcyjne. Prezentacja projektu, 7 stycznia 2008, Juliusz Sompolski

Wartość Shapleya. Oskar Skibski. Institute of Informatics, University of Warsaw. 8 października 2012

Plan Prezentacji Wprowadzenie Telefonia IP a bezpieczeństwo istotne usługi ochrony informacji i komunikacji w sieci Klasyczna architektura bezpieczeńs

Możliwe miejsca umieszczenia karty. W tym przykładzie występuje 5 możliwych miejsc, w których można umieścić kartę Ant-Man. ABOMINATION BULLDOZER

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Gry. wykład 5. dr inż. Joanna Kołodziejczyk. Zakład Sztucznej Inteligencji ISZiMM. ESI - wykład 5 p. 1

DEBIUT NA RYNKU NEWCONNECT

Elementy teorii gier. Badania operacyjne

Czym zajmuje się teroia gier

ZASADY GRY: COERCEO. Language: English / Polski

Jak zawsze wyjdziemy od terminologii. While oznacza dopóki, podczas gdy. Pętla while jest

Liczby nadrzeczywiste i gry Hackenbusha

Inteligencja + Maciej M. Sysło

Brain Game. Wstęp. Scratch

Transkrypt:

Jak oceniać, gdy nic nie wiemy? Jasiek Marcinkowski II UWr 25 października 2012 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 1 / 10

Jak się gra w gry, o których dużo wiemy? Normalne gry? Interesują nas normalne, dwuosobowe gry z pełną informacją. Najlepiej o dość dużej liczbie osiągalnych stanów (żeby nie były za nudne). Na przykład: Go, Gomoku, Reversi (Othello), Szachy, Shogi, Connect four, Nim,... Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 2 / 10

Jak komputery grają w normalne gry? Standardowy model: funkcja oceniająca pozycję (stan) przeszukiwanie osiągalnych stanów (mini-max) redukcja α β (ang. α β pruning) Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 3 / 10

Dobre ocenianie pozycji kluczem do zwycięstwa W szachach to jest fragment, który się najintensywniej rozwija. Turek (1769), Claude Shannon (1950), Alan Turing (1951), Los Alamos Chess (1956), Advanced Chess (Garry Kasparov, 1998) Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 4 / 10

Jak się uczyć grać w grę? Naturalne podejście zagrać sobie parę razy. n.p. skąd wiemy, że w tej grze czarny już wygrał? Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 5 / 10

Jak się uczyć grać w grę? Będziemy kojarzyć cechy pozycji ze zwycięstwem. M. Kirci, N. Sturtevant, J. Schaeffer, A GGP Feature Learning Algorithm, KI - KÜNSTLICHE INTELLIGENZ Volume 25, Number 1 (2011), 35-42 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 6 / 10

Jak się uczyć grać w grę? Będziemy kojarzyć cechy pozycji ze zwycięstwem. Strategie obronne? Sposoby na zablokowanie cech związanych ze zwycięstwem. M. Kirci, N. Sturtevant, J. Schaeffer, A GGP Feature Learning Algorithm, KI - KÜNSTLICHE INTELLIGENZ Volume 25, Number 1 (2011), 35-42 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 6 / 10

Jak się uczyć grać w grę? Dotychczas te cechy były znajdowane tylko przy końcu rozgrywki. Patrzymy wyżej w drzewie, na ruchy, które kontrybuowały do cechy związanej ze zwycięstwem (na przykład był gdzieś ruch (mark 1 1 x)). Oczywiście ten ruch jest mniej ważny (nadamy mu mniejszą wartość) zgodnie ze wzorem 100 V level 1 gdzie V = 0.9. Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 7 / 10

Jak się uczyć grać w grę? Dotychczas te cechy były znajdowane tylko przy końcu rozgrywki. Patrzymy wyżej w drzewie, na ruchy, które kontrybuowały do cechy związanej ze zwycięstwem (na przykład był gdzieś ruch (mark 1 1 x)). Oczywiście ten ruch jest mniej ważny (nadamy mu mniejszą wartość) zgodnie ze wzorem 100 V level 1 gdzie V = 0.9. Ale oni tego używają tylko do lepszego losowania ruchów w metodzie Monte-Carlo. Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 7 / 10

Prawdziwa gra pozycyjna Będzie prawdziwa funkcja oceny pozycji. Funkcja pomocnicza eval : F S [0; 1] służy do oceniania, w jakim stopniu pozycja z S 1 spełnia warunki f F. Wartości powyżej 2 to raczej spełnia, poniżej 1 raczej nie. 2 S. Haufe, D. Michulke, S. Schiffel, M.Thielscher, Knowledge-Based General Game Playing, KI - Künstliche Intelligenz, March 2011, Volume 25, Issue 1, pp 25-33 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 8 / 10

Prawdziwa gra pozycyjna Będzie prawdziwa funkcja oceny pozycji. Funkcja pomocnicza eval : F S [0; 1] służy do oceniania, w jakim stopniu pozycja z S 1 spełnia warunki f F. Wartości powyżej 2 to raczej spełnia, poniżej 1 raczej nie. 2 Funkcja h : P S [0; 1] będzie funkcją oceny pozycji z S dla gracza r P. h(r, z, v) v v GV h(r, z) = v v GV gdzie h(r, z, v) = { eval(goal(r, v) terminal, z), if goal(r, v) eval(goal(r, v) terminal, z), w.p.p. S. Haufe, D. Michulke, S. Schiffel, M.Thielscher, Knowledge-Based General Game Playing, KI - Künstliche Intelligenz, March 2011, Volume 25, Issue 1, pp 25-33 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 8 / 10

Prawdziwa gra pozycyjna funkcja eval eval(a, z) [0, 1] eval(f g, z) = T (eval(f, z), eval(g, z)) eval(f g, z) = S(eval(f, z), eval(g, z)) eval( f, z) = 1 eval(f, z) Żeby koniunkcja dwóch raczej prawd nie była raczej fałszem nie stosuje się n. p. T (x, y) = x y. Zamiast tego, ustalamy t [0, 1] i definiujemy { max(a b, t), if min(a, b) > 1 T (a, b) = 2 a b, w.p.p. Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 9 / 10

Więcej cudów 1 Wartości przypisane do różnych celów (goals) we wzorze na h(r, z) są arbitralne. Może warto je jakoś dostosowywać do rzeczywistości? Günther M, Schiffel S, Thielscher M (2009) Factoring general games. In: Proceedings of the IJCAI workshop on general intelligence in game-playing agents (GIGA), pp 27 34 E. Cox, E. Schkufza, R. Madsen, M. R. Genesereth, Factoring general games using propositional automata, In: Proceedings of the IJCAI Workshop on General Intelligence in Game-Playing Agents (GIGA). (2009) 13 20 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 10 / 10

Więcej cudów 1 Wartości przypisane do różnych celów (goals) we wzorze na h(r, z) są arbitralne. Może warto je jakoś dostosowywać do rzeczywistości? Autorzy proponują swoją własną metodę tworzenia sieci neuronowych na podstawie predykatów. Günther M, Schiffel S, Thielscher M (2009) Factoring general games. In: Proceedings of the IJCAI workshop on general intelligence in game-playing agents (GIGA), pp 27 34 E. Cox, E. Schkufza, R. Madsen, M. R. Genesereth, Factoring general games using propositional automata, In: Proceedings of the IJCAI Workshop on General Intelligence in Game-Playing Agents (GIGA). (2009) 13 20 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 10 / 10

Więcej cudów 1 Wartości przypisane do różnych celów (goals) we wzorze na h(r, z) są arbitralne. Może warto je jakoś dostosowywać do rzeczywistości? Autorzy proponują swoją własną metodę tworzenia sieci neuronowych na podstawie predykatów. 2 Knowledge extraction pozostawia nas w niepewności, co do słuszności odkrywanych właściwości Günther M, Schiffel S, Thielscher M (2009) Factoring general games. In: Proceedings of the IJCAI workshop on general intelligence in game-playing agents (GIGA), pp 27 34 E. Cox, E. Schkufza, R. Madsen, M. R. Genesereth, Factoring general games using propositional automata, In: Proceedings of the IJCAI Workshop on General Intelligence in Game-Playing Agents (GIGA). (2009) 13 20 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 10 / 10

Więcej cudów 1 Wartości przypisane do różnych celów (goals) we wzorze na h(r, z) są arbitralne. Może warto je jakoś dostosowywać do rzeczywistości? Autorzy proponują swoją własną metodę tworzenia sieci neuronowych na podstawie predykatów. 2 Knowledge extraction pozostawia nas w niepewności, co do słuszności odkrywanych właściwości Autorzy proponują udowadnianie różnych cech (w szczególności niezmienników) za pomocą theorem proverów. Günther M, Schiffel S, Thielscher M (2009) Factoring general games. In: Proceedings of the IJCAI workshop on general intelligence in game-playing agents (GIGA), pp 27 34 E. Cox, E. Schkufza, R. Madsen, M. R. Genesereth, Factoring general games using propositional automata, In: Proceedings of the IJCAI Workshop on General Intelligence in Game-Playing Agents (GIGA). (2009) 13 20 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 10 / 10

Więcej cudów 1 Wartości przypisane do różnych celów (goals) we wzorze na h(r, z) są arbitralne. Może warto je jakoś dostosowywać do rzeczywistości? Autorzy proponują swoją własną metodę tworzenia sieci neuronowych na podstawie predykatów. 2 Knowledge extraction pozostawia nas w niepewności, co do słuszności odkrywanych właściwości Autorzy proponują udowadnianie różnych cech (w szczególności niezmienników) za pomocą theorem proverów. 3 Powielenie gry powoduje multiplikatywny wzrost liczby stanów. Günther M, Schiffel S, Thielscher M (2009) Factoring general games. In: Proceedings of the IJCAI workshop on general intelligence in game-playing agents (GIGA), pp 27 34 E. Cox, E. Schkufza, R. Madsen, M. R. Genesereth, Factoring general games using propositional automata, In: Proceedings of the IJCAI Workshop on General Intelligence in Game-Playing Agents (GIGA). (2009) 13 20 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 10 / 10

Więcej cudów 1 Wartości przypisane do różnych celów (goals) we wzorze na h(r, z) są arbitralne. Może warto je jakoś dostosowywać do rzeczywistości? Autorzy proponują swoją własną metodę tworzenia sieci neuronowych na podstawie predykatów. 2 Knowledge extraction pozostawia nas w niepewności, co do słuszności odkrywanych właściwości Autorzy proponują udowadnianie różnych cech (w szczególności niezmienników) za pomocą theorem proverów. 3 Powielenie gry powoduje multiplikatywny wzrost liczby stanów. Dużo wysiłku idzie w oddzielanie niezależnych podgier. Günther M, Schiffel S, Thielscher M (2009) Factoring general games. In: Proceedings of the IJCAI workshop on general intelligence in game-playing agents (GIGA), pp 27 34 E. Cox, E. Schkufza, R. Madsen, M. R. Genesereth, Factoring general games using propositional automata, In: Proceedings of the IJCAI Workshop on General Intelligence in Game-Playing Agents (GIGA). (2009) 13 20 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 10 / 10