Gry umysłowe: człowiek kontra maszyna
|
|
- Krystian Krzemiński
- 9 lat temu
- Przeglądów:
Transkrypt
1 Gry umysłowe: człowiek kontra maszyna Wykład przeprowadzony na Politechnice Krakowskiej 24 kwietnia 2013 w ramach projektu POKL /10, studia zamawiane na kierunku Informatyka Wydziału Inżynierii Elektrycznej i Komputerowej Maciej Świechowski
2 Plan Wprowadzenie Klasyfikacja gier Algorytmy wprowadzające Przegląd gier i pojedynków człowieka z komputerem Czego brakuje? Obecne trendy i wyzwania GGP Podsumowanie
3 O czym nie opowiem To nie jest wykład z programowania gier. szkoda, to byłby ciekawy temat!
4 Gra pojęcie wieloznaczne Wiele osób naukowo zajmuje się metodami sztucznej inteligencji w grach pracując w istocie w obrębie różnych obszarów słowo jest używane w wielu kontekstach
5 Klasyfikacja Teoria gier Gry umysłowe Gry komputerowe (gry video) Gry jako symulacja sztucznego życia
6 Rozróżnienie typów na podstawie motywacji Teoria gier Gry komputerowe Symulacja sztucznego życia Gry umysłowe
7 silnie sformalizowane gry Teoria gier głównie zastosowania związane z ekonomią, gospodarką, prawami rynku często można całkowicie rozwiązać problem - dowodzić optymalnego zachowania celem jest bardziej wynik niż sama gra np. ustalenie strategii postępowania lub znalezienie równowagi (por. Nash Equilibrium)
8 Gry komputerowe celem jest dostarczenie rozrywki liczy się satysfakcjonująca gra AI - efekt wizualny brak silnych formalizmów, AI nawet nie musi grać na tych samych zasadach często stosowane są różnorakie sztuczki celem nie jest stworzenie niepokonanego gracza nie może być niepokonany, jednocześnie przekonujący (plausible)
9 Gry komputerowe Stosowane metody: skrypty (predefiniowane zachowanie brak AI) algorytmy wyszukiwania drogi mapy wpływów drzewa behawioralne i decyzyjne hierarchiczne automaty stanów Badania w zakresie tworzenia botów dla wielu gier. Przykłady: Starcraft (bardzo dużo prac, głównie w Azji) Unreal Tournament, Counter-Strike
10 [Artificial Life] Gry typu symulacja życia gry jako pewne zasady rządzące światem ciężko mówić o graczach i współzawodnictwie Np. Conway s Game of Life, Framsticks celem jest opracowanie reguł symulacji
11 Gry umysłowe abstrakcyjne gry takie jak np. Szachy czy Brydż programy grające mają dostarczyć rozrywki (wymagający przeciwnik) ale również grać najsilniej jak potrafią zwykle ogromna przestrzeń stanów (gry kombinatoryczne)
12 Gry umysłowe szukanie nowych strategii dla gier środowisko testowe tanie deterministyczne powtarzalne testowanie algorytmów i metod przeszukiwania
13 Metryki Ilość graczy: Zwykle klasyczne gry umysłowe są 2-osobowe. Gra synchroniczna (symultaniczna) lub turowa (sekwencyjna): w grach turowych gracze ruszają się na przemian w grach synchronicznych wszyscy gracze wykonują akcje jednocześnie, po czym następuje zmiana stanu gry Złożoność: długość wymiar przestrzeni stanów stopień rozgałęzienia
14 Metryki Gry deterministyczne i niedeterministyczne: czy występuje element losowości np. rzut kostką lub tasowanie kart Gry o pełnej lub niepełnej informacji: w każdym kroku dana jest pełna informacja o stanie gry każdy gracz ma dostęp do tej informacji Gry o pełnej informacji np. Szachy, Warcaby Gry o niepełnej informacji np. Brydż, Magic The Gathering
15 Metryki Gra o sumie zerowej (silnie konkurencyjna) lub nie: Czy zysk gracza jest równoważny z równą co do wartości stratą pozostałych graczy? Np. zdefiniowane wypłaty: [100, 0] [50,50] [0,100] Wypłata ZYSK A STRATA A ZYSK B STRATA B SUMA [100, 0] [50, 50] [0, 100] Jeśli wszystkie zyski i straty (zapisane z minusem) sumują się do 0, to gra jest o sumie zerowej
16 Metryki Gra skończona lub nieskończona 1. Skończona liczba graczy 2. Skończona liczba możliwych stanów gry 3. Skończona liczba legalnych akcji do wyboru w każdym stanie 4. Skończona liczba kroków potrzebnych do przejścia ze stanu początkowego do terminalnego (jeśli przynajmniej jeden warunek nie jest spełniony, to gra jest nieskończona)
17 Metryki Gra silnie wygrywalna (strongly winnable): Jeśli dla pewnego gracza istnieje sekwencja jego akcji, która prowadzi do stanu z maksymalną wypłatą (tego gracza). Gra słabo wygrywalna (weakly winnable): Jeśli dla każdego gracza, istnieje sekwencja połączonych akcji graczy, która prowadzi do stanu z maksymalną wygraną (każdego z graczy)
18 Początki [rok 1770] Wolfgang von Kempelen maszyna zwana The Turk
19 The Turk Pisał o nim Edgar Allan Poe
20 Podstawa większości programów grających Drzewo gry Drzewo: acykliczny graf spójny Graf (prosty): G = V, E, E V V V > 0, V niepusty zbiór wierzchołków E 0, E { u, v : u, v V u v} zbiór krawędzi
21 Pełny graf posiada Drzewo gry V ( V 1) 2 krawędzi Grafy można postrzegać kombinatorycznie, topologicznie, geometrycznie... Graf skierowany: krawędzie mają zwrot, czyli e = (u, v) (v, u)
22 Drzewo gry Drzewo, w którym: wierzchołek oznacza kompletny opis stanu w grze korzeń oznacza stan początkowy krawędź (u,v) oznacza akcję w grze (prostą lub złożoną) powodującą przejście ze stanu u i v. (stany połączone krawędzią to minimalne sąsiednie stany, które mogą wystąpić w grze)
23 Drzewo gry
24 Złożoność gry Złożoność przestrzeni stanów (state-space complexity) liczba unikalnych stanów legalnie osiągalnych w grze Stopień rozgałęzienia (BF, Branching Factor) średnia liczba akcji dostępna w danym stanie gry czyli średnia liczba potomków każdego węzła nie-liścia Długość gry średnia długość ścieżki w drzewie od korzenia do liścia
25 Złożoności przykładowych gier Nazwa gry Przestrzeń stanów Branching Factor Długość Kółko i krzyżyk Connect Warcaby Szachy Backgammon Othello (Reversi) Go Arimaa Szacunkowa liczba atomów w obserwowalnym wszechświecie: [źródło: NASA]
26 Drzewo gry Drzewo gry to abstrakcyjny matematyczny obiekt, który istnieje dla każdej gry mówi się, że drzewa gry się nie tworzy, a przeszukuje Przy odpowiedniej złożoności gry, nie da się operować na pełnym drzewie: limit pamięci limit mocy obliczeniowej
27 Rozwiązanie Funkcja ewaluacyjna + algorytm przeszukiwania
28 Funkcja ewaluacyjna Zwana także funkcją oceny, f. heurystyczną lub heurystyczną funkcją ewaluacyjną. Przybliżona ocena sytuacji jak bardzo wygrywamy lub przegrywamy. Stosowana tam, gdzie trzeba odciąć drzewo na pewnej głębokości. Im bardziej adekwatna funkcja oceny, tym lepiej.
29 Algorytmy przeszukiwania Różne algorytmy przeszukiwania drzewa. od lat ważna dziedzina informatyki, ze względu na uniwersalność: algorytmy stosuje się nie tylko do gier Dobór algorytmu zależy od charakterystyki gry oraz wiedzy o niej dostępnej.
30 Algorytmy przeszukiwania DFS, BFS IDFS A*, IDA* D* Min-Max Alfa-beta MTD(f) Negamax Nega-scout FSSS Hill climbing Tabele Transpozycji MCTS UCT... lub wspomagające przeszukiwanie
31 Min-Max Johna von Neumann [1944] Intuicyjna zasada postępowania Założenie, że każdy gracz stara się maksymalizować swój zysk Podejmując decyzje staramy się maksymalizować minimalny zysk (minimalizować stratę) W klasycznej definicji: tylko dla gier o sumie zerowej
32 Min-max
33 Min-max Wiele zastosowań i uogólnień w statystycznej teorii decyzji (estymator minimax) na gry z uwzględnieniem niepewności na bardziej skomplikowane gry, z elementami współpracy na gry nie będące o sumie zerowej
34 Alfa-beta (odcięcia) Obserwacja, że nie wszystkie gałęzie muszą być sprawdzane. Funkcja przyjmuje 2 dodatkowe parametry stanowiące okno przeszukiwań w poddrzewie danego wierzchołka: alfa (ograniczenie na minimalny wynik gracza MAX) beta (ograniczenie na maksymalny wynik gracza MIN)
35 Alfa-beta (odcięcia)
36 Alfa-beta (odcięcia)
37 Algorytm MTD(f) Memory-enhanced Test Driver with node n and value f Wstępne oszacowanie wartości beta Wywoływanie alfa-beta z pustymi oknami na podstawie warunków określających, kiedy okno okazało się niewłaściwe, alfa-beta uruchamiana jest ponownie z innym oknem Tabele Transpozycji tablica haszująca przechowująca raz odwiedzone stany
38 Algorytm A* Algorytm iteracyjny Powszechnie stosowany do wyszukiwania drogi w grafie (szeroko stosowany w grach komputerowych). W grach umysłowych pojawia się głównie w przypadku łamigłówek (gier jednoosobowych).
39 Algorytm A* Budowana jest ścieżka od wierzchołka startowego (korzeń) do docelowego (wygrana) Przechowywane w każdym kroku: Kolejka priorytetowa najlepszych do tej pory fragmentów ścieżek Zbiór niesprawdzonych jeszcze wierzchołków OPEN
40 Algorytm A* Wybór kolejnego wierzchołka x z OPEN następuje tak, aby minimalizować wyrażenie: f x = g x + h(x) g(x) długość (ważona) ścieżki od wierzchołka startowego do x h(x) heurystyczne oszacowanie ważonej długości ścieżki od x do wierzchołka końcowego
41 Algorytm A* A* jest kompletny znajduje poprawne rozwiązanie w skończonym czasie dla dowolnych danych wejściowych A* jest optymalny z dokładnością do heurystyki, jeżeli heurystyka jest dopuszczalna. Warunek dopuszczalności heurystyki dla A*: x,y h x d x, y + h y gdzie d(x,y) to faktyczna (nie znana apriori) odległość między x i y.
42 Człowiek vs Maszyna na przykładzie kilku gier
43 Wybrane gry Warcaby Szachy Othello Backgammon Go Jeopardy Scrabble Poker krótko
44 Warcaby
45 Warcaby ang. English Draughts/American Checkers plansza 8x8 bicia pionami jedynie do przodu promocja na damkę (króla) umożliwia bicia i poruszanie się do tyłu Istnieje polska odmiana: Polish draughts: plansza 10x10 damki mają zasięg całej linii
46 Warcaby Pierwsza praca [A. L. Samuel, 1956]: Making a computer play Draughts Pierwszy program [Samuel, ]: zademonstrowany w telewizji celem pokazanie, że po 8-10 godzinach nauki, program będzie grał lepiej niż jego twórca 1959: ulepszona wersja programu poziom przeciętnego amatora
47 Warcaby, początki Idea: Zaproponowanie 128-bitowego kodowania Uczenie poprzez rozgrywanie gier (rote learning) Przechowywanie wszystkich napotkanych w grach stanów plansz wraz z tzw. backed-up score backup-score obliczany na podstawie wielomianu liniowego wybranych cech na określonym poziomie ply (ruchów na przód)
48 Warcaby, początki Cechy funkcji w pierwszej wersji programu: ocena materiału (różnicy bierek) ze zwiększonymi wagami dla króli ocena potencjalnej równej wymiany materiału, oddzielnie w sytuacji wygrywającej (korzystnie) i przegrywającej (niekorzystnie) zakleszczenia brak ruchów
49 Warcaby, początki Zorganizowanie stanów plansz w formie drzewa gry Drzewo rosło wraz z kolejnymi grami Backup-score uaktualniany na zasadzie min-max
50 Warcaby, początki Prekursor metody TD-learning (TD - ang. temporal difference) 1956: poziom średniego amatora 1959: zwiększenie ilości cech do 22, lepsza gra, ale wciąż nie mistrzowska
51 Marion Tinsley vs Chinook [1992] Chinook ( ) Autorami naukowcy z Uniwesytetu w Albercie (Kanada) Rozwijany: Dr Marion Tinsley ( ) Mistrz świata w warcaby w latach i W ciągu 40 lat przegrał tylko 7 partii!
52 Tinsley vs Chinook - 4 : 33 : 2 W ciągu 45 lat kariery, najwybitniejszy warcabista, przegrał 9 gier, w tym 2 z Chinookiem. Do rewanżu nie doszło, gdyż Tinsley zmarł na raka Od tego momentu, żaden inny gracz nie wygrał z Chinookiem
53 Chinook 4 funkcje ewaluacyjne (w zależności od fazy gry) Każda funkcja złożona z 25 podstawowych cech ocena materiału układy bierek wzorce na planszy szczególne pola (narożniki) bicia z rozwidleniami (forks) Itd...
54 Chinook 4 funkcje ewaluacyjne (w zależności od fazy gry) Głębokie przeszukiwanie drzewa (> 12ply) Baza danych końcówek: 1989: : : obliczenie rozproszone na wiele komputerów
55 Checkers is Solved Gra okazała się być remisowa przy optymalnej grze obu graczy
56 Grand Challenge of AI The drosophilia of AI Szachy
57 Szachy - historia Za kolebkę szachów uznaje się Indie (VI wiek) [ok. 1890] Torres y Quevedo: maszyna grającą końcówki król + wieża vs król. [1944] von Neumann, algorytm min-max [1950] Claude Shannon: Programming a computer for playing chess [1953] Alan Turing tworzy pierwszy program szachowy
58 Szachy - historia [1968] Mistrz Świata David Levy postawił zakład, że żaden komputer nie pokona go przez 10 lat.
59 Szachy - historia [1968] zakład Davida Levy ego Wygrał zakład, ale przegrał w 1989 z ówcześnie najsilniejszym komputerem Deep Thought. Ogromne zainteresowane programami szachowymi od lat 70 (do lat ) Na temat szachów prawdopodobnie napisano więcej prac niż o jakiejkolwiek innej grze.
60 Garry Kasparov Deep Blue [1997]
61 Garry Kasparov vs Deep Blue 2 : 1 : 3
62 Deep Blue Przede wszystkim superkomputer 259 miejsce na ówczesnej liście top500 Dla porównania: Ostatnie notowanie [ ], 259 miejsce: x Intel Xeon E5 8C 109.9TFlops Klaster 30 węzłów x 480 specjalizowanych procesorów szachowych pozycji na sekundę
63 Deep Blue Funkcja oceny 8000 cech, w tym: Materiał Wybrane wzorce pozycyjne Kontrola środka gry Układ pionów Ochrona króla Mobilność Efektywne reprezentacja planszy: szybkie manipulacje bitowe
64 Deep Blue Baza debiutów: 4000 unikalnych otwarć z gier arcymistrzów Baza końcówek: Wszystkie możliwe zakończenia gry z 5 bierkami na planszy Dużo zakończeń z 6 bierkami Przeszukiwanie: Negascout + Iterative Search + Quiescence Search
65 Szachy Widoczny rozwój maszyn szachowych do roku Deep Fritz, Deep Junior, Hydra, Rybka, Pocket Fritz, Blue Gene, Houdini 3308 ELO ranking szachowy maszyny (Houdini) 2872 ELO najwyższy ranking osiągnięty przez człowieka (Magnus Carlsen) 6 graczy na świecie ma ranking powyżej 2800
66 Szachy Obecnie człowiek praktycznie nie ma szans pokonania topowych programów... nawet na maszynach klasy desktop PC
67 Othello (Reversi)
68 Othello Znana od końca XVIII wieku, nowoczesna wersja sformalizowana w 1973 r. (Goro Hasegawa). Wyjątkowo dobrze grają Polacy i Japończycy Plansza 8x8, kamienie białe/czerwone i czarne można dostawiać kamienie jedynie przyległe do kamieni przeciwnika należy zamykać linie, aby zdobywać kamienie wroga gra addytywna, lecz o bardzo dużej zmienności
69 Murakami vs Logistello [1997] Takeshi Murakami Mistrz świata, najlepszy gracz 1997 roku. Logistello Program grający w Othello Stworzone w ramach pracy doktorskiej Michaela Buro
70 Murakami vs Logistello 0:6 Program nie był ani przez moment zagrożony. Obecnie człowiek nie ma szans z Logistello i innymi najlepszymi programami.
71 Logistello Połączenie wielu pomysłów w jednym programie. Funkcja ewaluacyjna: kombinacja liniowa cech związanych z grą dynamicznie zarządzane cegiełki Wyróżnienie 13 faz gry w zależności od liczby dysków: 13-16, 17-20,..., w każdej fazie oddzielna funkcja ewaluacyjna
72 Logistello Elementy funkcji ewaluacyjnej: stabilność dysków bezpieczeństwo dysków maksymalizacja swojej mobilności minimalizacja mobilności przeciwnika parzystość siła poszczególnych pól
73 Logistello Dobór wag: statystycznie przy pomocy regresji liniowej próbka licząca 3 miliony pozycji
74 Logistello Program w fazie nauki przeprowadzał gry ze samym sobą. Węzły w drzewie etykietowane były wynikami poprzednich partii
75 Logistello Dynamicznie generowane bazy otwarć, dynamicznie uaktualniane na podstawie gier Dostosowywanie się do przeciwnika etykietowanie poprzednich gier nie przegrywanie gier pod rząd w taki sam sposób nie powtarzanie idealnie takich samych wygranych gier, jeśli przeciwnik zaczyna dobrze się bronić kopiowanie wygrywających ruchów przeciwnika po zmianie stron
76 Logistello Kilka metod przeszukiwania: ProbCUT (redukcja szerokości drzewa gry przez szybkie odrzucanie potencjalnie złych ruchów na bazie estymacji) Przeszukiwanie od 10 do 23 ruchów w głąb drzewa przy standardowej 30 minutowej grze ItDeepening Negamax Standardowy min-max jako plan awaryjny
77 Backgammon (pol. Tryktrak)
78 Backgammon Nietypowa plansza w porównaniu do prostokątnych zestawów pól Element losowości dwa rzuty kostką przed w każdej turze W każdej turze gracz przesuwa swoje kamienie zgodnie z wartościami wylosowanymi na kostkach oraz regułami przemieszczania Cel: pozbycie się swoich kamieni
79 TD-Gammon Najsłynniejszy program do gry w backgammona, rozwijany w latach Autor: G. Tesauro Grał na poziomie odrobinę poniżej najwyżej sklasyfikowanych arcymistrzów. Podejście rodem z inteligencji obliczeniowej (Computational Intelligence)
80 Inteligencja obliczeniowa Oparta na liczbach, a nie symbolach Stosowana głównie do problemów, które nie są efektywnie algorytmizowalne Metody zwykle uniwersalne czarne skrzynki w postaci modeli obliczeń. Przykłady: Sztuczne sieci neuronowe Algorytmy rojowe Systemy rozmyte Algorytmy genetyczne i ewolucyjne, memetyczne
81 TD-Gammon
82 TD-Gammon Reprezentacja planszy jako sieć neuronowa: 198 neuronów 24 lokacje x [4 kodowanie ułożenia białych w lokacji] x [4 kodowanie ułożenia czarnych] + 2 neurony na zakodowanie liczby pionów w domu + 2 neurony na zakodowanie liczby pionów poza grą + 2 neurony na zakodowanie wyniku obu graczy
83 TD-Gammon Sieć obserwuje sekwencje pozycji na planszy od początku gry do zakończenia w postaci zakodowanych wektorów X[1].X[f]. Dla każdego wzoru wejściowego sieć generuje sygnał wyjściowy Y[t] (int[4]). W każdym kroku czasowym t algorytm TD( ) zmienia tak wagi w sieci, aby ocena Y[t] była bliższa ocenie Y[t+1]
84 TD-Gammon Jedno z najbardziej efektownych zastosowań algorytmu TD Gracz pokazał zupełnie nowe strategie gry nie stosowane przez graczy do tej pory Silna gra była obserwowana od symulacji uczących. Wyniki poprawiały się do osiągnięcia nasycenia przy symulacji.
85 TD-Gammon [D-Gammon's exclusive training through self-play (rather than tutelage) enabled it to explore strategies that humans previously hadn't considered or had ruled out erroneously. Its success with unorthodox strategies had a significant impact on the backgammon community Tesauro 1995]
86 Go
87 Go Chińska gra, której początki sięgają 2500 lat wstecz Trudna strategicznie gra Plansza 19x19 (goban) Wiele konkurujących ze sobą celów Potyczki lokalne i globalne 40 milionów zarejestrowanych graczy [2008]
88 Go [1968] początki prac nad programami grającymi [1998] - silni gracze pokonują najlepsze programy nawet z handicapem 25 kamieni. handicap: strata wyrównująca siły Ranking gry w Go [k kyu; d amatorski dan; p profesjonalny dan] 30-20k: początkujący 19-10k: amator 9 1k: średnio-zaawansowany 1 8d : zaawansowany 1 9p: profesjonalista 10p: tytuł honorowy za specjalne osiągnięcia
89 Go [2012] najlepsze programy MoGo, Zen19D i CrazyStone posiadają poziom około 5p na maszynie 28-procesorowej w wersji gry 15 sekund na ruch Wciąż gorzej od mistrzów, ale nastąpił przełom.
90 Go Najważniejszym przełomem było zastosowanie symulacji Monte-Carlo i algorytmu UCT.
91 Monte-Carlo Tree Search (MCTS) Wykonujemy losowe symulacje i przechowujemy statystyki w węzłach: sumaryczny wynik gry każdego z graczy liczbę odwiedzin w węźle średni wynik wyliczany na podstawie powyższych dwóch Podejście typu knowledge-free: brak jawnie stworzonej funkcji ewaluacyjnej Wystarczy zaimplementować mechanikę gry
92 Monte-Carlo Tree Search (MCTS)
93 Monte-Carlo Tree Search (MCTS) Selekcja: w każdym węźle rozpoczynając od wierzchołka wybieramy najlepszego potomka do kontynuacji przeszukiwania Rozwinięcie: gdy jesteśmy w liściu to tworzymy nowy węzeł Symulacja: gramy losowo aż do osiągnięcia stanu terminalnego Propagacja wsteczna: uaktualniamy statystyki średni wynik oraz liczbę odwiedzin w każdym węźle na ścieżce, którą wybraliśmy
94 Monte-Carlo Tree Search (MCTS) Podstawowy schemat MCTS. Każdą z faz można komplikować i optymalizować
95 Monte-Carlo Tree Search (MCTS) Symulacje Monte-Carlo pierwszy raz opisane jako propozycja gry w Go zostały wyśmiane i zignorowane. Pojawiło się jednak ulepszenie, które spowodowało przełomowy wręcz wzrost siły gry.
96 Jednoręcy bandyci Jesteśmy w kasynie, gdzie mamy rząd N jednorękich bandytów do wyboru do gry. każdy automat ma swoją dystrybuantę wypłat (oczywiście nie jest nam znana) Cel: maksymalny zysk Pytanie: na których maszynach grać?
97 UCB (Upper Confidence Bounds) 1. Najpierw próbujemy każdy automat raz 2. Następnie według wzoru: b = arg max i Q i + C ln(n) T(b i, n) b* - bandyta, do wybrania Q i - średnia wypłata i-tego bandyty n - liczba gier do tej pory T(b i,n) - liczba gier na i-tym bandycie do tej pory C - współczynnik skalowania eksploracji
98 UCT (UCB applied for Trees) 1. Najpierw próbujemy każdy automat raz 2. Następnie według wzoru: a = arg max a A(s) Q(s, a) + C ln N(s) N(s, a) a* - akcja do wybrania s - bieżący stan Q(s,a) - średni wynik gry przy wykonaniu akcji a w stanie s N(s) - liczba dotychczasowych odwiedzin stanu s N(s,a) - liczba dotychczasowych wyborów akcji a w stanie s
99 UCT (UCB applied for Trees) Połączenie MCTS/UCT jest asymptotycznie zbieżne do uogólnionego min-max. W programach Go oprócz MCTS/UCT także wiele optymalizacji takich jak np: bardziej inteligentne symulacje losowe (quasi-losowe) wykrywanie oczywistych silnych akcji unikanie oczywistych poświęceń optymalizacja kolejności testowania ruchów heurystyki historyczne baza otwarć
100 Scrabble
101 Scrabble Maven (Brian Sheppard, rozwijany od 1986), licencjonowany przez Hasbro Historyczny wynik: Podział gry na 3 fazy (mid, pre-end, end) Słownik wszystkich słów (American English) Algorytm GADDAG generowania słów na planszy Ponad 400 wzorców synergii Potrafi również przeszkadzać przeciwnikom Przeszukiwanie do 14 ruchów
102 Jeopardy!
103 Jeopardy! Watson System zbudowany przez IBM Pierwszy taki projekt od czasów Deep Blue Rozpoczęcie prac: 2006 W 2011 wygrał quiz Jeopardy! pokonując dwóch zwycięzców z lat poprzednich (transmitowany w TV) Watson wygrał milion dolarów.
104 Jeopardy! Watson wygrał milion dolarów. czyli wg nieoficjalnych informacji od głównego projektanta (T. Pearson) zwrócił 1/3 swojego kosztu. Nie był podłączony do internetu Posiadał dużą bazę wiedzy offline np. całą wikipedię Szczegóły stosowanych rozwiązań są tajemnicą IBM.
105 Watson
106 Watson Obecnie przeprogramowany jako doradca w Memorial Sloan-Kettering Cancer Center i powiązanym towarzystwie ubezpieczeń zdrowotnych WellPoint. Oczekiwano, że Watson spróbuje zdać Test Turinga. Nigdy do jego zgłoszenia jednak nie doszło.
107 Poker
108 Poker Od 2006 roku rozgrywane są mistrzostwa komputerowych graczy. Autorami najsilniejszych programów: Poki, Polaris są pracownicy Uniwersytetu w Albercie - Poker Research Group Gra jest dochodowa, więc prace mają duże zainteresowanie
109 Poker Prosta mechanika gry jedynie 3 akcje do wyboru: Fold, Check/Call, Raise [X] Baza danych: Siły układów pre-flop Siły rąk Siły pozycji Podręcznikowa teoria Pokera (ICM) Modelowanie przeciwnika tworzenie bazy danych dotychczasowych zagrań Niedeterministyczny element blefu
110 Poker W pojedynkach Heads-Up z profesjonalistami: Fixed Limit: poziom porównywalny z mistrzami No limit: człowiek ma lekką przewagę W poker roomach, wiele gier z przypadkowymi graczami: programy bardzo dochodowe. Bazowanie na statystyce i błędach popełnianych przez ludzi
111 Wynik potyczki dla 8 gier Maszyna: Warcaby Szachy Othello Scrabble Jeopardy Remis: Backgammon Poker Człowiek: Go
112 Wniosek Tam, gdzie działają metody typu brute-force (można relatywnie dużo przeliczyć) lub silna gra jest łatwo algorytmizowana, komputer dzierży supremację.
113 Wniosek Tam, gdzie działają metody tybu brute-force (można relatywnie dużo przeliczyć) lub silna gra jest łatwo algorytmizowana, komputer dzierży supremację. To wcale nie oznacza, że komputer gra inteligentnie albo że mało zostało do zrobienia.
114 Obecne trendy Prace w obrębie gier trudnych takich jak Go czy Arimaa Nowe nurty: Intuicja Kreatywność, podejścia kognitywistyczne Wielozadaniowość
115 Wielozadaniowość
116 AI systems are dumb because Al researchers are too clever. Jaques Pitrat (1968)
117 General Game Playing (GGP) General Game Playing jako ogólny nurt jako nazwa własna konkursu wprowadzonego w 2005 roku Idea, aby tworzyć programy zdolne grać w dowolne gry na wysokim poziomie. podobnie jak ludzie
118 Idea GGP Programy grające w konkretne gry są mocno wyspecjalizowane. metody siłowe czasem mało w nich klasycznie rozumianej sztucznej inteligencji inteligencją popisują się twórcy programów dokonując analizy gry i dobierając metody ciężko przenieść takie mechanizmy na inne dziedziny (brak uniwersalności)
119 Idea GGP Jeden program (agent GGP) do grania w wiele gier. To program ma opracować metodę gry. Powrót do korzeni AI. Takie programy muszą integrować wiele aspektów: reprezentacja wiedzy domenowej wnioskowanie i rozumowanie logiczne tworzenie abstrakcyjnych modeli nauka podejmowanie decyzji automatyczne dostosowywanie metod do problemu
120 GGP Competition Coroczne, ogólnoświatowe mistrzostwa: Zewnętrznie organizowane i bezstronne środowisko testowe dla agentów GGP Sława dla zwycięzcy i $ Zwycięzcy są licznie cytowani ; 2012 w ramach konferencji IAAA na konferencji IJCAI
121 Game Manager (GameMaster)
122 GameMaster Nadzoruje przebieg rozgrywki Technicznie jest klientem, a gracze są serwerami do których GM się podłącza Pośredniczy w komunikacji Wysyła reguły gry i parametry rozgrywki Zbiera legalne akcje od każdego gracza i odsyła pełny wektor akcji wykonanych przez graczy W przypadku nielegalnego ruchu lub braku odpowiedzi w przewidzianym czasie, GM wybiera za gracza ruch losowy
123 Wymiana komunikatów
124 Klasa dostępnych gier Gracze muszą być w stanie zrozumieć reguły Do opisu został wybrany GDL (Game Description Language) wariacja Dataloga, będącego podzbiorem Prologa Klasa gier opisywana przez GDL-I (w wersji pierwszej): skończone deterministyczne synchroniczne
125 Game Description Language Logika pierwszego rzędu (First-Order Logic) Opiera się na predykatach, regułach, faktach Wyróżnione słowa kluczowe: do sterowania przebiegiem gry: role(r) init(p) true(p) does(r, a) legal (r, a) next(p) goal(r, v [0 100]) terminal distinct(v,w)
126 Game Description Language S zestaw stanów gry r 1,..., r n nazwy ról w n-osobowej grze I 1,..., I n zestaw n akcji, jeden zestaw dla każdego gracza a 1,..., a n zestaw legalnych akcji, a i I i x S I 1 x... x I n x S S funkcja uaktualnienia stanów s 1 stan początkowy, element należący do S g 1,..., g n para [cel,wypłata], g i S x [ ] T zestaw stanów końcowych (terminalnych)
127 GDL w praktyce 1. Fakty, które określają dynamiczny stan. początkowy zbiór realizacji zdefiniowany przy pomocy init po wykonanych akcjach następuje uaktualnienie (frame update) przy pomocy reguły next 2. Fakty stałe jawnie podane w regułach można je interpretować jako prawa fizyki w danej grze 3. Reguły związane ze słowami kluczowymi odpytywane w odpowiednich momentach symulacji rozgrywki 4. Pozostałe reguły dowolnie definiowane dla gry (wystarczy, żeby nazwa nie kolidowała) Reguły są w postaci implikacji z warunków wynika pewien zbiór faktów. Zbiór wszystkich implikacji danej reguły definiuje równoważność.
128 ... (<= (legal xplayer (mark?x?y)) (true (cell?x?y b)) (true (control xplayer))) (<= (legal oplayer (mark?x?y)) (true (cell?x?y b)) (true (control oplayer))) (<= (legal?player noop) (role?player) (not (true (control?player)))... (<= (row?m?x) (true (cell?m 1?x)) (true (cell?m 2?x)) (true (cell?m 3?x))) (<= (column?m?x) (true (cell 1?m?x)) (true (cell 2?m?x)) (true (cell 3?m?x))) (<= (line?x) (row?m?x)) (<= (line?x) (column?m?x)) (<= (line?x) (diagonal?x)) (<= open (true (cell?m?n b)))... (<= (goal xplayer 100) (line x)) (<= (goal xplayer 50) (not (line x)) (not (line o)) (not open)) (<= (goal xplayer 0) (line o)) (<= (goal oplayer 100) (line o)) (<= terminal (line x)) (<= terminal (line o)) (<= terminal (not open))
129 (role white) (role black) (init (cell 1 1 b)) (init (cell 1 2 b)) (init (cell 1 3 b)) (init (cell 2 1 b))... (init (cell 3 3 b)) (init (control xplayer)) (<= (next (cell?m?n x)) (does xplayer (mark?m?n)) (true (cell?m?n b))) (<= (next (cell?m?n x)) (does xplayer (mark?m?n)) (true (cell?m?n b))) (<= (next (cell?m?n b)) (does?w (mark?j?k)) (true (cell?m?n b)) (or (distinct?m?j) (distinct?n?k)))
130 Zwycięzcy mistrzostw GGP 2005 ClunePlayer, USA (UCLA) 2006 FluxPlayer, Niemcy (Dresden University of Technology) 2007 CadiaPlayer, Islandia (Reykjavik University) 2008 CadiaPlayer, Islandia (Reykjavik University) 2009 Ary, Francja (Paris 8) 2010 Ary, Francja (Paris 8) 2011 TurboTurtle, USA (absolwent Stanforda) 2012 CadiaPlayer, Islandia (Reykjavik University), 7 miejsce mojego gracza
131 Podsumowanie Gry i programy grające od lat są zarówno techniczną ciekawostką jak i przedmiotem badań naukowych. W wielu grach maszyny osiągnęły poziom znacznie przewyższający możliwości gry człowieka. Ale czy warto konkurować z dźwigiem w podnoszeniu ciężarów?
132 Podsumowanie Wciąż istnieją gry, dla których nie istnieją wydajne programy. Głównym powodem jest stopień rozgałęzienia eliminujący wydaje przeszukiwanie. W rywalizacji na równych zasadach np. uczeniu się nowych gier, maszyna na razie nie jest w stanie konkurować z człowiekiem. Czy maszyny mogą posiadać intuicję, kreatywność, inteligencję? Czy są to jedynie cechy organizmów żywych?
133 Oczekiwania Prawdziwie uniwersalne systemy Gracze co najmniej dorównujący ludziom w znacznej większości gier Przetwarzanie języka naturalnego Podawanie zasad w języku ludzkim Computer Vision System obserwuje elementy gier, planszę, karty, figury posiada percepcję Robotyka Aby w gry fizycznie grały roboty, a nie tylko programy
134 Dziękuję za uwagę
MAGICIAN. czyli General Game Playing w praktyce. General Game Playing
MAGICIAN czyli General Game Playing w praktyce General Game Playing 1 General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej w ramach AAAI National Conference
Wyznaczanie strategii w grach
Wyznaczanie strategii w grach Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Definicja gry Teoria gier i konstruowane na jej podstawie programy stanowią jeden z głównych
POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI
POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI mgr inż. Karol Walędzik k.waledzik@mini.pw.edu.pl prof. dr hab. inż. Jacek
Tworzenie gier na urządzenia mobilne
Katedra Inżynierii Wiedzy Teoria podejmowania decyzji w grze Gry w postaci ekstensywnej Inaczej gry w postaci drzewiastej, gry w postaci rozwiniętej; formalny opis wszystkich możliwych przebiegów gry z
Sztuczna Inteligencja i Systemy Doradcze
Sztuczna Inteligencja i Systemy Doradcze Przeszukiwanie przestrzeni stanów gry Przeszukiwanie przestrzeni stanów gry 1 Gry a problemy przeszukiwania Nieprzewidywalny przeciwnik rozwiązanie jest strategią
WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI
POLITECHNIKA WARSZAWSKA WYDZIAŁ MECHANICZNY ENERGETYKI I LOTNICTWA MEL WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI NS 586 Dr inż. Franciszek Dul 6. GRY POSZUKIWANIA W OBECNOŚCI PRZECIWNIKA Gry Pokażemy, w jaki
Narzędzia AI. Jakub Wróblewski jakubw@pjwstk.edu.pl Pokój 312. http://zajecia.jakubw.pl SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE)
Narzędzia AI Jakub Wróblewski jakubw@pjwstk.edu.pl Pokój 312 http://zajecia.jakubw.pl SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE) Nauka o maszynach realizujących zadania, które wymagają inteligencji
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ Wykład 7. O badaniach nad sztuczną inteligencją Co nazywamy SZTUCZNĄ INTELIGENCJĄ? szczególny rodzaj programów komputerowych, a niekiedy maszyn. SI szczególną własność
Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH
Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH Przeszukiwanie przestrzeni rozwiązań, szukanie na ślepo, wszerz, w głąb. Spis treści: 1. Wprowadzenie 3. str. 1.1 Krótki Wstęp
Algorytmy dla gier dwuosobowych
Algorytmy dla gier dwuosobowych Wojciech Dudek Seminarium Nowości Komputerowe 5 czerwca 2008 Plan prezentacji Pojęcia wstępne (gry dwuosobowe, stan gry, drzewo gry) Algorytm MiniMax Funkcje oceniające
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ Jak określa się inteligencję naturalną? Jak określa się inteligencję naturalną? Inteligencja wg psychologów to: Przyrodzona, choć rozwijana w toku dojrzewania i uczenia
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 9 PRZESZUKIWANIE GRAFÓW Z
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ SZTUCZNA INTELIGENCJA dwa podstawowe znaczenia Co nazywamy sztuczną inteligencją? zaawansowane systemy informatyczne (np. uczące się), pewną dyscyplinę badawczą (dział
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Jak oceniać, gdy nic nie wiemy?
Jak oceniać, gdy nic nie wiemy? Jasiek Marcinkowski II UWr 25 października 2012 Jasiek Marcinkowski (II UWr) Jak oceniać, gdy nic nie wiemy? 25 października 2012 1 / 10 Jak się gra w gry, o których dużo
Metody przeszukiwania
Metody przeszukiwania Co to jest przeszukiwanie Przeszukiwanie polega na odnajdywaniu rozwiązania w dyskretnej przestrzeni rozwiązao. Zwykle przeszukiwanie polega na znalezieniu określonego rozwiązania
Archipelag Sztucznej Inteligencji
Archipelag Sztucznej Inteligencji Istniejące metody sztucznej inteligencji mają ze sobą zwykle niewiele wspólnego, więc można je sobie wyobrażać jako archipelag wysp, a nie jako fragment stałego lądu.
Wstęp do Sztucznej Inteligencji
Wstęp do Sztucznej Inteligencji Rozwiązywanie problemów-i Joanna Kołodziej Politechnika Krakowska Wydział Fizyki, Matematyki i Informatyki Rozwiązywanie problemów Podstawowe fazy: Sformułowanie celu -
Ocena pozycji szachowych w oparciu o wzorce
Ocena pozycji szachowych w oparciu o wzorce Stanisław Kaźmierczak s.kazmierczak@mini.pw.edu.pl 2 Agenda Motywacja Statystyki Metoda statyczna sortowania ruchów Metoda następstwa wzorców Metoda podobieństwa
Obliczenia równoległe w General Game Playing
Obliczenia równoległe w General Game Playing promotor: prof. dr hab. Jacek Mańdziuk 1/66 Plan Krótkie przypomnienie GGP/MiNI-Player Motywacja Pomysł 2012 Pomysł 2013 Porównanie Podsumowanie 2/66 General
Sztuczna inteligencja stan wiedzy, perspektywy rozwoju i problemy etyczne. Piotr Bilski Instytut Radioelektroniki i Technik Multimedialnych
Sztuczna inteligencja stan wiedzy, perspektywy rozwoju i problemy etyczne Piotr Bilski Instytut Radioelektroniki i Technik Multimedialnych Plan wystąpienia Co to jest sztuczna inteligencja? Pojęcie słabej
SID Wykład 4 Gry Wydział Matematyki, Informatyki i Mechaniki UW
SID Wykład 4 Gry Wydział Matematyki, Informatyki i Mechaniki UW slezak@mimuw.edu.pl Gry a problemy przeszukiwania Nieprzewidywalny przeciwnik rozwiazanie jest strategia specyfikujac a posunięcie dla każdej
Tworzenie gier na urządzenia mobilne
Katedra Inżynierii Wiedzy Wykład 11 O czym dzisiaj? labirynty, dużo labiryntów; automaty komórkowe; algorytmy do budowy labiryntów; algorytmy do szukania wyjścia z labiryntów; Blueprints i drzewa zachowań
Rozwiązywanie problemów metodą przeszukiwania
Rozwiązywanie problemów metodą przeszukiwania Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Reprezentacja problemu w przestrzeni stanów Jedną z ważniejszych metod sztucznej
Alfa-beta Ulepszenie minimax Liczba wierzchołk ow w drzewie gry. maksymalnie wd. minimalnie wbd/2c + wdd/2e Algorytmy przeszukiwania drzewa gry 5
Zastosowanie metody Samuela doboru współczynników funkcji oceniajacej w programie grajacym w anty-warcaby Daniel Osman promotor: dr hab. inż. Jacek Mańdziuk 1 Spis treści Algorytmy przeszukiwania drzewa
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013 http://www.wilno.uwb.edu.
SYLLABUS na rok akademicki 01/013 Tryb studiów Studia stacjonarne Kierunek studiów Informatyka Poziom studiów Pierwszego stopnia Rok studiów/ semestr /3 Specjalność Bez specjalności Kod katedry/zakładu
Algorytmy i struktury danych. Drzewa: BST, kopce. Letnie Warsztaty Matematyczno-Informatyczne
Algorytmy i struktury danych Drzewa: BST, kopce Letnie Warsztaty Matematyczno-Informatyczne Drzewa: BST, kopce Definicja drzewa Drzewo (ang. tree) to nieskierowany, acykliczny, spójny graf. Drzewo może
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy oólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK
Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ).
Algorytm A* Opracowanie: Joanna Raczyńska 1.Wstęp Algorytm A* jest heurystycznym algorytmem służącym do znajdowania najkrótszej ścieżki w grafie. Jest to algorytm zupełny i optymalny, co oznacza, że zawsze
Adam Meissner. SZTUCZNA INTELIGENCJA Gry dwuosobowe
Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej Adam Meissner Adam.Meissner@put.poznan.pl http://www.man.poznan.pl/~ameis SZTUCZNA INTELIGENCJA Gry dwuosobowe Literatura [1] Sterling
AI i ML w grach. Przegląd zagadnień i inspiracje systemów human-like
Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska AI i ML w grach. Przegląd zagadnień i inspiracje systemów human-like Jacek Mańdziuk PP-RAI 2018, Poznań, 18/10/2018 Gry a poważna nauka
Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.
Kognitywne podejście do gry w szachy kontynuacja prac
Kognitywne podejście do gry w szachy kontynuacja prac Stanisław Kaźmierczak Opiekun naukowy: prof. dr hab. Jacek Mańdziuk 2 Agenda Motywacja Kilka badań Faza nauki Wzorce Generowanie ruchów Przykłady Pomysły
METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu
Kamil Figura Krzysztof Kaliński Bartek Kutera METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu Porównanie metod uczenia z rodziny TD z algorytmem Layered Learning na przykładzie gry w warcaby i gry w anty-warcaby
Wprowadzenie do teorii systemów ekspertowych
Myślące komputery przyszłość czy utopia? Wprowadzenie do teorii systemów ekspertowych Roman Simiński siminski@us.edu.pl Wizja inteligentnych maszyn jest od wielu lat obecna w literaturze oraz filmach z
Propozycje tematów zadań
Propozycje tematów zadań 1. WARCABY Opracować program do gry w warcaby dla dwu graczy. Program ma umożliwiać przesuwanie kursora na zmianę po polach białych lub czarnych, wskazywanie początku końca ruchu.
Partition Search i gry z niezupełną informacją
MIMUW 21 stycznia 2010 1 Co to jest gra? Proste algorytmy 2 Pomysł Algorytm Przykład użycia 3 Monte Carlo Inne spojrzenie Definicja Co to jest gra? Proste algorytmy Grą o wartościach w przedziale [0, 1]
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA SYSTEMY ROZMYTE Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium
Heurystyczne metody przeszukiwania
Heurystyczne metody przeszukiwania Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Pojęcie heurystyki Metody heurystyczne są jednym z ważniejszych narzędzi sztucznej inteligencji.
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Heurystyki. Strategie poszukiwań
Sztuczna inteligencja Heurystyki. Strategie poszukiwań Jacek Bartman Zakład Elektrotechniki i Informatyki Instytut Techniki Uniwersytet Rzeszowski DLACZEGO METODY PRZESZUKIWANIA? Sztuczna Inteligencja
Wykład 7 i 8. Przeszukiwanie z adwersarzem. w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach
(4g) Wykład 7 i 8 w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach P. Kobylański Wprowadzenie do Sztucznej Inteligencji 177 / 226 (4g) gry optymalne decyzje w grach algorytm
MAGICIAN: GUIDED UCT. Zastosowanie automatycznie generowanej funkcji oceny w GGP
MAGICIAN: GUIDED UCT Zastosowanie automatycznie generowanej funkcji oceny w GGP GENERAL GAME PLAYING General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej
Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści
Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, 2012 Spis treści Przedmowa do wydania drugiego Przedmowa IX X 1. Wstęp 1 2. Wybrane zagadnienia sztucznej inteligencji
Inspiracje kognitywne w procesie analizy pozycji szachowej
Inspiracje kognitywne w procesie analizy pozycji szachowej C. Dendek J. Mańdziuk Warsaw University of Technology, Faculty of Mathematics and Information Science Abstrakt Główny cel Poprawa efektywności
PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"
PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych
Matematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Informacje podstawowe 1. Konsultacje: pokój
10. Wstęp do Teorii Gier
10. Wstęp do Teorii Gier Definicja Gry Matematycznej Gra matematyczna spełnia następujące warunki: a) Jest co najmniej dwóch racjonalnych graczy. b) Zbiór możliwych dezycji każdego gracza zawiera co najmniej
Festiwal Myśli Abstrakcyjnej, Warszawa, Czy SZTUCZNA INTELIGENCJA potrzebuje FILOZOFII?
Festiwal Myśli Abstrakcyjnej, Warszawa, 22.10.2017 Czy SZTUCZNA INTELIGENCJA potrzebuje FILOZOFII? Dwa kluczowe terminy Co nazywamy sztuczną inteligencją? zaawansowane systemy informatyczne (np. uczące
Podstawy Sztucznej Inteligencji (PSZT)
Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12
CZYM JEST SZTUCZNA INTELIGENCJA? REPREZENTACJA WIEDZY SZTUCZNA INTELIGENCJA PROJEKTOWANIE ALGORYTMÓW I METODY SZTUCZNEJ INTELIGENCJI
PROJEKTOWANIE ALGORYTMÓW I METODY SZTUCZNEJ INTELIGENCJI CZYM JEST SZTUCZNA INTELIGENCJA? Jak działa ludzki mózg? SZTUCZNA INTELIGENCJA Jak zasymulować ludzki mózg? Co to kogo obchodzi zróbmy coś pożytecznego
MODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN Szkoła Wyższa Psychologii Społecznej d.wojcik@nencki.gov.pl dwojcik@swps.edu.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Zofia Kruczkiewicz, Algorytmu i struktury danych, Wykład 14, 1
Wykład Algorytmy grafowe metoda zachłanna. Właściwości algorytmu zachłannego:. W przeciwieństwie do metody programowania dynamicznego nie występuje etap dzielenia na mniejsze realizacje z wykorzystaniem
ĆWICZENIE 1: Przeszukiwanie grafów cz. 1 strategie ślepe
Instytut Mechaniki i Inżynierii Obliczeniowej Wydział Mechaniczny Technologiczny, Politechnika Śląska www.imio.polsl.pl METODY HEURYSTYCZNE ĆWICZENIE 1: Przeszukiwanie grafów cz. 1 strategie ślepe opracował:
Algorytmy ewolucyjne NAZEWNICTWO
Algorytmy ewolucyjne http://zajecia.jakubw.pl/nai NAZEWNICTWO Algorytmy ewolucyjne nazwa ogólna, obejmująca metody szczegółowe, jak np.: algorytmy genetyczne programowanie genetyczne strategie ewolucyjne
Uczenie ze wzmocnieniem aplikacje
Uczenie ze wzmocnieniem aplikacje Na podstawie: AIMA ch21 oraz Reinforcement Learning (Sutton i Barto) Wojciech Jaśkowski Instytut Informatyki, Politechnika Poznańska 23 maja 2014 Problem decyzyjny Markova
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.
Plan Procedura decyzyjna Reguły α i β - algorytm Plan Procedura decyzyjna Reguły α i β - algorytm Logika obliczeniowa Instytut Informatyki 1 Procedura decyzyjna Logiczna konsekwencja Teoria aksjomatyzowalna
Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy
Wykład7,31III2010,str.1 Gry dzielimy Wykład7,31III2010,str.1 Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), Wykład7,31III2010,str.1 Gry
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia
Sztuczna Inteligencja i Systemy Doradcze
Sztuczna Inteligencja i Systemy Doradcze Przeszukiwanie przestrzeni stanów algorytmy ślepe Przeszukiwanie przestrzeni stanów algorytmy ślepe 1 Strategie slepe Strategie ślepe korzystają z informacji dostępnej
Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!
Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), 2-osobowe(np. szachy, warcaby, go, itp.), wieloosobowe(np. brydż, giełda, itp.); wygraną/przegraną:
TEORIA GIER DEFINICJA (VON NEUMANN, MORGENSTERN) GRA. jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w
TEORIA GIER GRA DEFINICJA (VON NEUMANN, MORGENSTERN) Gra składa się z zestawu reguł określających możliwości wyboru postępowania jednostek (graczy) znajdujących się w sytuacji konfliktowej (konflikt interesów),w
Algorytmy genetyczne
Algorytmy genetyczne Motto: Zamiast pracowicie poszukiwać najlepszego rozwiązania problemu informatycznego lepiej pozwolić, żeby komputer sam sobie to rozwiązanie wyhodował! Algorytmy genetyczne służą
Planowanie drogi robota, algorytm A*
Planowanie drogi robota, algorytm A* Karol Sydor 13 maja 2008 Założenia Uproszczenie przestrzeni Założenia Problem planowania trasy jest bardzo złożony i trudny. W celu uproszczenia problemu przyjmujemy
Optymalizacja optymalizacji
7 maja 2008 Wstęp Optymalizacja lokalna Optymalizacja globalna Algorytmy genetyczne Badane czasteczki Wykorzystane oprogramowanie (Algorytm genetyczny) 2 Sieć neuronowa Pochodne met-enkefaliny Optymalizacja
Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej
1 Zastosowania Metod Inteligencji Obliczeniowej Tomasz Pawlak 2 Plan prezentacji Sprawy organizacyjne Wprowadzenie do metod inteligencji obliczeniowej Studium wybranych przypadków zastosowań IO 3 Dane
Sztuczna inteligencja
Sztuczna inteligencja Przykładowe zastosowania Piotr Fulmański Wydział Matematyki i Informatyki, Uniwersytet Łódzki, Polska 12 czerwca 2008 Plan 1 Czym jest (naturalna) inteligencja? 2 Czym jest (sztuczna)
Uczenie ze wzmocnieniem aplikacje
Uczenie ze wzmocnieniem aplikacje Na podstawie: AIMA ch21 oraz Reinforcement Learning (Sutton i Barto) Wojciech Jaśkowski Instytut Informatyki, Politechnika Poznańska 22 maja 2013 Problem decyzyjny Markova
Problemy Decyzyjne Markowa
Problemy Decyzyjne Markowa na podstawie AIMA ch17 i slajdów S. Russel a Wojciech Jaśkowski Instytut Informatyki, Politechnika Poznańska 18 kwietnia 2013 Sekwencyjne problemy decyzyjne Cechy sekwencyjnego
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. zajecia.jakubw.pl/nai Literatura: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym. WNT, Warszawa 997. PODSTAWOWE ZAGADNIENIA TECHNICZNE AI
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
GRY I ZABAWY UMYSŁOWO- LOGICZNE JAKO FORMA UPOWSZECHNIANIA KULTURY. Donata Fraś
GRY I ZABAWY UMYSŁOWO- LOGICZNE JAKO FORMA UPOWSZECHNIANIA KULTURY Donata Fraś Gry umysłowe To gry towarzyskie, których rezultat zależy wyłącznie od świadomych decyzji podejmowanych przez partnera Wymagają:
Dwaj gracze na przemian kładą jednakowe monety na stole tak, aby na siebie nie nachodziły Przegrywa ten, kto nie może dołożyć monety
Mateusz Lewandowski Krótka filozofia Ciekawość gier Poziomy rozwiązania gier Synchroniczne wykonywanie ruchów w GGP Podejścia do końcówek gier Wykrywanie symetrii Związki z innymi dziedzinami KONSPEKT
MODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN d.wojcik@nencki.gov.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/ Podręcznik Iwo Białynicki-Birula Iwona
SZTUCZNA INTELIGENCJA
Stefan Sokołowski SZTUCZNA INTELIGENCJA Inst Informatyki UG, Gdańsk, 2009/2010 Wykład1,17II2010,str1 SZTUCZNA INTELIGENCJA reguły gry Zasadnicze informacje: http://infugedupl/ stefan/dydaktyka/sztintel/
Teoria gier. prof. UŚ dr hab. Mariusz Boryczka. Wykład 4 - Gry o sumie zero. Instytut Informatyki Uniwersytetu Śląskiego
Instytut Informatyki Uniwersytetu Śląskiego Wykład 4 - Gry o sumie zero Gry o sumie zero Dwuosobowe gry o sumie zero (ogólniej: o sumie stałej) były pierwszym typem gier dla których podjęto próby ich rozwiązania.
a) 7 b) 19 c) 21 d) 34
Zadanie 1. Pytania testowe dotyczące podstawowych własności grafów. Zadanie 2. Przy każdym z zadań może się pojawić polecenie krótkiej charakterystyki algorytmu. Zadanie 3. W zadanym grafie sprawdzenie
O ALGORYTMACH I MASZYNACH TURINGA
O ALGORYTMACH I MASZYNACH TURINGA ALGORYTM (objaśnienie ogólne) Algorytm Pojęcie o rodowodzie matematycznym, oznaczające współcześnie precyzyjny schemat mechanicznej lub maszynowej realizacji zadań określonego
ATOLL. Wykonali: Aleksandra Kuchta, Łukasz Wójcik, Sztuczna Inteligencja, Semestr trzeci, Kierunek Informatyka, Wydział Informatyki i Zarządzania,
Sztuczna Inteligencja, Semestr trzeci, Kierunek Informatyka, Wydział Informatyki i Zarządzania, Politechnika Poznańska ATOLL Wykonali: Aleksandra Kuchta, WFT, PP, nr 76690, rok IV Łukasz Wójcik, WIiZ,
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski
Systemy ekspertowe i ich zastosowania Katarzyna Karp Marek Grabowski Plan prezentacji Wstęp Własności systemów ekspertowych Rodzaje baz wiedzy Metody reprezentacji wiedzy Metody wnioskowania Języki do
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
Stefan Sokołowski SZTUCZNAINTELIGENCJA. Inst. Informatyki UG, Gdańsk, 2009/2010
Stefan Sokołowski SZTUCZNAINTELIGENCJA Inst. Informatyki UG, Gdańsk, 2009/2010 Wykład1,17II2010,str.1 SZTUCZNA INTELIGENCJA reguły gry Zasadnicze informacje: http://inf.ug.edu.pl/ stefan/dydaktyka/sztintel/
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Systemy ekspertowe. Wnioskowanie w systemach regułowych. Część piąta. Autor Roman Simiński.
Część piąta Autor Roman Simiński Kontakt siminski@us.edu.pl www.us.edu.pl/~siminski Niniejsze opracowanie zawiera skrót treści wykładu, lektura tych materiałów nie zastąpi uważnego w nim uczestnictwa.
Metoda ewolucyjnego doboru współczynników funkcji oceniającej w antywarcabach
Metoda ewolucyjnego doboru współczynników funkcji oceniającej w antywarcabach Promotor: dr hab. Jacek Mańdziuk Autor: Jarosław Budzianowski Metoda ewolucyjnego doboru współczynników funkcji oceniajacej
2
1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem
Programowanie obiektowe
Programowanie obiektowe Sieci powiązań Paweł Daniluk Wydział Fizyki Jesień 2015 P. Daniluk (Wydział Fizyki) PO w. IX Jesień 2015 1 / 21 Sieci powiązań Można (bardzo zgrubnie) wyróżnić dwa rodzaje powiązań
Abstrakcyjne struktury danych - stos, lista, drzewo
Sprawozdanie Podstawy Informatyki Laboratoria Abstrakcyjne struktury danych - stos, lista, drzewo Maciej Tarkowski maciek@akom.pl grupa VII 1/8 1. Stos Stos (ang. Stack) jest podstawową liniową strukturą
Matematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 03/0 Przeszukiwanie w głąb i wszerz I Przeszukiwanie metodą
Sztuczna inteligencja - wprowadzenie
Sztuczna inteligencja - wprowadzenie Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Sztuczna inteligencja komputerów - wprowadzenie Kontakt: dr inż. Dariusz Banasiak, pok.
Jacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa
Jacek Skorupski pok. 251 tel. 234-7339 jsk@wt.pw.edu.pl http://skorupski.waw.pl/mmt prezentacje ogłoszenia konsultacje: poniedziałek 16 15-18, sobota zjazdowa 9 40-10 25 Udział w zajęciach Kontrola wyników
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: INTELIGENTNE SYSTEMY OBLICZENIOWE Systems Based on Computational Intelligence Kierunek: Inżynieria Biomedyczna Rodzaj przedmiotu: obowiązkowy moduł specjalności informatyka medyczna Rodzaj
Metoda Tablic Semantycznych
Procedura Plan Reguły Algorytm Logika obliczeniowa Instytut Informatyki Plan Procedura Reguły 1 Procedura decyzyjna Logiczna równoważność formuł Logiczna konsekwencja Procedura decyzyjna 2 Reguły α, β,
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
Podstawy sztucznej inteligencji
wykład II Problem solving 03 październik 2012 Jakie problemy możemy rozwiązywać? Cel: Zbudować inteligentnego agenta planującego, rozwiązującego problem. Szachy Kostka rubika Krzyżówka Labirynt Wybór trasy
Programowanie obiektowe
Programowanie obiektowe Sieci powiązań Paweł Daniluk Wydział Fizyki Jesień 2014 P. Daniluk (Wydział Fizyki) PO w. IX Jesień 2014 1 / 24 Sieci powiązań Można (bardzo zgrubnie) wyróżnić dwa rodzaje powiązań