MiNI-Player podsumowanie dotychczasowych badao
|
|
- Jolanta Szczepańska
- 8 lat temu
- Przeglądów:
Transkrypt
1 MiNI-Player podsumowanie dotychczasowych badao promotor: prof. dr hab. Jacek Maodziuk
2 O czym opowiem Wprowadzenie motywacja Monte-Carlo Tree Search i UCT Strategie gry Mechanizm oceny i wyboru strategii Mechanizm wyboru ruchu podczas gry Środowisko testowe Wyniki Wnioski, plany i oczekiwania
3 O czym nie opowiem Nie będzie elementarnego wprowadzenia do GGP Język reguł: GDL Interpreter reguł częśd MiNI-Player Parallelizacja Testowane i odrzucone podejścia
4 Czym jest MiNI-Player Agent GGP; program grający w dowolne gry mieszczące się w standardzie GGP i GDL-I. skooczone i deterministyczne Brał udział w konkursie GGP Competition 2012 wersja z konkursu jest głównym tematem prezentacji
5 Trendy zwycięzcy mistrzostw 2005: Cluneplayer uogólnione przeszukiwanie drzewa typu min-max funkcja ewaluacyjna: wypłata, kontrola, mobilnośd 2006: FluxPlayer wykrywanie struktur semantycznych w opisie gry - plansze, kamienie, liczniki, relacje porządku logika rozmyta stopieo spełnienia reguł goal i terminal funkcja ewaluacyjna; zmodyfikowany IDDFS
6 Trendy zwycięzcy mistrzostw 2007, 2008, 2012: CadiaPlayer Podejście czysto symulacyjne: Knowledge-Free Symulacje Monte-Carlo i algorytm UCT Heurystyka historyczna Duży nacisk na statystyczną optymalizację procesu MCTS Kontrola symulacji: FAST, MAST, TO-MAST, RAVE i inne Z czasem wiele prostych dodatków na zasadzie zgadywania i weryfikacji hipotezy
7 Trendy zwycięzcy mistrzostw 2009, 2010: Ary Monte-Carlo i UCT Podejście podobne do CadiaPlayer; prawdopodobnie mniej rozbudowane Nested Monte-Carlo do gier jednoosobowych Duży wysiłek badawczy w zakresie technik zrównoleglania
8 Trendy zwycięzcy mistrzostw 2011: TurboTurtle Simulation-Based wg prezentacji autora o GGP brak publikacji nie wiadomo wiele o tym graczu
9 Trendy zwycięzcy mistrzostw 2011: TurboTurtle Simulation-Based wg prezentacji autora o GGP brak publikacji nie wiadomo wiele o tym graczu 2013:???
10 AI systems are dumb because Al researchers are too clever. JACQUES PITRAT (1968)
11 Motywacja Usprawnienie losowych symulacji poprzez wprowadzenie wiedzy Próba bezpiecznej aplikacji wiedzy MCTS vs Min-Max/Alfa-Beta/MTD(f) Próba dalszego udoskonalenia podejścia, które uznawane jest za state-of-the-art w General Game Playing
12 MCTS/UCT vs MinMax/αβ/MTD(f) Łatwe zrównoleglenie Podejście skalowalne Można w każdej chwili przerwad Symulacje mogą robid błędy W podstawowej wersji wystarczy logika gry (knowledge-free) Potrzebuje silnej i bezbłędnej funkcji oceny stanu W przypadku posiadania takiej funkcji, ma przewagę nad MCTS
13 POJĘCIA BAZOWE
14 Drzewo gry *źródło:
15 Drzewo gry Dowolna liczba graczy Wierzchołek w drzewie: stan w grze Krawędź (A,B): wektor akcji każdego z graczy (akcja połączona: joint move) powodująca zmianę stanu z A do B np. (noop (mark 1 1 x)) Można nie powtarzad tych samych stanów, do których istnieje wiele ścieżek => graf skierowany
16 Monte-Carlo Tree Search (MCTS) Wykonujemy losowe symulacje i przechowujemy statystyki w węzłach: sumaryczny wynik gry każdego z graczy liczbę odwiedzin w węźle średni wynik wyliczany na podstawie powyższych dwóch Podejście typu knowledge-free. Wystarczy zaimplementowad mechanikę gry
17 Monte-Carlo Tree Search (MCTS) Selekcja: w każdym węźle rozpoczynając od wierzchołka wybieramy najlepszego potomka do kontynuacji przeszukiwania Rozwinięcie: gdy jesteśmy w liściu to tworzymy nowy węzeł Symulacja: gramy losowo aż do osiągnięcia stanu terminalnego Propagacja wsteczna: uaktualniamy statystyki średni wynik oraz liczbę odwiedzin w każdym węźle na ścieżce, którą wybraliśmy
18 Monte-Carlo Tree Search (MCTS)
19 UCT (Upper Confidence Bounds Applied For Trees) Modyfikacja algorytmu UCB [k-armed/multiarmed bandit problem] Bandyta: Stała, nieznana dystrybuanta wypłat Cel: maksymalizacja zysku
20 UCT (Upper Confidence Bounds Applied For Trees) Dla danej roli (gracza): a akcja s bieżący stan Q(s,a) uśredniony osiągnięty wynik gry przy wykonaniu akcji a w stanie s N(s) liczba dotychczasowych odwiedzin stanu s N(s,a) liczba dotychczasowych wyborów akcji a w stanie s
21 UCT (Upper Confidence Bounds Applied For Trees) Zasada balansu między eksploracją nowych ścieżek a wykorzystaniem najlepszych do tej pory. klasyczny problem exploration vs exploitation Celem jest ukierunkowanie symulacji na najbardziej obiecujące fragmenty w drzewie. [L. Kocsis and C. Szepesvari, 2006]
22 CrazyStone 2006 Komercyjne zastosowanie UCT
23 Zastosowanie UCT w MiNI-Player Optymalizacja fazy selekcji Dla każdego z graczy stosowane osobne UCT
24 Warunki stawiane symulacji w Go Ostatnie badania w Go, grze której rozwiązania zainspirowały twórców najsilniejszych programów GGP wskazują, że symulacje MCTS powinny: Wybierad silne akcje, które zagrałby gracz Byd różnorodne
25 STRATEGIE SYMULACJI
26 Zastosowanie strategii w MiNI-Player Optymalizacja fazy symulacji
27 Schemat symulacji w GGP dopóki(krok < MAX_STEP) 1. Wyznacz legalne akcje [legal] 2. Dla każdej roli i=0 N [does] move[i] = wybierz akcję wykonaj(move[i]) 3. Wyznacz, a następnie uaktualnij stan gry *next] 4. Sprawdź czy stan jest terminalny: [terminal] TAK: pobierz wyniki i zakoocz symulację [goal] NIE: wród do punktu 1.
28 Dostępne strategie W turniejowej wersji MiNI-Player: Random AGE (Approximate Goal Evaluation) HH (History Heuristic) M (Mobility) E (Exploration) SSC (Statistical Symbol Counting) Kandydaci do przetestowania: M2 (Mobility 2-ply) i inne wersje 2-ply Sc (Score)
29 Random Strategia losowa: wszystkie akcje tak samo prawdopodobne Niezwykle ważna, bo: Zwiększa różnorodnośd przeszukiwania nie trzyma się konkretnej ścieżki Wydajna obliczeniowo, co pozytywnie wpływa na ilośd wykonywanych symulacji (marginalnie szybsze byłoby tylko zawsze wybieranie akcji o stałym indeksie)
30 AGE Przybliżony stopieo spełnienia warunku goal wybierany jest zbiór reguł goal z najwyższą wypłatą dla każdego gracza Podobna idea do FluxPlayer, lecz inne wykonanie.
31 AGE pojęcie wstępne Relacja: knight_move (zbiór wszystkich faktów i reguł) Reguły: (<= (knight_move?piece?u?v?x?y?owner) (piece_owner_type?piece?owner knight) (adjacent_two?v?y) (adjacent?u?x)) (<= (knight_move?piece?u?v?x?y?owner) (piece_owner_type?piece?owner knight) (adjacent_two?u?x) (adjacent?v?y)) Warunek Zapytanie Wywołanie relacji: (adjacent_two?u?x) (knight_move?piece c 4?x?y white)
32 AGE Reprezentacja każdej reguły jako drzewa OR-AND
33 AGE Reprezentacja każdej reguły jako drzewa OR-AND OR: reprezentuje kontener na wszystkie zdefiniowane reguły dla danej relacji np. goal, legal, cell (czyli de facto zapytanie o fakty danego typu bo pytając nie specyfikujemy konkretnej instancji reguły) AND: reprezentuje konkretną instancję reguły
34 AGE Metoda obliczania AGE jest zdefiniowana rekurencyjnie na drzewie. rozpoczyna się w korzeniu obliczane i propagowane wstecz są 2 wartości: AgVal i TbVal (ApproximateGoalValue i TieBreakerValue) Możliwa dzięki własnej implementacji interpretera reguł.
35 AGE węzły typu AND i=1 N węzły OR będące dziedmi bieżącego węzła AND N AgVal = 1 N i=1 AgVal i TbVal = 1 N N i=1 TbVal i Jeżeli warunek reprezentowany przez OR posiada negację, to wartości wchodzą do sumy jako 1 AgVal i oraz 1 TbVal i
36 AGE węzły typu OR 1. Liśd AgVal = 1, jeśli reguła jest spełniona. AgVal = 0, jeśli reguła nie zachodzi Innymi słowy, pytamy czy zachodzi co najmniej jedna realizacja zmiennych dla zapytania reprezentowanego przez węzeł. 2. Węzeł wewnętrzny: N AgVal = max i=1 N AgVal i TbVal = 1 N i=1 TbVal i
37 Heurystyka Historyczna Uniwersalna metoda stosowana w AI w grach od 1989 [Schaeffer] Ideą jest, by przenieśd informację uzyskaną z wykonanych akcji wcześniej w procesie symulacji do nowej sytuacji, gdy akcja jest znów możliwa do wykonania. W GGP większośd programów stosuje HH, aby zwiększyd prawdopodobieostwo wybrania akcji dobrych niezależnie od stanu podczas symulacji Monte-Carlo.
38 Heurystyka Historyczna w MiNI-Player Globalny słownik akcji dla każdego z graczy Akcje wybierane podczas symulacji pozostałymi strategiami są zapamiętywane Po zakooczeniu symulacji uaktualniane są średnie wyniki Podczas symulacji z użyciem HH w każdym kroku z prawdopodobieostwem wybierany jest najlepiej oceniony ruch z aktualnie legalnych (w przeciwnym przypadku lub gdy takiego nie ma losowy)
39 Mobility Liczba dostępnych akcji względem pozostałych graczy zwykle im więcej tym lepiej (więcej możliwości, więcej figur w grach planszowych) Niech M i oznacza liczbę akcji dostępnych dla i-tego gracza Niech i=0 oznacza rolę przypisaną MiNI-Playerowi Wybieramy stan, w którym maximum osiąga wyrażenie: N 1 M 0 + M 0 M i i=1
40 Exploration Idea tej strategii polega na odwiedzaniu nowych stanów, które w największym stopniu różnią się od ostatnio odwiedzanych.
41 Exploration Idea tej strategii polega na odwiedzaniu nowych stanów, które w największym stopniu różnią się od ostatnio odwiedzanych. Różnica między stanem B i A: diff(b,a) = B A f: f B f A Licznośd zbioru faktów (termów GDL), które nalezą do B oraz nie należą do A
42 Exploration prev 3 (S) Dla każdej legalnej akcji a i w bieżącym stanie S wyznacz stan następny S i = next(a i,s) prev 2 (S) prev 1 (S) Dla każdego i wyznacz najbardziej podobny stan z ostatnich N: min d i = min i j=1..n diff[s i, prev j S i ] a 1 s a 2 stan bieżący a 3 potencjalne stany: next(a,s) Wybierz akcję, której najbardziej podobny stan jest od niej maksymalnie różny: a i arg max i min i d i
43 Statistical Symbol Counting Idea zaczerpnięta z wcześniej testowanego podejścia do budowania funkcji ewaluacyjnej. wzięty podzbiór (prostsza częśd) Strategia ma dwa fazy: uczącą: w czasie START CLOCK grającą: po zakooczeniu fazy uczącej Faza ucząca wykorzystuje symulacje przeprowadzane przez pozostałe strategie, aby zbierad informacje
44 Statistical Symbol Counting Podczas symulacji uczących: Dla każdej relacji zdefiniowanej w GDL obecnej w stanie gry: wyznaczana jest licznośd faktów (realizacji) Dla każdej pary: indeks na liście argumentów realizacji (nr kolumny) oraz symbol: wyznaczana jest liczba symboli Wszystkie liczności uśredniane są dla symulacji. (vs licznośd z koocówki, vs średnia ważona długością symulacji)
45 Statistical Symbol Counting [cell 1 1 x] [cell 1 2 b] [cell 1 3 x] [cell 2 1 b] [cell 2 2 o] [cell 2 3 b] [cell 3 1 b] [cell 3 2 b] [cell 3 3 b] Quantity( cell ) = 9 Quantity( cell, 1, 1 ) = 3 Quantity( cell, 1, 2 ) = 3 Quantity( cell, 1, 3 ) = 3 Quantity( cell, 2, 1 ) = 3 Quantity( cell, 2, 2 ) = 3 Quantity( cell, 2, 3 ) = 3 Quantity( cell, 3, x ) = 2 Quantity( cell, 3, o ) = 1 Quantity( cell, 3, b ) = 6 Optymalizacje odcinające po pewnym momencie niektóre kolumny.
46 Statistical Symbol Counting Średnia wartośd danej cechy może zostad dodana do jednego z dwóch kubełków na podstawie wyniku zakooczonej symulacji: i = 0 indeks roli przypisanej do MiNI-Player N liczba graczy R = goal 0 max i=1..n goal i N R > 0 R < 0 N ignoruj Kubełek wygranych T T Kubełek przegranych
47 Statistical Symbol Counting Średnie wartości są dalej uśredniane oddzielnie dla całej przestrzeni kubełków: Gier wygranych Gier przegranych Cesze przypisywana jest waga: w = AVG wins AVG losses Odrzucane są cechy z wagami w < Tworzona jest funkcja oceny stanu jako kombinacja liniowa: licznośd cechy * waga cechy
48 Dobór parametrów Nawet wybrana strategia do przeprowadzenia symulacji ma pewne prawdopodobieostwo P wykonania akcji zgodnie ze swoją formułą. aby zapewnid różnorodnośd przebiegów
49 Potencjalne strategie Przeszukiwanie na 2 kroki do przodu Wykrycie liczników faktów, które zawierają w danym momencie jedną wartośd dla każdego z graczy (maksymalizacja/minimalizacja tych wartości) Wykrywanie planszy? N-grams? Szeregi akcji do wykonania w przypadku gier o niewielkiej interakcji między graczami? Obliczanie odległości między faktami minimalizacja/maksymalizacja/koncentracja sugestie?
50 Mechanizm wyboru strategii Testowane rozwiązania: 1. Proporcjonalnie do średniego wyniku 2. Proporcjonalnie do kwadratu średniego wyniku 3. Statyczna alokacja na N symulacji bazująca na liście rankingowej strategii 4. Algorytm UCB
51 1. Proporcjonalnie do Q Weźmy dwie strategie S 1 oraz S 2 o ocenach Q 1 = 0.6, Q 2 = 0.5 Przydzielając ilości symulacji N dla strategii proporcjonalnie do Q, otrzymujemy: N 1 = 120 N 2 = 100 po 220 symulacjach!
52 2. Proporcjonalnie do Q 2 Planujemy kolejkę strategii przydzielanych do symulacji: 1. Znajdujemy d = min(q i ) najsłabszą strategię 2. Obliczamy znormalizowane wartości średnie dla każdej strategii: AVG i = Q i d 3. Przydzielamy i-tej strategii ilośd symulacji N i : N i = R i, R i = (AVG i + OF i ) 2 4. Obliczamy przepełnienie OF w bieżącym kroku: OF i = R i - R i
53 2. Proporcjonalnie do Q 2 Planujemy N i następnych symulacji równomiernie przeplatając startując od najlepiej ocenionych strategii Przykład: N 1 = 4, N 2 = 3, N 3 = 1 Wynik => plan symulacyjny: [S1, S2, S1, S2, S3, S1, S2, S1]
54 3. Statyczna alokacja Budujemy listę rankingową strategii sortując po średnim wyniku Q i Przydzielamy z góry ustaloną liczbę symulacji w zależności od zajmowanego miejsca na liście Przykład (dla MiNI-Player): Ranking: [S3, S2, S6, S1, S4, S5] Alokacja: [22, 11, 7, 4, 2, 1]
55 4. UCB Tu nie planujemy z góry symulacji, tylko decyzje podejmujemy w każdym kroku bazując na formule: S = arg max i=1 6 Q i + C ln n T(S i, n) S * - wybrana strategia n - liczba wszystkich symulacji od początku T(S i,n) liczba wyborów strategii S i wśród n symulacji C współczynnik eksploracji; C = 5 (wersja na mistrzostwa)
56 Porównanie mechanizmów selekcji AVG (Q 2 ) - zbyt słabe wyeksponowanie najlepszych strategii UCB - sprawdzona metoda, uzasadniona statystycznie - ryzyko zbytniej dominacji jednej strategii Static - w praktyce okazuje się bardzo dobra - nieoptymalna w ekstremalnych przypadkach: istnienia ewidentnie złej lub ewidentnie jedynej dobrej strategii
57 Porównanie mechanizmów selekcji Koszt obliczeniowy: Static > AVG (Q 2 ) > UCB w praktyce pomijalny w stosunku do czasów symulacji
58 Alokacja symulacji dla najlepszej strategii
59 Alokacja symulacji dla najgorszej strategii
60 Mechanizm wyboru akcji Akcja składowa wektora w krawędzi wychodzącej z aktualnego korzenia Wersja klasyczna przy korzystaniu z UCT: Wybierz akcję prowadzącą do potomka o najlepszym średnim wyniku Q Wybierz akcję najczęściej symulowaną (w wyjątkowych sytuacjach oba przypadki nie są tożsame)
61 Mechanizm wyboru akcji MiNI-Player korzysta ze zmodyfikowanej formuły EQ, która wykorzystuje dane z 2 poziomów w drzewie Wybrany zostaje potomek Root.Child[i] o największej wartości EQ
62 Obliczanie EQ Our liczba unikalnych akcji naszego gracza Total liczba wszystkich dostępnych akcji łączonych (joint moves) Iterujemy po węzłach wychodzących z korzenia: Warunek w węźle EQ Stan terminalny = TRUE EQ = node. Q (1.01 node. Q) Our = 1 1 < Our < Total Our = Total EQ = min (node. Cild i. Q) i=1 N EQ = min (node. Child i. Q) + node. Q i=1 N 2 EQ = max (node. Cild i. Q) i=1 N
63 Mechanizm wyboru akcji
64 Tabele transpozycji Stosowane w grach, aby nie duplikowad w drzewie powtarzających się stanów Procedura znalezienia identycznego stanu (porównywania stanów) musi byd bardzo wydajna sprawdzanie po każdym napisie GDL nie wchodzi w grę, zwłaszcza, że mogą byd w dowolnej kolejności Pesymistyczna złożonośd: N*R*C N: liczba węzłów w drzewie R: liczba relacji składających się na stan C: średnia liczba faktów występującej dla danej relacji
65 Tabele transpozycji W grach znanych z góry stosuje się bardzo wydajne reprezentacje stanów np. Zobrist Hashing/Keys Przede wszystkim znana jest natura gier i wymiary poszczególnych elementów
66 Tabele transpozycji w MiNI-Player Funkcja hashującą dla realizacji GDL efektywną w obrębie swojej relacji: Funkcja hashująca dla całej relacji suma + zoptymalizowana metoda EqualTo do radzenia sobie z kolizjami
67 Tabele transpozycji w MiNI-Player Klasyfikacja stanów, ze względów na pewne cechy celem przyspieszenia Sumaryczna liczba legalnych akcji Sumaryczna ilośd realizacji Ilośd niepustych relacji (w sensie liczności zbioru realizacji) Ilośd realizacji dla każdej z relacji (relacje znane są apriori bezpośrednio z reguł)
68 Tabele transpozycji w MiNI-Player Nie ma modyfikacji struktury drzewa. Przy dodaniu nowego węzła sprawdzane jest istnienie węzłów transponowanych W fazie propagacji wyniku wynik jest tak samo propagowany na węzły transponowane Wciąż można przechodzid w drzewie wieloma ścieżkami do tego samego stanu, ale podbicie liczby odwiedzin w połączeniu z algorytmem UCT minimalizuje wynikające z tego problemy.
69 WYNIKI EKSPERYMENTALNE
70 Gry z mistrzostw 2012 Connect-4 Cephalopod Micro Free for All 2P Pentago 9 Board Tic-Tac-Toe Connect-4 Suicide Checkers Farming Quandries Pilgrimage
71 Wyniki vs CadiaPlayer 5-4 w grach
72 Wyniki gracza bez strategii i EQ Gracz na bazie MINI-Player, tylko z heurystyką historyczną (bez innych strategii symulacji)
73 Wyniki dla gier jednoosobowych ze średnią na korzyśd MiNI-Player
74 Siła poszczególnych usprawnieo
75 Podsumowanie usprawnieo
76 Ocena strategii dla poszczególnych gier
77 Gracz korzystający z najlepszej strategii
78 Podsumowanie Wprowadzenie strategii symulacji wyraźnie zwiększyło siłę gracza MiNI-Player Zmodyfikowana formuła wyboru ruchu EQ wraz ze strategiami również poprawia wyniki Bez modyfikacji: wyniki vs CadiaPlayer to 1-8 Z modyfikacjami: wyniki vs CadiaPlayer to 5-4
79 Wciąż dużo otwartych pytao i problemów: Modelowanie przeciwników Jak siła symulacji MCTS wpływa na jakośd ostatecznego gracza? Uwzględnienie strategii przy wyborze ruchu do zagrania? W zależności od wiedzy o adekwatności strategii W przypadku niedostatecznej liczby symulacji, żeby polegad na średnim wyniku
80 Wciąż dużo otwartych pytao i problemów: Nowe strategie Przyspieszenie symulacji losowanie tylko podzbioru możliwych następnych stanów przy analizie ruchu przez strategie gry Podział gry na fazy early-mid-end i stosowanie odrębnych strategii
81 Wciąż dużo otwartych pytao i problemów: Monitorowanie wydajności strategii ile razy zadziałała a ile razy każdy ruch miał taką samą ocenę (np. Mobility w Connect-4) Stosowanie strategii zastępczych do powyższych przypadków Pogrupowanie strategii w zestawy i połączenie z mechanizmem zrównoleglenia
82 Dziękuję za uwagę
POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI
POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI mgr inż. Karol Walędzik k.waledzik@mini.pw.edu.pl prof. dr hab. inż. Jacek
MAGICIAN. czyli General Game Playing w praktyce. General Game Playing
MAGICIAN czyli General Game Playing w praktyce General Game Playing 1 General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej w ramach AAAI National Conference
Obliczenia równoległe w General Game Playing
Obliczenia równoległe w General Game Playing promotor: prof. dr hab. Jacek Mańdziuk 1/66 Plan Krótkie przypomnienie GGP/MiNI-Player Motywacja Pomysł 2012 Pomysł 2013 Porównanie Podsumowanie 2/66 General
Tworzenie gier na urządzenia mobilne
Katedra Inżynierii Wiedzy Teoria podejmowania decyzji w grze Gry w postaci ekstensywnej Inaczej gry w postaci drzewiastej, gry w postaci rozwiniętej; formalny opis wszystkich możliwych przebiegów gry z
Analiza stanów gry na potrzeby UCT w DVRP
Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527 Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza
Seminarium IO. Zastosowanie algorytmu UCT w Dynamic Vehicle Routing Problem. Michał Okulewicz
Seminarium IO Zastosowanie algorytmu UCT w Dynamic Vehicle Routing Problem Michał Okulewicz 05.11.2013 Plan prezentacji Przypomnienie Problem DVRP Algorytm UCT Zastosowanie algorytmu UCT/PSO w DVRP Zastosowanie
Risk-Aware Project Scheduling. SimpleUCT
Risk-Aware Project Scheduling SimpleUCT DEFINICJA ZAGADNIENIA Resource-Constrained Project Scheduling (RCPS) Risk-Aware Project Scheduling (RAPS) 1 tryb wykonywania działań Czas trwania zadań jako zmienna
Algorytmy genetyczne w optymalizacji
Algorytmy genetyczne w optymalizacji Literatura 1. David E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, Warszawa 1998; 2. Zbigniew Michalewicz, Algorytmy genetyczne + struktury danych = programy
Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.
Algorytmy dla gier dwuosobowych
Algorytmy dla gier dwuosobowych Wojciech Dudek Seminarium Nowości Komputerowe 5 czerwca 2008 Plan prezentacji Pojęcia wstępne (gry dwuosobowe, stan gry, drzewo gry) Algorytm MiniMax Funkcje oceniające
Metody przeszukiwania
Metody przeszukiwania Co to jest przeszukiwanie Przeszukiwanie polega na odnajdywaniu rozwiązania w dyskretnej przestrzeni rozwiązao. Zwykle przeszukiwanie polega na znalezieniu określonego rozwiązania
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
Modelowanie hierarchicznych struktur w relacyjnych bazach danych
Modelowanie hierarchicznych struktur w relacyjnych bazach danych Wiktor Warmus (wiktorwarmus@gmail.com) Kamil Witecki (kamil@witecki.net.pl) 5 maja 2010 Motywacje Teoria relacyjnych baz danych Do czego
Ogólne wiadomości o grafach
Ogólne wiadomości o grafach Algorytmy i struktury danych Wykład 5. Rok akademicki: / Pojęcie grafu Graf zbiór wierzchołków połączonych za pomocą krawędzi. Podstawowe rodzaje grafów: grafy nieskierowane,
Indukowane Reguły Decyzyjne I. Wykład 3
Indukowane Reguły Decyzyjne I Wykład 3 IRD Wykład 3 Plan Powtórka Grafy Drzewa klasyfikacyjne Testy wstęp Klasyfikacja obiektów z wykorzystaniem drzewa Reguły decyzyjne generowane przez drzewo 2 Powtórzenie
Porównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT
Porównanie rozwiązań równowagowych Stackelberga w grach z wynikami stosowania algorytmu UCT Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW
Teoria gier. wstęp. 2011-12-07 Teoria gier Zdzisław Dzedzej 1
Teoria gier wstęp 2011-12-07 Teoria gier Zdzisław Dzedzej 1 Teoria gier zajmuje się logiczną analizą sytuacji, gdzie występują konflikty interesów, a także istnieje możliwość kooperacji. Zakładamy zwykle,
Instytut Badań Systemowych Polskiej Akademii Nauk. Streszczenie rozprawy doktorskiej
Instytut Badań Systemowych Polskiej Akademii Nauk Streszczenie rozprawy doktorskiej Meta-heurystyczne metody adaptacyjne bazujące na symulacjach w synchronicznych grach wieloosobowych. Mgr inż. Maciej
Sztuczna Inteligencja i Systemy Doradcze
Sztuczna Inteligencja i Systemy Doradcze Przeszukiwanie przestrzeni stanów algorytmy ślepe Przeszukiwanie przestrzeni stanów algorytmy ślepe 1 Strategie slepe Strategie ślepe korzystają z informacji dostępnej
MAGICIAN: GUIDED UCT. Zastosowanie automatycznie generowanej funkcji oceny w GGP
MAGICIAN: GUIDED UCT Zastosowanie automatycznie generowanej funkcji oceny w GGP GENERAL GAME PLAYING General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej
Wyznaczanie strategii w grach
Wyznaczanie strategii w grach Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Definicja gry Teoria gier i konstruowane na jej podstawie programy stanowią jeden z głównych
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Algorytmy metaheurystyczne Wykład 11. Piotr Syga
Algorytmy metaheurystyczne Wykład 11 Piotr Syga 22.05.2017 Drzewa decyzyjne Idea Cel Na podstawie przesłanek (typowo zbiory rozmyte) oraz zbioru wartości w danych testowych, w oparciu o wybrane miary,
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych
Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych
Wybrane podstawowe rodzaje algorytmów
Wybrane podstawowe rodzaje algorytmów Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii informatycznych
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 12. PRZESZUKIWANIE Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska ROZWIĄZYWANIE PROBLEMÓW JAKO PRZESZUKIWANIE Istotną rolę podczas
10. Wstęp do Teorii Gier
10. Wstęp do Teorii Gier Definicja Gry Matematycznej Gra matematyczna spełnia następujące warunki: a) Jest co najmniej dwóch racjonalnych graczy. b) Zbiór możliwych dezycji każdego gracza zawiera co najmniej
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
Algorytm DIC. Dynamic Itemset Counting. Magdalena Przygórzewska Karolina Stanisławska Aleksander Wieczorek
Algorytm DIC Dynamic Itemset Counting Magdalena Przygórzewska Karolina Stanisławska Aleksander Wieczorek Spis treści 1 2 3 4 Algorytm DIC jako rozszerzenie apriori DIC Algorytm znajdowania reguł asocjacyjnych
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Algorytmy wyznaczania centralności w sieci Szymon Szylko
Algorytmy wyznaczania centralności w sieci Szymon Szylko Zakład systemów Informacyjnych Wrocław 10.01.2008 Agenda prezentacji Cechy sieci Algorytmy grafowe Badanie centralności Algorytmy wyznaczania centralności
Grafem nazywamy strukturę G = (V, E): V zbiór węzłów lub wierzchołków, Grafy dzielimy na grafy skierowane i nieskierowane:
Wykład 4 grafy Grafem nazywamy strukturę G = (V, E): V zbiór węzłów lub wierzchołków, E zbiór krawędzi, Grafy dzielimy na grafy skierowane i nieskierowane: Formalnie, w grafach skierowanych E jest podzbiorem
Optymalizacja. Przeszukiwanie tabu
dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Maciej Hapke Naturalny sposób powstania algorytmu Algorytm optymalizacji lokalnej Niezdolność wyjścia z lokalnych
ALGORYTMY EWOLUCYJNE W OPTYMALIZACJI JEDNOKRYTERIALNEJ
ALGORYTMY EWOLUCYJNE W OPTYMALIZACJI JEDNOKRYTERIALNEJ Zalety: nie wprowadzają żadnych ograniczeń na sformułowanie problemu optymalizacyjnego. Funkcja celu może być wielowartościowa i nieciągła, obszar
Algorytmy metaheurystyczne Wykład 6. Piotr Syga
Algorytmy metaheurystyczne Wykład 6 Piotr Syga 10.04.2017 Wprowadzenie Inspiracje Wprowadzenie ACS idea 1 Zaczynamy z pustym rozwiązaniem początkowym 2 Dzielimy problem na komponenty (przedmiot do zabrania,
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Kompresja danych Streszczenie Studia Dzienne Wykład 10,
1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny
RISK-AWARE PROJECT SCHEDULING
RISK-AWARE PROJECT SCHEDULING Z WYKORZYSTANIEM UCT KAROL WALĘDZIK DEFINICJA ZAGADNIENIA RESOURCE-CONSTRAINED PROJECT SCHEDULING (RCPS) Karol Walędzik - RAPS 3 RISK-AWARE PROJECT SCHEDULING (RAPS) 1 tryb
Algorytmy i struktury danych. Drzewa: BST, kopce. Letnie Warsztaty Matematyczno-Informatyczne
Algorytmy i struktury danych Drzewa: BST, kopce Letnie Warsztaty Matematyczno-Informatyczne Drzewa: BST, kopce Definicja drzewa Drzewo (ang. tree) to nieskierowany, acykliczny, spójny graf. Drzewo może
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH
Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH Przeszukiwanie przestrzeni rozwiązań, szukanie na ślepo, wszerz, w głąb. Spis treści: 1. Wprowadzenie 3. str. 1.1 Krótki Wstęp
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne
E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne Przypominajka: 152 drzewo filogenetyczne to drzewo, którego liśćmi są istniejące gatunki, a węzły wewnętrzne mają stopień większy niż jeden i reprezentują
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Adam Meissner. SZTUCZNA INTELIGENCJA Gry dwuosobowe
Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej Adam Meissner Adam.Meissner@put.poznan.pl http://www.man.poznan.pl/~ameis SZTUCZNA INTELIGENCJA Gry dwuosobowe Literatura [1] Sterling
Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek
Algorytmy i str ruktury danych Metody algorytmiczne Bartman Jacek jbartman@univ.rzeszow.pl Metody algorytmiczne - wprowadzenia Znamy strukturę algorytmów Trudność tkwi natomiast w podaniu metod służących
Sortowanie. Bartman Jacek Algorytmy i struktury
Sortowanie Bartman Jacek jbartman@univ.rzeszow.pl Algorytmy i struktury danych Sortowanie przez proste wstawianie przykład 41 56 17 39 88 24 03 72 41 56 17 39 88 24 03 72 17 41 56 39 88 24 03 72 17 39
Drzewa rozpinajace, zbiory rozłaczne, czas zamortyzowany
, 1 2 3, czas zamortyzowany zajęcia 3. Wojciech Śmietanka, Tomasz Kulczyński, Błażej Osiński rozpinajace, 1 2 3 rozpinajace Mamy graf nieskierowany, ważony, wagi większe od 0. Chcemy wybrać taki podzbiór
Kurs z NetLogo - część 4.
Kurs z NetLogo - część 4. Mateusz Zawisza Zakład Wspomagania i Analizy Decyzji Instytut Ekonometrii Szkoła Główna Handlowa Seminarium Wieloagentowe Warszawa, 10.01.2011 Agenda spotkań z NetLogo 15. listopada
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Wstęp do Sztucznej Inteligencji
Wstęp do Sztucznej Inteligencji Rozwiązywanie problemów-i Joanna Kołodziej Politechnika Krakowska Wydział Fizyki, Matematyki i Informatyki Rozwiązywanie problemów Podstawowe fazy: Sformułowanie celu -
Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ).
Algorytm A* Opracowanie: Joanna Raczyńska 1.Wstęp Algorytm A* jest heurystycznym algorytmem służącym do znajdowania najkrótszej ścieżki w grafie. Jest to algorytm zupełny i optymalny, co oznacza, że zawsze
D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO
D. Miszczyńska, M.Miszczyński KBO UŁ GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO Gra w sensie niżej przedstawionym to zasady którymi kierują się decydenci. Zakładamy, że rezultatem gry jest wypłata,
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY WALIDACJA KRZYŻOWA dla ZAAWANSOWANEGO KLASYFIKATORA KNN ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Metody Kompilacji Wykład 3
Metody Kompilacji Wykład 3 odbywa się poprzez dołączenie zasad(reguł) lub fragmentów kodu do produkcji w gramatyce. Włodzimierz Bielecki WI ZUT 2 Na przykład, dla produkcji expr -> expr 1 + term możemy
EGZAMIN - Wersja A. ALGORYTMY I STRUKTURY DANYCH Lisek89 opracowanie kartki od Pani dr E. Koszelew
1. ( pkt) Dany jest algorytm, który dla dowolnej liczby naturalnej n, powinien wyznaczyd sumę kolejnych liczb naturalnych mniejszych od n. Wynik algorytmu jest zapisany w zmiennej suma. Algorytm i=1; suma=0;
Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego
IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,
Systemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Tworzenie gier na urządzenia mobilne
Katedra Inżynierii Wiedzy Wykład 11 O czym dzisiaj? labirynty, dużo labiryntów; automaty komórkowe; algorytmy do budowy labiryntów; algorytmy do szukania wyjścia z labiryntów; Blueprints i drzewa zachowań
3. MINIMAX. Rysunek 1: Drzewo obrazujące przebieg gry.
3. MINIMAX. Bardzo wygodną strukturą danych pozwalającą reprezentować stan i przebieg gry (szczególnie gier dwuosobowych) jest drzewo. Węzły drzewa reprezentują stan gry po wykonaniu ruchu przez jednego
SYSTEMY OPERACYJNE LABORATORIUM 2014/2015
1 SYSTEMY OPERACYJNE LABORATORIUM 2014/2015 ZASADY OCENIANIA ZADAŃ PROGRAMISTYCZNYCH: Zadania laboratoryjne polegają na symulacji i badaniu własności algorytmów/mechanizmów stosowanych w systemach operacyjnych.
Uczenie sieci typu MLP
Uczenie sieci typu MLP Przypomnienie budowa sieci typu MLP Przypomnienie budowy neuronu Neuron ze skokową funkcją aktywacji jest zły!!! Powszechnie stosuje -> modele z sigmoidalną funkcją aktywacji - współczynnik
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 14c 2 Definicje indukcyjne Twierdzenia dowodzone przez indukcje Definicje indukcyjne Definicja drzewa
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
RISK-AWARE PROJECT SCHEDULING
RISK-AWARE PROJECT SCHEDULING SIMPLEUCT CZ. 2 KAROL WALĘDZIK DEFINICJA ZAGADNIENIA RESOURCE-CONSTRAINED PROJECT SCHEDULING (RCPS) Karol Walędzik - RAPS 3 RISK-AWARE PROJECT SCHEDULING (RAPS) 1 tryb wykonywania
Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!
Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), 2-osobowe(np. szachy, warcaby, go, itp.), wieloosobowe(np. brydż, giełda, itp.); wygraną/przegraną:
Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy
Wykład7,31III2010,str.1 Gry dzielimy Wykład7,31III2010,str.1 Gry dzielimy ze względu na: liczbę graczy: 1-osobowe, bez przeciwników(np. pasjanse, 15-tka, gra w życie, itp.), Wykład7,31III2010,str.1 Gry
Algorytmy ewolucyjne (3)
Algorytmy ewolucyjne (3) http://zajecia.jakubw.pl/nai KODOWANIE PERMUTACJI W pewnych zastosowaniach kodowanie binarne jest mniej naturalne, niż inne sposoby kodowania. Na przykład, w problemie komiwojażera
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Partition Search i gry z niezupełną informacją
MIMUW 21 stycznia 2010 1 Co to jest gra? Proste algorytmy 2 Pomysł Algorytm Przykład użycia 3 Monte Carlo Inne spojrzenie Definicja Co to jest gra? Proste algorytmy Grą o wartościach w przedziale [0, 1]
Automatyczny dobór parametrów algorytmu genetycznego
Automatyczny dobór parametrów algorytmu genetycznego Remigiusz Modrzejewski 22 grudnia 2008 Plan prezentacji Wstęp Atrakcyjność Pułapki Klasyfikacja Wstęp Atrakcyjność Pułapki Klasyfikacja Konstrukcja
Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.
Plan Procedura decyzyjna Reguły α i β - algorytm Plan Procedura decyzyjna Reguły α i β - algorytm Logika obliczeniowa Instytut Informatyki 1 Procedura decyzyjna Logiczna konsekwencja Teoria aksjomatyzowalna
METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu
Kamil Figura Krzysztof Kaliński Bartek Kutera METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu Porównanie metod uczenia z rodziny TD z algorytmem Layered Learning na przykładzie gry w warcaby i gry w anty-warcaby
ATOLL. Wykonali: Aleksandra Kuchta, Łukasz Wójcik, Sztuczna Inteligencja, Semestr trzeci, Kierunek Informatyka, Wydział Informatyki i Zarządzania,
Sztuczna Inteligencja, Semestr trzeci, Kierunek Informatyka, Wydział Informatyki i Zarządzania, Politechnika Poznańska ATOLL Wykonali: Aleksandra Kuchta, WFT, PP, nr 76690, rok IV Łukasz Wójcik, WIiZ,
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Heurystyki. Strategie poszukiwań
Sztuczna inteligencja Heurystyki. Strategie poszukiwań Jacek Bartman Zakład Elektrotechniki i Informatyki Instytut Techniki Uniwersytet Rzeszowski DLACZEGO METODY PRZESZUKIWANIA? Sztuczna Inteligencja
Luty 2001 Algorytmy (4) 2000/2001
Mając dany zbiór elementów, chcemy znaleźć w nim element największy (maksimum), bądź najmniejszy (minimum). We wszystkich naturalnych metodach znajdywania najmniejszego i największego elementu obecne jest
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Alfa-beta Ulepszenie minimax Liczba wierzchołk ow w drzewie gry. maksymalnie wd. minimalnie wbd/2c + wdd/2e Algorytmy przeszukiwania drzewa gry 5
Zastosowanie metody Samuela doboru współczynników funkcji oceniajacej w programie grajacym w anty-warcaby Daniel Osman promotor: dr hab. inż. Jacek Mańdziuk 1 Spis treści Algorytmy przeszukiwania drzewa
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Metoda UCT w stochastycznych problemach transportowych
Metoda UCT w stochastycznych problemach transportowych mgr inż. Maciej Świechowski promotor: prof. Jacek Mańdziuk Seminarium Metody Inteligencji Obliczeniowej 25.06.2015 Plan prezentacji Krótkie przypomnienie
Analiza konstrukcji zawierających wskaźniki. Piotr Błaszyński
Analiza konstrukcji zawierających wskaźniki Piotr Błaszyński Wskaźniki podejście naiwne: while(ptr!=null){ a[i] = *ptr; i++; ptr++; } po zmianie: N=length(ptr); alias_ptr = ptr; for(j=0 ; j
Ranking wyników na bazie linków
Eksploracja zasobów internetowych Wykład 4 Ranking wyników na bazie linków mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Poznane do tej pory mechanizmy sortowania istotności zwróconych wyników bazowały
KODY SYMBOLI. Kod Shannona-Fano. Algorytm S-F. Przykład S-F
KODY SYMBOLI Kod Shannona-Fano KODOWANIE DANYCH, A.Przelaskowski Metoda S-F Kod Huffmana Adaptacyjne drzewo Huffmana Problemy implementacji Kod Golomba Podsumowanie Kod drzewa binarnego Na wejściu rozkład:
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Metody probabilistyczne klasyfikatory bayesowskie
Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych First Prev Next Last Go Back Full Screen Close Quit Metody probabilistyczne klasyfikatory bayesowskie Wykład 8 Marcin
Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki
Dariusz Banasiak Katedra Informatyki Technicznej Wydział Elektroniki Machine Learning (uczenie maszynowe, uczenie się maszyn, systemy uczące się) interdyscyplinarna nauka, której celem jest stworzenie
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Heurystyczne metody przeszukiwania
Heurystyczne metody przeszukiwania Dariusz Banasiak Katedra Informatyki Technicznej W4/K9 Politechnika Wrocławska Pojęcie heurystyki Metody heurystyczne są jednym z ważniejszych narzędzi sztucznej inteligencji.
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość
Dwie metody Klasyczna metoda histogramu jako narzędzie do postawienia hipotezy, jaki rozkład prawdopodobieństwa pasuje do danych Indukcja drzewa decyzyjnego jako metoda wykrycia klasyfikatora ukrytego
Algorytmy genetyczne
Algorytmy genetyczne Motto: Zamiast pracowicie poszukiwać najlepszego rozwiązania problemu informatycznego lepiej pozwolić, żeby komputer sam sobie to rozwiązanie wyhodował! Algorytmy genetyczne służą
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony.
GRY (część 1) Zastosowanie: Modelowanie sytuacji konfliktowych, w których występują dwie antagonistyczne strony. Najbardziej znane modele: - wybór strategii marketingowych przez konkurujące ze sobą firmy
Planowanie przedsięwzięć
K.Pieńkosz Badania Operacyjne Planowanie przedsięwzięć 1 Planowanie przedsięwzięć Model przedsięwzięcia lista operacji relacje poprzedzania operacji modele operacji funkcja celu planowania K.Pieńkosz Badania