Metoda ewolucyjnego doboru współczynników funkcji oceniającej w antywarcabach

Podobne dokumenty
Alfa-beta Ulepszenie minimax Liczba wierzchołk ow w drzewie gry. maksymalnie wd. minimalnie wbd/2c + wdd/2e Algorytmy przeszukiwania drzewa gry 5

METODY SZTUCZNEJ INTELIGENCJI 2 Opis projektu

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

Dobór parametrów algorytmu ewolucyjnego

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

METODY SZTUCZNEJ INTELIGENCJI algorytmy ewolucyjne

SZTUCZNA INTELIGENCJA

Strategie ewolucyjne (ang. evolu4on strategies)

Optymalizacja optymalizacji

Programowanie genetyczne, gra SNAKE

Programowanie genetyczne - gra SNAKE

Algorytmy genetyczne. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki

PUCHAR ZARZĄDU GŁÓWNEGO w bowlingu

ATOLL. Wykonali: Aleksandra Kuchta, Łukasz Wójcik, Sztuczna Inteligencja, Semestr trzeci, Kierunek Informatyka, Wydział Informatyki i Zarządzania,

Algorytmy ewolucyjne (3)

Regulamin Zawodów. Bank: Nr rachunku:

Wyznaczanie strategii w grach

B.VII USTALANIE KOLEJNOŚCI MIEJSC W TURNIEJACH PZSZACH. q Ustalanie kolejności miejsc (PZSzach) Część B.VII str. 1

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Algorytm genetyczny (genetic algorithm)-

Metody Rozmyte i Algorytmy Ewolucyjne

Tworzenie gier na urządzenia mobilne

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Algorytmy ewolucyjne 1

Temat: Sieci neuronowe oraz technologia CUDA

Metody przeszukiwania

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

8. Neuron z ciągłą funkcją aktywacji.

Regulamin Zawodów. Citi Handlowy II Klubowe Mistrzostwa Polski Seniorów Sierra Golf Club sierpnia 2018 Ranking PZG Klubowy Puchar Polski

Algorytmy dla gier dwuosobowych

[Wpisz tekst] Regulamin Zawodów

Metody Sztucznej Inteligencji II

3. MINIMAX. Rysunek 1: Drzewo obrazujące przebieg gry.

ZASTOSOWANIE ALGORYTMU GENETYCZNEGO DO KONSTRUKCJI

Strefa pokrycia radiowego wokół stacji bazowych. Zasięg stacji bazowych Zazębianie się komórek

Regulamin Zawodów. Bank:

SIECI REKURENCYJNE SIECI HOPFIELDA

Algorytmy ewolucyjne Część II

Wstęp do głębokich sieci neuronowych. Paweł Morawiecki IPI PAN

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!

Uczenie sieci radialnych (RBF)

Regulamin V Mistrzostw Polski w Scrabble po angielsku

Narzędzia AI. Jakub Wróblewski Pokój SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE)

Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy

Retro Bowling Club 2019

Algorytmy genetyczne w optymalizacji

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym, kontynuacja badań

Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

IV Otwarte Mistrzostwa Łodzi 2013

SZTUCZNA INTELIGENCJA

Wstęp do sieci neuronowych, wykład 6 Wsteczna propagacja błędu - cz. 3

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Problemy z ograniczeniami

REGULAMIN MISTRZOSTW POLSKI 2015 NEUROSHIMA: HEX 3.0

Podejście memetyczne do problemu DCVRP - wstępne wyniki. Adam Żychowski

29 maja 2017 r Opłata wpisowa za drużynę wynosi 3360 zł. Polskie Związek Golfa Al. Jerozolimskie 65/ Warszawa

DRUŻYNOWYCH MISTRZOSTW POLSKI w SZACHACH

Zastosowania sieci neuronowych

Algorytmy ewolucyjne

Sieci M. I. Jordana. Sieci rekurencyjne z parametrycznym biasem. Leszek Rybicki. 30 listopada Leszek Rybicki Sieci M. I.

Algorytmy ewolucyjne optymalizacji wielokryterialnej sterowane preferencjami decydenta

JAK GRAĆ ONLINE? Korzystając z poniższych wskazówek, będziesz mógł rozgrywać mecze online, przekonasz się jakie to proste, ciekawe i ekscytujące.

Polski Związek Szachowy

Uczenie sieci typu MLP

DEKOMPOZYCJA HIERARCHICZNEJ STRUKTURY SZTUCZNEJ SIECI NEURONOWEJ I ALGORYTM KOORDYNACJI

Nazwa rachunku: Polski Związek Golfa Al. Jerozolimskie 65/ Warszawa

Regulamin Zawodów. Citi Handlowy XIII Mistrzostwa Polski Match Play Kraków Valley Golf & Country Club maja 2019 Ranking PZG kategoria Super

Regulamin KSzK nr 4 KLASYFIKACYJNO-RANKINGOWY

wiedzy Sieci neuronowe

Automatyczne Diagnozy Partii Szachowych nowa funkcja Zestawienie Ruchów.

Strategie ewolucyjne. Gnypowicz Damian Staniszczak Łukasz Woźniak Marek

Metody sztucznej inteligencji Zadanie 3: (1) klasteryzacja samoorganizująca się mapa Kohonena, (2) aproksymacja sieć RBF.

KARTA PRZEDMIOTU. 17. Efekty kształcenia:

Pawnographic chess. (Sztuczna inteligencja) Wydzia ł Informatyki i Zarządzania Informatyka. Pozna ń, 25 lutego 2008 r.

Program "FLiNN-GA" wersja 2.10.β

Strategie ewolucyjne (ang. evolution strategies)

Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009

Podstawy Sztucznej Inteligencji (PSZT)

Inteligentne systemy przeciw atakom sieciowym

Techniki optymalizacji

Regulamin Zawodów. Citi Handlowy XII Klubowe Mistrzostwa Polski Grupa Kwalifikacyjna Rosa Private Golf Club czerwca 2013

SIECI RBF (RADIAL BASIS FUNCTIONS)

Uczenie maszynowe end-to-end na przykładzie programu DeepChess. Stanisław Kaźmierczak

Algorytmy ewolucyjne. wprowadzenie

SZACHY mini INSTRUKCJA. rekwizyty: 1) Bierki - 32 szt. 2) plansza - 1 szt.

Nazwa rachunku: Polski Związek Golfa Al. Jerozolimskie 65/ Warszawa

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

Równoważność algorytmów optymalizacji

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Wstęp do Sztucznej Inteligencji

Przyrostowe uczenie sieci neuronowych w grze w go

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

Transkrypt:

Metoda ewolucyjnego doboru współczynników funkcji oceniającej w antywarcabach Promotor: dr hab. Jacek Mańdziuk Autor: Jarosław Budzianowski Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 1/44

Plan prezentacji Kontekst - praca magisterska Doświadczenie Chellapilli i Fogla Zastosowanie Wyniki Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 2/44

Kontekst - praca magisterska Kontekst - praca magisterska Antywarcaby Dwie funkcje oceniajace Algorytm genetyczny Drzewo gry Doświadczenie Chellapilli i Fogla Zastosowanie Wyniki Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 3/44

Antywarcaby Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 4/44

Antywarcaby Szachownica 8x8 Reguły amerykańskie: pionki tylko do przodu ruch damek we wszystkie strony, ale tylko o jedno pole obowiazuje nakaz bicia Zwycięstwo - niemożność wykonania ruchu oddanie wszystkich kamieni wszystkie kamienie zablokowane Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 5/44

Dwie funkcje oceniajace Funkcje heurystyczne Arthur L. Samuel 22 wagi Sieć neuronowa Chellapilla, Fogel Ponad 5000 wag... Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 6/44

Drzewo gry Zwykły mini-max Głębokość przeszukiwania: 4 Pogłębianie Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 7/44

Algorytm genetyczny Wektory wag poszukiwane w procesie genetycznym Operatory i parametry wzorowane na Chellapilli i Foglu Problem: brak obektywnej oceny Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 8/44

Doświadczenie Chellapilli i Fogla Kontekst - praca magisterska Doświadczenie Chellapilli i Fogla Idea Sieć neuronowa Algorytm genetyczny Zastosowanie Wyniki Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 9/44

Idea Autorzy: Kumar Chellapilla, David B. Fogel Sieć neuronowa + algorytm genetyczny Całkowity brak wiedzy eksperckiej Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 10/44

Idea Autorzy: Kumar Chellapilla, David B. Fogel Sieć neuronowa + algorytm genetyczny Całkowity brak wiedzy eksperckiej Seria artykułów Chellapilla K and Fogel DB (1999) "Evolving Neural Networks to Play Checkers without Expert Knowledge," IEEE Trans. Neural Networks, Vol. 10:6, pp. 1382-1391. Chellapilla K and Fogel DB (2000) "Anaconda beats Hoyle 6-0: A Case Study Competing an Evolved Checkers Playing Program Against Commercially Available Software," Proc. 2000 Congress on Evolutionary Computation, IEEE, San Diego, CA, pp. 857-863.... Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 10/44

Idea Autorzy: Kumar Chellapilla, David B. Fogel Sieć neuronowa + algorytm genetyczny Całkowity brak wiedzy eksperckiej Seria artykułów... Chellapilla K and Fogel DB (2001) "Evolving a Neural Network to Play Checkers without Human Expertise," Computational Intelligence in Games, N. Baba and L.C. Jain (eds.), Springer, Verlag, pp. 39-56. Fogel DB and Chellapilla K (2002) "Verifying Anaconda s Expert Rating by Competing Against Chinook: Experiments in Co-Evolving a Neural Checkers Player," Neurocomputing, Vol. 42, pp. 69-86. Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 10/44

Sieć neuronowa Struktura Pierwsza warstwa ukryta (91 neuronów) 36 razy 3x3 25 razy 4x4 Trzecia warstwa ukryta (10 neuronów) Wyjście 4 razy 7x7 1 raz 8x8 Druga warstwa ukryta (40 neuronów) Suma wartości wszystkich pionków Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 11/44

Sieć neuronowa Wejścia Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 12/44

Sieć neuronowa Wejścia Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 13/44

Sieć neuronowa 5046 wag Wartości pól: { K, 1,0,1,+K} Funkcja aktywacji: tangens hiperboliczny (ograniczony przez ±1) Trzy warstwy ukryte: 91 + 40 + 10 neuronów Dodatkowe wejście do neuronu wyjściowego stanowi suma wartości materiału Szkolenie sieci z użyciem algorytmu genetycznego! Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 14/44

Algorytm genetyczny Postać chromosomu: ( x, σ) = x(1) x(2)... x(n w) σ(1) σ(2)... σ(n w ) Mutacja: σ i(j) = σ i (j)exp(τn j (0,1)), dla j = 1,...,N w x i(j) = x i (j) + σ i(j)n j (0,1), dla j = 1,...,N w τ = ( 2 N w ) 1 Wartość damki: K i = K i + σ, gdzie σ { 0.1,0.0,+0.1} K i została ograniczona do < 1.0,3.0 > Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 15/44

Algorytm genetyczny Schemat algorytmu 1. Utwórz poczatkow a populację S (n osobników) 2. Utwórz n osobników stosujac operator mutacji na osobnikach z S 3. Znajdź wartość damki K dla nowych osobników 4. Rozegraj wewnętrzny turniej z udziałem wszystkich 2n osobników 5. S = n najlepszych osobników (na podstawie turnieju) 6. Idź do 2. Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 16/44

Algorytm genetyczny Turniej 2n uczestników (osobników) Zwycięstwo = 1 punkt, Remis = 0 punktów, Porażka = -2 punkty Każdy uczestnik rozgrywa k pojedynków białymi z losowym przeciwnikiem W sumie 2nk pojedynków Średnio każdy uczestnik rozgrywa 2k pojedynków Wartości proponowane przez Fogla i Chellapillę: n = 15, k = 5 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 17/44

Zastosowanie Kontekst - praca magisterska Doświadczenie Chellapilli i Fogla Zastosowanie Sieć neuronowa Algorytm genetyczny Poszukiwania parametrów Wyniki Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 18/44

Sieć neuronowa Niemal bez zmian: dodanie jednej wagi Pierwsza warstwa ukryta (91 neuronów) 36 razy 3x3 25 razy 4x4 Trzecia warstwa ukryta (10 neuronów) Wyjście 4 razy 7x7 1 raz 8x8 Druga warstwa ukryta (40 neuronów) Suma wartości wszystkich pionków Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 19/44

Algorytm genetyczny gracz nieaktywny 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 gracz aktywny Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 20/44

Algorytm genetyczny Poszukiwanie wartości damki analogicznie do wektora wag Całkowity brak ograniczeń na wartości wag Modyfikacja operatora mutacji w celu umożliwienia osiagania wartości ujemnych Dodanie operatora rekombinacji: ( x a, σ a ) + ( x b, σ b ), gdzie a b ( x i, σ i ) (j) = { ( x a, σ a )(j) ( x b, σ b )(j) jeśli rand j parzysta, w p.p. Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 21/44

Algorytm genetyczny Schemat 1. Utwórz poczatkow a populację S (n osobników) 2. Utwórz n osobników stosujac operator mutacji na osobnikach z S 3. Utwórz n osobników stosujac operator rekombinacji na osobnikach z S 4. Rozegraj wewnętrzny turniej z udziałem wszystkich 3n osobników 5. S = n najlepszych osobników (na podstawie turnieju) 6. Idź do 2. Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 22/44

Algorytm genetyczny Turniej 3n uczestników (osobników) Zwycięstwo = 3 punkty, Remis = 1 punkt, Porażka = 0 punktów Każdy uczestnik rozgrywa k pojedynków białymi z losowym przeciwnikiem W sumie 3nk pojedynków Średnio każdy uczestnik rozgrywa 2k pojedynków Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 23/44

Poszukiwania parametrów Wersja pierwotna Funkcja oceniajaca Samuela Amerykańskie reguły gry Punktacja: Zwycięstwo = 3, Remis = 1, Porażka = 0 Liczba uczestników: 3 razy 15 Liczba pojedynków każdego uczestnika jako rozpoczynajacy: 5 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 24/44

Poszukiwania parametrów Wersja pierwotna 1. miejsce 2. miejsce 3. miejsce 4. miejsce 5. miejsce 100 10 (33) 30 (28) 37 (18) 20 (39) 60 (33) 200 140 (38) 110 (43) 158 (22) 119 (44) 179 (23) 300 249 (21) 290 (41) 249 (44) 290 (23) 290 (26) 400 338 (28) 339 (27) 320 (37) 360 (29) 338 (27) 500 500 (17) 489 (31) 460 (18) 490 (28) 440 (38) 600 580 (44) 580 (34) 580 (37) 588 (44) 579 (34) 700 640 (31) 610 (37) 610 (20) 629 (15) 700 (44) 800 740 (41) 710 (37) 719 (37) 719 (34) 770 (20) 900 880 (29) 820 (43) 840 (39) 820 (34) 868 (37) 1000 960 (35) 990 (35) 940 (26) 970 (41) 999 (21) Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 25/44

Poszukiwania parametrów Powrót do ChF Funkcja oceniajaca Samuela Amerykańskie reguły gry Punktacja: Zwycięstwo = 1, Remis = 0, Porażka = -2 Liczba uczestników: 3 razy 10 Liczba pojedynków każdego uczestnika jako rozpoczynajacy: 5 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 26/44

Poszukiwania parametrów Powrót do ChF 1. miejsce 2. miejsce 3. miejsce 4. miejsce 5. miejsce 100 89 (28) 70 (23) 78 (21) 40 (11) 40 (10) 200 110 (25) 164 (15) 160 (11) 140 (16) 160 (14) 300 268 (13) 269 (22) 290 (26) 238 (19) 270 (24) 400 307 (33) 308 (28) 310 (24) 370 (24) 377 (27) 500 469 (26) 499 (27) 480 (18) 419 (10) 480 (16) 600 598 (11) 580 (23) 549 (27) 600 (24) 577 (27) 700 690 (12) 690 (21) 650 (23) 680 (23) 639 (16) 800 799 (12) 760 (18) 730 (17) 800 (15) 730 (27) 900 899 (16) 810 (20) 878 (12) 820 (24) 840 (11) 1000 919 (18) 909 (21) 910 (13) 959 (24) 978 (23) Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 27/44

Poszukiwania parametrów Wersja wydłużona Funkcja oceniajaca Samuela Amerykańskie reguły gry Punktacja: Zwycięstwo = 1, Remis = 0, Porażka = -2 Liczba uczestników: 3 razy 10 Liczba pojedynków każdego uczestnika jako rozpoczynajacy: 10 Uwaga: Proces natrafił na ekstremum lokalne Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 28/44

Poszukiwania parametrów Wersja wydłużona 1. miejsce 2. miejsce 3. miejsce 4. miejsce 5. miejsce 100 27 (22) 79 (25) 80 (15) 25 (28) 58 (18) 200 160 (14) 199 (23) 188 (26) 130 (23) 130 (14) 300 278 (18) 262 (26) 207 (12) 260 (24) 297 (23) 400 350 (27) 360 (28) 367 (29) 360 (21) 380 (29) 500 447 (13) 440 (26) 417 (20) 469 (17) 429 (26) 600 546 (14) 578 (18) 550 (23) 580 (23) 580 (11) 700 689 (29) 649 (27) 658 (22) 648 (27) 668 (25) 800 770 (20) 739 (28) 707 (15) 759 (26) 760 (24) 900 850 (14) 890 (13) 850 (26) 899 (16) 809 (11) 1000 920 (27) 910 (21) 979 (25) 960 (28) 990 (18) Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 29/44

Poszukiwania parametrów Wersja wydłużona Rozkład punktacji 10 0 punkty 10 20 30 40 0 200 400 600 800 1000 generacja Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 30/44

Poszukiwania parametrów Wersja wydłużona Stosunek liczby remisów (kolor pomarańczowy) do partii rozstrzygniętych (kolor niebieski) 300 rozkład (razem 150) 200 100 0 0 200 400 600 800 1000 generacja Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 31/44

Poszukiwania parametrów Zmodyfikowana punktacja Zmniejszenie wpływu losowości na wyniki turniejów Modyfikacja stosowana dla osobników starszych Do wyniku w danym turnieju dodawana średnia wartość poprzednich wyników S = S + S 0 A 2 S - ostateczny wynik turnieju S - pierwotny wynik turnieju S 0 - suma wyników z wcześniejszych turniejów A - wiek osobnika Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 32/44

Poszukiwania parametrów Zmodyfikowana punktacja 1. miejsce 2. miejsce 3. miejsce 4. miejsce 5. miejsce 100 40 (24) 40 (25) 44 (14) 38 (12) 49 (20) 200 168 (12) 110 (15) 109 (11) 200 (17) 150 (12) 300 280 (18) 250 (27) 250 (15) 207 (21) 229 (17) 400 398 (11) 390 (20) 399 (26) 379 (25) 389 (20) 500 440 (28) 410 (17) 429 (22) 409 (22) 407 (25) 600 520 (24) 513 (21) 528 (23) 520 (20) 519 (21) 700 699 (26) 629 (22) 700 (17) 608 (24) 645 (23) 800 760 (15) 800 (16) 780 (12) 790 (23) 800 (15) 900 900 (26) 876 (17) 899 (15) 900 (25) 890 (25) 1000 959 (28) 907 (23) 976 (21) 947 (21) 920 (29) Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 33/44

Wyniki Kontekst - praca magisterska Doświadczenie Chellapilli i Fogla Zastosowanie Wyniki Chellapilla i Fogel Porównanie konkurencyjnych funkcji oceniajacych Uwagi Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 34/44

Chellapilla i Fogel www.zone.com Najlepszy osobnik po 840 generacjach (6 miesięcy na komputerze Pentium II 400 MHz) Głębokość przeszukiwania drzewa: 8 165 pojedynków na www.zone.com Program uzyskał ranking 2048.85 (ekspert), lepszy niż 99,61% zarejestrowanych graczy 94 zwycięstwa, 32 remisy, 39 porażek (głównie z graczami o wysokich rankingach) Anakonda - unieruchamia przeciwnika Mimo braku zaimplementowanej koncepcji mobilności! Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 35/44

Chellapilla i Fogel Chinook University of Alberta (Edmonton, Kanada), szef zespołu: Jonathan Schaeffer Wpisany do Księgi Rekordów Guiness a jako pierwszy komputer, który pokonał ludzkiego mistrza świata w jakiejkolwiek grze Przeszukiwanie drzewa gry na głębokość minimum 17-19 ruchów Pełna baza końcówek dla 8 i mniej pionków na planszy (wcześniej 6, 7) Ranking: 2814 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 36/44

Chellapilla i Fogel Chinook Wersja z 1994 dostępna w Internecie Trzy wersje: novice (głębokość przeszukiwania 5) amateur (9) intermediate (13) Baza końcówek: od 6 kamieni Ranking 2150-2175 (wersja novice) 10 pojedynków: 4 zw. Chinook a, 2 zw. Anakondy, 4 remisy Stad ranking Anakondy: 2030-2055 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 37/44

Porównanie funkcji oceniajacych Pentium IV 2600 MHz - widziany jako dwie jednostki centralne Dwa tygodnie - obie metody uzyskały ok. 350 godzin czasu procesora Funkcja Samuela: 4298 generacji, Chellapilli i Fogla: 2147 Turniej porównujacy siłę gry: Po 10 osobników z odpowiedniej generacji 10 rund po dwa razy każdy z każdym Punktacja: Zwycięstwo = 1, Remis = 0, Porażka = -2 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 38/44

Porównanie funkcji oceniajacych 1000 kontra 1000 metoda generacja indeks wynik chf 998 12-7 sam 998 29-11 chf 1000 22-34 chf 1000 25-37 sam 1000 23-37 sam 1000 12-45 sam 1000 10-58 chf 999 19-62 chf 1000 21-67 chf 1000 13-68 Średnio sam = -75,3 ; chf = -77,4 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 39/44

Porównanie funkcji oceniajacych 2000 kontra 2000 metoda generacja indeks wynik sam 2000 26-17 sam 1999 14-22 sam 1999 22-39 chf 2000 21-44 chf 1999 28-44 sam 2000 29-46 sam 1993 26-46 chf 1998 14-48 chf 2000 28-49 sam 1995 16-53 Średnio sam = -61,9 ; chf = -79,0 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 40/44

Porównanie funkcji oceniajacych 2000 kontra 4000 metoda generacja indeks wynik chf 2147 16 26!!! sam 4297 28-33 sam 4296 16-41 chf 2147 13-43 chf 2147 24-52 sam 4297 24-57 sam 4283 13-58 sam 4298 27-61 chf 2143 20-63 sam 4297 26-66 Średnio sam = -71,5 ; chf = -70,0 Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 41/44

Uwagi Metoda Chellapilli i Fogla Przestrzeń ma ponad 5000 wymiarów Niewielka liczba osobników Krótkie turnieje - duży wpływ losowości Krótki proces genetyczny Algorytmy genetyczne i antywarcaby Problem z wyłonieniem najlepszego osobnika Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 42/44

Podsumowanie Kontekst - praca magisterska Doświadczenie Chellapilli i Fogla Zastosowanie Wyniki Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 43/44

KONIEC Metoda ewolucyjnego doboru współczynników funkcji oceniajacej w antywarcabach p. 44/44