Systems Research Institute Polish Academy of Sciences

Podobne dokumenty
POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

Risk-Aware Project Scheduling. SimpleUCT

Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem przedsięwzięcia z wykorzystaniem metod sieciowych PERT i CPM

Opinia o pracy doktorskiej pt. On active disturbance rejection in robotic motion control autorstwa mgr inż. Rafała Madońskiego

1. Problem badawczy i jego znaczenie. Warszawa,

Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa

Matryca weryfikacji efektów kształcenia - studia III stopnia

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

R E C E N Z J A. rozprawy doktorskiej mgr Wojciecha Bury nt. Wielokryterialne, mrowiskowe algorytmy optymalizacji w nawigacji samochodowej

Schemat programowania dynamicznego (ang. dynamic programming)

Jacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Optymalizacja ciągła

MATEMATYCZNE METODY WSPOMAGANIA PROCESÓW DECYZYJNYCH

Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH

Recenzja rozprawy doktorskiej mgr Pradeep Kumar pt. The Determinants of Foreign

Opinia o pracy doktorskiej pt. Damage Identification in Electrical Network for Structural Health Monitoring autorstwa mgr inż.

Algorytmy i schematy blokowe

K.Pieńkosz Badania Operacyjne Wprowadzenie 1. Badania Operacyjne. dr inż. Krzysztof Pieńkosz

Aproksymacja funkcji a regresja symboliczna

JAKIEGO RODZAJU NAUKĄ JEST

Maciej Piotr Jankowski

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.

RISK-AWARE PROJECT SCHEDULING

Heurystyki. Strategie poszukiwań

Opinia o pracy doktorskiej pt. Systemy adaptacyjnej absorpcji obciążeń udarowych autorstwa mgr inż. Piotra Krzysztofa Pawłowskiego

Heurystyczne metody przeszukiwania

Przedstawiona do recenzji rozprawa doktorska Pana mgra inż. Adama Dudka pt. :

Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD III: Problemy agenta

Wstęp do Sztucznej Inteligencji

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Recenzja rozprawy doktorskiej mgr Łukasza Gadomera pt. Rozmyte lasy losowe oparte na modelach klastrowych drzew decyzyjnych w zadaniach klasyfikacji

Recenzja pracy doktorskiej mgr Tomasza Świsłockiego pt. Wpływ oddziaływań dipolowych na własności spinorowego kondensatu rubidowego

Do oceny przedstawiono oprawioną rozprawę doktorską zawierającą 133 strony

PRAKTYCZNE METODY BADANIA NIEWYPŁACALNOŚCI ZAKŁADÓW UBEZPIECZEŃ

RECENZJA. rozprawy doktorskiej Jolanty GRZEBIELUCH nt. "Znaczenie strategii marketingowej w

Recenzja rozprawy doktorskiej mgr inż. Jarosława Błyszko

BADANIA OPERACYJNE i teoria optymalizacji. Prowadzący: dr Tomasz Pisula Katedra Metod Ilościowych

KIERUNKOWE EFEKTY KSZTAŁCENIA

OPIS EFEKTÓW KSZTAŁCENIA W OBSZARZE KSZTAŁCENIA W ZAKRESIE NAUK TECHNICZNYCH. Profil ogólnoakademicki. Wiedza

Modelowanie i Programowanie Obiektowe

RECENZJA ROZPRAWY DOKTORSKIEJ DLA RADY WYDZIAŁU ELEKTRONIKI I TECHNIK INFORMACYJNYCH POLITECHNIKI WARSZAWSKIEJ

Modele optymalizacyjne wspomagania decyzji wytwórców na rynku energii elektrycznej

Metody Optymalizacji: Przeszukiwanie z listą tabu

Granty badawcze. dr Tomasz Janus Biuro ds. Badań Naukowych UKSW

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Metody Programowania

ZAŁĄCZNIK NR 2 Uchwała Rady Wydziału Elektrotechniki i Informatyki Politechniki Lubelskiej z dnia 3 czerwca 2013 r

Wykład z Technologii Informacyjnych. Piotr Mika

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Spacery losowe generowanie realizacji procesu losowego

Rozprawy doktorskiej mgr Anny Marii Urbaniak-Brekke. pt.: Aktywność społeczności lokalnych w Polsce i Norwegii

Podstawy Programowania Obiektowego

Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach

Wprowadzenie dosystemów informacyjnych

Ekonomia menedżerska William F. Samuelson, Stephen G. Marks

Opis kryteriów, którymi Zamawiający będzie się kierował przy wyborze oferty, wraz z podaniem znaczenia tych kryteriów i sposobu oceny ofert:

10. Wstęp do Teorii Gier

Uchwała Nr 000-2/6/2013 Senatu Uniwersytetu Technologiczno-Humanistycznego im. Kazimierza Pułaskiego w Radomiu z dnia 21 marca 2013 r.

Faza Określania Wymagań

PRINCE2 Foundation & Practitioner - szkolenie z egzaminem certyfikacyjnym

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

KIERUNKOWE EFEKTY KSZTAŁCENIA

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning

DWUKROTNA SYMULACJA MONTE CARLO JAKO METODA ANALIZY RYZYKA NA PRZYKŁADZIE WYCENY OPCJI PRZEŁĄCZANIA FUNKCJI UŻYTKOWEJ NIERUCHOMOŚCI

Recenzja rozprawy doktorskiej mgr inż. Joanny Wróbel

Algorytm. Krótka historia algorytmów

Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15

Efekty kształcenia. Tabela efektów kształcenia

Plan. Zakres badań teorii optymalizacji. Teoria optymalizacji. Teoria optymalizacji a badania operacyjne. Badania operacyjne i teoria optymalizacji

Programowanie komputerów

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Ocena osiągnięć Dr. Adama Sieradzana w związku z ubieganiem się o nadanie stopnia naukowego doktora habilitowanego.

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Uniwersytet Łódzki Wydział Matematyki i Informatyki PROGRAM KSZTAŁCENIA kierunek Informatyka Środowiskowe Studia Doktoranckie (studia III stopnia)

efekty kształcenia dla kierunku Elektronika studia stacjonarne drugiego stopnia, profil ogólnoakademicki

Badania operacyjne. Michał Kulej. semestr letni, Michał Kulej () Badania operacyjne semestr letni, / 13

Efekty kształcenia Dla kierunku Inżynieria Bezpieczeństwa

Gdynia, dr hab. inż. Krzysztof Górecki, prof. nadzw. AMG Katedra Elektroniki Morskiej Akademia Morska w Gdyni

Specjalność Optymalizacja Decyzji Menedżerskich. Katedra Badań Operacyjnych Uniwersytetu Łódzkiego

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

SCENARIUSZ LEKCJI. Autorzy scenariusza: Krzysztof Sauter (informatyka), Marzena Wierzchowska (matematyka)

W trakcie konferencji zademonstrowano doświadczenia, rozwiązania i konkretne projekty wdrażania Krajowych Ram Interoperacyjności

dr hab. inż. Jacek Dziurdź, prof. PW Warszawa, r. Instytut Podstaw Budowy Maszyn Politechnika Warszawska

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Recenzja opracowania M. Bryxa. pt: Rynek nieruchomości. System i funkcjonowanie.

OPINIA. o rozprawie doktorskiej mgr inż. Beaty Potrzeszcz-Sut, pt. Sieci neuronowe w wybranych zagadnieniach mechaniki konstrukcji i materiałów".

Organizacyjny aspekt projektu

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA

ZARZĄDZANIE I INŻYNIERIA PRODUKCJI

M T E O T D O ZI Z E E A LG L O G R O Y R TM

zna metody matematyczne w zakresie niezbędnym do formalnego i ilościowego opisu, zrozumienia i modelowania problemów z różnych

Recenzja rozprawy doktorskiej

Opinia o dorobku naukowym dr inż. Ireneusz Dominik w związku z wystąpieniem o nadanie stopnia naukowego doktora habilitowanego.

Transkrypt:

Systems Research Institute Polish Academy of Sciences Newelska 6, 01-447 Warszawa, Poland Phone: Directors: Fax: E-mail: Web: Tax no.: (48) 22 38 10 100 (48) 22 38 10 275 (48) 22 38 10 105 ibs@ibspan.waw.pl www.ibspan.waw.pl 525 000 86 08 Prof. dr hab. inż. Janusz Kacprzyk, dr h.c. (mult.) Fellow, IEEE, IFSA, ECCAI, SMIA Członek rzeczywisty, Polska Akademia Nauk Członek, Academia Europaea (Informatyka) Członek, European Academy of Sciences and Arts Członek zagraniczny, Bułgarska Akademia Nauk Członek zagraniczny, Hiszpańska Królewska Akademia Nauk Ekonomicznych i Finansowych (RACEF) Warszawa, 1 czerwca 2017 r. Recenzja rozprawy doktorskiej mgr inż. Karola Walędzika pt. Połączenie algorytmów symulacyjnych oraz dziedzinowych metod heurystycznych w zagadnieniach dynamicznego podejmowania decyzji Niniejsza recenzja została przygotowana na prośbę Dziekana Wydziału Matematyki i Nauk Informacyjnych Politechniki Warszawskiej, prof. dr. hab. Wojciecha Domitrza. Najogólniej biorąc, praca jest bardzo oryginalna i niestandardowa. Otóż, po pierwsze, mamy z jednej strony prace Promotora, wybitnego w skali światowej specjalistę z dziedziny tzw. gier uogólnionych, która właściwie polega na zastosowaniu różnych metod i rozwiązań logicznych i algorytmicznych do reprezentacji różnego rodzaju gier, przede wszystkim skończonych, symultanicznych oraz dwu lub wieloosobowych, o pełnej informacji, a potem do opracowania agenta mogącego grać z powodzeniem w wiele tego typu gier, np. Go, Othello, warcaby itp., a nie tylko jedną konkretną grę. W tej rozwijającej się zresztą ostatnio dziedzinie znanych jest wiele podejść i metod wyznaczania strategii wygrywających. Jako punkt wyjścia bierze się przy tym zwykle, także w recenzowanej pracy, tzw. GGP (ang. General Game Playing), platformę umożliwiającej wyznaczanie strategii wygrywających dla różnych skończonych, symultanicznych i dwu lub wieloosobowych gier o pełnej informacji. Technicznie biorąc, zadanie wyznaczania wygrywającej strategii gracza sprowadza się do przeszukiwania pewnego drzewa decyzyjnego, zwykle bardzo dużego, co można zrealizować przez użycie algorytmu przeszukiwania drzew UCT (and. upper confidence bound applied to trees), znanej 1

zmodyfikowanej metody Monte Carlo przeszukiwania drzew MCTS (ang. Monte Carlo Tree Search), która zdobyła sobie wielką popularność w ostatnich latach. Oczywiście, natychmiast pojawia się pytanie, czy ta metoda UCT, lub jakaś jej modyfikacja, która w końcu sprowadza się do przeszukiwania drzew decyzyjnych, a w przypadku niepewności dodatkowo do symulacji, może być zastosowana do innych zadań, z innych dziedzin. Przecież przeszukiwanie drzew decyzyjnych jest istotą wielkiej liczby problemów typu podejmowania decyzji, analizy danych, itd. występujących w bardzo różnych dziedzinach nauki i techniki. Dobrze by przy tym było, gdyby spróbować zastosować te metody do jakichś ważnych, sztandarowych, zadań, które są od lat przedmiotem badań, dla których są znane optymalne metody wyznaczania rozwiązań, ale też efektywne metody heurystyczne. W pracy wybrano zadanie harmonogramowania, które nazwano RAPSP (and. Risk Aware Project Scheduling Problem). Jest to wybór dobry, bo w ogólności wszelkie nietrywialne zadania harmonogramowania są trudnymi zadaniami kombinatorycznymi, a wyznaczanie najlepszych harmonogramów jest niezwykle istotne dla praktyki. A zatem, ogólny cel, może nawet filozofia pracy, jest bardzo ciekawa. A mianowicie, bierzemy efektywne metody rozwiązywania zadań z jednej dziedziny i stosujemy je w innej dziedzinie, bardzo już tradycyjnej, w której wcześniej tych nowych metod się nie stosowało. Rozwinę to zresztą jeszcze w dalszej części. W tytule pracy jest dynamiczne podejmowanie decyzji, co jest prawdą, bo zarówno w zadaniach gier uogólnionych, z których bierze się te nowe metody przeszukiwania drzew, dynamika występuje, choćby dlatego, że decyzje podejmuje się krok po kroku, a jednocześnie rozpatrywane jako nowy obiekt zainteresowania zadanie harmonogramowania ma wyraźny charakter dynamiczny, bo czynności są wykonywanie w odpowiedniej kolejności i rozpoczynane w odpowiednich chwilach czasowych. Trzeba jednak podkreślić, że nie ma w pracy głębszej analizy wieloetapowych procesów podejmowania decyzji, które od wielu lat są przedmiotem intensywnych badań. Nie jest to jednak zarzut, ponieważ chyba należy tę rozprawę traktować jako propozycje koncepcyjnie nowego podejścia do rozwiązywania kombinatorycznych zadań wieloetapowego podejmowania decyzji, jakim jest niewątpliwie zadanie wyznaczania harmonogramu. Od tego do ogólnego podejścia do rozwiązywania wieloetapowego podejmowania decyzji droga jest daleka i, moim zdaniem, Autor dobrze zrobił, że na razie pokazał tylko zastosowanie swojego podejścia do konkretnego zadania z tej klasy, czyli zadania harmonogramowania. Podsumowując ten fragment o tym, co jest w końcu w każdym doktoracie rzeczą bardzo ważną, czyli o tym, czy w pracy jest oryginalna koncepcja, a także czy stosuje się właściwe środki formalne i algorytmiczne, a potem ich właściwą implementację, odpowiedź jest niewątpliwie twierdząca praca jest niewątpliwie bardzo oryginalna, a Autor zastosował bardzo ciekawe podejście. Jeżeli chodzi o tzw. hipotezy badawcze, to Autor formułuje je jako (cytuję): 2

Algorytmy symulacyjne, w szczególności UCT (and. upper confidence bound applied to trees), popularne głównie w obszarze gier, mogą być skuteczną metodą rozwiązywania złożonych dynamicznych problemów decyzyjnych samodzielnie lub jako element podejścia hybrydowego, Możliwe jest skonstruowanie podejścia hybrydowego, łączącego metody symulacyjne oraz dziedzinowe metody heurystyczne, uzyskując metodę skuteczniejszą od każdego z tych podejść stosowanych oddzielnie. W szczególności (cytuję): Tego typu podejścia łączone mogą sprawdzić się także w scenariuszach, w których standardowy mechanizm UCT jest niewystarczający. Tezy te są postawione właściwie, choć może nieco w pewnym sensie zbyt ambitnie, bo jak już napisałem Autor na dobra sprawę pokazuje dobre wyniki swojego podejścia dla specjalnego zadania harmonogramowania i te wyniki nie gwarantują oczywiście, że tak będzie dla innych kombinatorycznych zadać wieloetapowego podejmowania decyzji, choć jest na to szansa. Metodę hybrydową można oczywiście zawsze jakoś skonstruować, ale ważne jest pokazanie, że daje ona dobre wyniki, a właściwie lepsze niż poszczególne metody w jej skład wchodzące oddzielnie, bo inaczej nie byłoby sensu jest wprowadzać. Na szczęście, Autor pokazuje tę wartość dodaną hybrydyzacji. Przejdę teraz do omówienia kolejnych rozdziałów pracy. Bardzo ważna częścią pracy jest Rozdział 1. Wstęp. Autor podaje tu celne uwagi na temat rozwiązywania złożonych zadań, dla których w zasadzie można sobie wyobrazić użycie algorytmu optymalnego, ale ze względu zwykle na rozmiar zadania, ale też jego postać, jak np. silnie nieliniowe funkcje celu czy ograniczenia zastosowanie takich algorytmów może być albo niemożliwe albo nieefektywne. Ten fakt jest znany od lat, np. w badaniach operacyjnych, gdzie występuje cały szereg trudnych kombinatorycznych zadań optymalizacyjnych, praktycznie nierozwiązywalnych w rozsądnym czasie, co doprowadziło do zaproponowania wielu dziedzinowych metod heurystycznych. W tych metodach znajdują odbicie różnego rodzaju znane zależności i własności, specyficzne dla danej dziedziny czy klasy zadań, np. zadanie harmonogramowania, załadunku itp. Metody te działają zwykle dobrze i są powszechnie stosowane w praktyce. Zauważmy, że te powyższe własności i reguły są zwykle specyficzne dla danej klasy zadań, a nie ogólniejsze. To ostanie to już domena znacznie późniejszych metaheurystyk, których w pracy się na dobra sprawę nie stosuje. Dobrze podsumowano znaczenie symulacji komputerowej w rozwiązywaniu wszelkich złożonych zadań. Nawiasem mówiąc, zainteresowanie symulacje jest duże i rośnie, o czym świadczy np. fakt coraz większej popularności specjalizowanych konferencji typu SIMULTECH. Autor przedstawia dalej dobrze znaczenie zastosowania idei symulacji Monte Carlo, a w szczególności jej rozszerzeń, jak np. UCT (and. upper confidence bound applied to 3

trees), zwłaszcza w kontekście jej sukcesów w grach dwuosobowych, szczególnie Go. Zaraz potem krótko, ale celnie podsumowuje zagadnienie dynamicznego podejmowania decyzji, choć jak wspominałem może bym wyraźniej wspomniał, że nie rozpatruje się tego zagadnienia w kontekście ogólnym, ale na ważnym przykładzie zdania harmonogramowania, a wnioski wypływające z uzyskanych wyników dla tego specyficznego zadania, pozwalają sformułować tylko pewne wnioski ogólniejsze dla szerszej klasy zadań. Ciekawy i cenny jest krótki fragment dotyczący zastosowania do modelowania i rozwiązywania zadania wieloetapowego podejmowania decyzji znanej z gier uogólnionych koncepcji agenta GGP (ang. General Game Playing), platformy definiującej język opisu reguł gry oraz środowisko prowadzenia skończonej, symultanicznej, i deterministycznej gry jednolub wieloosobowej o pełnej informacji, oczywiście dla grania w wiele różnych gier. Podsumowując, ten rozdział wstępny jest napisany dobrze i od razu wprowadza czytelnika w to, co Autor zamierza w pracy rozpatrywać, jakie ogólnie metody zastosować i co chciałby osiągnąć. Rozdział 2 Metody symulacyjne jest krótkim wprowadzeniem do symulacji komputerowej, dziedziny niezwykle ważnej z praktycznego punktu widzenia, a przy tym cieszącej się dużym zainteresowaniem naukowców. Autor skupia się na metodach z klasy Monte Carlo, a w szczególności na metodach przeszukiwania drzew metoda Monte Carlo, tzw. MCTS (ang. Monte Carlo Tree Search), mających kluczowe znaczenie dla pracy. Jest to zrobione dobrze, a przykład gry w kółko i krzyżyk, a potem zagadnienie tzw. K-ręcznego bandyty, dobrze ilustrują istotę zagadnienia. Może, w tym drugim dobrze byłoby wspomnieć o tym, że do rozwiązywania można stosować zarówno metody optymalne, np. wywodzące się z wieloetapowych Markowskich procesów decyzyjnych i oparte np. na programowaniu dynamicznym, ale też i tradycyjne heurystyki, jak np. różne zmodyfikowane strategie zachłanne (np. epsilon-greedy strategy). Pozwoliłoby to może na lepsze uzasadnienie znaczenia algorytmu UCB1. W dalszej części omawia się istotę UCT (and. upper confidence bound applied to trees). Jest to zrobione bardzo dobrze, choć może podano zbyt lakonicznie różnicę między MSCS i UCT, a właściwie, co UCT daje. Jest to chyba ważne, bo w tytule następnego podrozdziału występuje UCT/MCTS w kontekście typowych modyfikacji. Powstaje oczywiście pytanie, czy jeśli już (chyba?) UCT jest lepszy, co wynika z opisu to czy warto jeszcze modyfikować MCTS, jak możemy po prostu zmodyfikować lepszy UCT. Uwagi o implementacji z użyciem obliczeń równoległych są dobre i bardzo cenne. Natomiast trochę niejasny jest podrozdział 2.6 MCTS poza domeną gier, bo znów nie wiadomo, dlaczego się pisze o MCTS, a nie o UCT. Czy znaczy to, że MCTS był stosowany do rozwiązywania zadań w innych, poza grami, dziedzinach, a UCT nie? A jest tak, czy to znaczy, że zastosowanie UCT do rozwiązywania niektórych zadań wieloetapowego podejmowania decyzji, przedstawione właściwie w pracy, jest jedynym przykładem zastosowania UCT poza grami? 4

Część 2 General game playing jest ważną częścią pracy, bo podaje główne idee i algorytmy stosowane w grach uogólnionych, dziedzinie rozwijającej się w ostatnich latach. Między innymi, dobrze się przedstawia ideę algorytmu minimaksowego i alfa-beta-obcięć. Może dobrze byłoby jednak poświęcić trochę więcej miejsca sprawie reprezentacji rozgrywania takich gier w postaci drzew decyzyjnych, co ułatwiłoby potem przejście do opisywanych dalej usprawnień algorytmu alfa-beta obcięć. Te usprawnienia są opisane dobrze, a pseudokody pozwalają zrozumieć kolejne kroki algorytmów. Dobry jest też opis GGP (ang. General Game Playing), platformy definiującej język opisu reguł gry oraz środowisko prowadzenia skończonej, symultanicznej, i deterministycznej gry jedno- lub wieloosobowej o pełnej informacji, oczywiście, dla wielu różnych gier. Pozwala ona tworzyć agentów, którzy potrafią grać w wiele gier. Jest to zrobione jasno i poglądowo. Język jest opisany dobrze, może nieco niejasna jest uwaga o GDL II, który może ująć pewne elementy przypadkowości w grach. Autor słusznie pisze, że co prawda jest on znany, ale rzadko stosowany i powstaje pytanie, ze skoro chcemy rozwiązywać metodami GPP zadanie harmonogramowania w warunkach ryzyka (niepewności), to czy GDL II nie powinien być tu stosowany. Moja ocena tego rozdziału jest zdecydowanie pozytywna, Autor wypunktowuje wszystkie elementy techniczne GGP i GDL, które mają znaczenie. Ten obraz psuje nieco używanie określeń pochodzących bezpośrednio z języka angielskiego, choć znana jest od lat terminologia polska w pokrewnych zagadnieniach, jak np. funkcja ewaluacyjna, choć to funkcja oceny, trawersacja grafu, choć to przejście grafu, stany terminalne, choć to stany końcowe (zresztą Autor tak potem pisze!). Nie są to oczywiście uwagi merytoryczne. Rozdział 4 Magician symulacyno-heurystyczny agent GGP jest poświęcony oryginalnemu wynikowi zaproponowanemu w niniejszej rozprawie, a mianowicie agentowi Magician, agentowi GGP stworzonemu dla potrzeb zadania rozpatrywanego w rozprawie. Chodzi oczywiście głównie o agenta o odpowiednich funkcjach oceny, a do tego implementowalnego dla możliwie szerokiej gamy różnych gier. Ogólna koncepcja wyposażenia tego agenta w zmodyfikowany algorytm minimaksowy z odpowiednio funkcją oceny, a do tego umożliwienie użycia hybrydowego systemu symulacyjnego łączącego w sobie algorytm tzw. MCTS (ang. Monte Carlo Tree Search) ze znaną od lat koncepcją heurystyk dziedzinowych jest bardzo dobrym pomysłem, Ale, trochę jest niejasne, dlaczego ten ostatni system symulacyjny nazywa się Guided UCT, czyli chyba stosuje explicite UCT, a Autor w tym samym zdaniu pisze o ogólniejszej metodzie MCTS. W dalszej części rozdziału Autor przedstawia ważne elementy swojego podejścia, m.in. heurystykę historyczną (a swoją drogą, jej idea była stosowana już dawno temu w dziedzinie zarówno modeli wieloetapowego podejmowania decyzji w sensie ogólnym, jak też w badaniach operacyjnych), identyfikację cech, budowę funkcji oceny itp. Jest to zrobione dobrze. Może czasami nie jest jasny jakaś uwaga, jak np. na str. 59 pisze się, że w wyrażeniach opisujących cechy mogą się pojawić zmienne, które nie muszą przyjmować wartości binarnych. Czy zmienna nie oznacza po prostu, że może być to albo 0 albo 1, bo w poprzednich tabelkach gry pisało się, że pola przyjmują właśnie wartości albo 0 albo 1. Nie jest to jasne. Punkt poświęcony budowie funkcji oceny jest zrobiony dobrze, a uwagi są celne. Sprowadzenie wiedzy dziedzinowej do odpowiedniej postaci funkcji oceny ma sens, choć 5

trochę może to być niejasne, jeśli się spojrzy na to z następującego punktu widzenia: w proponowanym systemie hybrydowym do metody UCT dodaje się jakieś heurystyki znane w konkretnej dziedzinie (por. podane w pkt. 5.3.3 dla harmonogramowanie, czy ogólniej dla różnych zadań badań operacyjnym). One raczej dotyczą jakichś reguł, które odzwierciedlają pewne rozsądne zależności, które ich autorzy zaproponowali i które się okazały użyteczne przy rozwiązywaniu wielu zadań. Warto byłoby to powiązać w funkcją oceny jako reprezentacją wiedzy dziedzinowej. W Podrozdziale 4.5 Rezultaty eksperymentalne przedstawiono wyniki numeryczne, które dość dobrze świadczą o zaproponowanym w pracy agencie Magician. Część III Risk-Aware Project Scheduling Problem jest poświęcona chyba najbardziej oryginalnej części pracy, jaka jest zastosowanie metod znanych z gier uogólnionych do rozwiązywania ważnego zadania badań operacyjnych, jakim jest zadanie harmonogramowania projektów, tzn. wyznaczania czasów rozpoczęcia poszczególnych czynności wchodzących w skład projektu przy spełnieniu ograniczeń na zasoby i relację następstwa, tak aby czas realizacji był minimalny. Oczywiście, takie zadanie jest modelem wielkiej liczby zadań występujących w praktyce, może być rozszerzone na wiele sposobów poprzez dodanie różnych dodatkowych warunków, ograniczeń, przyjęcie innych funkcji celu, wielu funkcji celu (analizy wielokryterialnych) itp. Wszystkie te zadania są przy tym z reguły bardzo trudne obliczeniowo. Autor dobrze przedstawia formalne postawienie zadania harmonogramowania w postaci podstawowej, a potem dobrze podsumowuje możliwe rozszerzenia, nazywając je modelami pochodnymi (Podrozdział 5.2). Jest to zrobione dobrze, a prostota (ideowa, nie numeryczna!) rozpatrywanych zadań jest uzasadniona właśnie faktem propozycji zastosowania metod znanych z gier uogólnionych. Przegląd metod rozwiązywania, z podziałem na metody dokładne, dające rozwiązania optymalne, i przybliżone, dające rozwiązania suboptymalne, albo dostatecznie dobre, jest dobry. Jedyna rzeczą, z która nie mogę się zgodzić to użycie jako polskiej nazwy metoda rozgałęzień i zamykania dla znanej metody branch and bound. W literaturze polskiej jest to metoda znana od dziesięcioleci jako metoda podziału i ograniczeń, a potem chyba raczej jako metoda podziału i oszacowań ; na marginesie, takich nazw używałem już w drugiej połowie lat 1970-tych w moich pracach nt. wieloetapowego podejmowania decyzji w warunkach rozmytości. Metody przybliżone są omówione dość dobrze, choć wolałbym, żeby było dokładniej wskazane, że Autor w jednym miejscu mówi o metodzie podziału i oszacowań z obcięciem, a w innym o metaheurystykach. Dałoby to lepszy ogląd sytuacji i roli heurystyk oraz metaheurystyk Autor omawia dobrze najczęściej stosowane heurystyki oparte na priorytetach (pkt. 5.3.3) i metody zachłanne (pkt. 5.3.4), a potem dodaje uwagi nt. konstrukcji harmonogramu. Oczywiście, wszystko to jest robione dla przypadku deterministycznego. Rozdział 6 RAPSP Risk-Aware Project Scheduling Problem jest poświęcony problemowi harmonogramowania w przypadku występowania informacji niepewnej w postaci przypadkowości. Głownie chodzi to o niepewność, którą Autor formułuje w postaci tzw. ryzyk. Jest to zgodne w zasadzie z ogólnie rozumianym pojęciem ryzyka, czyli jest związane z występowaniem mniejszego lub większego prawdopodobieństwa wystąpienia nieoczekiwanych okoliczności o negatywnym wpływie. W kontekście pracy, Autor robi to dobrze, a model ryzyk właśnie taki możliwy wpływ formalizuje w postaci funkcji T (str. 104). Trochę mi to brakuje głębszej analizy samego pojęcia ryzyka, a także metod 6

ograniczania jego negatywnych skutków, co można zaleźć bez problemu np. w literaturze ekonomicznej. Trochę nie rozumiem uwagi na str. 104, że efekty ryzyka nie musza być i często nie są deterministyczne, bo jak jest coś deterministyczne, to nie bardzo chyba można mówić o ryzyku. Jest to chyba po prostu niezbyt zręczne sformułowanie. Dla takiego zadania harmonogramowania z ryzykiem, Autor najpierw daje dobry przegląd heurystyk typu zachłannego czy opartych na priorytetach, potem omawia zastosowanie samego UTC, tzw. Basic UTC, a w końcu przechodzi do hybrydowego podejścia, zwanego Proactive UCT, w którym łączy się metodę UTC z rożnymi heurystykami, które korzystają z wiedzy dziedzinowej, tu z pewnych rozsądnych zależności dotyczących ustalania harmonogramów. Konkretnie, UTC łączy się z heurystykami zachłannymi i z priorytetami. Jest to ciekawe i dobre połączenie. W dalszej części rozdziału podano przykłady obliczeniowe, które pokazują, że zaproponowane podejście jest efektywne numerycznie, a metody hybrydowe okazuje się lepsze niż czyste metody oparte na UCT. Te wnioski sprawiają, że zadania postawione w pracy w postaci tez zostały zrealizowane. Praca ma przy tym ciekawą konstrukcję, a mianowicie zamieszczono bardzo duża część końcową, w której zawarto dokładniejsze informacje nt. rozwiązań technicznych, jak np. opis różnych gier w języku GPL, opis systemu Magician, pełna postać używanych w pracy zadań harmonogramowania bez i z ryzykiem, a także wyniki numeryczne. Jest to, moim zdaniem, dobry układ ze względu na fakt, że praca dotyczy zarówno gier uogólnionych, jak tez badań operacyjnych, a przedstawiciele tych dwu tak różnych środowisk mogą nie być zainteresowani takim samym zakresem wykładu, a zatem mogę wybrać z dodatku te dodatkowe informacje, które ich interesują. Podsumowując, praca zawiera bardzo oryginalną propozycję zastosowania metod symulacyjnych znanych z gier uogólnionych do rozwiązywania pewnych znanych i intuicyjnie zrozumiałych, ale trudnych obliczeniowo, zadań harmonogramowania. Do zalet pracy należy to, że przeprowadzone na szeroka skalę eksperymenty numeryczne. Z tych głównie powodów moja ocena recenzowanej rozprawy doktorskiej jest zdecydowanie pozytywna. Podkreślić też trzeba rolę Promotora, zwłaszcza w zainspirowaniu Doktoranta do podjęcia prac w tym nowoczesnym, nowatorskim i ambitnym temacie, a potem dobra opiekę naukową nad realizacją pracy. Praca spełnia, moim zdaniem, wszelkie wymagania ustawowe i zwyczajowo przyjęte w polskim środowisku naukowym stawiane rozprawom doktorskim i wnoszę o jej przyjęcie oraz dopuszczenie do publicznej obrony. Jednocześnie, proponowałbym w przypadku dobrego przebiegu obrony rozpatrzenie wyróżnienia pracy, przede wszystkim z tego powodu, że co nie jest tak często spotykane w przypadku doktoratów zaproponował jakościowo nowe podejście polegające na propozycji zastosowania metod symulacyjnych i przeszukiwania drzew rozwiązań, znanych z dziedziny gier uogólnionych, do rozwiązywania bardzo znanego i ważnego zadania harmonogramowania, jednego ze sztandarowych zadań badań operacyjnych, a więc innej dziedziny. Do tego, Kandydat przeprowadził wyczerpujące testy numeryczne, pokazujące 7

efektywność zaproponowanego podejścia, a także ciekawą krytyczną analizę otrzymanych wyników. 8