Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning

Podobne dokumenty
UCHWAŁA nr 03/2015/2016 Rady Wydziału Informatyki Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie z dnia 20 października 2015 r.

Recenzja. promotor: dr hab. Marianna Kotowska-Jelonek, prof. PŚk

Karta przedmiotu. Obowiązkowy. Kod przedmiotu: Rok studiów: Semestr: Język:

RECENZJA. 1. Ogólna charakterystyka rozprawy

Opinia o pracy doktorskiej pt. On active disturbance rejection in robotic motion control autorstwa mgr inż. Rafała Madońskiego

Recenzja rozprawy doktorskiej mgr Łukasza Gadomera pt. Rozmyte lasy losowe oparte na modelach klastrowych drzew decyzyjnych w zadaniach klasyfikacji

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Inżynierii Produkcji Dr Małgorzata Lucińska

1. Problem badawczy i jego znaczenie. Warszawa,

RECENZJA ROZPRAWY DOKTORSKIEJ

Opinia o pracy doktorskiej pt. Damage Identification in Electrical Network for Structural Health Monitoring autorstwa mgr inż.

PROCEDURA PRZEWODÓW DOKTORSKICH NA WYDZIALE NAUK EKONOMICZNYCH SGGW

II - EFEKTY KSZTAŁCENIA

Do oceny przedstawiono oprawioną rozprawę doktorską zawierającą 133 strony

Prof. dr hab. Stanisław Swadźba Katedra Ekonomii Uniwersytet Ekonomiczny w Katowicach

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

Nazwa przedmiotu: Współczesne koncepcje raportowania finansowego spółek w warunkach rynku kapitałowego. Obowiązkowy

Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa

RECENZJA. Rozprawy doktorskiej mgr Tomasza Deręgowskiego pt.: METODYKA ADAPTACYJNEGO ZARZĄDZANIA PROJEKTEM INFORMATYCZNYM W ŚRODOWISKU KORPORACYJNYM

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Matryca weryfikacji efektów kształcenia - studia III stopnia

Opinia o dorobku naukowym dr inż. Ireneusz Dominik w związku z wystąpieniem o nadanie stopnia naukowego doktora habilitowanego.

Regulamin przeprowadzania przewodów doktorskich w IPPT PAN przyjęty Uchwałą Rady Naukowej IPPT PAN w dniu 24 maja 2013 r.

Kryteria oceny pracy doktoranta przez opiekuna naukowego

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

Katedra Energoelektroniki i Automatyki Systemów Przetwarzania Energii Akademia Górniczo-Hutnicza im. St. Staszica al. Mickiewicza Kraków

Uchwała o zmianach w programie studiów doktoranckich. 1. Plan roku I studiów doktoranckich obejmuje następujące przedmioty:

dr hab. inż. Krzysztof Zatwarnicki, prof. PO Opole, r. Wydział Elektrotechniki, Automatyki i Informatyki Politechnika Opolska

Inteligentne Multimedialne Systemy Uczące

Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08

CHARAKTERYSTYKA STUDIÓW DOKTORANCKICH prowadzonych przez Uniwersytet Medyczny w Łodzi:

PROCEDURA PRZEPROWADZANIA CZYNNOŚCI W PRZEWODZIE DOKTORSKIM NA WYDZIALE BIOCHEMII, BIOFIZYKI I BIOTECHNOLOGII UJ

dr hab. inż. Piotr Krawiec prof. PP Poznań, r. RECENZJA

Recenzja mgr Anny ŚLIWIŃSKIEJ Ilościowa ocena obciążeń środowiskowych w procesie skojarzonego wytwarzania metanolu i energii elektrycznej

Rzeczywistość rozszerzona w edukacji w świetle piśmiennictwa

KIERUNKOWE EFEKTY KSZTAŁCENIA

PRZEWODNIK PO PRZEDMIOCIE

Opinia o pracy doktorskiej pt. Komputerowo wspomagana analiza przebiegów ph metrii i ph metrii z impedancją autorstwa mgr inż. Piotra Mateusza Tojzy

Seminarium doktorskie Zarządzanie zasobami ludzkimi dylematy i wyzwania

REGULAMIN postępowania o nadanie tytułu profesora na Wydziale Budownictwa, Inżynierii Środowiska i Architektury Politechniki Rzeszowskiej

Załącznik Nr 5 do Zarz. Nr 33/11/12

2. Formalna struktura pracy

Wstęp Opłaty i podatki ekologiczne w teorii ekonomii środowiska Pojęcie efektów zewnętrznych i ekologicznych kosztów zewnętrznych

Zarządzanie firmą Celem specjalności jest

Program kształcenia na Studiach Doktoranckich Wydziału Zarządzania Uniwersytetu Warszawskiego w roku 2014/2015

Recenzja pracy doktorskiej mgr Tomasza Świsłockiego pt. Wpływ oddziaływań dipolowych na własności spinorowego kondensatu rubidowego

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

1. Podstawa prawna oraz kryteria przyjęte do oceny rozprawy doktorskiej

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

RECENZJA. rozprawy doktorskiej Jolanty GRZEBIELUCH nt. "Znaczenie strategii marketingowej w

Technologie Internetowe i Algorytmy

RECENZJA ROZPRAWY DOKTORSKIEJ DLA RADY WYDZIAŁU INFORMATYKI ZACHODNIOPOMORSKIEGO UNIWERSYTETU TECHNOLOGICZNEGO W SZCZECINIE

TĘ CZĘŚĆ WYPEŁNIA DOKTORANT. Doktorant(-ka): mgr Rok studiów: tel. . Opiekun naukowy. I. Stypendium doktoranckie i tzw. zwiększenie stypendium

WYTYCZNE DOTYCZĄCE REALIZACJI PRAC DYPLOMOWYCH W INSTYTUCIE ORGANIZACJI SYSTEMÓW PRODUKCYJNYCH NA KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Podstawa formalna recenzji: pismo Pana Dziekana Wydziału Inżynierii Zarządzania Politechniki Poznańskiej z dnia r.

RECENZJA ROZPRAWY DOKTORSKIEJ DLA RADY WYDZIAŁU ELEKTRONIKI I TECHNIK INFORMACYJNYCH POLITECHNIKI WARSZAWSKIEJ

Efekty kształcenia na kierunku AiR drugiego stopnia - Wiedza Wydziału Elektrotechniki, Automatyki i Informatyki Politechniki Opolskiej

8. Drzewa decyzyjne, bagging, boosting i lasy losowe

Efekty kształcenia/uczenia się dla studiów technicznych: Studia I, II i III stopnia profil teoretyczny/(ogólno)akademicki

Opinia o pracy doktorskiej pt. Systemy adaptacyjnej absorpcji obciążeń udarowych autorstwa mgr inż. Piotra Krzysztofa Pawłowskiego

Recenzja opracowania M. Bryxa. pt: Rynek nieruchomości. System i funkcjonowanie.

Narzędzia Informatyki w biznesie

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

ZAŁĄCZNIK NR 2 Uchwała Rady Wydziału Elektrotechniki i Informatyki Politechniki Lubelskiej z dnia 3 czerwca 2013 r

Profil kształcenia. międzynarodowych studiów doktoranckich w dyscyplinie mechanika

Od koncepcji do sukcesu. Publikacja artykułów w czasopismach z tzw. Listy Filadelfijskiej

R E C E N Z J A. rozprawy doktorskiej mgr Wojciecha Bury nt. Wielokryterialne, mrowiskowe algorytmy optymalizacji w nawigacji samochodowej

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

UCHWAŁA. Wniosek o wszczęcie przewodu doktorskiego

Recenzja rozprawy doktorskiej mgr. inż. Bogumiła Chilińskiego

KIERUNKOWE EFEKTY KSZTAŁCENIA

2. Temat i teza rozprawy

SZCZEGÓŁOWY TRYB PRZEPROWADZANIA CZYNNOŚCI W PRZEWODACH DOKTORSKICH

Program Studium Doktoranckiego WEEIiA Dokumentacja studiów doktoranckich w Politechnice Łódzkiej

RECENZJA ROZPRAWY DOKTORSKIEJ mgr inż. Łukasza Kufla Security and System Events Monitoring in Distributed Systems Environment

Recenzja rozprawy doktorskiej mgr inż. Jarosława Błyszko

Przedmowa System zarządzania jakością w przygotowaniu projektów informatycznych...11

Ocena. rozprawy doktorskiej pani mgr Anety Spóz, zatytułowanej. Cypriniformes.

Ocena osiągnięć Dr. Adama Sieradzana w związku z ubieganiem się o nadanie stopnia naukowego doktora habilitowanego.

WNIOSEK OSOBY FIZYCZNEJ

Ocena rozprawy na stopień doktora nauk medycznych lekarz Małgorzaty Marii Skuzy

Recenzja rozprawy doktorskiej mgr Ludmiły Walaszczyk pt.: Model ewaluacji programów badawczych w obszarze innowacji technicznych

PROGRAM KSZTAŁCENIA NA STUDIACH III STOPNIA Informatyka (nazwa kierunku)

PROGRAM STUDIÓW DOKTORANCKICH

HARMONOGRAM GODZINOWY ORAZ PUNKTACJA ECTS CZTEROLETNIEGO STUDIUM DOKTORANCKIEGO

Recenzja rozprawy doktorskiej mgr Malgorzaty Grzeszczuk-Gniewek pt. Systemy

T2A_W01 T2A_W01 T2A_W02 3 SI_W03 Posiada szeroką wiedzę w zakresie teorii grafów T2A_W01

Przedstawiona do recenzji rozprawa doktorska Pana mgra inż. Adama Dudka pt. :

Zespół roboczy Komisji Badań na Rzecz Rozwoju... I. WYNIKI DZIAŁALNOŚCI NAUKOWEJ I UPRAWNIENIA DO NADAWANIA STOPNI

Uchwała nr 52/IX/2018 Rady Wydziału Lekarskiego Uniwersytetu Jagiellońskiego Collegium Medicum w Krakowie z dnia 20 września 2018 r.

I. Plan studiów doktoranckich. 1. Plan roku I studiów doktoranckich obejmuje następujące przedmioty:

Rozprawy doktorskiej mgr Anny Marii Urbaniak-Brekke. pt.: Aktywność społeczności lokalnych w Polsce i Norwegii

dr hab. inż. Andrzej Żyluk, prof. ITWL Warszawa r. Instytut Techniczny Wojsk Lotniczych ul. Ks. Bolesława Warszawa RECENZJA

dr hab. inż. Jacek Dziurdź, prof. PW Warszawa, r. Instytut Podstaw Budowy Maszyn Politechnika Warszawska

Seminarium doktorskie Zarządzanie publiczne

Relacja: III Seminarium Naukowe "Inżynierskie zastosowania technologii informatycznych"

KARTA PRZEDMIOTU. zaliczenie na ocenę

Regulamin Wydziałowej Komisji ds. Doktoratów

Transkrypt:

Warszawa, 30.01.2017 Prof. Dr hab. Henryk Rybinski Instytut Informatyki Politechniki Warszawskiej hrb@ii.pw.edu.pl Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning Dane ogólne Przedstawiona do recenzji rozprawa jest napisana w języku angielskim. Składa się ze streszczenia w języku polskim i angielskim oraz pięciu rozdziałów i krótkiego podsumowania. Rozdział pierwszy jest poświęcony wprowadzeniu w problematykę, motywacji autora oraz omówieniu poszczególnych metod omawianych w pracy. W rozdziałach 2-5 zawarte są publikacje doktoranta (dwie autorskie i 3 współautorskie): 1. Rozdział 2 stanowi publikacja współautorska Kursa, Miron B., and Witold R. Rudnicki. "Feature Selection with the Boruta Package." Journal of Statistical Software 36.11 (2010): 1-13. 2. Rozdział 3 zawiera publikację Kursa, Miron B. "rferns: An Implementation of the Random Ferns Method for General-Purpose Machine Learning." Journal of Statistical Software 61.i10 (2014). 3. W rozdziale 4 zawarta jest publikacja Kursa, Miron Bartosz. "Robustness of Random Forest-based gene selection methods." BMC Bioinformatics 15.1 (2014): 8. 4. Rozdział 5 zawiera 2 prace współautorskie: Wieczorkowska, Alicja A., and Miron B. Kursa. "A comparison of random forests and ferns on recognition of instruments in jazz recordings." International Symposium on Methodologies for Intelligent Systems. Springer Berlin Heidelberg, 2012. Kursa, Miron B., and Alicja A. Wieczorkowska. "Multi-label Ferns for Efficient Recognition of Musical Instruments in Recordings." International Symposium on Methodologies for Intelligent Systems. Springer International Publishing, 2014. Łączna objętość rozprawy wynosi 76 stron. Ponadto rozprawie towarzyszą 3 oświadczenia wpółautorów o ich udziale (dotyczy trzech zamieszczonych w doktoracie publikacji współautorskich).

1. Problem badawczy i jego znaczenie 1.1 Problem rozważany w rozprawie Tematyka rozprawy ściśle wiąże się z metodami odkrywania wiedzy ze zbiorów danych. Dziedzina ta jest od dawna w obszarze zainteresowań statystyków, nieco krócej w obszarze zainteresowań naukowców zajmujących się metodami sztucznej inteligencji, w szczególności metodami uczenia maszynowego. Zagadnienie to ma ogromne znaczenie, zarówno teoretyczne, jak też praktyczne, w szczególności w kontekście systemów akwizycji wiedzy, maszynowego uczenia, a także metod wnioskowania indukcyjnego przez analizę przykładów. Dlatego też od ponad 20-u lat daje się zaobserwować gwałtowny wzrost zainteresowań badaniami nad nowymi metodami analizy danych. Zainteresowania te dotyczą nie tylko środowisk akademickich, ale także przemysłowych laboratoriów badawczych. Wynika to przede wszystkim z zapotrzebowania na narzędzia w dziedzinie analizy dużych zasobów informacyjnych. Jednym z istotnych problemów badawczych w dziedzinie analizy danych jest problem selekcji cech analizowanych obiektów. Tematyka ta jest szczególnie ważna z uwagi na ograniczenia obliczeniowe eksploracji danych i uczenia maszynowego z jednej strony, zaś z drugiej strony ze względu na ryzyko nadmiernego zwiększenia wpływu fałszywych wzorców na wynik, bądź czysto losowych zależności, co w efekcie może prowadzić do fałszywych rezultatów. Opiniowana praca mieści się w nurcie badań nad metodami doboru cech analizowanych obiektów. Celem, jaki postawił sobie doktorant, jest opracowanie stabilnych i wydajnych metod doboru cech. Motywując swoje badania autor odniósł się we wstępie do problemów rozwiązań związanych doborem cech znanych z literatury. W szczególności autor stawia tezę, że tradycyjne podejście do problemu wyboru atrybutów, polegające na zidentyfikowaniu minimalnego zbioru atrybutów, prowadzącego do uzyskania najlepszej dokładności algorytmu klasyfikacji nie zawsze prowadzi do interesujących wniosków, przede wszystkim z uwagi na zależności przypadkowe, w szczególności w przypadku dużej wymiarowości danych, ponadto może prowadzić do usuwania istotnej informacji. Tematyka rozważana przez doktoranta jest niezwykle ważna i niewątpliwie jest godna rozprawy doktorskiej.

1.2 Charakter rozprawy i znaczenie praktyczne badań Rozprawa łączy cechy pracy eksperymentalnej i teoretycznej. Zaawansowany teoretyczny warsztat autora pozwala doktorantowi konstruować nowe autorskie rozwiązania algorytmiczne. Z drugiej strony algorytmiczne propozycje autora są wsparte zaawansowanymi implementacjami oraz eksperymentami. Rozprawa wskazuje na 1. bardzo solidny warsztat doktoranta w zakresie podstaw teoretycznych metod i narzędzi uczenia maszynowego; 2. ogromny potencjał praktycznego wdrażania opracowanych algorytmów; 3. szeroką wiedzę w zakresie możliwości zastosowań metod analizy danych; pozwoliło to autorowi przeprowadzić bardzo interesujące eksperymenty w różnych dziedzinach: W Rozdziale 2 jest przykład eksperymentów z realnymi danymi dotyczącymi warstwy ozonowej, jak też z benchmarkiem w postaci danych Madelon spreparowanym na potrzeby eksperymentów uczenia maszynowego; w Rozdziale 4 autor omawia zastosowanie algorytmu rferns na potrzeby eksploracji danych genetycznych, zaś w Rozdziale 5 prezentuje możliwości zastosowania opracowanych metod do analizy danych muzycznych. W szczególności, punkty (1) i (2) są wsparte treścią rozdziałów 2 i 3. W Rozdziale 2 autor koncentruje się na omówieniu algorytmu Boruta. Metoda Boruta pozwala uniknąć problemów charakterystycznych dla tradycyjnego podejścia do problemu selekcji cech, takich jak np. utrata istotnych informacji. Tu głównym osiągnięciem autora jest efektywne wdrożenie tego algorytmu. Pomimo intersujących własności tego algorytmu istotnym jego ograniczeniem są wymagania obliczeniowe. Dlatego w Rozdziale 3 autor proponuje metodę rferns, która jest uogólnieniem metody paproci losowych. Istotnym osiągnięciem autora jest pokazanie, że z użyciem opracowanej metody rferns można dokonywać selekcji atrybutów metodą Boruta na obszernych zbiorach danych w rozsądnym czasie. 2. Wkład autora Omawiając wkład autora ograniczam się tylko do prac zamieszczonych w doktoracie. Zastrzeżenia to ma o tyle znaczenie, że dorobek publikacyjny doktoranta jest znaczący i

obejmuje uczestnictwo w wielu międzynarodowych badaniach, gdzie doktorant realizował badania w zakresie eksploracji danych. Wkład autora w zakresie przedstawionego doktoratu obejmuje szereg ważnych elementów związanych z uczeniem maszynowym, w szczególności z problemem doboru atrybutów. Wyróżnić tu można kilka problemów, którymi autor się zajmuje, i dla których proponuje interesujące rozwiązanie. Zasadniczym wkładem autora jest: 1. zaproponowanie heurystycznego wrappera klasy all relevant w formie metody Boruta; 2. zaproponowanie rozwinięcia metody Boruta poprzez wykorzystanie paproci losowych (rferns); 3. przeprowadzenie eksperymentów w kilku różnych dziedzinach w oparciu o metody Boruta i rferns Podejście Boruta bazuje na koncepcji rozszerzenia systemu informacyjnego o tzw. cienie (atrybuty nieistotne), które wykorzystuje się do oceny istotności atrybutów oryginalnych. Jego przydatność została poparta eksperymentami. Problemy z wymaganiami obliczeniowymi podejścia Boruta skłaniają autora do badań nad jego modyfikacją. W efekcie autor proponuje w Rozdziale 3 metodę rferns, jednocześnie pokazuje jej przydatność do rozwiązania niezwykle trudnego zagadnienia klasyfikacyjnego klasy p >> n. W szczególności pokazana jest duża przydatność metody w procedurze selekcji genów w zbiorze danych mikromacierzy (Rozdział 4). Dodatkowo w Rozdziale 5 autor pokazuje przydatność metody rferns do rozpoznawania instrumentów w nagraniach audio. Omawiane tu osiągnięcia zawarte są w publikacjach z lata 2010-2014. Jak zaznaczyłem na wstępie, dorobek autora w przypadku 3ch publikacji współautorskich jest potwierdzony oświadczeniami współautorów. 3. Poprawność Wysoko oceniam przyjętą przez autora metodologię badań. Autor dokonuje krytycznej analizy stanu badań w dziedzinie doboru atrybutów, w oparciu o tę analizę proponuje rozwiązania, a następnie przeprowadza badania eksperymentalne. Badania te stanowią istotny element rozprawy. Autor bada skonstruowane algorytmy i miary na danych rzeczywistych.

Uzyskane eksperymentalnie wyniki potwierdzają słuszność proponowanej koncepcji nie tylko co do jakości klasyfikacji ale też stabilności. 4. Redakcja pracy Praca jest przygotowana starannie. Zamieszczone teksty są napisane dobrym językiem angielskim (choć kilka drobnych usterek można znaleźć, co oznacza, że nawet w przypadku dobrych czasopism nie należy liczyć na gruntowną redakcję tekstu przez wydawcę i warto weryfikować język z anglistą). Na szczególną uwagę zasługuje układ pracy. Pomimo tego, że praca jest złożeniem prac opublikowanych na przestrzeni lat 2010-2014, ich dobór jest logiczny i świetnie podporządkowany tezie rozprawy. 6. Podsumowanie Biorąc pod uwagę opinie zaprezentowane w poprzednich punktach i wymagania zdefiniowane przez artykuł 13 Ustawy z dnia 14 marca 2003 r. o stopniach naukowych i tytule naukowym (z późniejszymi zmianami) moja ocena rozprawy jest pozytywna. W szczególności uważam, że rozprawa z nadmiarem spełnia te wymagania, dlatego wnoszę o dopuszczenie pana Mirona Kursy do publicznej obrony. Jednocześnie uważam, że rozprawa zasługuje na wyróżnienie.