Prof. dr hab. inż. Franciszek Seredyński Warszawa, 29.01.2013 Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie Wydział Matematyczno Przyrodniczy Szkoła Nauk Ścisłych ul. Wóycickiego 1/3, 01-938 Warszawa R E C E N Z J A rozprawy doktorskiej mgr inż. Szymona Wąsika pt. Bioinformatyczne modele i algorytmy infekcji wirusowych 1. Problematyka naukowa oraz przedmiot rozprawy si gni cia naukowe i technologiczne ostatnich lat umożliwiły bardziej precyzyjne, globalne przyjrzenie si różnorodnym procesom biologicznym. bserwowany w ostatnich latach wci ż rosn cy napływ danych biologicznych, kształtuj cych si problemów zwi zanych z poprawn ich analiz oraz interpretacj zainspirował powstanie nowej dziedziny nauki jak jest biologia obliczeniowa, cz ściej znana jako bioinformatyka. Jest to dziedzina powstała na styku trzech dziedzin jakimi s biologia, matematyka oraz informatyka. Bioinformatyka wykorzystuje narz dzia informatyczne do opracowywania modeli matematycznych procesów biologicznych i efektywnych metod ich rozwi zywania. Jednym z lepszych dowodów jej znaczenia jest gwałtowny rozwój w ostatnich dwudziestu latach biologii systemowej, b d cej dziedzin biologii, która stara si opisać procesy biologiczne z punktu widzenia globalnego i która swoje powstanie zawdzi cza właśnie głównie szybkiemu rozwojowi informatyki i bioinformatyki. Recenzowana rozprawa doktorska, dotycz ca analizy modeli infekcji wirusowych, wpisuje si właśnie w zakres tematyczny bioinformatyki oraz biologii systemowej. Jednym z głównych problemów bioinformatycznych zwi zanych z analiz procesów zachodz cych w organizmach żywych jest poł czenie precyzyjnej wiedzy, która dost pna jest na temat procesów elementarnych w opis tłumacz cy przebieg procesów złożonych. Mimo że dość precyzyjnie poznane s mechanizmy, które wykorzystywane s na najniższym poziomie komórkowym i tkankowym, cz sto nie jest to wiedza wystarczaj ca do wytłumaczenia procesów globalnych zachodz cych w organizmie. Zaproponowane w niniejszej pracy podejścia i metody bioinformatyczne umożliwi analizowanie procesu globalnego, którym jest infekcja organizmu przez wirusa w oparciu o wiedz na temat interakcji zachodz cych na poziomie komórkowym. Zagadnienia podj te w rozprawie dotycz metod i algorytmów wykorzystywanych w procesie modelowanie infekcji wirusowych. Autor bardzo kompleksowo zanalizował proces modelowania i wszystkie składaj ce si na niego etapy. W pracy znajduje si szczegółowe omówienie procesu opisu modelu i jego definiowania za pomoc narz dzi informatycznych, od którego musi rozpocz ć si każda komputerowa analiza proponowanego podejścia. Na zakończenie tego etapu powstaje informatyczna reprezentacja modelu, która może być nast pnie użyta do jego analizy. Etap analizy został uwzgl dniony w pracy poprzez przedstawienie kolejnych jego kroków, od doboru wartości parametrów i symulowania modelu, przez analiz otrzymanych wyników, po metody weryfikacji i korekty modelu wejściowego. Autor nie zatrzymał si jedynie na procesie analizy trwaj cej w organizmie infekcji wirusowej, ale również przedstawił metody przydatne przy opracowywaniu terapii maj cej uleczyć zainfekowane osoby. Dla każdego z powyższych etapów procesu modelowania infekcji wirusowej autor szczegółowo zanalizował aktualnie stosowane metody i algorytmy oraz zaproponował ich optymalizacje. 1
Rozważane w rozprawie zagadnienia s aktualne oraz w istotny sposób wpisuj si w obszar informatyki. Rozprawa może zatem być przedstawiona jako monografia doktorska w dziedzinie informatyki w specjalności bioinformatyka. 2. Analiza treści rozprawy oraz uzyskanych wyników Głównymi celami rozprawy doktorskiej mgr. inż. Szymona W sika s kompleksowa analiza procesu modelowania infekcji wirusowych za pomoc metod i algorytmów bioinformatycznych oraz zaproponowanie metod, które mog ten proces usprawnić. Na cel ten składa si przegl d i analiza aktualnie stosowanych metod, opracowanie nowego sposobu zapisu modeli infekcji wirusowych oraz ich dalszego analizowania oraz zaproponowanie metod analizy infekcji i sposobów terapii na podstawie danych z dużej populacji ludzkiej. Cele te zostały zrealizowane i szczegółowo opisane w ośmiu rozdziałach rozprawy. Rozprawa posiada również dwa dodatki. Praca zawiera 145 ponumerowanych stron w tym 13 stron pozycji bibliograficznych, każda licz ca kilkanaście pozycji. Dodatkowo, w pracy zawarto 12 stron spisów oraz 6 stron edytorskich poprzedzaj cych spis treści. Struktura rozprawy jest przejrzysta i przemyślana, dobrze oddaj ca kolejne etapy realizacji przyj tych celów pracy. Praca rozpoczyna si sześciostronicowym streszczeniem w j zyku angielskim, które w precyzyjny sposób przedstawia główne osi gni cia pracy. Jest ono wystarczaj co długie, aby w zrozumiały dla czytelnika sposób przedstawić główne tezy oraz otrzymane wyniki oraz posiada odnośniki do opublikowanych przez autora prac w j zyku angielskim, w których można znaleźć obszerniejsze omówienie prezentowanych treści. W Rozdziale 1 przedstawiono wprowadzenie do poruszanej w rozprawie tematyki, motywy podj cia prezentowanej tematyki badawczej, struktur pracy oraz jej cel i zakres. W Rozdziale 2 zostały zawarte podstawy biologiczne, na które składaj si podstawowe poj cia z zakresu genetyki i wirusologii niezb dne do zrozumienia rozprawy oraz omówienie biologii systemowej, która jest dziedzin biologii, w ramach której prowadzona była wi kszość prac bioinformatycznych. Rozdział 3 zawiera definicje oraz poj cia z zakresu podstaw informatycznych i matematycznych wykorzystywanych w pracy. Rozdział został poświ cony przegl dowi oraz klasyfikacji metod bioinformatycznych aktualnie stosowanych w procesie modelowania infekcji wirusowych. Rozdział ten podzielony jest na dwie cz ści. W pierwszej autor szczegółowo przedstawia metody komputerowej reprezentacji modeli i dla najbardziej charakterystycznych z nich prezentuje zaimplementowane przez siebie opisy. W drugiej cz ści autor przedstawia istniej ce oprogramowanie do analizy modeli. W Rozdziale 5 zawarty jest opis autorskiego podejścia do opisu modeli infekcji wirusowych. Rozdział ten przedstawia definicj opracowanego przez autora j zyka ModeLang wraz z jego parserem oraz przykładowymi zastosowaniami. W Rozdziale 6 opisany został sposób analizowania infekcji wirusowej w ciele ludzkim za pomoc symulacji wieloagentowej. Autor opisuje sposób implementacji zaprojektowanego przez niego symulatora wraz z zaprojektowan przez niego interesuj c metod doboru parametrów wyko- 2
rzystuj c algorytm genetyczny. Rozdział kończy si omówieniem wyników eksperymentu obliczeniowego. Rozdział 7 przedstawia porównanie różnych sposobów obliczania efektywności terapii osób zainfekowanych wirusem, w tym algorytmu opracowanego przez autora. Ciekawym elementem omawianych metod jest to, że zostały opracowane na podstawie danych o różnorodności genetycznej wirusów w pojedynczych organizmach, co wcześniej było w literaturze niespotykane. statni z rozdziałów, Rozdział 8, został poświ cony przedstawieniu wniosków końcowych podsumowuj cych prac. W pierwszym dodatku do pracy, Dodatku A, przedstawione zostały skrypty zaimplementowane w trakcie prac nad przedstawionymi w pracy metodami. S to implementacje algorytmów, których wyniki znajduj si w pracy oraz przykładowe pliki wejściowe i wyjściowe otrzymane w trakcie eksperymentów obliczeniowych, których zawartość była zbyt długa, aby w pełni prezentować j we właściwej cz ści pracy. Drugi z dodatków, Dodatek B, zawiera tabele z danymi wykorzystanymi w pracy. Sposób w jaki została napisana rozprawa nie budzi wi kszych zastrzeżeń. Autor we właściwy sposób stosował metody badawcze, a dobór przytoczonej literatury wydaje si być trafny i uzasadniony. Spisy, rysunki oraz tabele zwi kszaj czytelność pracy i ułatwiaj orientacj w niej. 3. Najistotniejsze osiągnięcia przedstawione w rozprawie Do najistotniejszych osi gni ć rozprawy zaliczyć należy: Dokładn analiz aktualnie stosowanych metod opisu modeli infekcji wirusowych, zawieraj c implementacj przykładowych infekcji wirusami HCV i HIV za pomoc najważniejszych z rozpatrywanych metod, wykonan w celu dokładnego zrozumienia wad i zalet każdego z podejść. Analiza ta doprowadziła mi dzy innymi do wykrycia potencjalnych problemów w powszechnie używanych modelach oraz ich korekty. Zdefiniowanie składni j zyka ModeLang służ cego do formalnego opisu modeli infekcji wirusowych, który jest zdecydowanie bardziej zrozumiały dla biologów niż inne stosowane aktualnie podejścia. Dzi ki temu współpraca pomi dzy informatykami i biologami może przebiegać dużo efektywniej. Implementacja parsera j zyka ModeLang oraz jego testy w eksperymencie obliczeniowym dowodz ce jego poprawności i przydatności. Zaprojektowanie oraz implementacja środowiska symuluj cego infekcje wirusowe przy użyciu modelowania opartego na agentach. Ważnym osi gni ciem jest również zaproponowanie i weryfikacja metody wyznaczania wartości parametrów modelu, który to problem pozostawał w rozpatrywanym zastosowaniu nierozwi zany. Weryfikacja przydatności zaprojektowanego środowiska symulacyjnego w rzeczywistych zastosowaniach bioinformatycznych. Zaproponowanie nowej metody statystycznej opieraj cej si na różnorodności genetycznej wirusa, która może być użyta w celu prognozowania efektywności terapii osób zainfekowanych. 3
4. Uwagi merytoryczne W trakcie czytania rozprawy doktorskiej mgr. inż. Szymona W sika nasuwaj si pewne uwagi o charakterze dyskusyjnym. S to: Niewystarczaj co dokładne testy j zyka ModeLang, szczególnie w środowisku biologów zajmuj cych si modelowaniem infekcji wirusowych. Zbyt mało szczegółowy opis implementacji symulacji wieloagentowej przedstawiony w sekcji 6.1.2. Brak szczegółowej analizy doboru parametrów oraz operatorów w algorytmie genetycznym używanym do wyznaczania wartości parametrów w sekcji 6.2. Mała liczba danych testowych zawartych w tablicy B.2 wykorzystywanych do weryfikacji zaproponowanych metod definiowania efektywności terapii. 5. Uwagi redakcyjne Praca napisana jest precyzyjnym j zykiem i starannie zredagowana, mimo, że autor nie ustrzegł si drobnych niedoci gni ć redakcyjnych, jak np.: Strona vi, tytuły rozdziałów niepotrzebnie rozbite s na dwa wiersze. Strona 29, linia 10, jest nasywana, powinno być nazywana. Strona 38 i dalej, nagłówek rozdziału, 5 i 6 jest niepoprawnie wyrównany. Strona 66, linia 4, jest skyptu, powinno być skryptu. Strona 137, linia 19, jest COMPUTER ALGEBRA IN SCIENTIFIC COMPUTING, powinno być Computer Algebra in Scientific Computing. Strona 144, linia 16, jest hcv, powinno być HCV. Strona 144, linia 22, jest hcv, powinno być HCV. 6. Podsumowanie Powyżej przedstawione uwagi merytoryczne oraz redakcyjne nie maj istotnego wpływu na jakość i wag przedstawionych rozwi zań i w żadnym stopniu nie obniżaj wartości pracy. Przedstawione przez autora badane aspekty zostały uj te wystarczaj co szczegółowo i dokładnie. Reasumuj c można stwierdzić, że główne wyniki rozprawy potwierdzaj osi gni cie z powodzeniem założonego w rozprawie celu. Rang uzyskanych wyników podkreśla fakt opublikowania cz ści z nich w czasopismach filadelfijskich: BMC Bioinformatics czy też Computational and Mathematical Methods in Medicine oraz nagrody za prezentacj modelu wieloagentowego otrzymane przez autora na dwóch konferencjach. Praca pokazuje szeroki obszar zainteresowań autora i obszern wiedz z dziedziny analizowanych problemów. Rozprawa zawiera oryginalne i wartościowe wyniki, które stanowi istotny wkład w dziedzin nauki jak jest bioinformatyka. 4
Podsumowuj c, stwierdzam, że przedstawiona do oceny rozprawa doktorska mgr. inż. Szymona W sika pt.: Bioinformatyczne modele i algorytmy infekcji wirusowych spełnia w stopniu bardzo dobrym wymagania stawiane rozprawom doktorskim przez obowi zuj c ustaw o stopniach i tytule naukowym. W konsekwencji tego może ona stać si przedmiotem publicznej obrony. Wnosz zatem o dopuszczenie mgr. inż. Szymona W sika do dalszych etapów przewodu doktorskiego. Maj c na wzgl dzie oryginalność uzyskanych w rozprawie wyników oraz rang czasopism, w których opublikowano te wyniki wnioskuj o wyróżnienie rozprawy. 5