RECENZJA rozprawy doktorskiej Mgr inż. Macieja Antczaka pt. Algorytmiczne aspekty modelowania i ewaluacji biomolekuł



Podobne dokumenty
Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Rozprawy doktorskiej mgr Anny Marii Urbaniak-Brekke. pt.: Aktywność społeczności lokalnych w Polsce i Norwegii

Do uzyskania kwalifikacji pierwszego stopnia (studia inżynierskie) na kierunku BIOTECHNOLOGIA wymagane są wszystkie poniższe efekty kształcenia

prof. dr hab. Zbigniew Czarnocki Warszawa, 3 lipca 2015 Uniwersytet Warszawski Wydział Chemii

Recenzja rozprawy doktorskiej mgr Pradeep Kumar pt. The Determinants of Foreign

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW

Recenzja pracy doktorskiej mgr Tomasza Świsłockiego pt. Wpływ oddziaływań dipolowych na własności spinorowego kondensatu rubidowego

Recenzja. Warszawa, dnia 22 października 2018 r.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW INFORMATYKA

Wzorcowe efekty kształcenia dla kierunku studiów biotechnologia studia pierwszego stopnia profil ogólnoakademicki

Efekty kształcenia dla kierunku studiów INFORMATYKA, Absolwent studiów I stopnia kierunku Informatyka WIEDZA

Żwirki i Wigury 93, Warszawa TEL.: , FAX: , E- MAIL: Dr hab. Joanna T

Efekty kształcenia dla kierunku studiów CHEMIA studia pierwszego stopnia profil ogólnoakademicki

Poznań, r.

Informatyka klasa III Gimnazjum wymagania na poszczególne oceny

Webowy generator wykresów wykorzystujący program gnuplot

Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.

INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA.

Efekty kształcenia dla kierunku studiów informatyka i agroinżynieria i ich odniesienie do efektów obszarowych

KIERUNKOWE EFEKTY KSZTAŁCENIA

Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol

Grzegorz Ruciński. Warszawska Wyższa Szkoła Informatyki Promotor dr inż. Paweł Figat

Opisy efektów kształcenia w obszarze nauk przyrodniczych Załącznik 2

RECENZJA. 1. Ogólna charakterystyka rozprawy

SCENARIUSZ LEKCJI: TEMAT LEKCJI: Postać kanoniczna funkcji kwadratowej. Interpretacja danych w arkuszu kalkulacyjnym

SCENARIUSZ LEKCJI. Czas realizacji. Podstawa programowa

Sposoby przedstawiania algorytmów

Autor: mgr inż. Agata Joanna Czerniecka. Tytuł: Nowa metoda obliczeniowa porównywania sekwencji białek

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk

CZAS NA MATURĘ Z BIOLOGII 2015 DLA LO

Podsumowanie wyników ankiety

KIERUNKOWE EFEKTY KSZTAŁCENIA

Odniesienie do obszarowych efektów kształcenia Kierunkowe efekty kształcenia WIEDZA (W)

Wymagania edukacyjne z INFORMATYKI - SP

Programowanie i techniki algorytmiczne

Opis efektów uczenia się dla kwalifikacji na poziomie 7 Polskiej Ramy Kwalifikacji

Proporcje podziału godzin na poszczególne bloki. Tematyka lekcji. Rok I. Liczba godzin. Blok

dr hab. inż. Jacek Dziurdź, prof. PW Warszawa, r. Instytut Podstaw Budowy Maszyn Politechnika Warszawska

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Maciej Piotr Jankowski

PROGRAM NAUCZANIA DLA I I II KLASY GIMNAZJUM

Gdańsk, 10 czerwca 2016

Opinia o pracy doktorskiej pt. On active disturbance rejection in robotic motion control autorstwa mgr inż. Rafała Madońskiego

Projekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI

Tabela odniesień efektów kierunkowych do efektów obszarowych (tabele odniesień efektów kształcenia)

WYMAGANIA EDUKACYJNE Z INFORMATYKI dla klasy III gimnazjalnej, Szkoły Podstawowej w Rychtalu

NOWY egzamin maturalny

01, 02, 03 i kolejne numer efektu kształcenia. Załącznik 1 i 2

Z nowym bitem. Informatyka dla gimnazjum. Część II

Podstawa formalna recenzji: pismo Pana Dziekana Wydziału Inżynierii Zarządzania Politechniki Poznańskiej z dnia r.

Opis efektów kształcenia dla programu kształcenia (kierunkowe efekty kształcenia) WIEDZA. rozumie cywilizacyjne znaczenie matematyki i jej zastosowań

kwestionariusze badania ankietowego, karta badania, broszura informacyjna dla pacjentek,

Odniesienie symbol II/III [1] [2] [3] [4] [5] Efekt kształcenia. Wiedza

RECENZJA. Rozprawy doktorskiej mgr Mateusza Nowickiego. Ocena wybranych elementów niszy szpikowej u pacjentów poddawanych

tel. (+4861) fax. (+4861)

Efekty kształcenia dla kierunku Biotechnologia

Okręgowa Komisja Egzaminacyjna w Krakowie 1

KRYTERIA OCENIANIA II ETAP EDUKACYJNY ZAJĘCIA KOMPUTEROWE KLASA IV KLASA V KLASA VI. DOPUSZCZAJĄCY Uczeń

Program studiów doktoranckich

WYMAGANIA EDUKACYJNE

Recenzja mgr Anny ŚLIWIŃSKIEJ Ilościowa ocena obciążeń środowiskowych w procesie skojarzonego wytwarzania metanolu i energii elektrycznej

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Budowa atomu. Układ okresowy pierwiastków chemicznych. Promieniotwórczość naturalna i promieniotwórczość sztuczna

ANKIETA SAMOOCENY OSIĄGNIĘCIA KIERUNKOWYCH EFEKTÓW KSZTAŁCENIA

Projektowanie Wirtualne bloki tematyczne PW I

Recenzja pracy doktorskiej Mgr Macieja Chrzanowskiego pt.: Wykorzystanie otwartych innowacji w polskich przedsiębiorstwach

Uchwała nr 85/2017 z dnia 30 maja 2017 r. Senatu Uniwersytetu Medycznego w Łodzi

Kod doskonały : jak tworzyć oprogramowanie pozbawione błędów / Steve McConnell. Gliwice, cop Spis treści. Wstęp 15.

Opisy efektów kształcenia w obszarze nauk przyrodniczych Załącznik 2

II Wydział Lekarski z Oddziałem Anglojęzycznym Kierunek: BIOMEDYCYNA Poziom studiów: pierwszy stopień Profil: Praktyczny SEMESTR I

Szczegółowy program kształcenia na studiach doktoranckich Wydziału Fizyki UW

KRYTERIA OCENIANIA KLASA I KLASA II KLASA III

Streszczenie rozprawy doktorskiej MODEL FUNKCJONOWANIA GOSPODARKI KREATYWNEJ W PROCESIE WZROSTU GOSPODARCZEGO

Opinia o pracy doktorskiej pt. Damage Identification in Electrical Network for Structural Health Monitoring autorstwa mgr inż.

ZARZĄDZANIE I INŻYNIERIA PRODUKCJI

zna metody matematyczne w zakresie niezbędnym do formalnego i ilościowego opisu, zrozumienia i modelowania problemów z różnych

PROGRAM STUDIÓW WYŻSZYCH ROZPOCZYNAJĄCYCH SIĘ W ROKU AKADEMICKIM 2015/2016

WIEDZA T1P_W06. K_W01 ma podstawową wiedzę o zarządzaniu jako nauce, jej miejscu w systemie nauk i relacjach do innych nauk;

Ocena rozprawy na stopień doktora nauk medycznych lekarz Małgorzaty Marii Skuzy

Studia doktoranckie nowe regulacje prawne, nowe rozwiązania a jakość kształcenia - PRZYKŁAD UAM

Państwowa Wyższa Szkoła Zawodowa w Płocku Instytut Nauk Ekonomicznych i Informatyki KARTA PRZEDMIOTU. Część A

Organizacja informacji

Recenzja rozprawy doktorskiej mgr Łukasza Gadomera pt. Rozmyte lasy losowe oparte na modelach klastrowych drzew decyzyjnych w zadaniach klasyfikacji

i działanie urządzeń związanych równieŝ budowę i funkcje urządzeń

1. Podstawa prawna oraz kryteria przyjęte do oceny rozprawy doktorskiej

Opis kierunkowych efektów kształcenia w obszarze nauk przyrodniczych na I stopniu kierunku BIOLOGIA

Efekt kształcenia. Wiedza

Kryteria oceny pracy doktoranta przez opiekuna naukowego

KIERUNKOWE EFEKTY KSZTAŁCENIA

Recenzja rozprawy doktorskiej

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

PROGRAM STUDIÓW DOKTORANCKICH

dr hab. inż. Piotr Krawiec prof. PP Poznań, r. RECENZJA

EFEKTY KSZTAŁCENIA NA STUDIACH PODYPLOMOWYCH NAUCZANIE PRZYRODY W SZKOLE PODSTAWOWEJ

Załącznik 2. Symbol efektu obszarowego. Kierunkowe efekty uczenia się (wiedza, umiejętności, kompetencje) dla całego programu kształcenia

Narzędzia Informatyki w biznesie

Załącznik 2. Symbol efektu obszarowego. Kierunkowe efekty uczenia się (wiedza, umiejętności, kompetencje) dla całego programu kształcenia

Transkrypt:

Data: Toruń, 20 kwietnia, 2013 L. Dz. Prof. dr hab. Wiesław Nowak Zespół Teoretycznej Biofizyki Molekularnej Instytut Fizyki Uniwersytetu M. Kopernika w Toruniu Wydział Fizyki, Astronomii i Informatyki Stosowanej 87-100 Toruń, ul. Grudziądzka 5 RECENZJA rozprawy doktorskiej Mgr inż. Macieja Antczaka pt. Algorytmiczne aspekty modelowania i ewaluacji biomolekuł Współczesna nauka nie może w zasadzie obyć się bez komputerów. Obliczenia numeryczne czy inne analizy prowadzone na wysokowydajnym sprzęcie przynoszą informacje niemożliwe do uzyskania innymi sposobami. Ogromny postęp w dziedzinie badań komputerowych zawdzięczamy z jednej strony rewolucji technologicznej i błyskawicznie spadającym cenom sprzętu, z drugiej strony wysiłkowi programistów, którzy poświęcają życie by tworzyć coraz lepsze i wydajniejsze kody. Trudno jest przecenić znaczenie metod komputerowych w biologii strukturalnej. Odkrywanie tajników DNA, RNA, białek jest możliwe dzięki wspieranej komputerowo analizie struktury tych typów biocząsteczek. Walczymy o poznanie struktur, bo one warunkują funkcje biologiczne. Z kolei dobre zrozumienie funkcji podstawowych elementów komórek pozwala żywić nadzieję na opracowanie metod zachowania przez długi czas w dobrej sprawności rozmaitych organizmów żywych, w tym nas samych. Stawka walki o prawdę na temat struktur jest zatem wysoka. Niestety, natura fizyczna i matematyczna problemu poznania struktur natywnych biocząsteczek jest skomplikowana. Znamy już blisko 100 milionów sekwencji różnych białek czy DNA. Niekiedy subtelne zmiany w budowie biopolimeru prowadzą do dramatycznej zmiany funkcji. Poznanie metodami doświadczalnymi tych wszystkich układów jest obecnie z wielu względów niemożliwe, a nasze bazy zawierają zaledwie ok. 100 000 struktur przestrzennych (0.1 % znanych sekwencji). Marzeniem badaczy-biologów jest znalezienie algorytmu pozwalającego w sposób pewny i wiarygodny przewidzieć czy obliczyć strukturę 3D biocząsteczki ze znanej wcześniej sekwencji aminokwasów czy nukleotydów. Problem ten, mimo znacznych wysiłków wielu grup badawczych, nie jest jeszcze rozwiązany, chociaż należy do najważniejszych i najpopularniejszych problemów bioinformatyki. Badania w tym zakresie prowadzone są w wielu czołowych laboratoriach światowych, obejmują poszukiwanie algorytmów zwijania białek czy kwasów nukleinowych, oraz (bardzo ważne zadanie) konstrukcji i oceny wiarygodności modeli komputerowych biopolimerów. 1

Przedstawiona mi do oceny praca doktorska mgr inż. Macieja Antczaka, napisana pod kierunkiem dr hab. inż. Marty Kasprzak, prof. PP oraz promotora pomocniczego dr inż. Piotra Łukasiaka, w Instytucie Informatyki Politechniki Poznańskiej, wpisuje się w ten ważny i aktualny nurt badań. Rozprawa poświecona jest poszukiwaniu nowych metod i algorytmów numerycznego przewidywania struktur trzeciorzędowych cząsteczek RNA oraz nowych komputerowych metod oceny jakości modeli przestrzennych struktur biopolimerów. Zadanie jakie otrzymał doktorant do rozwiązania jest zatem ważne, aktualne i ambitne. Szczegółowymi celami recenzowanej rozprawy było (i) opracowanie nowego sposobu przewidywania struktury RNA w oparciu o sekwencję i strukturę drugorzędową, w szczególności zaprojektowanie oraz implementacja specjalnej obiektowo-relacyjnej bazy danych (ii) opracowanie nowej metody wspierającej identyfikację prawidłowo lub nieprawidłowo zbudowanych motywów hipotetycznych struktur biopolimerów (iii) opracowanie i implementacja nowej metody obliczeniowej do ewaluacji jakości modeli przestrzennych białek bez odwoływania się do struktury referencyjnej. Należy podkreślić, że cele te obejmowały zaprojektowanie nowych algorytmów, implementacje nowych metod w postaci nowych programów komputerowych, korzystających w części z danych uzyskiwanych z innych kodów. Badane były problemy optymalizacji obliczeń i problemy zwiększania wydajności poprzez obliczenia współbieżne. Moim zdaniem, cel ogólny i cele szczegółowe, sprecyzowane w rozdziale 1.2 rozprawy, zostały w pełni osiągnięte. Praca, licząca 228 stron (+16 stron nie numerowanych), składa się z czterostronicowego streszczenia w jęz. angielskim, spisu treści, spisu rysunków, spisu tabel, spisu algorytmów, sześciu rozdziałów, podsumowania, trzech dodatków oraz bibliografii liczącej 226 pozycji. Tytuł rozprawy jest, moim zdaniem, nieco zbyt skrótowy, być może zamiast frazy ewaluacji biomolekuł należałoby użyć dokładniejszego sformułowania ewaluacji struktury biomolekuł. Podział i układ treści jest prawidłowy. Brakuje często zamieszczanego w tego typu rozprawach wykazu skrótów. Przedstawię kolejno ocenę rozdziałów i uwagi merytoryczne na ich temat. Uwagi formalne podam w dalszej części recenzji. 2

Streszczenie angielskie poprawnie przedstawia problemy badawcze, zastosowane podejście, główne wątki analizowane w rozprawie i najważniejsze rezultaty. W rozdziale 1.1 Autor z dużą swadą, a nawet nieco pompatycznie ( wybuch bezprecendensowej aktywności dotyczącej sekwencjonowania genomów ) opisał znacznie bioinformatyki we współczesnej biologii molekularnej. Podrozdział ten zawiera dużo pożytecznych odnośników, świadczy o dobrej orientacji w literaturze i daje odpowiednie tło historyczne do dalszych wywodów. Znalazłem w nim kilka nieścisłości, np. chemiczne próbkowanie metodą SHAPE wprowadza raczej więzy strukturalne, niż wiązania strukturalne (str. 8). W metodzie Floresa przewidywania struktury RNA stosuje się dynamikę molekularną w przestrzeni współrzędnych wewnętrznych, a nie wewnątrzcząsteczkową dynamikę przestrzeni współrzędnych. W rozdziale 2, ( Podstawowe pojęcia biologiczne, 20 str.) przedstawiono w zwięzły sposób główne pojęcia biologiczne wymagane do zrozumienia dziedziny, do której stosowane są rozwijane algorytmy i metody. Informacje tam zebrane mają w znacznej części charakter podręcznikowy, jednak ich przytoczenie uważam za celowe. W podrozdziale 2.3 pojawia się opis ważnej koncepcji lokalnych deskryptorów struktur białkowych, stosowanych w dalszej części rozprawy. Rozdział ten czyta się dobrze. Mam pewne zastrzeżenia do jakości rysunku 2.1, na którym zasady azotowe DNA i RNA są przedstawione w wysoce amatorski sposób. Na dodatek we wzorach strukturalnych przykładowych nukleotydów brakuje zaznaczonych ładunków ujemnych w grupie fosforanowej, co może wywołać wrażenie, iż w tych cząsteczkach tlen jest jednowartościowy. Pewne sformułowania zastosowane w tym rozdziale są nieścisłe ( zasady budują cząsteczki kwasów nukleinowych, str. 14), ( struktura chemiczna.. powstała w efekcie spojenia.., ibid.). Wiązania wodorowe nie zachodzą pomiędzy zasadami, a występują (str. 17). W opisie translacji (str. 19) powinna być informacja, że białka są produktami, a nie jak błędnie podano substratami. Zadanie kod genetyczny występuje w postaci.. chromosomu (str. 21) jest moim zdaniem mylące kod genetyczny to tabela tłumacząca jak zasady kodują aminokwasy. W analizach funkcji energii białek nie uwzględnia się wagi a raczej masę aminokwasów (str. 28). Miejsca, w których wiążą się ligandy biochemicy nazywają miejscami wiązania (ang. binding sites), nie są to jak pisze Autor miejsca dowiązania (termin informatyczny) (str. 29). Nie jest dla mnie jasne co Autor rozumie przez termin stosunkowo inny geometryczny kształt opisują pojęcie grup deskryptorów (str. 34). 3

Rozdział 3, jak głosi jego tytuł, zawiera podstawowe definicje z zakresu kombinatoryki i informatyki. Mogłoby się wydawać, że ten fragment rozprawy nie jest potrzebny, bowiem wszystko i tak jest w Wikipedii. Uważam jednak, że ten słusznie poświęcono tych 16 stron na spójne przedstawienie głównych pojęć informatycznych, jakie są stale używane w dalszej części rozprawy. Oczywiście wprawny informatyk wie to wszystko, co zawiera ten rozdział, jednak potencjalnymi czytelnikami recenzowanej rozprawy mogą być też biolodzy parający się bioinformatyką i analizą struktur bimolekularnych, a w tym przypadku, zgrabnie napisany przegląd pojęć i definicji informatycznych będzie miłą pomocą w studiowaniu metod zaproponowanych przez doktoranta. W szczególności przydatna jest, opisana w tym rozdziale, praktyka optymalizacji przetwarzania i projektowania algorytmów współbieżnych. Zasadniczo nowe rozważania i wyniki znajdziemy w rozdziale 4 ( Nowe rozwiązania informatyczne dla modelowania struktur przestrzennych RNA ) i następnych. Przedstawiono w nim główne cechy systemu RNAComposer do przewidywania struktur przestrzennych 3D RNA oraz wyniki eksperymentów obliczeniowych przeprowadzonych przy pomocy tego systemu. System ten został opracowany w ośrodku poznańskim przez szersze grono badaczy, jest opublikowany w prestiżowym czasopiśmie Nucleic Acids Res. (M.Popenda, M.Szachniuk, M. Antczak i in. 40 (2012) e112), zaś w rozdziale 4 znajduje się ciekawa analiza informatyczna tego systemu. Nie znalazłem informacji, jaką część systemu stworzył osobiście doktorant, jednak sam pomysł, co najmniej dwie implementacje pozwalające na prace w trybie serwera sieciowego i przetwarzanie wsadowe, możliwości wizualizacyjne, a przede wszystkim skuteczność modelowania i wydajność przewyższające rozwiązania konkurencyjne oceniam bardzo wysoko. System ten na pewno jest potrzebny społeczności naukowej i na pewno z upływem lat będzie zyskiwał na popularności wśród użytkowników z całego świata. Jednym ze wstępnych kroków w modelowaniu RNA jest budowa słownika fragmentów, tutaj zrealizowanego w postaci relacyjno-obiektowej bazy danych (FraBabe) zawierającego ponad 190 tys. motywów przestrzennych. Do optymalizacji fragmentów zastosowano pole siłowe CHARMM (która wersja?). Byłbym ciekaw, czy system pozwala na tym etapie tworzyć alternatywne modele fragmentów, optymalizowane dowolnym polem siłowym (np. AMBER). Następnie program RNAComposer dokonuje fragmentacji struktury drugorzędowej badanego RNA, wyszukuje wg wielu kryteriów odpowiednie bloki strukturalne w basie i łączy wybrane motywy przestrzenne w hipotetyczne modele RNA, które są potem optymalizowane ze względu na pewne funkcje energii najpierw w przestrzeni kątów torsyjnych (CYANA) a na końcu w przestrzeni kartezjańskiej. Pan mgr inż. M. Antczak w omawianym rozdziale prezentuje bardzo ciekawe i potrzebne analizy jakości modeli przestrzennych uzyskanych przy pomocy 4

tego systemu. Zgodnie z intuicją modele budowane z bloków o dużym podobieństwie sekwencyjnym mają wysoką jakość, natomiast gorzej wypadają te przypadki gdzie podobnych wzorców brakuje. Na tle konkurencyjnych programów (MC/Fold, ifoldrna) jakość stereochemiczna (Tab.4.7) analizowanych modeli jest bardzo dobra. Grupa badawcza ( adamiak ) brała udział w konkursie przewidywania struktur RNA, wyniki przewidywania lokują program w środku stawki. Oczywiście analizy tutaj omawiane są z natury rzeczy ograniczone i trudno ekstrapolować, że RNAComposer stanie się dominującym narzędziem bioinformatycznym, Jednak pewne cechy tego systemu dają sporą wartość naukową: możliwość badania bardzo dużych modeli (do 500 nt) oraz zapewnienie dobrej wydajności w przetwarzaniu współbieżnym. Wyniki eksperymentów obliczeniowych doktoranta, prezentowane w rozdziale 4 pokazują, że skalowanie ładnie zbliża się do liniowego. Uzyskano to, m.in., dzięki algorytmom (A6 i A7, str. 75 i 77) współbieżnego wykonywania zapytań do bazy (programowanie dynamiczne - algorytm plecakowy) i współbieżnego przetwarzania samej konstrukcji modelu. Osiągnięcia informatyczne przedstawione w tym rozdziale, a zwłaszcza fakt uruchomienia dobrej jakości wydajnego serwera RNAComposer oceniam bardzo wysoko. Nieco inną tematykę rozwija doktorant w obszernych rozdziałach 5 (18 str.) i 6 (42 strony). Zajmuje się tutaj problemem oceny (ewaluacji) uzyskanych z modelowania komputerowego struktur przestrzennych biomolekuł. Temat ten jest aktualny, zwłaszcza w kontekście konkursów CASP. W rozdziale 5 analizowane są przypadki w których ewaluacja może być oparta o jakąś wzorcową strukturę referencyjną, zaś w rozdziale 6 zadnie jest znacznie trudniejsze: jak ocenić model, jeśli nie ma do czego porównać. Niestety, w szybko rozwijającej się biologii molekularnej coraz częściej mamy do czynienia z tą drugą sytuacją. Dyskusja problemu ewaluacji, typowych miar, stosowanych w literaturze podejść jest na bardzo wysokim poziomie i pokazuje oczytanie i erudycja doktoranta w tej tematyce. W rozdziale 5 opisana jest nowa metoda ewaluacji jakości modeli. Nowością jest tutaj zastosowanie swobody w definiowaniu zakresu przestrzennego porównywanych modeli zaimplementowane w wyborze tzw. wektora poziomów szczegółowości analizy. Sam pomysł wydaje się dość prosty, jego implementacja już nie jest trywialna. Autor rozprawy prezentuje narzędzia napisane w języku Java oraz szereg (obecnie 5) pomysłowych sposobów graficznej reprezentacji wyników analizy modelu (narzędzie Gnuplot). Nie warto w tej recenzji omawiać szczegółów technicznych przyjętych rozwiązań, chcę tylko zwrócić uwagę na jedną pozytywną cechę programista skupia się tutaj na wygodzie użytkownika, widać troskę o elastyczność w reprezentowaniu danych i silną współpracę z praktykami zajmującymi się ocenianiem modeli. 5

Realizując ten software doktorant pokazał, że jego umiejętności informatyczne nie są abstrakcyjne, zaś opracowane kody są dostępne (WWW) ogółowi badaczy. (NB. Próbowałem korzystając ze strony WWW utworzyć wykresy z analiz z białym tłem, nadające się do wstawienia do drukowanego raportu czy publikacji nie wiem czy jest to możliwe, na pewno byłby przydatne.) Bardzo ciekawy jest rozdział 6, a zwłaszcza szeroko opisany problem oceny jakości modeli przestrzennych w sytuacji gdy nie ma wzorca. Autor proponuje by skorzystać z podejścia deskryptorowego, rozwijanego w grupie dr Fidelisa. Deskryptory w białkach są liczne i przy odpowiedniej definicji dobrze opisują konformacje przestrzenne (kształty). Najpierw w oparciu o dostępne dane strukturalne (10 281 domen białkowych) buduje się bibliotekę deskryptorów (> 1.5 mln), z których zachowuje się do dalszych analiz tylko wybrany podzbiór deskryptorów trójsegementowych. Z deskryptorów tworzy się grupy. Dobór algorytmu podziału na grupy był przedmiotem badań doktoranta, wybrano algorytm oparty na drzewie przeszukiwań. W oparciu o ten algorytm utworzono użyteczną bibliotekę grup różnych konformacji. W rozdziale tym analizowana jest też procedura współbieżnego budowania takiej przykładowej biblioteki. Wersja równoległa uzyskała spodziewane przyśpieszenie. Zastanawia mnie jednak celowość wkładania wysiłku w optymalizację budowy biblioteki wydaje się, że proces ten jest robiony w gruncie rzeczy tylko raz, i nawet jeśli budowanie jest kosztowne, to nie zdarza się ono często. Ciekawym pomysłem jest zaproponowanie, aby rolę struktury referencyjnej w procedurze oceny stanowiła właśnie ta biblioteka. W każdej grupie deskryptorów określa się rozkłady statystyczne a następnie bada się odchylenia analizowanego motywu strukturalnego od tych rozkładów, obliczonych dla strukturalnie podobnych grup. W gruncie rzeczy autor stosuje kilka metod ewaluacji opartych na tym ogólnym schemacie. Szkoda, że metody te nie zostały w pracy jakoś konkretnie nazwane, np. metoda M1, M2, M2a itd., łatwiej byłoby je omawiać i porównywać. Dodatkowym problemem związanym z prezentacją wyników jest to, że ewaluacje można robić na poziomie lokalnym i globalnym, co dodatkowo zwiększa rozmaitość badanych metod/opcji i utrudnia dyskusję. W rozdziale tym widzę spore zacięcie badawcze doktoranta próbowane są różne pomysły i podejścia, pisane kody realizujące te pomysły, analizowana jest efektywność numeryczna proponowanych metod ewaluacji jakości struktur. Do oceny metod oceny zaprzęgnięto elementy analizy statystycznej i program STATISTICA (podrozdz. 6.4). Dobrze uzasadniony jest dobór białek testowych. Uzyskano obszerne wyniki, które prowadza do kilku wniosków praktycznych: okazuje się, m.in. ze najlepiej w zagadnieniach oceny opartej na funkcjach molekularnych sprawdza się DIFREQA ponieważ zawiera ona w sobie efektywną wiedzę o energii swobodnej badanych konformacji 6

białkowych. Innym cennym spostrzeżeniem jest zalecenie, by konstruować biblioteki grup deskryptorów w oparciu o minimalną liczbę deskryptorów w grupie. Ważne jest też ostrzeżenie przy bardzo błędnych strukturach, lub mało zróżnicowanych modelach proponowana metoda ewaluacji zawodzi. Ciekawe dla mnie było też zgromadzanie argumentów z doświadczeń komputerowych, za tym, że w niektórych sytuacjach ewaluacja dokonywana przy pomocy pojedynczych cech, np. podobieństwo sekwencyjne czy współczynnik hydrofobowości, daje najbardziej wiarygodne wyniki. Doktorant opracował też prototypowe narzędzie realizujące opisywane metody ewaluacji i wykorzystał je w dobrze rozbudowanym przykładzie pewnego syntetycznego białka Molybdopterin guanine (z CASP9). Wydaje się, że to potencjalnie użyteczne narzędzie to nie jest jeszcze udostępnione w internecie. Podsumowując merytoryczną ocenę pracy stwierdzam, ze pan mgr inż. Maciej Antczak przeanalizował dogłębnie od strony metodologicznej i algorytmicznej kilka poważnych problemów naukowych ważnych we współczesnej bioinformatyce, Zaproponował rozwiązania tych problemów i wraz z zespołem napisał odpowiednie programy. Wykonał też wiele testów komputerowych pozwalających zrozumieć lepiej naturę badanych problemów i wnoszących cenne wskazówki informatyczne do tworzenia jeszcze lepszych narzędzi dla biologii strukturalnej. Prezentowane badania, oparte na dobrym rozumieniu algorytmów i informatyki, mają dużą wartość formalną i praktyczną. Praca napisana jest na ogół poprawnym językiem, chociaż zdarzają się miejsca ze zbyt kwiecistym stylem czy wyrażenia żargonowe. Miejscami opis jest bardzo złożony, więc nie jest to prosta lektura. Redakcja pracy jest bardzo staranna, niemal nie ma w niej typowych literówek. Pewne zastrzeżenia można mieć do rysunków: na ogół teksty są podane w obcym języku (np. rys. 2.8, rys. 5.1, rys. 5.2, rys. 6.5), część jest tak mała, że staje się nieczytelna (np. rys. 1.2), część wykresów nie ma opisanych osi (rys. 6.11). Tabele czy schematy algorytmów w pseudokodzie zredagowane są starannie i nie budzą moich zastrzeżeń. Lektura rozprawy prowadzi do uwag i pytań szczegółowych, głównie o charakterze stylistycznym i edytorskim: - Str. 2 zdjęcia krystalografii rentgenowskiej niepoprawny termin (?zdjęcia kryszałów? dyfraktogramy??) - Str. 3 W efekcie impetu działania nowych technologii na polu sekwencjonowania styl - Str. 5 Koniec lat 80-tych.. był bardzo urodzajnym okresem nastąpił znaczący rozkwit wielu nowych źródeł danych.. - i styl i sens, zdanie to liczy 10 (!) linijek 7

- Str. 5 wybuch bezprecedensowej aktywności styl - Str. 5 dla specyficznych organizmów co to są specyficzne organizmy? - Str. 6 jest obszerny opis ale nigdzie nie pada nazwa bazy UniProt - Str. 17 w chemii raczej nie piszemy o podwójnych czy potrójnych wiązaniach wodorowych (pary mają dwa lub trzy wiązania wodorowe, wszystkie one sa pojedyncze) - Str. 17 interakcje oddziaływania - Str. 17 tą cząsteczkę tę cząsteczkę - Str.19 białka i kwasy nukleinowe są całkowicie innymi cząsteczkami biologicznymi czy są niecałkowicie inne? - Str. 23 pętle (ang coils) a nie loops? - Str. 24 ruch --. Ruchu - Str. 24 białka są krytycznie istotne? kalka? - Str. 29 sugerowaniećcząsteczek itd. błędy edytorskie w zdaniu - Str. 33 spr font we wzorze 2.6 - Str. 92 -- w rozdziale - Str. 93 natomiast - Str. 135 atomy traktowane są jako naładowane cząsteczki nie cząsteczki tylko jak już to cząstki, ale tak naprawdę w tym przybliżeniu są to ładunki punktowe. W Bibliografii, wyczerpującej, aktualnej i b. starannie zredagowanej wykryłem tylko jedną dodatkową spacje w [Bult i in. 1996] oraz braki spacji w [Hvidsten i in. 2003] oraz [Hvidsten i in. 2009b]. Pragnę zaznaczyć, że uwagi te nie pomniejszają zasadniczo wysokiej oceny całości badań. Pomimo podanych powyżej, w istocie drobnych, uwag krytycznych, uważam, że mgr inż. Maciej Antczak przygotowując swoją rozprawę doktorską wykonał wiele różnorodnych, trudnych badań i obliczeń. Opracował szereg unikatowych algorytmów przydatnych w analizie struktur biomolekuł. Uzyskał wartościowe i oryginalne wyniki. Spora część dokonań doktoranta została już opublikowana lub jest przygotowywana do publikacji w bardzo dobrych lub dobrych recenzowanych czasopismach o zasięgu światowym ( Foundations of Computing and Decision Science, Nucleic Acids Res.). 8

Stwierdzam, że przedłożona mi do oceny rozprawa doktorska mgr inż. Macieja Antczaka pt. Algorytmiczne aspekty modelowania i ewaluacji biomolekuł stanowi oryginalne rozwiązanie problemu naukowego i wykazuje ogólną wiedzę teoretyczną doktoranta w naukach technicznych (informatyce) oraz wykazuje umiejętność samodzielnego prowadzenia pracy naukowej, tj. spełnia w zupełności wymagania ustawowe [Ustawa z dnia 14 marca 2003 r. o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki (Dz. U. Nr 65, poz. 595, ze zm. w Dz. U. z 2005 r. Nr 164, poz. 1365 oraz w Dz. U. z 2011 r. Nr 84, poz. 455] i zwyczajowe stawiane rozprawom doktorskim. Wnoszę zatem o dopuszczenie Pana Macieja Antczaka do dalszych etapów przewodu doktorskiego. Uważam, że praca ta zasługuje na wyróżnienie, jeśli spełnia warunki formułowane przez Politechnikę Poznańską. 9