Dr hab. inż. Halina Szatyłowicz Zakład Chemii Fizycznej Wydział Chemiczny Politechniki Warszawskiej Warszawa, 19.08.2015 Recenzja rozprawy doktorskiej pt. Zastosowania algorytmów genetycznych w badaniach struktury związków biologicznie czynnych złożonej Radzie Wydziału Farmaceutycznego Warszawskiego Uniwersytetu Medycznego przez mgr. farm. Jarosława Bukowickiego w celu uzyskania stopnia doktora Recenzowana praca została wykonana w Zakładzie Chemii Fizycznej Wydziału Farmaceutycznego WUM pod opieką naukową prof. dr hab. Iwony Wawer. Tematyka rozprawy jest ściśle związana z zainteresowaniami naukowymi Pani Promotor, koncentrującymi się na badaniach właściwości związków biologicznie czynnych, będących składnikami farmaceutyków, ekstraktów roślinnych, kosmetyków oraz produktów żywnościowych. Wyniki doświadczeń tradycyjnych (uzyskane głównie metodami NMR i EPR) w ostatnich latach bardzo często uzupełniane są badaniami in silico. Tematyka recenzowanej rozprawy doktorskiej wpisuje się w ten nurt badań. Działanie algorytmu genetycznego naśladuje proces doboru naturalnego, przeszukując przestrzeń alternatywnych rozwiązań problemu w celu wyszukania rozwiązań najlepszych. Algorytmy genetyczne wykorzystywane są w bardzo różnorodnych obszarach badawczych, co ilustruje poniższy wykres. 1
Według Web of Science ukazało się dotychczas ponad 92 tys. prac dotyczących algorytmów genetycznych (dane z sierpnia br.), na wykresie przedstawiono dziedziny o ponad 2% dorobku. Ciekawostką jest fakt, iż najwięcej publikacji pochodzi z Chin (22,8%), a następnie kolejno: USA (14,4%), Indii (6,1%), Iranu (5,8), Japonii (5,4%), Tajwanu (5,3%) i Wielkiej Brytanii (5,1%). Pozostałe kraje opublikowały poniżej 4% prac, zaś dorobek Polski to 1,3% prac (18 miejsce), a wśród nich artykuły Doktoranta. Praca doktorska mgr. farm. Bukowickiego składa się z następujących rozdziałów: 1. Wstęp i cel pracy (str. 5 9) 2. Część literaturowa (str. 10 14) 3. Część eksperymentalna (str. 15 50) 4. Wyniki i dyskusja (str. 51 186) 5. Podsumowanie (str. 187 190) oraz spisu literatury (str. 191 206, ponad 200 odnośników literaturowych), po których następują: spis rysunków i tabel oraz wykaz stosowanych skrótów. Na początku rozprawy zamieszczono streszczenia w języku polskim i angielskim. Praca liczy łącznie 217 stron maszynopisu, na których zamieszczono 121 rysunków i 78 tabel. Dodatkowo, dołączone zostały również cztery artykuły, w których opublikowano wyniki badań bezpośrednio związanych z tematyką rozprawy doktorskiej. Cel przedstawionej pracy doktorskiej opracowanie oprogramowania wykorzystującego algorytm genetyczny do analizy przestrzeni konformacyjnej związków biologicznie czynnych jest sformułowany i uzasadniony we wstępie oraz wielokrotnie podkreślany w dalszej części rozprawy (w czwartym rozdziale). W kolejnej części pracy Doktorant przedstawił bardzo zwięzły przegląd literaturowy dotyczący zastosowania algorytmów ewolucyjnych w badaniach związków biologicznie czynnych. Skoncentrował się tu głównie na algorytmach genetycznych wykorzystujących optymalizację wielokryterialną. Część eksperymentalna zawiera szczegółowe omówienie poszczególnych elementów algorytmu genetycznego, ze szczególnym uwzględnieniem optymalizacji wielomodalnej oraz wielokryterialnej, które zostały zastosowane w opracowanym oprogramowaniu. Przedstawione są tu także wykorzystywane metody chemii obliczeniowej, używane komputery ( Obliczenia wykorzystujące metodę GAAGS oraz algorytm genetyczny w połączeniu z metodami mechaniki molekularnej i metodami półempirycznymi, a także część obliczeń DFT, wykonałem na pojedynczym komputerze PC, wyposażonym w procesor Intel Pentium D 2,80 GHz, 1 GB RAM ), programy modelowania molekularnego, programy do wizualizacji wyników oraz badane związki. Jako obiekty badań zostały wybrane następujące związki (grupy związków) biologicznie czynnych: 2
1) dopamina, 2) disacharydy i ich różnorodne pochodne (β-gencjobioza, α-melibioza, acylowane i nieacylowane pochodne 3- i 2-O-β-D-glukopiranozylo-β-D-galaktozy, pochodne maltozy) 3) galaktozydy fenylowe 4) kapsaicyna, 5) leki β-adrenolityczne (acebutolol, alprenolol, karwedilol, pindolol, cyjanopindolol i karazolol). Najobszerniejszym i najciekawszym jest rozdział czwarty rozprawy Wyniki i dyskusja. Rozpoczyna się od zwięzłego opisu opracowanego oprogramowania. Przedstawiony jest schemat komunikacji pomiędzy wybranymi algorytmami genetycznymi i pakietami do modelowania molekularnego: TINKER, MOPAC, ORCA i HyperChem. Wykorzystane i oprogramowane zostały następujące metody (możliwości) przeszukiwania przestrzeni konformacyjnej badanego związku chemicznego: (1) standardowy algorytm genetyczny z możliwością optymalizacji wielomodalnej, (2) systematyczne przeszukanie wspomagane algorytmem genetycznym (GAAGS) oraz (3) optymalizacja wielokryterialna przy użyciu algorytmu NSGA-II. Ponieważ są to narzędzia, które Doktorant wykorzystał do analizy konformacyjnej wybranych związków biologicznie czynnych, bardziej odpowiednim miejscem przedstawienia opracowanego oprogramowania byłaby Część eksperymentalna. Niewątpliwie jest to oryginalny dorobek Doktoranta i wynik Jego pracy, ale dotyczy metodologii narzędzia przeszukiwania przestrzeni konformacyjnej. W kolejnych podrozdziałach przedstawione zostały wyniki zastosowania opracowanego oprogramowania, wykorzystujące algorytm genetyczny do analizy strukturalnej powyżej wymienionych związków biologicznie czynnych. Na przykładzie dopaminy pokazane zostało działanie algorytmu genetycznego. W pozostałych przypadkach uzyskane niskoenergetyczne struktury (konformery) porównywano z dostępnymi wynikami doświadczeń tradycyjnych (krystalografia i spektroskopia NMR, głównie ciała stałego). Standardowy algorytm genetyczny, wzbogacony o przeszukanie systematyczne, został wykorzystany w badaniach pochodnych maltozy, zaś jego wersja wielomodalna do analizy strukturalnej kapsaicyny i leków β-adrenolitycznych. Algorytm GAAGS zastosowano w badaniach większości disacharydów i ich pochodnych, natomiast optymalizację wielokryterialną do analizy przestrzeni konformacyjnej β-gencjobiozy. W tym ostatnim przypadku przeprowadzono dwa warianty optymalizacji: 2- i 3-kryterialną. Porównanie wyników dwóch sposobów przeszukiwania przestrzeni konformacyjnej, standardowy AG 3
wraz z przeszukaniem systematycznym i GAAGS, pokazano na przykładzie galaktozydów fenylowych. Każdy z podrozdziałów zawiera wiele informacji literaturowych, dotyczących zarówno aktywności biologicznej substancji jak i analizy konformacyjnej ich pochodnych. W ostatnim rozdziale Doktorant podsumowuje wyniki badań, Zapoznając się z przedstawioną pracą dostrzegłam w wielu miejscach niezręczności językowe, niejasności, błędy edytorskie jak również stwierdzenia i wnioski wymagające polemiki. I tak: - Nadużywanie przyimka dla, a w wielu przypadkach niepoprawne użycie; kilka przykładów: Dla uproszczenia przykładu, dla fazy stałej i dla roztworu, dla danego farmakofora, dla istniejącego już antybiotyku, Dla problemu minimalizacji wszystkich funkcji, Dla tego przykładu. - Stale dąży się również do zmniejszenia kosztów rozwoju. (str. 5) Koszty rozwoju czego? - Drugie zdanie w poniższym akapicie (Wstęp i cel pracy) zaprzecza celowości zastosowań algorytmów genetycznych do modelowania molekularnego. Przykładem obrazującym zastosowanie algorytmu genetycznego w chemii jest sytuacja, w której poszukujemy konformacji o najmniejszej energii. Obecnie są dostępne różne programy modelowania molekularnego, które umożliwiają szybkie znalezienie najlepszej struktury pod względem energetycznym. Równie niezręczne sformułowanie jest w podsumowaniu rozprawy doktorskiej. - Błąd w opisie osi na rysunku 13. - Brak odnośników literaturowych do podstawowych prac dotyczących DFT (Hohenberg, P.; Kohn, W. Phys. Rev. 1964, 136, B864 B871; Kohn, W.; Sham, L. J. Phys. Rev. 1965, 140, A1133 A1138). - Jakie było kryterium doboru wykorzystanych (i) metod obliczeniowych modelowania molekularnego, (ii) pól siłowych oraz (iii) baz funkcyjnych? - Brak opisu osi energii potencjalnej na rysunkach 20-22. - Brak poprawy w energii cząsteczki... (str. 63) Co to oznacza? - Najlepsze konformacje znalezione dzięki metodzie GAAGS poddałem dalszym optymalizacjom, przy pomocy metod DFT, a następnie obliczyłem dla nich parametry NMR. Stałe ekranowania wyznaczyłem stosując metodę GIAO DFT, wykorzystując przy tym funkcjonał hybrydowy B3LYP oraz bazę funkcyjną 6-31+G(d,p). Zoptymalizowane struktury MM+ posłużyły tutaj jako struktury wyjściowe. (str. 65) Jakie metody DFT (funkcjonał/baza funkcyjna) wykorzystano do optymalizacji konformacji znalezionych poprzez zastosowanie metody GAAGS? Ostatnie zdanie w powyższym 4
fragmencie sugeruje, iż nie było ponownej optymalizacji geometrii cząsteczek. Co oznacza sformułowanie struktury wyjściowe? - Niekompletne podpisy pod rysunkami, na przykład brak nazw substancji (np. rys. 25, 77, 108), parametrów obliczeń (np. rys. 30) lub wykorzystanych oznaczeń (np. rys. 26-28, 34-36, 42, 43, 48, 50, 70). W przypadku kilku rysunków (np. 26-28, czy też 42 i 43) poprawne opisy można znaleźć w publikacjach Doktoranta. Podobne niedociągnięcia występują również w nagłówkach tabel. - Wykorzystanie obliczeń parametrów NMR (metoda GIAO) do weryfikacji wybranych konformerów zasygnalizowano na str. 65, pierwszą analizę otrzymanych wyników przedstawiono na str. 74, natomiast sposób ich obliczania można znaleźć dopiero na str. 103. - Kryterium doboru funkcjonału DFT i bazy funkcyjnej do obliczeń parametrów NMR. - Jako kryterium wyboru optymalnych konformerów zastosowano współczynnik determinacji (R 2 ) liniowej zależności pomiędzy obliczonymi i wyznaczonymi doświadczalnie wartościami przesunięcia chemicznego 13 C NMR (ciało stałe). Jednak wnioskowanie o większej zgodności struktury obliczonej z występującą w fazie stałej na podstawie różnicy czwartej cyfry wartości R 2 jest bardzo wątpliwe. - Kolejny obszar, oznaczony jako region b, został znaleziony w okolicach φ/ψ = 80 /160. (str. 104) Z rysunku 53 wynika, że powinno być φ/ψ = 80 /-160. Ten sam błąd jest w przypadku gaf3 i gaf4 (nie φ/ψ = -80 /-20 ale φ/ψ = 60 /0 ), na str. 109. - Niepoprawny opis zależności przedstawionych na rys. 76 (przesunięcia chemiczne atomów węgla pierścienia fenylowego, δ, vs. kąt torsyjny, ψ). Ten sam błąd jest również w publikacji (Chem. Phys. 2015, 457:43-50). Co oznacza sformułowanie aromatycznych atomów węgla? - Co nazywamy lekiem? Czy lekiem jest związek chemiczny (biologicznie czynny) o potencjalnym zastosowaniu w terapii? Powyższe uwagi w niewielkim stopniu wpływają jednak na moją ogólnie pozytywną ocenę recenzowanej pracy doktorskiej Jarosława Bukowickiego. Modelowanie molekularne jest powszechnie stosowane w badaniach struktury i właściwości cząsteczek, korelacji między tymi wielkościami, oraz oddziaływań wewnątrz- i międzycząsteczkowych. Obecnie dostępnych jest wiele programów umożliwiających wykorzystanie mechaniki i dynamiki molekularnej oraz chemii kwantowej w badaniach związków już istniejących czy też projektowaniu nowych substancji o określonych, pożądanych właściwościach. Celem obliczeń, w większości przypadków, jest znalezienie cząsteczki optymalnej, czyli o najniższej energii. Poszukiwanie minimum globalnego optymalizacja geometrii układu nie jest procesem trywialnym, w szczególności kiedy obiektem badań jest cząsteczka o większej 5
liczbie atomów, w której poszczególne jej fragmenty połączone są wiązaniami umożliwiającymi ich rotację i/lub zawierają podstawniki niesymetryczne. Pomimo wykorzystania komputerów o bardzo dużych możliwościach obliczeniowych nadal są to tzw. czasy nierzeczywiste, czyli lata obliczeń (wiele takich przykładów można znaleźć w recenzowanej pracy doktorskiej). Jedną z metod rozwiązania tego problemu jest wykorzystanie algorytmu genetycznego. Najbardziej cennym i oryginalnym osiągnięciem Doktoranta jest zastosowanie i rozwój metodyki badawczej umożliwiającej względnie szybkie i skuteczne przeszukiwanie przestrzeni konformacyjnej cząsteczki, czyli opracowanie programu wykorzystującego algorytmy genetyczne i współpracującego z wybranymi pakietami obliczeniowymi TINKER, MOPAC, ORCA oraz HyperChem. Do przetestowania programu wybrał odpowiednie obiekty badań. Charakteryzowały się one zarówno różnym stopniem skomplikowania struktury (liczba możliwych rotacji w cząsteczce) jak i dostępnością wyników badań doświadczeń tradycyjnych. Skuteczność i celowość zastosowania wybranych algorytmów genetycznych Doktorant przedstawił na przykładzie 21 związków biologicznie czynnych, ale obiektów badań było więcej ponieważ w kilku układach dyskutował On wpływ protonowania grup aminowych ( NH ) na strukturę cząsteczki. W większości przypadków do weryfikacji wyznaczonych konformerów, czyli porównania ze strukturami rzeczywistymi, wykorzystane zostały wartości przesunięcia chemicznego 13 C NMR. Natomiast, bardzo ciekawym problemem wydaje się porównanie efektów działania algorytmów genetycznych z wynikami przeszukiwań metodą dynamiki molekularnej. O wartości uzyskanych wyników świadczy również fakt, iż znaczna ich część została już opublikowana w (i) Journal of Molecular Structure IF = 1,602, (ii) Tetrahedron IF = 2,641, (iii) Journal of Carbohydrate Chemistry IF = 1,417 i (iv) Chemical Physics IF = 1,652. Publikacje te są wieloautorskie, zaś Doktorant jest pierwszym autorem w dwóch z nich. Wskazuje to na Jego umiejętność współpracy, co jest obecnie bardzo cenione, szczególnie w przypadku celowości łączenia badań in silico z doświadczeniem tradycyjnym. Podsumowując, z pełnym przekonaniem stwierdzam, iż przedstawiona mi do recenzji praca doktorska spełnia ustawowe i zwyczajowe wymagania stawiane rozprawom doktorskim i wnoszę o dopuszczenie mgr. farm. Jarosława Bukowickego do dalszych etapów przewodu doktorskiego. Halina Szatyłowicz 6