Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA Marta Szachniuk
Plan prezentacji Wprowadzenie do tematyki badań Teoretyczny model problemu Złożoność obliczeniowa Prezentacja algorytmów Eksperyment obliczeniowy Podsumowanie badań 2
Wprowadzenie 3 najważniejsze rodzaje cząsteczek: Białka + DNA+ RNA = molekularny model życia są podstawową strukturą we wszystkich żywych komórkach, uczestniczą w wytwarzaniu i przekazywaniu impulsów nerwowych, odpowiadają za transport i magazynowanie, kontrolują wzrost, etc. stanowi magazyn informacji genetycznej, bierze udział w przekazywaniu cech dziedzicznych, uczestniczy w podziale komórek, bierze udział w syntezie substancji białkowej, etc. 3
Funkcje RNA przenosi informacje genetyczne z DNA do białek bierze udział w wyciszaniu genów jest katalizatorem reakcji chemicznych jest elementem budulcowym rybosomów kontroluje przebieg niektórych procesów w komórce 4
Struktura cząsteczki RNA podstawowy składnik budulcowy: nukleotyd reszta kwasu zasada organiczna fosforowego Adenina Guanina cukier: ryboza Cytozyna Uracyl 5
RNA: struktura trzeciorzędowa Jest to forma przestrzenna, jaką przyjmuje cząsteczka. Determinuje funkcje cząsteczki. Określa pofałdowanie pierścienia rybozy, kąty torsyjne, parowanie się zasad (A:U, C:G, G:U, C:U). 6
Spektroskopia NMR Spektrometr (Bruker Avance 600 MHz) 7
NMR - wyznaczanie struktury CGC A. Wykonanie widm (eksperymenty NMR). B. Identyfikacja sygnałów rezonansowych. C. Wyznaczenie więzów strukturalnych. D. Wygenerowanie rodziny struktur i ich analiza. 8
Ścieżka NOE na widmie NOESY aromatyczno-anomeryczny region widma NOESY widmo NOESY H6 (C,U)/ H8 (A,G) H1` 9
Cel badań Stworzenie automatycznej metody konstruowania ścieżek NOE z wykorzystaniem: danych spektralnych, teoretycznego modelu problemu. 10
Grafowy model problemu aromatyczno-anomeryczny region widma NOESY graf NOESY 1 2 4 3 5 6 6.0 5.8 5.6 5.4 5.2 D1 ( ppm) 8 7 10 9 11 12 13 14 17 15 16 8.0 7.8 7.6 D2 ( ppm ) 5 8 16 11 6 15 2 12 17 4 7 13 3 10 14 1 9 11
Złożoność obliczeniowa problemu Teoretyczny model problemu Wersja decyzyjna jest silnie NP-zupełna. Wersja przeszukiwania jest silnie NP-trudna. Rzeczywisty model problemu Wersja decyzyjna jest łatwa. Wersja przeszukiwania jest silnie NP-trudna. 12
Dowód: transformacja wielomianowa graf Hamiltonowski graf NOESY v 2 w 3t w 2t w 3 3 1 2 w 1t w 2 w 2d 2 v 1 3 v 3 nie zawiera pętli własnych stopień każdego wierzchołka 3 w 1d w 3d w 1 1 2 3 13 1
Algorytmy: dane wejściowe numer sygnału współrzędne centrum sygnału szerokości sygnału w dwóch wymiarach intensywność sygnału sekwencja (struktura pierwszorzędowa cząsteczki) długość ścieżki rozdzielczość widma przedziały nakładania się sygnałów znane położenia sygnałów w ścieżce sygnały nadmiarowe oraz sygnały H5-H6 odległość między pikami dubletów 14
Algorytmy dla ścieżki NOE algorytm wyliczeniowy algorytm ewolucyjny algorytm przeszukiwania tabu algorytm dokładny, znajduje wszystkie rozwiązania dopuszczalne (zgodne z danymi wejściowymi). algorytm heurystyczny, ocenia rozwiązania dopuszczalne według zdefiniowanej funkcji kryterialnej i znajduje najlepsze (przybliżone) rozwiązanie. 15
Eksperyment obliczeniowy Zbiór danych testowych r(cgcgcg) 2 2 OMe(cgcgcg) 2 d(gactagtc) 2 r(gaggucuc) 2 r(ggaguucc) 2 r(cgcg F cg) 2 r(cgcg F cg) 2 r(ggcaggcc) 2 r(ggcgagcc) 2 r(ggaguucc) 2 Kryteria oceny algorytmów kryterium algorytm dokładny ewolucyjny tabu liczba ścieżek czas działania jakość rozwiązania 16
Eksperyment obliczeniowy (2) Liczba rozwiązań dopuszczalnych znalezionych przez algorytm dokładny w dwóch testach T1 i T2: I II III IV V VI VII VIII IX X T1 1 2 3 2 4 2 1 4 1 1 T2 140 776 72 63 240 3192 160 64 843 1134 Numeracja przykładów: I- r(cgcgcg) 2, II- 2 OMe(cgcgcg) 2, III, IV- r(cgcg F cg) 2, V- d(gactagtc) 2, VI- r(ggcaggcc) 2, VII- r(gaggucuc) 2, VIII- r(ggcgagcc) 2, IX, X- r(ggaguucc) 2 17
Eksperyment obliczeniowy (3) 100% 80% 60% 40% 20% 0% podobieństwo rozwiązania przybliżonego do ścieżki oryginalnej - test T1 I II III IV V VI VII VIII IX X TS GA(250) GA(500) GA(750) GA(1000) TS algorytm tabu, GA algorytm ewolucyjny 18
Eksperyment obliczeniowy (4) 100% 80% 60% 40% 20% podobieństwo rozwiązania przybliżonego do ścieżki oryginalnej - test T2 0% I II III IV V VI VII VIII IX X TS GA(250) GA(500) GA(750) GA(1000) TS algorytm tabu, GA algorytm ewolucyjny 19
Podsumowanie Zdefiniowano problem od strony bioinformatycznej Stworzono model teoretyczny problemu Opracowano metodę automatycznego konstruowania ścieżki NOE Przeprowadzono analizę złożoności obliczeniowej problemu Zaproponowano algorytmy konstruujące ścieżkę NOE Wykonano testy obliczeniowe 20
Kierunki dalszych badań Weryfikacja istniejących algorytmów dla struktur RNA nie będących regularnymi dupleksami Weryfikacja stosowalności algorytmów dla większych cząsteczek RNA Analiza problemu dla widm 3D: - stworzenie modelu teoretycznego, - analiza złożoności obliczeniowej, - konstrukcja algorytmów 21
Dziękuję za uwagę. 22