MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński
Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G, C - struktura drugorzędowa przestrzenne ukształtowanie cząsteczki - elementy tej struktury mogą być przewidziane za pomocą obliczeń
- struktura trzeciorzędowa Struktury 3D RNA są znane jako struktury trzeciorzędowe i formowane z długozasięgowych interakcji pomiędzy odległymi pętlami stabilizowanymi przez kanoniczne lub niekanoniczne par zasad, kationy bądź słabe oddziaływania
Cel Duży wpływ struktury trzeciorzędowej i porównanie struktur 3D RNA -> skuteczne narzędzie do badania funkcji RNA i relacji ewolucyjnych Kilka metod ARTS, DIAL, iparts, SARA, SARSA, Rclick, R3Dalign, RASS, FRASS, SETTER, czy R3D-BLAST
Ale Żadna z tych metod nie potrafi tego, czego my potrzebujemy, czyli bezpośredniego wielokrotnego dopasowania struktur RNA Tak więc opracowano MultiSETTER!
Zalety Można wykryć motywy niekonserwatywne na poziomie sekwencji Może być łatwo sprawdzane wizualnie w celu wykrycia wspólnych motywów -> nie wymagają tak wielu cząsteczek jak MSA Dostępność dla szerokiej publiczności biologów i bioinformatyków Bezpłatny i otwarty dla wszystkich Brak wymagań logowania
Zalety cd. Umożliwia wykonanie dopasowania zarówno dla dwóch, jak i więcej struktur oraz porównania między strukturami uzyskanymi z bazy danych PDB lub dostarczonego przez użytkownika Grafika 3D jak i zbiorcze dane statystyczne -> interpretacja
Algorytm SETTER SEcondary structure-based TERtiary superposition Podział na fragmenty drugorzędowe struktury GSSU (generalized secondary structure units)
Budowa GSSU
Algorytm SETTER cd. Nakładanie dwóch struktur Algorytm minimalizacji RMSD w celu uzyskania superpozycji strukturalnej 3 pary punktów: - Dwie poprzez dopasowanie dwóch odpowiednich reszt szyi - Trzecia identyfikowana poprzez dopasowanie każdej możliwej pary nukleotydów pętlowych (wybór najmniejsza liczba punktów)
Algorytm SETTER cd. Kolejne porównywanie dwóch struktur poprzez dodatkowe RMSD superpozycji wzajemnych najbliższych sąsiadujących reszt Punktacja : S-distance
Algorytm MultiSETTER Heurystyczne podejście dopasowanie progresywne (jak Clustal) Każda para struktur RNA jest dopasowywana przez SETTER, wyniki S-distance powodują powstanie macierzy odległości Drzewo prowadzące jest obliczane przy pomocy metody łączenia sąsiadów (neighbor-joining)
Algorytm MultiSETTER Dwie najbliższe sobie struktury -> average structure -> średnia pozycja indywidualnych atomów Dopóki nie dojdziemy do korzenia
Paralelizacja 1) Superpozycja struktury par RNA Przetwarzanie wielokrotnych par GSSU (TYLKO ONE!!), niezależnie i każdy z nich przypisany do danej jednostki obliczeniowej 2) Macierz odległości Dla n struktur: n*(n-1)/2 niezależnie
Paralelizacja 3) Łączenie RNA Powstawanie przeciętnej struktury może być rozłożone na scalone dopasowanie GSSUs. Takie łączenie może zachodzić niezależnie, czyli równolegle
Porównanie dopasowania dwóch struktur do wielokrotnego 1NKW i 1S72 (23 S) 1NKW, 1S72, 2AWB, 2Y11 (23 S) ~3000 reszt każdy 4 rdzeniowy z Hyper-V Intel(R) Core i7-4790 CP. 3.60 GHz, 16GB RAM, Windows 8.1 Ograniczenie liczby nici od 1-4
Wyniki
Języki programowania 1) Rdzeń C++ 2) Aplikacja web Python, Model-Template-View (MTV), Django version 1.4 Ze strony serweru: Python Dla klienta: jquery JavaScript version 1.10.4 oraz JavaScript molecular viewer JSmol
Połączenia Dane o strukturze RNA: baza danych SETTER Relacyjna baza danych MySQL synchronizowana z PDB w każdą środę SETTER = PDB ID, ID łańcuchów, wzory wiązań wodorowych
Input
Input
Output
Reasumując Pierwsze dostępne publicznie narzędzie do wielokrotnego dopasowania struktury RNA Wiele dokładnych dopasowań w rozsądnym czasie Wizualizacja w 3D, która może ujawnić relacje strukturalne i funkcjonalne W przyszłości łączyć dopasowania sekwencji i struktur z dużą dokładnością
Dziękuję za uwagę.