MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

Podobne dokumenty
Bioinformatyka wykład 8, 27.XI.2012

Bioinformatyka wykład 10

RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Bioinformatyka Laboratorium, 30h. Michał Bereta

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Grafy i sieci wybrane zagadnienia wykład 3: modele służące porównywaniu sieci

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das

Bioinformatyka wykład 3.I.2008

Dopasowanie sekwencji (sequence alignment)

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Bioinformatyka Laboratorium, 30h. Michał Bereta

PRZYRÓWNANIE SEKWENCJI

Bioinformatyka Laboratorium, 30h. Michał Bereta


Tematy prac dyplomowych inżynierskich

Bioinformatyka Laboratorium, 30h. Michał Bereta

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk

Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO

Wykład I. Wprowadzenie do baz danych

WorkingDoc CostControl: Precyzyjna kontrola kosztów wydruku na urządzeniach Grupy Ricoh

Statystyczna analiza danych

Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.

W kierunku równoległej implementacji pakietu T-Coffee

Wstęp do Biologii Obliczeniowej

Programowanie. programowania. Klasa 3 Lekcja 9 PASCAL & C++

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Wymagania techniczne. Sage Symfonia 2.0 i Sage Symfonia Start 2.0 wersje 2019

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Klaster obliczeniowy

Analiza porównawcza wybranych własności systemów zarządzania bazami danych

Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW

Języki skryptowe. zasady zaliczania literatura wprowadzenie

Customer Attribution Models. czyli o wykorzystaniu machine learning w domu mediowym.

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Wymagania techniczne

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

Bioinformatyka II Modelowanie struktury białek

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Generator testów Bioinformatyka wer / 0 Strona: 1

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Bioinformatyka II Modelowanie struktury białek

Założenia monitoringu innowacyjności województwa mazowieckiego

MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska

Algorytmy równoległe. Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2010

Efekt kształcenia. Wiedza

Wykład V. Rzut okiem na języki programowania. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Porównywanie i dopasowywanie sekwencji

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

WYMAGANIA EDUKACYJNE. Programowanie Aplikacji Internetowych klasa III

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

KARTA KURSU. Języki hipertekstowe i tworzenie stron WWW. Opis kursu (cele kształcenia) Warunki wstępne. Efekty kształcenia. Nazwa

Serwer SSH. Wprowadzenie do serwera SSH Instalacja i konfiguracja Zarządzanie kluczami

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Prof. dr hab. Joanna Trylska Rada Naukowa Instytutu Biochemii i Biofizyki Polskiej Akademii Nauk w Warszawie

Algorytmiczne aspekty modelowania i ewaluacji biomolekuł Algorithmic aspects of modeling and evaluation of biomolecules

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

Translacja i proteom komórki

Pracownia Inżynierii Procesowej

UCHWAŁA NR 46/2013. Senatu Akademii Marynarki Wojennej im. Bohaterów Westerplatte z dnia 19 września 2013 roku

która metoda jest najlepsza

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

Porównywanie i dopasowywanie sekwencji

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. dr inż. Adam Piórkowski. Jakub Osiadacz Marcin Wróbel

Automatyzacja Testowania w WEB 2.0

Wymagania sprzętowe i systemowe

Analiza biznesowa studium przypadku

Procesy integracji modeli danych do jednolitej struktury WBD. Tadeusz Chrobak, Krystian Kozioł, Artur Krawczyk, Michał Lupa

Dodatkowo planowane jest przeprowadzenie oceny algorytmów w praktycznym wykorzystaniu przez kilku niezależnych użytkowników ukończonej aplikacji.

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15

SYSTEM HYDROGRAFICZNY RZGW W SZCZECINIE

TOK STUDIÓW Kierunek: informatyka rok studiów: I studia stacjonarne pierwszego stopnia, rok akademicki 2014/2015. Forma zaliczen ia. egz. lab.

Przewidywanie struktur białek

UCHWAŁA NR 60/2013 Senatu Akademii Marynarki Wojennej im. Bohaterów Westerplatte z dnia 21 listopada 2013 roku

Przewidywanie struktury kanału białkowego z wykorzystaniem probabilistycznych gramatyk formalnych oraz modelu ciągłego przepływu jonów

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Podstawy bioinformatyki - biologiczne bazy danych

Algorytmy równoległe: prezentacja i ocena efektywności prostych algorytmów dla systemów równoległych

Program MC. Obliczyć radialną funkcję korelacji. Zrobić jej wykres. Odczytać z wykresu wartość radialnej funkcji korelacji w punkcie r=

BIM jako techniczna platforma Zintegrowanej Realizacji Przedsięwzięcia (IPD - Integrated Project Delivery)

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Aplikacje webowe z wykorzystaniem Node.js oraz Express

KONCEPCJA WYKORZYSTANIA TECHNOLOGII APPLET- JAVA W TWORZENIU

Transkrypt:

MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński

Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G, C - struktura drugorzędowa przestrzenne ukształtowanie cząsteczki - elementy tej struktury mogą być przewidziane za pomocą obliczeń

- struktura trzeciorzędowa Struktury 3D RNA są znane jako struktury trzeciorzędowe i formowane z długozasięgowych interakcji pomiędzy odległymi pętlami stabilizowanymi przez kanoniczne lub niekanoniczne par zasad, kationy bądź słabe oddziaływania

Cel Duży wpływ struktury trzeciorzędowej i porównanie struktur 3D RNA -> skuteczne narzędzie do badania funkcji RNA i relacji ewolucyjnych Kilka metod ARTS, DIAL, iparts, SARA, SARSA, Rclick, R3Dalign, RASS, FRASS, SETTER, czy R3D-BLAST

Ale Żadna z tych metod nie potrafi tego, czego my potrzebujemy, czyli bezpośredniego wielokrotnego dopasowania struktur RNA Tak więc opracowano MultiSETTER!

Zalety Można wykryć motywy niekonserwatywne na poziomie sekwencji Może być łatwo sprawdzane wizualnie w celu wykrycia wspólnych motywów -> nie wymagają tak wielu cząsteczek jak MSA Dostępność dla szerokiej publiczności biologów i bioinformatyków Bezpłatny i otwarty dla wszystkich Brak wymagań logowania

Zalety cd. Umożliwia wykonanie dopasowania zarówno dla dwóch, jak i więcej struktur oraz porównania między strukturami uzyskanymi z bazy danych PDB lub dostarczonego przez użytkownika Grafika 3D jak i zbiorcze dane statystyczne -> interpretacja

Algorytm SETTER SEcondary structure-based TERtiary superposition Podział na fragmenty drugorzędowe struktury GSSU (generalized secondary structure units)

Budowa GSSU

Algorytm SETTER cd. Nakładanie dwóch struktur Algorytm minimalizacji RMSD w celu uzyskania superpozycji strukturalnej 3 pary punktów: - Dwie poprzez dopasowanie dwóch odpowiednich reszt szyi - Trzecia identyfikowana poprzez dopasowanie każdej możliwej pary nukleotydów pętlowych (wybór najmniejsza liczba punktów)

Algorytm SETTER cd. Kolejne porównywanie dwóch struktur poprzez dodatkowe RMSD superpozycji wzajemnych najbliższych sąsiadujących reszt Punktacja : S-distance

Algorytm MultiSETTER Heurystyczne podejście dopasowanie progresywne (jak Clustal) Każda para struktur RNA jest dopasowywana przez SETTER, wyniki S-distance powodują powstanie macierzy odległości Drzewo prowadzące jest obliczane przy pomocy metody łączenia sąsiadów (neighbor-joining)

Algorytm MultiSETTER Dwie najbliższe sobie struktury -> average structure -> średnia pozycja indywidualnych atomów Dopóki nie dojdziemy do korzenia

Paralelizacja 1) Superpozycja struktury par RNA Przetwarzanie wielokrotnych par GSSU (TYLKO ONE!!), niezależnie i każdy z nich przypisany do danej jednostki obliczeniowej 2) Macierz odległości Dla n struktur: n*(n-1)/2 niezależnie

Paralelizacja 3) Łączenie RNA Powstawanie przeciętnej struktury może być rozłożone na scalone dopasowanie GSSUs. Takie łączenie może zachodzić niezależnie, czyli równolegle

Porównanie dopasowania dwóch struktur do wielokrotnego 1NKW i 1S72 (23 S) 1NKW, 1S72, 2AWB, 2Y11 (23 S) ~3000 reszt każdy 4 rdzeniowy z Hyper-V Intel(R) Core i7-4790 CP. 3.60 GHz, 16GB RAM, Windows 8.1 Ograniczenie liczby nici od 1-4

Wyniki

Języki programowania 1) Rdzeń C++ 2) Aplikacja web Python, Model-Template-View (MTV), Django version 1.4 Ze strony serweru: Python Dla klienta: jquery JavaScript version 1.10.4 oraz JavaScript molecular viewer JSmol

Połączenia Dane o strukturze RNA: baza danych SETTER Relacyjna baza danych MySQL synchronizowana z PDB w każdą środę SETTER = PDB ID, ID łańcuchów, wzory wiązań wodorowych

Input

Input

Output

Reasumując Pierwsze dostępne publicznie narzędzie do wielokrotnego dopasowania struktury RNA Wiele dokładnych dopasowań w rozsądnym czasie Wizualizacja w 3D, która może ujawnić relacje strukturalne i funkcjonalne W przyszłości łączyć dopasowania sekwencji i struktur z dużą dokładnością

Dziękuję za uwagę.