RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych Joanna Wiśniewska Promotor: dr inż. P. Łukasiak
Spis treści 1. Zakres pracy magisterskiej 2. Struktura białka 3. Struktura kwasów nukleionowych 4. RMSD Zastosowania RMSD 1. Porównywanie struktur przestrzennych 2. Metody porównywania struktur LGA CMO
Zakres pracy magisterskiej 1. Zaprojektowanie i implementacja schematu decyzyjnego umożliwiającego porównanie modeli przestrzennych w oparciu o sąsiedztwo lokalne 2. Implementacja istniejących metod służących do porównywania struktur przestrzennych 3. Przetestowanie zaimplementowanych rozwiązań na rzeczywistych danych 4. Zintegrowanie zaimplementowanych algorytmów w jednolitą aplikację internetową
Struktura białka Ze względu na budowę, białka można rozpatrywać na czterech poziomach: struktura pierwszorzędowa struktura drugorzędowa struktura trzeciorzędowa struktura czwartorzędowa
Modele przestrzenne kwasów nukleinowych trna DNA
Co to jest RMSD? Root mean square deviation Wzór ogólny:, gdzie δ jest odległością pomiędzy N parami odpowiednich atomów miara średniej odległości pomiędzy dwoma atomami wyznacza stopień podobieństwa strukturalnego najczęściej wyrażana w Angstreamach (Å), równoważnych 10 10m
Zastosowanie RMSD wykorzystywany do analizowania odległości pomiędzy atomami w strukturach trzeciorzędowych walidacja struktur in silico sprawdzenie dokładności modelu względem struktury natywnej (określonej biokrystalograficznie)
Porównywanie struktur przestrzennych Kolejne etapy ogólnego schematu porównywania: Pozyskanie analizowanych struktur Przyrównanie strukturalne Kalkulacja RMSD Atomy C-alfa Wszystkie atomy
Dlaczego dokonywane jest porównywanie modeli struktur przestrzennych? wyznaczanie struktur in silico (problem NP trudny) większa efektywność czasowa mniejszy koszt mniejsza dokładność wykorzystywane metody są heurystyczne nie istnieje jeszcze idealny algorytm identyfikacja różnic pomiędzy analizowanymi modelami ocena jakości metod przeznaczonych do wyznaczania struktury trzeciorzędowej
Metody porównywania struktur przestrzennych 1) dynamic programming 2) comparisons of distance matrices 3) graph theory and Local Search 4) geometrical hashing 5) principle component correlation analysis 6) local and global alignment 7) consensus shapes 8) consensus structures 9) Kolmogorov complexity 10) Fuzzy Contact Map Overlap 11) comparing proteins as paths in 3D
Contract Map Overlap (CAO) utworzenie mapy dla każdej analizowanej struktury analizowanie odległości pomiędzy poszczególnymi atomami (a) postać liniowa (b) struktura trzeciorzędowa (c) mapa odległości źródło: A Fuzzy Sets based Generalization of Contact Maps for the Overlap of Protein Structures David Pelta, Natalio Krasnogor, Carlos Bousono-Calzon,Jos L. Verdegay, Edmund Burke
Porównywanie struktur przy wykorzystaniu CAO Struktura 1 (a) struktura natywna (b) mapa odległości Struktura 2 (a) struktura natywna (b) mapa odległości źródło: A Fuzzy Sets based Generalization of Contact Maps for the Overlap of Protein Structures David Pelta, Natalio Krasnogor, Carlos Bousono-Calzon,Jos L. Verdegay, Edmund Burke
Porównywanie struktur przy wykorzystaniu map CAO analizowanie pary utworzonych map przyrównanie analizowanych struktur para kontraktów jest połączona jeżeli odległości są podobne oceną przyrównania jest liczba połączonych kontraktów na mapie źródło: A Fuzzy Sets based Generalization of Contact Maps for the Overlap of Protein Structures David Pelta, Natalio Krasnogor, Carlos Bousono-Calzon,Jos L. Verdegay, Edmund Burke
LGA (Local-Global Alignment) analizowane są lokalne i globalne superpozycje nie wymaga wcześniejszego definiowania powiązań pomiędzy resztami generuje wiele różnych superpozycji, aby identyfikować miejsca, gdzie białka są podobne funkcja oceniająca składa się z dwóch elementów LCS (longest continuous segments) GDT (global distance test) jako wynik otrzymywany jest zbiór zmodyfikowanych współrzędnych pierwszej struktury (opcjonalnie również drugiej)
LGA (Local-Global Alignment) Odległości pomiędzy atomami C-alfa Legenda: < 1.0 Å - kolor zielony < 2.0 Å - kolor żółty < 3.0 Å - kolor pomarańczowy < 4.0 Å - kolor brązow źródło: http://www.ncbi.nlm.nih.gov/pmc/articles/pmc168977/
LGA (Local-Global Alignment) Najlepsze ułożenie dwóch struktur wymodelowane na postawie obrazu A Wymodelowane struktury na podstawie obrazu B źródło: http://www.ncbi.nlm.nih.gov/pmc/articles/pmc168977/
Wykorzystywane narzędzia Eclipse Java 3D Java Enterprise Edition Perl SVN
Literatura Adam Zemla - LGA: a method for finding 3D similarities in protein structures David Pelta - A Fuzzy Sets based Generalization of Contact Maps for the Overlap of Protein Structures Wayne Pullan - Protein Structure Alignment Using Maximum Cliques and Local Search Giuseppe Lancia, Sorin Istrail - Protein Structure Comparison: Algorithms and Applications Cymerman, Sasin, Bujnicki - Przewidywanie struktur białek: od modelowania opratego o szablony Wikipedia: http://en.wikipedia. org/wiki/root_mean_square_deviation_(bioinformatics)
Dziękuję