na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das

na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das wykonała: Marta Szynczewska bioinformatyka Uniwersytet Jagielloński

Struktura I-rzędowa RNA: sekwencja nukleotydów Struktura II-rzędowa RNA: pojedyncza nić polinukleotydowa, pofałdowana, mogą tworzyć się odcinki dwuniciowe Struktura III-rzędowa RNA: przybieranie różnych konformacji w przestrzeni

Modelowanie komputerowe struktur RNA dynamicznie się rozwija. Znacząco poprawiły się umiejętności przewidywania i projektowania zarówno drugorzędowych jak i trzeciorzędowych struktur RNA. 1973 ulepszenie algorytmu przewidywania struktury drugorzędowej 2010 konformacje z punktacjami energii 2011 modelowanie motywów 2012 próby RNA Puzzles 2013 klasyfikacja motywów strukturalnych RNA

To bardzo duży pakiet oprogramowania służący do modelowania makromolekuł, głównie przewidywania struktur, projektowania lub remodelowania białej i kwasów nukleinowych. Zaimplementowany głównie w C++, Pythonie i innych językach. Nie jest to jeden monolityczny program. Wykorzystywana jest również do poznawania przyczyn powstawania chorób i leczenia ich oraz projektowania enzymów, szczepionek i leków. Modelowanie molekularne to proces oceniania i szeregowania struktur makrocząsteczek biologicznych.

Rosetta umożliwia modelowanie 100-300 nukleotydów RNA w rozdzielczości subhelikalnej. Jest to typowy zakres wielkości dla wielu ryboprzełączników (regulują ekspresję kodowanego przez siebie białka) oraz dla domen rybozymów. Rozdzielczość subhelikalna, choć wciąż ciężko osiągalna, jest użyteczna w prowadzeniu eksperymentów in vitro i in vivo do wykrywania częściowej struktury w ryboprzełącznikach bez ich ligandów oraz do ilustracji powiązań ewolucyjnych, które nie są oczywiste z sekwencją. Podstawowymi narzędziami są łańcuchy otrzymane z eksperymentów mapowania chemicznego.

Rozwój oprogramowania rozpoczął się w labolatorium dr Davida Bakera z Uniwersytetu Waszyngtonie. Początkowo miał służyć jako narzędzie do przewidywania struktury, ale z czasem został przystosowany do rozwiązywania typowych problemów obliczeniowych wielkocząsteczkowych. Aktualnie w rozwijaniu narzędzia biorą udział również członkowie RosettaCommons, do których należą laboratoria rządowe, instytuty, ośrodki badawcze i korporacje.

https://www.rosettacommons.org/

Informacje o licencji: Rosetta jest dostępna dla wszystkich użytkowników niekomercyjnych za darmo i dla użytkowników komercyjnych (instytucje, firmy) za opłatą. Pełną dokumentację Informacje jak zainstalować oprogramowanie Przewodnik jak posługiwać się narzędziami Forum użytkowników Rosetta Academy filmy edukacyjne Informacje o podobnych projektach

Wybór licencji

Zrozumienie interakcji międzycząsteczkowych Projektowanie niestandardowych cząsteczek Znalezienie powszechnie użytecznych funkcji energii dla różnych reprezentacji molekuł Opracowanie efektywnych sposobów odnajdywania budowy przestrzennej i konformacji

1. Wybór próbki o jak najwyższej rozdzielczości (lepszej niż 2Å). Im większa rozdzielczość tym łatwiejsza analiza wyników. 2. Wybór odpowiedniego protokołu Rosetta oraz opcji. 3. Poszukiwanie odpowiednio dużej mocy obliczeniowej, aby uzyskać wyniki. 4. Analiza wyników.

Istnieje kilka opcji użycia: Wiersz poleceń PyRosetta PyRosetta Toolkit (interfejs graficzny) RosettaScripts Serwery

Nazwa serwera ROSIE RosettaServer Robetta RosettaDesign RosettaBackrub RosettaDock FlexPepDock Funkcja Pełny zasób funkcji skierowany do użytkowników akademickich Do białek oraz modelowania de novo motywów RNA Przewidywanie struktury białek Projektowanie sekwencji białek Projektowanie szablonów Dokowanie białko-białko Dokowanie peptydów

http://rosie.rosettacommons.org/rna_denovo

Serwerem płatnym jest Rosetta@cloud. Mamy do dyspozycji niedrogie, umieszczone w chmurze narzędzia i usługi skierowane do przemysłu biotechnologicznego i farmaceutycznego. Lokalizacja Rosetty w chmurze daje elastyczność użytkowania i mobilność. Każdy użytkownik ma własny serwer w prywatnej chmurze. Dzięki płatności pay-per-use płaci się tylko wtedy, gdy serwer jest używany. Jeśli nie jest, to nie ma regularnej opłaty.

Dla małych motywów RNA -> algorytm pozwalający na modelowanie pętli i motywów RNA. Używany szczególnie gdy dane z NMR są ograniczone. Dla dużych RNA -> FARFAR

Plik FASTA >3P49_RNA.pdb ggauaugaggagagauuucauuuuaaugaaacaccgaagaaguaaaucu uucagguaaaaaggacucauauuggacgaaccucuggagagcuuaucua agagauaacaccgaaggagcaaagcuaauuuuagccuaaacucucaggu aaaaggacggag Struktura drugorzędowa.((((((((...((((((...)))))).(((...((((...))))..)))...))))))))...(((((...((((((...)))))).(((... ((((...((((...))))...))))..)))...)))))

Wykorzystywane są dwa pliki FASTA: zawierający sekwencję badaną zawierający sekwencję bazową (szablon) oraz podajemy jeszcze nazwę pliku wyjściowego. Sekwencja szablonowa powinna być przycięta do rozmiarów sekwencji badanej. Można to zrobić ręcznie za pomocą albo wykorzystując skrypt pdbslice.py.

Większość operacji modelowania molekularnego Rosetta nie może zostać wykonana na laptopie, ponieważ najczęściej posiadają one za małe moce obliczeniowe. Jednakże te operacje mogą zostać wykonane przez klastery komputerów. Istnieje możliwość bezpłatnego użycia przydziałów dla obliczeń o wysokiej wydajności. Taką opcję udostępnia Extreme Discovery Science and Engineering Environment (XSEDE, https://www.xsede.org/home). Ważną zasadą efektywnego modelowania jest ograniczenie wydatków obliczeniowych dla znanych już regionów.

Uzyskane modele zapisywane są w skompresowanym formacie zwanym silent files (ze względów historycznych), np. helix0.out. Pliki te wykorzystywane są dale jako input do globalnego modelowania całego RNA.

Dla przebiegów FARNA najlepiej wygenerować około 10tys-15tys. modeli o niskiej rozdzielczości.

Modelowanie trójwymiarowe cząsteczek znacznie się poprawiło w ostatnich latach. Zawdzięczamy to wzrostowi mocy obliczeniowej komputerów oraz rozwojowi algorytmów przewidywania struktury drugo i trzeciorzędowej. Niestety jeszcze nie można przewidywać i projektować struktur RNA w dokładności atomowej. Jednakże ciągły rozwój tej dziedziny daje nadzieję na rozwiązanie tego.

Dziękuję za uwagę!