na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das

Podobne dokumenty
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

Bioinformatyka II Modelowanie struktury białek

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk

Bioinformatyka II Modelowanie struktury białek

Podstawy bioinformatyki - biologiczne bazy danych

Bioinformatyka wykład 10

Wzorcowe efekty kształcenia dla kierunku studiów biotechnologia studia pierwszego stopnia profil ogólnoakademicki

Bioinformatyka wykład 10.I.2008

Przewidywanie struktur białek

Informatyka w medycynie Punkt widzenia kardiologa

Tworzenie i obsługa wirtualnego laboratorium komputerowego

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.

Bioinformatyka Laboratorium, 30h. Michał Bereta

STUDIA I STOPNIA NA KIERUNKU ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE. specjalność Biofizyka molekularna

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Bioinformatyka wykład 8, 27.XI.2012

Bioinformatyka wykład 12, 18.I.2011 Białkowa bioinformatyka strukturalna c.d.

Przewodnik instalacji i rozpoczynania pracy. Dla DataPage+ 2013

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Biofizyka molekularna. 3-letnie studia I stopnia (licencjackie)

Bioinformatyka Laboratorium, 30h. Michał Bereta

Biotechnologia farmaceutyczna

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 3-letnie studia I stopnia (licencjackie)

Specjalność (studia II stopnia) Oczyszczanie i analiza produktów biotechnologicznych

Badanie długości czynników sieciujących metodami symulacji komputerowych

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

KARTA PRZEDMIOTU. (pieczęć wydziału)

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW

Część I. Uwaga: Akceptowane są wszystkie odpowiedzi merytorycznie poprawne i spełniające warunki zadania. Zadanie 1.1. (0 3)

Do zapisu danych w pliku PDB używa się znaków ASCII o graficznej reprezentacji czyli:

Wybrane techniki badania białek -proteomika funkcjonalna

3.1. Na dobry początek

Przedmiotowy System Oceniania z informatyki Oddziały gimnazjalne SP 3 w Gryfinie, klasy II.

Proporcje podziału godzin na poszczególne bloki. Tematyka lekcji. Rok I. Liczba godzin. Blok

Wybrane techniki badania białek -proteomika funkcjonalna

Bioinformatics for Science. Tomasz Puton

Windows Serwer 2008 R2. Moduł 8. Mechanizmy kopii zapasowych

PROGRAM NAUCZANIA DLA I I II KLASY GIMNAZJUM

Żwirki i Wigury 93, Warszawa TEL.: , FAX: , E- MAIL: Dr hab. Joanna T

Program studiów II stopnia dla studentów kierunku chemia od roku akademickiego 2015/16

i działanie urządzeń związanych równieŝ budowę i funkcje urządzeń

Jajko czy kura? czyli gdzie dwóch się bije, tam trzeci korzysta

Zakład Chemii Teoretycznej i Strukturalnej

Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW)

Nowoczesne systemy ekspresji genów

K.Pieńkosz Badania Operacyjne Wprowadzenie 1. Badania Operacyjne. dr inż. Krzysztof Pieńkosz

Biochemia Stosowana. Specjalność kierunku Biotechnologia Studia I stopnia

Kierunek: technik informatyk 312[01] Semestr: II Przedmiot: Urządzenia techniki komputerowej Nauczyciel: Mirosław Ruciński

Dostawa oprogramowania. Nr sprawy: ZP /15

BIOTECHNOLOGIA STUDIA I STOPNIA

etyloamina Aminy mają właściwości zasadowe i w roztworach kwaśnych tworzą jon alkinowy

Instrukcja konfiguracji funkcji skanowania

O systemach D-Sight Charakterystyka

Dopasowanie sekwencji (sequence alignment)

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

IPomorskie Spotkanie Użytkowników Systemu Siemens NX

Generator testów Bioinformatyka wer / 0 Strona: 1

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Szkolenie autoryzowane. MS 6419 Konfiguracja, zarządzanie i utrzymanie systemów Windows Server 2008

Wykład Nr Sieci bezprzewodowe 2. Monitorowanie sieci - polecenia

WYNALAZKI BIOTECHNOLOGICZNE W POLSCE. Ewa Waszkowska ekspert UPRP

Program studiów II stopnia dla studentów kierunku chemia od roku akademickiego 2016/2017. Semestr 1M

PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020. Nazwa modułu ECTS Semestr I Semestr II. Liczba godzin z.

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Przewodnik instalacji i rozpoczynania pracy. dla DataPage+ 2012

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Nowa usługa Centrum Komputerowego PŁ. Pliki w Chmurze. Serwis przechowywania i udostępniania danych. Prezentacja wprowadzająca

Pierwszy projekt. Na początku warto wspomnieć, że program WebSite X5 dostępy jest w 3 wariantach: Start, Evolution oraz Professional

SM-EX System Multipłatności - EX

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka Laboratorium, 30h. Michał Bereta

Opis zakładanych efektów kształcenia OPIS ZAKŁADANYCH EFEKTÓW KSZTAŁCENIA

4.1 Hierarchiczna budowa białek

PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH

IMP PAN. Zaplecze obliczeniowe Centrum Zaawansowanych Technologii AERONET. Dolina Lotnicza

Historia modeli programowania

Efekty kształcenia dla kierunku studiów CHEMIA studia pierwszego stopnia profil ogólnoakademicki

1 Implementowanie i konfigurowanie infrastruktury wdraŝania systemu Windows... 1

Projektowanie Wirtualne bloki tematyczne PW I

L.dz.: WETI /16/2014 Gdańsk, dn

II Wydział Lekarski z Oddziałem Anglojęzycznym Kierunek: BIOMEDYCYNA Poziom studiów: pierwszy stopień Profil: Praktyczny SEMESTR I

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych

Modelowanie białek ab initio / de novo

IBM SPSS Statistics Wersja 22. Linux - Instrukcja instalacji (licencja wielokrotna)

Doświadczenia firmy ze współpracy z instytucjami naukowymi w zakresie komercjalizacji badań

MINIMALNY ZAKRES PROGRAMU STAŻU

Selvita i BioCentrum laboratoria, które zachwycają

Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

Modelowanie białek ab initio / de novo

Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08

Systemy Informatyki Przemysłowej

Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II

Transkrypt:

na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das wykonała: Marta Szynczewska bioinformatyka Uniwersytet Jagielloński

Struktura I-rzędowa RNA: sekwencja nukleotydów Struktura II-rzędowa RNA: pojedyncza nić polinukleotydowa, pofałdowana, mogą tworzyć się odcinki dwuniciowe Struktura III-rzędowa RNA: przybieranie różnych konformacji w przestrzeni

Modelowanie komputerowe struktur RNA dynamicznie się rozwija. Znacząco poprawiły się umiejętności przewidywania i projektowania zarówno drugorzędowych jak i trzeciorzędowych struktur RNA. 1973 ulepszenie algorytmu przewidywania struktury drugorzędowej 2010 konformacje z punktacjami energii 2011 modelowanie motywów 2012 próby RNA Puzzles 2013 klasyfikacja motywów strukturalnych RNA

To bardzo duży pakiet oprogramowania służący do modelowania makromolekuł, głównie przewidywania struktur, projektowania lub remodelowania białej i kwasów nukleinowych. Zaimplementowany głównie w C++, Pythonie i innych językach. Nie jest to jeden monolityczny program. Wykorzystywana jest również do poznawania przyczyn powstawania chorób i leczenia ich oraz projektowania enzymów, szczepionek i leków. Modelowanie molekularne to proces oceniania i szeregowania struktur makrocząsteczek biologicznych.

Rosetta umożliwia modelowanie 100-300 nukleotydów RNA w rozdzielczości subhelikalnej. Jest to typowy zakres wielkości dla wielu ryboprzełączników (regulują ekspresję kodowanego przez siebie białka) oraz dla domen rybozymów. Rozdzielczość subhelikalna, choć wciąż ciężko osiągalna, jest użyteczna w prowadzeniu eksperymentów in vitro i in vivo do wykrywania częściowej struktury w ryboprzełącznikach bez ich ligandów oraz do ilustracji powiązań ewolucyjnych, które nie są oczywiste z sekwencją. Podstawowymi narzędziami są łańcuchy otrzymane z eksperymentów mapowania chemicznego.

Rozwój oprogramowania rozpoczął się w labolatorium dr Davida Bakera z Uniwersytetu Waszyngtonie. Początkowo miał służyć jako narzędzie do przewidywania struktury, ale z czasem został przystosowany do rozwiązywania typowych problemów obliczeniowych wielkocząsteczkowych. Aktualnie w rozwijaniu narzędzia biorą udział również członkowie RosettaCommons, do których należą laboratoria rządowe, instytuty, ośrodki badawcze i korporacje.

https://www.rosettacommons.org/

Informacje o licencji: Rosetta jest dostępna dla wszystkich użytkowników niekomercyjnych za darmo i dla użytkowników komercyjnych (instytucje, firmy) za opłatą. Pełną dokumentację Informacje jak zainstalować oprogramowanie Przewodnik jak posługiwać się narzędziami Forum użytkowników Rosetta Academy filmy edukacyjne Informacje o podobnych projektach

Wybór licencji

Zrozumienie interakcji międzycząsteczkowych Projektowanie niestandardowych cząsteczek Znalezienie powszechnie użytecznych funkcji energii dla różnych reprezentacji molekuł Opracowanie efektywnych sposobów odnajdywania budowy przestrzennej i konformacji

1. Wybór próbki o jak najwyższej rozdzielczości (lepszej niż 2Å). Im większa rozdzielczość tym łatwiejsza analiza wyników. 2. Wybór odpowiedniego protokołu Rosetta oraz opcji. 3. Poszukiwanie odpowiednio dużej mocy obliczeniowej, aby uzyskać wyniki. 4. Analiza wyników.

Istnieje kilka opcji użycia: Wiersz poleceń PyRosetta PyRosetta Toolkit (interfejs graficzny) RosettaScripts Serwery

Nazwa serwera ROSIE RosettaServer Robetta RosettaDesign RosettaBackrub RosettaDock FlexPepDock Funkcja Pełny zasób funkcji skierowany do użytkowników akademickich Do białek oraz modelowania de novo motywów RNA Przewidywanie struktury białek Projektowanie sekwencji białek Projektowanie szablonów Dokowanie białko-białko Dokowanie peptydów

http://rosie.rosettacommons.org/rna_denovo

Serwerem płatnym jest Rosetta@cloud. Mamy do dyspozycji niedrogie, umieszczone w chmurze narzędzia i usługi skierowane do przemysłu biotechnologicznego i farmaceutycznego. Lokalizacja Rosetty w chmurze daje elastyczność użytkowania i mobilność. Każdy użytkownik ma własny serwer w prywatnej chmurze. Dzięki płatności pay-per-use płaci się tylko wtedy, gdy serwer jest używany. Jeśli nie jest, to nie ma regularnej opłaty.

Dla małych motywów RNA -> algorytm pozwalający na modelowanie pętli i motywów RNA. Używany szczególnie gdy dane z NMR są ograniczone. Dla dużych RNA -> FARFAR

Plik FASTA >3P49_RNA.pdb ggauaugaggagagauuucauuuuaaugaaacaccgaagaaguaaaucu uucagguaaaaaggacucauauuggacgaaccucuggagagcuuaucua agagauaacaccgaaggagcaaagcuaauuuuagccuaaacucucaggu aaaaggacggag Struktura drugorzędowa.((((((((...((((((...)))))).(((...((((...))))..)))...))))))))...(((((...((((((...)))))).(((... ((((...((((...))))...))))..)))...)))))

Wykorzystywane są dwa pliki FASTA: zawierający sekwencję badaną zawierający sekwencję bazową (szablon) oraz podajemy jeszcze nazwę pliku wyjściowego. Sekwencja szablonowa powinna być przycięta do rozmiarów sekwencji badanej. Można to zrobić ręcznie za pomocą albo wykorzystując skrypt pdbslice.py.

Większość operacji modelowania molekularnego Rosetta nie może zostać wykonana na laptopie, ponieważ najczęściej posiadają one za małe moce obliczeniowe. Jednakże te operacje mogą zostać wykonane przez klastery komputerów. Istnieje możliwość bezpłatnego użycia przydziałów dla obliczeń o wysokiej wydajności. Taką opcję udostępnia Extreme Discovery Science and Engineering Environment (XSEDE, https://www.xsede.org/home). Ważną zasadą efektywnego modelowania jest ograniczenie wydatków obliczeniowych dla znanych już regionów.

Uzyskane modele zapisywane są w skompresowanym formacie zwanym silent files (ze względów historycznych), np. helix0.out. Pliki te wykorzystywane są dale jako input do globalnego modelowania całego RNA.

Dla przebiegów FARNA najlepiej wygenerować około 10tys-15tys. modeli o niskiej rozdzielczości.

Modelowanie trójwymiarowe cząsteczek znacznie się poprawiło w ostatnich latach. Zawdzięczamy to wzrostowi mocy obliczeniowej komputerów oraz rozwojowi algorytmów przewidywania struktury drugo i trzeciorzędowej. Niestety jeszcze nie można przewidywać i projektować struktur RNA w dokładności atomowej. Jednakże ciągły rozwój tej dziedziny daje nadzieję na rozwiązanie tego.

Dziękuję za uwagę!