Dopasowanie sekwencji (sequence alignment)

Podobne dokumenty
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Bioinformatyka Laboratorium, 30h. Michał Bereta

PRZYRÓWNANIE SEKWENCJI

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji

dopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Dopasowania par sekwencji DNA

Wstęp do Biologii Obliczeniowej

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Acknowledgement. Drzewa filogenetyczne

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Przyrównywanie sekwencji

Podstawy bioinformatyki dla biotechnologów

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl

Bioinformatyka. Porównywanie sekwencji

Generator testów Bioinformatyka wer / 0 Strona: 1

Homologia, podobieństwo i analogia

Dopasowanie par sekwencji

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Zmienność ewolucyjna. Ewolucja molekularna

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

Porównywanie sekwencji białkowych

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

Analizy filogenetyczne

Motywy i podobieństwo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Bioinformatyka Laboratorium, 30h. Michał Bereta

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Ewolucja informacji genetycznej

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Bioinformatyka Laboratorium, 30h. Michał Bereta

Wykład 5 Dopasowywanie lokalne

3 Przeszukiwanie baz danych

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

MSA i analizy filogenetyczne

Spis treści 8 Ewolucja molekularna Ewolucyjne podstawy porównywania sekwencji Identyfikacja sekwencji i jej funkcji...

Mutacje jako źródło różnorodności wewnątrzgatunkowej

Księgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

Metoda dokładnej rekonstrukcji drzew filogenetycznych genów. współczynników substytucji dla genów i gatunków

Statystyczna analiza danych

Bioinformatyka II Modelowanie struktury białek

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

Ewolucja informacji genetycznej

Zmienność ewolucyjna. Ewolucja molekularna

D: Dopasowanie sekwencji. Programowanie dynamiczne

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

Generator testów bioinformatyka wer / Strona: 1

W kierunku równoległej implementacji pakietu T-Coffee

Podstawy biologii. Informacja, struktura i metabolizm.

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Filogenetyka molekularna I. Krzysztof Spalik

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee

Zmienność ewolucyjna. Ewolucja molekularna

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Filogenetyka molekularna I

Powstanie i ewolucja informacji genetycznej

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Ślady wspólnego pochodzenia

Samouczek: Konstruujemy drzewo

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Algorytmika dla bioinformatyki

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność

Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej

Powstanie i ewolucja informacji genetycznej

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Badanie doboru naturalnego na poziomie molekularnym

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online

Algorytmy kombinatoryczne w bioinformatyce

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

Bioinformatyka Laboratorium, 30h. Michał Bereta

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

Grafy i sieci wybrane zagadnienia wykład 3: modele służące porównywaniu sieci

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

Bioinformatyka II Modelowanie struktury białek

Bioinformatyczne bazy danych

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ROZPORZĄDZENIE KOMISJI (UE) / z dnia r.

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Teoria ewolucji. Podstawy wspólne pochodzenie.

Transkrypt:

Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa; wynik dopasowania w konsekwencji może pokazać relacje między sekwencjami na poziomie strukturalnym, funkcjonalnym i ewolucyjnym. Podobieństwo wielkość obserwowalna, wyrażona w procencie identyczności Homologia wniosek wyciągnięty na podstawie podobieństwa dotyczący wspólnego pochodzenia porównywalnych sekwencji; homologia jest lub jej nie ma; podobieństwo ze względu na wspólnego przodka (dywergencja) homoplazja podobieństwo ze względu na konwergencję Dywergencja rozwoju - w rozwoju ewolucyjnym różnokierunkowe kształtowanie się narządu lub postaci osobników jakiegoś szczepu, wskutek działania odmiennych warunków środowiskowych; np. dywergencja rozwoju kończyn ssaków. Konwergencja (łac. convergere, zbierać się, upodabniać się) - w biologii, proces powstawania morfologicznie i funkcjonalnie podobnych cech (czyli analogicznych) w grupach organizmów odlegle spokrewnionych (niezależnie w różnych liniach ewolucyjnych), odrębnych dla tych grup cech pierwotnych, w odpowiedzi na podobne lub takie same wymagania środowiskowe, np. podobny typ pokarmu, wymagania lokomocyjne

Homologi: ortologi -różne gatunki, taka sama funkcja (specjacja) paralogi-podobna funkcja, ale ewoluowały niezależnie (duplikacja,ten sam organizm) analogi- różne sekwencje, różne motywy, ale identyczna orientacja ważnych aminokwasów Paralogi a ortologi Duplikacje paralogiczne są źródłem nowych genów i nowych funkcji, ale często działających na podobnej zasadzie Np. poszukiwanie nowych enzymów o funkcji zbliżonej do już znanych Geny ortologiczne z reguły (choć nie zawsze) zachowują funkcję organizmy modelowe wnioskowanie o funkcji genów na podstawie badań nad innymi organizmami np myszy, a nawet drożdże jako modele do badania chorób człowieka Homologia nie zawsze podobne funkcje Podobieństwo Sekwencje nukleotydowe Zawartość identycznych pozycji między dwoma sekwencjami - % identyczności Długość porównywanych sekwencji Czy identyczne pozycje są zgrupowane, czy też rozproszone w alignmencie Sekwencje białkowe Wszystkie powyższe, plus: Podobieństwo pod względem właściwości fizykochemicznych lub kodonów, którymi są kodowane Reszty na konserwatywnych pozycjach przewidzianych domenach, miejscach katalitycznych.

Mutacje różnice między sekwencjami świadczą o mutacjach, które zaszły po rozdzieleniu się sekwencji od wspólnego przodka Insercja +TAC Delecja -CA AGA--TTGATACCCA AGACATTAA---CTA AGA--TTGATACCCA AGACATTAA---CTA G->A C->T substytucje TAC AGACATTGACCA Sekwencje są identyczne nic nowego. Sekwencja jest podobna (ma krewnych ) nowy członek znanej rodziny Sekwencja ma kilka podobnych regionów, motywów lub domen można zaproponować funkcję Nie ma znaczącego podobieństwa dużo pracy, trzeba eksperymentalnie dowieść funkcji. Bardzo krótkie lub bardzo podobne sekwencje mogą być dopasowane ręcznie. Bardzo często jednak konieczne jest dopasowanie licznych, bardzo długich i zmiennych sekwencji, które nie mogą być dopasowane tylko i wyłącznie ludzkim wysiłkiem. Zamiast tego, wysiłek wkładany jest w opracowanie algorytmów umożliwiające wysokiej jakości dopasowania, ewentualnie wprowadzanie poprawek do uzyskanych w ten sposób rezultatów,(szczególnie w przypadku sekwencji nukleotydowych).

Metody dopasowania Metody dot-matrix dopasowanie par sekwencji (pairwise alignment) Macierz punktowe - dot matrix, dotplot Programowanie dynamiczne (DP) Metody słów (k - tuple methods) - szybkie metody stosowane przy przeszukiwaniu baz danych sekwencji z wykorzystaniem programów FASTA i BLAST dopasowanie wielu sekwencji (multiple alignment) Multiple sequence alignment Metody dopasowania Pairwise alignment ścisłe rozwiązanie możliwe ATTCAGCTCCATGC ATTCGGCTACA-GC MSA - multiple sequence alingment ATTCAGCT-CCATGC ATTCGGCT-CCA-GC TTTGAGCTTCCATGC

Dopasowanie globalne a lokalne Dopasowanie globalne a lokalne Dopasowania globalne, obejmujące pełny zakres wszystkich sekwencji, są najbardziej użyteczne, gdy zestawiane sekwencje są podobne i o zbliżonych rozmiarach. Ogólna technika dopasowania globalnego jest znana jako algorytm Needlemana-Wunscha i jest oparta na programowaniu dynamicznym. Dopasowania lokalne są bardziej przydatne dla sekwencji nie wykazujących w całości większego podobieństwa, co do których istnieje przypuszczenie, że zawierają podobne subsekwencje czy motywy.algorytm Smitha-Watermana jest ogólną techniką dopasowania lokalnego, opartą na programowaniu dynamicznym. Zastosowanie alignmentu poszukiwaniu oraz określaniu funkcji i struktury (białek) dla nowych sekwencji (nieznanych nam do tej pory) określaniu powiązań filogenetycznych między sekwencjami - homologii między sekwencjami oraz w analizach ewolucyjnych KONIEC