Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Podobne dokumenty
Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Bioinformatyka Laboratorium, 30h. Michał Bereta

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

Bioinformatyka Laboratorium, 30h. Michał Bereta

Filogenetyka molekularna I. Krzysztof Spalik

Bioinformatyka Laboratorium, 30h. Michał Bereta

klasyfikacja fenetyczna (numeryczna)

Analizy filogenetyczne

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Filogenetyka molekularna I

Drzewa filogenetyczne jako matematyczny model relacji pokrewieństwa. dr inż. Damian Bogdanowicz

Bioinformatyka Laboratorium, 30h. Michał Bereta

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Acknowledgement. Drzewa filogenetyczne

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Bioinformatyka Laboratorium, 30h. Michał Bereta

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Konstrukcja drzew filogenetycznych podstawy teoretyczne.

Porównywanie i dopasowywanie sekwencji

ALGORYTMY KONSTRUOWANIA DENDROGRAMÓW STOSOWANYCH PRZY ANALIZIE FILOGENETYCZNEJ MIKROORGANIZMÓW

Bioinformatyka Laboratorium, 30h. Michał Bereta

Teoria ewolucji. Podstawy wspólne pochodzenie.

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

Filogenetyka. Dr inż. Magdalena Święcicka, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

MSA i analizy filogenetyczne

Porównywanie i dopasowywanie sekwencji

46 Olimpiada Biologiczna

Wyróżniamy dwa typy zadań projektowych.

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Mitochondrialna Ewa;

Wstęp do Biologii Obliczeniowej

Filogenetyka. Dr Marek D. Koter, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka

FILOGENETYKA. Bioinformatyka, wykład. 8 c.d. 0)

PRZYRÓWNANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI

ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺady nr. 12 i 13; 25 stycznia 2006) 8 Konstrukcja drzew filogenetycznych

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Bioinformatyka Laboratorium, 30h. Michał Bereta

Dopasowanie sekwencji (sequence alignment)

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

FILOGENETYKA. Bioinformatyka, wykład 7 (24.XI.200..XI.2008)

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Filogenetyka i taksonomia roślin i zwierząt dla EKOP

Podstawy teorii ewolucji. Informacja i ewolucja

KARTA PRZEDMIOTU. (pieczęć wydziału)

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Hierarchiczna analiza skupień

Krzysztof Spalik 1, Marcin Piwczyński 2

Ewolucjonizm NEODARWINIZM. Dr Jacek Francikowski Uniwersyteckie Towarzystwo Naukowe Uniwersytet Śląski w Katowicach

Badanie doboru naturalnego na poziomie molekularnym

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

MODELE SIECIOWE 1. Drzewo rozpinające 2. Najkrótsza droga 3. Zagadnienie maksymalnego przepływu źródłem ujściem

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

ZASADY PRZYZNAWANIA STYPENDIÓW ZA WYNIKI W NAUCE NA WYDZIALE BIOTECHNOLOGII UNIWERSYTETU WROCŁAWSKIEGO

Recenzja rozprawy doktorskiej. mgr Marcina Jana Kamińskiego. pt. Grupa rodzajowa Ectateus (Coleoptera: Tenebrionidae) filogeneza i klasyfikacja.

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

46 Olimpiada Biologiczna

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Definicja sieci. Sieć Petriego jest czwórką C = ( P, T, I, O ), gdzie: P = { p 1, p 2,, p n } T = { t 1, t 2,, t m }

Testy nieparametryczne

Zmienność ewolucyjna. Ewolucja molekularna

TEORIA GRAFÓW I SIECI

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Algorytmy wyznaczania centralności w sieci Szymon Szylko

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

Sortowanie. Bartman Jacek Algorytmy i struktury

Podstawy biologii. Podstawy biologii molekularnej

Matematyczne Podstawy Informatyki

Metoda dokładnej rekonstrukcji drzew filogenetycznych genów. współczynników substytucji dla genów i gatunków

Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.

Stochastyczne dynamiki z opóźnieniami czasowymi w grach ewolucyjnych

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

CLUSTERING. Metody grupowania danych

Algorytmy i struktury danych

Algorytmy i struktury danych

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA. Biomatematyka Dr Wioleta Drobik-Czwarno

Generator testów Bioinformatyka wer / 0 Strona: 1

Grafy Alberta-Barabasiego

Ewolucja człowieka. Ostatnie 5 milionów lat

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Ograniczenia środowiskowe nie budzą wielu kontrowersji, co nie znaczy że rozumiemy do końca proces powstawania adaptacji fizjologicznych.

Metody optymalizacji dyskretnej w analizie podobieństwa drzew filogenetycznych

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.

Transkrypt:

Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1

Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa 2. Metody konstrukcji drzew filogenetycznych 3. Programy do budowy drzew filogenetycznych 2

Analiza filogenetyczna Molekularne podejście: Zadaniem filogenetyki molekularnej jest zrekonstruowanie związków filogenetycznych między badanymi sekwencjami. Podstawowe założenie w filogenetyce molekularnej: Sekwencje przodka mutują w sekwencje potomków, podobne gatunki są genetycznie blisko spokrewnione. 3

Podstawowe elementy drzewa 4

Ukorzenione drzewo z osią czasu 5

Topologia drzewa Istnieje wiele drzew, które mają taką samą topologię (sposób rozgałęzienia drzewa). Każda forma jest właściwa jeżeli zachowuje topologię. Należy wybrad najbardziej czytelną formę. 6

Ukorzenione drzewo Czasem znana jest kolejnośd specjacji, ale nie ich czas, wtedy długości gałęzi nie jest istotna. Przed czytaniem drzewa musimy wiedzied, czy długościom gałęzi nadano sens biologiczny czy nie. Gdy sekwencje ewoluują w różnym tempie, gałęzie C i D będą różnej długości. Najdłuższa gałąź wskazuje gatunek ewoluujący najszybciej. 7

Nieukorzenione drzewo Wewnętrzne węzły odpowiadają przodkom obecnych gatunków Największe zmiany zaszły między i oraz A Nie można stwierdzid, które z rozgałęzieo i czy j było pierwsze. 8

Nieukorzenione drzewo Nieukorzenione drzewo można ukorzenid, w punkcie B, korzeo umieszczono na gałęzi Bi, natomiast w punkcie C korzeo umieszczono na gałęzi ij. Jak to zrobid? 9

Jako ukorzenid drzewo? Przekształcenie drzewa nieukorzenionego w ukorzenione możemy dokonad poprzez: Określenie grupy zewnętrzenej Np. Torbacze dla ssaków łożyskowych Metodę punktu środkowego Umieszczenie korzenia w środku najdłuższej gałęzi drzewa nieukorzenionego 10

Określenie grupy zewnętrzenej Należy ustalid grupę zewnętrzną, czyli gatunek, który jako pierwszy oddzielił się od pozostałych. Grupę zewnętrzną ustalamy na podstawie analizy skamielin i wcześniejszych badao filogenetycznych Torbacze- przykład grupy zewnętrznej (najbardziej oddalone w grupie ssaków). 11

Metoda punktu środkowego Metode stosujemy, gdy nie znamy grupy zewnętrznej Punkt środkowy jest pośrodku między dwoma najdłuższymi gałęziami 12

Budowa drzewa Klad (=grupa monofiletyczna) to grupa wszystkich gatunków wywodzących się od wspólnego przodka Kladem jest C i D Kladem jest B C D Kladem nie jest B C (brakuje D) 13

Wybór sekwencji 14

Metody konstrukcji drzew Metody odległościowe: Oparte na odległościach pomiędzy sekwencjami Konwertowanie znaków na odległości ewolucyjne Metody oparte na znakach: Oparte bezpośrednio na znakach sekwencji Zliczanie mutacji zgromadzonych w sekwencjach 15

Metody konstrukcji drzew Metody odległościowe: Metoda średnich połączeo (Unweighted pair group method with arithemtic mean, UPGMA) Metoda przyłączania sąsiadów (Neighbor- joining, NJ) Metody oparte na znakach: Metoda parsymonii (Parsimony) Metoda największej wiarygodności (Maximum likelihood) 16

Hipoteza zegara molekularnego Koncepcja zegara molekularnego (Zuckerlandl i Pauling, 1965) jest to metoda pozwalająca oszacować kolejność i czas oddzielania się różnych linii ewolucyjnych na podstawie liczby mutacji nagromadzonych u poszczególnych współczesnych form. Według hipotezy zegara molekularnego istnieje statystyczna proporcjonalność pomiędzy czasem, który upłynął od ostatniego wspólnego przodka dwóch homologicznych łańcuchów białek, a liczbą aminokwasów różniących się pomiędzy ich sekwencjami. 17

Wyznaczenie odległości ewolucyjnych Model Jukesa-Cantora - to najprostszy model ewolucyjny Założenia: 1. Każdy z nukleotydów występuje z jednakową częstością 2. Tempo podstawieo każdego nukleotydu na dowolny inny jest zawsze takie samo d = -0,75 ln( 1-4D / 3 ) d- Odległośd ewolucyjna Jukesa-Cantora D- Odsetek pozycji, w których występują różnice w dopasowaniu dwóch sekwencji 18

Wyznaczenie odległości ewolucyjnych Macierz odległości Junksa-Cantora dla wybranych sekwencji rrna 19

Algorytm analizy skupisk 1. Połącz najbliższe dwa skupiska w jedno większa skupisko 2. Oblicz odległości między wszystkimi skupiskami 3. Powtarzaj poprzednie kroki dopóki wszystkie gatunki nie zostaną połączone w jedno skupisko 20

Metoda średnich połączeo Hipoteza zegara molekularnego (ewolucja wszystkich gatunków zachodzi w tym samym tempie) Wysokośd drzewa to połowa średniej odległości pomiędzy sekwencjami z dwóch skupisk łączonych jako ostatnie Najprostsza metoda Odległośd między skupiskami liczona jest jako średnia z odległości każdej możliwej pary sekwencji Bezpośrednio tworzy korzeo (połączenie dwóch ostatnich skupisk) 21

Metoda średnich połączeo Odległośd do korzenia, średnia odległośd między małpami Starego Świata i małpami człekokształtnymi 22

Metoda przyłączania sąsiadów 1. Początkowe drzewo ma postad w pełni politomicznej gwiazdy. 2. Losowo wybierana jest para sekwencji i łączona gałęzią z centrum gwiazdy. Liczona jest całkowita długośd gałęzi drzewa. Para jest zwracana do gwiazdy. 3. Powtarzane jest to ze wszystkimi możliwymi kombinacjami par, aż do znalezienia drzewa o najmniejszej całkowitej długości gałęzi. Para sekwencji z tego drzewa sąsiaduje ze sobą w finalnym drzewie. 23

Metoda przyłączania sąsiadów 4. Para ta jest tymczasowo włączana do gwiazdy, która jest krótsza o jedną gałąź i matryca dystansów liczona jest na nowo. 5. Procedura jest powtarzana tak długo, aż wszyscy sąsiedzi zostaną znalezieni i otrzymamy gotowe drzewo 24

Metoda przyłączania sąsiadów 25

Metoda przyłączania sąsiadów 26

MEGA6 27

MEGA6 28

Bibliografia 1. Hall G.B. 2008. Łatwe drzewa filogenetyczne. Poradnik użytkownika. Wydawnictwa Uniwersytetu Warszawskiego. Warszawa 2. Higgs P., Attwood T. K. 2011. Bioinformatyka i ewolucja molekularna. Wydawnictwo Naukowe PWN. Warszawa 3. Xiong J. 2006. Podstawy bioinformatyki. Wydawnictwa Uniwersytetu Warszawskiego. Warszawa 4. Rogalla D., Rogalla M. 2007. Konstrukcja drzew filogenetycznych podstawy teoretyczne 29

Dziękuję za uwagę! 30