Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1
Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa 2. Metody konstrukcji drzew filogenetycznych 3. Programy do budowy drzew filogenetycznych 2
Analiza filogenetyczna Molekularne podejście: Zadaniem filogenetyki molekularnej jest zrekonstruowanie związków filogenetycznych między badanymi sekwencjami. Podstawowe założenie w filogenetyce molekularnej: Sekwencje przodka mutują w sekwencje potomków, podobne gatunki są genetycznie blisko spokrewnione. 3
Podstawowe elementy drzewa 4
Ukorzenione drzewo z osią czasu 5
Topologia drzewa Istnieje wiele drzew, które mają taką samą topologię (sposób rozgałęzienia drzewa). Każda forma jest właściwa jeżeli zachowuje topologię. Należy wybrad najbardziej czytelną formę. 6
Ukorzenione drzewo Czasem znana jest kolejnośd specjacji, ale nie ich czas, wtedy długości gałęzi nie jest istotna. Przed czytaniem drzewa musimy wiedzied, czy długościom gałęzi nadano sens biologiczny czy nie. Gdy sekwencje ewoluują w różnym tempie, gałęzie C i D będą różnej długości. Najdłuższa gałąź wskazuje gatunek ewoluujący najszybciej. 7
Nieukorzenione drzewo Wewnętrzne węzły odpowiadają przodkom obecnych gatunków Największe zmiany zaszły między i oraz A Nie można stwierdzid, które z rozgałęzieo i czy j było pierwsze. 8
Nieukorzenione drzewo Nieukorzenione drzewo można ukorzenid, w punkcie B, korzeo umieszczono na gałęzi Bi, natomiast w punkcie C korzeo umieszczono na gałęzi ij. Jak to zrobid? 9
Jako ukorzenid drzewo? Przekształcenie drzewa nieukorzenionego w ukorzenione możemy dokonad poprzez: Określenie grupy zewnętrzenej Np. Torbacze dla ssaków łożyskowych Metodę punktu środkowego Umieszczenie korzenia w środku najdłuższej gałęzi drzewa nieukorzenionego 10
Określenie grupy zewnętrzenej Należy ustalid grupę zewnętrzną, czyli gatunek, który jako pierwszy oddzielił się od pozostałych. Grupę zewnętrzną ustalamy na podstawie analizy skamielin i wcześniejszych badao filogenetycznych Torbacze- przykład grupy zewnętrznej (najbardziej oddalone w grupie ssaków). 11
Metoda punktu środkowego Metode stosujemy, gdy nie znamy grupy zewnętrznej Punkt środkowy jest pośrodku między dwoma najdłuższymi gałęziami 12
Budowa drzewa Klad (=grupa monofiletyczna) to grupa wszystkich gatunków wywodzących się od wspólnego przodka Kladem jest C i D Kladem jest B C D Kladem nie jest B C (brakuje D) 13
Wybór sekwencji 14
Metody konstrukcji drzew Metody odległościowe: Oparte na odległościach pomiędzy sekwencjami Konwertowanie znaków na odległości ewolucyjne Metody oparte na znakach: Oparte bezpośrednio na znakach sekwencji Zliczanie mutacji zgromadzonych w sekwencjach 15
Metody konstrukcji drzew Metody odległościowe: Metoda średnich połączeo (Unweighted pair group method with arithemtic mean, UPGMA) Metoda przyłączania sąsiadów (Neighbor- joining, NJ) Metody oparte na znakach: Metoda parsymonii (Parsimony) Metoda największej wiarygodności (Maximum likelihood) 16
Hipoteza zegara molekularnego Koncepcja zegara molekularnego (Zuckerlandl i Pauling, 1965) jest to metoda pozwalająca oszacować kolejność i czas oddzielania się różnych linii ewolucyjnych na podstawie liczby mutacji nagromadzonych u poszczególnych współczesnych form. Według hipotezy zegara molekularnego istnieje statystyczna proporcjonalność pomiędzy czasem, który upłynął od ostatniego wspólnego przodka dwóch homologicznych łańcuchów białek, a liczbą aminokwasów różniących się pomiędzy ich sekwencjami. 17
Wyznaczenie odległości ewolucyjnych Model Jukesa-Cantora - to najprostszy model ewolucyjny Założenia: 1. Każdy z nukleotydów występuje z jednakową częstością 2. Tempo podstawieo każdego nukleotydu na dowolny inny jest zawsze takie samo d = -0,75 ln( 1-4D / 3 ) d- Odległośd ewolucyjna Jukesa-Cantora D- Odsetek pozycji, w których występują różnice w dopasowaniu dwóch sekwencji 18
Wyznaczenie odległości ewolucyjnych Macierz odległości Junksa-Cantora dla wybranych sekwencji rrna 19
Algorytm analizy skupisk 1. Połącz najbliższe dwa skupiska w jedno większa skupisko 2. Oblicz odległości między wszystkimi skupiskami 3. Powtarzaj poprzednie kroki dopóki wszystkie gatunki nie zostaną połączone w jedno skupisko 20
Metoda średnich połączeo Hipoteza zegara molekularnego (ewolucja wszystkich gatunków zachodzi w tym samym tempie) Wysokośd drzewa to połowa średniej odległości pomiędzy sekwencjami z dwóch skupisk łączonych jako ostatnie Najprostsza metoda Odległośd między skupiskami liczona jest jako średnia z odległości każdej możliwej pary sekwencji Bezpośrednio tworzy korzeo (połączenie dwóch ostatnich skupisk) 21
Metoda średnich połączeo Odległośd do korzenia, średnia odległośd między małpami Starego Świata i małpami człekokształtnymi 22
Metoda przyłączania sąsiadów 1. Początkowe drzewo ma postad w pełni politomicznej gwiazdy. 2. Losowo wybierana jest para sekwencji i łączona gałęzią z centrum gwiazdy. Liczona jest całkowita długośd gałęzi drzewa. Para jest zwracana do gwiazdy. 3. Powtarzane jest to ze wszystkimi możliwymi kombinacjami par, aż do znalezienia drzewa o najmniejszej całkowitej długości gałęzi. Para sekwencji z tego drzewa sąsiaduje ze sobą w finalnym drzewie. 23
Metoda przyłączania sąsiadów 4. Para ta jest tymczasowo włączana do gwiazdy, która jest krótsza o jedną gałąź i matryca dystansów liczona jest na nowo. 5. Procedura jest powtarzana tak długo, aż wszyscy sąsiedzi zostaną znalezieni i otrzymamy gotowe drzewo 24
Metoda przyłączania sąsiadów 25
Metoda przyłączania sąsiadów 26
MEGA6 27
MEGA6 28
Bibliografia 1. Hall G.B. 2008. Łatwe drzewa filogenetyczne. Poradnik użytkownika. Wydawnictwa Uniwersytetu Warszawskiego. Warszawa 2. Higgs P., Attwood T. K. 2011. Bioinformatyka i ewolucja molekularna. Wydawnictwo Naukowe PWN. Warszawa 3. Xiong J. 2006. Podstawy bioinformatyki. Wydawnictwa Uniwersytetu Warszawskiego. Warszawa 4. Rogalla D., Rogalla M. 2007. Konstrukcja drzew filogenetycznych podstawy teoretyczne 29
Dziękuję za uwagę! 30