Filogenetyka molekularna Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji
Co to jest filogeneza? Filogeneza=drzewo filogenetyczne=drzewo rodowe=drzewo to rozgałęziający się diagram, który odzwierciedla pokrewieństwoewolucyjne pomiędzytaksonami Takson to grupa taksonomiczna, np: rodzina (Felidae) rodzaj (Felis) gatunek (Felis catus) osobnik ( Mania )
Jak wygląda drzewo filogenetyczne?
Po co nam drzewa (filogenetyczne)? Aby stworzyć hierarchiczny system klasyfikacji organizmów czyli ich katalog, umożliwiający dostęp do zgromadzonej wiedzy o nich Aby badać przebieg ewolucji, np. dokonywać rekonstrukcji zmian cech w czasie Nothing makes sense in biology if not in the light of evolution T. Dobzhansky
Rekonstrukcja filogenezy O filogenezie wnioskujemy w oparciu o cechy homologiczne the same organ in different animals under every variety of form and function R. Owen Cechę występującą u dwóch gatunków uznaje się za homologiczną jeżeli występowała u ich wspólnego przodka.
Rekonstrukcja filogenezy O filogenezie wnioskujemy w oparciu o cechy homologiczne Dwie sekwencje są homologiczne jeśli mają wspólne pochodzenie
Rekonstrukcja filogenezy podobieństwo a pokrewieństwo Podobieństwa nieświadczące o wspólnym pochodzeniu to homoplazje. Utrudniają one odtworzenie rzeczywistej filogenezy organizmów.
Jak czytać drzewo? Taksony (np. gatunki) Wymarła gałąź Węzeł zewnętrzny Gałąź (linia filogenetyczna) Węzły wewnętrzne (wspólni przodkowie) Korzeń drzewa 8
Mono-, para- i polifiletyzm Grupa jest Monofiletyczna: jeśli pochodzi od jednego przodka i obejmuje wszystkich jego potomków. Wszystkie ptaki I gady pochodzą od wspólnego przodka. Parafiletyczna: jeśli pochodzi od jednego przodka, ale nie obejmuje wszystkich jego potomków. współczesne gady" to grupa zawierająca ich wspólnego przodka, ale nie zawiera wszystkich potomkówtego przodka (ptaki są wykluczane z tej grupy). Polifiletyczna: jeśli włącza organizmy pochodzące od różnych przodków. Grupa taka jak organizmystałocieplne zawiera wyłącznie ptaki i ssaki, ale nie zawiera ich wspólnego przodka.
Drzewa można obracać wokół węzłów i niezmienia to filogenezy
Drzewa ukorzenione vs nieukorzenione Tylko drzewa ukorzenione informują o kierunku ewolucji
Politomia w pełni rozwikłana częściowo rozwikłana politomia drzewo gwiaździste Politomia - termin określający węzeł na kladogramie, z którego wychodzą co najmniej trzy linie ewolucyjne, stanowiące grupy siostrzane. Węzeł z którego wychodzą jedynie dwaj bezpośredni potomkowie jest określany jako dychotomia, czyli politomia rozwikłana.
Sposoby zapisywania drzew: format Newick Format Newick często wykorzystywany jest przez programy komputerowe
Sposoby przedstawiania drzew drzewa ukorzenione drzewo nieukorzenione kladogram filogram nieukorzenione drzewo
Topologia Topologia opisuje strukturę drzewa, co odzwierciedla pokrewieństwo. Taksony połączone wspólnym węzłem są najbliżej spokrewnione (tzw. grupy siostrzane) Te drzewa mają taką samą topologię A B C B A C C B A Te drzewa mają różne topologie A B C C A B A B C
Q1 Czy te topologie są takie same? TAK
Długość gałęzi 1.2 0.6 0.8 0.5 0.5 0.5 0.5 Dwa sposoby przedstawiania filogenezy wraz z długością gałęzi
Pierwsze drzewo filogenetyczne (Darwin)
Drzewo życia Haeckla i współczesne 19
Jeszcze inne drzewo gatunków
I kolejne
Q2 Które z drzew ma taką samą TOPOLOGIĘ i KORZEŃ jak drzewo A?
Rekonstrukcja filogenezy Filogeneza może bazować na danych morfologicznych i molekularnych Współczesnie filogeneza jest głównie odtwarzana na podstawie danych molekularnych z wykorzystaniem metod statystycznych i modeli ewolucji sekwencji Homologiczne sekwencje muszą zostać przyrównane (ang. alignment), jakość przyrównania wpływa na jakość drzewa przyrównanie: mafft przycinanie: trimal
Metody szacowania filogenezy 1. Metoda największej parsymonii (Maximum parsimony, MP) 2. Metody odległościowe, np. łączenia sąsiadów (Neighbor-joining, NJ) 3. Metoda największej wiarygodności (Maximum likelihood, ML) 4. Metoda bayesowska (Bayesian inference, BA, BI)
Metoda największej parsymonii Najbardziej prawdopodobne jest takie zdarzenie ewolucyjne, które wymaga najmniejszej liczby zmian. Drzewo nie jest obliczane sprawdzana i porównywana jest długość wszystkich możliwych drzew (lub najbardziej obiecujących) Poszukujemy drzewa, które wyjaśniałoby zróżnicowanie badanych sekwencji za pomocą najmniejszej liczbymutacji najkrótsze drzewo PAUP
4 cechy, 6 kroków
Metody odległościowe Obliczane jest drzewo na podstawie macierzyodległości pomiędzy wszystkimi sekwencjami w analizie 1. Obliczenie macierzyodległości 2. Obliczane jest drzewo na podstawie uzyskanej macierzy odległości (np. UPGMA, Neighbour-Joining) B C Zakładamy model ewolucji MEGA
Modele substytucji
Metoda największej wiarygodności W analizie największej wiarygodności poszukujesię drzewa, dla którego najbardziej prawdopodobne jest uzyskanie obserwowanego rozkładu cech (nukleotydów lub aminokwasów w sekwencjach), przy założonym modelu substytucji (parametry są określone) drzewo nie jest obliczane sprawdzane i porównywane jest prawdopodobieństwo wszystkich możliwych drzew (lub najbardziej obiecujących) RAxML
Analiza bayesowska W analizie bayesowskiej poszukuje się wielu najbardziej prawdopodobnych drzew dających obserwowany rozkład cech przy założonym modelu substytucji (parametry nie są określone) drzewa nie są obliczne przeszukiwana jest przestrzeń najbardziej prawdopodobnych drzew (przy pomocy łańcuchów markowa monte carlo), a odwiedzone drzewa są z pewną częstotliwością zapisywane ostatecznie wybrane drzewo jest drzewem konsensusowym obliczonym na podstawie najbardziej prawdopodobnych drzew MrBayes
Q3 Zinterpretuj drzewo Które zdanie jest prawdziwe? A) Mysz jest bliżej spokrewniona z rybą niż żaba z rybą B) Jaszczurka jest bliżej spokrewniona z rybą niż ryba z myszą C) Człowiek i żaba są w równym stopniu spokrewnione z rybą
Jak dobre jest drzewo? Drzewo to zestaw hipotez, ta więc dla każdej gałęzi drzewa możemy oszacować jej wsparcie Najczęstsze metody: Bootstrap Prawdopodobieństwo a posteriori Approximate likelihood ratio test (alrt) 85 100 0.99 63 0.81 0.93
Q4 Która wartość bootstrap świadczy o wsparciu dla monofiletycznej grupy A, B, C, D. Co myślisz o tej wartości, czy możemy uznać, że ta grupa jest monofiletyczna? 63 91 100 A B C 84 D E F
Filogenetyka i koewolucja Lustrzane filogenezywskazują nakoewolucję układu pasożyt-żywiciel Jiggins web page: http://www.gen.cam.ac.uk/research/jiggins/research.html
Filogeografia
Zasiedlanie wysp przez rodzaj Psychotria
Ewolucja żubra Soubrier et al. 2016
Zegar molekularny Hipoteza zegara molekularnego została zaproponowana w 1962 roku przez Zuckerkandla i Paulinga. Zaobserwowali oni, że tempo substytucji aminokwasów w sekwencji hemoglobiny u zwierząt jest proporcjonalne do czasu dywergencji oszacowanego na podstawie skamieniałości.
Ograniczenia zegara molekularnego Tempo w jakim ewoluuje dana sekwencja nie musi być stałe na przestrzeni czas, np. mutacje mogą zachodzić gwałtownie u nowo powstałych gatunków, natomiast z czasem tempo zmian w genomach spada Nawet mała różnica w tempie ewolucji w dużej skali czasowej może mieć ogromny wpływa na oszacowany czas zajścia danegozdarzenia ewolucyjnego BEAST2
Kalibracja drzew filogenetycznych
Ewolucja dzieje się teraz! Wiele wirusów, takich jak HIV, wirus grypy, czy wirus zapalenia wątroby, ewoluuje bardzo szybko, na tyle szybko, że w sekwencji wirusów pobranych w różnym czasie można znaleźć różnice. Czas pobrania próbek wykorzystano do wydatowania drzewa. Drummond et al. 2002
Pochodzenie i ekspansja wirusa HIV Gilbert et al. 2007
Niedawna ewolucja pingwinów Gavryushkina et al. 2016
Przedziały ufności dla oszacowanego czasu rozejścia się linii ewolucyjnych Gavryushkina et al. 2016
Chcesz wiedzieć więcej odwiedź nas w Zakładzie Filogenetyki Molekularnej i Ewolucji Centrum Nauk Biologiczno-Chemicznych IV piętro http://biol.uw.edu.pl/zfme Anna Karnkowska p. 4.146 ankarn@biol.uw.edu.pl @ania_karnkowska Zapraszamy na fakultet Filogenetyka w semestrze letnim Podziękowania za użyczenie fragementów prezentacji i inspirację: Alexei Drummond Rafał Milanowski Walter Salzburger Krzysztof Spalik