Acknowledgement. Drzewa filogenetyczne

Podobne dokumenty
Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Bioinformatyka Laboratorium, 30h. Michał Bereta

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Dopasowanie sekwencji (sequence alignment)

Bioinformatyka Laboratorium, 30h. Michał Bereta

klasyfikacja fenetyczna (numeryczna)

Analizy filogenetyczne

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

Porównywanie i dopasowywanie sekwencji

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

Zmienność ewolucyjna. Ewolucja molekularna

Filogenetyka molekularna I. Krzysztof Spalik

Wstęp do Biologii Obliczeniowej

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

Wyróżniamy dwa typy zadań projektowych.

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Parazytologia W6. Dabert Wstęp do parazytologii ewolucyjnej Teoria analizy ko filogenetycznej

Filogenetyka molekularna I

Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.

Drzewa filogenetyczne jako matematyczny model relacji pokrewieństwa. dr inż. Damian Bogdanowicz

Porównywanie i dopasowywanie sekwencji

Bioinformatyka Laboratorium, 30h. Michał Bereta

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Bioinformatyka Laboratorium, 30h. Michał Bereta

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

Ewolucja informacji genetycznej

Zmienność ewolucyjna. Ewolucja molekularna

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Zmienność ewolucyjna. Ewolucja molekularna

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Metoda dokładnej rekonstrukcji drzew filogenetycznych genów. współczynników substytucji dla genów i gatunków

Badanie doboru naturalnego na poziomie molekularnym

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Teoria ewolucji. Podstawy wspólne pochodzenie.

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Macierze substytucji. PAM - Point Accepted Mutations Margaret Dayhoff Macierze substytucji zależna od prawdopodobieństwa mutacji

MSA i analizy filogenetyczne

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺady nr. 12 i 13; 25 stycznia 2006) 8 Konstrukcja drzew filogenetycznych

Księgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Ewolucja informacji genetycznej

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Bioinformatyka Laboratorium, 30h. Michał Bereta

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

MODELE SIECIOWE 1. Drzewo rozpinające 2. Najkrótsza droga 3. Zagadnienie maksymalnego przepływu źródłem ujściem

Ograniczenia środowiskowe nie budzą wielu kontrowersji, co nie znaczy że rozumiemy do końca proces powstawania adaptacji fizjologicznych.

Ewolucjonizm NEODARWINIZM. Dr Jacek Francikowski Uniwersyteckie Towarzystwo Naukowe Uniwersytet Śląski w Katowicach

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Algorytmy kombinatoryczne w bioinformatyce

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Mitochondrialna Ewa;

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

ALGORYTMY KONSTRUOWANIA DENDROGRAMÓW STOSOWANYCH PRZY ANALIZIE FILOGENETYCZNEJ MIKROORGANIZMÓW

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Konstrukcja drzew filogenetycznych podstawy teoretyczne.

Geny i działania na nich

Filogenetyka. Dr Marek D. Koter, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

Generator testów Bioinformatyka wer / 0 Strona: 1

Powstanie i ewolucja informacji genetycznej

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka

Powstanie i ewolucja informacji genetycznej

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Bioinformatyka Laboratorium, 30h. Michał Bereta

P (A B) P (B) = 1/4 1/2 = 1 2. Zakładamy, że wszystkie układy dwójki dzieci: cc, cd, dc, dd są jednakowo prawdopodobne.

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Powstanie i ewolucja informacji genetycznej

Archipelag Sztucznej Inteligencji

Krzysztof Spalik 1, Marcin Piwczyński 2

Filogenetyka. Dr inż. Magdalena Święcicka, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

Powstanie i ewolucja informacji genetycznej

Biologia medyczna, materiały dla studentów

Metagenomika, filogenetyka i ewolucja molekularna drobnoustrojów dotychczasowe i aktualne wyzwania matematyki

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Ekologia molekularna. wykład 6

PRZYRÓWNANIE SEKWENCJI

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Translacja i proteom komórki

Wstęp do programowania

FILOGENETYKA. Bioinformatyka, wykład. 8 c.d. 0)

PROBLEM: KLASTROWANIE DANYCH I DRZEWA FILOGENETYCZNE METODY:

WPROWADZENIE DO GENETYKI MOLEKULARNEJ

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

Teoria ewolucji. Ślady wspólnego pochodzenia. Dobór sztuczny i naturalny.

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Definicja obrotu: Definicja elementów obrotu:

Transkrypt:

Wykład 8 Drzewa Filogenetyczne Lokalizacja genów Some figures from: Acknowledgement M. Zvelebil, J.O. Baum, Introduction to Bioinformatics, Garland Science 2008 Tradycyjne drzewa pokrewieństwa Drzewa oparte były o podobieństwa morfologiczne. Nie były binarne. Hackel. E. MonophyletischerStambaumder Organismen' from'generellemorphologieder Organismen' (1866) with the three branches Plantae, Protista, Animalia 1 2 3 Drzewa filogenetyczne Drzewo jest grafem, który ma gałęzie, węzły i liście (końcówki, Drzewa filogenetyczne Typy drzew filogenetycznych końcowe węzły) Drzewo może, ale nie musi mieć korzeń Drzewo filogenetyczne to drzewo binarne Kladogram nie uwzględnia czasu Gałęzie w drzewie filogenetycznym są skierowane Węzły i liście odpowiadają gatunkom lub sekwencjom Drzewo addytywne. Długości gałęzi proporcjonalne do ilości mutacji na miejsce w sekwencji, skąd można obliczyć odległość ewolucyjną. molekularnym i pokrewieństwom pomiędzy nimi Liście nazywa się w nim OUT ( Operational Taxonomic Units ) 4 Drzewo może, ale nie musi, mieć korzeń 5 Drzewo ultrametryczne. Drzewo addytywne, które dodatkowo ma stałą szybkość mutacji wzdłuż gałęzi (liczy się tylko czas). Skala po prawej pokazuje więc zarówno czas ewolucji, jak i (wyrównaną) ilość mutacji na miejsce. 6 1

Tekstowy zapis drzewa Jak wyznaczyć dobre drzewo Zjawiska, którym podlegają geny (m.in. w sekwencjach homologicznych) Duplikacja genów (również całych chromosomów i genomów) Podział i ponowne połączenie fragmentów, ale w innej kolejności Mutacja genów (wewnątrz gatunku i międzygatunkowo) Zanikanie genów po duplikacji (geny ciche - pseudogeny) Konwergencja genów (homoplazja sekwencji) Poziomy (horyzontalny, lateralny) transfer genów HGT (Horizontal Gene Transfer) W tabeli mogą się również znaleźć liczby określające długości gałęzi. 7 8 9 Ortologi i Paralogi Ortologi / Paralogi Geny ortologiczne to takie, których rozdzielenie nastąpiło na skutek specjacji (rozdzielenia gatunków). Inaczej mówiąc, w momencie specjacji gen miał tylko jedną kopię, dopiero później gen ewoluował w ramach odrębnych gatunków, w każdym niezależnie Geny paralogiczne to takie, których rozdzielenie nastąpiło w wyniku duplikacji genu (nie specjacji). Jeden gatunek ma dwie kopie tego samego genu, które ewoluują niezależnie od siebie, ale w ramach tego samego gatunku. Jaka część genów jest ortologiczna? 10 11 12 2

Zanikanie (lub nieoznakowanie) genów wpływ na odległości w drzewie Presja selektywna w pozycji 3 kodonu mutacje synonimowe Transfer poziomy genów (HGT), szczególnie bakterie 13 Możliwa losowa zawartość nukleotydu na 3 pozycji 14 Geny xenologowe pozornie b. podobne, jako efekt HGT 15 Transfer poziomy Rzęsistek pochwowy Science z 2007 roku doniósł o zsekwencjonowaniu genomu, o wielkości ok. 160 M bp, z czego dwie trzecie to sekwencje powtórzeniowe (repetywne), lub transpozonowe świadczy to o niedawnym rozszerzeniu genomu, związanym z przystosowaniem do pasożytniczego trybu życia, a wynikłym z poziomego transferu genu od bakterii i późniejszym amplifikacjom odpowiednich rodzin genowych. Odległa grupa (różne enzymy z jednej superodziny) 16 1. Wybrać rodzinę sekwencji homologicznych jako OTU Sekwencje powinny mieć wystarczająco silny sygnał filogenetyczny. Jeśli sygnał jest słaby (sekwencje są bardzo rozbieżne) to drzewo powstanie, ale nie będzie zbyt informatywne Sekwencje muszą pochodzić z genów, które mają odpowiednio dużą, ale nie zbyt dużą szybkość mutacji W wybranych genach nie powinno być poziomego tranferu genów Sekwencje musza pochodzić z odpowiednich genów (ortologi, nie paralogi). 17 Geny, które spełniają założenia Prokariota sekwencja DNA małej podjednostki rybosomu rrna (16S RNA). Mimo, że w niektórych genomach pojawia się w kilku kopiach (na tej podstawie wyodrębniono Bacteria i Archea Carl Woese) Bakterie enzymy DNA: GyrA, GyrB, białko chaperonowe HSP60. Zwierzęta segment (648 bp) z cytochromu c oksydaza I 18 3

2. Uzyskanie dla tych sekwencji tzw. zredukowanego MSA. Tzn. MSA bez kolumn, w których wystąpiły przerwy Zredukowane MSA 2. Uzyskanie dla tych sekwencji tzw. zredukowanego MSA. Tzn. MSA bez kolumn, w których wystąpiły przerwy 3. Wyznaczenie drzewa filogenetycznego ze zredukowanego MSA 19 20 21 Ile drzew może teoretycznie powstać? Przypadek z 3 OTU Metody wykreślania drzew Ilość możliwych drzew, gdy ilość OTU = n Dla n=3 istnieje tylko jedno drzewo bez wierzchołka X2 X1 Metody parsymonii Metody odległościowe Metody probabilistyczne w oparciu o MLE (Maximum Likelihood Estimation) Z wierzchołkiem? X3 22 23 24 4

Metoda parsymonii Rysujemy wszystkie możliwe drzewa, umieszczając na dole badane OUT i zgadując węzły pośrednie Dla każdego obliczamy koszt Koszt to suma przejść po gałęziach, minimalna liczba substytucji) Wybieramy drzewo o minimalnym koszcie przejścia (np. algorytm Fitcha) Metoda zakłada optymalność ewolucji. Najszybsza, ale mało dokładna. Wybór drzewa konsensusowego, gdy kilka jest jednakowo prawdopodobnych Metody odległościowe 25 26 27 d=d/l Miary odległości Poprawka Poissona Liczba zaobserwowanych mutacji (d=p=d/l) jest zwykle znacznie mniejsza od rzeczywistej liczby mutacji bo bywa kilka na 1 miejsce (np. macierz PAM-120-120 mutacji na 100 miejsc) Drzewa UPGMA Unweighted Pair Group Method Using Arithmetic Average Poprawka Poissona d p = - ln(1-p) 28 29 30 5