PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Podobne dokumenty
PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

Bioinformatyka Laboratorium, 30h. Michał Bereta

Filogenetyka molekularna I. Krzysztof Spalik

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Analizy filogenetyczne

klasyfikacja fenetyczna (numeryczna)

Filogenetyka molekularna I

Acknowledgement. Drzewa filogenetyczne

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Bioinformatyka Laboratorium, 30h. Michał Bereta

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Dopasowanie sekwencji (sequence alignment)

Bioinformatyka Laboratorium, 30h. Michał Bereta

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

MSA i analizy filogenetyczne

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Porównywanie i dopasowywanie sekwencji

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Filogenetyka. Dr inż. Magdalena Święcicka, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

ALGORYTMY KONSTRUOWANIA DENDROGRAMÓW STOSOWANYCH PRZY ANALIZIE FILOGENETYCZNEJ MIKROORGANIZMÓW

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

PRZYRÓWNANIE SEKWENCJI

Teoria ewolucji. Podstawy wspólne pochodzenie.

Filogenetyka. Dr Marek D. Koter, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Wyróżniamy dwa typy zadań projektowych.

Porównywanie i dopasowywanie sekwencji

Drzewa filogenetyczne jako matematyczny model relacji pokrewieństwa. dr inż. Damian Bogdanowicz

Wstęp do Biologii Obliczeniowej

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

Bioinformatyka Laboratorium, 30h. Michał Bereta

Konstrukcja drzew filogenetycznych podstawy teoretyczne.

Mitochondrialna Ewa;

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Grafy i sieci wybrane zagadnienia wykład 3: modele służące porównywaniu sieci

PODSTAWY BIOINFORMATYKI

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

Ewolucjonizm NEODARWINIZM. Dr Jacek Francikowski Uniwersyteckie Towarzystwo Naukowe Uniwersytet Śląski w Katowicach

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Ograniczenia środowiskowe nie budzą wielu kontrowersji, co nie znaczy że rozumiemy do końca proces powstawania adaptacji fizjologicznych.

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Zmienność ewolucyjna. Ewolucja molekularna

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Biologia medyczna, materiały dla studentów

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

FILOGENETYKA. Bioinformatyka, wykład. 8 c.d. 0)

Metoda dokładnej rekonstrukcji drzew filogenetycznych genów. współczynników substytucji dla genów i gatunków

Bioinformatyka wykład 8, 27.XI.2012

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Bioinformatyka Laboratorium, 30h. Michał Bereta

Hierarchiczna analiza skupień

WSTĘP. Copyright 2011, Joanna Szyda

Krzysztof Spalik 1, Marcin Piwczyński 2

FILOGENETYKA. Bioinformatyka, wykład 7 (24.XI.200..XI.2008)

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Bioinformatyka Laboratorium, 30h. Michał Bereta

Algorytm genetyczny (genetic algorithm)-

Wysokość drzewa Głębokość węzła

MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka

Algorytmy ewolucyjne NAZEWNICTWO

Algorytmy kombinatoryczne w bioinformatyce

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Podstawy teorii ewolucji. Informacja i ewolucja

Bioinformatyka Laboratorium, 30h. Michał Bereta

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

Badanie doboru naturalnego na poziomie molekularnym

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Bioinformatyka wykład 10

Wybrane podstawowe rodzaje algorytmów

Teoria ewolucji. Ślady wspólnego pochodzenia. Dobór sztuczny i naturalny.

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

Zmienność ewolucyjna. Ewolucja molekularna

Generator testów Bioinformatyka wer / 0 Strona: 1

1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

Egzamin, AISDI, I termin, 18 czerwca 2015 r.

Budowanie drzewa filogenetycznego

Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni

KONSEKWENCJE PŁCIOWOŚCI (dlaczego osobniki są podobne?)

Parazytologia W6. Dabert Wstęp do parazytologii ewolucyjnej Teoria analizy ko filogenetycznej

Dopasowania par sekwencji DNA

Recenzja rozprawy doktorskiej. mgr Marcina Jana Kamińskiego. pt. Grupa rodzajowa Ectateus (Coleoptera: Tenebrionidae) filogeneza i klasyfikacja.

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Transkrypt:

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego 5. Oprogramowanie - przykłady

WSTĘP - FILOGENETYKA OKREŚLENIE POWIĄZAŃ POMIĘDZY 1. gatunkami 2. populacjami 3. osobnikami 4. genami 5. sekwencjami powtarzalnymi 6. strukturami 2 rzędowymi białek 7. ścieżkami metabolicznymi

WSTĘP - FILOGENETYKA INFORMACJE Sekwencje aminokwasów, nukleotydów Całe genomy Genomy organelli (np. mitichondrium) Pojedyncze geny OKREŚLENIE POWIĄZAŃ OPIERA SIĘ NA METODACH Klastrowania Kladystycznych WIZUALIZACJA Drzewa filogenetyczne

WSTĘP - FILOGENETYKA ZASTOSOWANIE ANALIZY FILOGENETYCZNEJ 1. Ewolucjonizm określenie powiązań ewolucyjnych 2. Medycyna określenie zróżnicowania genetycznego patogenów 3. Predykcja funkcji genów 4. Bioróżnorodność

WSTĘP - FILOGENETYKA FILOGENEZA GENÓW A FILOGENEZA GATUNKÓW Ewolucja konkretnej sekwencji nie zawsze jest zgodna z drogą ewolucji gatunku Ewolucja gatunku jest łącznym efektem ewolucji wielu genów tworzących genom

WSTĘP - FILOGENETYKA PODOBIEŃSTWO SEKWENCJI HOMOLOGIA HOMOPLAZJA pochodzące od wspólnego przodka niepochodzące bezpośrednio od wspólnego przodka ORTOLOGIA PARALOGIA homologia pomiędzy gatunkami wynikła na drodze specjacji białka mają podobne domeny i strukturę 3-D podobna funkcja homologia wewnątrz gatunku wynikła na drodze duplikacji genu białka mają zwykle odmienne funkcje PARALELIZM niezależne zmiany podobnych sekwencji w tym samym kierunku KONWERGENCJA niezależne zmiany różnych sekwencji w tym samym kierunku predykcja funkcji nowych genów

DRZEWA FILOGENETYCZNE ukorzenione i nieukorzenione binarność konstrukcji topologia długość gałęzi = czas ewolucji? kladogram filogram Drzewo ukorzenione Drzewo nieukorzenione A C A B C D B D

STRUKTURA DRZEWA FILOGENETYCZNEGO TERMINOLOGIA TEORII GRAFÓW krawędź ścieżka syn rodzic korzeń węzeł zewnętrzny

STRUKTURA DRZEWA FILOGENETYCZNEGO GRAPH edge path child parent root external node

STRUKTURA DRZEWA FILOGENETYCZNEGO DRZEWO UKORZENIONE ssaki łożyskowe odległości ewolucyjne = długości gałęzi outgroup = korzeń = organizm referencyjny miara prawdopodobieństwa poprawności drzewa Ingroup klad = porównywane organizmy struktura powiązań = kształt drzewa

STRUKTURA DRZEWA FILOGENETYCZNEGO UKORZENIENIE DRZEWA Grupa zewnętrzna gatunek, który jako pierwszy oddzielił się od pozostałych Zwykle odległy ewolucyjnie od porównywanych organizmów

STRUKTURA DRZEWA FILOGENETYCZNEGO DRZEWO UKORZENIONE, BIFURKACYJNE sekwencja fragmentu genu groel ukorzeniona w Bacillus subtilis

STRUKTURA DRZEWA FILOGENETYCZNEGO DRZEWO NIEUKORZENIONE naczelne, mtdna

STRUKTURA DRZEWA FILOGENETYCZNEGO PRZYKŁADY

PRZYKŁAD Z LITERATURY

PRZYKŁAD Z LITERATURY

METODY KONSTRUKCJI DRZEW FILOGENETYCZNYCH ODLEGŁOŚCIOWE OPARTE NA ZNAKACH nie uwzględniają powiązań ewolucyjnych konwertowanie znaków na odległości ewolucyjne uwzględniają powiązania ewolucyjne (mutacje) oparte bezpośrednio na znakach sekwencji (zliczanie mutacji) Metoda średnich połączeń (Unweighted pair group method with arithemtic mean; UPGMA) Przyłączania sąsiadów (Neighbor- joining; NJ) Metoda parsymonii (Maximum Parsimony; MP) Metoda największej wiarygodności (Maximum likelihood; ML)

METODY KONSTRUKCJI DRZEWA METODA ODLEGŁOŚCIOWA (KLASTROWANIA)

METODY KONSTRUKCJI DRZEWA - UPGMA ETAPY UPGMA 1. Obliczyć macierz zróżnicowania pomiędzy osobnikami 2. Wybór najbardziej podobnych osobników = węzeł 3. Obliczenie nowej macierzy zróżnicowania 4.... powrót do punktu 2 5.

METODY KONSTRUKCJI DRZEWA - UPGMA 1. Obliczyć macierz zróżnicowania pomiędzy osobnikami ATCC ATGC TTCG TCGG ATCC ATGC TTCG TCGG 0 1 2 4 0 3 3 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 2. Wybór najbardziej podobnych osobników = węzeł ATCC ATGC TTCG TCGG ATCC ATGC TTCG TCGG 0 1 2 4 0 3 3 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 2. Wybór najbardziej podobnych osobników = węzeł ATCC ATGC TTCG TCGG 0.5 0.5 ATCC ATGC TTCG TCGG 0 1 2 4 0 3 3 0 2 0 ATCC ATGC

METODY KONSTRUKCJI DRZEWA - UPGMA 3. Obliczenie nowej macierzy zróżnicowania ATCC + ATGC TTCG TCGG ATCC + ATGC 0 (2+3)/2=2.5 (4+3)/2=3.5 TTCG TCGG 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 4. Wybór najbardziej podobnych osobników = węzeł ATCC + ATGC TTCG TCGG ATCC + ATGC 0 (2+3)/2=2.5 (4+3)/2=3.5 TTCG TCGG 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 4. Wybór najbardziej podobnych osobników = węzeł ATCC + ATGC TTCG TCGG ATCC + ATGC TTCG TCGG 0 (2+3)/2=2.5 (4+3)/2=3.5 0 2 0 0.5 0.5 1 1 ATCC ATGC TTCG TCGG

METODY KONSTRUKCJI DRZEWA - UPGMA 5. Obliczenie nowej macierzy zróżnicowania ATCC + ATGC TTCG + TCGG ATCC + ATGC ATCC + ATGC 0 (2+4+3+3)/4=3 0

METODY KONSTRUKCJI DRZEWA - UPGMA 6. Wybór najbardziej podobnych osobników = węzeł ATCC + ATGC TTCG + TCGG 1.5 1.5 ATCC + ATGC ATCC + ATGC 0 (2+4+3+3)/4=3 0 0.5 0.5 1 1 ATCC ATGC TTCG TCGG

METODY KONSTRUKCJI DRZEWA - UPGMA 1. Najprostsza metoda tworzenia drzew 2. Bardzo szybka 3. Tworzy drzewa ukorzenione 4. Przyjmuje założenie zegara molekularnego identyczna szybkość mutacji na poszczególnych ścieżkach

METODY KONSTRUKCJI DRZEWA - NEIGHBOUR JOINING 1. Pary sekwencji o najmniejszej odległości ewolucyjnej = sąsiedzi 2. Stosunkowo szybka 3. Tworzy drzewa nieukorzenione 4. Uwzględnia zróżnicowane tempo ewolucji 5. wyniki zależne od założonego modelu ewolucyjnego

METODY KONSTRUKCJI DRZEWA METODA OPARTA NA ZNAKACH (KLADYSTYCZNA)

METODY KONSTRUKCJI DRZEWA METODA PARSYMONII ETAPY METODA MAKSYMALNEGO PODOBIEŃSTWA 1. Dopasowanie sekwencji kilku organizmów 2. Konstrukcja (wszystkich) możliwych drzew 3. Wybór drzewa wymagającego najmniejszej liczby mutacji

METODY KONSTRUKCJI DRZEWA - METODA PARSYMONII 1. Dopasowanie sekwencji kilku organizmów 1 A A C C G A T 2 A A C C G C A 3 A G T C G T T 4 A G T C G G A Jednakowe wartości sekwencja nieinformatywna Różne wartości sekwencja nieinformatywna Powtarzalne wartości sekwencja informatywna

METODY KONSTRUKCJI DRZEWA - METODA PARSYMONII 2. Konstrukcja (wszystkich) możliwych drzew n N R N U 3 3 1 4 15 3 5 105 15 10 34 459 425 2 027 025 Liczba możliwych drzew: ukorzenionych N R = (2n 3)!/2 n 2 (n 2)!R = (2n 3)!/2 nieukorzenionych N U = (2n 5)!/2 n 3 (n 3)! n= liczba taksonów/sekwencji

METODY KONSTRUKCJI DRZEWA - METODA PARSYMONII 2. Konstrukcja (wszystkich) możliwych drzew ACT GTA GTA ACA GTA GTT ACA GTT ACT GTT ACA ACT

METODY KONSTRUKCJI DRZEWA - METODA PARSYMONII 3. Wybór drzewa wymagającego najmniejszej liczby mutacji ACT GTA GTA 3 1 GTA ACA 3 GTT GTA GTT GTA 2 ACA GTT 1 GTT 1 2 2 GTT 1 ACT ACT GTT ACA ACT

METODY KONSTRUKCJI DRZEWA - METODA PARSYMONII Inaczej metoda największej oszczędności wybiera drzewa z najmniejszą ilością zmian ewolucyjnych opiera się na zasadzie brzytwy Ockhama Wykorzystuje pozycje informatywne (skrócenie czasu obliczeń)

METODY KONSTRUKCJI DRZEWA - NAJWYŻSZE PRAWDOP. 1. Uwzględnia zróżnicowane prawdopodobieństwo poszczególnych mutacji modele substytucyjne 2. Uwzględnia każda pozycję (nie tylko informatywne) 3. Bardzo powolna 4. Daje dokładne wyniki (małe prawdopodobieństwo uzyskania błędnego drzewa) 5. Brak efektu przyciągania długich gałęzi 6. Określa prawdopodobieństwa poprawności danego drzewa

METODY KONSTRUKCJI DRZEWA UPGMA METODA PARSYMONII łatwa, szybka powolna, duża liczba możliwych drzew analiza dużych zbiorów danych możliwa analiza dużych zbiorów danych problematyczna nie uwzględnia powiązań ewolucyjnych uwzględnia powiązania ewolucyjne (mutacje)

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa 2. Przyrównanie sekwencji (alignment) 3. Konstrukcja drzewa za pomocą jednej z kilku metod 4. Ocena drzewa i przedstawienie drzewa w formie odpowiedniej dla odbiorców

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa Zależny od problemu! Filogeneza konkretnych organizmów (wybór dowolnego genu) Ewolucja konkretnego genu (sekwencje pochodzące od wielu gatunków) Wybór markerów ewolucja ani zbyt szybka, ani zbyt powolna, regiony zmienne, regiony konserwatywne

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa 2. Przyrównanie sekwencji (alignment) Przyrównanie Przycięcie sekwencji Edycja nazw sekwencji Zapisanie przyrównania w nowym pliku Copyright 2017, Copyright J. Szyda 2014, & Joanna M. Mielczarek Szyda

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa 2. Przyrównanie sekwencji (alignment) 3. Konstrukcja drzewa za pomocą jednej z kilku metod

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa 2. Przyrównanie sekwencji (alignment) 3. Konstrukcja drzewa za pomocą jednej z kilku metod Metoda NJ

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO Metoda UPGMA Metoda NJ

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Wybór i zgromadzenie sekwencji do budowy drzewa 2. Przyrównanie sekwencji (alignment) 3. Konstrukcja drzewa za pomocą jednej z kilku metod 4. Ocena drzewa i przedstawienie drzewa w formie odpowiedniej dla odbiorców 1. Ocena wiarygodności drzewa 2. Czytelna grafika

OCENA WIARYGODNOŚCI TOPOLOGII Prawdopodobieństwo poprawności drzewa bootstrap STWORZENIE SZTUCZNEGO ZBIORU DANYCH zamiana kolejności nukleotydów 1000 STWORZENIE DRZEWA FILOGENETYCZNEGO OKREŚLENIE POWTARZALNOŚCI DANEGO ROZGAŁĘZIENIA = PRAWDOPODOBIEŃSTWO

OPROGRAMOWANIE MEGA - www.megasoftware.net/