PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Podobne dokumenty
PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Bioinformatyka Laboratorium, 30h. Michał Bereta

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

klasyfikacja fenetyczna (numeryczna)

Filogenetyka molekularna I. Krzysztof Spalik

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Acknowledgement. Drzewa filogenetyczne

Filogenetyka molekularna I

MSA i analizy filogenetyczne

Analizy filogenetyczne

ALGORYTMY KONSTRUOWANIA DENDROGRAMÓW STOSOWANYCH PRZY ANALIZIE FILOGENETYCZNEJ MIKROORGANIZMÓW

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Bioinformatyka Laboratorium, 30h. Michał Bereta

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Drzewa filogenetyczne jako matematyczny model relacji pokrewieństwa. dr inż. Damian Bogdanowicz

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Bioinformatyka Laboratorium, 30h. Michał Bereta

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Filogenetyka. Dr inż. Magdalena Święcicka, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

Konstrukcja drzew filogenetycznych podstawy teoretyczne.

Filogenetyka. Dr Marek D. Koter, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

FILOGENETYKA. Bioinformatyka, wykład 7 (24.XI.200..XI.2008)

Wstęp do Biologii Obliczeniowej

Wyróżniamy dwa typy zadań projektowych.

Wybrane podstawowe rodzaje algorytmów

Teoria ewolucji. Podstawy wspólne pochodzenie.

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

PODSTAWY BIOINFORMATYKI

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

PRZYRÓWNANIE SEKWENCJI

Algorytm genetyczny (genetic algorithm)-

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

FILOGENETYKA. Bioinformatyka,, wykład 7 (29.XI.2007)

Algorytmy kombinatoryczne w bioinformatyce

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

Porównywanie i dopasowywanie sekwencji

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Metoda dokładnej rekonstrukcji drzew filogenetycznych genów. współczynników substytucji dla genów i gatunków

FILOGENETYKA. Bioinformatyka, wykład. 8 c.d. 0)

Algorytmy i struktury danych

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta

WSTĘP. Copyright 2011, Joanna Szyda

Od sieci transmisji do oporności w HIV/HCV: czy leczenie HCV u zakażonych HIV powinno być priorytetem ze wskazań epidemiologicznych?

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Porównywanie i dopasowywanie sekwencji

1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

Bioinformatyka Laboratorium, 30h. Michał Bereta

Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH

Programowanie genetyczne, gra SNAKE

PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI

METODY STATYSTYCZNE W BIOLOGII

Algorytmy ewolucyjne NAZEWNICTWO

Algorytmy genetyczne

Algorytmy genetyczne

Dopasowanie sekwencji (sequence alignment)

Autor: mgr inż. Agata Joanna Czerniecka. Tytuł: Nowa metoda obliczeniowa porównywania sekwencji białek

Kolorowanie wierzchołków grafu

CMAES. Zapis algorytmu. Generacja populacji oraz selekcja Populacja q i (t) w kroku t generowana jest w następujący sposób:

Algorytmy wyznaczania centralności w sieci Szymon Szylko

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Krzysztof Spalik 1, Marcin Piwczyński 2

Ewolucjonizm NEODARWINIZM. Dr Jacek Francikowski Uniwersyteckie Towarzystwo Naukowe Uniwersytet Śląski w Katowicach

MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA. Biomatematyka Dr Wioleta Drobik-Czwarno

Mitochondrialna Ewa;

Algorytmika dla bioinformatyki

MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

Generator testów Bioinformatyka wer / 0 Strona: 1

PROBLEM: KLASTROWANIE DANYCH I DRZEWA FILOGENETYCZNE METODY:

Grafy Alberta-Barabasiego

Wysokość drzewa Głębokość węzła

Metody optymalizacji dyskretnej w analizie podobieństwa drzew filogenetycznych

Programowanie genetyczne - gra SNAKE

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Podstawy teorii ewolucji. Informacja i ewolucja

Budowanie drzewa filogenetycznego

ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺady nr. 12 i 13; 25 stycznia 2006) 8 Konstrukcja drzew filogenetycznych

LABORATORIUM 4: Algorytmy ewolucyjne cz. 2 wpływ operatorów krzyżowania i mutacji na skuteczność poszukiwań AE

Drzewa decyzyjne i lasy losowe

Teoria ewolucji. Ślady wspólnego pochodzenia. Dobór sztuczny i naturalny.

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Podstawy teorii ewolucji. Informacja i ewolucja

STATYSTYKA MATEMATYCZNA

Metoda Automatycznej Detekcji Interakcji CHAID

Transkrypt:

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa filogenetycznego 5. Oprogramowanie Copyright 2010, Joanna Szyda

WSTĘP - FILOGENETYKA METODY KONSTRUKCJI DRZEW FILOGENETYCZNYCH KLASTROWANIA KLADYSTYCZNE nie uwzględnia powiązań ewolucyjnych uwzględnia powiązania ewolucyjne (mutacje) UPGMA - Unweighted pair Group Method with Arithmetic Mean Neighbour joining Maximum parsimony - Maksymalne podobieństwo Maximum likelihood - Najwyższe prawdopodobieństwo

METODY KONSTRUKCJI DRZEWA METODA KLASTROWANIA

METODY KONSTRUKCJI DRZEWA - UPGMA PRZYKŁAD TWORZENIA DRZEWA METODĄ UPGMA 1. Obliczyć macierz zróżnicowania pomiędzy osobnikami 2. Wybór najbardziej podobnych osobników = węzeł 3. Obliczenie nowej macierzy zróżnicowania 4.... powrót do punktu 2 5.

METODY KONSTRUKCJI DRZEWA - UPGMA 1. Obliczyć macierz zróżnicowania pomiędzy osobnikami ATGC TTCG TCGG ATGC TTCG TCGG 0 1 2 4 0 3 3 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 2. Wybór najbardziej podobnych osobników = węzeł ATGC TTCG TCGG ATGC TTCG TCGG 0 1 2 4 0 3 3 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 2. Wybór najbardziej podobnych osobników = węzeł ATGC TTCG TCGG 0.5 0.5 ATGC TTCG TCGG 0 1 2 4 0 3 3 0 2 0 ATGC

METODY KONSTRUKCJI DRZEWA - UPGMA 3. Obliczenie nowej macierzy zróżnicowania + ATGC TTCG TCGG + ATGC 0 (2+3)/2=2.5 (4+3)/2=3.5 TTCG TCGG 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 4. Wybór najbardziej podobnych osobników = węzeł + ATGC TTCG TCGG + ATGC 0 (2+3)/2=2.5 (4+3)/2=3.5 TTCG TCGG 0 2 0

METODY KONSTRUKCJI DRZEWA - UPGMA 4. Wybór najbardziej podobnych osobników = węzeł + ATGC TTCG TCGG + ATGC TTCG TCGG 0 (2+3)/2=2.5 (4+3)/2=3.5 0 2 0 0.5 0.5 1 1 ATGC TTCG TCGG

METODY KONSTRUKCJI DRZEWA - UPGMA 5. Obliczenie nowej macierzy zróżnicowania + ATGC TTCG + TCGG + ATGC + ATGC 0 (2+4+3+3)/4=3 0

METODY KONSTRUKCJI DRZEWA - UPGMA 6. Wybór najbardziej podobnych osobników = wierzchołek + ATGC TTCG + TCGG 1.5 1.5 + ATGC + ATGC 0 (2+4+3+3)/4=3 0 0.5 0.5 1 1 ATGC TTCG TCGG

METODY KONSTRUKCJI DRZEWA - UPGMA 1. Najprostsza metoda tworzenia drzew 2. Bardzo szybka 3. Przyjmuje działanie mechanizmu ZEGARA MOLEKULARNEGO

METODY KONSTRUKCJI DRZEWA - NEIGHBOUR JOINING 1. Uwzględnia zróżnicowane tempo ewolucji organizmów 2. Stosunkowo szybka 3. Oszacowanie długości krawędzi 4. Wyniki zależne od założonego modelu ewolucyjnego

METODY KONSTRUKCJI DRZEWA METODA KLADYSTYCZNA

METODY KONSTRUKCJI DRZEWA - MAKS. PODOBIEŃSTWO PRZYKŁAD TWORZENIA DRZEWA METODĄ MAKSYMALNEGO PODOBIEŃSTWA 1. Dopasowanie sekwencji kilku organizmów 2. Konstrukcja (wszystkich) możliwych drzew 3. Wybór drzewa wymagającego najmniejszej liczby mutacji

METODY KONSTRUKCJI DRZEWA - MAKS. PODOBIEŃSTWO 1. Dopasowanie sekwencji kilku organizmów sekwencja 1 A A C C G A T 2 A A C C G C A 3 A G T C G T T 4 A G T C G G A Jednakowe wartości sekwencja nieinformatywna Różne wartości sekwencja nieinformatywna Powtarzalne wartości sekwencja informatywna

METODY KONSTRUKCJI DRZEWA - MAKS. PODOBIEŃSTWO 2. Konstrukcja (wszystkich) możliwych drzew Liczba możliwych drzew: ukorzenionych (2n - 3)!! nieukorzenionych (2n - 5)!! n - liczba sekwencji n!! = 1*3*5*7*...*n n l.ukorzenionych l.nieukorzenionych 3 3 1 4 15 3 5 105 15 10 34 459 425 2 027 025 liczba potencjalnych topologii rośnie wykładniczo poszukiwanie odpowiedniego drzewa = duży koszt obliczeniowy (jak zmniejszyć koszt?)

METODY KONSTRUKCJI DRZEWA - MAKS. PODOBIEŃSTWO 2. Konstrukcja (wszystkich) możliwych drzew ACT GTA GTA ACA GTA GTT ACA GTT ACT GTT ACA ACT

METODY KONSTRUKCJI DRZEWA - MAKS. PODOBIEŃSTWO 3. Wybór drzewa wymagającego najmniejszej liczby mutacji ACT GTA GTA 3 1 GTA ACA 3 GTT GTA GTT GTA 2 ACA GTT 1 GTT 1 2 2 GTT 1 ACT ACT GTT ACA ACT

METODY KONSTRUKCJI DRZEWA - MAKS. PODOBIEŃSTWO Inaczej metoda największej oszczędności wybiera drzewa z najmniejszą ilością zmian ewolucyjnych opiera się na zasadzie brzytwy Ockhama Wykorzystuje pozycje informatywne (skrócenie czasu obliczeń) Czy wszystkie mutacje są równocenne? Problem przyciągania się długich gałęzi

METODY KONSTRUKCJI DRZEWA - NAJWYŻSZE PRAWDOP. 1. Uwzględnia zróżnicowane prawdopodobieństwo poszczególnych mutacji 2. Uwzględnia każda pozycję (nie tylko informatywne) 3. Bardzo wolna 4. Daje dokładne wyniki (małe prawdopodobieństwo uzyskania błędnego drzewa) 5. Wykorzystuje modele substytucyjne 6. Określa prawdopodobieństwa poprawności danego drzewa

METODY KONSTRUKCJI DRZEWA UPGMA MAKS. PODOBIEŃSTWO łatwa, szybka powolna, duża liczba możliwych drzew analiza dużych zbiorów danych możliwa analiza dużych zbiorów danych problematyczna nie uwzględnia powiązań ewolucyjnych uwzględnia powiązania ewolucyjne (mutacje)

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Znalezienie sekwencji wybranych organizmów 2. Dopasowanie sekwencji 3. Konstrukcja drzewa (Clustal W) 4. Prawdopodobieństwo poprawności drzewa (bootstrap)

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 1. Znalezienie sekwencji wybranych organizmów

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 2. Dopasowanie sekwencji

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 3. Konstrukcja drzewa (Clustal W) dystans pomiędzy sekwencjami

ETAPY KONSTRUKCJI DRZEWA FILOGENETYCZNEGO 4. Prawdopodobieństwo poprawności drzewa (bootstrap) STWORZENIE SZTUCZNEGO ZBIORU DANYCH zamiana kolejności nukleotydów 1000 STWORZENIE DRZEWA FILOGENETYCZNEGO OKREŚLENIE POWTARZALNOŚCI DANEGO ROZGAŁĘZIENIA = PRAWDOPODOBIEŃSTWO

OPROGRAMOWANIE PHYLIP - www.phylip.com/

OPROGRAMOWANIE PHYLIP online: http://mobyle.pasteur.fr/cgi-bin/portal.py?form=neighbor

OPROGRAMOWANIE MEGA - www.megasoftware.net/

OPROGRAMOWANIE PAUP www.paup.csit.fsu.edu/

OPROGRAMOWANIE Treefinder - www.treefinder.de