Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Podobne dokumenty
E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

PROBLEM: KLASTROWANIE DANYCH I DRZEWA FILOGENETYCZNE METODY:

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺady nr. 12 i 13; 25 stycznia 2006) 8 Konstrukcja drzew filogenetycznych

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Bioinformatyka Laboratorium, 30h. Michał Bereta

Procesy stochastyczne

Drzewa. Jeżeli graf G jest lasem, który ma n wierzchołków i k składowych, to G ma n k krawędzi. Własności drzew

Definicja sieci. Sieć Petriego jest czwórką C = ( P, T, I, O ), gdzie: P = { p 1, p 2,, p n } T = { t 1, t 2,, t m }

Algorytmy kombinatoryczne w bioinformatyce

Grafy (3): drzewa. Wykłady z matematyki dyskretnej dla informatyków i teleinformatyków. UTP Bydgoszcz

Algorytmy Równoległe i Rozproszone Część V - Model PRAM II

Filogenetyka molekularna I. Krzysztof Spalik

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

Filogenetyka molekularna I

TEORETYCZNE PODSTAWY INFORMATYKI

Teoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska

Algorytmy i Struktury Danych

Modelowanie motywów łańcuchami Markowa wyższego rzędu

a) 7 b) 19 c) 21 d) 34

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Struktury danych i złożoność obliczeniowa Wykład 5. Prof. dr hab. inż. Jan Magott

Złożoność obliczeniowa klasycznych problemów grafowych

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Wybrane podstawowe rodzaje algorytmów

Wykład 3. Złożoność i realizowalność algorytmów Elementarne struktury danych: stosy, kolejki, listy

MODELE SIECIOWE 1. Drzewo rozpinające 2. Najkrótsza droga 3. Zagadnienie maksymalnego przepływu źródłem ujściem

Wstęp do programowania. Drzewa. Piotr Chrząstowski-Wachtel

Matematyka dyskretna - 7.Drzewa

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

SPÓJNOŚĆ. ,...v k. }, E={v 1. v k. i v k. ,...,v k-1. }. Wierzchołki v 1. v 2. to końce ścieżki.

Problem straŝaka w drzewach. Agnieszka Skorupka Matematyka Stosowana FTiMS

Bioinformatyka Laboratorium, 30h. Michał Bereta

Twój wynik: 4 punktów na 6 możliwych do uzyskania (66,67 %).

Ogólne wiadomości o grafach

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Algorytmiczna teoria grafów Przepływy w sieciach.

Metody optymalizacji dyskretnej w analizie podobieństwa drzew filogenetycznych

Zofia Kruczkiewicz, Algorytmu i struktury danych, Wykład 14, 1

Elementy teorii informacji i kodowania

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

7. Teoria drzew - spinanie i przeszukiwanie

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

Sieć (graf skierowany)

D: Dopasowanie sekwencji. Programowanie dynamiczne

Bioinformatyka Laboratorium, 30h. Michał Bereta

Algorytmy zachłanne. dr inż. Urszula Gałązka

Znajdowanie skojarzeń na maszynie równoległej

< K (2) = ( Adams, John ), P (2) = adres bloku 2 > < K (1) = ( Aaron, Ed ), P (1) = adres bloku 1 >

Analizy filogenetyczne

Algorytm Dijkstry znajdowania najkrótszej ścieżki w grafie

Tadeusz Pankowski

MATEMATYKA DYSKRETNA - MATERIAŁY DO WYKŁADU GRAFY

Wykład 8. Drzewo rozpinające (minimum spanning tree)

Graf. Definicja marca / 1

Metoda Tablic Semantycznych

Acknowledgement. Drzewa filogenetyczne

PLAN WYKŁADU BAZY DANYCH INDEKSY - DEFINICJE. Indeksy jednopoziomowe Indeksy wielopoziomowe Indeksy z użyciem B-drzew i B + -drzew

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Drzewa filogenetyczne jako matematyczny model relacji pokrewieństwa. dr inż. Damian Bogdanowicz

Co to są drzewa decyzji

Kompresja bezstratna. Entropia. Kod Huffmana

Podstawy Informatyki. Wykład 6. Struktury danych

Matematyka Dyskretna - zadania

Wysokość drzewa Głębokość węzła

Wykład 10 Grafy, algorytmy grafowe

Wstęp do sieci neuronowych, wykład 9 Sieci rekurencyjne. Autoasocjator Hopfielda

Teoria grafów podstawy. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak

Wykłady z Matematyki Dyskretnej

CLUSTERING II. Efektywne metody grupowania danych

Programowanie dynamiczne i algorytmy zachłanne

Plan wykładu. Przykład. Przykład 3/19/2011. Przykład zagadnienia transportowego. Optymalizacja w procesach biznesowych Wykład 2 DECYZJA?

Wykład 2. Drzewa poszukiwań binarnych (BST)

Teoretyczne podstawy informatyki

Teoria gier. Teoria gier. Odróżniać losowość od wiedzy graczy o stanie!

Algorytmy klasyfikacji

1. Algorytmy przeszukiwania. Przeszukiwanie wszerz i w głąb.

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne

Algorytmika dla bioinformatyki

Teoria gier. Wykład7,31III2010,str.1. Gry dzielimy

Definicja pliku kratowego

Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.

Każdy węzeł w drzewie posiada 3 pola: klucz, adres prawego potomka i adres lewego potomka. Pola zawierające adresy mogą być puste.

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV

Algorytmika Problemów Trudnych

Wstęp do Sztucznej Inteligencji

Teoria gier. wstęp Teoria gier Zdzisław Dzedzej 1

PRZESZUKIWANIE W GŁĄB ALGORYTM PRZYKŁAD - C.D. PRZYKŁAD PRZESZUKIWANIE W GŁĄB (DFS) PROJEKTOWANIE ALGORYTMÓW I METODY SZTUCZNEJ INTELIGENCJI

Algorytmiczna teoria grafów

Algorytmy i struktury danych. Drzewa: BST, kopce. Letnie Warsztaty Matematyczno-Informatyczne

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

Bazy danych. Andrzej Łachwa, UJ, /15

UNIWERSYTET GDAŃSKI MATERIAŁY DYDAKTYCZNE DO PRZEDMIOTU MATEMATYKA DYSKRETNA. pod redakcją: Hanna Furmańczyk Karol Horodecki Paweł Żyliński

Przypomnij sobie krótki wstęp do teorii grafów przedstawiony na początku semestru.

Łyżwy - omówienie zadania

Algorytmy i struktury danych

Transkrypt:

181 Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami. 3. D T(D) poprzez algorytm łączenia sąsiadów 182 D D* : macierz łącząca sąsiadów n Niech TotDist i = k=1 D i,k Definiujemy D* następująco: D i,i = 0 D i,j = n 2 D i,j TotDist i TotDist i Twierdzenie: Dla danej macierzy addytywnej D, najmniejszy element D i,j macierzy łączącej sąsiadów odpowiada parze sąsiadujących liści i oraz j w T(D) 1

3. D T(D) poprzez algorytm łączenia sąsiadów 183 3. D T(D) poprzez algorytm łączenia sąsiadów 184 2

Skąd pochodzi SARS? 185 Skąd pochodzi SARS? 186 Macierz odległości wyznaczono w oparciu dopasowanie dla poszczególnych par białka Spike pobranego z wirusa SARS-CoV uzyskanego od różnych pacjentów. Jest także wirus od palm civet. 3

X Drzewo filogenetyczne bazujące na symbolach 187 Metody dyskretne rekonstrukcji drzewa ewolucji 188 Dane jest n sekwencji DNA o długości m każda. Mamy zatem macierz dopasowania w rozmiarze n x m. Species A Species B Species C Species D Species E ATGGCTATTCTTATAGTACG ATCGCTAGTCTTATATTACA TTCACTAGACCTGTGGTCCA TTGACCAGACCTGTGGTCCG TTGACCAGTTCTCTAGTTCG Można ją przetransformować na macierz odległości, ale nigdy w drugą stronę. Informacja o dopasowaniu jest bezpowrotnie tracona przy tej transformacji n x m macierz dopasowania tra Nie ma nsf transformacji or ma powrotnej cja n x n macierz odległości Lepsza technika: algorytm rekonstrukcji drzewa bazujący na symbolach umożliwia badanie ewolucji dla każdego znaku. 4

Parsymonia w rekonstrukcji drzewa filogenetycznego 189 Parsymonia (oszczędność): kryterium optymalizacyjne - szukamy takiego drzewa, które wyznacza najmniejszą liczbę zdarzeń ewolucyjnych ( podstawienia, zamiany, itp.) Brzytwa Ockhama Przykład: Szukaj najprostszego wyjaśnienia dla danych { ATCG, ATCC, ACGG} Problem parsymonii inaczej 190 Znaki naszego drzewa to brwi i usta. Każdy z nich może być w dwóch stanach. Dobierz etykiety węzłów wewnętrznych tak by wynik parsymonii był najmniejszy. 5

Drzewo filogenetyczne bazujące na symbolach 191 Dwie klasy problemów: małej parsymonii : zakładamy, że struktura drzewa jest dana wielkiej parsymonii : struktura drzewa jest dowolna. Drzewo filogenetyczne bazujące na symbolach 192 Każdy wierzchołek v z drzewa T wyznacza poddrzewo o korzeniu: wierzchołków osiągalnych z v. Etykieta v ma zbierać własności dzieci wierzchołka v. Niech s k (v) to wynik parsymonii dla poddrzewa v uzyskany przy założeniu, ze w v umieszczono znak k, czyli Algorytm dynamiczny s k (v) = min (s i(daughter(v)) + δ i,k ) + min (s j(son(v)) + δ j,k ) all symbols i all symbols j Warunki początkowe algorytmu: s k (v) = 0 dla v = k dla v k 6

Wartości początkowe Algorytm Sankoffa 193 Character: wektor dostępnych znaków (u nas ACGT) Tag: znacznik, czy węzeł był już obsłużony ripe: dojrzały węzeł ma Tag równy 0, ale jego dzieci maja Tag równe 1 194 7

Algorytm Sankoffa z inną punktacją 195 9 7 8 9 A T G C? A C Mała parsymonia na drzewie nieukorzenionym 196 8

Problem wielkiej parsymonii Problem NP-zupełny Przykłady drzew o 4 liściach Ilość drzew ukorzenionych o n liściach : T(n) dla n = 2, 3, 4, 5, 6, 7, 8, 9, 10,. to Problem przeszukiwania przestrzeni drzew 198 Wszystkie drzewa swobodne o pięciu liściach. Drzewa sąsiadujące (poprzez transformację zamiany najbliższych sąsiadów ) są połączone krawędzią Algorytm zachłanny Monte Carlo przeszukuje przestrzeń drzew 9