klasyfikacja fenetyczna (numeryczna)

Podobne dokumenty
Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

Filogenetyka molekularna I. Krzysztof Spalik

Bioinformatyka Laboratorium, 30h. Michał Bereta

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Filogenetyka molekularna I

Acknowledgement. Drzewa filogenetyczne

Bioinformatyka Laboratorium, 30h. Michał Bereta

Analizy filogenetyczne

Teoria ewolucji. Podstawy wspólne pochodzenie.

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Hierarchiczna analiza skupień

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Recenzja rozprawy doktorskiej. mgr Marcina Jana Kamińskiego. pt. Grupa rodzajowa Ectateus (Coleoptera: Tenebrionidae) filogeneza i klasyfikacja.

Ograniczenia środowiskowe nie budzą wielu kontrowersji, co nie znaczy że rozumiemy do końca proces powstawania adaptacji fizjologicznych.

Konstrukcja drzew filogenetycznych podstawy teoretyczne.

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

Bioinformatyka Laboratorium, 30h. Michał Bereta

Ewolucjonizm NEODARWINIZM. Dr Jacek Francikowski Uniwersyteckie Towarzystwo Naukowe Uniwersytet Śląski w Katowicach

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

FILOGENEZA A KLADYSTYKA

Dopasowanie sekwencji (sequence alignment)

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Mitochondrialna Ewa;

KARTA KURSU. Podstawy taksonomii. Dr hab. Mieczysław Mazur, prof. UP

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Filogenetyka i taksonomia roślin i zwierząt dla EKOP

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Porównywanie i dopasowywanie sekwencji

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Wstęp do Biologii Obliczeniowej

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Taksonomia numeryczna co to jest?

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Budowanie drzewa filogenetycznego

ALGORYTMY KONSTRUOWANIA DENDROGRAMÓW STOSOWANYCH PRZY ANALIZIE FILOGENETYCZNEJ MIKROORGANIZMÓW

Drzewa filogenetyczne jako matematyczny model relacji pokrewieństwa. dr inż. Damian Bogdanowicz

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Szczegółowy opis wszystkich sprawdzanych czynności wraz z poziomem ich wykonania zawiera poniższa tabela.

życia na Ziemi dr Joanna Piątkowska

Zmienność. środa, 23 listopada 11

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Algorytm genetyczny (genetic algorithm)-

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

BIOLOGIA EGZAMIN KLASYFIKACYJNY 2015/16. KLASA III Gimnazjum. Imię:... Nazwisko:... Data:...

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Ekologia wyk. 1. wiedza z zakresu zarówno matematyki, biologii, fizyki, chemii, rozumienia modeli matematycznych

Podstawy teorii ewolucji. Informacja i ewolucja

Biologia medyczna, materiały dla studentów

PDF created with FinePrint pdffactory Pro trial version

Ocena wartości hodowlanej. Dr Agnieszka Suchecka

I. Genetyka. Dział programu Lp. Temat konieczny podstawowy rozszerzający

Filogenetyka. Dr Marek D. Koter, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

Teoria ewolucji. Ślady wspólnego pochodzenia. Dobór sztuczny i naturalny.

Zmienność ewolucyjna. Ewolucja molekularna

Różnorodność życia na Ziemi

Polimorfizm genu mitochondrialnej polimerazy gamma (pol γ) w populacjach ludzkich Europy

Filogenetyka. Dr inż. Magdalena Święcicka, dr hab. Marcin Filipecki. Katedra Genetyki, Hodowli i Biotechnologii Roślin, SGGW

Algorytmy genetyczne

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

ALGORYTMY GENETYCZNE (wykład + ćwiczenia)

Porównywanie i dopasowywanie sekwencji

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Wspólne pochodzenie. Ślady ewolucji.

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

NaCoBeZu klasa 8 Dział Temat nacobezu programu I. Genetyka 1. Czym jest genetyka? 2. Nośnik informacji genetycznej DNA 3. Podziały komórkowe

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 2. PRZEDMIOTY PRZYRODNICZE

Bioinformatyka Laboratorium, 30h. Michał Bereta

46 Olimpiada Biologiczna

Podstawy biologii. Informacja, struktura i metabolizm.

GENETYKA POPULACJI. Ćwiczenia 5 Biologia I MGR

Agnieszka Nowak Brzezińska Wykład III

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 2. PRZEDMIOTY PRZYRODNICZE ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZE: GM-P5

Algorytmy ewolucyjne - algorytmy genetyczne. I. Karcz-Dulęba

Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych

Jak powstają nowe gatunki. Katarzyna Gontek

Elementy modelowania matematycznego

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia stacjonarne i niestacjonarne

Metody probabilistyczne klasyfikatory bayesowskie

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

GENETYCZNE PODSTAWY ZMIENNOŚCI ORGANIZMÓW ZASADY DZIEDZICZENIA CECH PODSTAWY GENETYKI POPULACYJNEJ

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

Agnieszka Nowak Brzezińska Wykład III

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia niestacjonarne

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Zastosowanie analizy kladystycznej do rekonstrukcji filogenezy hominidów

Agnieszka Nowak Brzezińska

Krzysztof Spalik 1, Marcin Piwczyński 2

Transkrypt:

Teorie klasyfikacji

klasyfikacja fenetyczna (numeryczna) systematyka powinna być wolna od wszelkiej teorii (a zwłaszcza od teorii ewolucji) filogeneza jako ciąg zdarzeń jest niepoznawalna opiera się na filozofii nominalistycznej taksony tworzone są wyłącznie na podstawie zaobserwowanego podobieństwa analizowane jest ogólne podobieństwo, maksimum dostępnych cech, niezależnie od ich natury wszystkie cechy mają tą samą wagę

klasyfikacja fenetyczna (numeryczna) obliczana jest odległość między gatunkami w dowolnej liczbie wymiarów rezultatem jest dendrogram ilustrujący stosunki podobieństwa fenetycznego - fenogram fenogram nie ma wymiaru historycznego końcowe taksony to tzw. OTU (operational taxonomic units)

nowa systematyka Huxley J.S. 1940. The New Systematics. London gatunek jest złożony z populacji zmienność populacji jest kluczowa dla procesu ewolucyjnego zmienność populacji jest oparta o zmienność genetyczną testowanie wyników morfologicznych w oparciu o dane ogólnobiologiczne

nowa nowa systematyka podstawową jednostką systematyki jest populacja zmienność jest zasadniczym elementem istoty i definicji populacji populacje są systemami dynamicznymi, które ewoluują Gatunek można definiować wyłącznie w kategoriach dynamiki, ewolucji, genetyki, zależności wewnątrzpopulacyjnych, a nie w kategoriach stałych struktur morfologicznych

Monofiletyzm grupa monofiletyczna zawiera swój takson macierzysty i wszystkich jego potomków wszyscy członkowie grupy musza posiadać co najmniej jedną cechę apomorficzną

Parafiletyzm grupa parafiletyczna zawiera swój takson macierzysty i niektóych jego potomków

Polifiletyzm grupa polifiletyczna zawiera potomków różnych przodków

plezjomorfia apomorfia morfoklina

morfoklina

apomorfie synapomorfie plezjomorfie

grupa parafiletyczna symplezjomorfie

grupy siostrzane dwie monofiletyczne grupy, pochodzące od jednego gatunku macierzystego razem tworzą grupę monofiletyczną wyższej rangi

grupy siostrzane A B C taksony 3 4 5 6 7 8 9 10 kladogramy 3 15 28 945 10 395 135 135 2 027 025 34 459 425 wspólny przodek B+C wspólny przodek A+B+C

Homologia zgodność organu lub części organu u dwóch (lub więcej) gatunków, jeśli możemy przypuszczać, że ta zgodność wynika z odziedziczenia cechy po ich wspólnym przodku

Homologia cechy są homologiczne, jeśli występowała u wspólnego przodka

Homologia cechy są homologiczne, jeśli odpowiadają różnym etapom tej samej serii przemian

Homoplazja występowanie u różnych taksonów podobnych cech nie będących homologiami

Konwergencja podobne cechy pojawiają się niezależnie w różnych liniach ewolucyjnych, nie mających wspólnego przodka

Paralelizm ta sama cecha pojawia się niezależnie w dwóch (lub więcej) liniach mających bliskiego wspólnego przodka

Rewersja w serii przemian cechy, powraca wtórnie stan morfologiczny podobny do stanu wyjściowego

Analogia cechy konwergentne spełniają podobne funkcje

Analiza cech polega na odtworzeniu serii przemian cech homologicznych (morfoklin)

Kryterium embriologiczne rozkład cech pojawiających się w ontogenezie wcześnie jest bardziej ogólny (plezjomorfia) niż cech pojawiających się późno (apomorfia)

Kryterium porównania pozagrupowego jeśli istnieje cecha homologiczna spotykana wewnątrz grupy monofiletycznej i również poza tą grupą, to jest ona cechą plezjomorficzną jeśli cecha homologiczna jest spotykana wyłącznie wewnątrz badanej grupy monofiletycznej to jest ona cechą apomorficzną

Kryterium porównania wewnątrzgrupowego kryterium złożoności jeśli różne stany cechy mogą być ułożone w serię o wzrastającej złożoności, to jest prawdopodobne, że stan najprostszy jest stanem plezjomorficznym

Kryterium porównania wewnątrzgrupowego kryterium korelacji niektóre cechy są ze sobą ściśle powiązane, znajomość polaryzacji jednej morfokliny może ułatwić określenie polaryzacji dla drugiej

Kryterium porównania wewnątrzgrupowego kryterium powszechności jeśli pewien stan cechy jest bardzo rozpowszechniony w badanej grupie, a inny jest dużo rzadszy, to stan częstszy jest prawdopodobnie plezjomorficzny

Kryterium paleontologiczne stan cechy pojawiający się w serii skamielin najwcześniej jest najbardziej plezjomorficzny

Analiza parsymoniczna zgodna z zasadą tzw. brzytwy Ockhama najlepszy jest model filogenezy, który zakłada najmniejszą liczbę zmian ewolucyjnych

kladyzm organizmy są szeregowane i klasyfikowane wyłącznie w zależności od współczesności ich wspólnego pochodzenia status kategorii zależy od położenia punktów odgałęzienia na drzewie filogenetycznym klasyfikacja musi być odbiciem genealogii taksony muszą być monofiletyczne

kladyzm 1. wszystkie organizmy rozmnażające się wyłącznie płciowo mają tylko jedną historię genealogiczną (filogenezę) 2. cechy są przekazywane dziedzicznie z gatunku macierzystego na gatunki potomne, a więc przynajmniej niektóre z cech noszonych przez te ostatnie stanowią dowód pochodzenia 3. zmiany niektórych cech przodków nadają poszczególnym liniom ich specyficzne właściwości

klasyfikacja ewolucyjna klasyfikacja ewolucyjna oparta jest na prostym fakcie, że w przyrodzie występują łatwe do rozgraniczenia grupy taksonomia ewolucyjna wyjaśnia istnienie takich grup

gady ptaki ssaki

grupa parafiletyczna gady żółwie łuskonośne krokodyle ptaki ssaki

gady żółwie łuskonośne krokodyle ptaki autapomorfie

Metody molekularne w taksonomii

Dwie szkoły w systematyce Tradycyjna Relacje pomiędzy organizmami opisywane są na podstawie cech fenotypowych: morfo-anatomicznych, fizjologicznych, behawioralnych itp... Nowoczesna Relacje pomiędzy organizmami opisywane są na podstawie informacji pozyskanych bezpośrednio lub pośrednio z sekwencji kwasów nukleinowych (lub protein).

Systematyka tradycyjna Zmienność morfologiczna jest pochodną nagromadzonej zmienności genetycznej Markery morfologiczne użyteczne na wyższych poziomach systematycznych Stosowane w zakresie zmian makroewolucyjnych Zmiany mikroewolucyjne domena genetyki populacyjnej (demografii)

Systematyka molekularna Pozwala badać relacje filogenetyczne na poziomie wewnątrzgatunkowym i wewnątrzpopulacyjnym Filogeografia Bada filogenezę organizmów na poziomie gatunku i populacji Jest pomostem łączącym genetykę populacji i systematykę

Filogeografia Określa zasady i procesy leżące u podstaw geograficznego rozmieszczenia linii genealogicznych organizmów (Avise i in. 1987)

genetyczna ZMIENNOŚĆ morfologiczna Tradycyjna systematyka (filogeneza) Genetyka populacyjna (demografia) CZAS

genetyczna ZMIENNOŚĆ morfologiczna Systematyka molekularna CZAS Filogeografia

Dlaczego markery molekularne? genetyczny charakter danych uniwersalna metodyka praktycznie nieograniczona zmienność

Genomy organizmów 0,6 x 10 6 300 x 10 9 bp = 18 x Różnorodność genetyczna 3 x 10 9 bp 3 / 100 bp różne 1 000 000 różnic 10 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 genotypów

Dlaczego markery molekularne? genetyczny charakter danych uniwersalna metodyka praktycznie nieograniczona zmienność rozróżnienie cech homologicznych i analogicznych uniwersalna linijka w ewolucji molekularnej podstawa mechanistycznego poglądu na ewolucję wyzwanie intelektualne!!!

Analiza danych molekularnych ocena dystansu genetycznego topologia dendrogramów hierarchicznego podobieństwa genetycznego analiza wariancji molekularnych (AMOVA) topologia dendrogramów parsymonicznych analiza binarna rozmieszczenia haplotypów

Rekonstrukcja filogenezy

OTU = Operational Taxonomic Units = molekularne jednostki analizy filogenetycznej zewnętrzne węzły na drzewie to współcześnie żyjące OTU wewnętrzne węzły to hipotetyczni przodkowie współczesnych OTU drzewo jest wyskalowane jeśli długości gałęzi odpowiadają liczbie zmian jakie zaszły w toku ewolucji między węzłami warunkiem użyteczności drzew jest brak połączeń między ich gałęziami odtworzenie jest możliwe pod warunkiem bifurkacyjnego rozgałęziania drzew rozgałęzienia multifurkacyjne uniemożliwiają wnioskowanie o pokrewieństwie

Wyszukiwanie właściwej (najbardziej prawdopodobnej topologii drzewa) liczba wersji rozgałęzień drzewa ilustrujących pokrewieństwa między taksonami jest ogromna dla N = 10 to od 10 milionów do ponad 30 milionów do wyszukwiania służą skomplikowane algorytmy matematyczne kalkulacja możliwa jedynie przy użyciu komputerów algorytmy wyszukują najbardziej prawdopodobne topologie drzew zgodnie z zadanym kryterium optymalizacji zwykle nie znamy prawdziwej filogenezy dlatego wszelkie prezentowane drzewa są jedynie jej przybliżeniem metody oparte na odległościach (dystansie genetycznym) analiza skupień (UPGMA) metoda łączenia sąsiadów (Neighbor-Joining) metody oparte na stanach cech największej oszczędności (MP = Maximum Parsimony) największej wiarygodności (ML = Maximum Likelihood) analiza Bayesowska (Bayesian analysis)

Metody oparte na odległościach wywodzą się od macierzy zawierającej oszacowania dystansów genetycznych między wszystkimi parami OTU uwzględnianymi w analizie macierz dla n OTU zawiera n(n-1)/2 takich odległości

UPGMA Unweighted Pair Group Method with Arithmetic Averages Nieważona metoda grupowania par średnimi arytmetycznymi nieważona wszystkie dystanse są tak samo ważne grupowanie par liczą się tylko bifurkacje średnie arytmetyczne odległości pomiędzy kladami są średnimy arytmetycznymi odległości pomiędzy wszystkim członkami obu kladów

Neighbor Joining metoda łączenia najbliższych sąsiadów metodologicznie zbliżona do analizy UPGMA modyfikacje macierzy odległości polegają na tym, że długości gałęzi między parami węzłów dopasowywane są na podstawie ich średniej dywergencji czyli odróżnicowania od wszystkich pozostałych węzłów metoda nie zakłada równego tempa ewolucji między gałęziami drzewo wyprodukowane za pomocą algorytmu NJ nie jest ukorzenione drzewo ukorzenić można przez dodanie grupy zewnętrznej lub przez dodanie korzenia w połowie najdłuższej gałęzi łączącej współczesne OTU

Metody oparte na stanach cech nie wymagają tworzenia macierzy dystansów genetycznych analizują prawdopodobieństwa przejścia między dyskretnymi stanami cech (literami kodu genetycznego) = prawdopodobieństwo substytucji prawdopodbieństwo tranzycji (A G lub C T) jest większe niż prawdopodobieństwo transwersji (A,G C,T) metody oparte o stanach cech poszukują drzew o topologii będącej wynikiem sumy najbardziej prawdopodobnych zdarzeń (mutacji) dzielących analizowane sekwencje DNA

Metoda największej oszczędności (Maximum parsimony) działa zgodnie z zasadą brzytwy Ockhama zakłada że najlepsza topologia to taka, która wymaga najmniejszej możliwej liczby pośrednich kroków mutacyjnych dzielących analizowane sekwencje miarą wiarygodności topologii jest więc jak najmniejsza suma kroków mutacyjnych koniecznych do jej utworzenia w porównaniu do innych uzyskanych topologii może istnieć wiele topologii charakteryzujących się tą samą liczbą kroków mutacyjnych istnieją różne warianty metody parsymonicznej zakładające np. odwracalność lub nieodwracalność mutacji

Metoda największej wiarygodności (Maximum Likelihood) zakłada określony model ewolucji sekwencji DNA w oparciu o dane empiryczne częstość tranzycji/transwersji lub określonych mutacji wyliczone ze zbioru sekwencji częstości te opisywane są matematycznie tworzenie matematycznego modelu procesu ewolucyjnego skutkującego obserwowaną zmiennością w zestawie analizowanych danych topologia drzewa konstruowana jest w taki sposób aby uwiarygodniała z jak największym prawdopodobieństwem zakładany model ewolucyjny (obserwowany rozkład zmienności danych) tworzonych jest wiele topologii drzew i wyliczane są prawdopodobieństwa wystąpienia zakładanego modelu ewolucji przy danej topologii topologia, dzięki której prawdopodobieństwo wystąpienia danego modelu jest najbliższe 1 zostaje wybierana jaka prawdziwa

Rzetelność uzyskanej topologii wynikiem analizy jest zwykle jedno lub wiele równocennych topologii na ile prawdopodobne jest, że dana topologia w najlepszy sposób obrazuje filogenezę sekwencji? do oceny tego prawdopodobieństwa służy metoda samopróbkowania bootstrap metoda ta symuluje powtarzanie zbierania danych w celu oszacowania rzetelności drzewa

Dziękuję bardzo