Bioinformatyka Wykład 7 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Plan Bioinformatyka Ewolucyjne podstawy Bioinformatyki Filogenetyka Bioinformatyczne narzędzia Filogenetyki Wykład 7, 2011 1
Ewolucyjne podstawy Bioinformatyki Nic w Biologii (Bioinformatyce) nie ma sensu jeśli rozpatruje się to w oderwaniu od ewolucji. Theodosius Dobzhansky (1900-1975) porównywanie sekwencji białkowych macierze PAM porównywanie RNA znajomość struktury tasowanie domen mechanizm ewolucji białek porównywanie genomów specjacja i duplikacja porównywanie genomów transfer poziomy DNA itd. duplikacja oryginalny gen duplikacja specjacja b 3 gatunek 2 b 2,c,a c 2 gen b b 2 b 1 gen a a 2 a 1 t 0 t 1 t 2 gatunek 1 b 1,a 1 Dywergencja (homologi): paralogi (wspólny przodek w czasie duplikacji) ortologi (wspólny przodek w czasie specjacji: a1-a2) Konwergencja (analogi) Wykład 7, 2011 2
pokolenia Wykład Bioinformatyka 2012-09-24 Ewolucja (jedna z definicji, wg.p.g.higgs&t.k.attwod): Zmiany w populacji dziedziczone przez wiele pokoleń. cechy: podatność na błędy samopowielania zmienność powodzenia procesu samopowielania (różnicowa przeżywalność) Rozwój formy biologicznej na skutek doboru naturalnego i występowania modyfikacji Drzewo filogenetyczne - koalescencja kopie genu koalescencja punkty rozgałęziania się linii przodków (droga w dół do współczesności) koalesecencja miejsca zbiegania się linii (wspólny przodek na drodze w górę) (np. chromosom Y, i mitochondrialny DNA po wyskalowaniu drzewa mtdna punkt koalescencji przypada na 200 000 lat temu, w Afryce dla chromosomu Y- ok. 60 000) Wykład 7, 2011 3
Mutacje (definicje z perspektywy ewolucji): Locus oznaczenie miejsca na chromosomie allele różne warianty sekwencji występujące w tym samym locus polimorfizm występowanie znaczącej liczby różnych alleli dla jednego locus (>1% w populacji) mutacja dowolna zmiana sekwencji DNA przekazana potomstwu Mutacje mutacje punktowe: substytucje, insercje, delecje mutacje na poziomie chromosomów: inwersje, transolkacje mikrosatelity sekwencje zawierające powtórzenia krótkich fragmentów sekwencji mutacje przystosowawczo neutralne nie mające wpływu na dostosowanie organizmu mutacje przystosowawczo szkodliwe mutacje przystosowawczo korzystne Wykład 7, 2011 4
BRCA1 Białko BRCA1 uczestniczy w naprawie uszkodzonego DNA - 1863 aminokwasy gen - 80 kpz DNA (24 egzony) lokalizacja: długie ramie 17 chromosomu w locus 17q21 mrna - 7,8 kpz http://pl.wikipedia.org/wiki/brca1 BRCA1 domena wiążąca białko BARD1 domeny często spotykane w białkach zaangażowanych w procesy naprawy DNA Schemat budowy polipeptydu białka BRCA1 i miejsc wiązania innych białek. Zaznaczono także reszty aminokwasowe BRCA1 fosforylowane przez kinazy http://pl.wikipedia.org/wiki/brca1 Wykład 7, 2011 5
Zmienność sekwencji w obrębie jednego gatunku i między gatunkami efekt założyciela (szczególny przypadek dryftu genetycznego) - wysoka częstość mutacji w populacjach jednorodnych etnicznie w Polsce 91% mutacji w genie BRCA1 to: 300T>G 5382insC, C61G 4153delA http://en.wikipedia.org/wiki/brca1 Zmienność sekwencji w obrębie jednego gatunku i między gatunkami Wykład 7, 2011 6
Zmienność sekwencji w obrębie jednego gatunku i między gatunkami A schemat sekwencji białkowej i CDS ludzkiego BRCA1 B pozycje insercji i delecji w sekwencji Rhesus macaque C pozycje substytucji w zestawieniu sekwencji Zmienność sekwencji w obrębie jednego gatunku i między gatunkami Wykład 7, 2011 7
Zmienność sekwencji w obrębie jednego gatunku i między gatunkami Zmienność sekwencji w obrębie jednego gatunku i między gatunkami Wykład 7, 2011 8
Zmienność sekwencji w obrębie jednego gatunku i między gatunkami zmienność sekwencji wewnątrz gatunku szkodliwe mutacje, które z czasem będą wyeliminowane (?) drogą doboru naturalnego zmienność sekwencji (różnice) między gatunkami utrwalone zmiany w genomach, które nie zostały wyeliminowane drogą doboru naturalnego (neutralne lub korzystne) Filogeneza/Filogenetyka Badanie drogi rozwoju rodowego, pochodzenia i relacji między istniejącymi (i kopalnymi) gatunkami Cele i zastosowania: tworzenie drzew filogenetycznych (relacje i wspólny przodek) wnioskowanie dotyczące wspólnego pochodzenia i wspólnych cech śledzenie ścieżek rozprzestrzeniania się infekcji Wykład 7, 2011 9
Filogenetyka drzewo filogenetyczne reprezentuje relacje między pomiędzy poszczególnymi taksonami filogenetyka molekularna wykorzystanie informacji zawartej w sekwencjach (aa lub DNA) do konstrukcji drzew filogenetycznych taksony konary tempo przemian ewolucyjnych pień wspólny przodek takson organizmy w obrębie jednej jednostki klasyfikacyjnej, posiadające wspólną, wyróżniającą je cechę Klasyfikacja biologiczna klasyfikacja obiektów biologicznych ze względu na różne kryteria Klasyfikacja sztuczna ze względu na cechy siedliskowe lub morfologiczne (lądowe/wodne, kręgowce/bezkręgowce) Klasyfikacja naturalna oparta o analizę filogenetyczną założenie klasyfikacji naturalnej: wszystkie organizmy powstały na drodze ewolucji (jedne wymierały, a inne dawały początek nowym) Wykład 7, 2011 10
Analiza filogenetyczna Filogeneza bada drogi rozwoju rodowego. pochodzenie i ewolucję w obrębie jakiejś grupy Drzewo filogenetyczne ilustracja pochodzenia i relacji pomiędzy poszczególnymi taksonami taksony konary tempo przemian ewolucyjnych pień wspólny przodek Filogenetyczne Drzewo Życia http://nai.arc.nasa.gov/news_stories/news_detail.cfm?id=274 Wykład 7, 2011 11
Klasyfikacja biologiczna organizmów żywych Gatunek (Species) Człowiek Współczesny Człowiek Rozumny (Homo Sapiens) Neandertalczyk (Homo Sapiens Sapiensis) (Homo sapiens neanderthalensis) Rodzaj (Genus) Goryl (Gorilla) Człowiek (Homo) Szympans (Pan) Orangutan (Pongo) Rodzina (Family) Rząd (Order) Klasa (Class) Typ (Phylum/Divission) Królestwo (Kingdom) Rośliny (Plantae) Człowiekowate (Hominidae) Naczelne (Primates) Ssaki (Mammalia) Strunowce (Chordata) Zwierzęta Metazoa/Animalia Domena (Domain/Superkingdom) Bacteria (Domain/Superkingdom) Eucaryota (Domain/Superkingdom) Archaea (Domain/Superkingdom) Drzewa filogenetyczne drzewo ukorzenione z osią czasu - długość gałęzi proporcjonalna do czasu Wykład 7, 2011 12
x 2 13 Zegar molekularny Koncepcja zegara molekularnego (Zuckerlandl i Pauling, 1965) : równe tempo substytucji we wszystkich liniach ewolucyjnych. kalibrowanie zegara - dane fosylne (kopalne)- określanie bezwzględnego czasu dywergencji. 13 mln lat Kalibracja zegara duplikacja hemoglogin ok. 350 mln lat temu. kopalne ryby bezszczękowe sprzed 400 mln lat mają jednocząsteczkową hemoglobinę Wykład 7, 2011 13
Zegar molekularny założenie, że podobne odległości miedzy węzłami w różnych gałęziach odpowiadają takim samym odległościom ewolucyjnym w czasie Hipoteza zegara działa tylko dla blisko spokrewnionych sekwencji Czasami niektóre gatunki ewoluowały szybciej niż inne gałęzie nierównej długości Drzewa filogenetyczne drzewo ukorzenione - długość gałęzi proporcjonalna do liczby zmian ewolucyjnych Wykład 7, 2011 14
Drzewa filogenetyczne drzewo nieukorzenione -długość gałęzi proporcjonalna do liczby zmian ewolucyjnych -można wskazać wspólnego przodka niektórych gatunków, ale nieznany jest kolejność specjacji -takie drzewo można ukorzenić ustalenie grupy zewnętrznej Grupy zewnętrzne (Outgroups) proces ukorzeniania sekwencja grupy zewnętrznej jest dużo dalej spokrewniona z pozostałymi sekwencjami (pierwsza oddzielona) Jest przydatna jako sekwencja referencyjna (np. do opisu ssaków łożyskowych wykorzystuje się sekwencje torbaczy) Wykład 7, 2011 15
Ukorzenianie midpoint method A D B C B A D C bez grupy zewnętrznej lepiej nie ukorzeniać drzewa Analiza filogenetyczna takson grupa oparta na podobieństwie, posiadająca konkretną wyróżniającą cechę (kręgowce-bezkręgowce, ssaki lądowe-wodne, zwierzęta latające i nielatające) takson monofiletyczny takson polifiletyczny takson parafiletyczny ryby płazy ssaki żółwie ptaki monofiletyczny wszyscy potomkowie wspólnego przodka parafiletyczny niektórzy potomkowie wspólnego przodka polifiletyczny potomkowie różnych przodków http://www.enotes.com/topic/paraphyly kręgowce gady owodniowce czworonogi cdn Wykład 7, 2011 16
Poprawny MSA!!!! Analiza filogenetyczna opiera się na założeniu, że kolumny zestawienia pochodzą od wspólnego przodka Poprawny MSA jest kluczowy!!!! konieczna może być ręczna interwencja w zestawienie Programy do Analizy Filogenetycznej Ogólne Phylip PAUP MEGA DAMBE PAL Bionumerics Pakiety Parsimony MALIGN Maximum Likelihood Tree-Puzzle Distance Treecon and many others Wykład 7, 2011 17
Źródła wykorzystano materiały pochodzące z wykładów dla Szkoły Bioinformatycznej i studentów biologii Prof. Jaceka Daberta Institute Director INSTITUTE OF ENVIRONMENTAL BIOLOGY Faculty of Biology Adam Mickiewicz University Wykład 7, 2011 18