Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Podobne dokumenty
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

PODSTAWY BIOINFORMATYKI

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Porównywanie i dopasowywanie sekwencji

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Bioinformatyka Laboratorium, 30h. Michał Bereta

Wstęp do Biologii Obliczeniowej

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta

Dopasowanie sekwencji (sequence alignment)

Wzorcowe efekty kształcenia dla kierunku studiów biotechnologia studia pierwszego stopnia profil ogólnoakademicki

Porównywanie i dopasowywanie sekwencji

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Bioinformatyka Laboratorium, 30h. Michał Bereta

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Informatyka w medycynie Punkt widzenia kardiologa

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Podstawy bioinformatyki - biologiczne bazy danych

9. Metody dydaktyczne 10. Podstawowe informacje i zaliczone kursy z genetyki i biologii molekularnej oraz dobra znajom angielskiego.

Księgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Teoria ewolucji. Podstawy wspólne pochodzenie.

Wprowadzenie do bioinformatyki

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy filogenetyczne

Bioinformatyka Laboratorium, 30h. Michał Bereta

Generator testów Bioinformatyka wer / 0 Strona: 1

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

PRZYRÓWNANIE SEKWENCJI

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Mitochondrialna Ewa;

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Podstawy teorii ewolucji. Informacja i ewolucja

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Podstawy biologii. Podstawy biologii molekularnej

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH

Filogenetyka molekularna I. Krzysztof Spalik

BIOLOGICZNE BAZY DANYCH SYLABUS

Acknowledgement. Drzewa filogenetyczne

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Opis zakładanych efektów kształcenia OPIS ZAKŁADANYCH EFEKTÓW KSZTAŁCENIA

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

przedmiotu Nazwa Wydział Nauk Medycznych i Nauk o Zdrowiu Kierunek jednolite studia magisterskie Profil kształcenia (studiów)

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das

Wybrane techniki badania białek -proteomika funkcjonalna

Filogenetyka molekularna I

Badanie doboru naturalnego na poziomie molekularnym

Zmienność ewolucyjna. Ewolucja molekularna

Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej

Przyrównywanie sekwencji

Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia

Biologia medyczna, materiały dla studentów

Ewolucja człowieka. Ślady w ziemi i ślady w genach

Od jakiego pułapu startujemy? matematyka

Autor: mgr inż. Agata Joanna Czerniecka. Tytuł: Nowa metoda obliczeniowa porównywania sekwencji białek

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

klasyfikacja fenetyczna (numeryczna)

Uniwersytet Rolniczy im. Hugona Kołłątaja w Krakowie Wydział Hodowli i Biologii Zwierząt

KARTA PRZEDMIOTU. (pieczęć wydziału)

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Informatyka wspomaga przedmioty ścisłe w szkole

3. Podstawy genetyki S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nazwa modułu. Kod F3/A. Podstawy genetyki. modułu

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Podstawy biologii. Informacja, struktura i metabolizm.

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Przewodnik do planowania programu kształcenia na II roku studiów I stopnia. Kierunek: Bioinformatyka. 17 czerwca 2013 r.

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW BIOINFORMATYKA

Bioinformatyka. Michał Bereta

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Samouczek: Konstruujemy drzewo

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

KARTA PRZEDMIOTU. Dyscyplina:

Algorytmika dla bioinformatyki

Olimpiada Biologiczna

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 2. PRZEDMIOTY PRZYRODNICZE ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GM-P8

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

DNA musi współdziałać z białkami!

Transkrypt:

Ewolucja molekularna człowieka okiem bioinformatyka Justyna Wojtczak Jarosław Jeleniewicz

Informatyka w biologii - bioinformatyka Jest to szeroka dziedzina zajmująca się tworzeniem zaawansowanych baz danych, algorytmów, metod statystycznych i teorii, które są przydatne przy analizie danych biologicznych. Do podstawowych czynności bioinformatyki należą: mapowanie i analiza sekwencji genomowych i białkowych, przyrównanie sekwencji modelowanie cząsteczek biologicznych Dyscyplina ta jest związana także z : genomiką proteomiką metabolomiką transkryptomiką białko szoku cieplnego

Bioinformatyka: poddziedziny Bioinformatyka strukturalna zajmuje się tworzeniem modeli przestrzennych cząsteczek biologicznych takich jak białka czy RNA bada oddziaływania pomiędzy białkami, peptydami, kwasami nukleinowymi ich ligandami umożliwia poznanie funkcji białek, co może być pomocne przy tworzeniu nowych leków glu-trna z syntetazą glutrna

Bioinformatyka: poddziedziny Genomika ewolucyjna bada zależności pomiędzy białkami i genami wywodzącymi się od wspólnego przodka zajmuje się mechanizmami ewolucyjnymi wykorzystując odpowiednie programy ustala położenie genów i transpozonów w genomach dzięki zastosowaniu komputerów do obliczeń drzewa filogenetyczne powstają znacznie szybciej i są bardziej zoptymalizowane

Bioinformatyka: poddziedziny Genomika obliczeniowa Porównuje i bada całe genomy różnych organizmów Wykorzystuje narzędzia informatyczne w analizach biologicznych: Zajmuje się tworzeniem specjalistycznych baz danych oraz optymalnym dostępem do danych w nich składowanych dodatkowo tworzy i ulepsza mechanizmy umożliwiające korzystanie ze zgromadzonych danych - np. odnajdywanie nowych czy optymalizacja już istniejących algorytmów przyrównywania sekwencji (BLAST, FASTA, MSA itp.)

Bioinformatyka obliczeniowa BLAST blast.ncbi.nlm.nih.gov/blast.cgi

Bioinformatyka: poddziedziny Biologia systemów ewolucyjnych Tworzy sieci zależności np. aktywności danego genu - w celu uwidocznienia złożoności procesu. Zajmuje się również problemami ewolucji dzięki użyciu symulacji prostych sztucznych form życia, realizowanych m.in. za pomocą tzw. automatów komórkowych. Do narzędzi, które stosuje można zaliczyć algorytmy genetyczne i sieci neuronowe. Natomiast do opisu zachodzących zjawisk stosuje generowane komputerowo modele matematyczne.

Ewolucja molekularna zmiany sekwencji DNA, RNA zmiany na poziomie białek związana z genetyką populacji

Jak z kilku sekwencji DNA stworzyć analizę filogenetyczną?

Wybieramy sekwencję Musimy określić gen, którego sekwencję będziemy badać. Często jest to metoda prób i błędów: gen nie może ewoluować zbyt szybko ani zbyt wolno Najczęściej w tego typu analizach sprawdzają się geny mitochondrialnego DNA: kodujące białko cytochromu C lub rrna budujące rybosom Aby pobrać sekwencję danego genu możemy np. posłużyć się bazą NCBI.

Wybieramy sekwencję Do celów niniejszego przykładu wybraliśmy sekwencję genu kodującego rrna małej podjednostki rybosomu pochodzącego z genomów mitochondrialnych różnych gatunków naczelnych. długość ok. 950 nu w miarę konserwatywne wśród blisko spokrewnionych organizmów

Pobranie sekwencji

Wybrana sekwencja (plik fasta) >gb JF682349.1 :648-1601 Homo sapiens mitochondrion, complete genome AATAGGTTTGGTCCTAGCCTTTCTATTAGCTCTTAGTAAGATTACACATGCAAGCATCC CCGTTCCAGTGAGTTCACCCTCTAAATCACCACGATCAAAAGGGACAAGCATCAAGCA CGCAGCAATGCAGCTCAAAACGCTTAGCCTAGCCACACCCCCACGGGAAACAGCAGTG ATTAACCTTTAGCAATAAACGAAAGTTTAACTAAGCTATACTAACCCCAGGGTTGGTCA ATTTCGTGCCAGCCACCGCGGTCACACGATTAACCCAAGTCAATAGAAGCCGGCGTAA AGAGTGTTTTAGATCACCCCCTCCCCAATAAAGCTAAAACTCACCTGAGTTGTAAAAAA CTCCAGTTGACACAAAATAGACTACGAAAGTGGCTTTAACATATCTGAACACACAATAG CTAAGACCCAAACTGGGATTAGATACCCCACTATGCTTAGCCCTAAACCTCAACAGTTA AATCAACAAAACTGCTCGCCAGAACACTACGAGCCACAGCTTAAAACTCAAAGGACCTG GCGGTGCTTCATATCCCTCTAGAGGAGCCTGTTCTGTAATCGATAAACCCCGATCAACC TCACCACCTCTTGCTCAGCCTATATACCGCCATCTTCAGCAAACCCTGATGAAGGCTAC AAAGTAAGCGCAAGTACCCACGTAAAGACGTTAGGTCAAGGTGTAGCCCATGAGGTGG CAAGAAATGGGCTACATTTTCTACCCCAGAAAACTACGATAGCCCTTATGAAACTTAAG GGTCGAAGGTGGATTTAGCAGTAAACTGAGAGTAGAGTGCTTAGTTGAACAGGGCCCT GAAGCGCGTACACACCGCCCGTCACCCTCCTCAAGTATACTTCAAAGGACATTTAACTA AAACCCCTACGCATTTATATAGAGGAGACAAGTCGTAACATGGTAAGTGTACTGGAAAG TGCACTTGGACGAAC

Wyszukiwanie spokrewnionych sekwencji Program BLAST wyszukuje podobne sekwencje do tej, którą podaliśmy. Aby wyszukiwanie było bardziej wiarygodne, możemy: zaznaczyć opcję maskowania fragmentów powtarzalnych zawęzić wyniki do jednej grupy organizmów, np kręgowców Należy pamiętać, aby wyszukane sekwencje miały wspólną historię ewolucyjną czyli ich ewolucja przebiegała na drodze duplikacji i mutacji punktowych

Wyszukiwanie spokrewnionych sekwencji Pan paniscus (szympans karłowaty) Pan troglodytes (szympans) Gorilla gorilla (goryl) Pongo pygmaeus (orangutan) Hylobates lar (gibon) Macaca mulatta (rezus)

Wyszukiwanie spokrewnionych sekwencji Callithrix pygmaea (marmozeta karłowata) Cebus apella (kapucynka czubata) Alouatta seniculus (wyjec rudy) Lemur catta (lemur katta) Tarsius syrichta (wyrak filipiński) Cavia porcellus (świnka morska) Mus musculus (mysz)

Przyrównanie pozwala ustalić identyczność sekwencji wyszukiwanie motywów dystans genetyczny niektóre sekwencje mają rejony o wysokiej zmienności (częste insercje i delecje nukleotydowe), warto je wykluczyć z dalszej analizy gdyż są przyczyną błędów Clustal w obserwowanej sekwencji widzimy zarówno rejony konserwatywne jak i te, które wykazują pewną zmienność - to właśnie one umożliwią skonstruowanie drzewa

Przyrównanie

Tworzenie drzewa filogentycznego Najczęściej używane metody: UPGMA- najprostsza, hierarchiczna analiza skupisk, stałe tempo ewolucji Neighbor-Joining, NJ (przyłączenie sąsiadów)- szybka,tworzenie macierzy odległości, analiza skupisk Fitcha-Margoliasha, FM - kolejna metoda odległościowa, generuje zbiór drzew, na podstawie którego wybiera się to optymalne Maksymalnej parsymonii (największej oszczędności) - wybiera drzewa ze zbioru wygenerowanych drzew, które opisują zmienność sekwencji za pomocą minimalnej liczby podstawień Największej wiarygodności - wybór drzewa o największej wiarygodności ze zbioru drzew wygenerowanych Metody bayesowkie - metoda MCMC (Monte Carlo dla łańcuchów Markowa), metody najnowsze, kryterium największej wiarygodności

Końcowe drzewo (metoda NJ) a) b)

Końcowe drzewo po optymalizacji c) d)

Wnioski na podstawie drzewa Człowiek jest bardziej spokrewniony z szympansem niż z jakimkolwiek innym taksonem Kapucynka, marmozeta i wyjec tworzą odrębny klad (małpy szerokonose), tak samo lemur i wyrak (małpiatki) Zgodnie z przypuszczeniami świnka morska i mysz są spokrewnione z człowiekiem najsłabiej, należą one do gryzoni

Dziękujemy za uwagę Bibliografia: "Bioinformatyka i ewolucja molekularna", Higgs P.G., wydawnictwo: PWN, 2004 http://www.ncbi.nlm.nih.gov/ Zdjęcia: wikipedia.org