Wstęp do Biologii Obliczeniowej

Podobne dokumenty
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Dopasowanie sekwencji (sequence alignment)

Bioinformatyka Laboratorium, 30h. Michał Bereta

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Porównywanie i dopasowywanie sekwencji

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Bioinformatyka 2 (BT172) Struktura i organizacja kursu

Statystyczna analiza danych

Porównywanie i dopasowywanie sekwencji

PRZYRÓWNANIE SEKWENCJI

Księgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna

Dopasowania par sekwencji DNA

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Badanie doboru naturalnego na poziomie molekularnym

Analizy filogenetyczne

Acknowledgement. Drzewa filogenetyczne

Bioinformatyka Laboratorium, 30h. Michał Bereta

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Wykład 5 Dopasowywanie lokalne

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Przyrównywanie sekwencji

Wyróżniamy dwa typy zadań projektowych.

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Biologia medyczna, materiały dla studentów

Zmienność ewolucyjna. Ewolucja molekularna

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Algorytmy kombinatoryczne w bioinformatyce

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Rozkład materiału z biologii dla klasy III AD. 7 godz / tyg rok szkolny 2016/17

MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA. Biomatematyka Dr Wioleta Drobik-Czwarno

Algorytmika dla bioinformatyki

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Bioinformatyka Laboratorium, 30h. Michał Bereta

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Filogenetyka molekularna I. Krzysztof Spalik

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

Podstawy biologii. Podstawy biologii molekularnej

Motywacja. Do tej pory: Dzisiaj:

Filogenetyka molekularna I. Krzysztof Spalik Zakład Filogenetyki Molekularnej i Ewolucji

Mutacje jako źródło różnorodności wewnątrzgatunkowej

Generator testów Bioinformatyka wer / 0 Strona: 1

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Szczegółowy harmonogram ćwiczeń Biologia medyczna w Zakładzie Biologii w roku akademickim 2017/2018 Analityka Medyczna I rok

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

Techniki optymalizacji

Algorytmy genetyczne

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Grafy i sieci wybrane zagadnienia wykład 3: modele służące porównywaniu sieci

Motywy i podobieństwo

Algorytmy kombinatoryczne w bioinformatyce

3 Przeszukiwanie baz danych

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

Wymagania edukacyjne

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

1. KEGG 2. GO. 3. Klastry

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

przedmiotu Nazwa Wydział Nauk Medycznych i Nauk o Zdrowiu Kierunek jednolite studia magisterskie Profil kształcenia (studiów)

Filogenetyka molekularna I

Teoria ewolucji. Podstawy wspólne pochodzenie.

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Metoda dokładnej rekonstrukcji drzew filogenetycznych genów. współczynników substytucji dla genów i gatunków

Uczeń potrafi. Dział Rozdział Temat lekcji

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

klasyfikacja fenetyczna (numeryczna)

1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

PODSTAWY BIOINFORMATYKI

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

Mitochondrialna Ewa;

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Testowanie hipotez statystycznych

Tematyka zajęć z biologii

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Wybrane techniki badania białek -proteomika funkcjonalna

Autor: mgr inż. Agata Joanna Czerniecka. Tytuł: Nowa metoda obliczeniowa porównywania sekwencji białek

Szczegółowy harmonogram ćwiczeń Biologia i genetyka w Zakładzie Biologii w roku akademickim 2015/ I rok Kosmetologia

Wstęp do programowania

Transkrypt:

Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018

Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko, komplementarność sekwencji, replikacja DNA, kod genetyczny Widmo k-merowe sekwencji, sekwencjonowanie przez hybrydyzację, podejście Eulerowskie i Hamiltonowskie, Grafy debruijna Mikromacierze, problem projektowania unikalnych sond dla mikromacierzy, temperatura topnienia DNA

Ewolucja sekwencji biologicznych Koncepcja jednego drzewa filogenetycznego łączącego wszystkie organizmy żywe jako liście Replikacja DNA, mutacje, selekcja Parsymoniczne modele ewolucji, odwracalność czasu, rekonstrukcja sekwencji przodka Modele Markowa ewolucji DNA (JC69, K80, F81), parametryzacja, estymacja odległości ewolucyjnej na podstawie mutacji, estymacja parametrów modelu Modele ewolucji sekwencji białkowych: PAM, BLOSSUM, macierze log-odds

Porównywanie 2 sekwencji Odległość Hamminga i zliczanie mutacji, rodzaje mutacji (kodujące i nie-kodujące), Macierze identyczności Rodzaje błędów w replikacji DNA insercje, delecje, substytucje i sposoby ich powstawania Odległość edycyjna, scenariusze edycyjne, optymalne scenariusze, problemy z wyliczaniem Uliniowienia: definicja, relacja ze scenariuszem edycyjnym, przestrzeń uliniowień, uliniowienia lokalne i globalne, ocena podobieństwa sekwencji Algorytmy do znajdowania uliniowień globalnych i lokalnych (Needleman-Wunsh, Smith-Waterman) Kary za przerwę: stałe, afiniczne

Konstrukcja drzew filogenetycznych Macierze odległości vs. Macierze podobieństwa Drzewa filogenetyczne, binarne i gwiaździste, ukorzenione i nieukorzenione, ukorzenianie, przestrzeń drzew Macierze odległości vs. Drzewa filogenetyczne, ultrametryczność, algorytm UPGMA (klastrowanie hierarchiczne) Hipoteza zegara ewolucyjnego, drzewa nieultrametryczne, algorytm neghbor-joining

Uliniowienia wielu sekwencji Niezgodności w estymacji sekwencji przodka na podstawie wielu porównań parami Multi-uliniowienie definicja jako uogólnienie uliniowienia 2 sekwencji, brak interpretacji edycyjnej Miara sumy par (SP) dla multi-uliniowień, naiwny algorytm (rozwinięcie programowania dynamicznego), heurystyczne poprawki (Carillo-Lipmann), NP-trudność problemu Uliniowienie progresywne pojęcie profilu i uliniawiania profilów, algorytm CLUSTALW, problemy z uliniowieniem progresywnym, heurystyki T- Coffee i MUSCLE

Ukryte modele Markowa Ukryte Modele Markowa (HMM) z czasem dyskretnym, macierz przejścia, macierz emisji, symulacje przebiegów(trajektorii), ciąg stanów, ciąg emisji Znajdowanie przebiegu na podstawie ciągu emisji (algorytm Viterbiego) Znajdowanie prawdopodobieństw przejścia przez stan w danym kroku (metoda forward-backward) Estymacja macierzy przejścia i emisji (algorytm Bauma-Welcha)

Modele Markowa do uliniowień Modele wyższego rzędu do reprezentacji generatywnej sekwencji (np. wyspy CpG) Modele interpolowane (IMM) do reprezentacji złożonych sekwencji Ukryte Modele Markowa do profilów sekwencyjnych (HMMER) Modele o zmiennym rzędzie (VOM)

Wyszukiwanie sekwencji podobnych Ogromne podobieństwo sekwencji genowych pomiędzy bardzo odległymi gatunkami Bazy danych sekwencji, cele i zasady działania Problem wyszukiwania sekwencji: krótka sekwencja zapytania, bardzo duża baza, konieczność wykonywania wielu zapytań Problemy z uliniowieniem, heurystyczne podejście, algorytm FASTA Alforytm BLAST: metoda, model statystyczny oceny trafień, testowanie hipotez, rozkład wartości ekstremalnych

Relacje homologii i funkcje genów Duplikacje i specjacje jako model ewolucji funkcji genów Szybsza ewolucja paralogów i neo-funkcjonalizacja Onologi i ksenologi Różne rodzaje rodzin genów w zależności od tolerancji dla paralogów Wyszukiwanie potencjalnych homologów: dwustronne trafienia BLAST i klastry genów ortologicznych Ontologie funkcjonalne Gene Ontology Testy statystyczne nadreprezentacji funkcji: test Fishera i Gene-Set Enrichment Analysis (GSEA)

Uzgadnianie drzew Drzewa genów i drzewa gatunków, scenariusze ewolucyjne, uzgodnienie drzew, relacja scenariusza ewolucyjnego i relacji para- orto-logii Różne funkcje kosztów uzgadniania: duplikacje, straty, koalescencja Mapowanie LCA i jego relacja z kosztami (D,L, DL, DC) Znajdowanie optymalnego uzgodnienia w sensie DL Horyzontalne transfery genów i sieci filogenetyczne Przykłady zastosowania uzgadniania do rzeczywistych danych

Motywy sekwencyjne Rola niekodującego DNA i wiązanie czynników transkrypcyjnych Miejsca wiązania i ich uliniowienia bez spacji Macierze zliczeń, częstości i log-odds (PWM) Zawartość informacyjna pozycji i logo motywu Bazy danych motywów Problem wyszukiwania motywów, algorytmy AlignACE i MEME

Mapowania odczytów NGS Metody sekwencjonowania Sangera i nowej generacji: wady i zalety Problem mapowania krótkich sekwencji na znany genom Drzewa sufiksowe, macierze sufiksowe, transformata Burrowsa-Wheelera Efektywność indeksów opartych na BWT (indeks Ferraginy-Manziniego) Różnorodność genetyczna w populacji, problem błędów, metoda dzielenia odczytów Szybkie metody kwantyfikacji odczytów: STAR, Kallisto