IV107 Bioinformatika I

Podobne dokumenty
IV107 Bioinformatika I

Internet a zdroje. (Zdroje na Internetu) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17.

Martin Pergel. 26. února Martin Pergel

Úvodní informace. 18. února 2019

Rovnice proudění Slapový model

PA152,Implementace databázových systémů 2 / 25

Matematika 2, vzorová písemka 1

Zásuvný modul QGISu. QGIS plugin pro práci s katastrálními daty

Kombinatorika a grafy I

Paradoxy geometrické pravděpodobnosti

Stavový popis Stabilita spojitých systémů (K611MSAP) Katedra aplikované matematiky Fakulta dopravní ČVUT. čtvrtek 20. dubna 2006

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Historia Bioinformatyki

Logika V. RNDr. Kateřina Trlifajová PhD. Katedra teoretické informatiky Fakulta informačních technologíı BI-MLO, ZS 2011/12

MATEMATIKA 3. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Powyższe reguły to tylko jedna z wersji gry. Istnieje wiele innych wariantów, można też ustalać własne zasady. Miłej zabawy!

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

Funkce zadané implicitně. 4. března 2019

Co nám prozradí derivace? 21. listopadu 2018

Modelov an ı v yukov ych dat, obt ıˇznosti probl em u Radek Pel anek

Matematická analýza II pro kombinované studium. Konzultace první a druhá. RNDr. Libuše Samková, Ph.D. pf.jcu.cz

Ewolucja genów i genomów

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

Kristýna Kuncová. Matematika B2 18/19

IEL Přechodové jevy, vedení

IB047. Pavel Rychlý. 21. února

TGH01 - Algoritmizace

(2) Funkce. Kristýna Kuncová. Matematika B2. Kristýna Kuncová (2) Funkce 1 / 25

Inverzní Z-transformace

Automatové modely. Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Kristýna Kuncová. Matematika B3

Představení projektu

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

Klasifikační metody (nejen) pro molekulárně genetická data

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

5. a 12. prosince 2018

Kontakt.

Návod k obsluze 2 Ďäçăßĺň ńţóçň 10 Instrukcja obsugi 18 Kullanma Kýlavuzu 26

(1) Derivace. Kristýna Kuncová. Matematika B2 17/18. Kristýna Kuncová (1) Derivace 1 / 35

Ekologia molekularna. wykład 11

Numerické metody 8. května FJFI ČVUT v Praze

Paradigmata programování 2

(13) Fourierovy řady

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

TVL LED NÁVOD K POUŽITÍ NÁVOD NA POUŽITIE

NÁVOD K POUŽITÍ KEZELÉSI KÉZIKÖNYV INSTRUKCJA OBSŁUGI NÁVOD NA POUŽÍVANIE. Česky. Magyar. Polski. Slovensky

Vlastnosti. Příprava. Czech - 2 -

PODSTAWY BIOINFORMATYKI

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Kapitola 4: Soustavy diferenciálních rovnic 1. řádu

ZÁVĚREČNÁ KONFERENCE Poslanecká sněmovna PČR Praha MEZINÁRODNÍ DOTAZNÍKOVÉ ŠETŘENÍ ANKIETY MIEDZYNARODOWE

Edita Pelantová, katedra matematiky / 16

Numerické metody minimalizace

Kristýna Kuncová. Matematika B2 18/19. Kristýna Kuncová (1) Vzorové otázky 1 / 36

TVL UMP2 NÁVOD K POUŽITÍ NÁVOD NA POUŽITIE

TGH01 - Algoritmizace

GENETICKÉM PROGRAMOVÁNÍ

ULS4805FE. Návod k použití Návod na použitie Instrukcja obsługi Instruction Manual Használatı utasítás. Licensed by Hyundai Corporation, Korea

Matematika III Stechiometrie stručný

Vybrané kapitoly z matematiky

Vladimír Ulman Centre for Biomedical Image Analysis. 10th October, 2007 FI MU, Brno

Kristýna Kuncová. Matematika B2

Elementární funkce. Edita Pelantová. únor FJFI, ČVUT v Praze. katedra matematiky, FJFI, ČVUT v Praze

Uvod Symbolick e modelov an ı Neuronov e s ıtˇ e Shrnut ı Modelov an ı myˇslen ı Radek Pel anek

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

ggplot2 Efektní vizualizace dat v prostředí jazyka R Martin Golasowski 8. prosince 2016

Plan wykładów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

HL24285SMART. Návod k použití Návod na použitie Instrukcja obsługi Használatı utasítás. Licensed by Hyundai Corporation, Korea

Analizy wielkoskalowe w badaniach chromatyny

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka wykład I.2009

Linea rnı (ne)za vislost

A71100TSW0 CS MRAZNIČKA NÁVOD K POUŽITÍ 2 PL ZAMRAŻARKA INSTRUKCJA OBSŁUGI 18 SL ZAMRZOVALNIK NAVODILA ZA UPORABO 35

Cauchyova úloha pro obyčejnou diferenciální rovnici

Bioinformatyczne bazy danych

Reprezentace dat. BI-PA1 Programování a Algoritmizace I. Ladislav Vagner

Rekrutacja List Motywacyjny

DVD P ehrávaã UÏivatelská p íruãka

Politechnika Wrocławska. BIOINFORMATYKA i BIOLOGIA OBLICZENIOWA

Podrêcznik podstawowej konfiguracji po³¹czeñ Wi-Fi

DXDB 215 NÁVOD K POUŽITÍ NÁVOD NA POUŽITIE INSTRUKCJA OBSŁUGI USER MANUAL

L FL L FL CS PRAČKA NÁVOD K POUŽITÍ 2 PL PRALKA INSTRUKCJA OBSŁUGI 34

Jan Tattermusch Databáze sekundárních struktur RNA

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

GENETICKÉ PROGRAMOVÁNÍ S JAZYKEM BRAINFUCK

ISBN

EWP W... CS PRAČKA NÁVOD K POUŽITÍ 2 PL PRALKA INSTRUKCJA OBSŁUGI 28

Příručka k rychlé instalaci: NWD2105. Základní informace. 1. Instalace softwaru

z geoinformatických dat

Přehled aplikací matematického programovaní a

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

Platforma pro analýzu, agregaci a vizualizaci otevřených dat souv

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Úvod 1 / 32

Expresivní deskripční logiky

Numerické metody a statistika

Bioinformatyka. Krzysztof Pawłowski. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013

Matematika 1 Jiˇr ı Fiˇser 24. z aˇr ı 2013 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 24. z aˇr ı / 52

Design of Experiment (DOE) Petr Misák. Brno 2016

Transkrypt:

IV107 Bioinformatika I Přednáška 1 Katedra informačních technologií Masarykova Univerzita Brno Jaro 2011

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Kontaktní údaje Dr. Matej Lexa, C506 (lexa@fi.muni.cz) Přednáška Po 08:00-09:50 (B410) Konzultace Čt 13:00-15:00 http://www.fi.muni.cz/ lexa/teaching.html

Studijní literatura 1. Zvelebil and Baum (2007). Understanding bioinformatics, Garland Science, Oxford, 772 s. (ISBN: 0-8153-4024-9) 2. Krane and Raymer (2005). Fundamental concepts in bioinformatics, Benjamin Cummings, London, 320 s. (ISBN 0-8053-4633-3) 3. Claverie (2005). Bioinformatics for dummies, Wiley Publishing, Hoboken, 452 s. (ISBN: 0-7645-1696-5)

Vědecké časopisy Bioinformatics BMC Bioinformatics J. of Bioinformatics and Computational Biology Briefings in Bioinformatics Genome Informatics Theoretical Biology and Medical Modelling InSilico Biology Biosemiotics

Obor bioinformatika na FI Bakalářská a magisterská úroveň Lze zvolit i v průběhu studia Základní sada předmětů Aplikované informatiky na FI a čtyři předměty na LF a PřF. Povinnost vypracovat bioinformatickou závěrečnou práci http://www.fi.muni.cz/ lexa/teaching.html.cz https://is.muni.cz/auth/setkavani/kruh.pl?kruh id=7161 Bioinformatika@FI Muni

Navazující předměty FI IV108 - Bioinformatika II (podzim) IV105/IV106 - Seminář z bioinformatiky P/G (Út 8:00 B411) IV110/IV114 - Projekt z bioinformatiky (podzim) IV116 - Evolutionary Bioinformatics (podzim?) PB051 - Výpočetní metody v bioinformatice a systémové biologii

Příbuzné předměty FI IV109 - Modelování a simulace IV117/8 - Systémová biologie

Harmonogram kurzu Rychlý úvod do molekulární biologie (do poloviny března) Semestrální test (březen/duben)

Klasifikace Hodnotí se Semestrální test 20 bodů Zkouška 80 bodů Klasifikační stupnice A 90-100 B 80-89 C 70-79 D 60-69 E 50-59 F méně než 50

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Definice bioinformatiky Bioinformatika Studuje metody shromážd ování, spřístupňování a analýzy rozsáhlých souborů biologických dat, zejména molekulárně biologických. Další disciplíny Výpočetní nebo matematická biologie matematické přístupy k reprezentaci a zkoumání biologických procesů, často simulace Lékařská informatika práce s medicínskými daty, převážně záznamy pacientů

Předmětem zájmu nebo používanými metodami se bioinformatika prolíná s 1. molekulární biologií 2. genomikou a proteomikou 3. genetikou 4. výpočetní biologií 5. matematickou či teoretickou biologií 6. systémovou biologií 7. biomedicínskou informatikou 8. biomedicínským inženýrstvím 9. výpočetní chemií 10. informatikou 11. počítačovou lingvistikou Převzato z http://cz.wikipedia.org/wiki/bioinformatics 16.2.2008

Typické okruhy problémů Analýza sekvencí Anotace genomů Evoluční bioinformatika Studium biodiverzity Analýza exprese genů Analýza genové regulace Analýza proteomu Odhad struktury proteinů Srovnávací genomika Modelování biologických systémů Analýza obrazu Studium strukturních interakcí proteinů Převzato z http://en.wikipedia.org/wiki/bioinformatics 16.2.2008

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Buňka základní forma organizace živé hmoty Molekuly (DNA, proteiny, sacharidy, lipidy) Geny (abstraktní pojem) Proteinové komplexy/membrány Organely a jiné substruktury Buňka Tkáň/pletivo Organizmus

Složitost biologických systémů na molekulární úrovni Člověk: cca 10 14 buněk. Buňka: 3 10 9 párů nukleotidů DNA (A:T a C:G). Nukleotidy: vytváří sřetězenými kombinacemi cca 20000 genů (a statisíce funkčních míst) Geny: kódují (a aktivitou vytváří) staticíce molekul (proteinů a RNA) Buňka: aktivuje v daném momentu určitou podmnožinu této sady Výsledek: obrovské množství možných stavů buněk (2 20000 je velmi podceňující odhad) Geny: evolucí vybrané sady z cca 4 1000 možných sekvencí DNA (1000 nukl./gen)

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Sekvence DNA a RNA Sekvence proteinů Struktura proteinů Údaje o aktivitě genů DNA čip, microarray, RNA-Seq Údaje o expresi proteinů 2-D gely + MS Mapy interakcí mezi proteiny a DNA - Chip-Seq Mapy interakcí mezi proteiny navzájem - Y2H Literatura

Sekvenční data AUGACAGUUGACGAGUGCA ATAGCAGTGCGCATGCAGT MASAQSFYLLMDDHLAVFM

Sekvenční data DNA ATAGCAGTGCGCATGCAGT RNA AUGACAGUUGACGAGUGCA Protein MASAQSFYLLMDDHLAVFM

Strukturní data Zobrazení struktury proteinu

Spřístupnění dat uživatelům NCBI Genome Viewer Zobrazení informací o genech na chromozomu

Spřístupnění dat vývojářům Grafika je zbytečná. Prvořadá je rychlost a možnost automatizace manipulace s daty BioJava, BioPerl, BioPython, Bioconductor (R) a další knihovny pro většinu jazyků a prostředí servery poskytující syrová data (holý text, obrázky, XML a jiné struktury přes HTTP, SOAP, ODBC)

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Stopy bioinformatiků na webu výraz Google (tis. výskytů) 2004 2011 et tu brutus 212 195 in vino veritas 162 1130 veni vidi vici 132 2340 in vivo (biolog) 19100 11400 in vitro (biochemik) 12900 18000 in silico (bionformatik) 349 1790

Práce bioinformatika Umí pracovat s velkými datovými soubory Moudrými triky ovláda výkonné počítače V datech hledá zajímavé subsekvence Srovnává podobné sekvence Předpovídá strukturu a funkci genů a proteinů Studuje vývoj sekvencí a organizmů Data a výsledky analýz zobrazuje graficky

Způsob nahlížení na data KLASIK směs biologie, chemie, fyziky atd. MECHANIK živé buňky jsou stroje, které chceme pochopit a ovládat HRA sekvence jsou definiční soubory hráčů SEMIOTIK život je signalizace a interpretace signálů JAZYK sekvence se skládají z modulů (slov) s určitou funkcí vykazujících gramatické uspořádání

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Kořeny a zdroje bioinformatiky 1951 Pauling struktura proteinů 1952 Turing chem. základy vývoje 1953 Watson, Crick, Franklin struktura DNA 1956 Gamow et al. genetický kód 1959 Chomsky gramatiky 1962 Shannon a Weaver informační teorie 1966 Martin-Lof náhodné řetězce 1966 Neumann automata 1969 Britten a Davidson génová regulace

Historie bioinformatiky do sformování disciplíny 1967 Fitch and Margoliash: sestrojení prvních fylogenetických stromů z bilogocké sekvence 1970 Needleman and Wunsh: zarovnání dvou sekvencí 1974 Chou and Fasman: predikce sekundární struktury proteinů 1978 Dayhoff: první sbírka sekvencí proteinů 1981 Kabsch and Sander: modelování struktury proteinů 1987 Feng and Doolitle: mnohonásobné zarovnání sekvencí 1990 Altschul et al.: efektivní hledání lokálních podobností 1998 The Journal Comp Appl Biosci se přejmenovává na Bioinformatics

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Jim Kent autor Aegis Animator, Cyber Paint a Autodesk Animator po shlédnutí 12-ti CD vývojového prostředí Windows 95 přechází k bioinformatikům s posteskem, že lidský genom se vejde na jedno CD autor webové aplikace Genome Browser sehrává důležitou roli v honičce o přečtení a skompletování lidského genomu (program GigAssembler) Převzato z Jim Kent: The Genes, the Whole Genes, and Nothing But the Genes, BioCon 2003.

UCSC Genome Browser Flexibilní nástroj určen k interaktivnímu prohlížení genomů

Homo/Homo rozdíl každých 1000 nukleotidů 90% variace je mezi africkými populacemi na Zemi je tolik lidí a četnost mutací je tak vysoká, že každý ze jmenovaných nukleotidů je v dané generaci mutován několik krát lidský genom obsahuje stovky nepříjemných mutací. Většina je recesivních, projeví se jenom ojediněle, pokud je mají oba rodiče Převzato z Jim Kent: The Genes, the Whole Genes, and Nothing But the Genes, BioCon 2003.

Homo/Pan rozdíl každých 100 nukleotidů transpozon každých 50000 nukleotidů dva chromozomy spojené, jinak podobná struktura Podle Jim Kent: The Genes, the Whole Genes, and Nothing But the Genes, BioCon 2003.

Homo/Mus 40% nukleotidů byli od dob společného předka změněny Ve funkčních oblastech se změnilo jenom 15% nukleotidů úseky podobnosti mezi genomy člověka a myši jsou kandidáti na biologické funkce Převzato z Jim Kent: The Genes, the Whole Genes, and Nothing But the Genes, BioCon 2003.

Homo/Caenorhabditis Asi 80% nukleotidů změněno (35% ve funkčních oblastech) Převzato z Jim Kent: The Genes, the Whole Genes, and Nothing But the Genes, BioCon 2003.

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Objem dat bude nadále narůstat Základní výskum Medicína a jiné aplikace Bezpečnost na molekulární úrovni Komerční data V současnosti např. nastupuje osobní genomika

HT-Seq: objem dat z jednoho mereni a cena za 1 Mbp Solexa pyrosequencing (Illumina) 18 Gbp $2 454 (Roche) 0.5 Gbp $60 (ale delší sekvence) SOLiD (Life Technologies) 24 Gbp $2 Heliscope (Helicos) 28 Gbp $1 Polonator (Danaher Motion) 8 Gbp $1 Zero-mode waveguide sequencing (Pacific Biosciences) 10 Gbp? $10? Nanoball sequencing (CompleteGenomics) 70 Gbp $1 FRET sequencing (Visigen)? Nanopore sequencing (Oxford Nanopore)?

Porovnávání sekvencí >P11633 NONHISTONE CHROMOSOMAL PROTEIN 6B. Score = 54.8 bits (155), Expect = 1e-10 Identities = 19/43 (46%), Positives = 24/43 (62%) Query: 2 TKKFKDPNRPPSAFFLFCSEYRKIKGEHPGLSIGDVAKKLGEM 52 : T : KDPNR SA: F :E R I E:P :: G V : LGE Sbjct: 5 TTRKKDPNRGLSAYMFFANENRDIRSENPDVTFGQVGRILGER 55

Analogie biosekvence jazyk 1. Mam z toho velkou radost. 2. Mam toho kocoura dost. Mamztohovelk ouradost. ::: :::: : ::::::::: Mam toho kocouradost.

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Informace v DNA určuje existenci proteinů v buňce

Příště struktura DNA a preotinů Struktura DNA Struktura proteinů Přenos genetické informace

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů

Outline Úvod do bioinformatiky Organizační záležitosti Zaměření bioinformatiky Objekty: geny, molekuly, buňky Práce bioinformatika Historie bioinformatiky Zkoumání lidského genomu Aktuální problémy Molekulární biologie v kostce Centrální dogma Struktura DNA Transkripce a translace Struktura proteinů