Bioinformatyka wykłady dla I r. studiów magisterskich, biologia (SGGW) 2007/2008 Wykład 1, 4.X.2007 Krzysztof Pawłowski
Wykład 4.X.2007 Co to jest bioinformatyka? Program wykładów Sekwencjonowanie DNA Sekwencjonowanie genomów
definicja bioinformatyki / biologii obliczeniowej Rozwiązywanie problemów biologicznych metodami obliczeniowymi Solving biological problems by computational means Some synonyms: In silico biology Biocomputing Theoretical biology Substantial overlaps: Computational chemistry / cheminformatics Systems biology Structural biology Theoretical biophysics
Zakres zainteresowań bioinformatyki Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms Objects attributes: sequences, 3-D structures, expression data, clinical data, publications,.
oficjalne definicje NIH Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data. Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.
ale pod innymi nazwami rozwijała się przynajmniej od lat 1960-tych bioinformatyka nowa dyscyplina? Publikacje bioinformatyczne (PubMed) 10000 1000 100 10 1 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 bioinformatics[text Word] bioinformatics[mesh Heading]
Bioinformatyka w Google 17 500 000 126 000 000 27 700 000 47 300 241 000 1 160 000 1 140 000 1 730 000 bioinformatics bioinformatyka bioinformatika bioinformatik bioinformatica bioinformatique biology biologia
BIOINFORMATYKA - dziedzina interdyscyplinarna bioinformatyka biologia (molekularna) = + dane biologiczne informatyka narzędzia,metody i obliczenia komputerowe dane dotyczące kwasów nukleinowych, białek, lipidów, węglowodanów i innych makrocząsteczek nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria prawdopodobieństwa
BIOINFORMATYKA - dziedzina interdyscyplinarna bioinformatyka biologia (molekularna) = + dane biologiczne informatyka narzędzia,metody i obliczenia komputerowe dane dotyczące kwasów nukleinowych, białek, lipidów, węglowodanów i innych makrocząsteczek fizyka i chemia nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria prawdopodobieństwa
BIOINFORMATYKA - cele Organizowanie i zarządzanie informacjami o makrocząsteczkach i innych danych biologicznych w formie skomputeryzowanych (cyfrowych) zapisów - baz danych Analiza tych danych przy pomocy metod obliczeniowych, rozwój metod i algorytmów
BIOINFORMATYKA - poziomy analiz DNA mrna białka interakcje i metabolizm
BIOINFORMATYKA - poziomy analiz poziom badań przedmiot badań dziedzina badań tematy badań genom wszystkie sekwencjie DNA zawarte w organizmie, geny, sekwencje regulatorowe genomika poszukiwanie sekwencji kodujących, rozpoznawanie eksonów i intronów, organizacja genomów, porównanie sekwencji transkryptom wszystkie sekwencie RNA zawarte w organizmie transkryptomika analiza ekspresji genów proteom wszystkie białka zawarte w organizmie proteomika porównanie sekwencji, identyfikacja zachowanych regionów, przewidywannie struktury, oddziaływania metabolom wszystkie procesy metaboliczne zachodzące w organizmie, metabolity metabolomika określanie sieci i szlaków metabolicznych, symulacje
Program wykładów Genomy Sekwencje biologiczne Biologiczne bazy danych Struktury makrocząsteczek biologicznych Elementy biologii systemowej Elementy epigenetyki dygresje w stronę biologii, fizyki, chemii
zaliczenie Ćwiczenia: lista obecności & kolokwium (a) Wykład: kolokwium (b) Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2
Literatura
Literatura http://www.ncbi.nlm.nih.gov/books
Baxevanis, Ouelette
1977 Sekwencjonowanie DNA Sanger i współpr. metoda terminacji łańcucha, dideoksy 1987 Prober i współpr. znakowanie fluorescencyjne i zautomatyzowanie metody analizator DNA (sekwenser) ABI PRISM 3700
Oczyszczanie fragmentów DNA: wyciętych z klonów plazmidowych lub fagowych zamplifikowanych przez PCR Denaturacja (pojedyncze nici) Hybrydyzacja ze starterem oligonukleotydowym Synteza nowej nici DNA od końca startera przy pomocy: polimerazy Taq puli trifosforanów deoksyrybonukleotydów (datp, dttp, dgtp, dctp) puli trifosforanów dideoksynukleotydów (ddatp, ddttp, ddgtp, ddctp) znakowanych fluorescencyjnie i powodujących zakończenie syntezy nici -A-G-T-C-G-T-A-T T-C-A-G-C-A-T-A -A-G-T-C-G-T-A-T T-C-A-G-C-A-T -A-G-T-C-G-T-A-T T-C-A-G-C-A T-C-A-G -A-G-T-C-G-T-A-T T-C-A-G-C -A-G-T-C-G-T-A-T
Elektroforeza kapilarna (sekwencje o długości do 1500 nukleotydów) 0 5 10 15 20 25 GCATATCGGCTAATTGCTCTAGCAC T-C-A-G-C-A-T-A T-C-A-G-C-A-T T-C-A-G-C-A T-C-A-G-C T-C-A-G Odczyt sekwencji 0 5 10 15 20 25 GCATATCGGCTAATTGCTCTAGCAC
Etapy sekwencjonowania genomów Oczyszczanie chromosomów Pofragmentowanie metodą sonikacji na odcinki o długości 100 kpz (kbp) lub większe Klonowanie fragmentów w wektorach (YAC, BAC) Tworzenie mapy chromosomu Wybór zachodzących pojedynczych klonów do sekwencjonowania
Subklonowanie w mniejszych fragmentach Tworzenie mapy subklonów Human Genome Project metoda tradycyjna
Wybór i sekwencjonowanie zachodzących subklonów SEKWENCJONOWANIE ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA Human Genome Project metoda tradycyjna ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA
Subklonowanie w mniejszych fragmentach Sekwencjonowanie wszystkich subklonów i tworzenie bazy komputerowej SEKWENCJONOWANIE Celera Genomics metoda shotgun ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA
Komputerowy zapis sekwencji nukleotydowej G C C A T T C G A lub M A lub S C lub P A C T G G A T A T T A C G T CGTACGTMTASTATAGTACTPC
Obróbka bka sekwencji HTGS Faza 0 Faza 1 Faza 2 Faza 3 contigs
Sekwencjonowanie genomów 1977 Sanger i współpr. - fag ΦX 174 (5,4 tys. pz) 1981 Anderson i współpr. - mtdna człowieka (17 tys. pz) 1995 Fleischmann i współpr. - Haemophilus influenzae (1.8 mln pz) Fraser i współpr. - Mycoplasma genitalium (0.6 mln pz) 1997 Blattner i współpr. Escherichia coli (4.6 mln pz) Kunst i współpr. Bacillus subtilis (4.2 mln pz)
Sekwencjonowanie genomów 1996 1997 Goffeau i współpr. Saccharomyces cerevisiae (13 mln pz) 1998 The C. elegans Sequencing Consortium Caenorhabditis elegans (100 mln pz)
Sekwencjonowanie genomu człowieka Celera Genomics od 1998 Human Genome Project od 1990 VI 2000 ogłoszenie zakończenie prac nad wstępną wersją genomu ludzkiego; zsekwencjonowano: 99 % 85 % Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą współpracować w końcowej fazie badań po okresie zażartej konkurencji. Craig Venter Francis Collins
Celera Genomics Human Genome Project II 2001 niezależna publikacja wyników w: Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM
The diploid sequence of an individual human PLoS Biol (2007) 5:e24 Individualised medicine?
GenBank statystyka Entries Bases Species 5910385 8975089696 Homo sapiens 3693368 4248000223 Mus musculus 440177 2845643085 Rattus norvegicus 334184 684138071 Drosophila melanogaster 364947 340669960 Arabidopsis thaliana 73786 324515226 Oryza sativa (japonica cultivar-group) 196469 220265073 Caenorhabditis elegans 280958 200452421 Danio rerio 140766 196468644 Oryza sativa 299860 195352078 Brassica oleracea 189102 169109095 Tetraodon nigroviridis 160484 161781732 Pan troglodytes 319238 148070112 Zea mays 279229 128872165 Glycine max 242987 128784744 Bos taurus 219188 115991395 Xenopus laevis 174573 112789672 Medicago truncatula 205617 103041525 Triticum aestivum 179025 99099713 Hordeum vulgare 155282 95915175 Anopheles gambiae Grupa Archaea 45 Bacteria 521 Eucaryota 25 liczba genomów zsekwencjonowanych
Liczba całkowicie zsekwencjonowanych genomów bakteryjnych
Kompletnie zsekwencjonowane genomy Eucaryota: Drosophila melanogaster OWADY (1) Saccharomyces cerevisiae Schizosaccharomyces pombe Candida glabratha Encephalitozoon cuniculi GB-M1. Caenorhabditis elegans GRZYBY (10) Entamoeba histolytica Plasmodium falciparum Trypanosoma cruzi. NICIENIE (1) KRĘGOWCE (2) PIERWOTNIAKI (6) Homo sapiens Mus musculus ROŚLINY (4) Arabidopsis thaliana Oryza sativa Oltmansiellopsis viridis Ostreococcus lucimarinus
Za tydzień gen definicja? biologiczne bazy danych