Bioinformatyka wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013 Krzysztof Pawłowski
Wykład 8.X.2012 Co to jest bioinformatyka? Program wykładów Zastosowanie bioinformatyki: sekwencjonowanie genomów
definicja bioinformatyki / biologii obliczeniowej Rozwiązywanie problemów biologicznych metodami obliczeniowymi Solving biological problems by computational means Some synonyms: In silico biology Computational biology / Biocomputing Theoretical biology Substantial overlaps: Computational chemistry / cheminformatics Systems biology Structural biology Theoretical biophysics
Zakres zainteresowań bioinformatyki Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms Objects attributes: sequences, 3-D structures, expression data, clinical data, publications,.
oficjalne definicje NIH Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data. Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.
Bioinformatics (wikipedia) Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.
Bioinformatics (wikipedia, contd.) The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.
Bioinformatyka (wikipedia) Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatyką powiązane są: genomika, proteomika, metabolomika i transkryptomika.
100000 bioinformatyka nowa dyscyplina? Publikacje bioinformatyczne (PubMed) 10000 1000 100 10 1 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 ale pod innymi nazwami rozwijała się przynajmniej od lat 60.
Dygresja. Syn na zawsze w głowie matki Wojciech Moskal, sciencemag.org 30.09.2012, aktualizacja: 30.09.2012 16:35 Kobiety, które są w ciąży z chłopcami, zatrzymują część ich materiału genetycznego. Synowskie DNA rozsiewa się nawet do matczynych mózgów - dowiedli naukowcy z USA Powiedzenie, że syn jest oczkiem w głowie matki, nabiera więc całkiem nowego znaczenia. W końcu oko to narząd zmysłu, jest więc integralną częścią układu nerwowego. A uczeni z Ośrodka Badań nad Rakiem im. Freda Hutchinsona w Seattle pracujący pod wodzą dr J. Lee Nelson znaleźli obcy materiał genetyczny w najważniejszej części tego układu - korze mózgowej. Co więcej, to specyficzne "zanieczyszczenie", opisane w ostatnim wydaniu magazynu "PloS ONE", prawdopodobnie chroni matkę przed niektórymi chorobami.
Bioinformatyka w Google 17 500 000 126 000 000 27 700 000 47 300 241 000 1 160 000 1 140 000 1 730 000 bioinformatics bioinformatyka bioinformatika bioinformatik bioinformatica bioinformatique biology biologia
BIOINFORMATYKA - dziedzina interdyscyplinarna bioinformatyka biologia (molekularna) = + dane biologiczne informatyka narzędzia,metody i obliczenia komputerowe fizyka i chemia
BIOINFORMATYKA - cele Organizowanie i zarządzanie informacjami o makrocząsteczkach i innych danych biologicznych w formie skomputeryzowanych (cyfrowych) zapisów - baz danych Analiza tych danych za pomocą metod obliczeniowych, rozwój metod i algorytmów
BIOINFORMATYKA - poziomy analiz DNA mrna białka interakcje i metabolizm
BIOINFORMATYKA - poziomy analiz poziom badań przedmiot badań dziedzina badań tematy badań genom wszystkie sekwencje DNA zawarte w organizmie, geny, sekwencje regulatorowe genomika poszukiwanie sekwencji kodujących, rozpoznawanie eksonów i intronów, organizacja genomów, porównanie sekwencji transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomika analiza ekspresji genów proteom wszystkie białka zawarte w organizmie proteomika porównanie sekwencji, identyfikacja zachowanych regionów, przewidywannie struktury, oddziaływania metabolom wszystkie procesy metaboliczne zachodzące w organizmie, metabolity metabolomika określanie sieci i szlaków metabolicznych, symulacje
Program wykładów Genomy Sekwencje biologiczne Biologiczne bazy danych Struktury makrocząsteczek biologicznych Elementy biologii systemowej Elementy epigenetyki dygresje w stronę biologii, fizyki, chemii
zaliczenie Ćwiczenia: lista obecności & kolokwium (a) Wykład: kolokwium (b) Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2
1977 Sekwencjonowanie DNA Sanger i współpr. metoda terminacji łańcucha, dideoksy 1987 Prober i współpr. znakowanie fluorescencyjne i zautomatyzowanie metody
Etapy sekwencjonowania genomów Oczyszczanie chromosomów Pofragmentowanie metodą sonikacji na odcinki o długości 100 kpz (kbp) lub większe Klonowanie fragmentów w wektorach (YAC, BAC) Tworzenie mapy chromosomu Wybór zachodzących pojedynczych klonów do sekwencjonowania
Obróbka bka sekwencji HTGS Faza 0 Faza 1 Faza 2 Faza 3 contigs
Sekwencjonowanie genomów 1977 1981 1995 Sanger i współpr. - fag X 174 (5,4 tys. pz) Anderson i współpr. - mtdna człowieka (17 tys. pz) Fleischmann i współpr. - Haemophilus influenzae (1.8 mln pz) Fraser i współpr. - Mycoplasma genitalium (0.6 mln pz) 1997 Blattner i współpr. Escherichia coli (4.6 mln pz) Kunst i współpr. Bacillus subtilis (4.2 mln pz)
Sekwencjonowanie genomów 1996 1997 Goffeau i współpr. Saccharomyces cerevisiae (13 mln pz) 1998 The C. elegans Sequencing Consortium Caenorhabditis elegans (100 mln pz)
Sekwencjonowanie genomu człowieka Celera Genomics od 1998 Human Genome Project od 1990 VI 2000 OIgłoszenie zakończenie prac nad wstępną wersją genomu ludzkiego; zsekwencjonowano: 99 % 85 % Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą współpracować w końcowej fazie badań po okresie zażartej konkurencji. Craig Venter Francis Collins
Celera Genomics Human Genome Project II 2001 niezależna publikacja wyników w: Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM
Kompletnie zsekwencjonowane genomy Eucaryota: Drosophila melanogaster OWADY (2) Saccharomyces cerevisiae Schizosaccharomyces pombe Candida glabratha Encephalitozoon cuniculi GB-M1. Caenorhabditis elegans GRZYBY (17) Entamoeba histolytica Plasmodium falciparum Trypanosoma cruzi. NICIENIE (1) KRĘGOWCE (3) PIERWOTNIAKI (8) Homo sapiens Mus musculus Arabidopsis thaliana Oryza sativa ROŚLINY (5)
Prywatne genomy medycyna zindywidualizowana? James Watson (2008) Craig Venter (2007)