Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2007/2008. Krzysztof Pawłowski

Podobne dokumenty
Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

Bioinformatyka. Krzysztof Pawłowski. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2007/2008. Wykład 1, 4.X.2007 Krzysztof Pawłowski

PODSTAWY BIOINFORMATYKI

PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Podstawy inżynierii genetycznej

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

Metody odczytu kolejności nukleotydów - sekwencjonowania DNA

Od jakiego pułapu startujemy? matematyka

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Historia Bioinformatyki

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Bioinformatyka. Michał Przyłuski

Kontakt.

Bioinformatyka wykład I.2009

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

Podstawy bioinformatyki dla biotechnologów. plan. Od jakiego pułapu startujemy? Wykład 2. Definicja bioinformatyki

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

Rok akademicki: 2014/2015 Kod: EIB BN-s Punkty ECTS: 3. Kierunek: Inżynieria Biomedyczna Specjalność: Bionanotechnologie

Techniki odczytu kolejności nukleotydów - sekwencjonowania DNA

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Bioinformatyczne bazy danych

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes.

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

Bioinformatyczne bazy danych

Bioinformatyczne bazy danych

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej

Genetyka i biologia eksperymentalna studia I stopnia 2017/18/19/20

Klonowanie molekularne Kurs doskonalący. Zakład Geriatrii i Gerontologii CMKP

Genetyka i biologia eksperymentalna studia I stopnia 2018/19/20/21

BIOINFORMATYKA. Gromadzenie informacji:

Podstawy bioinformatyki - biologiczne bazy danych

Public gene expression data repositoris

Politechnika Wrocławska. BIOINFORMATYKA i BIOLOGIA OBLICZENIOWA

GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

KARTA PRZEDMIOTU. (pieczęć wydziału)

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

Metody analizy genomu

Nowoczesne systemy ekspresji genów

Techniki molekularne w mikrobiologii SYLABUS A. Informacje ogólne

Genetyka i biologia eksperymentalna studia I stopnia 2018/19/20/21

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

Podstawy genetyki II. Metody badawcze i strategie genetyki i genomiki. Organizmy modelowe.

Academic year: 2012/2013 Code: EIB BN-s ECTS credits: 4. Electrical Engineering, Automatics, Computer Science and Engineering in Biomedicine

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Biologia medyczna II, materiały dla studentów kierunku lekarskiego

Budowa kwasów nukleinowych

DNA. Wykorzystanie baz danych w biotechnologii. Dr hab. Marcin Filipecki Katedra Genetyki, Hodowli i Biotechnologii Roślin

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

SCENARIUSZ LEKCJI BIOLOGII Z WYKORZYSTANIEM FILMU PCR sposób na DNA.

WARUNKI ZALICZENIA PRZEDMIOTU- 5 ECTS

Sekwencjonowanie wczoraj i dziś

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Techniki znakowania cząsteczek biologicznych - opis przedmiotu

Informatyka w medycynie Punkt widzenia kardiologa

Tytuł: Metody sekwencjonowania DNA. Autor: Magdalena Maniecka. Data publikacji:

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

ETYCZNE ASPEKTY INŻYNIERII GENETYCZNEJ

Organizacja genomu człowieka i sekwencjonowanie DNA

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

Wprowadzenie do bioinformatyki

Biologia Molekularna Podstawy

Genetyka i biologia eksperymentalna studia I stopnia 2017/18/19

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

2. Enzymy pozwalające na manipulację DNA a. Polimerazy DNA b. Nukleazy c. Ligazy

Ekologia molekularna. wykład 11

Ekspresja informacji genetycznej

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

DNA superhelikalny eukariota DNA kolisty bakterie plazmidy mitochondria DNA liniowy wirusy otrzymywany in vitro

PODSTAWY BIOINFORMATYKI 3 SEKWENCJONOWANIE GENOMÓW I

PODSTAWY BIOINFORMATYKI 2 SEKWENCJONOWANIE GENOMÓW

Bioinformatyka Laboratorium, 30h. Michał Bereta

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

Powodzenie reakcji PCR wymaga właściwego doboru szeregu parametrów:

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Podstawowe strategie i techniki genetyki molekularnej

BIOLOGICZNE BAZY DANYCH SYLABUS

METODY MOLEKULARNE STOSOWANE W TAKSONOMII

1

7. Metody molekularne jako źródło informacji botanicznej i lichenologicznej

Metody inżynierii genetycznej SYLABUS A. Informacje ogólne

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Bazy i modele danych

Biologiczne bazy i modele danych

Bioinformatyka Laboratorium, 30h. Michał Bereta

PLAN STUDIÓW. Rodzaj zajęć. e-nauczanie,

WYDZIAŁ INFORMATYKI I NAUKI O MATERIAŁACH

Transkrypt:

Bioinformatyka wykłady dla I r. studiów magisterskich, biologia (SGGW) 2007/2008 Krzysztof Pawłowski

Wykład 4.X.2007 Co to jest bioinformatyka? Program wykładów Sekwencjonowanie DNA Sekwencjonowanie genomów

definicja bioinformatyki / biologii obliczeniowej Rozwiązywanie problemów biologicznych metodami obliczeniowymi Solving biological problems by computational means Some synonyms: In silico biology Biocomputing Theoretical biology Substantial overlaps: Computational chemistry / cheminformatics Systems biology Structural biology Theoretical biophysics

Zakres zainteresowań bioinformatyki Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms Objects attributes: sequences, 3-D structures, expression data, clinical data, publications,.

oficjalne definicje NIH Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data. Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.

Bioinformatics (wikipedia) Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.

Bioinformatics (wikipedia, contd.) The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.

Bioinformatyka (wikipedia) Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatyką powiązane są: genomika, proteomika, metabolomika i transkryptomika.

ale pod innymi nazwami rozwijała się przynajmniej od lat 60. bioinformatyka nowa dyscyplina? Publikacje bioinformatyczne (PubMed) 10000 1000 100 10 1 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 bioinformatics[text Word] bioinformatics[mesh Heading]

Bioinformatyka w Google 17 500 000 126 000 000 27 700 000 47 300 241 000 1 160 000 1 140 000 1 730 000 bioinformatics bioinformatyka bioinformatika bioinformatik bioinformatica bioinformatique biology biologia

BIOINFORMATYKA - dziedzina interdyscyplinarna bioinformatyka biologia (molekularna) = + dane biologiczne informatyka narzędzia,metody i obliczenia komputerowe dane dotyczące kwasów nukleinowych, białek, lipidów, węglowodanów i innych makrocząsteczek nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria prawdopodobieństwa fizyka i chemia

BIOINFORMATYKA - cele Organizowanie i zarządzanie informacjami o makrocząsteczkach i innych danych biologicznych w formie skomputeryzowanych (cyfrowych) zapisów - baz danych Analiza tych danych za pomocą metod obliczeniowych, rozwój metod i algorytmów

BIOINFORMATYKA - poziomy analiz DNA mrna białka interakcje i metabolizm

BIOINFORMATYKA - poziomy analiz poziom badań przedmiot badań dziedzina badań tematy badań genom wszystkie sekwencje DNA zawarte w organizmie, geny, sekwencje regulatorowe genomika poszukiwanie sekwencji kodujących, rozpoznawanie eksonów i intronów, organizacja genomów, porównanie sekwencji transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomika analiza ekspresji genów proteom wszystkie białka zawarte w organizmie proteomika porównanie sekwencji, identyfikacja zachowanych regionów, przewidywannie struktury, oddziaływania metabolom wszystkie procesy metaboliczne zachodzące w organizmie, metabolity metabolomika określanie sieci i szlaków metabolicznych, symulacje

Program wykładów Genomy Sekwencje biologiczne Biologiczne bazy danych Struktury makrocząsteczek biologicznych Elementy biologii systemowej Elementy epigenetyki dygresje w stronę biologii, fizyki, chemii

zaliczenie Ćwiczenia: lista obecności & kolokwium (a) Wykład: kolokwium (b) Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2

Literatura

Literatura http://www.ncbi.nlm.nih.gov/books

Baxevanis, Ouelette

1977 Sekwencjonowanie DNA Sanger i współpr. metoda terminacji łańcucha, dideoksy 1987 Prober i współpr. znakowanie fluorescencyjne i zautomatyzowanie metody analizator DNA (sekwenser) ABI PRISM 3700

Oczyszczanie fragmentów DNA: wyciętych z klonów plazmidowych lub fagowych zamplifikowanych przez PCR Denaturacja (pojedyncze nici) Hybrydyzacja ze starterem oligonukleotydowym Synteza nowej nici DNA od końca startera za pomocą: polimerazy Taq puli trifosforanów deoksyrybonukleotydów (datp, dttp, dgtp, dctp) puli trifosforanów dideoksynukleotydów (ddatp, ddttp, ddgtp, ddctp) znakowanych fluorescencyjnie i powodujących zakończenie syntezy nici -A-G-T-C-G-T-A-T T-C-A-G-C-A-T-A -A-G-T-C-G-T-A-T T-C-A-G-C-A-T -A-G-T-C-G-T-A-T T-C-A-G-C-A T-C-A-G -A-G-T-C-G-T-A-T T-C-A-G-C -A-G-T-C-G-T-A-T

Elektroforeza kapilarna (sekwencje o długości do 1500 nukleotydów) 0 5 10 15 20 25 GCATATCGGCTAATTGCTCTAGCAC T-C-A-G-C-A-T-A T-C-A-G-C-A-T T-C-A-G-C-A T-C-A-G-C T-C-A-G Odczyt sekwencji 0 5 10 15 20 25 GCATATCGGCTAATTGCTCTAGCAC

Etapy sekwencjonowania genomów Oczyszczanie chromosomów Pofragmentowanie metodą sonikacji na odcinki o długości 100 kpz (kbp) lub większe Klonowanie fragmentów w wektorach (YAC, BAC) Tworzenie mapy chromosomu Wybór zachodzących pojedynczych klonów do sekwencjonowania

Subklonowanie w mniejszych fragmentach Tworzenie mapy subklonów Human Genome Project metoda tradycyjna

Wybór i sekwencjonowanie zachodzących subklonów SEKWENCJONOWANIE ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA Human Genome Project metoda tradycyjna ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA

Subklonowanie w mniejszych fragmentach Sekwencjonowanie wszystkich subklonów i tworzenie bazy komputerowej SEKWENCJONOWANIE Celera Genomics metoda shotgun ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA

Komputerowy zapis sekwencji nukleotydowej G C C A T T C G A lub M A lub S C lub P A C T G G A T A T T A C G T CGTACGTMTASTATAGTACTPC

Obróbka bka sekwencji HTGS Faza 0 Faza 1 Faza 2 Faza 3 contigs

Sekwencjonowanie genomów 1977 Sanger i współpr. - fag ΦX 174 (5,4 tys. pz) 1981 Anderson i współpr. - mtdna człowieka (17 tys. pz) 1995 Fleischmann i współpr. - Haemophilus influenzae (1.8 mln pz) Fraser i współpr. - Mycoplasma genitalium (0.6 mln pz) 1997 Blattner i współpr. Escherichia coli (4.6 mln pz) Kunst i współpr. Bacillus subtilis (4.2 mln pz)

Sekwencjonowanie genomów 1996 1997 Goffeau i współpr. Saccharomyces cerevisiae (13 mln pz) 1998 The C. elegans Sequencing Consortium Caenorhabditis elegans (100 mln pz)

Sekwencjonowanie genomu człowieka Celera Genomics od 1998 Human Genome Project od 1990 VI 2000 OIgłoszenie zakończenie prac nad wstępną wersją genomu ludzkiego; zsekwencjonowano: 99 % 85 % Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą współpracować w końcowej fazie badań po okresie zażartej konkurencji. Craig Venter Francis Collins

Celera Genomics Human Genome Project II 2001 niezależna publikacja wyników w: Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM

GenBank statystyka Grupa Archaea 52 Bacteria 706 Eucaryota 22 liczba genomów zsekwencjonowanych (6.10.2008)

Kompletnie zsekwencjonowane genomy Eucaryota: Drosophila melanogaster OWADY (1) Saccharomyces cerevisiae Schizosaccharomyces pombe Candida glabratha Encephalitozoon cuniculi GB-M1. Caenorhabditis elegans GRZYBY (10) Entamoeba histolytica Plasmodium falciparum Trypanosoma cruzi. NICIENIE (1) KRĘGOWCE (2) PIERWOTNIAKI (6) Homo sapiens Mus musculus Arabidopsis thaliana Oryza sativa ROŚLINY (2)

Prywatne genomy James Watson (2008) Craig Venter (2007)

12 genomów z rodzaju Drosophila 2007

Pyrosequencing Pyrosequencing. The strand synthesis reaction is carried out in the absence of dideoxynucleotides. Each dntp is added individually, along with a nucleotidase enzyme that degrades the dntp if it is not incorporated into the strand being synthesized. Incorporation of a nucleotide is detected by a flash of chemiluminescence induced by the pyrophosphate released from the dntp. The order in which nucleotides are added to the growing strand can therefore be followed 454

Sekwencjonowanie na mikromacierzach A possible way of using chip technology in DNA sequencing. The chip carries an array of every possible 8-mer oligonucleotide. The DNA to be sequenced is labeled with a fluorescent marker and applied to the chip, and the positions of hybridizing oligonucleotides determined by confocal microscopy. Each hybridizing oligonucleotide represents an 8-nucleotide sequence motif that is present in the probe DNA. The sequence of the probe DNA can therefore be deduced from the overlaps between the sequences of these hybridizing oligonucleotides.