PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW
SEKWENCJONOWANIE GENOMÓW 1. Sekwencjonowanie genomów 2. Automatyzacja sekwencjonowania 3. 1 000 (human) Genomes project 4. 1 000 Bull Genomes project
SEKWENCJONOWANIE Czym jest sekwencjonowanie DNA? STARSZE METODY Sangera (terminacji łańcucha / dideoksy) Maxama-Gilberta (chemicznej degradacji) Pirosekwencjonowanie METODA NGS
METODA SANGERA Frederick Sanger 2 nagrody Nobla Laboratory of Molecular Biology, Cambridge UK 1970-te metoda sekwencjonowania metoda terminacji łańcucha
METODA SANGERA starter Matryca w postaci jednoniciowego DNA wektory Substraty: datp, dctp, dgtp, dttp + ddatp, ddctp, ddgtp, ddttp (brak grupy 3 -hydroksylowej) Cząsteczki zakończone A
METODA SANGERA Elektroforeza + detektor floerescencji
SEKWENCJONOWANIE AUTOMATYCZNE Sekwencjonowanie cykliczne automatyzacja procesu sekwencjonowania Sekwenatory DNA 384 próbki DNA, 24 analizy / doba Termostabilne polimerazy DNA (PCR) Dwuniciowy DNA Niewielka ilość DNA (klonowanie) 1 starter
METODA MAXAMA GILBERTA 4 oddzielne reakcje sekwencjonowania
PIROSEKWENCJONOWANIE Rejestrowanie kolejności dodawania datp, dctp, dgtp, dttp Prosta automatyzacja
FARMAT ZAPISU SEKWENCJI - FASTA >Bos taurus natural resistance-associated macrophage protein (NRAMP1) gene, partial sequence TGAGAACGCTGGAGACTTCCTGAGGTCTTTCAGGATGCACCG GATCATGCGGGATCTCACCAGCCTGGGGAGGGAGGGAGGTC TGAGAACGCTGGAGACTTCCTGAGGTCTATCAGGATGCACCG GATCATGCGGGATCTCACCAGCCTGGGGAGGGAGGGAGGTC TGAGAACGCTGGAGACTTCCTGAGGTCCTCAGGATGCACCG GATCATGCGGGATCTCACCAGCCTGGGGAGGGAGGGAGGTC
PROJEKT POZNANIA GENOMU CZŁOWIEKA HISTORIA 1. 1986 początek projektu 15 lat 3 000 000 000 $ 2. 1988 rozpoczęcie badań przez NIH James Watson Francis Collins
PROJEKT POZNANIA GENOMU CZŁOWIEKA HISTORIA 3. ------ inne instytuty i firmy Chiny, Francja, Niemcy, Japonia, W. Brytania Celera Genomics 3 000 000 $ 4. 1998 wyścig Craig Venter Francis Collins Celera NIH whole genome shotgun klasyczne
PROJEKT POZNANIA GENOMU CZŁOWIEKA HISTORIA 5. 2000 ukończenie prac nad ogólną sekwencją 6. 2001 publikacje Celera NIH
SEKWENCJONOWANIE CAŁYCH GENOMÓW 1. Metoda tradycyjna BAC-to-BAC 1980 Map based sequencing 2. Metoda shotgun 1997 Whole genome shotgun sequencing
SEKWENCJONOWANIE GENOMÓW SHOTGUN:BAC-to-BAC BAC-to-BAC SHOTGUN Fragmentacja DNA: 150 kbp Fragmentacja DNA: 2 kbp Konstrukcja bibliotek BAC Konstrukcja bibliotek plazmidowych Konstrukcja ramowej mapy kolejność fragmentów BAC
SEKWENCJONOWANIE GENOMÓW SHOTGUN:BAC-to-BAC BAC-to-BAC SHOTGUN Fragmentacja BAC DNA konstrukcja bibliotek M13 Sekwencjonowanie bibliotek M13 Sekwencjonowanie bibliotek plazmidowych Łączenie sekwencji Łączenie sekwencji
PROJEKT POZNANIA GENOMU CZŁOWIEKA
SEKWENCJONOWANIE CAŁYCH GENOMÓW 1. Metoda tradycyjna BAC-to-BAC 1980 Map based sequencing 2. Metoda shotgun 1997 Whole genome shotgun sequencing 3. Metoda nowej generacji ~2007 Next generation sequencing
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION METODA NOWEJ GENERACJI Sekwencjonowanie bardzo krótkich fragmentów 50-700 bp DNA unieruchomione na płytce Szybkie Tanie Platformy: Ilumina/Solexa, 454 technology, SOLiD
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION PORÓWNANIE METOD dł. szybkość koszt łańcucha DNA dni/1gbp 1000 bp Tradycyjna, 1970 r. 1000 bp 500 0.100 $ 454, 2004/2005 r. 700-400 bp 2 0.020 $ Solexa, 2006 r. 100-150 bp 0.5 0.001 $ Solid, 2007 r. 50 bp 0.5 0.001 $
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION KOSZT/CZAS ZSEKWENCJONOWANIA CAŁEGO GENOMU CZŁOWIEKA Projekt poznania genomu człowieka ~ 13 lat ~ 15 000 000 $ Technologia NGS ~ kilka dni ~ 2 000 $ Copyright 2017, Copyright J. Szyda 2014, & Joanna M. Mielczarek Szyda
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION Illumina - Sequencing by Synthesis (SBS) https://www.illumina.com/techniques/sequencing.html https://www.illumina.com/documents/products/techspotlights/techspotlight_sequencing.pdf
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION 454 Mardis 2008
FARMAT ZAPISU SEKWENCJI - FASTQ @HWI-1KL157:67:D2AGFACXX:1:2316:10694:65033 2:N:0: CTATTACACGCCCCCGAAGCTCTAGCGGGTGTTCTCACGCAC + CCCFFADFHHGHHJJGGIIG@HIIFEHIJ;@F@DGGGGCCEB8B @HWI-1KL157:67:D2AGFACXX:1:2316:10671:65034 2:N:0: AGTGTATTACTGTCTTTGCACTCTTTAATCCTAGGTGACTTTTG +?@@ADDDDHDBFHCEHIIBHEHEEHEH>BF?EFHCHFGFGFHH
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION 2011 Nature special issue of nature on sequencing
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES human 1000 GENOMES PROJECT (www.1000genomes.org) technologie nowej generacji - obniżenie kosztów i duża szybkość sekwencjonowania zsekwencjonowanie wielu genomów ludzkich scharakteryzowanie zmienności genetycznej człowieka na podstawie sekwencji DNA
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES human 1000 GENOMES PROJECT (www.1000genomes.org) dane ogólnodostępne do badań 2535 osób, 26 populacji ftp.1000genomes.ebi.ac.uk/vol1/ftp/
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES human 1000 GENOMES PROJECT (www.1000genomes.org) The 1000 Genomes Project Consortium (2012) An integrated map of genetic variation from 1,092 human genomes. Nature 491: 56-65.
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES bovine 1000 GENOMES PROJECT (www.1000genomes.org) The 1000 Bull Genomes Project - Run 5 July 2015 Ben Hayes, Hans Daetwyler, Amanda Chamberlain, Phil Bowman
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES bovine 1000 GENOMES PROJECT (www.1000genomes.org) Run 5 Sequences Breed Taurus Taurus Breed Indicus Holstein(BW,RW) 450 Beef Crosses 5 UgandaAdmixed 26 Simmental Fleckvieh Pezzata Rossa 274 Piedmontese 5 IranAdmixed 9 Angus (B,R) 157 Angler 5 Korean 9 Brown Swiss (incl. Braunvieh) 131 Hinterwalder 3 JapanNative 8 Jersey 66 Vorderwalder 3 Brahman 7 Beef Composites 64 Eringer 2 Gir 6 Danish Red 44 Galloway 2 Nelore 5 Gelbvieh 41 Unknown 2 Dehong 2 Hereford 41 Scottish Highland 2 Dengchuan 2 Charolais 39 Romagnola 2 Fujian 2 Limousin 31 Stabilizer 2 Guanling 2 Beef Booster 29 Tyrolean Grey 2 Hasake 2 Montbeliarde 28 Salers 1 Liping 2 Dairy-Beef Crosses 27 Luxi 2 AyrshireFinnish 25 Menggu 2 Normande 24 Taurus 1577 Nanyang 2 NorwegianRed 24 Taurus Indicus 1682 Qinchuan 2 Guernsey 20 Wenling 2 Swedish Red 16 Yanbian 2 Belgian Blue 10 Dabieshan 2 Marchigiana 8 Xizang 1 1682 Sequenced Animals (1577 Taurus, 115 Indicus) ~55 Breeds Bos Taurus, Bos Indicus, mixtures Dairy, Beef, Dual Purpose, Crosses, Composites, Native breeds
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES bovine 1000 GENOMES PROJECT (www.1000genomes.org) Results 1000Bulls 5 Run 5 Taurus only 39.7 million filtered variants ~ 34 breeds 38.1 million SNP, 1.7 million indel Run 5 Taurus Indicus 67.3 million filtered variants ~ 55 breeds 64.8 million SNP, 2.5 million indel
SEKWENCJONOWANIE GENOMÓW 1000 GENOMES bovine 1000 GENOMES PROJECT (www.1000genomes.org) Results 1000Bulls 5
PODSTAWY BIOINFORMATYKI