PODSTAWY BIOINFORMATYKI 2 SEKWENCJONOWANIE GENOMÓW
PROJEKTY POZNANIA INNYCH GENOMÓW 300 250 Seria 1 251 254 200 150 100 50 0 23 ukończone w trakcie scalania w trakcie realizacji
SEKWENCJONOWANIE GENOMÓW 1. Sekwencjonowanie 2. Automatyzacja sekwencjonowania 3. Sekwencjonowanie całych genomów Metoda tradycyjna BAC-to-BAC Metoda "shotgun" Metoda "high throughoutput" 4. Zsekwencjonowane genomy - przykłady Człowiek Mysz Bydło 5. Zagadnienia bioinformatyczne
SEKWENCJONOWANIE Fred Sanger 2 nagrody Nobla Laboratory of Molecular Biology, Cambridge UK 1970-te metoda sekwencjonowania metoda zakończenia łańcucha DNA
SEKWENCJONOWANIE 1. W sekwencjonowaniu prowadzi się 4 osobne reakcje, kaŝda wykorzystuje: Wzorcową nić DNA Primer Polimerazę DNA Deoksyrybonukleotydy 4 Dideoksyrybonukleotydy (kaŝdy w innej reakcji) 2. Denaturacja DNA na pojedyncze nici w temp. 94 C 3. Przyłączenie primera w temp. 55 C 4. Przyłączenie polimerazy w temp. 37 C 5. Replikacja DNA
SEKWENCJONOWANIE 6. W przypadku przyłączenia dideoksynukleotydu następuje zakończenie replikacji - zakończenie łańcucha DNA 7. Przyłączenie dideoksynukleotydu jest losowe - otrzymujemy zbiór łańcuchów DNA o róŝnej długości zakończonych np. adeniną 8. Lub innym nukleotydem (w pozostałych reakcjach) 9. Produkty reakcji są poddane elektroforezie - 4 osobne linie dla A, C, T i G 10.Droga wędrówki łańcuchów DNA przez Ŝel zaleŝy od ich długości
SEKWENCJONOWANIE 11. Wizualizacja pozycji poszczególnych fragmentów 12. Odczytywanie DNA - rozpoczynając od najkrótszych fragmentów = od dołu 13. Identyfikacja sekwencji nukleotydów 14. Typowa długość łańcucha 200-500 bp
SEKWENCJONOWANIE AUTOMATYCZNE Analiza całych genomów automatyzacja procesu sekwencjonowania Sekwenatory DNA 384 próbki DNA, 24 analizy / doba
SEKWENCJONOWANIE AUTOMATYCZNE 1. Substraty do sekwencjonowania? 2. Denaturacja DNA 3. Przyłączenie primera 4. Przyłączenie polimerazy 5. Replikacja 6. Zakończenie 7. Łańcuchy DNA o róŝnych długościach 8. Sekwenator elektroforeza 9. Sekwenator odczytanie fluorescencji A, C, T lub G 10. Program plik wynikowy
SEKWENCJONOWANIE CAŁYCH GENOMÓW 1. Metoda tradycyjna BAC-to-BAC 1980 Map based sequencing 2. Metoda shotgun 1997 Whole genome shotgun sequencing 3. Metoda nowej generacji ~2007 Next generation sequencing
SEKWENCJONOWANIE GENOMÓW - SHOTGUN DEFRAGMENTACJA DNA fragmenty oczyszczonego DNA 150-200 kb losowo pocięte fragmenty DNA 2-4 kb
SEKWENCJONOWANIE GENOMÓW - SHOTGUN WPROWADZANIE DNA DO PLAZMIDU
SEKWENCJONOWANIE GENOMÓW - SHOTGUN WPROWADZANIE DNA DO GENOMU BAKTERII REPLIKACJA MILIARDY KOPII
SEKWENCJONOWANIE GENOMÓW - SHOTGUN SEKWENCJONOWANIE FRAGMENTÓW 1 000 bp
SEKWENCJONOWANIE GENOMÓW - SHOTGUN OSTATECZNY WYNIK - SEKWENCJA KONSENSUSOWA
SEKWENCJONOWANIE GENOMÓW - SHOTGUN PROGRAMY KOMPUTEROWE: Phrap składanie zsekwencjonowanych fragmentów assembling Consed przygotowywanie ostatecznej sekwencji consensus sequence
SEKWENCJONOWANIE GENOMÓW SHOTGUN:BAC-to-BAC BAC-to-BAC SHOTGUN Fragmentacja DNA: 150 kbp Fragmentacja DNA: 2 kbp Konstrukcja bibliotek BAC Konstrukcja bibliotek plazmidowych Konstrukcja ramowej mapy kolejność fragmentów BAC
SEKWENCJONOWANIE GENOMÓW SHOTGUN:BAC-to-BAC BAC-to-BAC SHOTGUN Fragmentacja BAC DNA konstrukcja bibliotek M13 Sekwencjonowanie bibliotek M13 Sekwencjonowanie bibliotek plazmidowych Łączenie sekwencji Łączenie sekwencji
SEKWENCJONOWANIE GENOMÓW NEXT GENERATION METODA NOWEJ GENERACJI Sekwencjonowanie bardzo krótkich fragmentów 100-500 bp DNA unieruchomione na płytce Szybkie Tanie Platformy: 454 technology, Solexa, SOLiD
ZSEKWENCJONOWANE GENOMY CZŁOWIEK
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ŹRÓDŁO DNA mieszanka DNA róŝnych dawców / Europa / Afryka / Ameryki (pn, centralna, pd) / Azja Craig Venter plemniki krew
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIARY GENOMU 300 250 200 Mbp 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y chromosom
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIESZCZENIE GENÓW 35 30 25 gęstość ge enów 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y chromosom
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK CHARAKTERYSTYKA Wielkość: 2.91 3.16 Gbp % par nukleotydów: A T 54 % (ubogie w geny) G C 38 % (bogate w geny) nieznane 9 % Elementy powtarzalne: 35-46 % genomu Liczba genów: 39 114 Chromosom najbogatszy w geny: 19 (23 geny/1mbp) Chromosom najuboŝszy w geny: 13 (5 genów/1mbp) Średnia długość genu: 27 000 40 000 bp NajdłuŜszy gen: 2 400 000 bp Gen o największej liczbie egzonów: titina (234) 1 gen koduje średnio 3 białka
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU 59 % genów ma nieznaną funkcję wpływ genów na zdrowie wpływ na inne cechy człowieka współdziałanie pomiędzy genami imprinting 2 % genomu koduje białka poznanie funkcji pozostałej części genomu Analiza mapy sprzęŝeniowej częstość crossing over u róŝnych płci rekombinacyjne hot- i coldspots
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK WYKORZYSTANIE ZDOBYTEJ WIEDZY medycyna rozwój metod diagnostycznych produkcja nowych (specyficznych) leków antropologia badania ewolucji człowieka identyfikacja osobników: kontrola spokrewnienia, kryminalistyka
ZSEKWENCJONOWANE GENOMY MYSZ
ZSEKWENCJONOWANE GENOMY - MYSZ ZAWARTOŚĆ G+C człowiek mysz
ZSEKWENCJONOWANE GENOMY - MYSZ FUNKCJE BIAŁEK człowiek mysz
ZSEKWENCJONOWANE GENOMY - MYSZ CHARAKTERYSTYKA Wielkość: 2.5 Gbp Elementy powtarzalne: 38% genomu Liczba genów: 30 000 99% genów myszy ma homologi u człowieka
ZSEKWENCJONOWANE GENOMY BYDŁO
ZSEKWENCJONOWANE GENOMY - BYDŁO Dominette, Hereford Norwegian red
ZSEKWENCJONOWANE GENOMY - BYDŁO QTL: 1 050 QTL, 91 cech 250 200 Lic czba QTL 150 100 50 0 cecha
ZAGADNIENIA BIOINFORMATYCZNE 1. Łączenie fragmentów DNA Błędy odczytu sekwencji Niekompletne pokrycie genomu Sekwencje powtarzalne Polimorfizm rozmiary danych Programy: Celera Assembler, Jazz, Arachne, Phrap 2. Anotacja genomu identyfikacja strukturalnych i funkcjonalnych elementów genomu Programy: Basic Local Alignment Search Tool (BLAST)
1. Sekwencjonowanie 2. Automatyzacja sekwencjonowania 3. Sekwencjonowanie całych genomów Metoda tradycyjna BAC-to-BAC Metoda "shotgun" Metoda "high throughoutput" 4. Zsekwencjonowane genomy - przykłady Człowiek Mysz Bydło 5. Zagadnienia bioinformatyczne