Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej rozdzielczości jest sekwencja nukleotydowa -mapowanie fizyczne genomu to zadanie genomiki strukturalnej
Dlaczego nie mapa genetyczna? Ograniczenia map genetycznych 1. Mała rozdzielczość (1 cm to w przybliżeniu 1 Mpz), która zależy od liczby przeprowadzonych krzyżówek 2. Mapy genetyczne mają małą dokładność: pewne regiony genomu są bardziej podatne na rekombinację 3. Markery użyte do konstrukcji mapy muszą być polimorficzne
Strategie tworzenia map fizycznych o wysokiej rozdzielczości strategie sekwencjonowania genomów 1. Strategia hierarchiczna 2. Strategia przypadkowej fragmentacji genomu tzw. WGS (whole genome shotgun shotgun ) Strategia hierachiczna WGS Konstrukcja BAC lub PAC z dużymi wstawkami i układanie ich w kontigi Fragmentacja genomu i sekwencjonowanie Sekwencjonowanie wybranego zestawu klonów Składanie odczytów sekwencji i analiza bioinformatyczna Wspólną cechą obu strategii jest dekonstrukcja genomu a następnie jego rekonstrukcja z uzyskanych odczytów sekwencji
1. podzielenie genomu na mniejsze (rzędu dziesiątków lub setek tysięcy pz) fragmenty i sklonowanie ich do specjalnych wektorów biblioteka genomowa) Strategia hierarchiczna 2. poukładanie klonów biblioteki w tzw. kontigi (kontig to ciąg zachodzących na siebie fragmentów, który odzwierciedla ich układ jaki występował w genomie/chromosomie przed jego fragmentacją 3. Wybór minimalnego zestawu fragmentów pokrywających genom/chromosom i ich sekwencjonowanie
Biblioteki genomowe (banki DNA) - zbiór klonów pokrywających cały genom zwykle fragmenty DNA w klonach biblioteki są duże Zbiór ten przed sekwencjonowaniem musi być uporządkowany tak aby sklonowane fragmenty odzwierciedlały ich naturalny układ w genomie/chromosomie Konstrukcja i uporządkowanie klonów biblioteki genomowej jest istotą strategii hierarchicznej (umożliwia przyporządkowanie odczytów sekwencji do konkretnego miejsca w genomie)
Konstrukcja biblioteki genomowej co trzeb wziąć pod uwagę : Ile musi być klonów w bibliotece genomowej (zawierających fragmenty genomu zrekombinowane w odpowiednim wektorze)? Jaką metodą przeprowadzić fragmentację genomu aby uzyskać fragmenty o odpowiednio dużej wielkości? W jakim wektorze sklonować długie fragmenty DNA?
1. Określenie liczby klonów w bibliotece genomowej? czyli: stopień pokrycia genomu przez bibliotekę Liczba potrzebnych klonów zależy od: zależy to od wielkości genomu wielkości fragmentów na które został podzielony Np. dla genomu 2,8 x 10 6 pz, przy średniej wielkości wstawki 20 kpz potrzeba klonów n = 140 Żeby skonstruować tzw. reprezentatywną bibliotekę genomową n (czyli liczba klonów) musi być większa bo fragmenty DNA sklonowane w wektorze mogą się powtarzać w uzyskanym zbiorze
Dla 95% prawdopodobieństwa pokrycia przez bibliotekę całego genomu potrzeba 3x większego nadmiaru sklonowanych fragmentów względem wielkości genomu, a dla 99% 5x większego nadmiaru sklonowanych fragmentów DNA - reprezentatywna biblioteka genomowa
Reprezentatywna biblioteka genomowa musi zawierać nadmiar sklonowanych fragmentów (3-5 krotny) względem wielkości genomu
2. Wybór sposobu fragmentacji genomu Liczba niezbędnych klonów biblioteki genomowej zależy od wielkości fragmentów i wielkości genomu im większe fragmenty na które podzielimy genom tym mniej klonów do uporządkowania Organizm wielkość genomu enzym czwórkowy (n/256) enzym szóstkowy (n/4096) enzym ósemkowy (n/~65 kpz) E. coli 4,7 x 10 6 18 tys 1 tys 72 drożdże 1,35 x 10 7 52 tys 3 tys 206 człowiek 3,0 x 10 9 ok. 1 mln 683 tys 420 Miejsca rozpoznawane przez enzymy rzadkotnące np. ósemkowe są rozmieszczone w genomach bardzo nierównomiernie
W przypadku konstrukcji biblioteki genomowej potrzebujemy dużych fragmentów DNA o bardzo wyrównanej wielkości Dlatego do fragmentacji genomu najczęściej stosuje się tzw. trawienie częściowe (ograniczone) przy pomocy enzymów rozpoznających sekwencje czwórkowe lub szóstkowe Zalety takiego sposobu fragmentacji genomu: trawienie jest losowe żadna część genomu nie będzie pominięta, Fragmenty będą się częściowo nakładały (zachodziły) na siebie (właściwość, która jest pożądana przy konstrukcji biblioteki genomowej)
3. Wybór wektora do konstrukcji biblioteki genomowej F ori
BAC (Bacterial Artificial Chromosome) - sztuczny chromosom bakteryjny (Shizuya i in. 1992) Bakteryjny wektor do klonowania oparty na niskokopijnym plazmidzie F E. coli Posiada wszystkie cechy dobrego wektora plazmidowego Do wektorów BAC można wstawić fragment o długości około 100-500 kpz W porównaniu do wektorów YAC, wektory BAC są bardziej stabilne segregacyjnie Są łatwe w manipulacji np. łatwiej je namnażać i izolować z komórek bakteryjnych niż wektor typu YAC Pozwala uzyskać wysoką wydajność transformacji komórek E. coli Zapewnia dużą stabilność sklonowanego DNA
System klonowania PAC P1-derived artificial chromosome Wektor do klonowania (zakres wielkości wstawek w PAC: 100-300 kpz), który stanowi połączenie elementów plazmidu F (system replikacji) bakteriofaga P1 (miejsca loxp, rozpoznawane przez fagową rekombinazę Cre) zrekombinowany liniowy DNA jest wprowadzany do specjalnych komórek E. coli (niosących w chromosomie gen cre) gdzie jest przekształcany w kolisty plazmid, który utrzymuje się w małej liczbie kopii (dzięki ori z plazmidu F) F ori elektroporacja
Układanie biblioteki genomowej w kontigi Dysponując biblioteką musimy zestawić sklonowane fragmenty DNA w takim samym porządku, w jakim znajdowały się w genomie/chromosomie, zanim poddaliśmy go fragmentacji Kontig ciąg zachodzących fragmentów, pokrywających chromosom/genom, który odzwierciedla ich układ jaki występował w genomie/chromosomie przed jego fragmentacją
Ponieważ sklonowanych fragmentów DNA w bibliotece zwykle jest dużo, metoda ich układania czyli znajdowania pokrywających się odcinków powinna być szybka i wydajna Układanie biblioteki genomowej bardzo specyficzne puzzle Układanie polega na znalezieniu w klonach biblioteki genomowej wspólnych, pasujących do siebie molekularnych elementów.
1. Tworzenie kontigu klonów metodą spacerów po chromosomie (chromosome walking) Wady metody spacerów po chromosomie: Pracochłonność i czasochłonność, Źle spisuje się jeśli DNA jest bogate w sekwencje powtarzające się prowadzi wtedy do uzyskania błędnych wyników
2. Tworzenie kontigu klonów w wykorzystaniem analizy restrykcyjnej - metoda odcisku palca enzymów restrykcyjnych (restriction enzymes fingerprinting) Polega na trawieniu DNA poszczególnych klonów biblioteki enzymami restrykcyjnymi (najczęściej szóstkowym) i porównywanie wzorów trawienia Kontigi powstają na podstawie identyfikacji klonów o podobnych wzorach restrykcyjnych (dające podobny układ prążków w obrazie elektroforetycznym)
Metoda odcisku palca enzymów restrykcyjnych (restriction enzymes fingerprinting) Nakładające się klony identyfikuje się na podstawie identyczności co najmniej 5 kolejnych miejsc trawienia podobnych odcisków palców poszczególnych klonów
Skalę analizy odcisku palców enzymów restrykcyjnych ograniczają rozmiary fragmentów sklonowanych w bibliotece Mapy restrykcyjne analizuje się łatwo kiedy jest mało miejsc restrykcyjnych, czyli dla stosunkowo krótkich fragmentów DNA (których wielkość nie przekracza 50 100 kpz) Kiedy rośnie wielkość sklonowanych fragmentów DNA rośnie liczba miejsc restrykcyjnych, a tym samym liczba fragmentów do analizy - granicę stanowi moment kiedy jest tak dużo pojedynczych fragmentów DNA że zaczynają się one ze sobą zlewać w analizie elektroforetycznej Analiza restrykcyjna jest pracochłonna manipulacje dużymi ilościami klonów (mimo automatyzacji i użycia komputerów do analizy odcisków)
3. Tworzenie kontigu klonów przez lokalizację tzw. etykietek sekwencyjnych (znaczników sekwencyjnych) typu STS i EST Wykorzystanie etykietek STS i EST jest jedną z najlepszych technik tworzenia kontigu klonów bibliotek genomowych
Etykietki typu STS (STS sequence tagged sites) - miejsca znaczone sekwencyjnie (czyli miejsca, których sekwencję DNA znamy i możemy dla tego miejsca zaprojektować startery do reakcji PCR) STS to krótka, znana sekwencja genomu (100-500 pz), łatwa do rozpoznania (np. możliwa do powielenia w reakcji PCR) pojawiająca się w genomie tylko jeden raz unikalna (nie powinna być zlokalizowana w obrębie sekwencji powtarzających się lub zawierać sekwencji powtórzonych!!!) STS mogą pochodzić np. z losowego sekwencjonowania końcówek wstawek biblioteki genomowej DNA
Tworzenie kontigu polega na sprawdzaniu poprzez reakcję PCR, które klony biblioteki zawierają fragmenty z daną etykietkę sekwencyjną - STS. Fragmenty zawierające tę samą etykietkę STS zachodzą na siebie możemy z nich utworzyć kontig
Wyszukiwanie etykietek ekspresyjnych EST (expressed sequence tag) sekwencyjne znaczniki ekspresji specyficzny rodzaj STS-ów stosowany głównie w analizie genomów eukariotycznych są to krótkie sekwencje uzyskiwane przez analizę klonów cdna uzyskanego w wyniku odwrotnej transkrypcji mrna Zaletą używania EST-ów do tworzenia kontigów (poza takimi samymi jakie dają etykietki STS) jest to, że wykazują bezpośredni związek z sekwencjoami kodującymi - genami ulegającymi ekspresji w genomie, ponieważ pochodzą z mrna
Kiedy już poukładamy bibliotekę genomową w kontigi. Czy trzeba zsekwencjonować wszystkie fragmenty DNA biblioteki genomowej? Genom/chromosom Biblioteka genomowa poukładana w kontigi klonów wybór minimalnego zestawu klonów pokrywającego genom/chromosom Uzyskane odczyty sekwencji Poskładana sekwencja genomu/chromosomu Zalety strategii hierarchicznej 1. Łatwiejsze składanie uzyskanych odczytów sekwencji szczególnie w przypadku złożonych genomów, bogatych w sekwencje powtórzone 2. Łatwość wypełniania przerw w ciągłej sekwencji Wady strategii hierarchicznej 1. Konieczność konstrukcji i układania klonów biblioteki 2. Czasochłonność
Strategia przypadkowej fragmentacji genomu (whole genome shotgun- WGS) nie wymaga tworzenia bibliotek i kontigów klonów szybko uzyskujemy prawie pełną sekwencję genomu), WGS uznawana (niesłusznie!!!) za przydatną do sekwencjonowania jedynie małych genomów Izolacja DNA Przypadkowa fragmentacja genomu (trawienie lub sonikacja) Elektroforeza w żelu agarozowym i izolacja fragmentów DNA określonej wielkości (zwykle małe do 10 kpz, najczęściej jeszcze mniejsze 1.6-2.0 kpz Klonowanie w uniwersalne wektory (puc) (zbędne w metodach NGS)
Sekwencjonowanie ogromnej ilości klonów z użyciem uniwersalnych starterów wektora (suma uzyskanych odczytów sekwencji musi co najmniej 6-8 krotnie pokrywać wielkość genomu) (w metodach NGS wiele więcej!!!) Składanie odczytów sekwencji i wypełnianie przerw
Zalety WGS: 1. Szybko uzyskujemy prawie pełną sekwencję genomu 2. Nie wymaga konstrukcji bibliotek genomowych Wady WGS: 1. trzeba przeanalizować ogromną ilość sekwencji (duży ciężar badań przeniesiony na analizy bioinformatyczne) 2. Trudno zamyka się duże przerwy w sekwencji 3. problemem dla WGS są genomy bogate w sekwencje powtórzone
Problemem dla WGS są genomy bogate w sekwencje powtórzone
Ukierunkowana strategia WGS shotgun Strategia ukierunkowanego shotgun: Większość sekwencji genomu uzyskuje się na drodze sekwencjonowania zbioru klonów o małej wielkości wstawek ok. 2 kpz (80-90% sekwencji genomu) (czyli tak jak w WGS) Pozostałe sekwencje pochodzą z odczytania sekwencji klonów drugiej biblioteki o średniej wielkości wstawek co najmniej 10 kpz lub więcej (10-20% sekwencji genomu). Biblioteka z dłuższymi wstawkami nie jest układana w kontigi Składanie odczytów sekwencji Zalety: Zastosowanie dwóch bibliotek daje lepsze pokrycie genomu Biblioteka dużych klonów z dużymi wstawkami pozwala lepiej przyporządkować odczyty do określonego miejsca w genomie/chromosomie i zapobiega błędom składania sekwencji wynikającym np. z obecności powtórzeń w genomie