GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE Bioinformatyka, wykład 3 (21.X.2008) krzysztof_pawlowski@sggw.waw.pl
tydzień temu Gen??? Biologiczne bazy danych historia Biologiczne bazy danych najważniejsze
Wykład 3 spis treści Genomika Mapy genomowe Markery genetyczne, mapy genetyczne Mapowanie fizyczne Bazy danych map genomowych
GENOMIKA badanie struktury i funkcjonowania genomów GENOMIKA GENOMIKA STRUKTURALNA GENOMIKA PORÓWNAWCZA GENOMIKA FUNKCJONALNA MAPOWANIE GENOMU: Mapy genetyczne Mapy fizyczne SEKWENCJONOWANIE Ewolucja genomów Ewolucja genów Structural genomics Comparative genomics Functional genomics Transkryptom Regulacja tranckrypcji Proteom
GENOMIKA badanie struktury i funkcjonowania genomów GENOMIKA STRUKTURALNA MAPOWANIE GENOMU: Mapy II genetyczne znaczenie: Mapy =proteomika fizyczne strukturalna SEKWENCJONOWANIE GENOMIKA GENOMIKA PORÓWNAWCZA Ewolucja genomów Ewolucja genów Structural genomics Comparative genomics Functional genomics Biologia molekularna & bioinformatyka GENOMIKA FUNKCJONALNA Transkryptom Regulacja tranckrypcji Proteom
Zmienność genomu ludzkiego Nature, 2008 1695 sites of structural variation (> 6kbp) 4 million SNPs 800000 small indels (< 100 bp)
Zmienność genomu ludzkiego
PubMed stats [Oct 2008] Genomics[MAJR] 12,606 Bioinformatics[MAJR] 8,257 Genomics 43,415 Bioinformatics 34,610 Bioinformatics (Google) 12,200,000 Genomics (Google) 12,100,000
Mapa genomu graficzna prezentacja położenia markerów/genów na chromosomie MAPY GENETYCZNE MAPY FIZYCZNE cm bp
Mapy genomowe MAPY GENETYCZNE powstają w oparciu o analizę częstości rekombinacji między badanymi markerami pokazują rozmieszczenie markerów na chromosomie oraz odległości genetyczne między nimi jednostka: 1cM = 1% rekombinacji (1 crossing over na 100 mejoz) u ludzi to ok.0,7 1 Mb MAPY FIZYCZNE powstają poprzez bezpośrednią lokalizację, technikami biologii molekularnej, badanej sekwencji DNA w genomie jednostka: pary zasad pz (ang. bp, kbp)
Mapy genetyczne Rekombinacje Jeżeli markery A i B są na tym samym chromosomie, częstość rekombinacji jest > 0 i < 0.5 Jeżeli markery A i B są na różnych chromosomach, częstość rekombinacji jest = 0.5.
Częstość rekombinacji (θ) Ten sam chromosom Różne chromosomy Częstość CROSSING-OVER Bardzo blisko Blisko Daleko Rzadko Kilka Często Często Sprzężenie TAK TAK NIE NIE θ 0% 1-4% 50% 50% From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY
Marker genetyczny polimorficzna sekwencja DNA (specyficzna) z jednego miejsca na chromosomie, używana do mapowania genetycznego, może być związana z fenotypem. Jest to podstawowe narzędzie genetyka Marker genetyczny klasa I (markery fenotypowe) są to geny kodujące cechy jakościowe organizmu np. antygeny erytrocytarne, antygeny głównego układu zgodności tkankowej (Major Histocompatibility Complex - MHC). markery tej klasy indentyfikowane są metodami serologicznymi lub metodami elektroforetycznymi. klasa II (markery DNA) są to sekwencje DNA, niekoniecznie kodujące, np. RFLP, SSLP, SNP markery takie jako markery genetycze muszą mieć przynajmniej dwie alleliczne formy. markery tego typu identyfikowane są przy użyciu technik analizy molekularnej.
Markery DNA RFLPs (Restriction Fragment Lenght Polymorphisms) Minisatelity Mikrosatelity SNPs (Single Nucleotide Polymorphisms)
Markery genetyczne cd. RFLPs (Restriction Fragment Lenght Polymorphisms) -- polimorfizm długości fragmentów restrykcyjnych Miejsce cięcia enzymu restrykcyjnego HindIII.
Markery RFLP: Restriction Fragment Length Polymorphism Żel
Markery genetyczne cd. Wady markerów RFLP: - tylko dwie formy alleliczne - dużo miejsc cięcia w dużych genomach
Markery genetyczne cd. SSLPs (Simple Sequence Length Polymorphisms) polimorfizm długości prostych sekwencji -minisatelity -mikrosatelity
Minisatelitarny DNA VNTRs (Variable Number of Tandem Repeats) zmienna liczba powtórzeń tandemowych sekwencje zawierające zmienną liczbę tandemowych powtórzeń motywu (11 60 pz) z reguły występują przy końcach chromosomów - telomerach liczba powtórzeń motywu: 2 do 1000, w zależności od ilości powtórzeń dany fragment DNA ma charakterystyczną długość (polimorfizm długości widoczny podczas elektroforezy) VNTR może być badane metodą PCR wraz z elektroforezą, połączoną z hybrydyzacją z wyznakowaną sondą. Liczba powtórzeń decyduje o długości fragmentu, co z kolei wpływa na szybkości jego przemieszczania się podczas elektroforezy. w danym locus VNTR występuje znaczna zmienność osobnicza Przykładowy motyw sekwencji minisatelitarnej: AGGGCTGGAGG Allel 1. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG Allel 2. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG Allel 3. AGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGGAGGGCTGGAGG itd.
Przykładowa analiza VNTRs
Mikrosatelitarny DNA STRs (Short Tandem Repeats) krótkie sekwencje powtórzone tandemowo sekwencje zawierające zmienną liczbę tandemowych powtórzeń kilkunukleotydowego motywu (1 4 pz) motyw równomiernie rozmieszczony w genomie liczba powtórzeń motywu minisatelitarnego: 10 do 50 i w zależności od ilości powtórzeń dany fragment DNA ma charakterystyczną długość (polimorfizm długości widoczny podczas elektroforezy) często motyw taki może być regularnie przerywany inną sekwencją. ulokowane są zazwyczaj w intronach (czasami również w eksonach [egzonach] w postaci mniejszej liczby powtórzeń).
STR (Short Tandem Repeats) a analiza restrykcyjna A1A1 A1A2 A3A4 ACGACGACGACG A1A1 A1A2 A3A4 Zalety: -duża zmienność - często tworzą multi-locus patterns charakterystyczne dla danego osobnika Wady: - nie nadają się do dokładnego mapowania z powodu ich nielosowego rozkładu w genomie
Markery genetyczne cd. SNPs (Single Nucleotide Polymorphisms) polimorfizm pojedynczych nukleotydów Genom ludzki: 56 mln SNPs (6,5 mln validated SNPs) - dbsnp @ NCBI Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na amplifikacji określonego fragmentu genomu w reakcji PCR i sekwencjonowaniu uzyskanego produktu. Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu w obrębie badanej sekwencji, wadą jest wysoki koszt analizy.
Analiza SNP molecular beacons SNP microarrays
Analiza sprzężeń zaburzenia w analizach: - gorące miejsca rekombinacji - podwójny crossing over
Type of marker No. of loci Features Blood groups ~20 May need fresh blood 1910-1960 No easy physical localization Electrophoretic mobility variants of serum proteins ~30 May need fresh serum, specialized assays 1960-1975 No easy physical localization Often limited polymorphism HLA tissue types 1 One linked set 1970- Can only test for linkage to 6p21.3 DNA RFLPs >10 5 Two allele markers, maximum heterozygosity 0.5 1975- (potentially) Initially required Southern blotting, now PCR Easy physical localization DNA VNTRs >10 4 Many alleles, highly informative (minisatellites) (potentially) Tend to cluster near ends of chromosomes 1985- Easy physical localization DNA VNTRs >10 5 Many alleles, highly informative (microsatellites) (potentially) Can type by automated multiplex PCR Easy physical localization 1989- Distributed throughout genome DNA SNPs >10 6 Less informative than microsatellites (single nucleotide polymorphisms) (potentially) Can be typed on a very large scale by automated equipment without gel electrophoresis 1998- Markery fenotypowe Markery DNA
Niska rozdzielczość Mapowanie Fizyczne Mapa Cytogenetyczna (chromosome bands) rozróżnialne zabarwione fragmenty chromosomów (mikroskop optyczny) Mbps Restriction mapping kolejność i odległości pomiędzy punktami trawienia enzymami DNA. 100s kbp Fluorescence in situ hybridisation hybrydyzacja fluorescencyjnych sond do chromosomów 100s kbp STS sequence mapping kolejność unikalnych w genomie markerów DNA (STS) 100 kbp Sequence map - całkowicie zsekwencjonowany chromosom 1bp. Wysoka rozdzielczość
Mapy fizyczne FISH (Fluorescent in situ hybridization) hybrydyzacja fluorescencyjna in situ
Mapa fizyczna genomu Medicago truncatula (lucerny) skonstruowana metodą FISH
Mapy fizyczne cd. STS (Sequence tagged site) mapping - - mapowanie miejsc znakowanych sekwencją
Analiza STS
Mapa restrykcyjna A B A B
Sekwencjonowanie genomów Clone contig WGS (whole genome shotgun)
Przeglądarki genomowe - Genome Browsers NCBI Map Viewer UCSC Genome Browser (University of Calif., Santa Cruz) Ensembl Map View
Ensembl Ensembl
UCSC
NCBI NCBI