EWOLUCJA GENOMÓW Bioinformatyka, wykład 6 (22.XI.2010) krzysztof_pawlowski@sggw.pl
Wykład 6 spis treści genomika mapowanie genomów początki ewolucji świat RNA świat wirusów (?) ewolucja genomów
GENOMIKA badanie struktury i funkcjonowania genomów GENOMIKA STRUKTURALNA MAPOWANIE GENOMU: Mapy II genetyczne znaczenie: Mapy =proteomika fizyczne strukturalna SEKWENCJONOWANIE GENOMIKA GENOMIKA PORÓWNAWCZA Ewolucja genomów Ewolucja genów Structural genomics Comparative genomics Functional genomics Biologia molekularna & bioinformatyka GENOMIKA FUNKCJONALNA Transkryptomika Regulacja transkrypcji Proteomika
Mapy genomowe MAPY GENETYCZNE powstają w oparciu o analizę częstości rekombinacji między badanymi markerami pokazują rozmieszczenie markerów na chromosomie oraz odległości genetyczne między nimi jednostka: 1cM = 1% rekombinacji (1 crossing over na 100 mejoz) u ludzi to ok.0,7 1 Mb MAPY FIZYCZNE powstają poprzez bezpośrednią lokalizację, technikami biologii molekularnej, badanej sekwencji DNA w genomie jednostka: pary zasad pz (ang. bp, kbp)
Mapa genomu graficzna prezentacja położenia markerów/genów na chromosomie MAPY GENETYCZNE MAPY FIZYCZNE cm bp
Marker genetyczny polimorficzna sekwencja DNA (specyficzna) z jednego miejsca na chromosomie, używana do mapowania genetycznego, może być związana z fenotypem. Jest to podstawowe narzędzie genetyka Marker genetyczny klasa I (markery fenotypowe) są to geny kodujące cechy jakościowe organizmu np. antygeny erytrocytarne, antygeny głównego układu zgodności tkankowej (Major Histocompatibility Complex - MHC). markery tej klasy indentyfikowane są metodami serologicznymi lub metodami elektroforetycznymi. klasa II (markery DNA) są to sekwencje DNA, niekoniecznie kodujące, np. RFLP, SSLP, SNP markery takie jako markery genetycze muszą mieć przynajmniej dwie alleliczne formy. markery tego typu identyfikowane są przy użyciu technik analizy molekularnej.
Częstość rekombinacji Ten sam chromosom Różne chromosomy Częstość CROSSING-OVER Bardzo blisko Blisko Daleko Rzadko Kilka Często Często Sprzężenie TAK TAK NIE NIE θ 0% 1-4% 50% 50% From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY
Markery genetyczne cd. RFLPs (Restriction Fragment Lenght Polymorphisms) -- polimorfizm długości fragmentów restrykcyjnych Miejsce cięcia enzymu restrykcyjnego HindIII.
Markery genetyczne cd. SNPs (Single Nucleotide Polymorphisms) polimorfizm pojedynczych nukleotydów Genom ludzki: 37,8 mln SNPs dbsnp @ NCBI Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na amplifikacji określonego fragmentu genomu w reakcji PCR i sekwencjonowaniu uzyskanego produktu. Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu w obrębie badanej sekwencji, wadą jest wysoki koszt analizy.
Początki ewolucji H 2 O, CO, CO 2, N 2, H 2 S and H 2 Pierwotna zupa prostych związków organicznych pierwotny skład atmosfery ziemskiej
Experiment by Miller: 1953: Eksperyment Ureya-Millera
Początek życia Ok. 14 miliardów lat temu Wielki Wybuch (Big Bang) LUCA Last Universal Common Ancestor?
Hipoteza świata RNA oryginalny gen rybonukleotydy krótkie polimery RNA komplementarne łańcuchy RNA komplementarne łańcuchy RNA traktowane jako matryca do robienia kopii oryginalnego genu Carl Woese, 1967. Walter Gilbert,1986
Świat RNA/DNA
Monowarstwa micele dwuwarstwa pęcherzyki z dwuwarstwy
Chemical Prebiological Biological Organisms Biopolymers Probionts Polymers with the higher degree of organization Primitive Probionts Oligo/polymers with low degree of organization Free olygomers and polymers Prebiological selection Prebiological selection Non-specific self assembly
Major transitions in early evolution Hipoteza! Pre-LUCA diversity
Rola wirusów. Hipoteza Forterre a
Świat wirusów. Hipoteza Koonina
Powstanie eukariontów Geny informacyjne z archeonów Geny operacyjne z bakterii
Powstanie eukariontów Geny informacyjne z archeonów Geny operacyjne z bakterii
Początki kodowania białek
1-sza pozycja w kodonie 2-ga pozycja w kodonie T C A G TTT Phe TTC Phe TCT Ser TCC Ser TAT Tyr TAC Tyr TGT Cys TGC Cys T TTA Leu TTG Leu TCA Ser TCG Ser TAA Ochre stop TAGAmber stop TGA Opal stop TGG Trp C CTT Leu CTC Leu CTA Leu CTG Leu CCT Pro CCC Pro CCA Pro CCG Pro CAT His CAC His CAA Gln CAG Gln CGT Arg CGC Arg CGA Arg CGG Arg ATT Ile ATC Ile ACT Thr ACC Thr AAT Asn AAC Asn AGT Ser AGC Ser A ATA Ile ATG Met ACA Thr ACG Thr AAA Lys AAG Lys AGA Arg AGG Arg GTT Val GTC Val GCT Ala GCC Ala GAT Asp GAC Asp GGT Gly GGC Gly G GTA Val GTG Val GCA Ala GCG Ala GAA Glu GAG Glu GGA Gly GGG Gly KOD GENETYCZNY A/Ala alanina C/Cys cysteina D/Asp kwas asparaginowy E/Glu kwas glutaminowy F/Phe fenyloalanina G/Ala glicyna H/His histydyna I/Ile izoleucyna K/Lys lizyna L/Leu leucyna M/Met metionina N/Asn asparagina P/Pro prolina Q/Gln glutamina R/Arg arginina S/Ser seryna T/Thr treonina V/Val walina W/Trp tryptofan Y/Tyr tyrozyna
Własności kodu genetycznego TRÓJKOWY NIEZACHODZĄCY A G A C G A C U U a 1 a 2 a 3 A G A C G A C U U A B a 3 a 4 a 5 a 6 a 7 C A G A C G A C U U a 4 a 3 a 2 a 1 a 1 a 2
Własności kodu genetycznego TRÓJKOWY NIEZACHODZĄCY BEZPRZECINKOWY JEDNOZNACZNY KOLINEARNY pierwsza trójka druga trójka trzecia trójka czwarta trójka G A A G A C C U U G A G kolejność trójek w mrna Glu Asp Leu Glu kolejność aminokwasów w białku pierwszy amin. drugi amin. trzeci amin. czwarty amin.
Własności kodu genetycznego. UNIWERSALNY ZDEGENEROWANY Trójka ABC Trójka ABA Trójka CBC Trójka CBA Trójka Trójka AAA AAC Amin1 Amin2 Amin3 Am4 Am5 Amin3 NIEPRAWDA!!
Odstępstwa od kodu genetycznego kodon Uniwersalny kod Mitochondria ssacze Mitochondria drożdżowe Mitochondria Drosophila Mitochondria Aspergillus TGA STOP tryptofan tryptofan tryptofan tryptofan AGA arginina STOP arginina seryna arginina AGG ATA izoleucyna metionina metionina metionina izoleucyna CTN leucyna leucyna treonina leucyna leucyna
Ewolucja genomów Mutacje Duplikacje genów Rearanżacje genów Utrata genów Rearanżacje chromosomalne Duplikacje genomów... Poziomy transfer genów
Powstawanie nowych genów. Mutacje punktowe typu missense (nonsynonymous ) AUG CCU CAA UUG UAG met pro gln leu STOP Mutacje punktowe typu frameshift mutacja AUG CCC UCA AUU GUA met pro ser ile val AUG CAU CAA UUG UAG met his gln leu STOP X
duplikacje genów lub ich fragmentów nierówny crossing-over X1 X2 X1 X2 nierównomierna wymiana fragmentów między siostrzanymi chromatydami duplikacja podczas replikacji widełki replikacyjne
rearanżacja istniejących genów duplikacja domen Domena A Domena B Domena C A B C Duplikacja segmentu genowego B Domena A Domena B Domena B Domena C A B B C
przetasowanie domen X1 X2 Domena A Domena B Domena C Domena X Domena Y A B C X Y Przetasowanie domen Domena A Domena B Domena X A B X