Mapowanie genów 10 maja 2004
Co daje identyfikacja genów? 1 poszerzenie wiedzy podstawowej perspektywy przyspieszenia i zwi ekszenia efektywności selekcji precyzyjne wprowadzanie obych genów do populacji (introgresja)
Klonowanie pozycyjne genów kandydujacych 2 Najbardziej preferowana metoda identyfikacji genów Etapy: 1. określenie pozycji genu na chromosomie wzgl edem markerów 2. określenie genów kandydatów we wskazanym rejonie (mapy transkrypcyjne) 3. zidentyfikowanie zmienności kszta ltuj acej ceche
Markery genetyczne 3 Trzy w lasności markera: 1. specyficzny dla danego locus 2. polimorficzny w danej populacji 3. latwy do oznaczenia
Typy markerów genetycznych 4 markery fenotypowe grupy krwi polimorfizm biochemiczny RFLPs Minisatelity (VNTR) Mikrosatelity (SSR) SNPs
RFLPs 5 RFLPs restriction site probe A a AA Aa aa 1 2 3 resulting gel kodominujace potrzebna w laściwa kombinacja enzym-sonda tylko 200 enzymów, liczba sond nieograniczona
RFLPs 6 mutacja punktowa insercja35 zmienna powtórzeń liczba
RAPDs 7 RAPDs AA Aa aa A PCR product dominujace a 1 2 3 wiele loci jednocześnie resulting gel
Mikrosatelity 8 Microsatellites GCCGCCGCC A AA Aa aa kodominujace duża obfitość GCC GCCGCCGCCGCC a 1 2 3 resulting gel równomiernie w genomie roz lożone pó lautomatyczne wykrywanie
Strategie mapowania 9 Linkage Analysis (analiza sprzeżeniowa) DNA Pooling / Bulk Segregant Analysis Genetically Directed Representational Difference Analysis analiza asocjacji i mapowanie genów i.p.p Genome Mismatch Scanning
Tempo rekombinacji 10 A A a a A 49 mejoz bez crossing over B B b A A b B B b b b b 1 mejoza z crossing over A B B tempo rekombinacji 1+1 49+49+49+49+1+1+1+1 = 0.01 A b A b a a B b a a B b
Ukryte crossing-over 11 A B A B a A a b B b a A a b B b A A a a a B B b b A A a a B B b b
Odleg lość genetyczna 12 mierzona czestości a (prawdopodobieństwem) crossing-over jednostka jest Morgan 1 centimorgan - prawdopodobieństwo crossing-over wynosi 0.01 addytywna (r AC = r AB + r BC ) określana na podstawie rekombinacji
Funkcje mapowe 13 Pozwalaja przeliczyć obserwowane tempo rekombinacji na odleg lość genetyczna Najcześciej używane: Morgana Haldane a Kosambiego
Funkcja Kosambiego 14 x = 0.25 ln 1 + 2θ 1 2θ θ = 0.5 exp(4x) 1 exp(4x) + 1 x odleg lość genetyczna (w Morganach) θ tempo rekombinacji
Funkcje mapowe 15 odleglosc 1 0.8 0.6 0.4 Haldane Kosambi Morgan 0.2 0 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 tempo rekombinacji
Odleg lość genetyczna i fizyczna 16 1 cm 1 M p.z.
Skad uzyskać tempo rekombinacji? 17 bezpośrednie genotypowanie plemników i oocytów (tylko markery genetyczne) genotypowanie rodziców i potomstwa jedyna możliwość dla cech fenotypowych wymaga podwójnych heterozygot
Informatywność markera 18 1 1 A A 1 A A 2 1 1 A A potomstwo 1 A A 1 1 1 A A potomstwo 1 1 A A 1 2 A A 1 A A 1 A A 2 2 potomstwo A 1 A 1 1 2 A A 2 2 A A A 1 A 2 A 1 A 3 A 1 4 A potomstwo A 2 3 A A 3 A 4 A 2 A 4
Miary informatywności markera 19 Heterozygotyczność H = 1 p 2 i Polymorphism Information Content (PIC) P IC = 1 n p 2 i n 1 n p 2 i p 2 j i=1 i=1 j=i+1
Test lod score 20 Test statystyczny weryfikujacy hipoteze o niezależnej segregacji genów z różnych loci Hipotezy: H0: brak sprz eżenia (θ = 0.5) H1: sprz eżenie loci (θ < 0.5) Wiarogodność (Likelihood) miara si ly dowodów na rzecz hipotezy prawdopodobieństwo danych obliczone przy danej hipotezie
Iloraz wiarygodności (likelihood ratio) 21 LR = L(dane θ) L(dane θ = 0.5) Lod score Z = log 10 (LR) Interpretacja Z > 3 geny s a sprz eżone Z < 2 brak sprz eżenia 2 < Z < 3 brak informacji
Test lod score 22 A1 A2 B1 B2 A1 A1 B1 B1 potomstwo gamety ojcowska matczyna N A1 A1 B1 B1 A1 B1 A1 B1 9 A1 A2 B1 B1 A2 B1 A1 B1 1 A1 A1 B1 B2 A1 B2 A1 B1 1 A1 A2 B1 B2 A2 B2 A1 B1 9
Test lod score 23 najprawdopodobniej u ojca wyst epuje sprzeżenie A1-B1 oraz A2-B2 oszacowane tempo rekombinacji θ = 2/20 = 0.1 wiarogodność przy θ = 0.1 L(0.1) = ( 20 2 ) (1 0.1) 18 0.1 2 wiarogodność przy braku sprz eżenia (θ = 0.5)
L(0.5) = ( 20 2 ) (1 0.5) 18 0.5 2 24 lod score Z(0.1) = log 10 L(0.1) L(0.5) 3.2
Test lod score 25 max 1 3 0 Z 2 0 tempo rekombinacji 0.5
Programy komputerowe 26 LINKAGE FASTLINK VITESSE CRIMAP - pozwala oszacować uszeregowanie genów!
Mapy sprz eżeniowe 27 Fragment mapy sprz eżeniowej chromosomu 6 świni.
Mapy sprz eżeniowe (1999) 28 Gatunek liczba markerów przecietna odleg lość miedzy markerami Byd lo 1240 2,5 Świnia 1042 2,2 Owca 519 6,4 Koń 162 14,2 Pies 276 10,0
Mapowanie choroby monogenicznej 29 22 12 2 2 d d 2 1 1 2 D d D d 12 22 12 22 12 2 1 d d 2 2 d D 2 2 d D 2 1 d d 12 22 22 22
Mapowanie choroby monogenicznej 30 L I (θ) = (1 θ) 4 L II (θ) = θ 4 L(θ) = 1 2 [(1 θ)4 + θ 4 ] ] 0.5 [(1 0.25) 4 + 0.25 4 Z(0.25) = log 10 ] 0.79 0.5 [(1 0.5) 4 + 0.5 4
Mapowanie choroby monogenicznej 31 5 4 lod score 3 2 1 0 1 2 0 0.15 0.25 0.35 0.45 tempo rekombinacji
Cechy z lożone 32 A H a Aa bb aa Bb locus heterogeneity disease loci Aa bb Ha bb allelic heterogeneity Aa bb Aa Bb epistasis B b Aa bb aa bb incomplete penetrance phenocopy
Geny cech ilościowych 33 QTL (Quantitative Trait Locus) to locus genu cechy ilościowej. Gen g lówny (major gene) - to QTL o bardzo dużym efekcie.
Model poligeniczny 34 czestosc abc ABc AbC abc abc ABC genotyp
Model mieszany - QTL + poligeny 35 czestosc abc qq ABc AbC abc abc Qq ABc AbC abc abc genotyp QQ ABc ABc AbC abc ABC
Mapowanie QTL 36 G lówna strategia 1. (utworzenie populacji w nierównowadze gametycznej) 2. śledzenie (przy pomocy markerów) przekazywania fragmentów chromosomowych od rodziców do potomstwa 3. porównanie wydajności zwierz at, które odziedziczy ly różne fragmenty chromosomowe
Nierównowaga gametyczna 37 A p A a p a B q B p A q B + D p a q B D b q b p A q b D p a q b + D
Nierównowaga gametyczna 38 nierownowaga gametyczna (D) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 r=0.5 r=0.3 r=0.01 r=0.05 r=0.1 0 2 4 6 8 10 pokolenie
Nierównowaga gametyczna 39 Mm D=0.0 mm Qq qq frequency frequency MM Qq QQ D=0.1 MM QQ Qq qq qq QQ QQ Mm Qq qq QQ QQ Qq mm Qq qq qq
Mapowanie QTL 40 Uk lady doświadczalne: krzyżówki mi edzy liniami, rasami i gatunkami nierównowaga gametyczna w populacji duża szansa wykrycia QTL ale tylko tych odpowiedzialnych za różnice mi edzy rasami zwierz eta czystorasowe nierównowaga gametyczna w rodzinach mniejsza szansa wykrycia QTL QTL odpowiedzialne za zmienność osobnicza
Uk lad doświadczalny F2 41 świnie dzik świnie ras szlachetnych Meishan świnie ras szlachetnych z lotnicka pstra wielka bia la polska drób Red Jungle Fowl White Leghorn Sasumadorri White Plymouth Rock byd lo byd lo holsztyńsko-fryzyjskie charolais
Uk lad doświadczalny F2 42 F0 rasa A M Q M Q rasa B m q m q F1 M Q m q genotypowanie F2 M M M m m m pomiar cech
Uk lad doświadczalny F2 43 MMQQ mmqq MmQq gamety MM 1/4 Mm 1/2 mm 1/4 P(MQ)=P(mq)=0.5(1 r) P(Mq)=P(mQ)=0.5r P(QQ MM) = P(MQ)*P(MQ)/4=(1 r)*(1 r) P(Qq MM) = 2r(1 r) P(qq MM) = r*r
Uk lad doświadczalny F2 44 L(z MM) = P (QQ MM) f(z, µ QQ, σ) +P (Qq MM) f(z, µ Qq, σ) +P (qq MM) f(z, µ qq, σ) ( ) f(z, µ QQ, σ) = 1 exp (z µ QQ ) 2 2πσ 2 2σ 2
Mapowanie przedzia lowe 45 A Q B
Mapowanie QTL 46 W populacji F2, po krzyżowaniu knurów Meishan z lochami holenderskimi, badano grubość s loniny. Zlokalizowano QTL na chromosomie 17, którego efekt addytywny wynosi a = 2.1mm (De Koning 2001). Strza lki wskazuja pozycje markerów. statystyka testowa wartosc krytyczna chromosom 17 swini 0 30 70 80 150 cm
Mapowanie w populacjach hodowlanych 47 Trudniejsze niż u mieszańców: selekcja prowadzi do utrwalenia korzystnych alleli i redukcji zmiennośći genetycznej także mniejsza zmienność markerów w poszczególnych rodzinach segreguja różne QTL i allele różne fazy sprzeżenia pomiar fenotypów mniej doskona ly Latwiejsze niż u cz lowieka - duże grupy (pó l)rodzeństwa
48 Daughter design Pozwala wykryc QTL w czystych Mm rasach. Poro wnywane sa, co rki krowy, kto re odziedziczyly po ojcu alterantywne allele markerowe. Genotypowane sa, buhaje, matki i co rki. M* m*
Granddaughter design 49 genotypowanie Genotypowane sa tylko buhaje (duża oszczedność). Zamiast fenotypów bada si e wartość hodowlana buhajów, oceniona na podstawie dużej liczby córek. h 2 wartości hodowlanej aż 80%. ocena potomstwa
Genotypowanie wybiórcze 50 20% 20% 1 S.D. Genotypowanie osobników odbiegajacych 1 S.D. od średniej pozwala zredukować liczbe osobników o 60% bez straty mocy doświadczenia.
Dok ladność analizy sprz eżeniowej 51 Wymagana - 1cM (klonowanie pozycyjne genów kandydatów) Ograniczona dostepności a loci markerowych ilościa i rozk ladem crossing-over w badanej rodzinie Osiagana cechy proste - kilka cm (400 mejoz daje 90% szans na lokalizacje genu z dok ladności a 1cM) cechy z lożone - kilkadziesiat cm
Mapowanie porównawcze 52 Pozwala zaw ezić grup e genów kandydatów we wskazanym regionie (50cM to setki genów). Wykorzystuje zjawisko konserwatyzmu genetycznego - tu podobieństwa u lożenia genów u różnych gatunków. Najważniejsze źród la informacji to mapy cz lowieka i myszy.
Mapowanie genów i.p.p. 53 Przy b. bliskim sasiedztwie markera i genu crossing-over prawie nie zachodzi, co daje duża nierównowage gametyczna. Jeżeli przyczyna choroby jest 1 zmutowany gen, chorzy bed a dzielili sasiaduj ace markery i.p.p.
Mapowanie genów i.p.p. 54 1 2 5 6 3 4 1 3 3 5 r=1/8 r=1/4
Mapowanie genów i.p.p. 55 1 para spokrew. 1 4 1/8 1 5 1/8 2 3 2 3 1/4 2 5 1/8 4 5 3 4 4 5 1/8 1/16 13/16 13/16
Asocjacja allel-cecha 56 test χ 2 dla danego allelu si la asocjacji - ryzyko relatywne testowany allel obecny brak gr. dośw. n 1 n 3 gr. kontrolna n 2 n 4 R = n 1 (n 2 +n 4 ) n 2 (n 1 +n 3 )
Przypadek cukrzycy 57 Badano plemiona Pima i Tohono O odham (pd. Arizona) w których cz esto wyst epuje cukrzyca typu 2. Wykonano proste porównanie udzia lu cukrzyków w dwóch grupach haplotypowych. Badanie wykaza lo, że pewien allel Gm + jest negatywnie skorelowany z cukrzyca. Gm + ogó lem % cukrzyków obecny 293 8% brak 4627 29%
Populacje l aczone 58 Populacja A - 100 osobników allel N chorych % chorych obecny 80 16 20% brak 20 4 20% Populacja B - 100 osobników allel N chorych % chorych obecny 30 15 50% brak 70 35 50% A+B - 200 osobników allel N chorych % chorych obecny 110 16+15=31 28% brak 90 4+35=39 43%
Przypadek cukrzycy - c.d. 59 Dalsze badanie wykaza lo, że asocjacja jest spowodowana przemieszaniem plemion z Kaukazami. U Kaukazów allel Gm + wystepuje z czestoci a 67%, a u rodowitych Pima i Tohono <1%. Badania ograniczone do rodowitych Pima i Tohono nie wykaza ly asocjacji. Gm + ogó lem % cukrzyków obecny 17 59% brak 1764 60%
Test TDT 60 Transmission disequlibrium test porównuje ile razy dany allel zosta l przekazany (T) chorym a ile nie (NT) 3 3 przekazany 1 2 przy braku sprz eżenia T NT χ 2 1 = (T NT ) 2 /(T + NT ) 3 1 nie przekazany
Test TDT 61 a b b c a b c c T +1 NT +0 b c T +0 T +1 NT +1 NT +0 b c
Test TDT 62 Przetestowano 21 markerów u 455 rodzin cukrzyków typu 1. Jeden z trzech alleli markera D2S152 jest mocno powiazany z cukrzyca. Obecność tego allelu może wskazywać na ryzyko zachorowania. allel T NT χ 2 p 228 81 45 10.29 0.001 230 59 73 1.48 0.223 240 36 24 2.40 0.121
Podsumowanie 63 Określenie pozycji genu jest pierwszym krokiem do jego identyfikacji. Naj latwiej określić pozycj e genów wzgl edem genów markerowych. Dla wielu gatunków powsta ly (markerowe) mapy sprzeżeniowe stanowiace matryce do lokalizacji ważnych genów. Najważniejsze źród la markerów genetycznych to RFLP, mikro- i minisatelity oraz SNP. Analiza sprz eżeniowa jest najważniejszym narz edziem mapowania. Bazuje na obserwacji rekombinacji genów.
Geny sprzeżone maja tempo rekombinacji < 0.5. 64 Funkcja mapowa pozwala wyliczyć odleg lość genetyczna (cm) z oszacowanego tempa rekombinacji. Test lod score testuje czy dwa geny sa sprzeżone. QTL można wykryć analizujac mieszańce mocno zróżnicowanych ras lub bada- ac poszczególne rodziny. j Do zmapowania QTL potrzeba setek osobników, dla cech prostej tylko kilkanaście. Wst epna lokalizacja QTL daje bardzo niedok ladny wynik. Dok ladna lokalizacja QTL stanowi poważne wyzwanie.
Informacja genomowa może może być przenoszona mi edzy gatunkami przez mapowanie porównawcze. 65 Bliskie sprz eżenie utrzymuje asocjacje allel (markerowy) - cecha przez wiele pokoleń.