Mapowanie genów czowieka podstawy
Sprzężenie Geny leżące na różnych chromosomach spełniają II prawo Mendla Dla 2 genów: 4 równoliczne klasy gamet W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Sprzężenie Allele genów leżących na tym samym chromosomie dziedziczą się razem sprzężenie Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Sprzężenie Crossing-over (rekombinacja chromatyd niesiostrzanych) Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich 2 równoliczne klasy gamet zrekombinowanych Klasy zrekombinowane mniej liczne od rodzicielskich W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Mapowanie genów Aby powstały gamety zrekombinowane, crossing-over musi zajść pomiędzy genami (loci) powstają gamety zrekombinowane W. S Klug, M.R Cummings Concepts of Genetics 8th edition, Prentice Hall, 2005
Mapowanie genów Prawdopodobieństwo crossing-over pomiędzy genami jest proporcjonalne do odległości między nimi na chromosomie Liczebność klas zrekombinowanych w potomstwie jest miarą odległości genetycznej U Drosophila najlepiej mapować za pomocą heterozygotycznej samicy i samca recesywnego A u człowieka?
Asocjacja i sprzężenie Sprzężenie - wspólna segregacja alleli genów leżących blisko siebie na chromosomie dotyczy loci, nie konkretnych alleli proste podłoże biologiczne (chromosomy, rekombinacja) badana w rodowodach i/lub parach krewnych Asocjacja - korelacja występowania konkretnych alleli genów w populacji dotyczy konkretnych alleli często złożone i/lub niejasne podłoże biologiczne - zjawisko statystyczne, niekiedy bez związku przyczynowego dotyczy populacji lub grupy, ale bez wymogu pokrewieństwa może niekiedy być związana ze sprzężeniem (nierównowaga sprzężeń)
Metody Sprzężenie - analiza sprzężeń (mapowanie) metody parametryczne metody nieparametryczne Asocjacje - badania korelacji (testy statystyczne)
Asocjacja a sprzężenie Asocjacja alleli! Sprzężenie! Na poziomie populacji! W rodzinie! Wskazuje konkretne allele! Wskazuje loci!
Sprzężenie markera i genu choroby Asocjacja w obrębie rodziny Z reguły brak asocjacji w populacji Niezależne od struktury populacji Asocjacja populacyjna dla rzadkiego allelu i bardzo bliskiego sprzężenia nierównowaga sprzężeń
Metody mapowania Parametryczna (oparte na modelach) analiza lod dwupunktowa wielopunktowa Nieparametryczna analiza sprzężeń współwystępowanie alleli klucz: IBD (identity by descent) vs. IBS (identity by state)
Analiza nieparametryczna Dwa allele są identyczne przez pochodzenie (IBD) jeżeli są kopiami tego samego allelu rodzicielskiego
Analiza nieparametryczna Korelacja względnego podobieństwa u par mapowanej cechy z podobieństwem markera Badania bliźniąt Badania chorego rodzeństwa (affected siblings method) Badania rodzin (2-3 pokoleniowe)
Miarą odlegości jest częstość rekombinacji częstość rekombinacji θ=prawdopodobieństwo przekazania zrekombinowanej gamety Loci na różnych chromosomach segregują niezależnie => θ = 0,5 Loci blisko sprzężone segregują razem => θ = 0 Terminologia θ<0,5 sprzężenie θ=0,5 brak sprzężenia
Mapowanie Jednostka cm (centymorgan) = 1% rekombinacji W rzeczywistości zależność nie jest liniowa Podwójny crossing-over gamety typu rodzicielskiego Interferencja zajście crossing-over w danym miejscu wpływa na prawdopodobieństwo zajścia kolejnego w pobliżu
Podwójny c-o jeszcze bardziej złożony W. S Klug, M.R Cummings Concepts of Genetics 8th edition, Prentice Hall, 2005 Powstanie średnio 50% rekombinantów. Podobnie dla potrójnych itp.
Funkcja mapowa zależność odlegości genetycznej od częstości rekombinacji Funkcja mapowa Haldane a d = ln(1 2θ) 2 nie uwzględnia interferencji w crossing-over Funkcja mapowa Kosambiego uwzględnia interferencję crossing-over zmniejsza prawdopodobieństwo drugiego w pobliżu szeroko stosowana Dla małych wartości θ: d θ 1+ 2θ ln 1 2θ d = 4
Mapy genetyczne a płeć Całkowita mapa mężczyzny = 2851cM Całkowita mapa kobiety = 4296cM (wyłączając X) Dla ~3000Mb genomu autosomalnego 1 cm u mężczyzny 1.05 Mb 1 cm u kobiety 0.88Mb
Wiarygodność (likelihood) Wiarygodność=prawdopodobieństwo uzyskania danych przy założeniach modelu i jego określonych parametrach W układzie w pełni informatywnym dane: R=liczba rekombinantów, NR=liczba genotypów rodzicielskich parametr: częstość rekombinacji θ=prawd. rekombinacji Hipoteza zerowa brak sprzężenia (θ=0,5) Stosunek wiarygodności L(θ)/L(θ=0,5) lod score (Z) = logarithm of odds logarytm (dziesiętny) stosunku wiarygodności
Jak obliczać lod score Dla każdego rodowodu (i) lod wynosi: Z i ( ˆ θ ) = log 10 L( ped _ data / ˆ θ ) L( ped _ data /θ = 0,5) Dla danej wartości θ, sumuje się wartości lod-score z różnych rodowodów (F): Z( ˆ θ ) = F i=1 Z i ( ˆ θ )
Wynik dwupunktowej analizy sprzężeń lod -4-2 0 2 4 znaczące wykluczone Tabela θ= 0.01, 0.10, 0.20, 0.30, 0.35, 0.40, 0.45, 0.50 lod= -5.0, -2.0, 1.0, 3.3, 4.0, 3.0, 1.0, 0.0
1,1 1,2 1,2 2,2 1,2 2,2 2,2 1,2 1,2
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Przy braku sprzężenia (θ=0,5) prawdopodobieństwo uzyskania R i NR jest równe i wynosi ½ L(θ=0,5)= (½) 5
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Dla sprzężenia θ prawdopodobieństwo uzyskania R wynosi θ (z definicji), więc prawdopodobieństwo uzyskania NR wynosi 1- θ L(θ)= θ (1- θ) 4 1R 4NR
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) L(θ=0,5)= (½) 5 L(θ)= θ (1- θ) 4 Dla θ=0,1 L(θ=0,1) = 0,1 (0,9) 4 0,1 0,9 4 Z(θ = 0,1) = log 10 0,5 5 0,32
0! 0,02! 0,1! 0,2! 0,3! 0,4! 0,5! - -0,23 0,32 0,42 0,36 0,22 0
0! 0,02! 0,1! 0,2! 0,3! 0,4! 0,5! -! -0,23! 0,32! 0,42! 0,36! 0,22! 0!
1,1 1,2 Nieznana faza u ojca 1,2 2,2 1,2 2,2 2,2 1,2 1,2
1,2 2,2 1R 4NR L(θ = 0,2) = 1 + 2-0,2 0,84 2 1,2 2,2 2,2 1,2 1,2 albo 1NR 4R 2 + 1 - L(θ = 0,2) = 0,24 0,8 + 2 4 0,2 0,8 Z(θ = 0,2) = log 2 10 0,5 5 + 0,24 0,8 2 0,12