Mapowanie genów czowieka i badania asocjacji podstawy
Sprzężenie Geny leżące na różnych chromosomach spełniają II prawo Mendla Dla 2 genów: 4 równoliczne klasy gamet W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Sprzężenie Allele genów leżących na tym samym chromosomie dziedziczą się razem sprzężenie Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Sprzężenie Crossing-over (rekombinacja chromatyd niesiostrzanych) Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich 2 równoliczne klasy gamet zrekombinowanych Klasy zrekombinowane mniej liczne od rodzicielskich W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Mapowanie genów Aby powstały gamety zrekombinowane, crossing-over musi zajść pomiędzy genami (loci) powstają gamety zrekombinowane W. S Klug, M.R Cummings Concepts of Genetics 8th edition, Prentice Hall, 2005
Mapowanie genów Prawdopodobieństwo crossing-over pomiędzy genami jest proporcjonalne do odległości między nimi na chromosomie Liczebność klas zrekombinowanych w potomstwie jest miarą odległości genetycznej U Drosophila najlepiej mapować za pomocą heterozygotycznej samicy i samca recesywnego A u człowieka?
Asocjacja i sprzężenie Sprzężenie - wspólna segregacja alleli genów leżących blisko siebie na chromosomie dotyczy loci, nie konkretnych alleli proste podłoże biologiczne (chromosomy, rekombinacja) badana w rodowodach i/lub parach krewnych Asocjacja - korelacja występowania konkretnych alleli genów w populacji dotyczy konkretnych alleli często złożone i/lub niejasne podłoże biologiczne - zjawisko statystyczne, niekiedy bez związku przyczynowego dotyczy populacji lub grupy, ale bez wymogu pokrewieństwa może niekiedy być związana ze sprzężeniem (nierównowaga sprzężeń)
Metody Sprzężenie - analiza sprzężeń (mapowanie) metody parametryczne metody nieparametryczne Asocjacje - badania korelacji (testy statystyczne)
Asocjacja Nieprzypadkowe współwystępowanie czynników (alleli i fenotypów) na poziomie populacji Czy zawsze asocjacja oznacza zależność przyczynową? Czy każda asocjacja ma wartość diagnostyczną? Czy asocjacja odkrywa gen na...?
Struktura populacji Lander & Schork, 1994 - w rejonie San Francisco jest wyraźna asocjacja między allelem HLA-A1 a umiejętnością jedzenia pałeczkami
Przykad medyczny Allel 3A4 cytochromu P450 (CYP3A) i rak prostaty (bardziej zaawansowana postać w momencie diagnozy) CYP3A może w pływać na tempo hydroksylowania testosteronu - związek przyczynowy? Nie ma wpływu allelu 3A4 na kinetykę metabolizmu testosteronu# Allel 3A4 częściej występuje u ludzi pochodzenia afrykańskiego (Afroamerykanie), niż europejskiego# Podobne korelacje dla raka prostaty dla innych alleli częstszych w populacji afrykańskiej# Bardziej zaawansowany rak prostaty u Afroamerykanów (przyczyny społeczne)?#
Przyczyny asocjacji alleli Paradoks Simpsona: Jeżeli zmieszamy dwie populacje, w których nie występuje asocjacja markera i choroby, ale są różne częstości występowania choroby (oraz markera), w zmieszanej populacji pojawi się asocjacja markera z chorobą (problem ukrytej zmiennej).# Jest to przyczyna artefaktów#
Paradoks Simpsona Prosty przykład: uniwersytet powinien faworyzować kobiety przy przyjmowaniu na studia doktoranckie: Mężczyźni# Kobiety# Wydział historii# 1/5 (20%)# 2/8 (25%)# Wydział geografii# 6/8 (75%)# 4/5 (80%)# Razem# 7/13 (54%)# 6/13 (46%)
University of California, Berkeley, 1973 Przyjęcia na studia doktoranckie Kierunek "Mężczyźni (przyjęci) "Kobiety (przyjęte)" A "825 "62% "108 "82%" B "560 "63% "25 "68%" C "325 "37% "593 "34%" D "417 "33% "375 "35%" E "191 "28% "393 "24%" F "272 "6% "341 "7%" Razem!8442!44%!4321!35%" Więcej kobiet zgłaszało się na trudniejsze kierunki.
Przykad medyczny Porównywano dwie terapie kamieni nerkowych# Terapia A# Terapia B# 78 % (273/350)# 83% (289/350)# Ale: Terapia A# Terapia B# Małe kamienie# 93% (81/87)# 87% (234/270)# Duże kamienie# 73% (192/263)# 69% (55/80)# Razem# 78 % (273/350)# 83% (289/350)# Terapię A częściej stosowano u pacjentów z dużymi kamieniami, które trudniej się leczy.#
Paradoks niskiej masy urodzeniowej Niska masa urodzeniowa zwiększa śmiertelność Palenie u matki zwiększa prawdopodobieństwo wystąpienia niskiej masy urodzeniowej oraz śmiertelność, ale: Dzieci matek palących z NMU mają mniejszą śmiertelność, niż dzieci matek niepalących z NMU??? Wyjaśnienie: dzieci matek palących częściej mają NMU, nawet bez innych problemów, dzieci matek niepalących mają NMU rzadziej, wtedy kiedy występuje inny problem
Asocjacja Zależności funkcjonalne, nie związane ze sprzężeniem często z allelami MHC (HLA) - związane z funkcjonowaniem układu odpornościowego poszukuje się asocjacji dla bardzo intensywnie poznawanych polimorfizmów SNP w genomie człowieka
Farmakogenetyka i farmakogenomika Znamy ponad 10 milionów SNP, większość bez znaczenia CRHR1 (receptor kortykotropiny) - skuteczność terapii kortykosteroidami w leczeniu astmy HLA-B27 - nadwrażliwość na skutki uboczne Abcaviru HTR2A (serotonina 2A) - reakcja na środki antydepresyjne itd.
Asocjacja - przykład HLA-B27 i choroby autoimmunologiczne, np. zesztywniające zapalenie stawów Chorzy# Zdrowi# HLA-B27 +# 90# 1000# HLA-B27 -# 10# 9000# test statystyczny Fishera (Fisher exact test): p 2 10-76
Geny na...?
A w rzeczywistości...
Dla przypomnienia HLA-B27 i choroby autoimmunologiczne, np. zesztywniające zapalenie stawów Chorzy# Zdrowi# HLA-B27 +# 90# 1000# HLA-B27 -# 10# 9000# OR = 90 1000 10 9000 = 81 test statystyczny Fishera (Fisher exact test): p 2 10-76
Sprzężenie (bliskie) mutacja A 1 d A 1 D
Asocjacja a sprzężenie Asocjacja alleli# Sprzężenie# Na poziomie populacji# W rodzinie# Wskazuje konkretne allele# Wskazuje loci#
Sprzężenie markera i genu choroby Asocjacja w obrębie rodziny Z reguły brak asocjacji w populacji Niezależne od struktury populacji Asocjacja populacyjna dla rzadkiego allelu i bardzo bliskiego sprzężenia nierównowaga sprzężeń
Metody mapowania Parametryczna (oparte na modelach) analiza lod dwupunktowa wielopunktowa Nieparametryczna analiza sprzężeń współwystępowanie alleli klucz: IBD (identity by descent) vs. IBS (identity by state)
Analiza nieparametryczna Dwa allele są identyczne przez pochodzenie (IBD) jeżeli są kopiami tego samego allelu rodzicielskiego
Analiza nieparametryczna Korelacja względnego podobieństwa u par mapowanej cechy z podobieństwem markera Badania bliźniąt Badania chorego rodzeństwa (affected siblings method) Badania rodzin (2-3 pokoleniowe)
Miarą odlegości jest częstość rekombinacji częstość rekombinacji θ=prawdopodobieństwo przekazania zrekombinowanej gamety Loci na różnych chromosomach segregują niezależnie => θ = 0,5 Loci blisko sprzężone segregują razem => θ = 0 Terminologia θ<0,5 sprzężenie θ=0,5 brak sprzężenia
Mapowanie Jednostka cm (centymorgan) = 1% rekombinacji W rzeczywistości zależność nie jest liniowa Podwójny crossing-over gamety typu rodzicielskiego Interferencja zajście crossing-over w danym miejscu wpływa na prawdopodobieństwo zajścia kolejnego w pobliżu
Podwójny c-o jeszcze bardziej złożony W. S Klug, M.R Cummings Concepts of Genetics 8th edition, Prentice Hall, 2005 Powstanie średnio 50% rekombinantów. Podobnie dla potrójnych itp.
Funkcja mapowa zależność odlegości genetycznej od częstości rekombinacji Funkcja mapowa Haldane a d = ln(1 2θ) 2 nie uwzględnia interferencji w crossing-over Funkcja mapowa Kosambiego uwzględnia interferencję crossing-over zmniejsza prawdopodobieństwo drugiego w pobliżu szeroko stosowana Dla małych wartości θ: d θ 1+ 2θ ln 1 2θ d = 4
Mapy genetyczne a płeć Całkowita mapa mężczyzny = 2851cM Całkowita mapa kobiety = 4296cM (wyłączając X) Dla ~3000Mb genomu autosomalnego 1 cm u mężczyzny 1.05 Mb 1 cm u kobiety 0.88Mb
Wiarygodność (likelihood) Wiarygodność=prawdopodobieństwo uzyskania danych przy założeniach modelu i jego określonych parametrach W układzie w pełni informatywnym dane: R=liczba rekombinantów, NR=liczba genotypów rodzicielskich parametr: częstość rekombinacji θ=prawd. rekombinacji Hipoteza zerowa brak sprzężenia (θ=0,5) Stosunek wiarygodności L(θ)/L(θ=0,5) lod score (Z) = logarithm of odds logarytm (dziesiętny) stosunku wiarygodności
Jak obliczać lod score Dla każdego rodowodu (i) lod wynosi: Z i ( ˆ θ ) = log 10 L( ped _ data / ˆ θ ) L( ped _ data /θ = 0,5) Dla danej wartości θ, sumuje się wartości lod-score z różnych rodowodów (F): Z( ˆ θ ) = F i=1 Z i ( ˆ θ )
Wynik dwupunktowej analizy sprzężeń lod -4-2 0 2 4 znaczące wykluczone Tabela θ= 0.01, 0.10, 0.20, 0.30, 0.35, 0.40, 0.45, 0.50 lod= -5.0, -2.0, 1.0, 3.3, 4.0, 3.0, 1.0, 0.0
1,1 1,2 1,2 2,2 1,2 2,2 2,2 1,2 1,2
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Przy braku sprzężenia (θ=0,5) prawdopodobieństwo uzyskania R i NR jest równe i wynosi ½ L(θ=0,5)= (½) 5
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Dla sprzężenia θ prawdopodobieństwo uzyskania R wynosi θ (z definicji), więc prawdopodobieństwo uzyskania NR wynosi 1- θ L(θ)= θ (1- θ) 4 1R 4NR
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) L(θ=0,5)= (½) 5 L(θ)= θ (1- θ) 4 Dla θ=0,1 L(θ=0,1) = 0,1 (0,9) 4 0,1 0,9 4 Z(θ = 0,1) = log 10 0,5 5 0,32
0# 0,02# 0,1# 0,2# 0,3# 0,4# 0,5# - -0,23 0,32 0,42 0,36 0,22 0
0# 0,02# 0,1# 0,2# 0,3# 0,4# 0,5# - # -0,23# 0,32# 0,42# 0,36# 0,22# 0#
1,1 1,2 Nieznana faza u ojca 1,2 2,2 1,2 2,2 2,2 1,2 1,2
1,2 2,2 1R 4NR L(θ = 0,2) = 1 + 2-0,2 0,84 2 1,2 2,2 2,2 1,2 1,2 albo 1NR 4R 2 + 1 - L(θ = 0,2) = 0,24 0,8 + 2 4 0,2 0,8 Z(θ = 0,2) = log 2 10 0,5 5 + 0,24 0,8 2 0,12