Mapowanie genów człowieka i badania asocjacji podstawy
Sprzężenie } Geny leżące na różnych chromosomach spełniają II prawo Mendla Dla 2 genów: 4 równoliczne klasy gamet W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Sprzężenie } Allele genów leżących na tym samym chromosomie dziedziczą się razem sprzężenie Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Sprzężenie } Crossing-over (rekombinacja chromatyd niesiostrzanych) Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich 2 równoliczne klasy gamet zrekombinowanych Klasy zrekombinowane mniej liczne od rodzicielskich W. S Klug, M.R Cummings Concepts of Genetics 8 th edition, Prentice Hall, 2005
Mapowanie genów } Aby powstały gamety zrekombinowane, crossing-over musi zajść pomiędzy genami (loci) powstają gamety zrekombinowane W. S Klug, M.R Cummings Concepts of Genetics 8th edition, Prentice Hall, 2005
Mapowanie genów } Prawdopodobieństwo crossing-over pomiędzy genami jest proporcjonalne do odległości między nimi na chromosomie } Liczebność klas zrekombinowanych w potomstwie jest miarą odległości genetycznej } U Drosophila najlepiej mapować za pomocą heterozygotycznej samicy i samca recesywnego } A u człowieka?
Asocjacje } Nieprzypadkowe współwystępowanie czynników (alleli i fenotypów) na poziomie populacji (korelacja) } Czy zawsze asocjacja oznacza zależność przyczynową? } Czy każda asocjacja ma wartość diagnostyczną? } Czy asocjacja odkrywa gen na...? } Czy zawsze czynnik ryzyka? 7
Geny na...? 8
Asocjacja Przyczyny asocjacji losowa (i nieprawidłowe obliczanie p) relacja przyczynowa związek bezpośredni (plejotropizm, jednym z efektów allelu A jest podatność na chorobę) dobór naturalny (allel A zwiększa fitness u chorych) nie zawsze czynnik ryzyka struktura populacji i efekty statystyczne zależności etniczne paradoks Simpsona (dodatkowa zmienna ukryta) bliskie sprzężenie + historia (nierównowaga sprzężeń) 9
Struktura populacji } Lander & Schork, 1994 - w rejonie San Francisco jest wyraźna asocjacja między allelem HLA-A1 a umiejętnością jedzenia pałeczkami HLA-A1 jest częstszy u Azjatów niż u Europejczyków 10
Asocjacje mogą być zwodne } } Allel 3A4 cytochromu P450 (CYP3A) i rak prostaty (bardziej zaawansowana postać w momencie diagnozy) CYP3A może w pływać na tempo hydroksylowania testosteronu - związek przyczynowy? Nie ma wpływu allelu 3A4 na kinetykę metabolizmu testosteronu Allel 3A4 częściej występuje u ludzi pochodzenia afrykańskiego (Afroamerykanie), niż europejskiego Podobne korelacje dla raka prostaty dla innych alleli częstszych w populacji afrykańskiej Bardziej zaawansowany rak prostaty u Afroamerykanów (przyczyny społeczne)? 11
Przyczyny asocjacji alleli Struktura populacji (ukryta zmienna) Paradoks Simpsona: Jeżeli zmieszamy dwie populacje, w których nie występuje asocjacja markera i choroby, ale są różne częstości występowania choroby (oraz markera), w zmieszanej populacji pojawi się asocjacja markera z chorobą (problem ukrytej zmiennej). Jest to przyczyna artefaktów Należy badać populacje jednorodne etnicznie, a nawet tylko pojedyncze duże rodziny 12
Paradoks Simpsona } Prosty przykład: uniwersytet powinien faworyzować kobiety przy przyjmowaniu na studia doktoranckie: Mężczyźni Kobiety Wydział historii 1/5 (20%) 2/8 (25%) Wydział geografii 6/8 (75%) 4/5 (80%) Razem 7/13 (54%) 6/13 (46%) 13
University of California, Berkeley, 1973 Przyjęcia na studia doktoranckie Kierunek Mężczyźni (przyjęci) Kobiety (przyjęte) 14 A 825 62% 108 82% B 560 63% 25 68% C 325 37% 593 34% D 417 33% 375 35% E 191 28% 393 24% Więcej F kobiet zgłaszało 272 się na trudniejsze 6% kierunki. 341 7% Razem 8442 44% 4321 35%
Przykład medyczny Porównywano dwie terapie kamieni nerkowych Terapia A Terapia B 78 % (273/350) 83% (289/350) Ale: Terapia A Terapia B Małe kamienie 93% (81/87) 87% (234/270) Duże kamienie 73% (192/263) 69% (55/80) Razem 78 % (273/350) 83% (289/350) 15 Terapię A częściej stosowano u pacjentów z dużymi kamieniami, które trudniej się leczy.
Podwójna ślepa próba } Przy badaniach działania leków. terapii itp. } Terapia vs. placebo; nowa terapia vs. dotychczasowa, itp. } Ani pacjent, ani lekarz oceniający efekty nie wie, do której grupy należy dany pacjent 16
Asocjacja } Zależności funkcjonalne } często z allelami MHC (HLA) - związane z funkcjonowaniem układu odpornościowego } poszukuje się asocjacji dla bardzo intensywnie poznawanych polimorfizmów SNP w genomie człowieka } farmakogenetyka i farmakogenomika polimorfizmy a działanie leków } CRHR1 (receptor kortykotropiny) - skuteczność terapii kortykosteroidami w leczeniu astmy } HLA-B27 - nadwrażliwość na skutki uboczne Abcaviru } HTR2A (serotonina 2A) - reakcja na środki antydepresyjne 17
Asocjacja - przykład } HLA-B27 i choroby autoimmunologiczne, np. zesztywniające zapalenie stawów Chorzy Zdrowi HLA-B27 + 90 1000 Ryzyko 8% HLA-B27-10 9000 Ryzyko 0,11% test statystyczny Fishera (Fisher exact test): p 2 10-76 Ryzyko dla całej populacji ~1% 18
19
Geny na...? 20
A w rzeczywistości... 21
A w rzeczywistości... Ryzyko schizofrenii u posiadaczy wariantu wzrasta z ~2% (w populacji) do ~4,5% (posiadający wariant) >95% posiadających wariant nie zachoruje (dla choroby dwubiegunowej, odpowiednio ~4% i ~10%) 22
Dla przypomnienia } HLA-B27 i choroby autoimmunologiczne, np. zesztywniające zapalenie stawów HLA-B27 + HLA-B27 - Chorzy Zdrowi 90 1000 10 9000 OR = 90 1000 10 9000 = 81 test statystyczny Fishera (Fisher exact test): p 2 10-76 23
Asocjacja i sprzężenie } Sprzężenie - wspólna segregacja alleli genów leżących blisko siebie na chromosomie } } } dotyczy loci, nie konkretnych alleli proste podłoże biologiczne (chromosomy, rekombinacja) badana w rodowodach i/lub parach krewnych } Asocjacja - korelacja występowania konkretnych alleli genów w populacji } } } } dotyczy konkretnych alleli często złożone i/lub niejasne podłoże biologiczne - zjawisko statystyczne, niekiedy bez związku przyczynowego dotyczy populacji lub grupy, ale bez wymogu pokrewieństwa może niekiedy być związana ze sprzężeniem (nierównowaga sprzężeń)
Metody } Sprzężenie - analiza sprzężeń (mapowanie) } metody parametryczne } metody nieparametryczne } Asocjacje - badania korelacji (testy statystyczne)
Allel genu d w pobliżu markera A zmutował dając związany z chorobą allel D wiele pokoleń temu' mutacja A 1 d A 1 D Jeżeli odległość A do d jest niewielka, wówczas większość chromosomów w populacji niosących D niesie też A 1 ' Ale nie odwrotnie!' Nierównowaga sprzężeń (linkage disequilibrium) nieprzypadkowe skojarzenie alleli w sprzężonych loci efekt założycielski. Maleje z czasem.'
Asocjacja a sprzężenie Asocjacja alleli' Sprzężenie' Na poziomie populacji' W rodzinie' Wskazuje konkretne allele' Wskazuje loci'
Sprzężenie markera i genu choroby } Asocjacja w obrębie rodziny } Z reguły brak asocjacji w populacji } Niezależne od struktury populacji } Asocjacja populacyjna dla rzadkiego allelu i bardzo bliskiego sprzężenia nierównowaga sprzężeń
Metody mapowania } Parametryczna (oparte na modelach) analiza lod } dwupunktowa } wielopunktowa } Nieparametryczna analiza sprzężeń } współwystępowanie alleli } klucz: IBD (identity by descent) vs. IBS (identity by state)
Analiza nieparametryczna Dwa allele są identyczne przez pochodzenie (IBD) jeżeli są kopiami tego samego allelu rodzicielskiego A 1 A 1 A 1 A 2 A 1 A 2 A 1 A 2 IBD
Analiza nieparametryczna } Korelacja względnego podobieństwa u par mapowanej cechy z podobieństwem markera } Badania bliźniąt } Badania chorego rodzeństwa (affected siblings method) } Badania rodzin (2-3 pokoleniowe) Analiza chorych krewniaków: czy w parach chorych krewnych allele markera (nieważne które) są wspólne częściej, niż w reszcie populacji?'
Miarą odległości jest częstość rekombinacji } częstość rekombinacji θ=prawdopodobieństwo przekazania zrekombinowanej gamety } Loci na różnych chromosomach segregują niezależnie => θ = 0,5 } Loci blisko sprzężone segregują razem => θ = 0 } Terminologia } θ<0,5 sprzężenie } θ=0,5 brak sprzężenia
Mapowanie } Jednostka cm (centymorgan) = 1% rekombinacji } W rzeczywistości zależność nie jest liniowa } Podwójny crossing-over gamety typu rodzicielskiego } Interferencja zajście crossing-over w danym miejscu wpływa na prawdopodobieństwo zajścia kolejnego w pobliżu
Podwójny c-o jeszcze bardziej złożony W. S Klug, M.R Cummings Concepts of Genetics 8th edition, Prentice Hall, 2005 } Powstanie średnio 50% rekombinantów. Podobnie dla potrójnych itp.
Funkcja mapowa zależność odległości genetycznej od częstości rekombinacji } Funkcja mapowa Haldane a d = ln(1 2θ) 2 } nie uwzględnia interferencji w crossing-over } } } } Funkcja mapowa Kosambiego } uwzględnia interferencję crossing-over zmniejsza prawdopodobieństwo drugiego w pobliżu szeroko stosowana Dla małych wartości θ: d θ $ 1+ 2θ ' ln& ) % 1 2θ ( d = 4
Funkcja mapowa } Wraz ze wzrostem odległości częstość c-o dąży do 0,5 } Dla genów niesprzężonych rekombinantów jest 50%, podobnie jak dla genów leżących w dużej odległości 36
Mapy genetyczne a płeć } Całkowita mapa mężczyzny = 2851cM } Całkowita mapa kobiety = 4296cM (wyłączając X) } Dla ~3000Mb genomu autosomalnego 1 cm u mężczyzny 1.05 Mb 1 cm u kobiety 0.88Mb
Wiarygodność (likelihood) } } Wiarygodność=prawdopodobieństwo uzyskania danych przy założeniach modelu i jego określonych parametrach W układzie w pełni informatywnym } dane: R=liczba rekombinantów, NR=liczba genotypów rodzicielskich } parametr: częstość rekombinacji θ=prawd. rekombinacji } } } Hipoteza zerowa brak sprzężenia (θ=0,5) Stosunek wiarygodności L(θ)/L(θ=0,5) lod score (Z) = logarithm of odds logarytm (dziesiętny) stosunku wiarygodności
Jak obliczać lod score Dla każdego rodowodu (i) lod wynosi: Z i ( ˆ θ ) = log 10 L( ped _ data / ˆ θ ) L( ped _ data /θ = 0,5) Dla danej wartości θ, sumuje się wartości lod-score z różnych rodowodów (F): Z( ˆ θ ) = F i=1 Z i ( ˆ θ )
Wynik dwupunktowej analizy sprzężeń lod -4-2 0 2 4 znaczące wykluczone Tabela θ= 0.01, 0.10, 0.20, 0.30, 0.35, 0.40, 0.45, 0.50 lod= -5.0, -2.0, 1.0, 3.3, 4.0, 3.0, 1.0, 0.0
Markery w analizie sprzężeń człowieka } Sprzężenie dwóch genów o obserwowalnym fenotypie praktycznie niespotykane } wyjątek zespół paznokciowo-rzepkowy (NPS Nail Patella Syndrome) i grupy krwi AB0 } Loci w obrębie kompleksów MHC } Markery molekularne } PCR, RFLP
Markery
Lokalizowanie genu } I etap zgrubne (markery co 8-20 cm) ustalenie chromosomu, czy 1 locus itp. } II etap dokładne (co 1-4 cm) The Cooperative Human Linkage Center, www.chlc.org
1,1 1,2 1,2 2,2 1,2 2,2 2,2 1,2 1,2
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Przy braku sprzężenia (θ=0,5) prawdopodobieństwo uzyskania R i NR jest równe i wynosi ½ L(θ=0,5)= (½) 5
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Dla sprzężenia θ prawdopodobieństwo uzyskania R wynosi θ (z definicji), więc prawdopodobieństwo uzyskania NR wynosi 1- θ L(θ)= θ (1- θ) 4 1R 4NR
1,1 1,2 1,2 2,2 * 1,2 2,2 2,2 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) L(θ=0,5)= (½) 5 L(θ)= θ (1- θ) 4 Dla θ=0,1 L(θ=0,1) = 0,1 (0,9) 4 $ 0,1 0,9 4 Z(θ = 0,1) = log 10 & % 0,5 5 ' ) 0,32 (
0' 0,02' 0,1' 0,2' 0,3' 0,4' 0,5' - -0,23 0,32 0,42 0,36 0,22 0
0' 0,02' 0,1' 0,2' 0,3' 0,4' 0,5' - ' -0,23' 0,32' 0,42' 0,36' 0,22' 0'
1,1 1,2 Nieznana faza u ojca 1,2 2,2 1,2 2,2 2,2 1,2 1,2
1,2 2,2 1R 4NR $ L(θ = 0,2) = & % 1 + 2-0,2 0,84 2 1,2 2,2 2,2 1,2 1,2 albo 1NR 4R 2 + 1 - ' $ ) L(θ = 0,2) = 0,24 0,8 + & ( % 2 ' ) ( $ 4 0,2 0,8 & Z(θ = 0,2) = log 2 10 & 0,5 5 & % + 0,24 0,8 2 ' ) ) ) ( 0,12
} Nail-patella syndrome