Dryf genetyczny i jego wpływ na rozkłady próbek z populacji - modele matematyczne Adam Bobrowski, IM PAN Katowice 1
Tematyka cyklu referatów Dryf genetyczny Matematyczne modele równowagi między mutacja a dryfem. 2
Główne zagadnienia na dziś Genetyka populacyjna i jej zastosowania. Dryf genetyczny. Koalescencja Kingmana. 3
Genetyka populacyjna Nauka o procesach zachodza- cych w materiale genetycznym zbiorowisk, populacji organizmów. Konglomerat dyscyplin naukowych: genetyka, biochemia, bioinformatyka, matematyka. statystyka, Dogmat: materiał genetyczny = chromosom. Główne siły: MUTACJA, SE- LEKCJA, REKOMBINACJA I DRYF GENETYCZNY. 4
Lokus Lokus - miejsce na chromosomie. Allel - jeden z możliwych stanów lokusa. Nie mylić z genem. 5
Zastosowania genetyki
Zastosowania genetyki Medycyna
Zastosowania genetyki Medycyna Sadownictwo
Zastosowania genetyki Medycyna Sadownictwo Archeologia!
Zastosowania genetyki Medycyna Sadownictwo Archeologia! Ślady przeszłych zmian wielkości populacji w materiale genetycznym Historia zapisana w genach. 6
Jak to możliwe? - Dryf genetyczny MUTACJA - losowa zmiana stanu lokusa SELEKCJA - usuwanie wadliwych" kopii REKOMBINACJA - mieszanie materiału genetycznego z różnych lokusów DRYF GENETYCZNY - losowa zmiana częstości alleli 7
Prawo Hardy ego - Weinberga Nieskończenie wielka" populacja. Na lokusie dwa możliwe allele - A i a. Osobnik = gameta = para chromosomów = para alleli AA,aa,Aa. Gamety łacz a się losowo. 8
Prawo Hardy ego - Weinberga Nieskończenie wielka" populacja. Na lokusie dwa możliwe allele - A i a. Osobnik = gameta = para chromosomów = para alleli AA,aa,Aa. Gamety łacz a się losowo. AA x, Aa 2y, aa z, (x + 2y + z = 1). Częstość połaczeń gamet AA Aa aa AA x 2 2xy xz Aa 2xy 4y 2 2yz aa xz 2yz z 2 8
Prawo Hardy ego - Weinberga Nieskończenie wielka" populacja. Na lokusie dwa możliwe allele - A i a. Osobnik = gameta = para chromosomów = para alleli AA,aa,Aa. Gamety łacz a się losowo. AA x, Aa 2y, aa z, (x + 2y + z = 1). AA + AA AA, Częstość połaczeń gamet Gamety potomne AA Aa aa AA x 2 2xy xz Aa 2xy 4y 2 2yz aa xz 2yz z 2 AA + Aa AA(Pr = 1 2 ) lub Aa(Pr = 1 2 ), Aa + Aa AA(Pr = 1 4 ) lub Aa(Pr = 1 2 ) lub aa(pr = 1 4 ), AA + aa Aa pozostałe przypadki przez symetrię 8
Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 AA x, Aa 2y, aa z, (x + 2y + z = 1). AA + AA AA, Częstość połaczeń gamet Gamety potomne AA Aa aa AA x 2 2xy xz Aa 2xy 4y 2 2yz aa xz 2yz z 2 AA + Aa AA(Pr = 1 2 ) lub Aa(Pr = 1 2 ), Aa + Aa AA(Pr = 1 4 ) lub Aa(Pr = 1 2 ) lub aa(pr = 1 4 ), AA + aa Aa pozostałe przypadki przez symetrię 9
Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10
Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 = 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10
Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 = (x+y) 2 = x. 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10
Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 = (x+y) 2 = x. Podobnie y = y i z = z. 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10
Prawo Hardy ego - Weinberga W nieskończenie wielkich" populacjach częstotliwość gamet znajduje się w stanie równowagi Hardy ego - Weinberga i jest następujaca AA p 2 Aa 2p(1 p) aa (1 p) 2 gdzie p(= x + y) jest częstotliwościa występowania allela A. 11
Prawo Hardy ego - Weinberga W nieskończenie wielkich" populacjach częstotliwość gamet znajduje się w stanie równowagi Hardy ego - Weinberga i jest następujaca AA p 2 Aa 2p(1 p) aa (1 p) 2 gdzie p(= x + y) jest częstotliwościa występowania allela A. Testy statystyczne na to czy populacja jest w równowadze H-W. 11
Małe populacje - znaczne odchylenia. 12
Małe populacje - znaczne odchylenia. Ludność odizolowanej wioski w buszu, lub małej wyspy. 12
Małe populacje - znaczne odchylenia. Ludność odizolowanej wioski w buszu, lub małej wyspy. Małe populacje zwierzat - niedźwiedzie grizzly. 12
Dryf genetyczny Małe populacje - znaczne odchylenia. Ludność odizolowanej wioski w buszu, lub małej wyspy. Małe populacje zwierzat - niedźwiedzie grizzly. Powodem jest dryf genetyczny - losowa zmiana alleli. częstości 12
Model Wrighta - Fishera - postać klasyczna Populacja o stałej wielkości 2N. Rozłaczne pokolenia, dyskretny czas t = 0,1,... Dziecko" losuje rodzica" niezależnie od innych dzieci i jednostajnie; jest od rodzica nieodróżnialne. Dwa allele. 13
Model Wrighta - Fishera (c.d.) Stan populacji - ilość alleli typu A, X(t) {0,...,2N}. Jeśli X(t) = k to X(t + 1) jest zmienna losowa o rozkładzie dwumianowym z parametrem p = k 2N : ( 2N P{X(t + 1) = l X(t) = k} = l ) p l (1 p) 2N l. 14
Model Wrighta - Fishera (c.d.) Stan populacji - ilość alleli typu A, X(t) {0,...,2N}. Jeśli X(t) = k to X(t + 1) jest zmienna losowa o rozkładzie dwumianowym z parametrem p = k 2N : ( 2N P{X(t + 1) = l X(t) = k} = l ) p l (1 p) 2N l. X(t),t = 0, 1,... jest łańcuchem Markowa z prawdopodobieństwami przejścia p kl = P{X(t + 1) = l X(t) = k}. Stany X = 0 X = 2N sa stanami pochłaniajacymi. 14
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) EZ = np 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) E(X(t + 1) X(t)) = 2N X(t) 2N EZ = np X(t) Y (t) = nieujemny martyngał, 2N 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) E(X(t + 1) X(t)) = 2N X(t) 2N Y ( ) = lim t Y (t) EZ = np X(t) Y (t) = nieujemny martyngał, 2N istnieje (p.p.) 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) E(X(t + 1) X(t)) = 2N X(t) 2N Y ( ) = lim t Y (t) EZ = np X(t) Y (t) = nieujemny martyngał, 2N istnieje (p.p.) u k 1 + (1 u k ) 0 = EY ( ) = EY (0) = k 2N. 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = 2N p kl u l, l=0 u 0 = 0,u 2N = 1,k = 0,...,2N, 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = 2N l=0 p kl u l, u 0 = 0,u 2N = 1,k = 0,...,2N, 2N p kl l = E(X(t + 1) X(t) = k), l=0 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = k = 2N l=0 p kl u l, u 0 = 0,u 2N = 1,k = 0,...,2N, 2N p kl l = E(X(t + 1) X(t) = k), l=0 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = k = 2N l=0 p kl u l, u 0 = 0,u 2N = 1,k = 0,...,2N, 2N p kl l = E(X(t + 1) X(t) = k), l=0 (u 1,u 2,...,u 2N ) = c (1,2,...,2N), u 2N = 1 = c = 1 2N. 15
Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: Wartość oczekiwana czasu do utrwalenia się pojedynczego poczatkowo allela 2[log(2N 1) + γ]; γ stała Eulera. 15
Zróżnicowanie materiału genetycznego Heterozygotyczność - prawdopodobieństwo, że dwa losowo wybrane (ze zwracaniem) chromosomy sa różne: H(t + 1) = 1 2N 0 + (1 1 2N )H(t), 16
Zróżnicowanie materiału genetycznego Heterozygotyczność - prawdopodobieństwo, że dwa losowo wybrane (ze zwracaniem) chromosomy sa różne: H(t + 1) = 1 2N 0 + (1 1 2N Dryf eliminuje zróżnicowanie. )H(t), = H(t) = (1 1 2N )t H(0). 16
Zróżnicowanie materiału genetycznego Heterozygotyczność - prawdopodobieństwo, że dwa losowo wybrane (ze zwracaniem) chromosomy sa różne: H(t + 1) = 1 2N 0 + (1 1 2N Dryf eliminuje zróżnicowanie. Czy ciag geometryczny maleje szybko czy wolno? )H(t), = H(t) = (1 1 2N )t H(0). t 1/2 : H 1 2 H, t 1/2 2N ln2 populacja generacja t 1/2 milionowe miasto 20 lat 28 milionów lat 20 misiów 10 lat 280 lat 100 kart 1 minuta 2 godz. 20 minut 16
Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela.
Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela. H(t + 1) = ah(t) + b, a = (1 u) 2 (1 1 ),b = 2u u2 2N
Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela. H(t + 1) = ah(t) + b, a = (1 u) 2 (1 1 2N H(t) = a t H(0) + b 1 a [1 at ] ),b = 2u u2
Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela. H(t + 1) = ah(t) + b, a = (1 u) 2 (1 1 2N H(t) = a t H(0) + b 1 a [1 at ] H( ) = b 1 a = 4Nu 2Nu 2 4Nu 2Nu 2 + (1 u) 2 ),b = 2u u2 4Nu 4Nu + 1 (2N 10 4 ). 17
Równowaga między mutacja a dryfem H( ) = θ 1 + θ, θ = 4Nu. 18
Historia ukryta w genach - idea Populacja o stałej wielkości 2N Nieco inny model mutacji - stosowny dla mikrosatelitów Heterozygotyczność funkcja θ: 1 H = 1 1 + 2θ Wariancja funkcja θ: V = E(X i X j ) 2 = θ. Wskaźnik niestabilności β = 2V 1 (1 H) 2 1. 19
Podsumowanie informacji o dryfie Dryf zmiejsza różnorodność materiału genetycznego, przeciwdziała mutacji, która różnorodność wprowadza Dryf wprowadza swoista zależność zmiennych występujacych w genetyce, spowodowana tym, że sa one połaczone więzami rodzinnymi Moc dryfu jest odwrotnie proporcjonalna do wielkości populacji Z punktu widzenia zastosowań ważne badanie wzajemnego oddziaływania dryfu i mutacji Dryf i to wzajemne odziaływanie widoczne w rozkładach par 20