Dryf genetyczny i jego wpływ na rozkłady próbek z populacji - modele matematyczne. Adam Bobrowski, IM PAN Katowice



Podobne dokumenty
ZARZĄDZANIE POPULACJAMI ZWIERZĄT

Bliskie Spotkanie z Biologią. Genetyka populacji

ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI. Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt

GENETYKA POPULACJI. Ćwiczenia 1 Biologia I MGR /

Ekologia molekularna. wykład 3

1 Podstawowe pojęcia z zakresu genetyki. 2 Podstawowy model dziedziczenia

Genetyka Populacji

WSTĘP. Copyright 2011, Joanna Szyda

ZARZĄDZANIE POPULACJAMI ZWIERZĄT DRYF GENETYCZNY EFEKTYWNA WIELKOŚĆ POPULACJI PRZYROST INBREDU

Wprowadzenie do genetyki medycznej i sądowej

GENETYKA POPULACJI. Ćwiczenia 3 Biologia I MGR

Podstawy genetyki populacji. Genetyka mendlowska i ewolucja. Dobór i dryf.

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

GENETYKA POPULACJI. Ćwiczenia 4 Biologia I MGR

GENETYKA POPULACJI. Fot. W. Wołkow

Podstawy genetyki populacji. Populacje o skończonej liczebności. Dryf. Modele wielogenowe.

1 Genetykapopulacyjna

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia niestacjonarne

PORÓWNYWANIE POPULACJI POD WZGLĘDEM STRUKTURY

Podstawy genetyki populacji. Genetyka mendlowska i ewolucja. Dobór i dryf.

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Algorytmy ewolucyjne - algorytmy genetyczne. I. Karcz-Dulęba

Strategie ewolucyjne (ang. evolu4on strategies)

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Ekologia molekularna. wykład 6

Genetyka populacyjna. Populacja

EGZAMIN DYPLOMOWY, część II, Biomatematyka

Modelowanie ewolucji. Dobór i dryf genetyczny

Spokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia

GENETYCZNE PODSTAWY ZMIENNOŚCI ORGANIZMÓW ZASADY DZIEDZICZENIA CECH PODSTAWY GENETYKI POPULACYJNEJ

Księgarnia PWN: Joanna R. Freeland - Ekologia molekularna

Anna Szewczyk. Wydział Geodezji Górniczej i InŜynierii środowiska AGH

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Statystyka matematyczna dla leśników

Genetyka populacji. Efektywna wielkość populacji

Algorytmy genetyczne w optymalizacji

Genetyka ekologiczna i populacyjna W8

Testowanie hipotez statystycznych.

Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009

Tematy prac magisterskich i doktorskich

Zmienna losowa. Rozkład skokowy

Ekologia ogólna. wykład 4. Metody molekularne Genetyka populacji

Statystyka i eksploracja danych

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia stacjonarne i niestacjonarne

Podstawy genetyki populacji. Genetyka mendlowska i ewolucja

Podstawy genetyki populacji. Genetyka mendlowska i ewolucja

Zadanie 1. są niezależne i mają rozkład z atomami: ( ),

Zarządzanie populacjami zwierząt. Efektywna wielkość populacji Wykład 3

EGZAMIN MAGISTERSKI, Biomatematyka

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Podstawy teorii ewolucji. Informacja i ewolucja

Podstawy teorii ewolucji. Informacja i ewolucja

2. CZYNNIKI ZABURZAJĄCE RÓWNOWAGĘ GENETYCZNĄ

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

6. Klasyczny algorytm genetyczny. 1

EGZAMIN MAGISTERSKI, 18 września 2013 Biomatematyka

ALGORYTMY GENETYCZNE ćwiczenia

EGZAMIN DYPLOMOWY, część II, Biomatematyka

Matematyka ubezpieczeń majątkowych r.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Polimorfizm genu mitochondrialnej polimerazy gamma (pol γ) w populacjach ludzkich Europy

Selekcja, dobór hodowlany. ESPZiWP

Wprowadzenie do genetyki sądowej. Materiały biologiczne. Materiały biologiczne: prawidłowe zabezpieczanie śladów

Wybrane rozkłady zmiennych losowych. Statystyka

Ekologia molekularna. wykład 4

Genetyka populacyjna. Populacja

Funkcja tworząca Funkcja charakterystyczna. Definicja i własności Funkcja tworząca momenty

Algorytm genetyczny (genetic algorithm)-

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Elementy teorii informacji w ewolucji

Dobór naturalny. Ewolucjonizm i eugenika

Generowanie i optymalizacja harmonogramu za pomoca

STATYSTYKA MATEMATYCZNA

Podstawy genetyki populacji. Genetyka mendlowska i ewolucja

Matematyka dla biologów Zajęcia nr 12.

Wybrane rozkłady zmiennych losowych. Statystyka

Biologia medyczna, lekarski Ćwiczenie ; Ćwiczenie 19

Mapowanie genów cz owieka. podstawy

Metody Rozmyte i Algorytmy Ewolucyjne

1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

Biologia molekularna z genetyką

GRA Przykład. 1) Zbiór graczy. 2) Zbiór strategii. 3) Wypłaty. n = 2 myśliwych. I= {1,,n} S = {polować na jelenia, gonić zająca} S = {1,,m} 10 utils

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Rachunek Prawdopodobieństwa Anna Janicka

Dyskretne zmienne losowe


Zmienność. środa, 23 listopada 11

Adam Łomnicki. Tom Numer 3 4 ( ) Strony Zakład Badania Ssaków PAN Białowieża adam.lomnicki@uj.edu.

BioTe21, Pracownia Kryminalistyki i Badań Ojcostwa.

Biologia medyczna, materiały dla studentów

PLAN WYKŁADU OPTYMALIZACJA GLOBALNA OPERATOR KRZYŻOWANIA ETAPY KRZYŻOWANIA

Zmienne losowe ciągłe i ich rozkłady

MODELOWANIE STOCHASTYCZNE CZĘŚĆ I - PODSTAWY. Biomatematyka Dr Wioleta Drobik-Czwarno

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Prawdopodobieństwo i statystyka

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Transkrypt:

Dryf genetyczny i jego wpływ na rozkłady próbek z populacji - modele matematyczne Adam Bobrowski, IM PAN Katowice 1

Tematyka cyklu referatów Dryf genetyczny Matematyczne modele równowagi między mutacja a dryfem. 2

Główne zagadnienia na dziś Genetyka populacyjna i jej zastosowania. Dryf genetyczny. Koalescencja Kingmana. 3

Genetyka populacyjna Nauka o procesach zachodza- cych w materiale genetycznym zbiorowisk, populacji organizmów. Konglomerat dyscyplin naukowych: genetyka, biochemia, bioinformatyka, matematyka. statystyka, Dogmat: materiał genetyczny = chromosom. Główne siły: MUTACJA, SE- LEKCJA, REKOMBINACJA I DRYF GENETYCZNY. 4

Lokus Lokus - miejsce na chromosomie. Allel - jeden z możliwych stanów lokusa. Nie mylić z genem. 5

Zastosowania genetyki

Zastosowania genetyki Medycyna

Zastosowania genetyki Medycyna Sadownictwo

Zastosowania genetyki Medycyna Sadownictwo Archeologia!

Zastosowania genetyki Medycyna Sadownictwo Archeologia! Ślady przeszłych zmian wielkości populacji w materiale genetycznym Historia zapisana w genach. 6

Jak to możliwe? - Dryf genetyczny MUTACJA - losowa zmiana stanu lokusa SELEKCJA - usuwanie wadliwych" kopii REKOMBINACJA - mieszanie materiału genetycznego z różnych lokusów DRYF GENETYCZNY - losowa zmiana częstości alleli 7

Prawo Hardy ego - Weinberga Nieskończenie wielka" populacja. Na lokusie dwa możliwe allele - A i a. Osobnik = gameta = para chromosomów = para alleli AA,aa,Aa. Gamety łacz a się losowo. 8

Prawo Hardy ego - Weinberga Nieskończenie wielka" populacja. Na lokusie dwa możliwe allele - A i a. Osobnik = gameta = para chromosomów = para alleli AA,aa,Aa. Gamety łacz a się losowo. AA x, Aa 2y, aa z, (x + 2y + z = 1). Częstość połaczeń gamet AA Aa aa AA x 2 2xy xz Aa 2xy 4y 2 2yz aa xz 2yz z 2 8

Prawo Hardy ego - Weinberga Nieskończenie wielka" populacja. Na lokusie dwa możliwe allele - A i a. Osobnik = gameta = para chromosomów = para alleli AA,aa,Aa. Gamety łacz a się losowo. AA x, Aa 2y, aa z, (x + 2y + z = 1). AA + AA AA, Częstość połaczeń gamet Gamety potomne AA Aa aa AA x 2 2xy xz Aa 2xy 4y 2 2yz aa xz 2yz z 2 AA + Aa AA(Pr = 1 2 ) lub Aa(Pr = 1 2 ), Aa + Aa AA(Pr = 1 4 ) lub Aa(Pr = 1 2 ) lub aa(pr = 1 4 ), AA + aa Aa pozostałe przypadki przez symetrię 8

Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 AA x, Aa 2y, aa z, (x + 2y + z = 1). AA + AA AA, Częstość połaczeń gamet Gamety potomne AA Aa aa AA x 2 2xy xz Aa 2xy 4y 2 2yz aa xz 2yz z 2 AA + Aa AA(Pr = 1 2 ) lub Aa(Pr = 1 2 ), Aa + Aa AA(Pr = 1 4 ) lub Aa(Pr = 1 2 ) lub aa(pr = 1 4 ), AA + aa Aa pozostałe przypadki przez symetrię 9

Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10

Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 = 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10

Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 = (x+y) 2 = x. 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10

Prawo Hardy ego - Weinberga Częstotliwości gamet potomków x = x 2 + 1 2 (4xy) + 1 4 4y2 = (x + y) 2 W drugim pokoleniu: x = (x +y ) 2 = (x+y) 2 = x. Podobnie y = y i z = z. 2y = 1 2 (4xy) + 1 2 (4y2 ) + 2xz + 1 4 (4xz) = 2(x + y)(y + z) z = 1 4 (4y2 ) + 1 (4yz) + z2 4 = (y + z) 2 10

Prawo Hardy ego - Weinberga W nieskończenie wielkich" populacjach częstotliwość gamet znajduje się w stanie równowagi Hardy ego - Weinberga i jest następujaca AA p 2 Aa 2p(1 p) aa (1 p) 2 gdzie p(= x + y) jest częstotliwościa występowania allela A. 11

Prawo Hardy ego - Weinberga W nieskończenie wielkich" populacjach częstotliwość gamet znajduje się w stanie równowagi Hardy ego - Weinberga i jest następujaca AA p 2 Aa 2p(1 p) aa (1 p) 2 gdzie p(= x + y) jest częstotliwościa występowania allela A. Testy statystyczne na to czy populacja jest w równowadze H-W. 11

Małe populacje - znaczne odchylenia. 12

Małe populacje - znaczne odchylenia. Ludność odizolowanej wioski w buszu, lub małej wyspy. 12

Małe populacje - znaczne odchylenia. Ludność odizolowanej wioski w buszu, lub małej wyspy. Małe populacje zwierzat - niedźwiedzie grizzly. 12

Dryf genetyczny Małe populacje - znaczne odchylenia. Ludność odizolowanej wioski w buszu, lub małej wyspy. Małe populacje zwierzat - niedźwiedzie grizzly. Powodem jest dryf genetyczny - losowa zmiana alleli. częstości 12

Model Wrighta - Fishera - postać klasyczna Populacja o stałej wielkości 2N. Rozłaczne pokolenia, dyskretny czas t = 0,1,... Dziecko" losuje rodzica" niezależnie od innych dzieci i jednostajnie; jest od rodzica nieodróżnialne. Dwa allele. 13

Model Wrighta - Fishera (c.d.) Stan populacji - ilość alleli typu A, X(t) {0,...,2N}. Jeśli X(t) = k to X(t + 1) jest zmienna losowa o rozkładzie dwumianowym z parametrem p = k 2N : ( 2N P{X(t + 1) = l X(t) = k} = l ) p l (1 p) 2N l. 14

Model Wrighta - Fishera (c.d.) Stan populacji - ilość alleli typu A, X(t) {0,...,2N}. Jeśli X(t) = k to X(t + 1) jest zmienna losowa o rozkładzie dwumianowym z parametrem p = k 2N : ( 2N P{X(t + 1) = l X(t) = k} = l ) p l (1 p) 2N l. X(t),t = 0, 1,... jest łańcuchem Markowa z prawdopodobieństwami przejścia p kl = P{X(t + 1) = l X(t) = k}. Stany X = 0 X = 2N sa stanami pochłaniajacymi. 14

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) EZ = np 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) E(X(t + 1) X(t)) = 2N X(t) 2N EZ = np X(t) Y (t) = nieujemny martyngał, 2N 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) E(X(t + 1) X(t)) = 2N X(t) 2N Y ( ) = lim t Y (t) EZ = np X(t) Y (t) = nieujemny martyngał, 2N istnieje (p.p.) 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Z Bin(n, p) E(X(t + 1) X(t)) = 2N X(t) 2N Y ( ) = lim t Y (t) EZ = np X(t) Y (t) = nieujemny martyngał, 2N istnieje (p.p.) u k 1 + (1 u k ) 0 = EY ( ) = EY (0) = k 2N. 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = 2N p kl u l, l=0 u 0 = 0,u 2N = 1,k = 0,...,2N, 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = 2N l=0 p kl u l, u 0 = 0,u 2N = 1,k = 0,...,2N, 2N p kl l = E(X(t + 1) X(t) = k), l=0 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = k = 2N l=0 p kl u l, u 0 = 0,u 2N = 1,k = 0,...,2N, 2N p kl l = E(X(t + 1) X(t) = k), l=0 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: u k = k = 2N l=0 p kl u l, u 0 = 0,u 2N = 1,k = 0,...,2N, 2N p kl l = E(X(t + 1) X(t) = k), l=0 (u 1,u 2,...,u 2N ) = c (1,2,...,2N), u 2N = 1 = c = 1 2N. 15

Utrwalanie się allela u k := P{allel A utrwali się w populacji X(0) = k} = k 2N. Trzy dowody: Dowód genetyczny. Dowód martyngałowy: Dowód oparty na łańcuchach Markowa: Wartość oczekiwana czasu do utrwalenia się pojedynczego poczatkowo allela 2[log(2N 1) + γ]; γ stała Eulera. 15

Zróżnicowanie materiału genetycznego Heterozygotyczność - prawdopodobieństwo, że dwa losowo wybrane (ze zwracaniem) chromosomy sa różne: H(t + 1) = 1 2N 0 + (1 1 2N )H(t), 16

Zróżnicowanie materiału genetycznego Heterozygotyczność - prawdopodobieństwo, że dwa losowo wybrane (ze zwracaniem) chromosomy sa różne: H(t + 1) = 1 2N 0 + (1 1 2N Dryf eliminuje zróżnicowanie. )H(t), = H(t) = (1 1 2N )t H(0). 16

Zróżnicowanie materiału genetycznego Heterozygotyczność - prawdopodobieństwo, że dwa losowo wybrane (ze zwracaniem) chromosomy sa różne: H(t + 1) = 1 2N 0 + (1 1 2N Dryf eliminuje zróżnicowanie. Czy ciag geometryczny maleje szybko czy wolno? )H(t), = H(t) = (1 1 2N )t H(0). t 1/2 : H 1 2 H, t 1/2 2N ln2 populacja generacja t 1/2 milionowe miasto 20 lat 28 milionów lat 20 misiów 10 lat 280 lat 100 kart 1 minuta 2 godz. 20 minut 16

Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela.

Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela. H(t + 1) = ah(t) + b, a = (1 u) 2 (1 1 ),b = 2u u2 2N

Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela. H(t + 1) = ah(t) + b, a = (1 u) 2 (1 1 2N H(t) = a t H(0) + b 1 a [1 at ] ),b = 2u u2

Zróżnicowanie materiału genetycznego - model z mutacja u - prawdopodobieństwo mutacji, jednakowe dla każdego osobnika ( 10 10 10 5. mutacje u różnych osobników niezależne. każda mutacja prowadzi do nowego allela. H(t + 1) = ah(t) + b, a = (1 u) 2 (1 1 2N H(t) = a t H(0) + b 1 a [1 at ] H( ) = b 1 a = 4Nu 2Nu 2 4Nu 2Nu 2 + (1 u) 2 ),b = 2u u2 4Nu 4Nu + 1 (2N 10 4 ). 17

Równowaga między mutacja a dryfem H( ) = θ 1 + θ, θ = 4Nu. 18

Historia ukryta w genach - idea Populacja o stałej wielkości 2N Nieco inny model mutacji - stosowny dla mikrosatelitów Heterozygotyczność funkcja θ: 1 H = 1 1 + 2θ Wariancja funkcja θ: V = E(X i X j ) 2 = θ. Wskaźnik niestabilności β = 2V 1 (1 H) 2 1. 19

Podsumowanie informacji o dryfie Dryf zmiejsza różnorodność materiału genetycznego, przeciwdziała mutacji, która różnorodność wprowadza Dryf wprowadza swoista zależność zmiennych występujacych w genetyce, spowodowana tym, że sa one połaczone więzami rodzinnymi Moc dryfu jest odwrotnie proporcjonalna do wielkości populacji Z punktu widzenia zastosowań ważne badanie wzajemnego oddziaływania dryfu i mutacji Dryf i to wzajemne odziaływanie widoczne w rozkładach par 20