Anna Szewczyk Wydział Geodezji Górniczej i InŜynierii środowiska AGH
Zastosowania biblioteki Genetics programu R
The genetics Package Tytuł: Populacja genetyczna Wersja:1.2.0 Data utworzenia: 2005-11-09 Autorzy: Gregory Warnes i Friedrich Leisch
Do zainstalowania biblioteki potrzeba dodatkowych bibliotek od których jest zaleŝna: combinat gdata ( gtools) MASS mvtnorm
Funcje dostępne w bibliotece Genetics: HWE.chisq gregorius HWE.exact homozygote HWE.test locus LD makegenotypes binsearch plot.genotype ci.balance power.casectrl diseq Print.LD expectedgenotypes Summary.genotype genotype Write.pop.file
Zakres prezentacji: HWE.chisq gregorius HWE.exact homozygote HWE.test locus LD makegenotypes binsearch plot.genotype ci.balance power.casectrl diseq Print.LD expectedgenotypes Summary.genotype genotype Write.pop.file
Testy statystyczne w bibliotece Genetics sprawdzające czy rozkład alleli jest zgodny z prawem Hardy Weinberga (HWE) HWE.chisq test na równowagę Hardy Weinberg a metodą chi 2 HWE.exact test dokładności dla markerów dwuallelicznych. Jest stosowany do sprawdzenia, czy dane pasują do równowagi Hardy-Weinberga, kiedy w populacji niektóre allele i genotypy są rzadkie. WaŜnym zastosowaniem tego testu jest szacowanie stopnia wsobności i sprzęŝenia w populacjach ludzkich, dla sprawdzenia załoŝeń o częstości genotypów w dochodzeniach sądowych. HWE.test oszacowanie parametru równowagowego (współczynnika korelacji)
Prawo Hardy - Weinberga ZałoŜenia Hardy Weinberga: Organizmy są diploidalne RozmnaŜają się płciowo Pokolenia nie zachodzą na siebie Osobniki kojarzą się losowo (populacja jest panmiktyczna) Populacja jest bardzo duŝa (nieskończenie wielka) Nie ma migracji Nie ma mutacji Dobór naturalny nie wpływa na badany locus JeŜeli spełnione są powyŝsze załoŝenia to proporcje dla locus o dwóch allelach A i a, których frekwencje wynoszą odpowiednio p i q będą odpowiadały rozwinięciu dwumiany (gdy są dwa allele, trójmianu, gdy są trzy allele itd..): faa = p 2, faa = 2pq, faa = q 2
Inaczej mówiąc równowaga Hardy ego Weinberga oznacza, Ŝe proporcja alleli w kolejnych pokoleniach w stanie równowagi genetycznej jest taka sama (czyli to czego moŝna się spodziewać gdy populacja nie będzie ulegała ewolucji)
Przykładowe genotypy Kolor oczu Kolor włosów Kolor skóry A/a B/b C/c a/a B/b C/c a/a B/B C/C a/a B/b C/c A/a B/b C/C a/a B/b C/c a/a B/b C/c A/a B/b C/c a/a B/b C/c a/a B/B C/C A/a B/b C/c A/A B/B c/c a/a B/b C/c A/a B/b c/c A/a B/b C/c a/a B/B C/C a/a B/b C/c A/a B/b C/c A/a B/b C/c a/a b/b c/c p 2 2pq q 2
Przykład na HWE.chisq p-value - graniczny poziom istotności; jest to poziom prawdopodobieństwa a odpowiadający takiej wartości t a, która jest równa zrealizowanej wartości t i. Dla dowolnego wyŝszego poziomu istotności t a się zmniejszy, czyli zajdzie t i >t a, dla dowolnego niŝszego poziomu t a się zwiększy, czyli zajdzie t i <t a. Wartość p-value sumaryzuje wszystkie wyniki testu tej samej pary hipotez na dowolnym poziomie istotności. JeŜeli p-value badanej hipotezy wynosi 0,1 lub więcej, to świadczy to raczej przeciwko hipotezie alternatywnej; p-value około 0,01 lub mniejsze świadczy raczej za hipotezą alternatywną i przeciw hipotezie zerowej.
Przykład na HWE.exact c/c=3 Ilość allelu C = 21 C/c=13 Ilość allelu c = 19 C/C=4 Test dokładności jest stosowany do sprawdzenia, czy dane pasują do równowagi Hardy-Weinberga, kiedy w populacji niektóre allele i genotypy są rzadkie. WaŜnym zastosowaniem tego testu jest szacowanie stopnia wsobności i sprzęŝenia w populacjach ludzkich, dla sprawdzenia załoŝeń o częstości genotypów w dochodzeniach sądowych. p-value = 0.3672 Nie ma podstaw do odrzucenia H 0
Przykład na HWE.test D bezwzględna róŝnica we frekwencji pomiędzy obserwowaną ilością par alleli a ilością oczekiwaną D D względne (skalowane) w przedziale [-1,1] r współczynnik korelacji dla kaŝdej pary alleli
Przykład na HWE.test c.d. CI (confidence interval, przedział ufności): Określa stopień precyzji danego oznaczenia. Zwykle podaje się 95% CI, czyli przedział wartości, w którym z 95% pewnością znajduje się prawdziwa wartość danego parametru w badanej populacji. Jeśli w tym przedziale zawarte jest 0 dla róŝnicy ryzyka lub 1 dla ryzyka względnego albo ilorazu szans, to jest to równoznaczne z brakiem istotności statystycznej danego wyniku (p >0,05). Współczynnik determinajcji definiuje jaki proceny obserwacji jest tłumaczony przez model regresji
Inne testy statystyczne LD test na nierównowagę sprzęŝeń (sprawdza, czy allele w analizowanych loci są dziedziczone razem, czy są ze sobą powiązane) Zdarza się wtedy, kiedy poszczególne allele w dwóch związanych loci występują w tym samym haplotypie, częściej niŝ moŝna byłoby oczekiwać biorąc pod uwagę równowagę Hardy Weinberga (HWE) Uwaga: JeŜeli dane(data frame) zawierają obiekty niegenetyczne lub genotypy z liczbą alleli róŝną od 2, dane te zostaną pominięte)
Nierównowaga sprzęŝeń wyraŝona jest w postaci współczynników liczonych dla kaŝdej pary alleli: 1. D bezwzględna róŝnica we frekwencji pomiędzy obserwowaną ilością par AB a ilością oczekiwaną (proporcjonalna róŝnica D): D=p AB - p A p B 2. D D odniesione (skalowane) o zasięgu: [-1,1],gdzie D =D/D max Dla D>0: D max =min(p A p b, p a p B ) Dla D<0 D max =max p A p B,-p a p b
3. r - współczynnik korelacji pomiędzy markerami r = ( p p p p ) A a D B b gdzie: p A - obserwowane prawdopodobieństwo wystąpienia allela A dla markera 1 P a =1- p A - obserwowane prawdopodobieństwo wystąpienia allela a dla markera 1 p B - obserwowane prawdopodobieństwo wystąpienia allela B dla markera 2 P b =1- p B - obserwowane prawdopodobieństwo wystąpienia allela b dla markera 2
Przykład zastosowania LD Badanie nierównowagi sprzęŝeń, sprawdzające czy dane allele są ze sobą powiązane Przykład rozpatrywany dla trzech genotypów: ZaleŜności pomiędzy poszczególnymi genotypami scharakteryzowane za pomocą wskaźników: D D r Chi 2 p-value
Graficzne przedstawienie LD
Graficzne przedstawienie LD
Graficzne przedstawienie LD
Graficzne przedstawienie LD Im więcej markerów, tym ciekawsze wyniki
Graficzne przedstawienie LD