BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji 7. Sekwencjonowanie nowej generacji 8. Funkcjonalna adnotacja polimorfizmów 9. Funkcjonalna adnotacja polimorfizmów 10. Wybrane algorytmy 11. Wybrane algorytmy 12. Literatura 2017-2018 13. Literatura 2017-2018 14. Literatura 2017-2018 15. Literatura 2017-2018
WSTĘP 1. Analiza asocjacyjna Cechy ciągłe Cechy binarne 2. Inne metody Analiza sprzężeń Runs of homozygosity Signatures of selection
WSTĘP
ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA wartości cechy genotypy markerów
ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA gen genotypy markerów
ANALIZA ASOCJACYJNA - poszukiwanie genów poszukiwanie markera o najwyższej korelacji ze zmiennością cechy 1) 2) M1 M2 M3 M4 M5 M6... M7 0 cm 100 cm asocjacja? M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm asocjacja? lokalizacja: 1 Marker lokalizacja: 2 Marker 7) M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm asocjacja? lokalizacja: 7 marker
ANALIZA ASOCJACYJNA cechy ciągłe
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem przykładowy zbiór danych
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem model regresji y = Wb + Xg + e y fenotyp g efekt markera SNP b inne efekty np. wiek e błąd X macierz wystąpień dla g W macierz wystąpień dla b
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem estymacja efektów modelu y = Wb + Xg + e b g = W W X W W X X X 1 W y X y
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem y = Wb + Xg + e Stwórzmy macierze b g = W W X W W X X X 1 W y X y
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Niezależne od frekwencji alleli 11 0 12 1 22 2 Konstrukcja macierzy X Niezależne od frekwencji alleli 11 1 Kao and Zeng, 2002 12 0 22-1 Zależne od frekwencji alleli 11 2p 2 Cockerham, 1954 12 p 2 - p 1 22-2p 1
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Konstrukcja macierzy X
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem HIPOTEZY H 0 : brak asocjacji/ld marker - gen g = 0 H 1 : występuje asocjacja/ld marker gen g 0 MAKSYMALNY POZIOM BŁĘDU I-GO RODZAJU a MAX = 0.05 TEST F = N 1 gx y 1 Ny y y y gx y bw y ~ F 1,N 1 UZYSKANY POZIOM BŁĘDU I-GO RODZAJU a T decyzja nt hipotez
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Testowanie wszystkich markerów 1) y = Wb + Xg 1 + e test F a T 2) y = Wb + Xg 2 + e test F a T... 10) y = Wb + Xg 10 + e test F a T
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem F 1) y = Wb + Xg 1 + e F test a T 2) y = Wb + Xg 2 + e F test a T... 10) y = Wb + Xg 10 + e F test a T 20.0 15.0 10.0 5.0 0.0 1 2 3 4 5 6 7 8 9 10 marker
ANALIZA ASOCJACYJNA regresja z pojedynczym markerem -log10(a T ) 1) y = Wb + Xg 1 + e F test a T 2) y = Wb + Xg 2 + e F test a T... 10) y = Wb + Xg 10 + e F test a T 3.0 2.5 2.0 1.5 1.0 0.5 0.0 1 2 3 4 5 6 7 8 9 10 marker
GWAS Genomewide Association Study
ANALIZA ASOCJACYJNA skan genomu Genome Wide Association Study = SNP w całym genomie Copyright 2011, Joanna Szyda
skan genomu przykład z literatury Copyright 2011, Joanna Szyda
ANALIZA ASOCJACYJNA cechy binarne
TRANSMISSION DISEQUILIBRIUM TEST - sprzężenie + asocjacja 12 11 allel przekazany allel nieprzekazany 1 2 1 x x 1 x 2 rodzice + chore dziecko allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x
TRANSMISSION DISEQUILIBRIUM TEST allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x TDT 2 n n 2 12 21 ~ 1 12 n21 n brak założeń o modelu dziedziczenia cechy
TRANSMISSION DISEQUILIBRIUM TEST - przykład
TRANSMISSION DISEQUILIBRIUM TEST - przykład HIPOTEZY H 0 : n 12 =n 21 H 1 : n 12 n 21 allel przekazany allel nieprzekazany 1 2 1 x 46 2 79 x H 0 : brak sprzężenia i LD miedzy markerem, a genem H 1 : występuje sprzężenia i LD miedzy markerem, a genem MAKSYMALNY POZIOM BŁĘDU I-GO RODZAJU a MAX = 0.01 TEST TDT= 8.71 dla markera D6S2889 na chromosomie 6 UZYSKANY POZIOM BŁĘDU I-GO RODZAJU a T =0.0031 Segregacja genotypów markera D6S2889 jest skorelowana z objawami łysienia plackowatego Copyright 2017 Joanna Szyda
COCHRAN-ARMITAGE TEST Genotyp 11 12 22 chory N 11chore N 12chore N 22chore zdrowy N 11zdrowe N 12zdrowe N 22zdrowe brak założeń nt modelu dziedziczenia cechy
INNE METODY STATYSTYCZNEJ DETEKCJI GENÓW
ANALIZA SPRZĘŻEŃ y = + q i + e 1.17 2.01 1.56 1.93 1 1 1 1 0.95 0.35 0.84 1.00 prawdopodobieństwo, że dany osobnik odziedziczył określony genotyp QTL (QQ, Qq, qq) prawdopodobieństwo jest obliczone na podstawie genotypu markerów i informacji o spokrewnieniu prawdopodobieństwo jest funkcją częstości rekombinacji pomiędzy markerami
RUNS OF HOMOZYGOSITY 1. Runs of homozygosity identyfikacja regionów z homozygotycznymi markerami 2. ROH 3. Wskazują na regiony ważne z punktu widzenia selekcji Nature464, 587 591 doi:10.1038/nature08832
SIGNATURES OF SELECTION ҧ ҧ 1. Różnice we frekwencji alleli między populacjami 2. Wskazują na regiony ważne z punktu widzenia selekcji F ST = σk i=1 p i K 1 p 1 p pҧ 2 K p i pҧ liczba populacji frekwencja alleli w populacji i ogólna frekwencja alleli
1. Analiza asocjacyjna Cechy ciągłe Cechy binarne 2. Inne metody Analiza sprzężeń Runs of homozygosity Signatures of selection