1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji 7. Sekwencjonowanie nowej generacji 8. Funkcjonalna adnotacja polimorfizmów 9. Funkcjonalna adnotacja polimorfizmów 10. Wybrane algorytmy 11. Wybrane algorytmy 12. Literatura 2017-2018 13. Literatura 2017-2018 14. Literatura 2017-2018 15. Literatura 2017-2018

WSTĘP 1. Analiza asocjacyjna Cechy ciągłe Cechy binarne 2. Inne metody Analiza sprzężeń Runs of homozygosity Signatures of selection

WSTĘP

ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA wartości cechy genotypy markerów

ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA gen genotypy markerów

ANALIZA ASOCJACYJNA - poszukiwanie genów poszukiwanie markera o najwyższej korelacji ze zmiennością cechy 1) 2) M1 M2 M3 M4 M5 M6... M7 0 cm 100 cm asocjacja? M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm asocjacja? lokalizacja: 1 Marker lokalizacja: 2 Marker 7) M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm asocjacja? lokalizacja: 7 marker

ANALIZA ASOCJACYJNA cechy ciągłe

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem przykładowy zbiór danych

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem model regresji y = Wb + Xg + e y fenotyp g efekt markera SNP b inne efekty np. wiek e błąd X macierz wystąpień dla g W macierz wystąpień dla b

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem estymacja efektów modelu y = Wb + Xg + e b g = W W X W W X X X 1 W y X y

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem y = Wb + Xg + e Stwórzmy macierze b g = W W X W W X X X 1 W y X y

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Niezależne od frekwencji alleli 11 0 12 1 22 2 Konstrukcja macierzy X Niezależne od frekwencji alleli 11 1 Kao and Zeng, 2002 12 0 22-1 Zależne od frekwencji alleli 11 2p 2 Cockerham, 1954 12 p 2 - p 1 22-2p 1

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Konstrukcja macierzy X

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem HIPOTEZY H 0 : brak asocjacji/ld marker - gen g = 0 H 1 : występuje asocjacja/ld marker gen g 0 MAKSYMALNY POZIOM BŁĘDU I-GO RODZAJU a MAX = 0.05 TEST F = N 1 gx y 1 Ny y y y gx y bw y ~ F 1,N 1 UZYSKANY POZIOM BŁĘDU I-GO RODZAJU a T decyzja nt hipotez

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Testowanie wszystkich markerów 1) y = Wb + Xg 1 + e test F a T 2) y = Wb + Xg 2 + e test F a T... 10) y = Wb + Xg 10 + e test F a T

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem F 1) y = Wb + Xg 1 + e F test a T 2) y = Wb + Xg 2 + e F test a T... 10) y = Wb + Xg 10 + e F test a T 20.0 15.0 10.0 5.0 0.0 1 2 3 4 5 6 7 8 9 10 marker

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem -log10(a T ) 1) y = Wb + Xg 1 + e F test a T 2) y = Wb + Xg 2 + e F test a T... 10) y = Wb + Xg 10 + e F test a T 3.0 2.5 2.0 1.5 1.0 0.5 0.0 1 2 3 4 5 6 7 8 9 10 marker

GWAS Genomewide Association Study

ANALIZA ASOCJACYJNA cechy binarne

TRANSMISSION DISEQUILIBRIUM TEST - sprzężenie + asocjacja 12 11 allel przekazany allel nieprzekazany 1 2 1 x x 1 x 2 rodzice + chore dziecko allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x

TRANSMISSION DISEQUILIBRIUM TEST allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x TDT 2 n n 2 12 21 ~ 1 12 n21 n brak założeń o modelu dziedziczenia cechy

TRANSMISSION DISEQUILIBRIUM TEST - przykład

TRANSMISSION DISEQUILIBRIUM TEST - przykład HIPOTEZY H 0 : n 12 =n 21 H 1 : n 12 n 21 allel przekazany allel nieprzekazany 1 2 1 x 46 2 79 x H 0 : brak sprzężenia i LD miedzy markerem, a genem H 1 : występuje sprzężenia i LD miedzy markerem, a genem MAKSYMALNY POZIOM BŁĘDU I-GO RODZAJU a MAX = 0.01 TEST TDT= 8.71 dla markera D6S2889 na chromosomie 6 UZYSKANY POZIOM BŁĘDU I-GO RODZAJU a T =0.0031 Segregacja genotypów markera D6S2889 jest skorelowana z objawami łysienia plackowatego Copyright 2017 Joanna Szyda

COCHRAN-ARMITAGE TEST Genotyp 11 12 22 chory N 11chore N 12chore N 22chore zdrowy N 11zdrowe N 12zdrowe N 22zdrowe brak założeń nt modelu dziedziczenia cechy

INNE METODY STATYSTYCZNEJ DETEKCJI GENÓW

ANALIZA SPRZĘŻEŃ y = + q i + e 1.17 2.01 1.56 1.93 1 1 1 1 0.95 0.35 0.84 1.00 prawdopodobieństwo, że dany osobnik odziedziczył określony genotyp QTL (QQ, Qq, qq) prawdopodobieństwo jest obliczone na podstawie genotypu markerów i informacji o spokrewnieniu prawdopodobieństwo jest funkcją częstości rekombinacji pomiędzy markerami

RUNS OF HOMOZYGOSITY 1. Runs of homozygosity identyfikacja regionów z homozygotycznymi markerami 2. ROH 3. Wskazują na regiony ważne z punktu widzenia selekcji Nature464, 587 591 doi:10.1038/nature08832

SIGNATURES OF SELECTION ҧ ҧ 1. Różnice we frekwencji alleli między populacjami 2. Wskazują na regiony ważne z punktu widzenia selekcji F ST = σk i=1 p i K 1 p 1 p pҧ 2 K p i pҧ liczba populacji frekwencja alleli w populacji i ogólna frekwencja alleli

1. Analiza asocjacyjna Cechy ciągłe Cechy binarne 2. Inne metody Analiza sprzężeń Runs of homozygosity Signatures of selection