1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

Podobne dokumenty
BIOINFORMATYKA 8. Analiza asocjacyjna - teoria

WSTĘP. Copyright 2011, Joanna Szyda

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Oprogramowanie dla GWAS

Badania asocjacyjne w skali genomu (GWAS)

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

Postępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

METODY STATYSTYCZNE W BIOLOGII

Badania asocjacyjne w skali genomu (GWAS)

STATYSTYKA MATEMATYCZNA

Podstawy genetyki człowieka. Cechy wieloczynnikowe

Analiza sprzężeń u człowieka. Podstawy

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Mapowanie genów cz owieka. podstawy

ZARZĄDZANIE POPULACJAMI ZWIERZĄT

STATYSTYKA MATEMATYCZNA

WSTĘP Oprogramowanie dla GWAS

Analiza sprzężeń u człowieka. Podstawy

Analiza sprzężeń u człowieka. Podstawy

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII

Analiza sprzężeń u człowieka. Podstawy

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA MATEMATYCZNA

Mapowanie genów cz owieka i badania asocjacji. podstawy

STATYSTYKA MATEMATYCZNA

Ekologia molekularna. wykład 14. Genetyka ilościowa

STATYSTYKA MATEMATYCZNA WYKŁAD 1

Algorytmy ewolucyjne - algorytmy genetyczne. I. Karcz-Dulęba

Ekologia molekularna. wykład 3

Opis wykonanych badań naukowych oraz uzyskanych wyników

STATYSTYKA MATEMATYCZNA

Składniki jądrowego genomu człowieka

Zmienność populacji człowieka. Polimorfizmy i asocjacje

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

PRZYGODY DGV. historia programu selekcji genomowej w Polsce. Joanna Szyda, Andrzej Żarnecki

STATYSTYKA MATEMATYCZNA

ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI. Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt

Człowiek mendlowski? Genetyka człowieka w XX i XXI w.

Wprowadzenie do genetyki medycznej i sądowej

Ekologia molekularna. wykład 10

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

GENETYKA POPULACJI. Ćwiczenia 1 Biologia I MGR /

STATYSTYKA MATEMATYCZNA

Genetyka Populacji

1. KEGG 2. GO. 3. Klastry

Genetyka człowieka II. Cechy wieloczynnikowe, polimorfizmy i asocjacje

Zmienność populacji cz owieka. Polimorfizmy i asocjacje

Mapowanie genów człowieka i badania asocjacji. podstawy

Zadania do cz. II (z frekwencji i prawa Hardy ego-weinberga)

Spokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia

Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych

Dziedziczenie poligenowe

Wykład 14 Test chi-kwadrat zgodności

Genetyka człowieka II. Cechy wieloczynnikowe, polimorfizmy i asocjacje

Pytania i odpowiedzi

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

STATYSTYKA MATEMATYCZNA

Zarządzanie populacjami zwierząt. Parametry genetyczne cech

Modelowanie danych hodowlanych

Zmodyfikowane wg Kadowaki T in.: J Clin Invest. 2006;116(7):

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA WYKŁAD 5 TEST T

GENETYKA POPULACJI. Ćwiczenia 4 Biologia I MGR

BioTe21, Pracownia Kryminalistyki i Badań Ojcostwa.

Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni

Pytania i odpowiedzi

Biologia medyczna, lekarski Ćwiczenie ; Ćwiczenie 19

Genetyka człowieka II. Zaburzenia chromosomowe, cechy wieloczynnikowe, polimorfizmy i asocjacje

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Dryf genetyczny i jego wpływ na rozkłady próbek z populacji - modele matematyczne. Adam Bobrowski, IM PAN Katowice

Algorytmy genetyczne

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Anna Szewczyk. Wydział Geodezji Górniczej i InŜynierii środowiska AGH

STATYSTYKA MATEMATYCZNA

Tomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia niestacjonarne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Zmienność genetyczna człowieka

Modelowanie danych hodowlanych

2. CZYNNIKI ZABURZAJĄCE RÓWNOWAGĘ GENETYCZNĄ

Testowanie hipotez statystycznych.

EGZAMIN DYPLOMOWY, część II, Biomatematyka

Zastosowanie nowych technologii genotypowania w nowoczesnej hodowli i bankach genów

PRACE NAUKOWE Akademii im. Jana Długosza w Częstochowie Informatyka, Inżynieria Bezpieczeństwa

Ekologia ogólna. wykład 4. Metody molekularne Genetyka populacji

Bliskie Spotkanie z Biologią. Genetyka populacji

Biologia medyczna, materiały dla studentów

Ćwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

Transkrypt:

BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji 7. Sekwencjonowanie nowej generacji 8. Funkcjonalna adnotacja polimorfizmów 9. Funkcjonalna adnotacja polimorfizmów 10. Wybrane algorytmy 11. Wybrane algorytmy 12. Literatura 2017-2018 13. Literatura 2017-2018 14. Literatura 2017-2018 15. Literatura 2017-2018

WSTĘP 1. Analiza asocjacyjna Cechy ciągłe Cechy binarne 2. Inne metody Analiza sprzężeń Runs of homozygosity Signatures of selection

WSTĘP

ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA wartości cechy genotypy markerów

ANALIZA ASOCJACYJNA - źródła informacji ANALIZA ASOCJACYJNA gen genotypy markerów

ANALIZA ASOCJACYJNA - poszukiwanie genów poszukiwanie markera o najwyższej korelacji ze zmiennością cechy 1) 2) M1 M2 M3 M4 M5 M6... M7 0 cm 100 cm asocjacja? M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm asocjacja? lokalizacja: 1 Marker lokalizacja: 2 Marker 7) M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm asocjacja? lokalizacja: 7 marker

ANALIZA ASOCJACYJNA cechy ciągłe

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem przykładowy zbiór danych

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem model regresji y = Wb + Xg + e y fenotyp g efekt markera SNP b inne efekty np. wiek e błąd X macierz wystąpień dla g W macierz wystąpień dla b

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem estymacja efektów modelu y = Wb + Xg + e b g = W W X W W X X X 1 W y X y

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem y = Wb + Xg + e Stwórzmy macierze b g = W W X W W X X X 1 W y X y

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Niezależne od frekwencji alleli 11 0 12 1 22 2 Konstrukcja macierzy X Niezależne od frekwencji alleli 11 1 Kao and Zeng, 2002 12 0 22-1 Zależne od frekwencji alleli 11 2p 2 Cockerham, 1954 12 p 2 - p 1 22-2p 1

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Konstrukcja macierzy X

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem HIPOTEZY H 0 : brak asocjacji/ld marker - gen g = 0 H 1 : występuje asocjacja/ld marker gen g 0 MAKSYMALNY POZIOM BŁĘDU I-GO RODZAJU a MAX = 0.05 TEST F = N 1 gx y 1 Ny y y y gx y bw y ~ F 1,N 1 UZYSKANY POZIOM BŁĘDU I-GO RODZAJU a T decyzja nt hipotez

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem Testowanie wszystkich markerów 1) y = Wb + Xg 1 + e test F a T 2) y = Wb + Xg 2 + e test F a T... 10) y = Wb + Xg 10 + e test F a T

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem F 1) y = Wb + Xg 1 + e F test a T 2) y = Wb + Xg 2 + e F test a T... 10) y = Wb + Xg 10 + e F test a T 20.0 15.0 10.0 5.0 0.0 1 2 3 4 5 6 7 8 9 10 marker

ANALIZA ASOCJACYJNA regresja z pojedynczym markerem -log10(a T ) 1) y = Wb + Xg 1 + e F test a T 2) y = Wb + Xg 2 + e F test a T... 10) y = Wb + Xg 10 + e F test a T 3.0 2.5 2.0 1.5 1.0 0.5 0.0 1 2 3 4 5 6 7 8 9 10 marker

GWAS Genomewide Association Study

ANALIZA ASOCJACYJNA skan genomu Genome Wide Association Study = SNP w całym genomie Copyright 2011, Joanna Szyda

skan genomu przykład z literatury Copyright 2011, Joanna Szyda

ANALIZA ASOCJACYJNA cechy binarne

TRANSMISSION DISEQUILIBRIUM TEST - sprzężenie + asocjacja 12 11 allel przekazany allel nieprzekazany 1 2 1 x x 1 x 2 rodzice + chore dziecko allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x

TRANSMISSION DISEQUILIBRIUM TEST allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x TDT 2 n n 2 12 21 ~ 1 12 n21 n brak założeń o modelu dziedziczenia cechy

TRANSMISSION DISEQUILIBRIUM TEST - przykład

TRANSMISSION DISEQUILIBRIUM TEST - przykład HIPOTEZY H 0 : n 12 =n 21 H 1 : n 12 n 21 allel przekazany allel nieprzekazany 1 2 1 x 46 2 79 x H 0 : brak sprzężenia i LD miedzy markerem, a genem H 1 : występuje sprzężenia i LD miedzy markerem, a genem MAKSYMALNY POZIOM BŁĘDU I-GO RODZAJU a MAX = 0.01 TEST TDT= 8.71 dla markera D6S2889 na chromosomie 6 UZYSKANY POZIOM BŁĘDU I-GO RODZAJU a T =0.0031 Segregacja genotypów markera D6S2889 jest skorelowana z objawami łysienia plackowatego Copyright 2017 Joanna Szyda

COCHRAN-ARMITAGE TEST Genotyp 11 12 22 chory N 11chore N 12chore N 22chore zdrowy N 11zdrowe N 12zdrowe N 22zdrowe brak założeń nt modelu dziedziczenia cechy

INNE METODY STATYSTYCZNEJ DETEKCJI GENÓW

ANALIZA SPRZĘŻEŃ y = + q i + e 1.17 2.01 1.56 1.93 1 1 1 1 0.95 0.35 0.84 1.00 prawdopodobieństwo, że dany osobnik odziedziczył określony genotyp QTL (QQ, Qq, qq) prawdopodobieństwo jest obliczone na podstawie genotypu markerów i informacji o spokrewnieniu prawdopodobieństwo jest funkcją częstości rekombinacji pomiędzy markerami

RUNS OF HOMOZYGOSITY 1. Runs of homozygosity identyfikacja regionów z homozygotycznymi markerami 2. ROH 3. Wskazują na regiony ważne z punktu widzenia selekcji Nature464, 587 591 doi:10.1038/nature08832

SIGNATURES OF SELECTION ҧ ҧ 1. Różnice we frekwencji alleli między populacjami 2. Wskazują na regiony ważne z punktu widzenia selekcji F ST = σk i=1 p i K 1 p 1 p pҧ 2 K p i pҧ liczba populacji frekwencja alleli w populacji i ogólna frekwencja alleli

1. Analiza asocjacyjna Cechy ciągłe Cechy binarne 2. Inne metody Analiza sprzężeń Runs of homozygosity Signatures of selection