BIOINFORMATYKA 8. Analiza asocjacyjna - teoria



Podobne dokumenty
1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

WSTĘP. Copyright 2011, Joanna Szyda

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Mapowanie genów cz owieka. podstawy

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

Badania asocjacyjne w skali genomu (GWAS)

Podstawy genetyki człowieka. Cechy wieloczynnikowe

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII

Oprogramowanie dla GWAS

Analiza sprzężeń u człowieka. Podstawy

Analiza sprzężeń u człowieka. Podstawy

Analiza sprzężeń u człowieka. Podstawy

METODY STATYSTYCZNE W BIOLOGII

ZARZĄDZANIE POPULACJAMI ZWIERZĄT

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Analiza sprzężeń u człowieka. Podstawy

Mapowanie genów cz owieka i badania asocjacji. podstawy

Opis wykonanych badań naukowych oraz uzyskanych wyników

STATYSTYKA MATEMATYCZNA WYKŁAD 1

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Ekologia molekularna. wykład 14. Genetyka ilościowa

Postępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda

Badania asocjacyjne w skali genomu (GWAS)

WSTĘP Oprogramowanie dla GWAS

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Spokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

STATYSTYKA MATEMATYCZNA

Ekologia molekularna. wykład 3

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

GENETYKA POPULACJI. Ćwiczenia 4 Biologia I MGR

STATYSTYKA MATEMATYCZNA

ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI. Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt

Człowiek mendlowski? Genetyka człowieka w XX i XXI w.

STATYSTYKA MATEMATYCZNA

1. KEGG 2. GO. 3. Klastry

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Anna Szewczyk. Wydział Geodezji Górniczej i InŜynierii środowiska AGH

Zarządzanie populacjami zwierząt. Parametry genetyczne cech

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

METODY STATYSTYCZNE W BIOLOGII

PODSTAWY GENETYKI. Prowadzący wykład: prof. dr hab. Jarosław Burczyk

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Wprowadzenie do genetyki medycznej i sądowej

Genetyka człowieka II. Cechy wieloczynnikowe, polimorfizmy i asocjacje

Mapowanie genów człowieka i badania asocjacji. podstawy

Dziedziczenie poligenowe

Statystyka matematyczna Test χ 2. Wrocław, r

PAKIETY STATYSTYCZNE

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Podstawy genetyki populacji SYLABUS A. Informacje ogólne

GENETYKA POPULACJI. Ćwiczenia 1 Biologia I MGR /

PAKIETY STATYSTYCZNE

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Biologia medyczna, materiały dla studentów

STATYSTYKA MATEMATYCZNA WYKŁAD 5 TEST T

Wykład 14 Test chi-kwadrat zgodności

BioTe21, Pracownia Kryminalistyki i Badań Ojcostwa.

Zmienność populacji człowieka. Polimorfizmy i asocjacje

Składniki jądrowego genomu człowieka

Badanie predyspozycji do łysienia androgenowego u kobiet (AGA)

Genetyka Populacji

PRZYGODY DGV. historia programu selekcji genomowej w Polsce. Joanna Szyda, Andrzej Żarnecki

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych

Tomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda

PODSTAWY BIOINFORMATYKI

ALGORYTMY GENETYCZNE (wykład + ćwiczenia)

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Dziedziczenie cech sprzężonych, crossing-over i mapy chromosomów

Ćwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński

a) Zapisz genotyp tego mężczyzny... oraz zaznacz poniżej (A, B, C lub D), jaki procent gamet tego mężczyzny będzie miało genotyp ax b.

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Dziedziczenie wieloczynnikowe. Problem przewidywalności

PDF created with FinePrint pdffactory Pro trial version

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

Ćwiczenie 3/4. Prawa Mendla: zadania, analiza rodowodów Sprzężenia i odległość genetyczna. Kariotypy i chromosomopatie. Prof. dr hab.

21. Poszukiwanie markerów molekularnych genów przywracania płodności pyłku u żyta ( Secale cereale

PAKIETY STATYSTYCZNE

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

1 Podstawowe pojęcia z zakresu genetyki. 2 Podstawowy model dziedziczenia

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Dr hab.n.med. Renata Jacewicz

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Pytania i odpowiedzi

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Genetyka człowieka II. Cechy wieloczynnikowe, polimorfizmy i asocjacje

Zastosowanie nowych technologii genotypowania w nowoczesnej hodowli i bankach genów

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

Z1/1. ANALIZA BELEK ZADANIE 1

PORÓWNYWANIE POPULACJI POD WZGLĘDEM STRUKTURY

Transkrypt:

IOINFORMTYK 1. Wykład wstępny 2. Struktury danych w adaniach ioinformatycznych 3. azy danych: projektowanie i struktura 4. azy danych: projektowanie i struktura 5. Powiązania pomiędzy genami: równ. Hardyego-Weinerga, wsp. rekominacji 6. naliza sprzężeń - teoria 7. naliza sprzężeń - przykłady programów 8. naliza asocjacyjna - teoria 9. naliza asocjacyjna przykłady programów 10.Symulacje komputerowe, jackknife, ootstrap 11.Monte Carlo Markov Models 12.Metody klasyfikacyjne 13.Wykład podsumowujący 14.Zastosowanie przykładowych programów do analizy danych 15.Zastosowanie przykładowych programów do analizy danych

WSTĘP 1. naliza asocjacyjna Zasady stosowania Różnice z analizą sprzężeń 2. Przykłady Metody wykorzystujące modele statystyczne Metody pomijające modele

NLIZ SOCJCYJN wstęp

ŹRÓDŁ ZURZENI RÓWNOWGI HW pokolenie 1 SPRZĘŻENIE SELEKCJ a a a pokolenie N a a a a a pokolenie 1 pokolenie N

POZORNE ZURZENIE RÓWNOWGI HW SUPOPULCJ SUPOPULCJ a a a PRÓ DNYCH a a a

NLIZ SOCJCYJN - definicja NLIZ SOCJCYJN 1. Statystyczna procedura poszukiwania genów 2. Poszukiwanie markerów powiązanych z genem głównym 3. Wykorzystująca zaurzenie równowagi HW pomiędzy (widzialnymi) markerami, a (niewidzialnym) genem głównym 4. Oliczone na podstawie korelacji pomiędzy zmiennością cechy, a zmiennością genotypów markerów

NLIZ SOCJCYJN - źródła informacji NLIZ SOCJCYJN wartości cechy genotypy markerów spokrewnienie

NLIZ SOCJCYJN - poszukiwanie genów POSZUKIWNIE MRKER O NJWYŻSZEJ KORELCJI ZE ZMIENNOŚCIĄ CECHY 1) 2) M1 M2 M3 M4 M5 M6... M7 0 cm 100 cm QTL M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm QTL lokalizacja: 1 Marker lokalizacja: 2 Marker 7) M1 M2 M3 M4 M5 M6 M7 0 cm 100 cm QTL lokalizacja: 7 marker

NLIZ SOCJCYJN - NLIZ SPRZĘŻEŃ NLIZ SPRZĘŻEŃ Wykorzystuje informacje o spokrewnieniu NLIZ SOCJCYJN Nie wykorzystuje informacji o spokrewnieniu Detekcja rzeczywistego sprzężenia pomiędzy genem, a markerem Duża moc detekcji QTL nawet w pewnej odległości od markera Mała precyzja lokalizacji QTL Skan genomu Detekcja powiązania =korelacji pomiędzy genem, a markerem Mała moc detekcji QTL zlokalizowanego w pewnej odległości od markera Duża precyzja lokalizacji QTL Mapowanie precyzyjne lu skan genomu np. wykorzystanie mikromacierzy Copyright 2011, SNP Joanna Szyda

NLIZ SOCJCYJN cechy ciągłe

NLIZ SOCJCYJN - poszukiwanie genów POSZUKIWNIE MRKER O NJWYŻSZEJ KORELCJI ZE ZMIENNOŚCIĄ CECHY 1) y = + m 1 + e prawdopodoieństwo 2) y = + m 2 + e prawdopodoieństwo... 7) y = + m 7 + e prawdopodoieństwo ELEMENTY MODELU: y wartość cechy efekty wspólne dla wszystkich osoników e efekty niemierzalne (łąd) m i efekt markera " i "

NLIZ SPRZĘŻEŃ - poszukiwanie genów y = + m i + e 1.17 2.01 1.56 1.93 1 1 1 1 1 0-1 0 Kod genotypu markera (11, 12, 22)

KODOWNIE GENOTYPÓW MRKERÓW - przykłady Niezależne od frekwencji alleli 11 1 Kao and Zeng, 2002 12 0 22-1 Zależne od frekwencji alleli 11 2p 2 Cockerham, 1954 12 p 2 - p 1 22-2p 1

TESTOWNIE - prawdopodoieństwa dla każdego markera ln ( prawdopod. ) 1) y = + m 1 + e prawdopodoieństwo 2) y = + m 2 + e prawdopodoieństwo... 7) y = + m 7 + e prawdopodoieństwo -275-280 -285-290 -295 1 2 3 4 5 6 7 marker

TESTOWNIE - hipotezy i test HIPOTEZY H 0 : marker "i" nieskorelowany z QTL m i = 0 rak asocjacji H 1 : marker "i" skorelowany z QTL m i 0 występuje asocjacja MODELE STTYSTYCZNE MODEL 0 : MODEL 1 : y = + e y = + m i + e TEST LRT (likelihood ratio test) LRT = -2 [ lnpr ( MODEL 0 ) - lnpr ( MODEL 1 ) ] ~ c 2 M1-M0 Copyright 2012, Joanna Szyda

TESTOWNIE - wnioskowanie najardziej prawdopodona lokalizacja genu: marker 5 LRT = 18.72 założone maksymalne prawdopodoieństwo łędu a MX = 0.01 prawdopodoieństwo łędu dla LRT=25.46 wynosi a T =0.000015 20 a MX > a T H 1 na dziedziczenie cechy ma wpływ gen główny LRT gen jest w LD z markerem 5 15 10 5 0 1 2 3 4 5 6 7 lokalizacja genu

NLIZ SOCJCYJN - przykład, skan genomu GWS GenomeWise ssociation Study

NLIZ SOCJCYJN - przykład z literatury

NLIZ SOCJCYJN cechy 0/1

TRNSMISSION DISEQUILIRIUM TEST - sprzężenie + asocjacja 12 11 allel przekazany allel nieprzekazany 1 2 1 2 x x rodzice + chore dziecko allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x

TRNSMISSION DISEQUILIRIUM TEST allel przekazany allel nieprzekazany 1 2 1 x n 12 2 n 21 x TDT 2 n n 2 12 21 ~ c1 12 n21 n rak założeń nt modelu dziedziczenia cechy

TRNSMISSION DISEQUILIRIUM TEST - przykład

TRNSMISSION DISEQUILIRIUM TEST - przykład H 0 równowaga miedzy markerem a genem H 1 zaurzenie równowagi miedzy markerem a genem H 0 : n 12 =n 21 H 1 : n 12 n 21 allel przekazany allel nieprzekazany 1 2 1 x 46 2 79 x TDT = 8.71 dla markera D6S2889 na chromosomie 6 a max = 0.01 a T = 0.0031 H 1 Segregacja genotypów markera D6S2889 jest skorelowana z ojawami łysienia plackowatego Copyright 2013 Joanna Szyda

COCHRN-RMITGE TEST Genotyp 11 12 22 chory N 11chore N 12chore N 22chore zdrowy N 11zdrowe N 12zdrowe N 22zdrowe rak założeń nt modelu dziedziczenia cechy Copyright 2013, Joanna Szyda

zasady stosowania M1 M2 M3 M4 M5 M6 QTL M1 M2 M3 M4 M5 M6 M7 M7 QTL NLIZ SOCJCYJN y = + m i + e