WSTĘP Oprogramowanie dla GWAS
|
|
- Filip Domański
- 4 lat temu
- Przeglądów:
Transkrypt
1 ANALIZA DANYCH 1. Wykład wstępny 2. Charakterystyka danych 3. Analiza wstępna genomiczna charakterystyka cech 4. Prezentacje grup roboczych analiza wstępna 5. Prezentacje grup roboczych analiza wstępna 6. Metodyka Genome-wide Association Studies 7. Opis programu preznaczonego do ostatecznej analizy 8. Przegląd literatury GWAS dla analizowanych cech 9. Przegląd literatury GWAS dla analizowanych cech 10. Przegląd literatury GWAS dla analizowanych cech 11. Przegląd literatury GWAS dla analizowanych cech 12. Przegląd literatury GWAS dla analizowanych cech 14. Prezentacje grup roboczych ostateczna analiza 15. Prezentacje grup roboczych ostateczna analiza
2 SKN Bioinformatyków
3 WSTĘP Oprogramowanie dla GWAS 1. PLINK Struktura plików wsadowych Wykonanie programu Interpretacja wyników 2. GCTA Struktura plików wsadowych Wykonanie programu Interpretacja wyników 3. GVCBLUP Modele statystyczne Wykonanie programu Interpretacja wyników 4. Przykłady innych programów Copyright 2018, Joanna Szyda
4 WSTĘP Tworzenie własnych programów 5. R Kod programu Wykonanie programu Interpretacja wyników 6. SAS Kod programu Wykonanie programu Interpretacja wyników Copyright 2018, Joanna Szyda
5 PLINK
6 PLINK Copyright 2018, Joanna Szyda
7 PLINK 1. Darmowy 2. Dobra dokumentacja 3. Różne systemy operacyjne Linia komend Interfejs graficzny (Java) Copyright 2018, Joanna Szyda
8 PLINK Zastosowanie Edycja danych: proste manipulacje na zbiorach danych, detekcja błędnych obserwacji, zmiany formatów, Podstawowe statystyki opisowe: brakujące dane, średnia, frekwencje alleli Obliczanie spokrewnienia IBD / IBS Analiza asocjacyjna: cechy ciągłe i dyskretne, różne struktury danych Permutacje danych Obliczanie LD Identyfikacja haplotypów Imputacja uzupełnienie brakujących genotypów... Copyright 2018, Joanna Szyda
9 PLINK plik wsadowy *.ped: genotypy, pochodzenie, cechy nr rodziny nr osobnika nr ojca nr matki płeć cecha genotypy markerów (tylko bialleliczne = SNP) Copyright 2018, Joanna Szyda
10 PLINK plik wsadowy *.map: mapa markerów 1 rs rs rs rs rs rs rs rs rs rs chromosom nazwa markera SNP położenie [ M ] 0=nieznane położenie [ bp ] 0=nieznane Copyright 2018, Joanna Szyda
11 PLINK wykonanie programu z linii komend plink --noweb --file test --assoc nazwa zbiorów danych *.map, *.ped test.map, test.ped opcja analizy asocjacyjnej Copyright 2018, Joanna Szyda
12 PLINK plik plink.qassoc: wyniki CHR SNP BP NMISS BETA SE R2 T P 1 rs rs NA NA NA NA NA 1 rs rs rs rs chromosom nazwa markera lokalizacja [ bp ] liczba zaobserwowanych danych współczynnik regresji liniowej b 1 odchylenie standardowe b 1 R 2 wartość testu Walda a T Copyright 2018, Joanna Szyda
13 PLINK regresja liniowa efekt SNP y 0 1 x wartość cechy kod genotypu SNP Copyright 2018, Joanna Szyda
14 PLINK regresja liniowa jaka część obserwowanej zmienności została wyjaśniona przez równanie regresji R 2 n i 1 n y y i i 1 yˆ i y 2 2 Copyright 2018, Joanna Szyda
15 PLINK test Walda W ˆ 0 1 ~ ˆ 1 t n p Copyright 2018, Joanna Szyda
16 PLINK test Walda H 0 : SNP nie wykazuje powiązania z cechą i = 0 H 1 : SNP wykazuje powiązanie z cechą i 0 maksymalny błąd I-go rodzaju a MAX = 0.01 SNP1 = a T = SNP2 = NA NA SNP3 = a T = SNP4 = a T = SNP5 = a T = SNP6 = a T = SNP7 = a T = SNP8 = a T = SNP9 = a T = SNP10 = a T = H 0 : SNP1, SNP3, SNP4, SNP5, SNP8, SNP9, SNP10 H 1 : SNP6, SNP7 W bp Copyright 2018, Joanna Szyda
17 PLINK literatura DOI:
18 PLINK publikacja Copyright 2018, Joanna Szyda
19 GCTA
20 GCTA Copyright 2018, Joanna Szyda
21 GCTA 1. Genome-wide Complex Trait Analysis 2. Darmowy 3. Różne systemy operacyjne 4. Wersja wykonawcza oraz kod źródłowy 5. Często uaktualniany 6. Słaba dokumentacja Copyright 2018, Joanna Szyda
22 GCTA Zastosowanie analiza danych GREML estymacja wariancji genetycznej determinowanej przez SNP GWAS vróżne modele LD obliczanie i analiza Genetyka populacji F st, PCA Copyright 2018, Joanna Szyda
23 GCTA genotypy, pochodzenie, cechy *.ped nr rodziny nr osobnika nr ojca nr matki płeć cecha genotypy markerów (tylko bialleliczne = SNP) Copyright 2018, Joanna Szyda
24 GCTA fenotypy *.phen nr rodziny nr osobnika wartość cechy Copyright 2018, Joanna Szyda
25 GCTA wykonanie programu z linii komend gcta64 --mlma --bfile test --pheno test.phen --out test opcja analizy modeli mieszanych y = Xb + Zu + e y u b e X Z fenotyp połączony efekt wszystkich SNP inne efekty np. wiek błąd macierz wystąpień dla b macierz wystąpień dla u var u = Gσ u 2 var e = Iσ e 2 Copyright 2018, Joanna Szyda
26 GCTA wykonanie programu Jak uzyskać efekty poszczególnych SNP (g) z modelu: g = W G 1 u W G macierz wystąpień dla genotypów macierz kowariancji pomiędzy osobnikami w ij = x ij 2p i 2p i 1 p i element macierzy W dla i-ego SNP u osobnika j g lm = 1 N σ N x il 2p i x im 2p i i=1 2p i 1 p i element macierzy G dla osobników l oraz m Copyright 2018, Joanna Szyda
27 GCTA wyniki 1 s A T s C T s C G s T A s A G s G C s C A chromosom nr SNP pz allel referencyjny allele alternatywny frekwencja allelu referencyjnego efekt allelu referencyjnego błąd standardowy P Copyright 2018, Joanna Szyda
28 GCTA literatura DOI:
29 GCTA publikacja Copyright 2018, Joanna Szyda
30 GVCBLUP
31 GVCBLUP download Copyright 2017, Joanna Szyda
32 GVCBLUP publikacja Copyright 2017, Joanna Szyda
33 GVCBLUP publikacja Copyright 2017, Joanna Szyda
34 GVCBLUP model model GWAS y = Wb + ZT α α + ZT δ δ + e y b a d e fenotyp inne efekty np. wiek addytywny efekt wszystkich SNP dominacyjny efekt wszystkich SNP błąd α~n 0, A g σ α 2 δ~n 0, D g σ δ 2 e~n 0, Iσ e 2 W macierz wystąpień dla b Z macierz wystąpień dla SNP T α macierz dla efektów addytywnych SNP T δ macierz dla efektów dominacyjnych SNP Copyright 2017, Joanna Szyda
35 GVCBLUP model α~n 0, A g σ α 2 A g =T α T α δ~n 0, D g σ δ 2 D δ =T δ T δ A g = D g = Copyright 2017, Joanna Szyda
36 GVCBLUP parameter file estymatory efektów SNP w pliku wynikowym Copyright 2017, Joanna Szyda
37 GVCBLUP genotype file Copyright 2017, Joanna Szyda
38 GVCBLUP phenotype file Copyright 2017, Joanna Szyda
39 GVCBLUP map.txt file Snp Snp Snp Snp Copyright 2017, Joanna Szyda
40 GVCBLUP uruchomienie programu Uruchomienie w linii komend: Windows c:\greml\reml_ce.exe gparameter.dat Linux >./reml_ce.exe gparameter.dat ce moduł do analizy dużej liczby SNP Copyright 2017, Joanna Szyda
41 GVCBLUP wariancje Copyright 2017, Joanna Szyda
42 GVCBLUP wartości addytywne i dominacyjne osobników Copyright 2017, Joanna Szyda
43 GVCBLUP wartości addytywne i dominacyjne SNPów Copyright 2018, Joanna Szyda
44 Inne programy
45 GenABEL Copyright 2018 Joanna Szyda
46 EMMAX Copyright 2018 Joanna Szyda
47 GEMMA Copyright 2018 Joanna Szyda
48 R
49 SAS - dane krów Jersey 2. Cechy: wydajność mleka-, białka-, tłuszczu 3. Geny: leptyna, receptor leptyny, dgat1 Copyright 2018 Joanna Szyda
50 GWAS dane wejściowe fenotypy Copyright 2017, Joanna Szyda
51 GWAS dane wejściowe genotypy Copyright 2017, Joanna Szyda
52 GWAS kod R PHEN <- read.table("c:/asia/class/bioinformatics2/data/laktacjejersey.prn", col.names=c("iid","bdate","cdate","parity","dim","my","fy","fp","py","pp")) PHEN1 <- PHEN[PHEN$PARITY==1,] GEN <- read.table("c:/asia/class/bioinformatics2/data/genotypejerseyc.txt", col.names=c("iid","snp1","snp2","snp3")) ALLDAT <- merge(phen1, GEN, by="iid", all=false) REGSNP1 = lm(my ~ SNP1, data=alldat) summary(regsnp1) results=matrix(0,3,3) for (i in 1:3) { model=summary(lm(alldat$my ~ ALLDAT[,i+10])) results[i,1]=model$coef[2,1] results[i,2]=model$coef[2,3] results[i,3]=model$coef[2,4] } results=as.data.frame(results) colnames(results)=c("effect","t-test","p-value") rownames(results)=c("snp1","snp2","snp3") results Copyright 2017, Joanna Szyda
53 GWAS wyniki effect t-test P-value SNP SNP SNP Copyright 2017, Joanna Szyda
54 SAS
55 SAS kod programu *************************************************************/ /* J.Szyda */ /* program fitts various linear mixed repeatability models */ /* to jersey data */ /*************************************************************/ options obs=max; options ls=70; %let INFILE1 ='C:/ASIA/CLASS/bioinformatics2/data/genotypejerseyC.txt' ; %let INFILE2 ='C:/ASIA/CLASS/bioinformatics2/data/laktacjejersey.prn' ; * read phenotypes ; data PHEN ; infile "&INFILE2" ; input IID BDAY 9-10 BMONTH BYEAR CDAY CMONTH CYEAR PARITY DIM MY FY FP PY PP ; if PARITY ne 1 then delete ; run ; proc sort data=phen nodupkey ; by IID ; run ; Copyright 2017, Joanna Szyda
56 SAS kod programu * read genotypes ; data GEN ; infile "&INFILE1" ; input IID LEPR DGAT LEP ; if LEP=9 then LEP=. ; if LEPR=9 then LEPR=. ; if DGAT=9 then DGAT=. ; run ; proc sort data=gen nodupkey ; by IID ; run ; data ALL ; merge PHEN (in=a) GEN (in=b) ; by IID ; if A and B ; run ; * fitting models ; proc reg data=all ; eq1: model MY = DIM LEPR ; eq2: model MY = DIM LEP ; eq2: model MY = DIM DGAT ; run ; Copyright 2017, Joanna Szyda
57 SAS wyniki Parameter Estimates eq1 VariableDF Parameter Standard t Value Pr > t Estimate Error Intercept DIM <.0001 LEPR Parameter Estimates eq2 VariableDF Parameter Standard t Value Pr > t Estimate Error Intercept DIM <.0001 LEP Parameter Estimates eq3 VariableDF Parameter Standard t Value Pr > t Estimate Error Intercept DIM <.0001 DGAT Copyright 2017, Joanna Szyda
58 Oprogramowanie dla GWAS 1. PLINK 2. GCTA 3. GVCBLUP 4. Przykłady innych programów 5. R 6. SAS
Oprogramowanie dla GWAS
BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji
Bardziej szczegółowoPAKIETY STATYSTYCZNE
. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
Bardziej szczegółowoPAKIETY STATYSTYCZNE
1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
Bardziej szczegółowoPAKIETY STATYSTYCZNE
1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
Bardziej szczegółowoPAKIETY STATYSTYCZNE
1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
Bardziej szczegółowoModelowanie danych hodowlanych
Modelowanie danych hodowlanych 1. Wykład wstępny. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami
Bardziej szczegółowo1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection
BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji
Bardziej szczegółowoINFORMATYKA W SELEKCJI
INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne
Bardziej szczegółowoANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI Joanna Szyda Magdalena Frąszczak Magda Mielczarek WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
Bardziej szczegółowoMETODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowo1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa
BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP
PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP WSTĘP 1. SNP 2. haplotyp 3. równowaga sprzężeń 4. zawartość bazy HapMap 5. przykłady zastosowań Copyright 2013, Joanna Szyda HAPMAP BAZA DANYCH HAPMAP - haplotypy
Bardziej szczegółowoWSTĘP. Copyright 2011, Joanna Szyda
BIOINFORMATYKA 1. Wykład wstępny 2. Struktury danych w badaniach bioinformatycznych 3. Bazy danych: projektowanie i struktura 4. Bazy danych: projektowanie i struktura 5. Równowaga Hardyego-Weinberga,
Bardziej szczegółowoBIOMETRIA 3. Wprowadzenie do pakietu SAS
BIOMETRIA 1. Wykład wstępny 2. Opis danych przeznaczonych do analizy 3. Wprowadzenie do pakietu SAS 4. SAS Wykresy 5. SAS Test t 6. SAS Test c2 7. SAS Regresja liniowa 8. SAS Analiza wariancji 9. Wprowadzenie
Bardziej szczegółowoPAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows
PAKIETY STATYSTYCZNE 1. Wykład wstępny 2. Statistica wprowadzenie 3. Statistica elementy analizy danych 4. Statistica wykresy 5. SAS wprowadzenie - środowisko Windows 6. SAS wprowadzenie - środowisko Linux
Bardziej szczegółowoOpis wykonanych badań naukowych oraz uzyskanych wyników
Opis wykonanych badań naukowych oraz uzyskanych wyników 1. Analiza danych (krok 2 = uwzględnienie epistazy w modelu): detekcja QTL przy wykorzystaniu modeli dwuwymiarowych z uwzględnieniem różnych modeli
Bardziej szczegółowoANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI JOANNA SZYDA MAGDALENA FRĄSZCZAK MAGDA MIELCZAREK WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
Bardziej szczegółowoStatystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Bardziej szczegółowoBIOINFORMATYKA. Copyright 2011, Joanna Szyda
BIOINFORMATYKA 1. Wykład wstępny 2. Struktury danych w badaniach bioinformatycznych 3. Bazy danych: projektowanie i struktura 4. Bazy danych: projektowanie i struktura 5. Powiązania pomiędzy genami: równ.
Bardziej szczegółowoPAKIETY STATYSTYCZNE
1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
Bardziej szczegółowoPAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI
PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki - projekt 3. Charakterystyka przedmiotu 4. Kontakt 5. Literatura Copyright 2017 Joanna Szyda KATEDRA
Bardziej szczegółowoCECHY ILOŚCIOWE PARAMETRY GENETYCZNE
CECHY ILOŚCIOWE PARAMETRY GENETYCZNE Zarządzanie populacjami zwierząt, ćwiczenia V Dr Wioleta Drobik Rodzaje cech Jakościowe o prostym dziedziczeniu uwarunkowane zwykle przez kilka genów Słaba podatność
Bardziej szczegółowo1. KEGG 2. GO. 3. Klastry
ANALIZA DANYCH 1. Wykład wstępny 2. Charakterystyka danych 3. Analiza wstępna genomiczna charakterystyka cech 4. Prezentacje grup roboczych analiza wstępna 5. Prezentacje grup roboczych analiza wstępna
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Bardziej szczegółowoSpokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia
prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami ID. Relationship Relatedness Kinship Fraternity ID = identical by descent, geny identycznego pochodzenia jest miarą względną. Przyjmuje
Bardziej szczegółowoSzacowanie wartości hodowlanej. Zarządzanie populacjami
Szacowanie wartości hodowlanej Zarządzanie populacjami wartość hodowlana = wartość cechy? Tak! Przy h 2 =1 ? wybitny ojciec = wybitne dzieci Tak, gdy cecha wysokoodziedziczalna. Wartość hodowlana genetycznie
Bardziej szczegółowoTomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda
Tomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda Uniwersytet Przyrodniczy we Wrocławiu, Pracownia Biostatystyki Instytut Zootechniki Państwowy Instytut Badawczy 2 > 76 000 osobników w bazie
Bardziej szczegółowoBIOINFORMATYKA 8. Analiza asocjacyjna - teoria
IOINFORMTYK 1. Wykład wstępny 2. Struktury danych w adaniach ioinformatycznych 3. azy danych: projektowanie i struktura 4. azy danych: projektowanie i struktura 5. Powiązania pomiędzy genami: równ. Hardyego-Weinerga,
Bardziej szczegółowoInformatyka w selekcji - Wykªad 4
Informatyka w selekcji - Wykªad 4 Plan wykªadu SAS 1. Praca z programem 2. Edycja danych 3. Procedury graczne 4. Analiza w pakiecie SAS na»ywo, Wykªad 5 2/36 Praca z programem, Wykªad 5 3/36 Praca z programem
Bardziej szczegółowoBadania asocjacyjne w skali genomu (GWAS)
Badania asocjacyjne w skali genomu (GWAS) Część 2 LD, PCA Bioinżynieria, I mgr Bioinformatyczna analiza danych Wykład 3 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt Analiza głównych
Bardziej szczegółowoPostępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda
Postępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda Uniwersytet Przyrodniczy we Wrocławiu Katedra Genetyki, Pracownia Biostatystyki 1. MASinBULL 2. Metody oceny genomowej
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II
PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II BAZA DANYCH NCBI 1. NCBI 2. Dane gromadzone przez NCBI 3. Przegląd baz danych NCBI: Publikacje naukowe Projekty analizy genomów OMIM: fenotypy człowieka
Bardziej szczegółowoModelowanie danych hodowlanych
Modelowanie danych hodowlanych 1. Wykład wstępny 2. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 1
STATYSTYKA MATEMATYCZNA WYKŁAD 1 Wykład wstępny Teoria prawdopodobieństwa Magda Mielczarek wykłady, ćwiczenia Copyright 2017, J. Szyda & M. Mielczarek STATYSTYKA MATEMATYCZNA? ASHG 2011 Writing Workshop;
Bardziej szczegółowoOcena wartości hodowlanej. Dr Agnieszka Suchecka
Ocena wartości hodowlanej Dr Agnieszka Suchecka Wartość hodowlana genetycznie uwarunkowane możliwości zwierzęcia do ujawnienia określonej produkcyjności oraz zdolność przekazywania ich potomstwu (wartość
Bardziej szczegółowoPytania i odpowiedzi
Pytania i odpowiedzi Czy kontrola jakości płytek w programach analizy danych jest dostosowywana do przeprowadzanego badania, czy też przyjmuje się jednakową jej wartość dla różnych analiz? We wstępnym
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych
STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące
Bardziej szczegółowoDziedziczenie poligenowe
Dziedziczenie poligenowe Dziedziczenie cech ilościowych Dziedziczenie wieloczynnikowe Na wartość cechy wpływa Komponenta genetyczna - wspólne oddziaływanie wielu (najczęściej jest to liczba nieznana) genów,
Bardziej szczegółowoBADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ
WYKŁAD 3 BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ Było: Przykład. Z dziesięciu poletek doświadczalnych zerano plony ulw ziemniaczanych (cecha X) i oznaczono w nich procentową zawartość
Bardziej szczegółowoPRZYGODY DGV. historia programu selekcji genomowej w Polsce. Joanna Szyda, Andrzej Żarnecki
PRZYGODY DGV historia programu selekcji genomowej w Polsce Joanna Szyda, Andrzej Żarnecki Co to DGV? DGV Direct Genomic Value bezpośrednia genomowa wartość hodowlana suma addytywnych efektów markerów SNP
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE
PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE WSTĘP 1. Mikromacierze ekspresyjne tworzenie macierzy przykłady zastosowań 2. Mikromacierze SNP tworzenie macierzy przykłady zastosowań MIKROMACIERZE EKSPRESYJNE
Bardziej szczegółowoModelowanie danych hodowlanych
Modelowanie danych hodowlanych 1. Wykład wstępny 2. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test
Bardziej szczegółowoINFORMATYKA W SELEKCJI
INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne
Bardziej szczegółowoADNOTACJE WARIANTÓW GENETYCZNYCH
ADNOTACJE WARIANTÓW GENETYCZNYCH WSTĘP 1. Adnotacja? 2. Klasyfikacja wariantów 3. Sequence Ontology terms 4. Variant Effect Predictor online skrypt 5. Inne źródła adnotacji ADNOTACJA WARIANTÓW 1. Edycja
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Bardziej szczegółowoZarządzanie populacjami zwierząt. Parametry genetyczne cech
Zarządzanie populacjami zwierząt Parametry genetyczne cech Teoria ścieżki zależność przyczynowo-skutkowa X p 01 Z Y p 02 p 01 2 + p 02 2 = 1 współczynniki ścieżek miary związku między przyczyną a skutkiem
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych
Bardziej szczegółowoRozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Bardziej szczegółowoSYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Prowadzący: JOANNA SZYDA MAGDALENA FRĄSZCZAK WSTĘP 1. Systemy informatyczne w hodowli -??? 2. Katedra Genetyki 3. Pracownia biostatystyki - wykorzystanie narzędzi
Bardziej szczegółowoDefinicja. Odziedziczalność. Definicja. w potocznym rozumieniu znaczy tyle co dziedziczenie. Fenotyp( P)=Genotyp(G)+Środowisko(E) V P = V G + V E
Odziedziczalność w potocznym rozumieniu znaczy tyle co dziedziczenie...ale ma ścisłą techniczną definicję. Definicja Fenotyp( P)=Genotyp(G)+Środowisko(E) V P = V G + V E H 2 (w szerszym sensie) = V G /
Bardziej szczegółowoMapowanie genów cz owieka. podstawy
Mapowanie genów czowieka podstawy Sprzężenie Geny leżące na różnych chromosomach spełniają II prawo Mendla Dla 2 genów: 4 równoliczne klasy gamet W. S Klug, M.R Cummings Concepts of Genetics 8 th edition,
Bardziej szczegółowoSYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Struktura efektywnej bazy danych Zastosowanie pakietu MS Excel do tworzenia baz danych WSTĘP 1. Dane Przykłady Edycja Zarządzanie 2. Bazy danych Definicje Przykłady
Bardziej szczegółowoKatedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Temat: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. MS EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w MS Excelu wykorzystujemy funkcję o nazwie T.TEST.
Bardziej szczegółowoZ poprzedniego wykładu
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne
Bardziej szczegółowoTablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZA 1. Wykład wstępny. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. ajczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoBadanie normalności rozkładu
Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność
Bardziej szczegółowoEkologia molekularna. wykład 14. Genetyka ilościowa
Ekologia molekularna wykład 14 Genetyka ilościowa Dziedziczenie mendlowskie wykład 14/2 Cechy wieloczynnikowe (ilościowe) wzrost masa ciała kolor skóry kolor oczu itp wykład 14/3 Rodzaje cech ilościowych
Bardziej szczegółowoMETODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoMETODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoweryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Bardziej szczegółowoBadania asocjacyjne w skali genomu (GWAS)
Badania asocjacyjne w skali genomu (GWAS) Wstęp do GWAS Część 1 - Kontrola jakości Bioinformatyczna analiza danych Wykład 2 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt Badania
Bardziej szczegółowoTESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Bardziej szczegółowoEstymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych
Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania
Bardziej szczegółowoCzynniki genetyczne sprzyjające rozwojowi otyłości
Czynniki genetyczne sprzyjające rozwojowi otyłości OTYŁOŚĆ Choroba charakteryzująca się zwiększeniem masy ciała ponad przyjętą normę Wzrost efektywności terapii Czynniki psychologiczne Czynniki środowiskowe
Bardziej szczegółowoZarządzanie populacjami zwierząt. Ocena wartości hodowlanej Wykład 7
Zarządzanie populacjami zwierząt Ocena wartości odowlanej Wykład 7 Wartość fenotypowa Ceca ilościowa G GE E D I GE E E p E t,d,i addytywna, dominacyjna, interakcyjna (epistatyczna) część wartości genotypowej
Bardziej szczegółowoStosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
Bardziej szczegółowo1 Podstawowe pojęcia z zakresu genetyki. 2 Podstawowy model dziedziczenia
Rachunek Prawdopodobieństwa MAP8 Wydział Matematyki, Matematyka Stosowana Projekt - zastosowania rachunku prawdopodobieństwa w genetyce Opracowanie: Antonina Urbaniak Podstawowe pojęcia z zakresu genetyki
Bardziej szczegółowoStatystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Bardziej szczegółowoAnna Szewczyk. Wydział Geodezji Górniczej i InŜynierii środowiska AGH
Anna Szewczyk Wydział Geodezji Górniczej i InŜynierii środowiska AGH Zastosowania biblioteki Genetics programu R The genetics Package Tytuł: Populacja genetyczna Wersja:1.2.0 Data utworzenia: 2005-11-09
Bardziej szczegółowoModel regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago
Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,
Bardziej szczegółowoPDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Bardziej szczegółowoWykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Bardziej szczegółowoPODSTAWY GENETYKI. Prowadzący wykład: prof. dr hab. Jarosław Burczyk
PODSTAWY GENETYKI Prawa Mendla (jako punkt wyjścia) Epistaza (interakcje między genami) Sprzężenia genetyczne i mapowanie genów Sprzężenie z płcią Analiza rodowodów Prowadzący wykład: prof. dr hab. Jarosław
Bardziej szczegółowoa) Zapisz genotyp tego mężczyzny... oraz zaznacz poniżej (A, B, C lub D), jaki procent gamet tego mężczyzny będzie miało genotyp ax b.
W tomie 2 zbioru zadań z biologii z powodu nieprawidłowego wprowadzenia komendy przenoszenia spójników i przyimków do następnej linii wystąpiła zamiana samotnych dużych liter (A, I, W, U) na małe litery.
Bardziej szczegółowoGenetyka populacji. Ćwiczenia 7
Genetyka populacji Ćwiczenia 7 Rodowody wraz z wynikami kontroli użytkowości stanowią podstawową informację potrzebną do doskonalenia zwierząt C F X S D C F C F S D strzałka oznacza przepływ genów między
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test
Bardziej szczegółowoPodstawy genetyki człowieka. Cechy wieloczynnikowe
Podstawy genetyki człowieka Cechy wieloczynnikowe Dziedziczenie Mendlowskie - jeden gen = jedna cecha np. allele jednego genu decydują o barwie kwiatów groszku Bardziej złożone - interakcje kilku genów
Bardziej szczegółowoWSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Bardziej szczegółowoSAS Podstawowe informacje przed ćwiczeniem 1
SAS Podstawowe informacje przed ćwiczeniem 1 Zasady tworzenia programów każda instrukcja zakończona się średnikiem małe i duże litery nie są rozróżniane instrukcje mogą być kontynuowane w następnej linii
Bardziej szczegółowoSYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ. Ocena wartości hodowlanej bydła mlecznego wprowadzenie
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Ocen wrtości hodowlnej bydł mlecznego wprowdzenie WSTĘP. Modele oceny wrtości hodowlnej. Ocen konwencjonlnej wrtości hodowlnej w Polsce 3. Ocen genomowej wrtości
Bardziej szczegółowoZARZĄDZANIE POPULACJAMI ZWIERZĄT
ZARZĄDZANIE POPULACJAMI ZWIERZĄT Ćwiczenia 1 mgr Magda Kaczmarek-Okrój magda_kaczmarek_okroj@sggw.pl 1 ZAGADNIENIA struktura genetyczna populacji obliczanie frekwencji genotypów obliczanie frekwencji alleli
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
Bardziej szczegółowoINFORMATYKA W SELEKCJI 9 MODELE MIESZANE
INFORMATYKA W SELEKCJI 9 MODELE MIESZANE SAS WYKORYSTANIE PAKIETU SAS DO ESTYMACJI EFEKTÓW MODELI MIESZANYCH. Modl stały, a modl miszany. Macirz spokrwniń addytywni polignicznych 3. Przygotowani danych
Bardziej szczegółowoWprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Bardziej szczegółowoStosowana Analiza Regresji
Model jako : Stosowana Analiza Regresji Wykład XI 21 Grudnia 2011 1 / 11 Analiza kowariancji Model jako : Oprócz czynnika o wartościach nominalnych chcemy uwzględnić wpływ predyktora o wartościach ilościowych
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoStatystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład X, 9.05.206 TESTOWANIE HIPOTEZ STATYSTYCZNYCH II: PORÓWNYWANIE TESTÓW Plan na dzisiaj 0. Przypomnienie potrzebnych definicji. Porównywanie testów 2. Test jednostajnie
Bardziej szczegółowoStatystyka matematyczna. Wykład V. Parametryczne testy istotności
Statystyka matematyczna. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Weryfikacja hipotezy o równości wartości średnich w dwóch populacjach 2 3 Weryfikacja hipotezy o równości wartości średnich
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoRegresja liniowa wprowadzenie
Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem
Bardziej szczegółowoZmienność. środa, 23 listopada 11
Zmienność http://ggoralski.com Zmienność Zmienność - rodzaje Zmienność obserwuje się zarówno między poszczególnymi osobnikami jak i między populacjami. Różnice te mogą mieć jednak różne podłoże. Mogą one
Bardziej szczegółowoTestowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie
Bardziej szczegółowo