Predykcja wartości hodowlanej byd la mlecznego na podstawie wybranych haplotypów SNP

Wielkość: px
Rozpocząć pokaz od strony:

Download "Predykcja wartości hodowlanej byd la mlecznego na podstawie wybranych haplotypów SNP"

Transkrypt

1 Uniwersytet Przyrodniczy we Wroc lawiu Wydzia l Biologii i Hodowli Zwierzat Praca doktorska Predykcja wartości hodowlanej byd la mlecznego na podstawie wybranych haplotypów SNP Projekt badawczy finansowany przez Narodowe Centrum Nauki, grant nr N N Anna Mucha Promotor: dr hab. inż. Heliodor Wierzbicki Katedra Genetyki Wydzia l Biologii i Hodowli Zwierzat Uniwersytet Przyrodniczy we Wroc lawiu Wroc law, 2012

2

3 Sk ladam serdeczne podziekowania Konsorcjum MASinBULL, a w szczególności jego koordynatorowi, prof. dr hab. Stanis lawowi Kamińskiemu, za udostepnienie danych, na podstawie których powsta la niniejsza dysertacja. Dzi ekuj e mojemu promotorowi i mentorowi, dr hab. Heliodorowi Wierzbickiemu, za poświ econy czas, 5 lat niezwykle pouczajacej dla mnie wspó lpracy, wyrozumia lość, życzliwość oraz naukowe wsparcie, ale także duża swobode w realizacji niniejszej pracy. Dzi ekuj e Pracownikom i Doktorantom Katedry Genetyki za wsparcie, pomoc oraz przyjazna i niepowtarzalna atmosfere pracy. Dzi ekuj e moim Rodzicom, Bratu, M eżowi oraz wszystkim Przyjacio lom i Bliskim za mi lość, wyrozumia lość, nieustajace wsparcie oraz niez lomna wiare w moje si ly.

4

5 Spis treści Streszczenie Abstract vii viii 1 Wstep i przeglad piśmiennictwa Selekcja zwierzat Selekcja zwierzat wspomagana analiza markerów genetycznych Genomowa selekcja zwierzat Selekcja genomowa byd la mlecznego na świecie i w Polsce Cel pracy Materia l Dane fenotypowe Dane genotypowe Metody Selekcja polimorfizmów pojedynczych nukleotydów oraz wybór bloków powiazanych ze soba markerów SNP Odsetek brakujacych genotypów oraz frekwencja rzadszego allelu Nierównowaga sprz eżeń Konstrukcja haplotypów SNP oraz estymacja ich frekwencji Predykcja wartości hodowlanej na bazie haplotypów SNP Model ze sta lymi efektami haplotypów SNP Model z losowymi efektami haplotypów SNP i równomiernie roz lożona wariancja genetyczna

6 vi SPIS TREŚCI Model z losowymi efektami haplotypów SNP i nierównomiernie roz lożona wariancja genetyczna Model ze sta lymi efektami haplotypów SNP oraz losowymi addytywnymi efektami poligenicznymi Model z losowymi addytywnymi efektami poligenicznymi Porównanie wykorzystanych modeli predykcji Wyniki Selekcja SNP Wyodr ebnienie bloków SNP Konstrukcja i selekcja haplotypów SNP Predykcja wartości hodowlanej na bazie haplotypów SNP Porównanie modeli predykcji ze wzgl edu na efekty haplotypów Porównanie modeli predykcji ze wzgl edu na relacj e DGV do EBV Dyskusja Selekcja markerów SNP Konstrukcja i selekcja haplotypów SNP Efekty haplotypów SNP Predykcja wartości hodowlanej Podsumowanie i wnioski 111 Bibliografia 112 Spis rysunków 122 Spis tabel 124 A Wykaz bloków markerów 127

7 SPIS TREŚCI vii Streszczenie G lównym celem badań by la predykcja genomowej wartości hodowlanej cech produkcyjnych, wybranych cech pokrojowych, reprodukcyjnych i wyniku komórek somatycznych byd la mlecznego w Polsce w oparciu o dane rzeczywiste, zawierajace genotypy z lożone z tysiecy markerów typu SNP, tworzacych haplotypy. Analizowany zbiór danych stanowi ly dane fenotypowe, genotypowe oraz rodowodowe 1216 buhajów rasy polskiej holsztyńsko-fryzyjskiej. Badaniem obj eto 3 cechy produkcyjne, 3 cechy pokrojowe, 3 cechy reprodukcyjne oraz wynik komórek somatycznych. Rol e fenotypów pe lni ly zderegresowane estymatory wartości hodowlanych. Dane genotypowe stanowi lo 54 tys. markerów SNP. Z analizowanego zbioru danych wyodr ebniono 1064 osobniki, które stanowi ly zbiór testowy i 152 osobniki, które stworzy ly zbiór walidacyjny. Dane genotypowe by ly selekcjonowane ze wzgledu na odsetek brakujacych genotypów, frekwencje rzadszego allelu oraz nierównowage sprzeżeń. Celem selekcji danych przy użyciu nierównowagi sprz eżeń by lo wyodr ebnienie bloków SNP, które stanowi ly baz e do konstrukcji haplotypów SNP. Spośród wszystkich skonstruowanych haplotypów wybrane zosta ly te, których estymatory frekwencji przekroczy ly 25%. Predykcja wartości hodowlanej zosta la przeprowadzona z wykorzystaniem jedenastu modeli statystycznych dla każdej z analizowanych cech. Rozważono różne postaci modeli predykcji oraz dwa rodzaje macierzy wystapień efektów haplotypów SNP, które by ly traktowane jako sta le albo losowe. Wyniki porównano z predyktorami wartości hodowlanych otrzymanymi metoda BLUP z poligenicznymi efektami losowymi. Korelacje pomiedzy genomowymi i konwencjonalnymi wartościami hodowlanymi otrzymane dla zbioru testowego osiagn e ly wartości od 0.63 dla cech reprodukcyjnych do 1.00 dla cech produkcyjnych i pokrojowych. Analogiczne wspó lczynniki korelacji liniowej, rangowej oraz wspó lczynniki regresji uzyskane dla zbioru walidacyjnego wskaza ly, że w praktyce selekcji genomowej powinny być stosowane modele z losowymi haplotypami SNP. Korelacje otrzymane za pomoca tych modeli by ly niższe od korelacji uzyskanych w zbiorze testowym i waha ly sie od 0.23 dla cech reprodukcyjnych do 0.47 dla cech produkcyjnych. Wspó lczynniki regresji wskazywa ly na nieznaczne zaniżanie ocen wartości hodowlanych przez modele z losowymi haplotypami SNP oraz na zawyżanie ocen wartości hodowlanych przez modele ze sta lymi efektami haplotypów SNP. Otrzymane predyktory wartości hodowlanych by ly mniej dok ladne od wyników opisanych w literaturze, które uzyskane zosta ly z wykorzystaniem dużych populacji referencyjnych, ale porównywalne do predyktorów wartości hodowlanych wyznaczanych w oparciu o ten sam zbiór danych, ale przy użyciu innej metodyki (wykorzystanie efektów pojedynczych SNP).

8 viii SPIS TREŚCI Abstract The main objective of this study was to predict the genomic breeding values of production traits, selected conformation traits, selected reproductive traits and somatic cell score of dairy cattle in Poland based on the real data containing genotypes composed of thousands of SNP markers forming the SNP haplotypes. The analyzed data set consisted of phenotypic, genotypic and pedigree data of 1216 Polish Holstein-Friesian bulls. The study included three production traits, 3 conformation traits, 3 reproductive traits and somatic cell score. Deregressed breeding values were used as phenotypes (dependent variables). Genotypic data were 54 thousands SNP markers. The data were divided into two subsets: training set (1064 individuals) and validation set (152 individuals). Genotypic data were selected due to the percentage of missing genotypes, minor allele frequency and linkage disequilibrium. The purpose of data selection using linkage disequilibrium was to identify SNP blocks that were the basis for the construction of SNP haplotypes. Of all the constructed haplotypes only those with frequency higher than 25% were selected. Prediction of breeding values was carried out using eleven statistical models for each of the analyzed traits. Various forms of predictive models and two types of design matrix for SNP haplotypes effects, which were treated as fixed or random, were considered. The results were compared with predictors of breeding values obtained using BLUP with a model with random poligenic effects. Correlations between direct and conventional breeding values obtained for the training data set have ranged from 0.63 for reproductive traits to 1.00 for production and conformation traits. The analogical linear and rank correlation coefficients and regression coefficients obtained for a validation data set indicated that the models with random SNP haplotypes should be used in practice of genomic selection. Correlations obtained with these models were lower than the correlations obtained in the training data set and ranged from 0.23 for reproductive traits to 0.47 for production traits. Regression coefficients indicated a slight underestimation of breeding values for models with random SNP haplotypes and overestimation of breeding values for models with fixed SNP haplotype effects. The resulting predictors were less accurate than the results reported in the literature, obtained on the basis of a large reference populations. However, comparable accuracy of prediction was obtained when the same data set was used to predict breeding values using different methodology (single SNPs as independent variables in a statistical model).

9 Rozdzia l 1 Wstep i przeglad piśmiennictwa 1.1 Selekcja zwierzat Selekcja zwierzat stanowi nieod l aczn a cześć pracy hodowcy. Kluczem do trafnej decyzji selekcyjnej, a tym samym przyspieszenia postepu hodowlanego, jest w laściwa ocena wartości hodowlanej zwierzat. Aktualnie w Polsce szacuje sie ja na podstawie informacji fenotypowej i rodowodowej osobnika oraz jego krewnych. Najprostsza, ale i najmniej dok ladna metoda jest dokonywanie oceny osobnika na podstawie wydajności jego rodziców. Nieco dok ladniejsze oceny wartości hodowlanej uzyskuje sie przy znanych wydajnościach krewnych z tego samego lub starszych pokoleń, jednak podejście takie wymaga wi ekszego nak ladu czasu. Najbardziej precyzyjne oceny otrzymywane sa na podstawie informacji fenotypowej potomstwa ocenianego osobnika, ale metoda ta jest niezwykle kosztowna i zwi eksza odst ep mi edzy pokoleniami. W przypadku byd la mlecznego najostrzejszej selekcji podlegaja buhaje. Do oceny wartości hodowlanej buhaja, w tradycyjnym ujeciu, niezbedne jest zgromadzenie informacji fenotypowej, np. wydajności mlecznej, co najmniej kilkudziesi eciu jego córek. Metoda ta przynosi zadowalajace efekty, ale niesie ze soba duże koszty i wyd lużony czas oczekiwania. Ponadto, oceny sa trafne w odniesieniu do cech średnio i wysoko odziedziczalnych, ale metoda jest mniej dok ladna dla cech takich, jak p lodność, zdrowotność wymion czy d lugowieczność, czyli cech o niższej odziedziczalności. Wi ekszość modeli oceny wartości hodowlanej opiera si e na metodzie wyznaczania najlepszego liniowego nieobci ażonego predyktora (ang. Best Linear Unbiased Prediction, BLUP) (Henderson, 1949, 1976, 1984; Mrode, 2005). Do powszechnego użytku wesz la

10 2 Wstep i przeglad piśmiennictwa ona w latach 80-tych XX wieku. Dzi eki metodzie BLUP możliwe jest szacowanie wszystkich parametrów modelu jednocześnie. Jej wprowadzenie da lo możliwość podniesienia dok ladności oceny wartości hodowlanej, ale pojawi l sie problem rosnacego zinbredowania. Przez wiele lat ocene wartości hodowlanej prowadzono metoda BLUP z modelem ojca (ang. BLUP sire model, BLUP SM) i modelem zwierzecia (ang. BLUP animal model, BLUP AM). Bardziej wyrafinowane jej uj ecie opublikowane zosta lo przez Ptak i Schaeffer (1993), w postaci modelu regresji próbnych udojów (ang. test day regression model). Rok później Schaeffer i Dekkers (1994) przedstawili podejście oparte na regresjach losowych (ang. random regression model). 1.2 Selekcja zwierzat wspomagana analiza markerów genetycznych Zastosowanie markerów molekularnych przynios lo ze soba dostep do nowego źród la informacji, w którym upatrywano szansy na ocene wartości hodowlanej cech np. mierzonych dopiero po śmierci zwierz ecia, charakterystycznych jedynie dla konkretnej p lci lub nisko odziedziczalnych. Za marker godny uwagi uznawano taki, który jest silnie sprz eżony z cecha bed ac a przedmiotem badania. Pojawi ly sie próby opierania decyzji selekcyjnych nie tylko na bazie informacji fenotypowej i rodowodowej, ale także genotypowej (Dekkers, 2004; FAO, 2007). Nowy trend zyska l miano selekcji wspomaganej markerami genetycznymi (ang. marker assisted selection, MAS). Nowa metoda mia la s lużyć selekcji ze wzgl edu na cech poligenicznych. Opiera la si e g lównie na wskazywaniu w genomie obszarów (ang. quantitative trait loci, QTL) majacych istotny wp lyw na zmienność genetyczna doskonalonej cechy. Poszukiwano QTL dla cech produkcyjnych byd la mlecznego, zwiaza- nych z p lodnościa, wyniku komórek somatycznych, cech pokrojowych (Heyen i wsp., 1999; Kolbehdari i wsp., 2009; Viitala i wsp., 2003; Ashwell i wsp., 2004; Olsen i wsp., 2005; Schnabel i wsp., 2005; Meuwissen i Goddard, 2004; Meuwissen, 2010; Calus i wsp., 2010; Cohen-Zinder i wsp., 2005; de Koning, 2006; Cohen i wsp., 2004; Freyer i wsp., 2003; Nilsen i wsp., 2009). Problemem badań prowadzonych na podstawie rzeczywistych danych by l fakt, iż trudno by lo porównać ich wyniki oraz zweryfikować, które QTL rzeczywiście istnieja i sa istotne. Oczekiwania postawione wobec MAS nie zosta ly wiec spe lnione (Misztal, 2006). W zwiazku z tym, selekcja wspierana markerami, poza nielicznymi wyjat- kami, nie zosta la zaimplementowana w praktyce. Jednym z tych wyjatków by la Francja,

11 1.3 Genomowa selekcja zwierzat 3 gdzie w latach funkcjonowa l program selekcji byd la wspomaganej markerami genetycznymi (Guillaume i wsp., 2008), a drugim - Niemcy (Bennewitz i wsp., 2004). 1.3 Genomowa selekcja zwierzat Dynamicznie rozwijajaca sie technika mikromacierzowa postawi la badaczy przed szansa korzystania z dziesiatek, a nawet setek tysiecy markerów genetycznych. Mikromacierze, zwane także czujnikami lub chipami DNA, zosta ly wprowadzone na rynek w 1996 roku (Friend i Stoughton, 2002). Poczatkowo by ly to chipy z niewielka liczba polimorfizmów pojedynczych nukleotydów (ang. single nucleotide polymorphism, SNP) w technice APEX, opisanej przez Shumaker i wsp. (1996). Na bazie tej techniki powsta la mikromacierz s lużaca genotypowaniu SNP zwiazanych potencjalnie z biosynteza bia lka mleka krowiego, o nazwie MilkProtChip (Kamiński i wsp., 2005). Obecnie dostepne mikromacierze przeznaczone do genotypowania SNP m.in. cz lowieka (mikromacierz o wielkości 2 mln SNP), psa (2 tys. SNP), konia (54 tys. SNP), byd la (777 tys. SNP), owcy (54 tys. SNP) czy świni (62 tys. SNP) (Affymetrix, 2010; Illumina, 2010a,b). Komercjalizacja mikromacierzy bydl ecej rozpocz e la si e w 2005 roku, kiedy to do obrotu rynkowego wprowadzono chip o wielkości 10 tys. SNP (Affymetrix, 2005). W 2008 roku pojawi la si e mikromacierz o wielkości 54 tys. SNP, a dwa lata później - chip pozwalajacy na genotypowanie 777 tys. SNP (Illumina, 2010c,b). Dost epność technik mikromacierzowych skierowa la uwag e badaczy na zupe lnie nowe tory. W 2001 roku, za sprawa Meuwissen i wsp. (2001), miejsce selekcji wspomaganej markerami genetycznymi zaje la selekcja genomowa (ang. genomic selection). Autorzy za lożyli, że poszczególne markery, zgenotypowane dzieki gestej mikromacierzy, znajduja sie blisko QTL i prawdopodobnie sa z nim powiazane. W zwiazku z tym, moga one mieć znaczacy wp lyw na analizowana ceche ilościowa, a pewne segmenty chromosomów z lożone z sasiaduj acych ze soba markerów maja szanse być identyczne przez pochodzenie (ang. identical by descent) oraz zawierać ten sam allel QTL. Należy zatem oszacować efekty ma lych fragmentów chromosomów, reprezentowanych przez pojedyncze markery lub haplotypy, w odniesieniu do badanej cechy ilościowej, czyli przypisać im cz eści wartości hodowlanej. Predyktorem wartości hodowlanej jest wówczas suma wszystkich oszacowanych efektów. Meuwissen i wsp. (2001) wykazali, że zastosowanie g estych map markerów, przy ograniczonej liczbie obserwacji fenotypowych, umożliwia dok ladna predykcje wartości

12 4 Wstep i przeglad piśmiennictwa hodowlanych zwierzat, także tych, których wartości fenotypowe nie by ly znane. Stwierdzili ponadto, iż selekcja zwierzat, bazujaca na wartościach hodowlanych oszacowanych zaproponowana przez nich metoda, może prowadzić do zauważalnego skrócenia odstepu mi edzypokoleniowego. Potencjalne korzyści p lyn ace z zastosowania selekcji genomowej przedstawi l Schaeffer (2006). Wykaza l on, że postep genetyczny selekcjonowanej populacji kanadyjskiego byd la rasy holsztyńskiej b edzie podwojony w porównaniu do selekcji prowadzonej na podstawie wydajności potomstwa. Stwierdzi l ponadto, że zastosowanie selekcji genomowej zmniejszy koszty finansowe o 92% w stosunku do selekcji tradycyjnej. Polemik e na temat selekcji genomowej podj eli także Goddard i Hayes (2007). Przekonywali oni, że metoda ta bedzie mia la znaczacy wp lyw na strukture programów hodowlanych oraz, że poziom skrócenia odstepu miedzypokoleniowego bedzie już jedynie kwestia możliwości technologii reprodukcyjnych. Autorzy wyodrebnili kilka etapów selekcji genomowej. Pierwszy z nich to genotypowanie zwierzat. Nastepnie, na podstawie danych genotypowych i fenotypowych populacji testowej, ma miejsce szacowanie efektów markerów, które po zsumowaniu stanowia predyktor wartości hodowlanej. Otrzymane efekty markerów s luż a potem szacowaniu wartości hodowlanych zwierzat należacych do zbioru walidacyjnego, także tych, których fenotypy nie by ly wcześniej mierzone. Pedersen i wsp. (2008) zainteresowali sie problemem rosnacego w wyniku selekcji inbredu. W przeprowadzonych badaniach symulacyjnych wykazali, że selekcja wspomagana markerami genetycznymi oraz selekcja genomowa wp lywaja zarówno na zinbredowanie szacowane na podstawie informacji rodowodowej, jak i na wspó lczynnik inbredu wyznaczany na podstawie znanych QTL. Badania dotyczy ly nisko odziedziczalnej cechy zdrowotnej zwiazanej z p lci a u byd la mlecznego. Rozważano jeden QTL oraz cztery silnie polimorficzne markery. Autorzy wykazali, że po up lywie dziesieciu lat, selekcja wspomagana markerami genetycznymi doprowadzi do obniżenia inbredu szacowanego na podstawie informacji rodowodowej o 36% oraz inbredu rzeczywistego o 6%, zaś selekcja genomowa, w tym samym czasie, pozwoli na obniżenie inbredu szacowanego o 43% oraz inbredu rzeczywistego o 17%, w stosunku do selekcji prowadzonej na podstawie standardowej metody BLUP. Do analogicznych wniosków, co do kierunku wp lywu selekcji genomowej na inbred, doszli Sonesson i Meuwissen (2009). Przeprowadzili oni badania symulacyjne, które dotyczy ly czterech tysi ecy pokoleń ryb. Wykaza ly one, że selekcja genomowa zredukuje wspó lczynnik inbredu o 81% w porównaniu do selekcji tradycyjnej. Selekcja genomowa byd la mlecznego daje nie tylko możliwość wyboru ojców kolejnego

13 1.4 Selekcja genomowa byd la mlecznego na świecie i w Polsce 5 pokolenia, czyli buhajów. Umożliwia także selekcj e kandydatek na matki buhajów, która obecnie bazuje na informacji rodowodowej oraz ocenie eksterieru lub wydajności dwóch pierwszych laktacji (Murray, 2012). Problem w tym, że pierwsza z wymienionych metod jest niezawodna jedynie w 35%, druga zaś w 54%, ale wymaga wi ekszych nak ladów finansowych i czasu do przeprowadzenia oceny. Zastosowanie selekcji genomowej pozwala podnieść niezawodność oceny do 61% dla ja lówek oraz do 70% dla krów po dwóch pierwszych laktacjach, a także umożliwia wprowadzenie do hodowli nowych rodzin krów, co wp lywa korzystnie na spowolnienie tempa wzrostu inbredu. Wielu badaczy podejmujacych tematyke selekcji genomowej bazuje na danych symulowanych (Meuwissen i wsp., 2001; Kolbehdari i wsp., 2007; Habier i wsp., 2007; Muir, 2007; Solberg i wsp., 2008, 2009; Meuwissen i wsp., 2009; Bennewitz i wsp., 2009; Villumsen i wsp., 2008; Calus i wsp., 2008, 2009; Sonesson i Meuwissen, 2009). Zaleta takiego podejścia jest dobra znajomość struktury zbioru danych oraz, co niezwykle istotne, brak ograniczeń co do wielkości analizowanej populacji. Dane symulowane pozwalaja na testowanie metod statystycznych mogacych mieć zastosowanie w predykcji wartości hodowlanej. Najefektywniejsze z metod moga nastepnie zostać wykorzystane do analizy danych rzeczywistych. W przypadku byd la mlecznego dostepność takich danych jest w wielu przypadkach warunkowana istnieniem ogólnokrajowych lub mi edzynarodowych projektów ewaluacji wartości hodowlanej. 1.4 Selekcja genomowa byd la mlecznego na świecie i w Polsce Selekcja genomowa znalaz la swoje zastosowanie w praktyce, g lównie w odniesieniu do byd la mlecznego. Krajem przodujacym w zastosowaniu markerów genetycznych w selekcji przez wiele lat by la Francja, gdzie po 2000 roku zaczeto wdrażać program selekcji byd la wspomaganej markerami genetycznymi (Krychowski i Journeau, 2009; Boichard i wsp., 2012). Program dotyczy l trzech g lównych ras byd la: rasy holsztyńskiej, normandzkiej oraz montbeliarde. Pierwszy etap badań obejmowa l analiz e 45 markerów mikrosatelitarnych umiejscowionych na chromosomie 14. W czasie siedmiu lat trwania programu zgenotypowano 70 tys. zwierzat. Doświadczenia zdobyte w trakcie tych prac by ly niezwykle pomocne, gdy do praktyki hodowlanej zaczeto wprowadzać selekcje genomowa. Specyfika i zaleta selekcji genomowej funkcjonujacej we Francji jest ścis la i wieloletnia

14 6 Wstep i przeglad piśmiennictwa wspó lpraca ośrodków naukowych i hodowców, umożliwiajaca ciag l a wymiane informacji, genotypowanie dużej liczby osobników oraz ogólny dostep do danych o wartościach użytkowych zwierzat. Finansowania programu badawczego podje ly sie tam ośrodki selekcji zwierzat. W 2007 roku program MAS zosta l wzbogacony o użycie informacji pochodzacej z mikromacierzy o 54 tys. SNP. Jedna z g lównych cech implementacji selekcji genomowej francuskiego byd la by lo użycie haplotypów w miejsce pojedynczych markerów SNP, co mia lo zapewnić maksymalizacje stopnia powiazania użytych markerów z QTL. Haplotypy by ly konstruowane na bazie sasiaduj acych markerów. Efekty poszczególnych haplotypów szacowane by ly za pomoca modelu statystycznego zawierajacego losowe efekty haplotypów oraz losowe resztowe efekty poligeniczne, reprezentujace oko lo 30-40% zmienności genetycznej. Role fenotypów w modelu pe lni ly wartości hodowlane otrzymane droga tradycyjnej oceny. Dla każdej analizowanej cechy oszacowano oko lo 7000 efektów haplotypów. Populacje referencyjna, budowana od 2008 roku, stanowi lo 1800 buhajów rasy montbeliarde, 1400 buhajów rasy normandzkiej oraz 4000 buhajów rasy holsztyńskiej. W wyniku powstania w 2009 roku europejskiego konsorcjum EuroGenomics, w którego sk lad wesz ly Holandia, kraje skandynawskie, Niemcy oraz Francja, populacje referencyjne tych krajów po l aczy ly sie, co da lo buhajów w nowej populacji referencyjnej. W 2011 roku rozpocze ly sie także prace nad selekcja genomowa samic. Program od 2008 obejmowa l genotypowanie oko lo zwierzat miesiecznie, z czego 40-50% stanowi ly kandydatki na matki buhajów. Planuje sie również zwiekszanie populacji referencyjnej o przedstawicieli różnych ras. Obecnie trwa genotypowanie kilkuset buhajów z użyciem mikromacierzy o 777 tys. SNP. Zastosowanie tak g estej mikromacierzy ma s lużyć identyfikacji segmentów chromosomów identycznych przez pochodzenie pomi edzy rasami, by w przysz lości oszacować efekty haplotypów umiejscowionych na tych segmentach. Kolejnym pionierem w praktyce selekcji genomowej jest Holandia, gdzie organizacja hodowlana CRV finansuje badania nad użyciem markerów w selekcji już od 1994 roku, a selekcja genomowa jest stosowana w praktyce od 2006 roku (CRV, 2012). Populacj e referencyjna stanowi ly 1583 buhaje. Dane genotypowe sk lada ly sie z SNP, spośród których zosta lo poddanych analizie. Predykcja wartości hodowlanych oparta zosta la na szacowaniu efektów pojedynczych SNP przy użyciu próbkowania Gibbsa (Meuwissen i Goddard, 2004; Hayes i wsp., 2009). Program ewaluacji wartości hodowlanej korzysta także z populacji referencyjnej zgromadzonej przez EuroGenomics. Selekcja genomowa funkcjonuje także w praktyce w Australii, gdzie analizie podlega lo 798 buhajów rasy australijskiej holsztyńsko-fryzyjskiej urodzonych w latach

15 1.4 Selekcja genomowa byd la mlecznego na świecie i w Polsce 7 (Hayes i wsp., 2009). Dane genotypowe stanowi lo SNP. Podlega ly one redukcji ze wzgledu na procent genotypów brakujacych, frekwencje rzadszego allelu oraz odchylenia od równowagi Hardy ego - Wienberga. Ostatecznie do analizy zakwalifikowano SNP. W pierwszym etapie efekt każdego SNP by l szacowany osobnym modelem, który traktowa l ten efekt jako sta ly i zawiera l losowe efekty poligeniczne. Rol e fenotypów pe lni ly wartości hodowlane otrzymane w tradycyjnej ocenie. Markery o statystycznie istotnym wp lywie na badana ceche uczestniczy ly w drugim etapie analizy, która polega la na predykcji wartości hodowlanych przy jednoczesnym użyciu wszystkich wybranych w poprzednim etapie SNP By ly one traktowane jako efekty losowe w modelu statystycznym zawierajacym także losowe efekty poligeniczne. Populacja referencyjna by la ustawicznie zwiekszana i w 2011 roku stanowi ly ja 2247 buhaje. Podobna do australijskiej metodyka stosowana jest w praktyce selekcji genomowej w Nowej Zelandii. Populacje referencyjna stanowi lo tam 4500 buhajów rasy holsztyńskofryzyjskiej, rasy jersey oraz skrzyżowania tych dwóch ras, urodzonych w latach osiemdziesiatych zesz lego wieku. Na podstawie markerów SNP szacowano wartości hodowlane ze wzgledu na 25 cech (Hayes i wsp., 2009). Selekcja genomowa w Stanach Zjednoczonych Ameryki Pó lnocnej i Kanadzie jest efektem wspó lpracy badaczy z tych państw. Zgenotypowano buhajów i 1472 krowy rasy holsztyńskiej (Schenkel i wsp., 2009). Dane genotypowe każdego osobnika sk lada ly si e z SNP, które przesz ly uprzednio selekcj e ze wzgl edu na frekwencj e rzadszego allelu oraz korelacj e z innymi markerami. Przedmiotem zainteresowania by ly 44 cechy: 5 cech produkcyjnych, 11 cech funkcjonalnych i reprodukcyjnych oraz 28 cech typu. Szacowanie wartości hodowlanych odbywa lo sie za pomoca modelu liniowego, w którym miejsce tradycyjnej macierzy spokrewnień, wyznaczanej na bazie informacji rodowodowej, zaje la macierz spokrewnień powsta la w oparciu o dane genotypowe (Van Raden, 2008). Zmiennymi objaśniajacymi modelu by ly SNP, z za lożeniem takiej samej cześci zmienności genetycznej wyjaśnianej przez poszczególne markery. Procedura wprowadzenia do praktyki selekcji genomowej byd la zosta la także rozpocz eta w Irlandii. W 2007 roku rozpocz eto tam gromadzenie materia lu genetycznego (Berry i Kearney, 2009). Ekstrakcja DNA z 1998 próbek pochodzacych od 1290 buhajów rozpocze la sie w styczniu 2009 roku. Genotypowanie przebiega lo z użyciem Illumina Bovine50 Beadchip. Do analizy w l aczono także materia l genetyczny 158 buhajów nowozelandzkich, których córki sa cześci a populacji byd la w Irlandii. Markery SNP podlega ly selekcji m.in. ze wzgledu na umiejscowienie (do analizy nie wesz ly markery umiejscowione na alloso-

16 8 Wstep i przeglad piśmiennictwa mie), frekwencje rzadszego allelu oraz odchylenie od równowagi Hardy ego - Wienberga. Zbiór danych po redukcji zawiera l informacje genotypowa 1209 buhajów rasy holsztyńskofryzyjskiej. Predykcja wartości hodowlanych, podobnie jak w przypadku amerykańskiej i kanadyjskiej populacji byd la, przebiega la z użyciem modelu liniowego, w którym, zamiast tradycyjnej macierzy spokrewnień, zastosowanie znalaz la macierz spokrewnień zbudowana na podstawie danych genotypowych. Dok ladność wykorzystanej metody weryfikowana by la w oparciu o zbiór danych dotyczacy buhajów posiadajacych co najmniej 40 córek o zmierzonej mleczności. Zbiór testowy stanowi ly 803 buhaje, zbiór walidacyjny buhajów. W kolejnym etapie badań do zbioru testowego trafi ly 945 buhaje posiadajace córki w irlandzkiej populacji byd la i oszacowano wartości hodowlane 246 buhajów nie posiadajacych córek w tej populacji. odbywa sie cztery razy do roku. Ewaluacja wartości hodowlanej byd la w Irlandii Genomowa selekcja byd la wesz la do praktyki także w krajach nordyckich (Lund i Su, 2009). Mia la swój poczatek w analizie zbioru danych, w sk lad którego wesz ly buhaje rasy holsztyńskiej, bed ace cześci a populacji duńskiej i szwedzkiej. Zgenotypowano 2012 buhajów urodzonych w latach oraz pochodzacych ze 125 pó l-rodzin. Genotypowanie przebiega lo z użyciem mikromacierzy o 54 tys. SNP. Markery podlega ly selekcji ze wzgledu na frekwencje rzadszego allelu, odsetek zwierzat zgenotypowanych w danym locus oraz dok ladność genotypowania. Liczba osobników zosta la zredukowana ze wzgledu na odsetek zgenotypowanych loci. Ostatecznie do analizy wesz lo 2012 buhajów z informacja genotypowa z lożona z SNP. Predyktory wartości hodowlanych, bazujace na opisanym zbiorze danych, zosta ly wyznaczone dla 17 cech w 2008 roku. Model predykcji (Janns, 2008) zawiera l zmienne objaśniajace w postaci pojedynczych markerów SNP. Badania prowadzone by ly także dla ras miesnych przy populacji referencyjnej sk ladaj a- cej sie z 821 buhajów rasy duńskiej czerwonej, 2049 buhajów fińskiej rasy ayrshire oraz 1375 buhajów rasy czerwonej szwedzkiej. Pierwsze wyniki predykcji wartości hodowlanej, bazujace na tej populacji, przestawione zosta ly we wrześniu 2010 roku. Kolejnym krajem, w którym dostrzeżono zalety selekcji genomowej, sa Niemcy. Analizowano tam niemieckie byd lo rasy holsztyńskiej. Zbiór danych obejmowa l genotypy oko lo 2500 buhajów urodzonych w latach i 500 krów, zwiazane z realizacja narodowego projektu GenoTrack. Ponadto wykorzystano genotypy oko lo 2500 buhajów urodzonych przed rokiem 1998 i w latach 2003 i Zwierz eta genotypowane by ly przy użyciu Illumina chip Bovine SNP50 BeadChip (Reinhardt i wsp., 2009). Markery genetyczne podlega ly selekcji ze wzgl edu na frekwencj e rzadszego allelu oraz odsetek bra-

17 1.4 Selekcja genomowa byd la mlecznego na świecie i w Polsce 9 kujacych genotypów. W wyniku redukcji pozosta lo SNP. Analizie podlega ly 44 cechy. Rutynowej ewaluacji genomowej, która mia la miejsce w sierpniu 2009 roku, podlega lo 4572 zgenotypowanych buhajów posiadajacych córki o zmierzonych wydajnościach mlecznych. Walidacja systemu ewaluacyjnego przebiega la w oparciu o zbiór danych utworzony przez genotypy 655 buhajów urodzonych w 2004 roku. Efekty SNP szacowane by ly na podstawie 3684 osobników urodzonych przed 2004 rokiem. Model statystyczny, s luż acy predykcji wartości hodowlanych, zawiera l losowe efekty markerów SNP oraz losowe resztowe efekty poligeniczne, na które przypada lo oko lo 1% ca lkowitej zmienności genetycznej cechy. Selekcja genomowa może być także prowadzona w odniesieniu do konkretnej rasy przy wspó lpracy wi ekszej liczby krajów. Tak si e sta lo w przypadku byd la szwajcarskiej rasy brazowej (Zumbach i wsp., 2010). W ramach projektu Intergenomics zainicjowanego przez Europejska Ferderacje Byd la Szwajcarskiej Rasy Brazowej (ang. European Brown Swiss Federation) zgenotypowano 3392 buhaje: 136 z Austrii, 517 z Niemiec, 86 z Francji, 745 z W loch, 188 ze S lowenii, 1091 ze Szwajcarii oraz 629 ze Stanów Zjednoczonych Ameryki Pó lnocnej. Buhaje urodzone by ly w latach Genotypowanie zosta lo przeprowadzone przy zastosowaniu Illumina Bovine SNP50 BeadChip. Selekcja markerów przebieg la z zastosowaniem frekwencji rzadszego allelu, odsetka brakujacych genotypów i zależności pomiedzy markerami. Do analizy wybrano SNP. Predykcji z wykorzystaniem markerów podlega ly wartości hodowlane wydajności bia lka w mleku, wyniku komórek somatycznych oraz wskaźnik niepowtarzalności unasieniania krów. W zbiorze walidacyjnym znalaz ly si e buhaje urodzone po 1999 roku - od 467 do 608 buhajów, w zależności od analizowanej cechy. Program selekcji genomowej w Polsce zosta l powo lany do życia 6. czerwca 2009 roku, wraz z powstaniem konsorcjum MASinBULL (Kamiński, 2012). Poczatkowo w sk lad tego konsorcjum wchodzi ly zespo ly badawcze prof. dra hab. Stanis lawa Kamińskiego z Uniwersytetu Warmińsko-Mazurskiego w Olsztynie, prof. dr hab. Joanny Szydy z Uniwersytetu Przyrodniczego we Wroc lawiu, prof. dra hab. Andrzeja Żarneckiego i prof. dr hab. Ewy S loty z Instytutu Zootechniki w Balicach oraz Stacja Hodowli i Unasieniania Zwierzat Sp. z o.o. w Bydgoszczy, która w ca lości finansowa la realizacje projektu. W 2011 roku do konsorcjum do l aczy lo Ma lopolskie Centrum Biotechniki Sp. z o.o. w Krasnem i przeje lo na siebie cześć kosztów zwiazanych z realizacja projektu. Polska Federacja Hodowców Byd la i Producentów Mleka wesz la w sk lad konsorcjum w styczniu 2012 roku. Poczatkow a populacje referencyjna stanowi lo 1227 buhajów rasy polskiej holsztyńsko-

18 10 Wstep i przeglad piśmiennictwa fryzyzyjskiej urodzonych w latach (Szyda i wsp., 2009), zgenotypowanych za pomoca mikromacierzy Illumina BovineSNP50. Do sierpnia 2011 roku populacja ta zwiekszy la sie do 2531 buhajów. Markery poddane by ly selekcji ze wzgledu na frekwencje rzadszego allelu oraz odsetek brakujacych genotypów. Analizowano 30 cech. W 2011 zespó l prof. dr hab. Joanny Szydy zakończy l opracowywanie modelu statystycznego szacujacego wartości hodowlane, zawierajacego losowe efekty pojedynczych markerów SNP. Zak lada on, że każdy marker wyjaśnia taka sama cześć zmienności genetycznej analizowanej cechy. Wyniki otrzymane w wyniku tych prac, jak i rezultaty prac nad selekcja genomowa w innych krajach zostana przeanalizowane i porównane z efektami badań przeprowadzonych na potrzeby niniejszej dysertacji w rozdziale 5. W ramach polskiego projektu selekcji genomowej zakończono także prace nad przygotowaniem narz edzi niezb ednych do genotypowania krów, co wp lynie na selekcj e matek buhajów oraz dawczyń zarodków. Dla dalszego rozwoju i wzrostu efektywności selekcji genomowej niezwykle istotna jest wspó lpraca pomi edzy poszczególnymi krajami, ośrodkami badawczymi i naukowymi oraz hodowcami. Niektóre kraje dostrzeg ly już t e potrzeb e i w celu m.in. powi ekszania populacji referencyjnych powsta ly konsorcja lub podpisano umowy dwustronne. Przyk ladami sa tutaj wymienione już wcześniej Eurogenomics i Intergenomics. Ścis l a wspó lprac e na tym polu prowadza Stany Zjednoczone Ameryki Pó lnocnej i Kanada, natomiast Irlandia zaproponowa la powstanie konsorcjum IGenoP. W 2011 roku do Eurogenomics do l aczy la Hiszpania. Populacja referencyjna tego konsorcjum w maju 2012 roku liczy la oko lo 22 tys. buhajów (Kamiński, 2012). 26. października 2012 roku w sk lad konsorcjum EuroGenomics wesz la także Polska.

19 1.5 Cel pracy Cel pracy G lównym celem niniejszej pracy by la predykcja genomowej wartości hodowlanej cech produkcyjnych, wybranych cech pokrojowych, reprodukcyjnych i wyniku komórek somatycznych byd la mlecznego w Polsce, w oparciu o dane rzeczywiste, zawierajace genotypy z lożone z tysiecy markerów typu SNP, tworzacych haplotypy. Cel ten zosta l osiagni ety poprzez realizacje nastepuj acych celów szczegó lowych: selekcj e polimorfizmów pojedynczych nukleotydów, wybór bloków powiazanych ze soba markerów SNP, konstrukcj e haplotypów SNP oraz estymacj e ich frekwencji w populacji, testowanie modeli statystycznych ze sta lymi lub losowymi efektami haplotypów oraz wybór modelu liniowego pozwalajacego najdok ladniej oszacować wartość hodowlana, predykcj e wartości hodowlanej na bazie haplotypów SNP.

20 12 Wstep i przeglad piśmiennictwa

21 Rozdzia l 2 Materia l Analizowany zbiór danych obejmuje dane fenotypowe, genotypowe oraz rodowodowe 1216 buhajów rasy polskiej holsztyńsko-fryzyjskiej. Wszystkie brane pod uwage zwierzeta urodzone by ly w latach Rozk lad liczby analizowanych buhajów w zależności od roku ich urodzenia przedstawia rysunek 2.1. Rysunek 2.1: Liczba analizowanych buhajów w zależności od roku ich urodzenia

22 14 Materia l Najliczniejsza grupe analizowanych zwierzat stanowi ly buhaje urodzone w latach (n = 1061). Najwiecej danych pochodzi lo z 2001 (n = 206), a najmniej z 1987 roku (n = 3). Zbiór danych zosta l podzielony na dwa podzbiory. Pierwszy z nich stanowi l zbiór testowy, na podstawie którego wyznaczono estymatory efektów sta lych oraz predyktory efektów losowych modeli statystycznych. Znalaz ly si e w nim 1064 najstarsze osobniki, czyli 80% wszystkich analizowanych buhajów. Drugi zbiór utworzy ly pozosta le 152 osobniki, bed ace zbiorem walidacyjnym. Niniejszy podzia l zosta l dokonany, aby umożliwić sprawdzenie poprawności dzia lania modeli statystycznych przy ograniczonej liczbie danych. Ca ly zbiór danych jest w lasnościa Konsorcjum MASinBULL. 2.1 Dane fenotypowe Badaniem objeto nastepuj ace cechy: wydajność mleczna (WM, ang. milk yield), wydajność t luszczu (WT, ang. fat yield), wydajność bia lka (WB, ang. protein yield), kaliber (STA, ang. stature), nogi i racice (OFL, ang. overall feet and leg score), wi ezad lo środkowe wymienia (USU, ang. udder support), wskaźnik niepowtarzalności unasieniania krów (NRK, ang. non return rate of cows), przestój poporodowy (PRP, ang.rest before pregnancy), odstep miedzyci ażowy (OMC, ang. time between pregnancies), wynik komórek somatycznych (SCS, ang. somatic cell score).

23 2.1 Dane fenotypowe 15 Cechy produkcyjne (WM, WT, WB) zosta ly zmierzone w kilogramach. Cechy pokroju (STA, OFL, USU) objete by ly ocena liniowa wyrażona w przyznanych punktach (od 50 do 100 punktów dla cech kaliber oraz nogi i racice; od 1 do 9 punktów dla cechy wiezad lo środkowe wymienia). Wskaźnik niepowtarzalności unasieniania krów (NRK) wyniós l 1, jeżeli krowa w ciagu 56 dni od pierwszego zabiegu unasieniania nie wykaza la objawów rui i 0, w przeciwnym przypadku. Przestój poporodowy (PRP), określany jako odstep czasu od pierwszego ocielenia do pierwszego zabiegu unasieniania oraz odstep miedzyci ażowy (OMC), czyli czas od ocielenia do ponownego zacielenia, liczone by ly w dniach. Wynik komórek somatycznych powsta l poprzez przekszta lcenie liczby komórek somatycznych (ang. somatic cell count, SCC) nastepuj acym wzorem: SCS = log 2 ( SCC ) + 3. (2.1) Cechy pokroju, p lodności oraz wynik komórek somatycznych zosta ly poddane standaryzacji do średniej 100 i odchylenia standardowego 10. Rol e fenotypów pe lni ly zderegresowane estymatory wartości hodowlanych 1 (ang. deregressed estimated breeding values). Estymatory wartości hodowlanych (ang. estimated breeding values, EBV) otrzymane zosta ly z wykorzystaniem modelu dla próbnych udojów z regresjami losowymi (Strabel i wsp., 2005). Odziedziczalności i komponenty wariancyjne analizowanych cech zosta ly oszacowane w ramach narodowego systemu ewaluacji genetycznej byd la rasy polskiej holsztyńskofryzyjskiej (Interbull, 2012). Ich wartości przedstawia tabela 2.1. Tabela 2.1: Wspó lczynniki odziedziczalności (h 2 ) oraz wariancje genetyczne (σ 2 g) analizowanych cech cecha WM WT WB STA OFL USU NRK PRP OMC SCS [kg] [kg] [kg] [ [ [1-9 [0 lub 1] [dni] [dni] punktów] punktów] punktów] h σg Buhaje zosta ly ocenione na podstawie pomiaru ocenianych cech swoich córek, a nast epnie, przy wykorzystaniu metod statystycznych, wyodr ebnione zosta ly ich wartości hodowlane nie uwzgl edniaj ace już żadnych innych efektów, w tym środowiskowych.

24 16 Materia l Statystyki opisowe analizowanych cech dla wszystkich osobników zawiera tabela 2.2. Tabele 2.3 oraz 2.4 zawieraja odpowiednio statystyki cech dla zbioru testowego oraz dla zbioru walidacyjnego. Tabela 2.2: Statystyki opisowe analizowanych cech (zderegresowane wartości hodowlane) dla pe lnego zbioru danych (n = 1216) cecha WM WT WB STA OFL USU NRK PRP OMC SCS [kg] [kg] [kg] [ [ [1-9 [0 lub 1] [dni] [dni] statystyka punktów] punktów] punktów] średnia mediana odchylenie standardowe wspó lczynnik zmienności [%] minimum maksimum Tabela 2.3: Statystyki opisowe analizowanych cech (zderegresowane wartości hodowlane) dla testowego zbioru danych (n = 1064) cecha WM WT WB STA OFL USU NRK PRP OMC SCS [kg] [kg] [kg] [ [ [1-9 [0 lub 1] [dni] [dni] statystyka punktów] punktów] punktów] średnia mediana odchylenie standardowe wspó lczynnik zmienności [%] minimum maksimum

25 2.2 Dane genotypowe 17 Tabela 2.4: Statystyki opisowe analizowanych cech (zderegresowane wartości hodowlane) dla walidacyjnego zbioru danych (n = 152) cecha WM WT WB STA OFL USU NRK PRP OMC SCS [kg] [kg] [kg] [ [ [1-9 [0 lub 1] [dni] [dni] statystyka punktów] punktów] punktów] średnia mediana odchylenie standardowe wspó lczynnik zmienności [%] minimum maksimum Najwieksz a zmienność we wszystkich trzech zbiorach wykaza ly cechy produkcyjne (WM, WT, WB). Najmniejsza zmiennościa charakteryzuja sie cechy zwiazane pokrojowe (STA, OFL, USU). Wspó lczynnik zmienności cech zwiazanych z p lodnościa (NRK, PRP, OMC) oraz wynik komórek somatycznych (SCS) kszta ltowa ly sie na porównywalnym poziomie. 2.2 Dane genotypowe Dane genotypowe zosta ly otrzymane dzieki technice mikromacierzowej przy użyciu Illumina BovineSNP50 BeadChip na Uniwersytecie Warmińsko - Mazurskim w Olsztynie. Wykorzystanie mikromacierzy umożliwia analize poliformizmów pojedynczych nukleotydów dla każdego osobnika. Zbiór ten zosta l poddany selekcji, której kryteria opisane zosta ly w rozdziale trzecim niniejszej pracy. Wyniki selekcji zawiera rozdzia l czwarty.

26 18 Materia l

27 Rozdzia l 3 Metody Praca nad otrzymaniem wyników prezentowanych w niniejszej dysertacji sk lada la si e z trzech g lównych etapów: selekcja polimorfizmów pojedynczych nukleotydów oraz wybór bloków powiazanych ze soba markerów SNP, konstrukcja haplotypów SNP oraz estymacja ich frekwencji w analizowanej populacji, predykcja wartości hodowlanej na bazie haplotypów SNP oraz porównanie wykorzystanych modeli predykcji. 3.1 Selekcja polimorfizmów pojedynczych nukleotydów oraz wybór bloków powiazanych ze soba markerów SNP Odsetek brakujacych genotypów oraz frekwencja rzadszego allelu Pierwszym krokiem w selekcji SNP by lo usuni ecie ze zbioru tych markerów, dla których dane brakujace stanowi ly wiecej, niż 10% ca lości (GENO < 0.1). Nastepnie wykorzystane zosta lo kryterium frekwencji rzadszego allelu markera (ang. minor allel frequency, MAF). Rozważane by ly dwie wartości graniczne: 1% oraz 5%. W wyniku tej selekcji powsta ly wi ec dwa podzbiory danych: pierwszy z MAF > 0.01 oraz drugi z MAF > 0.05.

28 20 Metody Nierównowaga sprz eżeń Na bazie powsta lych w poprzednim kroku selekcji podzbiorów danych, wybierane by ly bloki powiazanych ze soba markerów SNP. Miara zależności markerów jest nierównowaga sprzeżeń (ang. linkage disequilibrium, LD). Jest ona wyrażana za pomoca trzech wskaźników: D, D oraz r 2. Dla nierównowagi sprzeżeń wyznaczanej dla pary markerów A i B dane sa one wzorami 3.1, 3.2 oraz 3.4. D = frek (A1B1) frek (A2B2) frek (A1B2) frek (A2B1), (3.1) gdzie frek (A1B1) jest czestości a wystepowania allelu recesywnego jednocześnie w markerze A i w markerze B. Pozosta le sk ladowe wzoru 3.1 interpretuje sie analogicznie. gdzie D = D D max, (3.2) D max = { min [frek (A1) frek (B2), frek (1 frek (A2)) (1 frek (B1))] dla D > 0 min [frek (A1) (1 frek (B1)), (1 frek (A2)) frek (B2)] dla D < 0, (3.3) gdzie frek (A1) jest frekwencja allelu recesywnego w markerze A. Pozosta le sk ladowe wzoru 3.3 interpretuje sie analogicznie. r 2 = D 2 frek (A1) frek (A2) frek (B1) frek (B2), (3.4) gdzie sk ladowe wzoru interpretuje si e analogicznie, jak we wzorze 3.3. Do wykonanych analiz wykorzystany zosta l wskaźnik r 2. Jego przedzia l wartości to [0, 1]. Wartość r 2 = 0 oznacza brak zależności pomi edzy markerami, czyli równowag e sprz eżeń (ang. linkage equilibrium, LE). Jeżeli r 2 = 1, to mówi si e o ścis lej zależności pomi edzy markerami, czyli nierównowadze sprz eżeń. Celem tego etapu selekcji danych by lo wyodrebnienie bloków SNP, które sa zależne. Wybrane zosta ly dwie wartości graniczne: r oraz r W obrebie każdego chromosomu obliczone zosta ly wskaźniki r 2 dla każdej z par markerów SNP. Markery wykazujace zależność zosta ly po l aczone w bloki. Metoda taka gwarantuje ma l a zależność, lub jej brak, dla markerów SNP znajdujacych sie w różnych blokach. Jest to jej poważna

29 3.2 Konstrukcja haplotypów SNP oraz estymacja ich frekwencji 21 zaleta, ponieważ haplotypy skonstruowane na bazie wyodrebnionych bloków pe lni ly role zmiennych objaśniajacych w modelach liniowych, a jedna z podstaw poprawności modelu liniowego jest niezależność zmiennych objaśniajacych. Podsumowujac efekty dotychczas opisanych kroków selekcji, powsta ly cztery podzbiory danych, spe lniaj ace nastepuj ace kryteria: MAF > 0.01 oraz r 2 0.8, MAF > 0.01 oraz r 2 0.9, MAF > 0.05 oraz r 2 0.8, MAF > 0.05 oraz r Przedstawione etapy selekcji zosta ly przeprowadzone z wykorzystaniem programu PLINK (Purcell i wsp., 2007; Purcel, 2010). Ze wzgledu na najwieksz a różnorodność wielkości bloków markerów SNP (tabele ), do dalszej analizy zosta l wybrany pierwszy z wymienionych podzbiorów, spe lniaj acy kryteria MAF > 0.01 oraz r Konstrukcja haplotypów SNP oraz estymacja ich frekwencji Wyodrebnione bloki powiazanych markerów SNP stanowi ly baze do konstrukcji haplotypów SNP. Ten etap pracy, wraz z estymacja frekwencji haplotypów w populacji, zosta l zrealizowany przy użyciu programu PHASE (Stephens i wsp., 2001). Spośród wszystkich skonstruowanych haplotypów do dalszej analizy wybrane zosta ly te, których estymatory frekwencji przekroczy ly 25%. Tak wyznaczona wartość graniczna jest konsekwencja dwóch czynników. Po pierwsze, znajomość wielkości wp lywu haplotypu o niskiej frekwencji na wartość hodowlana jest ma lo informatywna. Po drugie, przy ograniczonej liczbie obserwacji zmiennej objaśnianej w modelu liniowym, należy dażyć do jak najmniejszej liczby zmiennych objaśniajacych.

30 22 Metody 3.3 Predykcja wartości hodowlanej na bazie haplotypów SNP Predykcja wartości hodowlanej zosta la przeprowadzona z wykorzystaniem jedenastu modeli statystycznych dla każdej z analizowanych cech, co daje l acznie 110 analiz Model ze sta lymi efektami haplotypów SNP Model ze sta lymi efektami haplotypów SNP mia l postać zapisana nastepuj acym wzorem. gdzie: y jest zderegresowana wartościa hodowlana, µ jest średnia wartościa cechy w populacji, y = µ + Xh + ɛ, (3.5) X jest macierza wystapień sta lych efektów haplotypów SNP, h jest wektorem sta lych efektów haplotypów SNP, ɛ jest wektorem b l edów losowych modelu ɛ N (0, σ 2 e), σe 2 jest wariancja b l edu. Model zdefiniowany wzorem 3.5 zosta l zaimplementowany w dwojaki sposób (z różnymi macierzami wystapień sta lych efektów haplotypów). Pierwsza implementacja nastapi la przy użyciu macierzy wystapień X zawierajacej prawdopodobieństwa przekazania przez konkretnego buhaja danego haplotypu (model 1). Druga implementacja obejmowa la wykorzystanie macierzy wystapień X sk ladaj acej sie wy l acznie z jedynek, w przypadku pojawienia sie u konkretnego buhaja danego haplotypu, oraz z zer, w przeciwnym przypadku (model 2). Bezpośrednia wartość hodowlana (ang. direct breeding value, DGV) i-tego osobnika wyznaczana by la w nastepuj acy sposób: DGV i = i X ih i.

31 3.3 Predykcja wartości hodowlanej na bazie haplotypów SNP Model z losowymi efektami haplotypów SNP Model z losowymi efektami haplotypów SNP mia l postać zapisana nastepuj acym wzorem. i równomiernie roz lożona wariancja genetyczna gdzie: y = µ + Zh + ɛ, (3.6) Z jest macierza wystapień losowych efektów haplotypów SNP, h jest wektorem losowych efektów haplotypów SNP, h N ( 0, σ 2 g/liczba haplotypów ), σg 2 jest wariancja genetyczna cechy. Pozosta le sk ladowe modelu określone by ly jak we wzorze 3.5. Również w tym przypadku, model by l implementowany w dwojaki sposób. Pierwsza implementacja nastapi la z wykorzystaniem macierzy wystapień Z zawierajacej prawdopodobieństwa przekazania przez konkretnego buhaja danego haplotypu (model 3). Druga implementacja obejmowa la użycie macierzy wystapień Z sk ladaj acej sie wy l acznie z jedynek, w przypadku pojawienia sie u konkretnego buhaja danego haplotypu, oraz z zer, w przeciwnym przypadku (model 4). W obydwu tych modelach (model 3 i model 4) wariancja genetyczna jest podzielona po równo na wszystkie haplotypy, bez wzgl edu na ich d lugość. Bezpośrednia wartość hodowlana i-tego osobnika wyznaczana by la w nastepuj acy sposób: DGV i = i Z ih i Model z losowymi efektami haplotypów SNP Model z losowymi efektami haplotypów SNP mia l postać zapisana nastepuj acym wzorem. i nierównomiernie roz lożona wariancja genetyczna y = µ + Zh + ɛ, (3.7) gdzie h jest wektorem losowych efektów haplotypów SNP, h N ( ) 0, σg 2. wielkość haplotypu liczba alleli Pozosta le sk ladowe modelu zdefiniowane by ly jak we wzorze 3.6. Na bazie wzoru 3.7,

32 24 Metody w sposób analogiczny, jak w przypadku modeli danych wzorami 3.5 oraz 3.6, także powsta ly dwa modele: model 5 oraz model 6. W tym uj eciu wariancja genetyczna zosta la podzielona na poszczególne haplotypy zależnie od wielkości haplotypu. Im wi ecej pojedynczych markerów zawiera l w swej strukturze haplotyp, tym wi eksza cz eść wariancji genetycznej by la mu przyporzadkowana. Bezpośrednia wartość hodowlana i-tego osobnika wyznaczana by la w nastepuj acy sposób: DGV i = i Z ih i Model ze sta lymi efektami haplotypów SNP oraz losowymi addytywnymi efektami poligenicznymi Model ze sta lymi efektami haplotypów SNP oraz losowymi addytywnymi efektami poligenicznymi mia l nastepuj ac a postać. gdzie: y jest zderegresowana wartościa hodowlana, µ jest średnia wartościa cechy w populacji, y = µ + Xh + Zg + ɛ, (3.8) X jest macierza wystapień sta lych efektów haplotypów SNP, h jest wektorem sta lych efektów haplotypów SNP, Z jest macierza wystapień losowych addytywnych efektów poligenicznych, g jest wektorem losowych addytywnych efektów poligenicznych, g N ( 0, A σ 2 g), A jest macierza spokrewnień buhajów, σg 2 jest wariancja genetyczna cechy, ɛ jest wektorem b l edów losowych modelu ɛ N (0, σ 2 e), σe 2 jest wariancja b l edu.

33 3.3 Predykcja wartości hodowlanej na bazie haplotypów SNP 25 Model zapisany wzorem 3.8 także by l wykorzystywany w dwóch uj eciach, analogicznych do modeli 3.5, 3.6, 3.7. Pierwsze ujecie uwzglednia lo macierz wystapień efektów sta- lych haplotypów X z prawdopodobieństwami przekazania danego haplotypu przez buhaja (model 7). Drugie ujecie polega lo na zastosowaniu macierzy wystapień X wype lnionej jedynkami w przypadku pojawienia sie danego haplotypu u buhaja i zerami w przeciwnym przypadku (model 8). Bezpośrednia wartość hodowlana i-tego osobnika wyznaczana by la w nastepuj acy sposób: DGV i = i X ih i. Przy użyciu modelu danego wzorem 3.8 przeprowadzono także analiz e, która polega la na estymacji sta lych efektów haplotypów dla każdego chromosomu osobno (Żukowski, 2011). Przeprowadzono 29 analiz (chromosom p lci X nie by l brany pod uwag e) przy za lożeniu, że addytywne efekty poligeniczne sa losowe oraz ich wariancja równa jest 28/29 σg, 2 czyli reprezentuje zmienność pozosta lych 28 chromosomów. Za predyktor wartości hodowlanej j -tego osobnika uznawano sume efektów haplotypów otrzymanych droga estymacji z użyciem wszystkich 29 modeli: DGV i = i j X ijh ij, gdzie i = 1, 2,..., 29. Podejście to zosta lo zrealizowane także z wykorzystaniem macierzy wystapień X z prawdopodobieństwami przekazania haplotypów (model 9) oraz przy użyciu macierzy wysta- pień X zawierajacej jedynki (jeżeli haplotyp wystapi l u buhaja) i zera (jeżeli haplotyp nie wystapi l u buhaja) (model 10) Model z losowymi addytywnymi efektami poligenicznymi Kolejny analizowany model jest to model osobniczy postaci: y = µ + Zg + ɛ, (3.9) gdzie jego sk ladowe zdefiniowane by ly jak w modelu 3.8. W modelu tym nie wystepuj a efekty haplotypów i by l on wykorzystywany tylko raz dla każdej z analizowanych cech (model 11). Bezpośrednia wartość hodowlana i-tego osobnika wyznaczana by la w nastepuj acy sposób: DGV i = g i.

34 26 Metody 3.4 Porównanie wykorzystanych modeli predykcji Porównanie metod predykcji uwzgl ednia lo dwa ważne aspekty. Po pierwsze, modele zawierajace w swej strukturze wektory efektów haplotypów zosta ly porównane pod wzgle- dem wielkości tych efektów i umiejscowienia na chromosomach haplotypów o efektach najbardziej znaczacych. Po drugie, modele zosta ly porównane ze wzgledu na dok ladność predykcji wartości hodowlanej. Istotność różnic pomi edzy estymatorami i predyktorami efektów haplotypów zosta la zweryfikowana testem Kruskala-Wallisa przy hipotezie zerowej H 0 :postać zastosowanego modelu predykcji nie wp lywa na rozk lad efektów haplotypów oraz testem Wilcoxona przy hipotezie zerowej H 0 :postać macierzy wystapień w modelu predykcji nie wp lywa na rozk lad efektów haplotypów. Ponadto, wykonano analize korelacji rangowej efektów haplotypów w celu sprawdzenia, czy ranking tych efektów utworzony ze wzgl edu na wielkość ich wp lywu na fenotyp jest porównywalny dla poszczególnych metod predykcji. Wykonano także testy istotności wspó lczynników korelacji rangowej. Dok ladność predykcji wartości hodowlanej zosta la zweryfikowana przy użyciu trzech metod. Weryfikacji poddano testowy oraz walidacyjny zbiór danych. Pierwsza z metod by la korelacja liniowa Pearsona pomiedzy EBV oraz DGV. Pozwoli la ona zbadać, czy istnieje liniowa zależność pomiedzy zmienna EBV a zmienna DGV. Im wartość wspó lczynnika korelacji liniowej bliższa jest 1, tym silniejsza zależność pomiedzy EBV a DGV, a tym samym wyższa dok ladność predykcji. Druga wykorzystana metoda porównawcza by la korelacja rangowa Spearmana, która także bada zależność zmiennych, ale nie musi to być zależność liniowa. Wspó lczynnik korelacji rangowej Spearmana interpretuje si e jako wspó lczynnik korelacji Pearsona rang analizowanych zmiennych. W odniesieniu do weryfikacji dok ladności predykcji wartości hodowlanej jest on zatem sprawdzeniem, czy ranking buhajów powsta ly ze wzgl edu na EBV jest tożsamy z rankingiem powsta lym ze wzgledu na DGV. Ostatnia metoda porównawcza stanowi l wspó lczynnik regresji, który określa si l e i kierunek wp lywu zmiennej objaśniajacej, czyli DGV, na zmienna objaśniana, czyli EBV. Pożadanym by lo, aby wielkość wspó lczynnika by la jak najbliższa wartości 1, ponieważ wówczas wartość DGV jest najbliższa wartości EBV oraz estymator wartości hodowlanej jest najmniej obciażony (Meuwissen i wsp., 2001). Wspó lczynniki korelacji oraz wspó lczynnik regresji zosta ly zweryfikowane pod wzgledem istotności statystycznej przy hipotezie zerowej H 0 : wspó lczynnik korelacji (wspó lczynnik regresji) jest równy zero.

35 Rozdzia l 4 Wyniki 4.1 Selekcja SNP Najwi eksza liczba markerów by la dost epna na chromosomie pierwszym, a najmniejsza na chromosomie p lci X. Chromosomem autosomalnym o najmniejszej liczbie markerów by l chromosom 28. Rezultaty redukcji liczby markerów z wykorzystaniem kryterium odsetka brakujacych genotypów (GENO), czestości wystepowania rzadszego allelu (MAF) oraz nierównowagi sprzeżeń (r 2 ) zawiera tabela 4.1. Najmniejsza redukcje otrzymano dla pierwszego z zastosowanych kryteriów. Wartość graniczna MAF = 0.05 czyni la to kryterium ostrzejszym, niż w przypadku MAF = 0.01, stad wieksza redukcja danych w pierwszym przypadku. Najbardziej znaczaco na stopień selekcji SNP wp lyn e lo ostatnie z rozważanych kryteriów (LD). Wynika to z wysokich za lożonych wartości granicznych 0.8 oraz 0.9. Jako, że miara nierównowagi sprz eżeń r 2 by la wyznaczana dla każdej pary markerów, to do zbiorów markerów spe lniaj acych kryteria MAF i LD przyporzadkowane zosta ly wszystkie te SNP, które pozostawa ly w nierównowadze sprzeżeń na zadanym poziomie (przynajmniej 0.8 lub przynajmniej 0.9) z przynajmniej jednym markerem z tego zbioru. Rysunek 4.1 ilustruje procentowy udzia l markerów spe lniaj acych kryterium MAF o za- lożonych wartościach granicznych w ca lym zbiorze danych. Widać, że najwieksz a redukcje danych przy obydwu wartościach granicznych osiagni eto dla allosomu. Wśród autosomów najwieksza redukcja liczby markerów nastapi la na chromosomu 13 i 21 przy MAF > 0.01 oraz dla chromosomu 7 i 16 przy MAF > Niewielki stopień selekcji zosta l uzyskany dla chromosomu 20 przy MAF > 0.01 oraz dla chromosomu 28 przy MAF > 0.05.

36 28 Wyniki Tabela 4.1: Redukcja liczby markerów ze wzgl edu na kryterium MAF oraz LD dla poszczególnych chromosomów liczba markerów spe lniajacych kryterium wszystkie GENO<0.1 MAF>0.01 MAF>0.05 MAF>0.01 MAF>0.01 MAF>0.05 MAF>0.05 chromosom markery r r r r

37 4.1 Selekcja SNP 29 Rysunek 4.1: Odsetek markerów spe lniaj acych zadane kryteria MAF dla poszczególnych chromosomów Rysunek 4.2 przedstawia efekty selekcji danych przy użyciu kryteriów MAF i LD w postaci procentowego udzia lu w ca lym zbiorze danych markerów spe lniaj acych te kryteria. Ponownie najwieksza redukcja danych nastapi la dla chromosomu p lciowego. Wśród autosomów najostrzejsza selekcja danych, pod wzgledem wszystkich wartości granicznych, wystapi la w przypadku chromosomu 28. Ogólna tendencja w redukcji liczby markerów by la nastepuj aca: najmniejsza liczba odrzuconych SNP przy MAF > 0.01 i r 2 0.8, nastepnie MAF > 0.05 i r 2 0.8, potem MAF > 0.01 i r i najwieksza redukcja dla MAF > 0.05 i r Inaczej by lo w przypadku chromosomów: 23, 24 i 26. Tutaj selekcja przy MAF > 0.05 i r by la ostrzejsza, niż przy MAF > 0.01 i r Dla tych samych trzech chromosomów pojawi la si e także duża różnica w stopniu redukcji liczby markerów przy MAF > 0.01 i r oraz MAF > 0.01 i r 2 0.9, w porównaniu do pozosta lych chromosomów - znacznie wi ecej SNP spe lnia lo zadane kryteria. Dla tych trzech wyjatków silniejszym okaza lo sie być kryterium MAF.

38 30 Wyniki Rysunek 4.2: Odsetek markerów spe lniajacych zadane kryteria MAF oraz LD dla poszczególnych chromosomów Podstawowe statystyki opisowe wartości MAF przedstawione zosta ly w tabeli 4.2. Średnia wartość MAF w zbiorze markerów z frekwencja rzadszego allelu przekraczajac a 1% waha la sie w granicach od (chromosom 9) do (chromosom 25). Nieco wyższe wartości osiagn e la średnia wartość MAF w podzbiorze markerów z frekwencja rzadszego allelu przekraczajac a 5% - od (chromosom 26) do (chromosom 14). Wartości mediany należa ly do przedzia lu od (chromosom 26) do (chromosom 25) dla zbioru z MAF > 0.01 oraz do przedzia lu od (chromosom 26) do (chromosom 14) dla zbioru z MAF > Średnia i mediana kszta ltowa ly si e wi ec na podobnym poziomie, co wskazuje na symetryczność rozk ladu wartości MAF w obydwu podzbiorach. Podniesienie wartości granicznej MAF skutkowa lo także niewielkim obniżeniem wartości odchylenia standardowego, a co za tym idzie, spadkiem wartości wspó lczynnika zmienności.

39 4.1 Selekcja SNP 31 Tabela 4.2: Średnia arytmetyczna, mediana, odchylenie standardowe oraz wspó lczynnik zmienności wartości MAF dla poszczególnych chromosomów we wskazanych podzbiorach markerów chromosom podzbiór średnia mediana odchylenie wspó lczynnik markerów arytmetyczna standardowe zmienności 1 MAF> % MAF> % 2 MAF> % MAF> % 3 MAF> % MAF> % 4 MAF> % MAF> % 5 MAF> % MAF> % 6 MAF> % MAF> % 7 MAF> % MAF> % 8 MAF> % MAF> % 9 MAF> % MAF> % 10 MAF> % MAF> % 11 MAF> % MAF> % 12 MAF> % MAF> % 13 MAF> % MAF> % 14 MAF> % MAF> % 15 MAF> % MAF> % 16 MAF> % MAF> % 17 MAF> % MAF> % 18 MAF> % MAF> % 19 MAF> % MAF> % 20 MAF> % MAF> % 21 MAF> % MAF> % 22 MAF> % MAF> %

40 32 Wyniki 23 MAF> % MAF> % 24 MAF> % MAF> % 25 MAF> % MAF> % 26 MAF> % MAF> % 27 MAF> % MAF> % 28 MAF> % MAF> % 29 MAF> % MAF> % 30 MAF> % MAF> % Tabela 4.3 zawiera podstawowe statystyki opisowe miary r 2 w sześciu podzbiorach. Pierwsze dwa podzbiory by ly wynikiem zastosowania kryterium MAF (MAF > 0.01 i MAF > 0.05). Pozosta le podzbiory by ly konsekwencja dzia lania kryteriów MAF i LD. Średnie wartości miary r 2 w podzbiorach z MAF > 0.01 i MAF > 0.05 kszta ltowa ly sie na podobnym poziomie (od wartości dla chromosomu 1 do wartości dla chromosomu 26 w podzbiorze z MAF > 0.01 oraz od wartości dla allosomu i dla chromosomu 1 do wartości dla chromosomu 20 w podzbiorze z MAF > 0.05), z wyjatkiem chromosomów: 27, 28, 29 i chromosomu p lci przy MAF > 0.01, gdzie wartość średnia analizowanej miary wynios la oko lo 0.4. Powodem tego faktu by ly markery o niskim poziomie MAF (mniejszym niż 1%), ale znajdujace sie w nierównowadze sprze- żeń, które po zastosowaniu wartości granicznej MAF > 0.01 do redukcji liczby markerów, zosta ly usuni ete z dalszej analizy. Zastosowanie kryterium LD (r i r 2 0.9), zgodnie z oczekiwaniami, wp lyn e lo na podniesienie si e średniej wartości oraz mediany miary r 2 (powyżej wartości 0.9) oraz na zredukowanie zmienności tej miary (wspó lczynnik zmienności z kilkuset lub kilkudziesi eciu procent spada l do wartości kilku procent). Należy także zwrócić uwag e, iż zmienność miary r 2 przy wartości granicznej 0.8 by la oko lo dwukrotnie wi eksza, niż w przypadku wartości granicznej równej 0.9.

41 4.1 Selekcja SNP 33 Tabela 4.3: Średnia arytmetyczna, mediana, odchylenie standardowe oraz wspó lczynnik zmienności wartości r 2 dla poszczególnych chromosomów we wskazanych podzbiorach markerów chromosom podzbiór średnia mediana odchylenie wspó lczynnik markerów arytmetyczna standardowe zmienności 1 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 2 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 3 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 4 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 5 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 6 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 7 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r %

42 34 Wyniki 8 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 9 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 10 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 11 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 12 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 13 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 14 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 15 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r %

43 4.1 Selekcja SNP MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 17 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 18 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 19 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 20 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 21 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 22 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 23 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r %

44 36 Wyniki 24 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 25 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 26 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 27 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 28 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 29 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r % 30 MAF> % MAF> % MAF>0.01, r % MAF>0.01, r % MAF>0.05, r % MAF>0.05, r %

45 4.2 Wyodr ebnienie bloków SNP Wyodr ebnienie bloków SNP W obr ebie każdego chromosomu obliczone zosta ly wskaźniki r 2 dla każdej z par markerów SNP. Markery wykazujace zależność (r albo r 2 0.9) zosta ly po l aczone w bloki. Wyróżnione zosta ly dwa rodzaje bloków: pe lne i niepe lne. Za blok pe lny uznany zosta l taki, w którym wszystkie pary markerów by ly ze soba powiazane przynajmniej na zadanym poziomie. Blok niepe lny by l to taki, w którym marker by l powiazany przynajmniej na zadanym poziomie z co najmniej jednym markerem należacym do tego samego bloku. Przyk lad bloku pe lnego przedstawiony zosta l na rysunku 4.3, wykonanym w programie HaploView (Barrett i wsp., 2005). Kolor czerwony oznacza na nim silne powiazanie pomiedzy markerami. Naniesione na rysunku liczby sa wartościami miary r 2 pomnożonymi przez sto. Brak liczby w komórce oznacza doskona l a nierównowage sprzeżeń (r 2 = 1). Wartości miary r 2 pomiedzy konkretnymi markerami odczytuje sie w komórce znajdujacej sie na przecieciu linii prowadzonych od numerów tych markerów do wierzcho lka trójkata utworzonego przez komórki. Rysunek dotyczy bloku sześciu markerów zlokalizowanych na chromosomie 14. Rysunek 4.3: Przyk lad pe lnego bloku SNP (chromosom 14)

46 38 Wyniki Rysunek 4.4: Przyk lad niepe lnego bloku SNP (chromosom 14) Na rysunku 4.4 pokazany zosta l przyk lad bloku niepe lnego, z lożonego z dziesi eciu markerów zlokalizowanych także na chromosomie 14. Kolor czerwony oznacza silne powiazanie pomiedzy markerami. Im kolor bliższy żó ltemu, tym mniejsza wartość miary r 2 (najmniejsza wartość pomiedzy markerami 2 i 5 równa 0.7). Widoczne sa mocno i s labiej powiazane grupy markerów. Miara r 2 dla markerów 1, 2, 3 i 4 przekracza poziom 0.8, ale marker 5 z markerami 1, 2 i 3 nie jest już tak silnie zwiazany. Jest on natomiast zależny od markera 4, który już jest w zależności z pierwszymi trzema markerami. Analogicznie powsta l ca ly przedstawiony na rysunku niepe lny blok. Tabela 4.4 przedstawia ilość bloków SNP wed lug ich wielkości (liczby sk ladaj acych sie na nie SNP) w każdym z analizowanych podzbiorów danych. Najwiecej, bo 3718 bloków SNP powsta lo dla podzbioru markerów spe lniaj acych kryteria MAF > 0.01 i r Najmniej liczna grupa bloków SNP (2387 bloków) powsta la dla podzbioru markerów

47 4.2 Wyodr ebnienie bloków SNP 39 spe lniaj acych kryteria MAF > 0.05 i r Kryterium LD okaza lo sie być silniejszym pod wzgledem wp lywu na liczbe bloków, ponieważ zaostrzenie go wp lywa lo na spadek tej liczby wyraźniej, niż zaostrzenie kryterium MAF. Najliczniejsza grupa bloków we wszystkich podzbiorach by ly bloki z lożone z dwóch markerów. Bloki SNP zawierajace od 2 do 9 markerów pojawi ly sie w każdym z podzbiorów danych. Najwiekszy powsta ly blok sk lada l sie z 43 markerów i pojawi l sie w podzbiorze zawierajacym SNP spe lniaj ace kryteria MAF > 0.01 i r Podzbiór ten by l także unikatowy pod wzgledem pojawienia sie w nim bloku o wielkości 13, 15, 16, 17, 28 i 36 markerów. Blok o wielkości 21 SNP pojawi l si e w obydwu podzbiorach z MAF > 0.01, przy czym w zbiorze z r by l to blok najwi ekszy. Podzbiór z MAF > 0.05 i r maksimum wielkości bloku SNP osiagn a l w liczbie 11, a podzbiór z MAF > 0.05 i r w liczbie 9. Otrzymany rozk lad wielkości bloków SNP by l konsekwencja selekcji liczby markerów za pomoca przyjetych kryteriów oraz redukcja liczby powiazań pomiedzy markerami wraz ze wzrostem wartości granicznej miary LD. Tabela 4.4: Ilość bloków SNP wed lug zawartej w nich liczby markerów we wskazanych podzbiorach markerów liczba markerów podzbiór danych w bloku MAF>0.01, r MAF>0.01, r MAF>0.05, r MAF>0.05, r SUMA

48 40 Wyniki Tabele 4.5, 4.6, 4.7 oraz 4.8 zawieraja liczby bloków wed lug ich wielkości dla poszczególnych chromosomów w podzbiorach, odpowiednio: MAF > 0.01 i r 2 0.8, MAF > 0.01 i r 2 0.9, MAF > 0.05 i r oraz MAF > 0.05 i r W pierwszym z rozpatrywanych podzbiorów najwi ecej bloków SNP zosta lo wyodr ebnionych dla chromosomu 1 (272, w tym 11 bloków niepe lnych), a najmniej dla allosomu (25, w tym 2 niepe lne) oraz dla chromosomu 28 (40, w tym 2 niepe lne). Dla wszystkich chromosomów najliczniejsza grupa bloków stanowi ly te o wielkości 2 SNP. Druga co do liczebności grupa by ly bloki zawierajace 3 markery. Najwieksze bloki, zawierajace 13, 15, 16, 17, 21, 28, 36 i 43 SNP, pojawi ly sie na chromosomach 23, 24 i 26. Na tych samych trzech chromosomach odnotowano najwi ecej bloków niepe lnych (odpowiednio: 41, 38 i 32). W podzbiorze z markerami spe lniaj acymi kryteria MAF > 0.01 i r najwiecej bloków SNP zlokalizowano także na chromosomie 1 (202, w tym 2 niepe lne). Dla chromosomu p lci i dla chromosomu 28 odnotowano najmniejsze liczby bloków (odpowiednio 13, w tym 1 niepe lny oraz 28, w tym 1 niepe lny). Tutaj także najwi eksze bloki SNP i najwi ecej bloków niepe lnych pojawi lo si e na chromosomach 23, 24 i 26. W podzbiorze markerów spe lniaj acych kryteria MAF > 0.05 i r również najwie- cej bloków SNP pojawi lo sie na chromosomie 1 (255, w tym 11 niepe lnych), a najmniej dla allosomu (25, w tym 2 niepe lne) oraz dla chromosomu 28 (37, w tym 2 niepe lne). Chromosom 1 charakteryzowa l sie najwieksz a liczba bloków niepe lnych. Podzbiór ten, w stosunku do dwóch poprzednich, charakteryzowa l sie mniejszymi blokami SNP. Najwiekszy blok, zawierajacy 11 markerów, zlokalizowany by l na chromosomie 13. Markery spe lniaj ace kryteria MAF > 0.05 i r tworzy ly podzbiór, w którym najwiecej bloków SNP zlokalizowanych by lo także na chromosomie 1 (188, w tym 2 niepe lne), a najmniej na chromosomie p lci (13, w tym 1 niepe lny) oraz na chromosomie 28 (25, w tym 1 niepe lny). Najwi ecej bloków niepe lnych (w liczbie 5) pojawi lo si e na chromosomach 4, 9 i 14. Najwi ekszym blokiem w tym podzbiorze by l blok z lożony z 9 SNP. Znalaz l si e on chromosomie 13. We wszystkich czterech analizowanych podzbiorach widać wyraźnie, że wzrost wartości granicznej miary MAF z poziomu 0.01 do poziomu 0.05 skutkowa l zmniejszeniem si e wielkości bloków w przypadku chromosomów 23, 24 i 26, co potwierdza wniosek nasuwajacy si e po analizie rysunku 4.2.

49 Tabela 4.5: Liczba bloków markerów z MAF > 0.01 oraz r wed lug ich wielkości dla poszczególnych chromosomów wielkość chromosom bloku wszystkie 272 (11) (10) 192 (11) 179 (11) 138 (9) 194 (9) 178 (9) 197 (10) 122 (3) 146 (6) 149 (7) 93 (5) 114 (7) 143 (10) 104 (2) 2-SNP SNP 45 (4) 35 (5) 39 (6) 21 (4) 23 (7) 26 (5) 30 (6) 33 (5) 22 (1) 20 (3) 26 (6) 15 (2) 21 (3) 21 (4) 13 (2) 4-SNP 11 (3) 4 (1) 5 (3) 8 (3) 4 (1) 13 (3) 6 (1) 11 (4) 3 (1) 7 (1) 1 5 (2) 3 (1) 6 (3) 1 5-SNP 6 (3) 2 (2) 4 (2) 2 4 (1) 3 2 (1) 3 (1) - 4 (2) 2 (1) (1) 1 6-SNP 2 3 (2) (1) (1) - 2 (1) - 7-SNP (1) (1) (1) SNP (1) (1) SNP (1) SNP (1) (1) - 11-SNP (1) - - wielkość chromosom bloku wszystkie 133 (8) 101 (7) 73 (3) 83 (1) 121 (7) 88 (1) 81 (1) 122 (41) 158 (38) 44 (2) 122 (32) (2) 60 (2) 25 (2) 2-SNP SNP 24 (5) 15 (5) 14 (2) 8 (1) 13 (3) (16) 36 (14) 6 (2) 26 (11) 4 2 (2) 8 (1) 7 (2) 4-SNP 2 (1) 2 (1) 1 (1) - 3 (2) 4-9 (8) 7 (5) 1 9 (6) (1) - 5-SNP 2 (1) (1) 1 (1) 6 (5) 11 (10) - 4 (3) SNP 1 (1) 1 (1) (1) 1-3 (3) 2 (2) - 3 (3) SNP (3) 2 (2) SNP (2) (3) SNP (1) 1 (1) - 1 (1) SNP (1) SNP (2) 1 (1) SNP (1) - 1 (1) SNP (1) SNP (1) SNP (1) SNP (1) SNP (1) SNP (1) SNP (1) W nawiasach zawarta zosta la liczba bloków niepe lnych. 4.2 Wyodr ebnienie bloków SNP 41

50 Tabela 4.6: Liczba bloków markerów z MAF > 0.01 oraz r wed lug ich wielkości dla poszczególnych chromosomów wielkość chromosom bloku wszystkie 202 (2) 142 (2) 135 (5) 123 (5) 103 (2) 152 (2) 129 (4) 150 (2) 96 (5) 119 (4) 111 (1) 66 (2) 78 (3) 101 (5) 73 (2) 2-SNP SNP 30 (1) (4) (5) 21 (1) (4) 16 (2) (1) 13 (2) 12 (2) 10 (2) 4-SNP (2) 1 9 (1) 2 (2) 3 (1) 2 2 (2) 2 1 (1) 2 1 (1) - 5-SNP 2-2 (1) 3 (2) 3 (1) 1 1 (1) (1) 1-1 (1) 1 6-SNP - 2 (2) 1 2 (1) (1) (1) - 7-SNP 1 (1) (1) - 8-SNP (1) SNP (1) - - wielkość chromosom bloku wszystkie 97 (1) 75 (1) 57 (3) (2) 60 (2) 54 (2) 95 (22) 136 (20) (22) (1) 43 (1) 13 (1) 2-SNP SNP 12 (1) 7 9 (3) 6 9 (2) 3 (1) 5 (2) 27 (15) 23 (8) 3 19 (6) 1-3 (1) 5 (1) 4-SNP 1 1 (1) (2) 6 (4) 1 7 (6) SNP (1) 4 (3) - 4 (4) SNP (1) - 1 (1) 2 (2) - 1 (1) SNP (1) 1 (1) - 1 (1) SNP (1) (1) SNP (1) - 1 (1) SNP (1) (1) SNP (1) Wyniki

51 Tabela 4.7: Liczba bloków markerów z MAF > 0.05 oraz r wed lug ich wielkości dla poszczególnych chromosomów wielkość chromosom bloku wszystkie 255 (11) 192 (9) 183 (10) 167 (9) 129 (10) 182 (9) 163 (8) 186 (10) 111 (3) 139 (6) 142 (6) 89 (5) 111 (7) 134 (9) 99 (2) 2-SNP SNP 43 (4) 32 (5) 36 (6) 20 (3) 24 (8) 25 (5) 27 (5) 30 (5) 18 (1) 20 (3) 24 (5) 15 (2) 21 (3) 19 (3) 13 (2) 4-SNP 11 (3) 4 (1) 5 (3) 8 (3) 4 (1) 13 (3) 6 (1) 12 (5) 3 (1) 7 (1) 1 5 (2) 3 (1) 6 (3) 1 5-SNP 6 (3) 2 (2) 3 (1) 2 4 (1) 3 2 (1) 2-4 (2) 2 (1) (1) 1 6-SNP 2 (1) (1) (1) - 2 (1) - 7-SNP (1) (1) (1) SNP (1) (1) SNP - 1 (1) (1) SNP (1) (1) - 11-SNP (1) - - wielkość chromosom bloku wszystkie 126 (8) 95 (7) 70 (3) 82 (1) 111 (7) 81 (1) 78 (1) 49 (7) 81 (4) 44 (2) 62 (2) (2) 58 (2) 25 (2) 2-SNP SNP 23 (5) 15 (4) 13 (2) 8 (1) 11 (3) (2) 12 (2) 6 (2) (2) 8 (1) 7 (2) 4-SNP 2 (1) 2 (1) 1 (1) - 3 (2) 4-2 (2) 1 (1) 1 2 (1) (1) - 5-SNP 2 (1) 1 (1) (1) 1 (1) 1 (1) 1 (1) SNP 1 (1) 1 (1) (1) 1-2 (2) SNP (1) SNP SNP (1) Wyodr ebnienie bloków SNP 43

52 Tabela 4.8: Liczba bloków markerów z MAF > 0.05 oraz r wed lug ich wielkości dla poszczególnych chromosomów wielkość chromosom bloku wszystkie 188 (2) 132 (1) 128 (4) 112 (5) 95 (2) 141 (2) 118 (4) 142 (2) 87 (5) 113 (4) 106 (1) 62 (2) 76 (3) 95 (5) 69 (2) 2-SNP SNP 30 (1) (3) (1) (1) (4) 16 (2) (1) 13 (2) 12 (2) 10 (2) 4-SNP (2) 1 9 (1) 2 (2) 3 (1) 2 2 (2) 2 1 (1) 2 1 (1) - 5-SNP 2-2 (1) 3 (2) 3 (1) 1 1 (1) 2 (1) (1) 1-1 (1) 1 6-SNP 1 (1) 2 (1) 1 2 (1) (1) SNP (1) - 8-SNP (1) SNP (1) - - wielkość chromosom bloku wszystkie 93 (1) 71 (1) 54 (2) (2) 54 (1) 53 (2) 31 (3) 61 (2) (2) (1) 41 (1) 13 (1) 2-SNP SNP 11 (1) 7 8 (2) 6 8 (2) 3 5 (2) - 7 (1) 3 6 (2) 1-3 (1) 5 (1) 4-SNP 1 1 (1) (2) 1 (1) (1) 1-5-SNP (1) SNP (1) SNP Wyniki

53 4.2 Wyodr ebnienie bloków SNP 45 Rysunek 4.5: Odsetek bloków niepe lnych dla poszczególnych chromosomów oraz podzbiorów danych Rysunek 4.5 przedstawia procentowy udzia l bloków niepe lnych we wszystkich analizowanych blokach SNP dla poszczególnych chromosomów oraz podzbiorów danych. Widać tu różne tendencje w pojawianiu si e bloków niepe lnych. Dla chromosomów 1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 16, 17, 19, 20, 25, 28, 29 i allosomu liczba bloków niepe lnych wieksza by la w przypadku podzbiorów z markerami spe lniaj acymi kryterium r 2 0.8, bez wzgledu na poziom miary MAF. Dla chromosomu 1, 2, 5, 6, 8, 11, 16, 17 i 20 różnice te by ly szczególnie wyraźne, a dla chromosomu 19 i 25 liczba bloków niepe lnych przy r spad la do zera. Odwrotna zależność zaistnia la dla chromosomu 9, 15, 21 i 22. Przy mierze r liczba bloków niepe lnych by la wi eksza, niż w przypadku r 2 0.8, bez wzgledu na poziom MAF. Chromosom 18 charakteryzowa l sie najwieksz a liczba bloków niepe lnych w podzbiorze markerów z MAF > 0.01 oraz r 2 0.9, nieco mniejsza w podzbiorze markerów z MAF > 0.05 oraz r 2 0.8, jeszcze mniejsza w podzbiorze z MAF > 0.01 oraz r i najmniejsza w podzbiorze markerów z MAF > 0.05 oraz r

54 46 Wyniki Ciekawym przypadkiem okaza l si e być także chromosom 27, gdzie w żadnym podzbiorze danych nie pojawi l sie blok niepe lny. Wyróżniajacymi sie pod wzgledem odsetka bloków niepe lnych by ly chromosomy 23, 24 i 26, gdzie odsetek ten stanowi l ponad jedna piat a wszystkich bloków. W przypadku chromosomu 23 w podzbiorze z MAF > 0.01 oraz r przekroczy l on nawet jedna trzecia wszystkich bloków. Dla chromosomu 23 i 24 odsetek bloków niepe lnych spad l przy wzroście r 2 z 0.8 do 0.9 przy MAF > 0.01, jeszcze mniejszy by l w podzbiorze z MAF > 0.05 oraz r i najmniejsza wartość osiagn a l w podzbiorze z MAF > 0.05 oraz r Podobnie sytuacja wyglada la dla chromosomu 26, ale w tym przypadku odsetek bloków niepe lnych wiekszy by l w podzbiorze z MAF > 0.05 oraz r 2 0.9, niż w podzbiorze z MAF > 0.05 oraz r Rysunek 4.6: Średnia liczba markerów przypadaj acych na jeden blok dla poszczególnych chromosomów oraz podzbiorów danych Chromosomy różni ly sie miedzy soba pod wzgledem przecietnej liczby markerów przypadajacych na jeden blok SNP. Różnice te przedstawia rysunek 4.6. Średnia liczba markerów tworzacych jeden blok waha la sie od oko lo 2.03 markera dla chromosomu 27 w pod-

55 4.3 Konstrukcja i selekcja haplotypów SNP 47 zbiorach z r 2 0.9, bez wzgl edu na poziom MAF, do oko lo 3.63 markera w podzbiorze z MAF > 0.01 i r Ponownie uwag e zwróci ly chromosomy: 23, 24 i 26. Średnie wartości liczby markerów przypadajacych na jeden blok by ly dla nich najwyższe, szczególnie przy MAF > 0.01, bez wzgledu na wartość miary r 2. Jest to zgodne z wynikami zawartymi w tabeli 4.5 oraz 4.6, gdzie widać, że najwieksze bloki SNP wystapi ly w laśnie w przypadku tych trzech chromosomów we wskazanych podzbiorach danych. 4.3 Konstrukcja i selekcja haplotypów SNP Konstrukcja haplotypów SNP przeprowadzona zosta la na bazie wyodr ebnionych bloków SNP. Bloki wyodrebnione z markerów SNP spe lniaj acych kryteria MAF > 0.01 oraz r zosta ly uznane za zbiór najlepszy do konstrukcji haplotypów. Przes lank a tak podjetej decyzji by la duża różnorodność wielkości bloków, zw laszcza fakt, że w podzbiorze tym powsta ly bloki najwieksze, które przedstawia ly ciekawsza wartość badawcza, szczególnie jako zmienne objaśniajace w modelu z losowymi efektami haplotypów SNP i nierównomiernie roz lożona wariancja genetyczna (wzór 3.7). Tabela 4.9 zawiera liczby skonstruowanych haplotypów dla poszczególnych chromosomów. Najwi eksza liczba haplotypów zosta la otrzymana w przypadku chromosomu 26 (3709 haplotypów). Najmniej haplotypów powsta lo dla allosomu (99 haplotypów) oraz dla chromosomu 28 (137 haplotypów). Wyróżniajacymi sie pod wzgledem liczby haplotypów by ly także chromosomy 23 i 24, gdzie ich liczba przekroczy la dwa tysiace (2069 dla chromosomu 23, 2843 dla chromosomu 24). W przypadku chromosomu 1 powsta lo 1050 haplotypów. Liczba haplotypów zależna by la od wielkości bloku SNP, na bazie którego by ly one konstruowane. Im wi ekszy blok, czyli im wi ecej dost epnych markerów, tym wi ecej możliwych kombinacji alleli, a tym samym wi ecej możliwych postaci haplotypów. Zastosowane oprogramowanie pozwala lo analizować haplotypy, które mog lyby powstać na bazie dostarczonych markerów, a nie wszystkie dost epne z probabilistycznego punktu widzenia kombinacje alleli.

56 48 Wyniki Tabela 4.9: Liczba haplotypów skonstruowanych dla poszczególnych chromosomów wszystkie haplotypy chromosom skonstruowane o frekwencji haplotypy przekraczajacej 25% suma SUMA Kryterium selekcji haplotypów stanowi la ich frekwencja w populacji. Tylko haplotypy, które pojawia ly si e przynajmniej u jednej czwartej osobników w populacji, by ly brane pod uwage. Tabela 4.9 oraz rysunek 4.7 przedstawiaja liczbe oraz odsetek haplotypów spe lniaj acych zadane kryterium. Najwiecej haplotypów o frekwencji przekraczajacej 25% otrzymano dla chromosomu 1 (409 haplotypów), a najmniej dla allosomu (39 haplotypów) oraz dla chromosomu 28 (63 haplotypy). Najwieksz a redukcje liczby haplotypów odnotowano dla chromosomu 23, 24

57 4.3 Konstrukcja i selekcja haplotypów SNP 49 i 26. W przypadku chromosomu 26 odrzucono ponad 95% skonstruowanych haplotypów. Dla chromosomu 23 i 24 kryterium selekcji spe lni lo oko lo 8% haplotypów. W przypadku pozosta lych chromosomów do dalszej analizy wzieto od oko lo 35% haplotypów z chromosomu 17 i 20 do oko lo 46% haplotypów z chromosomu 28. Rysunek 4.7: Odsetek haplotypów o frekwencji przekraczajacej 25% Najwiekszym haplotypem, który spe lni l kryterium selekcji by l haplotyp utworzony na bazie 21 markerów. Ostatecznie, do predykcji wartości hodowlanych użyto 5643 haplotypy z chromosomów autosomalnych.

58 50 Wyniki 4.4 Predykcja wartości hodowlanej na bazie haplotypów SNP Wykorzystane modele predykcji zosta ly porównane ze wzgledu na wielkości estymatorów i predyktorów efektów haplotypów oraz ze wzgledu na dok ladność predykcji wartości hodowlanej. Jako pierwsze przedstawione zosta ly wyniki analizy porównawczej ze wzgledu na wielkość efektów haplotypów Porównanie modeli predykcji ze wzgl edu na efekty haplotypów Tabela 4.10 przedstawia podstawowe statystyki opisowe efektów haplotypów dla poszczególnych cech i modeli predykcji. Wartości statystyk opisowych pokazuja, że estymatory efektów otrzymanych przy użyciu modeli 1, 2, 7, 8, 9 oraz 10 (modele ze sta lymi efektami haplotypów) tworzy ly próby o rozst epie wi ekszym, niż predyktory efektów haplotypów otrzymane przy użyciu modeli 3, 4, 5 oraz 6 (modele z losowymi efektami haplotypów). Tendencja taka utrzymywa la si e dla wszystkich analizowanych cech, zw laszcza w przypadku modeli 9 i 10. Cecha o najwiekszym rozstepie wartości, bez wzgledu na model predykcji, by la wydajność mleczna (WM). Różnice w rozk ladach efektów haplotypów w modelach tej samej postaci (pary modeli: 1 i 2, 3 i 4, 5 i 6, 7 i 8, 9 i 10), ale z różnymi macierzami wystapień tych efektów, nie by ly statystycznie istotne. Prawid lowość ta zosta la zachowana dla wszystkich analizowanych cech (test Wilcoxona, p-wartość > 0.05) i jest widoczna w tabeli Średnie efekty haplotypów oraz ich mediany w rozpatrywanych parach modeli predykcji cz esto wykazywa ly takie same lub różniace sie w jednej lub kilku tysiecznych wartości. Rodzaj zastosowanego modelu predykcji nie wp lywa l na rozk lad efektów haplotypów w przypadku cech produkcyjnych (WM, WT, WB)(test Kruskala-Wallisa, p-wartość > 0.05). Dla cech pokrojowych (STA, OFL, USU), p lodności (NRK, PRP, OMC) oraz wyniku komórek somatycznych (SCS) postać zastosowanego modelu predykcji wp lywa la na średnia wielkość efektu haplotypu (test Kruskala-Wallisa, p-wartość < 0.05).

59 4.4 Predykcja wartości hodowlanej na bazie haplotypów SNP 51 Tabela 4.10: Statystyki opisowe efektów haplotypów dla poszczególnych cech i modeli predykcji cecha model statystyka WM WT WB STA OFL USU NRK PRP OMC SCS minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum minimum mediana średnia maksimum

60 52 Wyniki Rysunek 4.8 przedstawia wykresy efektów haplotypów otrzymanych z zastosowaniem modeli 1 i 2 dla cech produkcyjnych. Wyniki otrzymane obiema metodami bardzo si e pokrywa ly. Na wszystkich trzech wykresach wyróżnia si e jeden z efektów. Jest to efekt haplotypu o numerze 5018, pochodzacego z chromosomu 24, postaci 11, powsta ly na bazie bloku Dla WM oraz WB jest to efekt dodatni, a dla WT jest to efekt ujemny. W przypadku WM pojawi ly si e także dość silne efekty ujemne: haplotyp o numerze 3355 postaci 00 umiejscowiony na chromosomie 14, powsta ly na bazie bloku 2181 oraz haplotyp o numerze 3704 postaci 00 umiejscowiony na chromosomie 15, powsta ly na bazie bloku Haplotyp o numerze 3355 wykaza l najwyższy efekt dodatni dla cechy WT. Rysunek 4.9 przedstawia wykresy efektów haplotypów otrzymanych z zastosowaniem modeli 1 i 2 dla cech pokrojowych. Także w tym przypadku, wyniki obydwu metod by ly porównywalne, a wyróżniajacym sie efektem by l efekt haplotypu o numerze Dla wszystkich trzech cech by l to efekt dodatni, najwiekszy dla OFL. Rysunki 4.10 oraz 4.11 przedstawiaja wykresy efektów haplotypów otrzymanych z zastosowaniem modeli 1 i 2 dla cech p lodności oraz dla wyniku komórek somatycznych (SCS). Również w tych przypadkach, najbardziej znaczacym okaza l sie być efekt haplotypu o numerze 5018, ujemny dla cech p lodności oraz dodatni dla SCS. Cecha NRK wykaza la mniejszy przedzia l zmienności, niż pozosta le cechy p lodności. 2 Wykaz bloków markerów dost epny jest w dodatku A niniejszej pracy, A.1

61 4.4 Predykcja wartości hodowlanej na bazie haplotypów SNP 53 Rysunek 4.8: Efekty haplotypów SNP otrzymane dla cech produkcyjnych przy użyciu modeli 1 i 2

62 54 Wyniki Rysunek 4.9: Efekty haplotypów SNP otrzymane dla cech pokrojowych przy użyciu modeli 1 i 2

63 4.4 Predykcja wartości hodowlanej na bazie haplotypów SNP 55 Rysunek 4.10: Efekty haplotypów SNP otrzymane dla cech p lodności przy użyciu modeli 1 i 2 Rysunek 4.11: użyciu modeli 1 i 2 Efekty haplotypów SNP otrzymane dla wyniku komórek somatycznych przy

64 56 Wyniki Efekty otrzymane przy użyciu modeli z losowymi efektami haplotypów SNP (modele 3 i 4 oraz modele 5 i 6) wykaza ly mniejsze, niż w przypadku modeli 1 i 2, przedzia ly zmienności. W przypadku modeli 3 i 4 dla cech produkcyjnych najbardziej znaczacymi by ly efekty ujemne haplotypów o numerach 3355 (postać 00, chromosom 14, blok 2181), 3357 (postać 01, chromosom 14, blok 2182), 2686 (postać 00, chromosom 10, blok 1756) oraz efekty dodatnie haplotypów o numerach 3363 (postać 000, chromosom 14, blok 2185), 3361 (postać 00, chromosom 14, blok 2184), 3358 (postać 10, chromosom 14, blok 2182), Efekt haplotypu 3355 by l dodatni dla WT, ale ujemny dla WM, przy czym dla WM by l to efekt najsilniejszy (rysunek 4.12). Efekty haplotypów otrzymane z użyciem modeli 3 i 4 dla cech pokrojowych (rysunek 4.13), p lodności (rysunek 4.14) oraz wyniku komórek somatycznych (rysunek 4.15) nie wykaza ly żadnych wyraźnie odstajacych wartości. Przedzia ly zmienności efektów dla tych cech by ly niewielkie. Modele 5 i 6 s luży ly estymacji losowych efektów haplotypów z za lożeniem nierównomiernie roz lożonej wariancji. Najwi ekszy analizowany haplotyp (o numerze 5376), postaci , pochodzacy z chromosomu 26 mia l najsilniejszy efekt dodatni dla cechy WM (rysunek 4.16). Dodatnie efekty dla tej cechy wykaza ly także haplotypy o numerach 5126 (postać , chromosom 24, blok 3343), 4952 (postać , chromosom 23, blok 3223) oraz 4791 (postać , chromosom 23, blok 3111). Haplotyp 5376 wykaza l także najsilniejszy efekt dodatni dla WT, WB (rysunek 4.16) oraz STA (rysunek 4.17). Najmocniejszym efektem ujemnym dla cechy WT by l efekt haplotypu nr 4866 postaci , umiejscowionego na chromosomie 23, powsta lym na bazie bloku Efekty haplotypów otrzymane dla OFL, USU, cech p lodności oraz SCS również w przypadku modeli 5 i 6 wykaza ly ma ly zakres zmienności.

65 4.4 Predykcja wartości hodowlanej na bazie haplotypów SNP 57 Rysunek 4.12: Efekty haplotypów SNP otrzymane dla cech produkcyjnych przy użyciu modeli 3 i 4

66 58 Wyniki Rysunek 4.13: Efekty haplotypów SNP otrzymane dla cech pokrojowych przy użyciu modeli 3 i 4

67 4.4 Predykcja wartości hodowlanej na bazie haplotypów SNP 59 Rysunek 4.14: Efekty haplotypów SNP otrzymane dla cech p lodności przy użyciu modeli 3 i 4 Rysunek 4.15: Efekty haplotypów SNP otrzymane dla SCS przy użyciu modeli 3 i 4

Postępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda

Postępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda Postępy w realizacji polskiego programu selekcji genomowej buhajów MASinBULL Joanna Szyda Uniwersytet Przyrodniczy we Wrocławiu Katedra Genetyki, Pracownia Biostatystyki 1. MASinBULL 2. Metody oceny genomowej

Bardziej szczegółowo

era genomowa w hodowli bydła mlecznego Instytut Zootechniki Państwowy Instytut Badawczy

era genomowa w hodowli bydła mlecznego Instytut Zootechniki Państwowy Instytut Badawczy era genomowa w hodowli bydła mlecznego Instytut Zootechniki Państwowy Instytut Badawczy 1 2 Szanowni Państwo! W Instytucie Zootechniki PIB od ponad 40 lat prowadzona jest ocena wartości hodowlanej. W tym

Bardziej szczegółowo

PRZYGODY DGV. historia programu selekcji genomowej w Polsce. Joanna Szyda, Andrzej Żarnecki

PRZYGODY DGV. historia programu selekcji genomowej w Polsce. Joanna Szyda, Andrzej Żarnecki PRZYGODY DGV historia programu selekcji genomowej w Polsce Joanna Szyda, Andrzej Żarnecki Co to DGV? DGV Direct Genomic Value bezpośrednia genomowa wartość hodowlana suma addytywnych efektów markerów SNP

Bardziej szczegółowo

Modelowanie danych hodowlanych

Modelowanie danych hodowlanych Modelowanie danych hodowlanych 1. Wykład wstępny 2. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami

Bardziej szczegółowo

Ocena wartości hodowlanej buhajów rasy simentalskiej. Sierpień

Ocena wartości hodowlanej buhajów rasy simentalskiej. Sierpień Ocena wartości hodowlanej buhajów rasy simentalskiej Sierpień 2017.3 1 Spis treści Ocena wartości hodowlanej dla cech produkcyjnych i komórek somatycznych... 3 Indeks produkcyjny [kg]... 3 Podindeks produkcyjny

Bardziej szczegółowo

Modelowanie danych hodowlanych

Modelowanie danych hodowlanych Modelowanie danych hodowlanych 1. Wykład wstępny. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami

Bardziej szczegółowo

Szacowanie wartości hodowlanej. Zarządzanie populacjami

Szacowanie wartości hodowlanej. Zarządzanie populacjami Szacowanie wartości hodowlanej Zarządzanie populacjami wartość hodowlana = wartość cechy? Tak! Przy h 2 =1 ? wybitny ojciec = wybitne dzieci Tak, gdy cecha wysokoodziedziczalna. Wartość hodowlana genetycznie

Bardziej szczegółowo

Tomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda

Tomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda Tomasz Suchocki Kacper Żukowski, Magda Mielczarek, Joanna Szyda Uniwersytet Przyrodniczy we Wrocławiu, Pracownia Biostatystyki Instytut Zootechniki Państwowy Instytut Badawczy 2 > 76 000 osobników w bazie

Bardziej szczegółowo

Ocena wartości hodowlanej buhajów rasy simentalskiej

Ocena wartości hodowlanej buhajów rasy simentalskiej Ocena wartości hodowlanej buhajów rasy simentalskiej Sierpień 2016 1 Spis treści Ocena wartości hodowlanej dla cech produkcyjnych i komórek somatycznych... 3 Indeks produkcyjny [kg]... 3 Podindeks produkcyjny

Bardziej szczegółowo

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y

Bardziej szczegółowo

Praca hodowlana. Wartość użytkowa, wartość hodowlana i selekcja bydła

Praca hodowlana. Wartość użytkowa, wartość hodowlana i selekcja bydła Praca hodowlana Wartość użytkowa, wartość hodowlana i selekcja bydła Duże zróżnicowanie, obserwowane w zakresie wydajności poszczególnych krów w obrębie rasy, zależy od wielu czynników genetycznych i środowiskowych.

Bardziej szczegółowo

Rozwój oceny wartości hodowlanej w Polsce w świetle oczekiwań hodowców dr Katarzyna Rzewuska CGen PFHBiPM

Rozwój oceny wartości hodowlanej w Polsce w świetle oczekiwań hodowców dr Katarzyna Rzewuska CGen PFHBiPM Rozwój oceny wartości hodowlanej w Polsce w świetle oczekiwań hodowców dr Katarzyna Rzewuska CGen PFHBiPM k.rzewuska@cgen.pl 1 października 2018 Czym jest indeks ekonomiczny? WH =? Indeks ekonomiczny to

Bardziej szczegółowo

Ocena wartości hodowlanej krów rasy PHF odmiany czarno-białej i czerwono-białej

Ocena wartości hodowlanej krów rasy PHF odmiany czarno-białej i czerwono-białej Ocena wartości hodowlanej krów rasy PHF odmiany czarno-białej i czerwono-białej SPIS TREŚCI OCENA KONWENCJONALNA... 2 Ocena wartości hodowlanej krów dla cech produkcyjnych i zawartości komórek somatycznych...

Bardziej szczegółowo

Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej

Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej Sierpień 2014 SPIS TREŚCI OCENA KONWENCJONALNA... 3 Ocena wartości hodowlanej buhajów dla cech produkcyjnych i zawartości

Bardziej szczegółowo

Krajowy program hodowlany dla rasy polskiej czarno-białej

Krajowy program hodowlany dla rasy polskiej czarno-białej 1 Krajowy program hodowlany dla rasy polskiej czarno-białej Cel hodowlany Celem realizacji programu jest odtworzenie i zachowanie bydła mlecznego rasy polskiej czarno-białej w typie dwustronnie użytkowym

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś

Bardziej szczegółowo

Ocena wartości hodowlanej. Dr Agnieszka Suchecka

Ocena wartości hodowlanej. Dr Agnieszka Suchecka Ocena wartości hodowlanej Dr Agnieszka Suchecka Wartość hodowlana genetycznie uwarunkowane możliwości zwierzęcia do ujawnienia określonej produkcyjności oraz zdolność przekazywania ich potomstwu (wartość

Bardziej szczegółowo

Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej

Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej Grudzień 2016 SPIS TREŚCI OCENA KONWENCJONALNA... 4 Ocena wartości hodowlanej buhajów dla cech produkcyjnych i zawartości

Bardziej szczegółowo

Krajowy program hodowlany dla rasy polskiej czerwono-białej

Krajowy program hodowlany dla rasy polskiej czerwono-białej 1 Krajowy program hodowlany dla rasy polskiej czerwono-białej Cel hodowlany Celem realizacji programu jest odtworzenie i zachowanie bydła mlecznego rasy polskiej czerwono-białej w typie dwustronnie użytkowym

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 22 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś

Bardziej szczegółowo

Selekcja genowa buhajów

Selekcja genowa buhajów Selekcja genomowa buhajow_m.xd 10-05-18 14:57 Strona 55 hodowla Kamil Siatka Mazowieckie Centrum Hodowli i Rozrodu Zwierząt Sp. z o.o. w Łowiczu Selekcja genowa buhajów i jej wpływ na produkcję mleka Dotychczasowa

Bardziej szczegółowo

Ocena wartości hodowlanej. Indeksy selekcyjne Krzysztof Gałązka

Ocena wartości hodowlanej. Indeksy selekcyjne Krzysztof Gałązka Ocena wartości hodowlanej. Indeksy 2016 Krzysztof Gałązka 1 Praca hodowlana w stadzie wymaga odpowiednich narzędzi (informacji) do jej wykonania Współczesny hodowca powinien właściwie (efektywnie) wykorzystywać

Bardziej szczegółowo

Charakterystyka innych ras czerwonych w Europie zrzeszonych w ERDB

Charakterystyka innych ras czerwonych w Europie zrzeszonych w ERDB Wiadomości Zootechniczne, R. XLIII (2005), 2: 144-148 zrzeszonych w ERDB Lisbet Holm 1, Piotr Wójcik 2 1 European Red Dairy Breed, Udkaersovej 15, 8200 Aarhus N., Dania 2 Instytut Zootechniki, Dział Genetyki

Bardziej szczegółowo

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej holsztyńsko-fryzyjskiej

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej holsztyńsko-fryzyjskiej R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej holsztyńsko-fryzyjskiej Regulamin został opracowany na podstawie Ustawy z dnia 29 czerwca 2007 r. o organizacji hodowli i rozrodzie zwierząt

Bardziej szczegółowo

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Prowadzący: JOANNA SZYDA MAGDALENA FRĄSZCZAK WSTĘP 1. Systemy informatyczne w hodowli -??? 2. Katedra Genetyki 3. Pracownia biostatystyki - wykorzystanie narzędzi

Bardziej szczegółowo

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE CECHY ILOŚCIOWE PARAMETRY GENETYCZNE Zarządzanie populacjami zwierząt, ćwiczenia V Dr Wioleta Drobik Rodzaje cech Jakościowe o prostym dziedziczeniu uwarunkowane zwykle przez kilka genów Słaba podatność

Bardziej szczegółowo

Wykorzystanie informacji o genomie w selekcji bydªa

Wykorzystanie informacji o genomie w selekcji bydªa Wykorzystanie informacji o genomie w selekcji bydªa Tomasz Suchocki 1,2, Joanna Szyda 1,2 1 Grupa Biostatystyki, Uniwersytet Przyrodniczy we Wrocªawiu 2 Instytut Zootechniki - PIB, Kraków 1 / 50 1. Ocena

Bardziej szczegółowo

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej holsztyńsko-fryzyjskiej

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej holsztyńsko-fryzyjskiej R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej holsztyńsko-fryzyjskiej Regulamin został opracowany na podstawie Ustawy z dnia 29 czerwca 2007 r. o organizacji hodowli i rozrodzie zwierząt

Bardziej szczegółowo

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej czerwonej obowiązujący od 1 stycznia 2017 r.

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej czerwonej obowiązujący od 1 stycznia 2017 r. R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej czerwonej obowiązujący od 1 stycznia 2017 r. Regulamin został opracowany na podstawie Ustawy z dnia 29 czerwca 2007 r. o organizacji hodowli

Bardziej szczegółowo

1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection

1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji

Bardziej szczegółowo

Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej

Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej Ocena wartości hodowlanej buhajów rasy PHF odmiany czarno-białej i czerwono-białej ( listopad 2012) SPIS TREŚCI Ocena wartości hodowlanej buhajów dla cech produkcyjnych i zawartości komórek somatycznych...

Bardziej szczegółowo

Spokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia

Spokrewnienie prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami IBD. IBD = identical by descent, geny identycznego pochodzenia prawdopodobieństwo, że dwa losowe geny od dwóch osobników są genami ID. Relationship Relatedness Kinship Fraternity ID = identical by descent, geny identycznego pochodzenia jest miarą względną. Przyjmuje

Bardziej szczegółowo

R E G U L A M I N wpisu do ksiąg bydła hodowlanego ras mlecznych

R E G U L A M I N wpisu do ksiąg bydła hodowlanego ras mlecznych R E G U L A M N wpisu do ksiąg bydła hodowlanego ras mlecznych Regulamin został opracowany na podstawie Ustawy z dnia 29 czerwca 2007 r. o organizacji hodowli i rozrodzie zwierząt gospodarskich (Dz. U.

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Zarządzanie populacjami zwierząt. Parametry genetyczne cech

Zarządzanie populacjami zwierząt. Parametry genetyczne cech Zarządzanie populacjami zwierząt Parametry genetyczne cech Teoria ścieżki zależność przyczynowo-skutkowa X p 01 Z Y p 02 p 01 2 + p 02 2 = 1 współczynniki ścieżek miary związku między przyczyną a skutkiem

Bardziej szczegółowo

Dziedziczenie poligenowe

Dziedziczenie poligenowe Dziedziczenie poligenowe Dziedziczenie cech ilościowych Dziedziczenie wieloczynnikowe Na wartość cechy wpływa Komponenta genetyczna - wspólne oddziaływanie wielu (najczęściej jest to liczba nieznana) genów,

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 19 kwietnia 2011 Testy dla dwóch grup 1 Analiza danych dla dwóch grup: test t-studenta dla dwóch grup sparowanych; test t-studenta dla dwóch grup niezależnych (jednakowe wariancje) test Z dla dwóch grup

Bardziej szczegółowo

Selekcja genomowa. w programach hodowlanych

Selekcja genomowa. w programach hodowlanych Selekcja genomowa w programach hodowlanych Aleksander Osten-Sacken* Selekcja zwierząt na podstawie oceny genomu stosowana jest obecnie we wszystkich liczących się programach hodowlanych na całym świecie.

Bardziej szczegółowo

Dyskretne modele populacji

Dyskretne modele populacji Dyskretne modele populacji Micha l Machtel Adam Soboczyński 17 stycznia 2007 Typeset by FoilTEX Dyskretne modele populacji [1] Wst ep Dyskretny opis modelu matematycznego jest dobry dla populacji w których

Bardziej szczegółowo

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy simentalskiej obowiązujący od 1 lipca 2015 r.

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy simentalskiej obowiązujący od 1 lipca 2015 r. R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy simentalskiej obowiązujący od 1 lipca 2015 r. Regulamin został opracowany na podstawie Ustawy z dnia 29 czerwca 2007 r. o organizacji hodowli i rozrodzie

Bardziej szczegółowo

Badania asocjacyjne w skali genomu (GWAS)

Badania asocjacyjne w skali genomu (GWAS) Badania asocjacyjne w skali genomu (GWAS) Wstęp do GWAS Część 1 - Kontrola jakości Bioinformatyczna analiza danych Wykład 2 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt Badania

Bardziej szczegółowo

Opracowanie metod genomowej oceny wartości

Opracowanie metod genomowej oceny wartości Wiadomości Zootechniczne, R. LVII (2019), 1: 109 113 Praktyczne wykorzystanie oceny genomowej w hodowli bydła mlecznego Monika Skarwecka Instytut Zootechniki Państwowy Instytut Badawczy, Zakład Hodowli

Bardziej szczegółowo

Opis wykonanych badań naukowych oraz uzyskanych wyników

Opis wykonanych badań naukowych oraz uzyskanych wyników Opis wykonanych badań naukowych oraz uzyskanych wyników 1. Analiza danych (krok 2 = uwzględnienie epistazy w modelu): detekcja QTL przy wykorzystaniu modeli dwuwymiarowych z uwzględnieniem różnych modeli

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące

Bardziej szczegółowo

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej czarno-białej

R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej czarno-białej R E G U L A M I N wpisu do ksiąg bydła hodowlanego rasy polskiej czarno-białej Regulamin został opracowany na podstawie Ustawy z dnia 29 czerwca 2007 r. o organizacji hodowli i rozrodzie zwierząt gospodarskich

Bardziej szczegółowo

Genetyka populacji. Ćwiczenia 7

Genetyka populacji. Ćwiczenia 7 Genetyka populacji Ćwiczenia 7 Rodowody wraz z wynikami kontroli użytkowości stanowią podstawową informację potrzebną do doskonalenia zwierząt C F X S D C F C F S D strzałka oznacza przepływ genów między

Bardziej szczegółowo

Ocena wartości hodowlanej krów rasy PHF odmiany czarno-białej i czerwono-białej

Ocena wartości hodowlanej krów rasy PHF odmiany czarno-białej i czerwono-białej Ocena wartości hodowlanej krów rasy PHF odmiany czarno-białej i czerwono-białej W ocenie 2014/1 wprowadzono zmiany do dotychczas używanego indeksu krowy IKW/IKR, z którego korzystano przy wyborze kandydatek

Bardziej szczegółowo

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ. Ocena wartości hodowlanej bydła mlecznego wprowadzenie

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ. Ocena wartości hodowlanej bydła mlecznego wprowadzenie SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Ocen wrtości hodowlnej bydł mlecznego wprowdzenie WSTĘP. Modele oceny wrtości hodowlnej. Ocen konwencjonlnej wrtości hodowlnej w Polsce 3. Ocen genomowej wrtości

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie

Bardziej szczegółowo

Definicja. Odziedziczalność. Definicja. w potocznym rozumieniu znaczy tyle co dziedziczenie. Fenotyp( P)=Genotyp(G)+Środowisko(E) V P = V G + V E

Definicja. Odziedziczalność. Definicja. w potocznym rozumieniu znaczy tyle co dziedziczenie. Fenotyp( P)=Genotyp(G)+Środowisko(E) V P = V G + V E Odziedziczalność w potocznym rozumieniu znaczy tyle co dziedziczenie...ale ma ścisłą techniczną definicję. Definicja Fenotyp( P)=Genotyp(G)+Środowisko(E) V P = V G + V E H 2 (w szerszym sensie) = V G /

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 4 kwietnia 2012 Testy nieparametryczne Dotychczas zajmowaliśmy si e praktycznym zastosowaniem testów istotności nasze zadanie sprowadza lo si e do testowania hipotez o parametrach rozk ladu. Teraz b edziemy

Bardziej szczegółowo

Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych

Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych Konrad Ocalewicz Zakład Biologii i Ekologii Morza, Instytut Oceanografii, Wydział Oceanografii i Geografii,

Bardziej szczegółowo

Indeksy wartości hodowlanych rasy simentalskiej w poszczególnych krajach - omówienie

Indeksy wartości hodowlanych rasy simentalskiej w poszczególnych krajach - omówienie Indeksy wartości hodowlanych rasy simentalskiej w poszczególnych krajach - omówienie Od pewnego czasu w naszym kraju toczą się rozmowy na temat zmiany i rozwinięcia indeksu wartości hodowlanych dla rasy

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 1

STATYSTYKA MATEMATYCZNA WYKŁAD 1 STATYSTYKA MATEMATYCZNA WYKŁAD 1 Wykład wstępny Teoria prawdopodobieństwa Magda Mielczarek wykłady, ćwiczenia Copyright 2017, J. Szyda & M. Mielczarek STATYSTYKA MATEMATYCZNA? ASHG 2011 Writing Workshop;

Bardziej szczegółowo

Dyskretne modele populacji

Dyskretne modele populacji Dyskretne modele populacji Micha l Machtel Adam Soboczyński 19 stycznia 2007 Typeset by FoilTEX Dyskretne modele populacji [1] Wst ep Dyskretny opis modelu matematycznego jest dobry dla populacji w których

Bardziej szczegółowo

Oprogramowanie dla GWAS

Oprogramowanie dla GWAS BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki - projekt 3. Charakterystyka przedmiotu 4. Kontakt 5. Literatura Copyright 2017 Joanna Szyda KATEDRA

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZA 1. Wykład wstępny. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. ajczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Modelowanie danych hodowlanych

Modelowanie danych hodowlanych Modelowanie danych hodowlanych 1. Wykład wstępny 2. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Znaczenie analiz DNA w praktycznej hodowli bydła w Polsce

Znaczenie analiz DNA w praktycznej hodowli bydła w Polsce S. Kamiński Wiadomości Zootechniczne, R. LIII (2015), 2: 46 51 Znaczenie analiz DNA w praktycznej hodowli bydła w Polsce Stanisław Kamiński Uniwersytet Warmińsko-Mazurski, Katedra Genetyki Zwierząt, ul.

Bardziej szczegółowo

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji

Bardziej szczegółowo

Modelowanie rynków finansowych

Modelowanie rynków finansowych Zaj ecia 2 8 października, 2012 Plan zaj eć 1 Czym nie b edziemy si e zajmować - finanse behawioralne 2 Autokorelacja mi edzy stopami zwrotu Efekt kalendarza Efekt wielkości firmy 3 Pu lapka reprezentatywności

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP WSTĘP 1. SNP 2. haplotyp 3. równowaga sprzężeń 4. zawartość bazy HapMap 5. przykłady zastosowań Copyright 2013, Joanna Szyda HAPMAP BAZA DANYCH HAPMAP - haplotypy

Bardziej szczegółowo

INFORMATYKA W SELEKCJI

INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne

Bardziej szczegółowo

Normy wektorów i macierzy

Normy wektorów i macierzy Rozdzia l 3 Normy wektorów i macierzy W tym rozdziale zak ladamy, że K C. 3.1 Ogólna definicja normy Niech ψ : K m,n [0, + ) b edzie przekszta lceniem spe lniaj acym warunki: (i) A K m,n ψ(a) = 0 A = 0,

Bardziej szczegółowo

Opracowanie metod genomowej oceny wartości

Opracowanie metod genomowej oceny wartości Praktyczne wykorzystanie oceny wartości hodowlanej Wiadomości Zootechniczne, R. LVI (2018), 3: 11 16 Praktyczne wykorzystanie oceny wartości hodowlanej Monika Skarwecka, Piotr Topolski Instytut Zootechniki

Bardziej szczegółowo

Wstęp do selekcji genomowej z punktu widzenia praktycznego. Ignacy Misztal University of Georgia

Wstęp do selekcji genomowej z punktu widzenia praktycznego. Ignacy Misztal University of Georgia Wstęp do selekcji genomowej z punktu widzenia praktycznego Ignacy Misztal University of Georgia Katedra Hodowli na Uniwersytecie w Georgii 10-15 osób (profesorowie, adiunkci, doktoranci + goście) Nacisk

Bardziej szczegółowo

Mapowanie gen ow 10 maja 2004

Mapowanie gen ow 10 maja 2004 Mapowanie genów 10 maja 2004 Co daje identyfikacja genów? 1 poszerzenie wiedzy podstawowej perspektywy przyspieszenia i zwi ekszenia efektywności selekcji precyzyjne wprowadzanie obych genów do populacji

Bardziej szczegółowo

ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 3 Tablice trwania życia 2

ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 3 Tablice trwania życia 2 Wst ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 3 Tablice trwania życia 2 1 Przypomnienie Jesteśmy już w stanie wyznaczyć tp x = l x+t l x, gdzie l x, l x+t, to liczebności kohorty odpowiednio

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu lista nr 7

Statystyka w analizie i planowaniu eksperymentu lista nr 7 Statystyka w analizie i planowaniu eksperymentu lista nr 7 1 B l edy pomiaru Wskutek niedoskona lości przyrzadów jak również niedoskona lości naszych zmys lów - wszystkie pomiary sa dokonywane z określonym

Bardziej szczegółowo

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI JOANNA SZYDA MAGDALENA FRĄSZCZAK MAGDA MIELCZAREK WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Pytania i odpowiedzi

Pytania i odpowiedzi Pytania i odpowiedzi Czy kontrola jakości płytek w programach analizy danych jest dostosowywana do przeprowadzanego badania, czy też przyjmuje się jednakową jej wartość dla różnych analiz? We wstępnym

Bardziej szczegółowo

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki. Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki. Zaj ecia 5 Natalia Nehrebeceka 04 maja, 2010 Plan zaj eć 1 Rachunek prawdopodobieństwa Wektor losowy Wartość oczekiwana Wariancja Odchylenie

Bardziej szczegółowo

GENETYKA POPULACJI. Ćwiczenia 1 Biologia I MGR /

GENETYKA POPULACJI. Ćwiczenia 1 Biologia I MGR / GENETYKA POPULACJI Ćwiczenia 1 Biologia I MGR 1 ZAGADNIENIA struktura genetyczna populacji obliczanie frekwencji genotypów obliczanie frekwencji alleli przewidywanie struktury następnego pokolenia przy

Bardziej szczegółowo

Badania asocjacyjne w skali genomu (GWAS)

Badania asocjacyjne w skali genomu (GWAS) Badania asocjacyjne w skali genomu (GWAS) Część 2 LD, PCA Bioinżynieria, I mgr Bioinformatyczna analiza danych Wykład 3 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt Analiza głównych

Bardziej szczegółowo

ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI. Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt

ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI. Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI Fot. W. Wołkow Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt POPULACJA Zbiór organizmów żywych, które łączy

Bardziej szczegółowo

ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 2 Tablice trwania życia

ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 2 Tablice trwania życia Wst ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 2 Tablice trwania życia 1 Cele (na dzisiaj): Zrozumieć w jaki sposób można wyznaczyć przysz ly czas życia osoby w wieku x. Zrozumieć parametry

Bardziej szczegółowo

Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni

Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni Gurgul A., Jasielczuk I., Semik-Gurgul E., Pawlina-Tyszko K., Szmatoła T., Bugno-Poniewierska M. Instytut Zootechniki PIB Zakład Biologii

Bardziej szczegółowo

OCENA TYPU i BUDOWY KRÓW MLECZNYCH

OCENA TYPU i BUDOWY KRÓW MLECZNYCH WYDZIAŁ OCENY TYPU i BUDOWY BYDŁA MLECZNEGO OCENA TYPU i BUDOWY KRÓW MLECZNYCH 129 POLSKA FEDERACJA HODOWCÓW BYDŁA i PRODUCENTÓW MLEKA 130 OCENA TYPU i BUDOWY KRÓW MLECZNYCH OCENA TYPU i BUDOWY KRÓW MLECZNYCH

Bardziej szczegółowo

Z poprzedniego wykładu

Z poprzedniego wykładu PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne

Bardziej szczegółowo

SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac:

SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac: SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ Ewa Madalińska na podstawie prac: [1] Lukaszewicz,W. (1988) Considerations on Default Logic: An Alternative Approach. Computational Intelligence, 44[1],

Bardziej szczegółowo

Jeden przyk lad... czyli dlaczego warto wybrać MIESI.

Jeden przyk lad... czyli dlaczego warto wybrać MIESI. Jeden przyk lad... czyli dlaczego warto wybrać MIESI. Micha l Ramsza Szko la G lówna Handlowa Micha l Ramsza (Szko la G lówna Handlowa) Jeden przyk lad... czyli dlaczego warto wybrać MIESI. 1 / 13 Dlaczego

Bardziej szczegółowo

Zakres i metodyka prowadzenia oceny wartości użytkowej bydła typu użytkowego mlecznego i mięsno-mlecznego

Zakres i metodyka prowadzenia oceny wartości użytkowej bydła typu użytkowego mlecznego i mięsno-mlecznego Zakres i metodyka prowadzenia oceny wartości użytkowej bydła typu użytkowego mlecznego i mięsno-mlecznego w zakresie cech produkcji mleka przez Polską Federację Hodowców Bydła i Producentów Mleka w Warszawie

Bardziej szczegółowo

Pochodne cz ¾astkowe i ich zastosowanie.

Pochodne cz ¾astkowe i ich zastosowanie. Pochodne cz ¾astkowe i ich zastosowanie. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Pochodne cz ¾astkowe i ich zastosowanie. maj 2013 1 / 18 Zanim przejdziemy do omawiania pochodnych funkcji wielu zmiennych

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

ZARZĄDZANIE POPULACJAMI ZWIERZĄT SPOKREWNIENIE INBRED

ZARZĄDZANIE POPULACJAMI ZWIERZĄT SPOKREWNIENIE INBRED ZARZĄDZANIE POPULACJAMI ZWIERZĄT SPOKREWNIENIE INBRED Rodowody wraz z wynikami kontroli użytkowości stanowią podstawową informację potrzebną do doskonalenia zwierząt X S D C F C F C S D F strzałka oznacza

Bardziej szczegółowo

Grupy i cia la, liczby zespolone

Grupy i cia la, liczby zespolone Rozdzia l 1 Grupy i cia la, liczby zespolone Dla ustalenia uwagi, b edziemy używać nast epuj acych oznaczeń: N = { 1, 2, 3,... } - liczby naturalne, Z = { 0, ±1, ±2,... } - liczby ca lkowite, W = { m n

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych round Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 13 grudnia 2014 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie

Bardziej szczegółowo

Omówienie audytu gospodarstw ocena potencjalnych możliwości poprawy wyników produkcyjnych w gospodarstwach objętych programem Zdrowa Krowa

Omówienie audytu gospodarstw ocena potencjalnych możliwości poprawy wyników produkcyjnych w gospodarstwach objętych programem Zdrowa Krowa Omówienie audytu gospodarstw ocena potencjalnych możliwości poprawy wyników produkcyjnych w gospodarstwach objętych programem Zdrowa Krowa Marcin Gołębiewski, Jan Slósarz SGGW w Warszawie; Wydział Nauk

Bardziej szczegółowo

WSTĘP Oprogramowanie dla GWAS

WSTĘP Oprogramowanie dla GWAS ANALIZA DANYCH 1. Wykład wstępny 2. Charakterystyka danych 3. Analiza wstępna genomiczna charakterystyka cech 4. Prezentacje grup roboczych analiza wstępna 5. Prezentacje grup roboczych analiza wstępna

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2015/2016. Forma studiów: Stacjonarne Kod kierunku: 12.

Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2015/2016. Forma studiów: Stacjonarne Kod kierunku: 12. Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Zdrowia obowiązuje studentów rozpoczynających studia w roku akademickim 201/2016 Kierunek studiów: Pielęgniarstwo Profil: Praktyczny

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie

Bardziej szczegółowo

PORÓWNYWANIE POPULACJI POD WZGLĘDEM STRUKTURY

PORÓWNYWANIE POPULACJI POD WZGLĘDEM STRUKTURY PORÓWNYWANIE POPULACJI POD WZGLĘDEM STRUKTURY obliczanie dystansu dzielącego grupy (subpopulacje) wyrażonego za pomocą indeksu F Wrighta (fixation index) w modelu jednego locus 1 Ćwiczenia III Mgr Kaczmarek-Okrój

Bardziej szczegółowo