Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t
Plan wykªadu Model mieszany 1. Podstawy teoretyczne 2. Przykªady w R Tomasz Suchocki, Modele liniowe... Wykªad 2 2/27
Model mieszany zmienna zale»na jest typu ci gªego komplementarnie do efektów staªych mo»emy okresli efekty losowe, które w modelu uwzgl dniamy jako realizacje zmiennej losowej o pewnych parametrach Tomasz Suchocki, Modele liniowe... Wykªad 2 3/27
Dlaczego u¹ywamy efektów losowych? Efektów tych mo»e by tak du»o,»e zamiast traktowa je jako parametry modelu, przyjmujemy,»e s to zmienne losowe z zadanego rozkªadu prawdopodobie«stwa, którego parametry b d parametrami modelu. Mo»emy nie by zainteresowani bezpo±redni ocen warto±ci efektów, lecz raczej zmienno±ci tych efektów w populacji. Tomasz Suchocki, Modele liniowe... Wykªad 2 4/27
Ogólna posta modelu: Efekty staªe: X β y = X β + Zu + ɛ, X - macierz wyst pie«dla efektów staªych (n p) β - parametry do estymacji (p 1) Efekty losowe: Zu Z - macierz wyst pie«dla efektów losowych (n q) u - wektor zmiennych losowych odpowiadaj cych efektom losowym (q 1) Tomasz Suchocki, Modele liniowe... Wykªad 2 5/27
Residua: ɛ - bªedy losowe (n 1) Zakªada si,»e wektory u i ɛ s niezale»ne i pochodz z rozkªadów normalnych: u N (0, G), z macierz G = Aσu 2 o wymiarach (q q) ɛ N (0, R), z macierz R = I σ 2 ɛ o wymiarach (n n) Przy powy»szych zaªo»eniach wariancja zmiennej y ma posta : Var(y) = V = ZGZ T + R Tomasz Suchocki, Modele liniowe... Wykªad 2 6/27
Estymatory efektów staªych β uzyskane przy pomocy metody najwi kszej wiarygodno±ci: y N (X β, V ) z macierz V = ZGZ T + R Funkcja wiarygodno±ci powy»szego modelu mieszanego ma posta 2 log L = n log (2π) + log V + (y X β) T V 1 (y X β) β = ( X T V 1 X ) 1 X T V 1 y Tomasz Suchocki, Modele liniowe... Wykªad 2 7/27
Jak otrzyma funkcj najwi kszej wiarygodno±ci? Wiemy,»e je»eli z N (A, B) to g sto± prawdopodobie«stwa zmiennej y ma posta ( 1 (2π) n exp 1 ) 2 B 1 2 2 (z A)T B 1 (z A) Korzystaj c z tego faktu mamy i z tego,»e y N (X β, V ) otrzymujemy ( 1 L = (2π) n exp 1 ) 2 V 1 2 2 (y X β)t V 1 (y X β) Tomasz Suchocki, Modele liniowe... Wykªad 2 8/27
Logarytmuj c otrzyman funckj wiarygodno±ci otrzymujemy log L = n 2 log (2π) 1 2 log V 1 2 (y X β)t V 1 (y X β) Mno» c otrzymany logarytm funkcji wiarygodno±ci przez liczb ( 2) otrzymujemy ostateczn posta funkcji wiarygodno±ci. Tomasz Suchocki, Modele liniowe... Wykªad 2 9/27
Jak otrzyma wzór na estymatory parametrów β metod najwi kszej wiarygodno±ci? 2 log L=n log (2π) + log V + y T V 1 y y T V 1 X β β T X T V 1 y + β T X T V 1 X β Ró»niczkuj c powy»sz funkcj wzgl dem parametru β i otrzymujemy ( 2 log L) = y T V 1 X X T V 1 y + 2X T V 1 X β β = 2X T V 1 y + 2X T V 1 X β Tomasz Suchocki, Modele liniowe... Wykªad 2 10/27
Otrzyman ró»niczk funkcji wiarygodno±ci przyrównujemy do 0 i otrzymujemy ( 2 log L) β β = = 2X T V 1 y + 2X T V 1 X β = 0 ( X T V 1 X ) 1 X T V 1 y Tomasz Suchocki, Modele liniowe... Wykªad 2 11/27
FAKT: Var(Ay) = A Var(y) A T, dla zmiennej losowej y i znanej macierzy A Tomasz Suchocki, Modele liniowe... Wykªad 2 12/27
Macierz wariancji-kowariancji dla efektów staªych: ) ( ( ) ) 1 Var ( β =Var X T V 1 X X T V 1 y ( ) 1 ( ) ( ) 1 = X T V 1 X X T V 1 Var(y)V 1 X X T V 1 X Podstawiaj c za Var(y) = V otrzymujemy ) ( ) 1 ( ) ( ) 1 Var ( β = X T V 1 X X T V 1 VV 1 X X T V 1 X i ostatecznie mamy ) ( ) 1 Var ( β = X T V 1 X Tomasz Suchocki, Modele liniowe... Wykªad 2 13/27
Testowanie istotno±ci efektów staªych (Test Walda): Dla ka»dego efektu β j, j = 1,..., p mamy SE( β j ) = diag(var( β) j ) Hipotezy H 0 : β j = 0 vs. H 1 : β j 0 Statystyka testowa W = β j SE( β j ) Statystyka W przy prawdziwo±ci H 0 ma rozkªad N (0, 1) Tomasz Suchocki, Modele liniowe... Wykªad 2 14/27
Testowanie istotno±ci efektów staªych (Test Walda): Hipotezy H 0 : Lβ = 0 vs. H 1 : Lβ 0, dla danej macierzy kontrastu L Statystyka testowa W = β T L T [ L(X T V 1 X ) 1 L T ] 1 L β Statystyka W przy prawdziwo±ci H 0 ma rozkªad chi 2 z liczb stopni swobody rown rz dowi macierzy L Tomasz Suchocki, Modele liniowe... Wykªad 2 15/27
Testowanie istotno±ci efektów staªych (Test oparty na ilorazie wiarygodno±ci - porównywanie modeli z ró»n ilo±ci efektów staªych): Hipotezy H 0 : beta Ω 0, gdzie Ω 0 Ω Statystyka testowa 2 log λ N = 2 log L Ω 0 L Ω Statystyka przy prawdziwo±ci H 0 ma rozkªad chi 2 z liczb stopni swobody rown ró»nicy parametrów pomi dzy Ω i Ω 0 Tomasz Suchocki, Modele liniowe... Wykªad 2 16/27
Estymacja parametrów wariancji: 2 log L REML = 2 log L + log X T V 1 X Metody estymacji parametrów wariancji: EM Newton-Raphson Fisher scoring Tomasz Suchocki, Modele liniowe... Wykªad 2 17/27
Testowanie istotno±ci efektów losowych (Test oparty na ilorazie wiarygodno±ci): Hipotezy H 0 : σ 2 u = 0 Statystyka testowa 2 log λ N = 2 log L zredukowanej + 2 log L penej Statystyka przy prawdziwo±ci H 0 jest mieszanin rozkªadów chi 2 z 0 i 1 stopniem swobody ( 1 2 χ2 0 + 1 2 χ2 1 ) Tomasz Suchocki, Modele liniowe... Wykªad 2 18/27
Porównywanie modeli: AIC = 2 log L + 2s BIC = 2 log L + s log (n ) gdzie s - liczba wszystkich parametrów w modelu n = n p dla funkcji L REML n = n dla funkcji L Tomasz Suchocki, Modele liniowe... Wykªad 2 19/27
Predykcja efektów losowych: ( X T R 1 X X T R 1 ) ) Z ( β Z T R 1 X Z T R 1 Z + G 1 = û Warto przypomnie sobie funkcje cbind() i rbind() ( X T R 1 ) y Z T R 1 y Tomasz Suchocki, Modele liniowe... Wykªad 2 20/27
Przykªad Zbiór danych o nazwie "milkgene¹ pakietu "PBImisc". Kolejne kolumny zawieraj : numer krowy numer laktacji gen BTM3a1 wydajno± mleczn wydajno± tªuszczu Tomasz Suchocki, Modele liniowe... Wykªad 2 21/27
Przykªad Chcemy sprawdzi, czy obserwowana mutacja w genie BTN3a1 wpªywa na mleczno± krów. Mamy 915 pomiarów mleczno±ci dla osobników o genotypie 1 i 85 pomiarów dla genotypu 2. Nie mo»na zastosowa w tym przypadku testu t-studenta dla dwóch grup, ani modelu z jednym efektem staªym genu poniewa» cz ± osobników byªa mierzona wi cej ni» jeden raz (przez kilka laktacji). Aby uwzgl dni podobie«stwo w pomiarach do modelu doªo»ymy efekt losowy osobnika. Wybieramy efekt losowy, poniewa» krów jest du»o i nie chcemy wprowadza tak wielu parametrów do modelu. Dodatkowo nie interesuje nas efekt pojedynczych osobników, a efekt genu. Tomasz Suchocki, Modele liniowe... Wykªad 2 22/27
Przykªad Model: y mleko = X btn3a1 β btn3a1 + X laktacja β laktacja + Z krowa u krowa + ɛ u krowa - efekt losowy o rozkªadzie N (0, σ 2 krowa ) macierz Z krowa ma wymiary 1000 409, z i,j = 1 gdy wiersz i dotyczy j tego osobnika oraz 0 w przeciwnym razie. Tomasz Suchocki, Modele liniowe... Wykªad 2 23/27
Przykªad Formuªa: require(lme4) m1=lmer(milk btn3a1+lactation+(1 cow.id),data=milkgene) Otrzymujemy wyniki: Efekt staªy genu 244.07. O tyle ±rednio wy»sza jest mleczno± osobników o genotypie 2 od osobników o genotypie 1. Parametr σ 2 krowa = 1240403 i jest praktycznie równy wariancji bª du. Nale»y sprawdzi zaªo»enia modelu tzn. Normalno± reszt i efektów losowych oraz ich niezale»no±. Tomasz Suchocki, Modele liniowe... Wykªad 2 24/27
Przykªad Istotno± efektów staªych: summary(m1)$coefs - testy t-studenta test opary na ilorazie wiarygodno±ci tzn. tworzymy dwa modele z i bez efektu genu btn3a1, nast pnie obliczamy logarytmy funkcji wiarygodno±ci dla ka»dego z modeli i wyznaczamy statystyk λ. Rozkªad lambdy to χ 2 1. Istotno± efektów losowych: test opary na ilorazie wiarygodno±ci tzn. tworzymy dwa modele z i bez efektu genu osobniczego, nast pnie obliczamy logarytmy funkcji wiarygodno±ci dla ka»dego z modeli i wyznaczamy statystyk λ. Rozkªad lambdy to 1 2 χ2 0 + 1 2 χ2 1. Tomasz Suchocki, Modele liniowe... Wykªad 2 25/27
Przykªad Istotno± efektów staªych: Efekt genu BTN3a1 wynosi 1.03 z p-warto±ci p = 0.299 Istotno± efektów losowych: Statystyka λ = 243.92 z p-warto±ci p = 5.49e 55 Tomasz Suchocki, Modele liniowe... Wykªad 2 26/27
Dzi kuj za uwag Tomasz Suchocki, Modele liniowe... Wykªad 2 27/27