Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Podobne dokumenty
Pakiety statystyczne Wykªad 14

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Pakiety statystyczne - Wykªad 8

Podstawy statystycznego modelowania danych - Wykªad 7

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

In»ynierskie zastosowania statystyki wiczenia

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Modele wielorównaniowe. Estymacja parametrów

Biostatystyka, # 5 /Weterynaria I/

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Metody probablistyczne i statystyka stosowana

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

MODELE LINIOWE i MIESZANE

Biostatystyka, # 4 /Weterynaria I/

Podstawy statystycznego modelowania danych Analiza prze»ycia

Rozwini cia asymptotyczne dla mocy testów przybli»onych

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Informatyka w selekcji - Wykªad 1

3. (8 punktów) EGZAMIN MAGISTERSKI, Biomatematyka

Modele wielorównaniowe. Problem identykacji

Ekonometria - wykªad 8

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)

Ekonometria Bayesowska

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Wst p do ekonometrii II

Ekonometria. wiczenia 3 Autokorelacja, heteroskedastyczno±, wspóªliniowo± Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

CAŠKOWANIE METODAMI MONTE CARLO Janusz Adamowski

Rozdziaª 5. Modele wektorowej autoregresji

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Statystyka matematyczna - ZSTA LMO

Elementy Modelowania Matematycznego Wykªad 1 Prawdopodobie«stwo

Ekonometria Bayesowska

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Ekonometria - wykªad 1

Statystyka matematyczna - ZSTA LMO

Rachunek ró»niczkowy funkcji jednej zmiennej

Matematyka z elementami statystyki

Andrzej D browski. Analiza danych jako±ciowych

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Wykªad 6: Model logitowy

Weryfikacja hipotez statystycznych

Metody bioinformatyki (MBI)

Ukªady równa«liniowych - rozkªady typu LU i LL'

Rozdziaª 4. Jednowymiarowe modele szeregów czasowych

Aproksymacja funkcji metod najmniejszych kwadratów

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Ekonometria Przestrzenna

Lab. 02: Algorytm Schrage

Ekonometria Bayesowska

Liniowe zadania najmniejszych kwadratów

Dynamiczne wªasno±ci algorytmu propagacji przekona«

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach. a) (6 pkt.) oblicz intensywno± pªaconych skªadek;

Egzamin z ekonometrii - wersja ogólna

Ukªady równa«liniowych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Twierdzenie Wainera. Marek Czarnecki. Warszawa, 3 lipca Wydziaª Filozoi i Socjologii Uniwersytet Warszawski

Ekonometria. wiczenia 5 i 6 Modelowanie szeregów czasowych. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Ekonometria Bayesowska

Przykªadowe analizy. Grzegorz Kemski. 26 listopada 2008

wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. Metodyka bada«do±wiadczalnych dr hab. in». Sebastian Skoczypiec Cel wiczenia Zaªo»enia

Własności statystyczne regresji liniowej. Wykład 4

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych

Wykład 5 Teoria eksperymentu

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Wykªad 1+2: Klasyczny model regresji liniowej. Podstawy R

Rozdziaª 7. Modele klasy ARCH

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Podstawy statystycznego modelowania danych Analiza prze»ycia. Tomasz Suchocki

Ekonometria Bayesowska

Makroekonomia Zaawansowana

Elementarna statystyka Test Istotno±ci (Tests of Signicance)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Stacjonarne szeregi czasowe

Funkcje wielu zmiennych

Zadania z rachunku prawdopodobie«stwa

Testy nieparametryczne

r = x x2 2 + x2 3.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

E k o n o m e t r i a S t r o n a 1

Metoda największej wiarogodności

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Egzamin z ekonometrii - wersja IiE, MSEMAT

Funkcje wielu zmiennych

Matematyka wykªad 1. Macierze (1) Andrzej Torój. 17 wrze±nia Wy»sza Szkoªa Zarz dzania i Prawa im. H. Chodkowskiej

Rozdziaª 6. Strukturalne modele VAR

Spis tre±ci. Plan. 1 Pochodna cz stkowa. 1.1 Denicja Przykªady Wªasno±ci Pochodne wy»szych rz dów... 3

Ekonometria Przestrzenna

Statystyka opisowa. Wykªad II. Elementy statystyki opisowej. Edward Kozªowski.

Liniowe równania ró»niczkowe n tego rz du o staªych wspóªczynnikach

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Transkrypt:

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

Plan wykªadu Model mieszany 1. Podstawy teoretyczne 2. Przykªady w R Tomasz Suchocki, Modele liniowe... Wykªad 2 2/27

Model mieszany zmienna zale»na jest typu ci gªego komplementarnie do efektów staªych mo»emy okresli efekty losowe, które w modelu uwzgl dniamy jako realizacje zmiennej losowej o pewnych parametrach Tomasz Suchocki, Modele liniowe... Wykªad 2 3/27

Dlaczego u¹ywamy efektów losowych? Efektów tych mo»e by tak du»o,»e zamiast traktowa je jako parametry modelu, przyjmujemy,»e s to zmienne losowe z zadanego rozkªadu prawdopodobie«stwa, którego parametry b d parametrami modelu. Mo»emy nie by zainteresowani bezpo±redni ocen warto±ci efektów, lecz raczej zmienno±ci tych efektów w populacji. Tomasz Suchocki, Modele liniowe... Wykªad 2 4/27

Ogólna posta modelu: Efekty staªe: X β y = X β + Zu + ɛ, X - macierz wyst pie«dla efektów staªych (n p) β - parametry do estymacji (p 1) Efekty losowe: Zu Z - macierz wyst pie«dla efektów losowych (n q) u - wektor zmiennych losowych odpowiadaj cych efektom losowym (q 1) Tomasz Suchocki, Modele liniowe... Wykªad 2 5/27

Residua: ɛ - bªedy losowe (n 1) Zakªada si,»e wektory u i ɛ s niezale»ne i pochodz z rozkªadów normalnych: u N (0, G), z macierz G = Aσu 2 o wymiarach (q q) ɛ N (0, R), z macierz R = I σ 2 ɛ o wymiarach (n n) Przy powy»szych zaªo»eniach wariancja zmiennej y ma posta : Var(y) = V = ZGZ T + R Tomasz Suchocki, Modele liniowe... Wykªad 2 6/27

Estymatory efektów staªych β uzyskane przy pomocy metody najwi kszej wiarygodno±ci: y N (X β, V ) z macierz V = ZGZ T + R Funkcja wiarygodno±ci powy»szego modelu mieszanego ma posta 2 log L = n log (2π) + log V + (y X β) T V 1 (y X β) β = ( X T V 1 X ) 1 X T V 1 y Tomasz Suchocki, Modele liniowe... Wykªad 2 7/27

Jak otrzyma funkcj najwi kszej wiarygodno±ci? Wiemy,»e je»eli z N (A, B) to g sto± prawdopodobie«stwa zmiennej y ma posta ( 1 (2π) n exp 1 ) 2 B 1 2 2 (z A)T B 1 (z A) Korzystaj c z tego faktu mamy i z tego,»e y N (X β, V ) otrzymujemy ( 1 L = (2π) n exp 1 ) 2 V 1 2 2 (y X β)t V 1 (y X β) Tomasz Suchocki, Modele liniowe... Wykªad 2 8/27

Logarytmuj c otrzyman funckj wiarygodno±ci otrzymujemy log L = n 2 log (2π) 1 2 log V 1 2 (y X β)t V 1 (y X β) Mno» c otrzymany logarytm funkcji wiarygodno±ci przez liczb ( 2) otrzymujemy ostateczn posta funkcji wiarygodno±ci. Tomasz Suchocki, Modele liniowe... Wykªad 2 9/27

Jak otrzyma wzór na estymatory parametrów β metod najwi kszej wiarygodno±ci? 2 log L=n log (2π) + log V + y T V 1 y y T V 1 X β β T X T V 1 y + β T X T V 1 X β Ró»niczkuj c powy»sz funkcj wzgl dem parametru β i otrzymujemy ( 2 log L) = y T V 1 X X T V 1 y + 2X T V 1 X β β = 2X T V 1 y + 2X T V 1 X β Tomasz Suchocki, Modele liniowe... Wykªad 2 10/27

Otrzyman ró»niczk funkcji wiarygodno±ci przyrównujemy do 0 i otrzymujemy ( 2 log L) β β = = 2X T V 1 y + 2X T V 1 X β = 0 ( X T V 1 X ) 1 X T V 1 y Tomasz Suchocki, Modele liniowe... Wykªad 2 11/27

FAKT: Var(Ay) = A Var(y) A T, dla zmiennej losowej y i znanej macierzy A Tomasz Suchocki, Modele liniowe... Wykªad 2 12/27

Macierz wariancji-kowariancji dla efektów staªych: ) ( ( ) ) 1 Var ( β =Var X T V 1 X X T V 1 y ( ) 1 ( ) ( ) 1 = X T V 1 X X T V 1 Var(y)V 1 X X T V 1 X Podstawiaj c za Var(y) = V otrzymujemy ) ( ) 1 ( ) ( ) 1 Var ( β = X T V 1 X X T V 1 VV 1 X X T V 1 X i ostatecznie mamy ) ( ) 1 Var ( β = X T V 1 X Tomasz Suchocki, Modele liniowe... Wykªad 2 13/27

Testowanie istotno±ci efektów staªych (Test Walda): Dla ka»dego efektu β j, j = 1,..., p mamy SE( β j ) = diag(var( β) j ) Hipotezy H 0 : β j = 0 vs. H 1 : β j 0 Statystyka testowa W = β j SE( β j ) Statystyka W przy prawdziwo±ci H 0 ma rozkªad N (0, 1) Tomasz Suchocki, Modele liniowe... Wykªad 2 14/27

Testowanie istotno±ci efektów staªych (Test Walda): Hipotezy H 0 : Lβ = 0 vs. H 1 : Lβ 0, dla danej macierzy kontrastu L Statystyka testowa W = β T L T [ L(X T V 1 X ) 1 L T ] 1 L β Statystyka W przy prawdziwo±ci H 0 ma rozkªad chi 2 z liczb stopni swobody rown rz dowi macierzy L Tomasz Suchocki, Modele liniowe... Wykªad 2 15/27

Testowanie istotno±ci efektów staªych (Test oparty na ilorazie wiarygodno±ci - porównywanie modeli z ró»n ilo±ci efektów staªych): Hipotezy H 0 : beta Ω 0, gdzie Ω 0 Ω Statystyka testowa 2 log λ N = 2 log L Ω 0 L Ω Statystyka przy prawdziwo±ci H 0 ma rozkªad chi 2 z liczb stopni swobody rown ró»nicy parametrów pomi dzy Ω i Ω 0 Tomasz Suchocki, Modele liniowe... Wykªad 2 16/27

Estymacja parametrów wariancji: 2 log L REML = 2 log L + log X T V 1 X Metody estymacji parametrów wariancji: EM Newton-Raphson Fisher scoring Tomasz Suchocki, Modele liniowe... Wykªad 2 17/27

Testowanie istotno±ci efektów losowych (Test oparty na ilorazie wiarygodno±ci): Hipotezy H 0 : σ 2 u = 0 Statystyka testowa 2 log λ N = 2 log L zredukowanej + 2 log L penej Statystyka przy prawdziwo±ci H 0 jest mieszanin rozkªadów chi 2 z 0 i 1 stopniem swobody ( 1 2 χ2 0 + 1 2 χ2 1 ) Tomasz Suchocki, Modele liniowe... Wykªad 2 18/27

Porównywanie modeli: AIC = 2 log L + 2s BIC = 2 log L + s log (n ) gdzie s - liczba wszystkich parametrów w modelu n = n p dla funkcji L REML n = n dla funkcji L Tomasz Suchocki, Modele liniowe... Wykªad 2 19/27

Predykcja efektów losowych: ( X T R 1 X X T R 1 ) ) Z ( β Z T R 1 X Z T R 1 Z + G 1 = û Warto przypomnie sobie funkcje cbind() i rbind() ( X T R 1 ) y Z T R 1 y Tomasz Suchocki, Modele liniowe... Wykªad 2 20/27

Przykªad Zbiór danych o nazwie "milkgene¹ pakietu "PBImisc". Kolejne kolumny zawieraj : numer krowy numer laktacji gen BTM3a1 wydajno± mleczn wydajno± tªuszczu Tomasz Suchocki, Modele liniowe... Wykªad 2 21/27

Przykªad Chcemy sprawdzi, czy obserwowana mutacja w genie BTN3a1 wpªywa na mleczno± krów. Mamy 915 pomiarów mleczno±ci dla osobników o genotypie 1 i 85 pomiarów dla genotypu 2. Nie mo»na zastosowa w tym przypadku testu t-studenta dla dwóch grup, ani modelu z jednym efektem staªym genu poniewa» cz ± osobników byªa mierzona wi cej ni» jeden raz (przez kilka laktacji). Aby uwzgl dni podobie«stwo w pomiarach do modelu doªo»ymy efekt losowy osobnika. Wybieramy efekt losowy, poniewa» krów jest du»o i nie chcemy wprowadza tak wielu parametrów do modelu. Dodatkowo nie interesuje nas efekt pojedynczych osobników, a efekt genu. Tomasz Suchocki, Modele liniowe... Wykªad 2 22/27

Przykªad Model: y mleko = X btn3a1 β btn3a1 + X laktacja β laktacja + Z krowa u krowa + ɛ u krowa - efekt losowy o rozkªadzie N (0, σ 2 krowa ) macierz Z krowa ma wymiary 1000 409, z i,j = 1 gdy wiersz i dotyczy j tego osobnika oraz 0 w przeciwnym razie. Tomasz Suchocki, Modele liniowe... Wykªad 2 23/27

Przykªad Formuªa: require(lme4) m1=lmer(milk btn3a1+lactation+(1 cow.id),data=milkgene) Otrzymujemy wyniki: Efekt staªy genu 244.07. O tyle ±rednio wy»sza jest mleczno± osobników o genotypie 2 od osobników o genotypie 1. Parametr σ 2 krowa = 1240403 i jest praktycznie równy wariancji bª du. Nale»y sprawdzi zaªo»enia modelu tzn. Normalno± reszt i efektów losowych oraz ich niezale»no±. Tomasz Suchocki, Modele liniowe... Wykªad 2 24/27

Przykªad Istotno± efektów staªych: summary(m1)$coefs - testy t-studenta test opary na ilorazie wiarygodno±ci tzn. tworzymy dwa modele z i bez efektu genu btn3a1, nast pnie obliczamy logarytmy funkcji wiarygodno±ci dla ka»dego z modeli i wyznaczamy statystyk λ. Rozkªad lambdy to χ 2 1. Istotno± efektów losowych: test opary na ilorazie wiarygodno±ci tzn. tworzymy dwa modele z i bez efektu genu osobniczego, nast pnie obliczamy logarytmy funkcji wiarygodno±ci dla ka»dego z modeli i wyznaczamy statystyk λ. Rozkªad lambdy to 1 2 χ2 0 + 1 2 χ2 1. Tomasz Suchocki, Modele liniowe... Wykªad 2 25/27

Przykªad Istotno± efektów staªych: Efekt genu BTN3a1 wynosi 1.03 z p-warto±ci p = 0.299 Istotno± efektów losowych: Statystyka λ = 243.92 z p-warto±ci p = 5.49e 55 Tomasz Suchocki, Modele liniowe... Wykªad 2 26/27

Dzi kuj za uwag Tomasz Suchocki, Modele liniowe... Wykªad 2 27/27