Dane zgrupowane: każda obserwacja należy do jednej grupy i jest tylko jeden czynnik grupujący

Podobne dokumenty
Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Elementy statystyki STA - Wykład 5

Metoda najmniejszych kwadratów

Weryfikacja hipotez statystycznych

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testowanie hipotez statystycznych.

Metoda największej wiarogodności

Stosowana Analiza Regresji

Testowanie hipotez statystycznych.

Matematyka ubezpieczeń majątkowych r.

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

Natalia Neherbecka. 11 czerwca 2010

Kolokwium ze statystyki matematycznej

Własności statystyczne regresji liniowej. Wykład 4

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka matematyczna dla leśników

Testy post-hoc. Wrocław, 6 czerwca 2016

Prawdopodobieństwo i statystyka r.

Metody Ekonometryczne

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Metoda największej wiarygodności

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Wykład 5 Teoria eksperymentu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

METODY STATYSTYCZNE W BIOLOGII

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Stosowana Analiza Regresji

Statystyka Matematyczna Anna Janicka

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Prawdopodobieństwo i statystyka r.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Prawdopodobieństwo i rozkład normalny cd.

Stosowana Analiza Regresji

Zawansowane modele wyborów dyskretnych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Analiza wariancji, część 2

Analiza kanoniczna w pigułce

STATYSTYKA MATEMATYCZNA

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Redukcja wariancji w metodach Monte-Carlo

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Stanisław Cichocki. Natalia Nehrebecka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Ekonometria. Zajęcia

166 Wstęp do statystyki matematycznej

Rozdział 8. Regresja. Definiowanie modelu

WYKŁAD 8 ANALIZA REGRESJI

Wprowadzenie do analizy korelacji i regresji

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

PDF created with FinePrint pdffactory Pro trial version

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Elementy statystyki wielowymiarowej

Analiza wariancji i kowariancji

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Ekonometria egzamin 07/03/2018

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Estymacja parametrów rozkładu cechy

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Transkrypt:

1 Wstęp 1.1 Czym są efekty losowe? Jednokierunkowa ANOVA Na poprzednich zajęciach mówiliśmy o modelach liniowych, o jedno- i dwuczynnikowej analizie wariancji. W tych modelach estymowaliśmy nieznane wartości stałych parametrów, W ANOVIE rolę parametrów pełniły efekty różnych poziomów czynnika. W tym przypadku obserwacje zmiennej odpowiedzi możemy zapisać jako: Y ij = µ + α i + ε ij i = 1, 2,..., k, j = 1, 2,..., n Y ij - j-ta obserwacja na i-tym poziomie czynnika µ - ogólna wartość średnia α i - efekt i-tego poziomu czynnika ε ij - niezależne zmienne losowe N(0, σ 2 ) Obserwacje Y ij, j = 1, 2,..., n dla każdej ustalonej wartości wskaźnika i tworzą grupę. Efekty α i są stałymi o nieznanych wartościach, zakłądaliśmy przy tym, że ki=1 α i = 0. Bez takiego założenia wielkościµ i α i nie byłyby określone jednoznacznie. Dane zgrupowane: każda obserwacja należy do jednej grupy i jest tylko jeden czynnik grupujący hierarchiczne, zagnieżdżone zbiory danych - bardziej skomplikowane przypadki nie możemy zakładać niezależności obserwacji, obserwacje są skorelowane w ramach grup efekty losowe - wygodne do modelowania tego typu danych Użycie efektów losowych jest popularnym sposobem używanym do modelowania takich danych. 1. Efekt stały - nieznana liczba, którą estymujemy z danych Są często używane w modelach liniowych i uogólnionych modelach liniowych 2. Efekt losowy - zmienna losowa, estymujemy parametry opisujące rozkład efektu losowego 1

1.2 Przykłady 1. Z astronomii: 1861 r. - astronom Airy sformułował model Y ij = µ + α i + ε ij z losowymi efektami α i do opisu obserwowanych przez teleskop obiektów astronomicznych. Obserwacje Y ij opisywane są mianowicie jako suma parametru stałego µ, określającego średnią wartość obserwacji, losowego efektu i-tej nocy α i, spowodowanego zmiennyim warunkami atmosferyczymi lub innymi czynnikami losowymi charakterstycznymi (i stałymi) dla danej nocy, oraz błedu losowego ε ij obserwacji Y ij spowodowanego czynnikami losowymi różnymi od czynników stałych dla danej nocy, składających się na efekt α i. Jasne, że potraktowanie efektu czynnika nocy jako stałego, a nie losowego, byłoby bardzo grubym błędem. 2. Z medycyny: Zazwyczaj interesuje nas lecznie konkretnymi lekami i traktujemy efekty wywołane przez te leki jako stałe. Sensownie jest jednak uznać efekt pacjentów za losowy. Traktujemy pacjentów poddanych leczeniu, jako wybranych losowo z większego zbioru pacjentów, których cechy chcemy estymować. Zwykle nie interesuje nas wyłącznie ta wąska grupa pacjentów, ale cała populacja pacjentów. Kiedy używać efektów losowych? Czasem w miarę jasne jest, że np. lepiej byłoby użyć efektów losowych, ale w niektórych przypadkach, może być kwestią dyskusji, czy efekty losowe czy stałe będą bardziej odpowiednie. Użycie efektów losowych jest ambitniejsze w takim sensie, że próbujemy powiedzieć coś o szerszej populacji a nie tylko naszej konkretnej próbce. gdy efektom danego czynnika nie można przypisać charakteru stałego, należy uznać je za losowe gdy chcemy uzyskać informacje o całej populacji, nasze obserwacje traktujemy jako próbkę z całej populacji niektórzy statystycy polecają zawsze używanie efektów losowych 1.3 Model mieszany Z efektami, które rozsądnie jest przedstawić jako losowe, spotykamy sięw praktyce nierzadko, zwłąszcza wtedy, gdy mamy do czynienia ze zjawiskami bardziej złożonymi, niż zjawiska dające sięopisać za pomocą modelu jednokierunkowej klasyfikacji. Jak wiadomo, modele analizy wariancji możemy przedstawić jako modele liniowej analizy regresji z odpowiednio okreśłoną macierzą planu doświadczenia X. 2

w modelu mieszanym pojawiają się efekty stałe i efekty losowe najprostszy przykład - model dwukierunkowej klasyfikacji: gdzie µ, τ i - efekty stałe efekty losowe, i.i.d.: ν j N(0, σ 2 ν) ε ijk N(0, σ 2 ) y ijk = µ + τ i + ν j + ε ijk Przykład - badania biologiczne: Dla przykładu, w badanich biologicznych często bada sięjakąścehcę potomków zadanej populacji l matek. Powiedzmy, że wartość tej cechy rozsądnie jest uzależnić od płci potomka. Można wówczas zbadać trafność przyjęcia modelu dwukierunkowej klasyfikacji z efektami czynnika płci, jako efektami stałymi oraz efektem j-tej matki, j = 1, 2,..., l, jako efektem Z efektami, które rozsądnie jest przedstawić jako losowe, spotykamy sięw praktyce nierzadko, zwłąszcza wtedy, gdy mamy do czynienia ze zjawiskami bardziej złożonymi, niż zjawiska dające sięopisać za pomocąmodelu jednokierunkowej klasyfikacji. Y ijk oznacza m-tą obserwację na i-tym poziomie czynnika płeć (m = 2) i j-tym, losowym poziomie czynnika matka, µ jest ogólną wartością średnią, τ i jest (stałym) efektem t-tego poziomu czynnika płeć, ν j jest efektem związanym z j-tą matką, n ij jest liczbą potomków i-tej płci j-tej matki oraz ε ijk są niezależnymi zmiennymi losowymi o rozkładzie normalnym N(o, σ 2 ε). O efektach stałych zakładamy jak w ANOVIE, że sumują się do zera. Dodatkowo zakładamy zwykle, że efekty ν j są nieskorelowane między sobą i z błedami ε ijk, posiadają zerową wartość oczekiwaną i wspólną wariancją σ 2 ν 0, niezależną od wskaźnika j. Estymacja efektów, przykład Hipoteza zerowa przy estymacji efektów: stałych - w modelu mieszanym chcemy estymować τ i i testować hipotezę: H 0 : τ i = 0 i losowych - H 0 : σ 2 ν = 0 Różnica - w pierwszym przypadku musimy przetestować wiele parametrów efektu stałego, podczas gdy w drugim przypadu estymujemy i testujemy jednynie jeden parametr efektu losowego. Teraz powiemy więcej o estymacji i testowaniu modeli losowych i mieszanych. 2 Estymacja Estymacja efektów w modelu losowym jest możliwa przy użyciu: 3

klasyfikacji jednokierunkowej (ANOVY) metody największej wiarogodności (ML) metody największej wiarogodności z restrykcjami (REML) 2.1 Jednokierunkowa klasyfikacja (ANOVA) Najprostszy model losowy - model jednokierunkowej klasyfikacji (ANOVA): i = 1,..., a j = 1,..., n α i N(0, σ 2 α) ε ij N(0, σ 2 ε) Y ij = µ + α i + ε ij Komponenty wariancyjne: σ 2 α, σ 2 ε Wewnątrzgrupowy współczynnik korelacji: ρ = Estymatory Dekompozycja wariancji: SST = SSE + SSA σ2 α σ 2 α +σ2 ε a n i=1 j=1 (yij ȳ )2 = a n i=1 j=1 (yij ȳi )2 + a n i=1 j=1 (ȳi ȳ )2 E(SSE) = a(n 1)σ 2 ε E(SSA) = (a 1)(nσ 2 α + σ 2 ε) Estymatory: ˆσ 2 ε = SSE/(a(n 1)) = MSE ˆσ 2 α = SSA/(a 1) ˆσ2 ε n = MSA MSE n Wady korzystania z ANOVY: estymator wariancji może przyjmować ujemne wartości skomplikowane obliczenia w przypadku gdy dane są niezbalansowane 2.2 Metoda największej wiarogodności (ML) Jak widzimy ANOVA nie jest doskonała. Szukamy metody, która będzie działała dobrze dla danych niezablansowanycy, którą będzie można łatwo zastosować i nie będzie problemów z ujemną wariancją. Te warunki spełnia ML. nie ma takich wad jak ANOVA musimy założyć, jaki rozkład mają błędy i efekty losowe (zwykle rozkład normalny) ML zadziałą też dla innych rozkładów, ale zwykle nie rozważa się innych rozkładów niż rozkład normalny. dla modelu wyłącznie z efektami stałymi mamy model: y = Xβ + ε, y N(Xβ, σ 2 I) 4

gdzie X - macierz planu doświadczenia nxp β - wektor p stałych parametrów ε - wektor błędów losowych Model mieszany Ww. model możemy uogólnić na model mieszany. Mając dane wartości efektów losowych możemy modelować odpowiedź y. dla modelu mieszanego: y = Xβ + Zγ + ε, y γ N(Xβ + Zγ, σ 2 I) gdzie Z - macierz nxq opisująca wpływ efektów losowych na obserwacje y γ - wektor q efektów losowych ε - wektor błędów losowych Przyjmuje się, iż wartości oczekiwane obydwu wektorów losowych są wektorami zerowymi. O macierzy kowariancji wektora ε zakłada się zwykle, że jest macierzą diagonalną o postaci σ 2 I, gdzie I jest macierzą jednostkową. dalej zakładamy, że γ N(0, σ 2 D), Na macierz kowariancji wektora efektów losowych γ nie nakłada się w ogólności żadnych ograniczeń (poza oczywistym wymaganiem jej symetryczności i nieujemnej określoności); macierz tę zapisuję się zwykle jako równą σ 2 D wówczas możemy zapisać rozkład y (bezwarunkowy) vary = varzγ + varε = σ 2 ZDZ T + σ 2 I y N(Xβ, σ 2 (I + ZDZ T )) przyjmuje się, że wektory losowe γ i ε są niezależne Przy takich założeniach macierz kowariancji wektora obserwacji Y ma postać σ 2 ZDZ T + σ 2 I. Najczęściej przyjmuje się ponadto, że zarówno wektor ε jak i wektor γ mają rozkłady normalne (o podanych parametrach) Estymacja przy użyciu metody największej wiarogodności (ML) Gydbyśmy znali D, wówczas moglibyśmy estymować β przy użcyiu metody najmniejszych kwadratów. Jednak estmacja komponentów wariancyjnych D jest jednym z celów naszej analizy. W tej sytuacji jedną z metod estymacji, którą możemy tutaj użyć jest metoda największej wiarogdności. jeśli przyjmiemy, że V = I + ZDZ T, wówczas łączna gęstość y wynosi: logarytm wiarogodności: 1 e 1 (2π) n/2 σ 2 V 1/2 2σ 2 (y Xβ)T V 1 (y Xβ) 5

l(β, σ, D y) = n 2 log2π 1 2 log σ2 V 1 2σ 2 (y Xβ) T V 1 (y Xβ) estymacji podlega nieznany wektor stałych parametrów modelu β, wariancja σ 2 i macierz komponentów wariancyjnych D Wszystko wydaje się proste, jednak w praktyce może to stwarzać trudności. Wady korzystania z metody największej wiarogodności (ML): trudności w przypadku bardziej złożonych modeli, wymagających estymacji większej liczby paremetrów efektów losowych pojawiają się trudności. problem z estymatorem wariancji, gdy maksimum wiarogodności jest przyjmowane dla ujemnych wartości. Często trzeba w takich sytuacjach przyjąć po prostu, że estymator wariancji wynosi zero (gdy pochodna wiarogodności nie zeruje się np. dla wartości nieujemnych). To komplikuje obliczenia numeryczne. estymatory są często dość silnie obciążone (?) 2.3 Metoda największej wiarogodności z restrykcjami (REML) nie ma wielu wad, które dotyczyły ANOVY i ML próbują rozwiązać problem obciążenia dla danych zbalasowanych, estymatory obliczone przy użyciu REML są zwykle takie same jak obliczone przy użyciu ANOVY dostajemy estymatory nieobciążone lub o zredukowanym obciążeniu idea: bierzemy liniową kombinację X taką że K T X = 0. Wówczas: K T y N(0, σ 2 K T V K), następnie możemy korzystać z metody ML (nie mamy już efektów stałych) Kiedy już zastymujemy efekty losowe, możemy łatwo estymować parametry efektów stałych 2.4 R REML Teraz zaprezentujemy estymatory uzyskiwane metodą największej wiarogodności. Używamy pakiety lme4 (dopasowuje modele mieszane; wcześniej nlme). Model jak widzimy ma efekty stałe i losowe. Efekty losowe tutaj to przecięcie prezentowane przez pierwszą jedynkę w formule modelu. Efekty losowe są reprezentowane przez (1 operator) - zaznaczone jest, że dane są zgrupowane po operatorze, 1 oznacza, że fekt losowy jest stały w każdej grupie. 6

REML jest domyślną metodą dopasowania (tutaj jest użyty). Widzimy, że daje identyczne estymatory jak ANOVA, ˆσ 2 = 0.106, ˆσ 2 α = 0.068 i µ = 60.4. Dla danych niezbalansowanych estymatory REMLA i ANOVY niekoniecznie sąidentyczn. ML Możemy też skorzystać z tradycyjnej metody największej wiarogodności. Jak widzimy wariancja między grupami wynosi 0.0482 i jest mniejsza niż w REMLu, natomiast wariancja wewnątrz grupy wynosi 0.1118 i jest większa niż poprzednio. 3 Testowanie 3.1 Test ilorazu wiarogodności Używają standardowej teorii wiarogodności, możemy wyprowadzić test, który służy do porównywania dwóch zagnieżdżonych hipotez H 0 ) i H 1, obliczając test ilorazu wiarogodności. Do porównywania hipotez H 0 i H 1 używamy testu ilorazu wiarogodności: 2(l( ˆβ 1, ˆσ 1, ˆD 1 y) l( ˆβ 0, ˆσ 0, ˆD 0 y) gdzie ˆβ 1, ˆσ 1, ˆD 1 - estymatory największej wiarogodności (MLE) parametrów przy hipotezie zerowej ˆβ 0, ˆσ 0, ˆD 0 - MLE przy hipotezie alternatywnej Rozkład zerowy tej statystyki testowej to w przybliżeniu rozkład χ 2 z liczbą stopni swobody równą różnicy stopni swobody w modelu zerowym i pierwszym (w wymiarach dwóch przestrzeni parametrów (gdy modele są identyfikowalne)). Wady testu ilorazu wiarogodności: test jest przybliżony i często przybliżenie to jest nienajlepsze wymaga wielu dodatkowych założeń, np. parametry przy hipotezie zerowej nie mogą być na brzegu przestrzeni parametrów Jako, że w naszym przypadku H 0 : ˆσ 2 = 0, to stanowi to prawdziwy problem. Nawet jeśli te warunki są spełnione, to przybliżenie rozkładu χ 2 jest bardzo kiepskie. 3.2 Testowanie efektów stałych jeśli chcemy użyć testu ilorazu wiarogodności do porównania dwóch zagnieżdżonych modeli, które różnią się tylko efektami stałymi, to nie mo- 7

żemy użyć metody REML do ich porównania. Przyczyną jest to, że REML estymuje efekty losowe przez rozważanie liniowych kombinacji danych, które likwidują efekty stałe. Jeśli te efekty stałe zostaną zmienione, wówczas wiarogodności dwóch modeli nie będą bezpośrednio porównywalne. Jeśli chcemy korzystać z testu ilorazu wiarogodności do testowania efektów stałych używamy ML. p-wartości generowane przez test ilorazu wiarogodności dla efektów stałych są przybliżone i często zbyt małe, przez co wyolbrzymiają wagę niektórych efektów. do znalezienia dokładniejszej p-wartości testu iloraz wiarogodności możemy użyć metody parametryczego bootstrapu. Generujemy dane (przy założeniu modelu zerowego używając dopasowanych estymatorów przy hipotezie zerowej)a następnie obliczamy test ilorazu wiarogodności dla tak wygenerowanych danych. Powtarzamy to wielokrotnie i używamy otrzymanych wyników do ocenienia istotności obserwowanej statystyki testowej. Metoda ta zostanie zaprezentowana później. alternatywnie: możemy użyć standardowych testów F lub t (parametry efektu losowego warunkujemy po estymowanych wartościach) Tutaj zakładamy, że kowariancja losowej części modelu, D, jest równa estymowanej wartości i postępujemy tak jak w metodzie najmniejszych kwadratów. 3.3 Testowanie efektów losowych hipoteza zerowa zwykle ma postać H 0 : σ 2 = 0 problem - to nie jest wnętrze przestrzeni parametrów, a standardowe obliczenie asymptotycznego rozkładu χ 2 dla ilorazu wiarogodności opiera się o hipotezę zerową leżącą we wnętrzu przestrzeni parametrów. To założenie jest złamane, kiedy testujemy, czy wariancja jest równa zero. rozkład zerowy jest wtedy w ogólności nieznany, musimy zastosować metody numeryczne (bootstrap), jeśli chcemy dokładniej testować. jeśli jednak przyjmiemy, że otrzymujemy rozkład χ 2 ze standordową liczbą stopni swobody, wówczas otrzymana p-wartość będzie zwykle większa niż powinna. To oznacza, że jeśli obserwujemy istotny efekt używając przybliżenia χ 2, to możemy być na 100 % pewni, że ten efekt jest rzeczywiście istotny. Jeśli, otrzymujemy wątpliwe wyniki, powinniśmy skorzystać z dokładniejszej, ale czasochłonnej metody bootstrapu. 8