Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Podobne dokumenty
Dane zgrupowane: każda obserwacja należy do jednej grupy i jest tylko jeden czynnik grupujący

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Elementy statystyki STA - Wykład 5

Testowanie hipotez statystycznych.

Metoda najmniejszych kwadratów

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

Matematyka ubezpieczeń majątkowych r.

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Prawdopodobieństwo i statystyka r.

Statystyka Matematyczna Anna Janicka

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Stosowana Analiza Regresji

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Metoda największej wiarygodności

Testowanie hipotez statystycznych.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Porównanie błędu predykcji dla różnych metod estymacji współczynników w modelu liniowym, scenariusz p bliskie lub większe od n

Metoda największej wiarogodności

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Stosowana Analiza Regresji

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i rozkład normalny cd.

Wykład 5 Teoria eksperymentu

Kolokwium ze statystyki matematycznej

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Metody Ekonometryczne

Własności statystyczne regresji liniowej. Wykład 4

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Prawdopodobieństwo i statystyka r.

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Zawansowane modele wyborów dyskretnych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Testowanie hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Ekonometria. Zajęcia

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

METODY STATYSTYCZNE W BIOLOGII

Spis treści 3 SPIS TREŚCI

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Rozdział 8. Regresja. Definiowanie modelu

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Estymacja parametrów rozkładu cechy

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

1 Gaussowskie zmienne losowe

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Prawdopodobieństwo i statystyka

Agata Boratyńska Statystyka aktuarialna... 1

1 Modele ADL - interpretacja współczynników

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Analiza kanoniczna w pigułce

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Estymatory nieobciążone

Wst p do ekonometrii II

Analiza wariancji, część 2

Testowanie hipotez statystycznych cd.

Statystyka i eksploracja danych

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Metody systemowe i decyzyjne w informatyce

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Metody Ekonometryczne

Statystyka matematyczna dla leśników

STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Testowanie hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Czasowy wymiar danych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Statystyka w analizie i planowaniu eksperymentu

Stosowana Analiza Regresji

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

STATYSTYKA MATEMATYCZNA

Analiza wariancji i kowariancji

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Transkrypt:

Bogumiła Koprowska Elżbieta Kukla

1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności z restrykcjami (REML) 3 Testowanie Test ilorazu wiarogodności Testowanie efektów stałych Testowanie efektów losowych

Jednokierunkowa ANOVA Było: Y ij = µ + α i + ε ij i = 1, 2,..., k, j = 1, 2,..., n Y ij - j-ta obserwacja na i-tym poziomie czynnika µ - ogólna wartość średnia α i - efekt i-tego poziomu czynnika ε ij - niezależne zmienne losowe N(0, σ 2 ) Obserwacje Y ij, j = 1, 2,..., n dla każdej ustalonej wartości wskaźnika i tworzą grupę.

Dane zgrupowane każda obserwacja należy do jednej grupy i jest tylko jeden czynnik grupujący hierarchiczne, zagnieżdżone zbiory danych - bardziej skomplikowane przypadki nie możemy zakładać niezależności obserwacji, obserwacje są skorelowane w ramach grup efekty losowe - wygodne do modelowania tego typu danych

Efekt losowy a efekt stały 1 Efekt stały nieznana liczba, którą estymujemy z danych 2 Efekt losowy zmienna losowa, estymujemy parametry opisujące rozkład efektu losowego

Przykłady 1 Z astronomii: 1861 r. - astronom Airy sformułował model Y ij = µ + α i + ε ij z losowymi efektami α i do opisu obserwowanych przez teleskop obiektów astronomicznych 2 Z medycyny: traktowanie pacjentów poddanych leczeniu, jako wybranych losowo z większego zbioru pacjentów, których cechy chcemy estymować

Kiedy używać efektów losowych? gdy efektom danego czynnika nie można przypisać charakteru stałego, należy uznać je za losowe gdy chcemy uzyskać informacje o całej populacji, nasze obserwacje traktujemy jako próbkę z całej populacji niektórzy statystycy polecają zawsze używanie efektów losowych

Model mieszany w modelu mieszanym pojawiają się efekty stałe i efekty losowe najprostszy przykład - model dwukierunkowej klasyfikacji: gdzie y ijk = µ + τ i + ν j + ε ijk i = 1, 2,..., m, j = 1, 2,..., l, k = 1,..., n ij efekty stałe: µ, τ i efekty losowe, i.i.d.: ν j N(0, σ 2 ν) ε ijk N(0, σ 2 )

Estymacja efektów, przykład 1 Hipoteza zerowa przy estymacji efektów: stałych - H 0 : τ i = 0 i losowych - H 0 : σ 2 ν = 0 2 Przykład - badania biologiczne: badanie cechy potomków zadanej populacji l matek, np. efekt czynnika płci - efekt stały, efekt j-tej matki - efekt losowy

Estymacja

Estymacja efektów Estymacja efektów w modelu losowym jest możliwa przy użyciu: klasyfikacji jednokierunkowej (ANOVY) metody największej wiarogodności (ML) metody największej wiarogodności z restrykcjami (REML)

Najprostszy model losowy Model jednokierunkowej klasyfikacji (ANOVA): i = 1,..., a j = 1,..., n α i N(0, σ 2 α) ε ij N(0, σ 2 ε) Y ij = µ + α i + ε ij Komponenty wariancyjne: σ 2 α, σ 2 ε Wewnątrzgrupowy współczynnik korelacji: ρ = σ2 α σ 2 α +σ2 ε

Estymatory Dekompozycja wariancji: a n i=1 j=1 (y ij ȳ ) 2 = a n i=1 j=1 (y ij ȳ i ) 2 + a n i=1 j=1 (ȳ i ȳ ) 2 SST = SSE + SSA E(SSE) = a(n 1)σ 2 ε E(SSA) = (a 1)(nσ 2 α + σ 2 ε) Estymatory: ˆσ 2 ε = SSE/(a(n 1)) = MSE ˆσ 2 α = SSA/(a 1) ˆσ2 ε n = MSA MSE n

Wady ANOVY Wady korzystania z ANOVY: estymator wariancji może przyjmować ujemne wartości skomplikowane obliczenia w przypadku gdy dane są niezbalansowane

Metoda największej wiarogodności (ML) nie ma takich wad jak ANOVA musimy założyć, jaki rozkład mają błędy i efekty losowe (zwykle rozkład normalny) dla modelu wyłącznie z efektami stałymi mamy: y = X β + ε, y N(X β, σ 2 I ) gdzie X - macierz planu doświadczenia nxp β - wektor p stałych parametrów ε - wektor błędów losowych

Model mieszany dla modelu mieszanego: y = X β + Zγ + ε, y γ N(X β + Zγ, σ 2 I ) gdzie Z - macierz nxq opisująca wpływ efektów losowych na obserwacje y γ - wektor q efektów losowych ε - wektor błędów losowych dalej zakładamy, że γ N(0, σ 2 D), wówczas: vary = varzγ + varε = σ 2 ZDZ T + σ 2 I y N(X β, σ 2 (I + ZDZ T )) przyjmuje się, że wektory losowe γ i ε są niezależne

Estymacja przy użyciu metody największej wiarogodności (ML) jeśli przyjmiemy, że V = I + ZDZ T, wówczas łączna gęstość y wynosi: logarytm wiarogodności: 1 e 1 (2π) n/2 σ 2 V 1/2 2σ 2 (y X β)t V 1 (y X β) l(β, σ, D y) = n 2 log2π 1 2 log σ2 V 1 2σ 2 (y X β) T V 1 (y X β) estymacji podlega nieznany wektor stałych parametrów modelu β, wariancja σ 2 i macierz komponentów wariancyjnych D

Wady ML Wady korzystania z metody największej wiarogodności (ML): trudności w przypadku bardziej złożonych modeli, wymagających estymacji większej liczby paremetrów efektów losowych problem z estymatorem wariancji, gdy maksimum wiarogodności jest przyjmowane dla ujemnych wartości estymatory są często dość silnie obciążone

Metoda największej wiarogodności z restrykcjami (REML) nie ma wielu wad, które dotyczyły ANOVY i ML dla danych zbalasowanych, estymatory obliczone przy użyciu REML są zwykle takie same jak obliczone przy użyciu ANOVY dostajemy estymatory nieobciążone lub o zredukowanym obciążeniu idea: bierzemy K - dopełnienie ortogonalne X (tzn. K T X = 0). Wówczas: K T y N(0, σ 2 K T VK), następnie możemy korzystać z metody ML (nie mamy już efektów stałych)

Testowanie

Test ilorazu wiarogodności Do porównywania hipotez H 0 i H 1 używamy testu ilorazu wiarogodności: 2(l( ˆβ 1, ˆσ 1, ˆD 1 y) l( ˆβ 0, ˆσ 0, ˆD 0 y)) gdzie ˆβ 1, ˆσ 1, ˆD 1 - estymatory największej wiarogodności (MLE) parametrów przy hipotezie alternatywnej ˆβ 0, ˆσ 0, ˆD 0 - MLE przy hipotezie zerowej

Wady testu ilorazu wiarogodności Wady testu ilorazu wiarogodności: test jest przybliżony i często przybliżenie to jest nienajlepsze wymaga wielu dodatkowych założeń, np. parametry przy hipotezie zerowej nie mogą być na brzegu przestrzeni parametrów

Testowanie efektów stałych nie możemy użyć metody REML do porównania dwóch modeli, które różnią się tylko efektami stałymi do testowania efektów stałych używamy ML (jeśli chcemy korzystać z testu ilorazu wiarogodności) p-wartości generowane przez test ilorazu wiarogodności dla efektów stałych są przybliżone i często zbyt małe - wyolbrzymiają wagę niektórych efektów do znalezienia dokładniejszej p-wartości możemy użyć metody parametryczego bootstrapu

Testowanie efektów losowych hipoteza zerowa zwykle ma postać H 0 : σ 2 = 0 problem - to nie jest wnętrze przestrzeni parametrów jeśli jednak przyjmiemy, że otrzymujemy rozkład χ 2, wówczas otrzymana p-wartość będzie zwykle większa niż powinna metody numeryczne (bootstrap)

Dziękujemy!