Stosowana Analiza Regresji

Podobne dokumenty
Stosowana Analiza Regresji

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Własności statystyczne regresji liniowej. Wykład 4

Stosowana Analiza Regresji

Metoda najmniejszych kwadratów

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Weryfikacja hipotez statystycznych

Metody Ekonometryczne

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Prawdopodobieństwo i statystyka

Statystyka i eksploracja danych

Metody Ekonometryczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Ekonometria egzamin 07/03/2018

Testowanie hipotez statystycznych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Testowanie hipotez statystycznych

Dane zgrupowane: każda obserwacja należy do jednej grupy i jest tylko jeden czynnik grupujący

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Metoda największej wiarogodności

Wybór modelu i ocena jakości klasyfikatora

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

1.1 Klasyczny Model Regresji Liniowej

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Ekonometria dla IiE i MSEMat Z12

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Metoda najmniejszych kwadratów

Statystyka Matematyczna Anna Janicka

Testowanie hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

STATYSTYKA

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

WYKŁAD 8 ANALIZA REGRESJI

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Rozpoznawanie obrazów

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

1.8 Diagnostyka modelu

Statystyka Matematyczna Anna Janicka

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Monte Carlo, bootstrap, jacknife

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

1 Gaussowskie zmienne losowe

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Natalia Neherbecka. 11 czerwca 2010

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Estymacja parametrów rozkładu cechy

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Porównanie błędu predykcji dla różnych metod estymacji współczynników w modelu liniowym, scenariusz p bliskie lub większe od n

Elementy statystyki STA - Wykład 5

Wykład 5 Teoria eksperymentu

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

STATYSTYKA MATEMATYCZNA

1 Estymacja przedziałowa

Analiza kanoniczna w pigułce

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka r.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Transkrypt:

Stosowana Analiza Regresji Wykład VI... 16 Listopada 2011 1 / 24

Jest to rozkład zmiennej losowej rozkład chi-kwadrat Z = n i=1 X 2 i, gdzie X i N(µ i, 1) - niezależne. Oznaczenie: Z χ 2 (n, λ), gdzie: n - liczba stopni swobody, λ = 1 2 n i=1 µ2 i - parametr niecentralności. Fakt. Z χ 2 (n, λ) EZ = n + 2λ, VarZ = 2n + 8λ. Uwaga. Zwykły (n) jest tożsamy z χ(n, 0) i zachodzi: EZ = n, VarZ = 2n dla Z χ 2 (n). 2 / 24

rozkład chi-kwadrat Przykład: 0.00 0.05 0.10 0.15 χ 2 (5) χ 2 (5,5) 0 10 20 30 40 Tw. Z i χ 2 (n i, λ i ) - niezależne k Z i χ 2 ( k n i, k λ i ). i=1 i=1 i=1 3 / 24

Rozkład F Rozkład F jest to rozkład zmiennej losowej W = Z 1/n 1 Z 2 /n 2, gdzie Z 1 χ 2 (n 1 ), Z 2 χ 2 (n 2 ) - niezależne. Oznaczenie: n 1, n 2 - stopnie swobody. W F(n 1, n 2 ), Fakt. W F(n 1, n 2 ) EW = n2 n 2 2, VarW = 2n2 2 (n1+n2 2) n 1(n 2 1) 2 (n 2 4). 4 / 24

Jest to rozkład zmiennej losowej W = Z 1/n 1 Z 2 /n 2, gdzie Z 1 χ 2 (n 1, λ), Z 2 χ 2 (n 2 ) - niezależne. Oznaczenie: n 1, n 2 - stopnie swobody, λ - parametr niecentralności. W F(n 1, n 2, λ), Fakt. W F(n 1, n 2, λ) EW = n2 n 2 2 ( 1 + 2λ n 1 ). 5 / 24

Przykład: 0.0 0.2 0.4 0.6 F(5,10) F(5,10,10) 0 2 4 6 8 10 6 / 24

Rozkład statystyki F Ogólny test liniowy: ω : Y = X 1 β 1 + ε p parametrów Ω : Y = X 1 β 1 + X 2 β 2 + ε p + q parametrów Testujemy: H 0 : ω przeciwko H 1 : Ω \ ω Statystyka F : F = (SSE ω SSE Ω )/q SSE Ω /(n p q) 7 / 24

Rozkład statystyki F Przy H 1 zachodzi: 1 (SSE ω SSE Ω ) niezależne od SSE Ω 2 σ 2 SSE Ω χ 2 (n p q) 3 σ 2 (SSE ω SSE Ω ) χ 2 (q, λ), gdzie λ = σ 2 (Xβ) H 2 Xβ, H 2 = H H 1. Zatem przy hipotezie alternatywnej mamy: F F(q, n p q, λ). może być więc użyty do obliczenia mocy testu (prawd. odrzucenia H 0, gdy H 0 fałszywa). Wykazano, że moc rośnie, gdy n 2 lub λ rośnie, i maleje, gdy n 1 rośnie. 8 / 24

Odchylenie modelu ω od modelu Ω (deviance): dev ω,ω = 2 log L Ω(ˆθ Ω NW ) L ω (ˆθ ω NW ), gdzie: ˆθ NW Ω, ˆθ NW ω - estymatory największej wektora nieznanych parametrów występujących w modelach Ω i ω, odpowiednio. Testy oparte o dev ω,ω nazywamy testami ilorazu (LRT - likelihood ratio test). Przy H 0 : ω mają one z reguły asymptotyczny rozkład chi-kwadrat. 9 / 24

Dla modelu liniowego: jeśli σ 2 znane: L( ˆβ NW ) = { 1 1 } exp (Yi (2πσ 2 ) n/2 2σ 2 x i ˆβ) 2. Zatem Mamy więc dev ω,ω = 1 σ 2 (SSE ω SSE Ω ). F = 1 q SSE ω SSE Ω ˆσ 2 Ω = 1 q dev ω,ω. jeśli σ 2 nieznane: dev ω,ω = n log SSE ω SSE Ω. Również w tym przypadku test oparty o dev ω,ω jest równoważny testowi F. 10 / 24

Dane: D = ((x 1, Y 1 ),..., (x n, Y n )) ˆf D - estymator funkcji regresji w skonstruowany oparciu o D. Cel: ocena błędu popełnianego dla nowej losowej obserwacji (x, Y ) niezależnej od D i pochodzącej z tego samego modelu (błąd ten jest miarą jakości estymatora ˆf D ). Możemy estymować: ( ( Err D = E Y ˆf ) ) 2 D (x) D, lub ( ( ) ) 2 Err = E Y ˆf D (x) = E (Err D ). 11 / 24

1.. Próba testowa o liczności m niezależna od danych D, pochodząca z tego samego rozkładu co D: T = ( (x t 1, Y t 1 ),..., (x t m, Y t m) ) Estymator błędu na podstawie T : Êrr D = 1 m m i=1 ( Yi t ˆf 2 D (xi )) t. 12 / 24

2. (sprawdzanie krzyżowe) dzielimy próbę D na K części (losowo), dopasowujemy model w oparciu o dane D z wyłączeniem jednej z K części, obliczamy błąd dla wyłączonej części danych, postępowanie powtarzamy dla każdej z K części. Na końcu uśredniamy obliczone błędy. Formalnie: κ : {1,..., n} {1,..., K} - przyporządkowuje każdej obserwacji nr bloku, do którego ona należy. ˆf k (x) - model dopasowany bez użycia k-tej części, k = 1,..., K. Wtedy: Êrr = 1 n n i=1 ( Y i ˆf κ(i) (x i )) 2. 13 / 24

Typowo przyjmuje się: K = 5, 10, n. K = n leave-one-out crossvalidation. Wtedy otrzymujemy: PRESS = n e(i) 2, gdzie: e (i) - rezyduum dla i-tej obserwacji w modelu dopasowanym na podstawie n 1 obserwacji z pominięciem i-tej obserwacji. i=1 PRESS - Predicted Residual Sum of Squares. 14 / 24

3. : wielokrotne repróbkowanie elementów z oryginalnej próby D (losowanie ze zwracaniem); otrzymujemy m pseudoprób o liczności n każda, na podstawie każdej z nich dopasowujemy model ˆf b, b = 1,..., m; dla każdej obserwacji z pierwotnych danych liczymy średni błąd w modelach nie wykorzystujących tych obserwacji; uśredniamy otrzymane wielkości po wszystkich obserwacjach Êrr = 1 n n i=1 1 C i b C i ( Y i ˆf b (x i )) 2, C i - zbiór indeksów modeli dopasowanych na podstawie pseudoprób nie zawierających i-tej obserwacji. Uwaga: Przy pomocy bootstrapu możemy też przybliżać rozkład estymatorów b i S 2. 15 / 24

Jest to rozwiązanie problemu: ( ( ˆβridge 0, ˆβ ridge) p 1 = arg min SSE + λ b dla ustalonego λ > 0, gdzie SSE = ( n i=1 Y i b 0 ) p 1 2. j=1 x ijb j Z Tw. Kuhna-Tackera wynika, że problem ten jest równoważny problemowi programowania wypukłego: ( ˆβridge 0, ˆβ ridge) = arg min b SSE przy war. j=1 b 2 j p 1 bj 2 j=1 ) t(λ). (1) Zatem szukamy minimum SSE przy nałożonym ograniczeniu na normę wektora (b 1,..., b p 1 ) lub, równoważnie, budujemy funkcję kryterialną dodając do SSE karę za dużą wartość normy tego wektora. 16 / 24

Uwaga 1. Kara w (1) nie uwzględnia b 0. W przeciwnym razie przesunięcie wektora Y o stałą nie skutkowałoby przesunięciem ˆβ ridge 0 o tę stałą. Uwaga 2. Rozwiązanie (1) jest równoważne wykonaniu dwóch kroków: ˆβ ridge 0 := Ȳ, regresja dla scentrowanych X i Y i bez uwzględnienia b 0 w SSE. Dowód:... 17 / 24

Mamy: Stąd SSE(λ) = (Y c X c b) (Y c X c b) + λb b b SSE(λ) = 2(Xc ) X c b 2(X c ) Y c + 2λb ˆβ ridge = ((X c ) X c + λi) 1 (X c ) Y c. Zatem sytuacja, gdy mac. (X c ) X c jest nieodwracalna lub bliska nieodwracalnej została zamieniona na sytuację bardziej stabilną numerycznie (macierz (X c ) X c + λi możemy odwrócić). 18 / 24

Dekompozycja na wartości szczególne (Singular Values Decomposition) X = UDV, gdzie: U(n p) - ortonormalna, jej kolumny rozpinają tę samą przestrzeń, co kolumny X, D(p p) - diagonalna, na przekątnej: wartości własne X X, V (p p) - ortonormalna, jej kolumny rozpinają przestrzeń wierszy X. Estymatory MNK i ridge można prosto wyrazić używając rozkładu SVD. 19 / 24

Dekompozycja na wartości szczególne Dla estymatorów MNK: Ŷ MNK = X(X X) 1 X Y = = UDV (VDU UDV ) 1 VDU Y = p p = UU Y = u j u jy = u j, Y u j. j=1 Zatem ŶMNK - rzut ortogonalny Y na podprzestrzeń rozpiętą przez kolumny mac. X. j=1 20 / 24

Dekompozycja na wartości szczególne Dla regresji grzbietowej (przy zał., że X scentrowana): Ŷ ridge = X(X X + λi) 1 X Y = = UDV (VDU UDV + λvv ) 1 VDU Y = = p j=1 u j = UD(D 2 + λi)du Y = dj 2 p d dj 2 + λ u j 2 jy = u j, Y u j dj 2 + λ. Współczynniki rzutu Y na lin(u 1,..., u p ) są ściągane przez przemnożenie przez współczynniki: j=1 d 2 j d 2 j + λ 1. 21 / 24

Porównanie MNK i ridge Estymator ˆβ MNK jest nieobciążony o macierzy kowariancji: σ 2 (X X) 1 = σ 2 VD 1 D 1 V. Estymator ˆβ ridge jest obciążony o macierzy kowariancji: σ 2 VD 1 (D 2 + λi) 2 D 4 D 1 V. Na przekątnej: ( d 2 j ) 2 1. d 2 j + λ Zatem dla i = 0,..., p 1. Var ˆβ ridge i Var ˆβ MNK i 22 / 24

Metoda (Least Absolute Shrinkage and Selection Operator): Równoważnie: ˆβ lasso = arg min b ˆβ lasso = arg min SSE b ) p 1 2 SSE + λ b j. ( 1 przy war. j=1 p 1 b j t. j=1 23 / 24

24 / 24