UOGÓLNIONA MIARA DOPASOWANIA W MODELU LINIOWYM

Podobne dokumenty
Metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Interpolacja. Interpolacja wykorzystująca wielomian Newtona

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Przestrzeń unitarna. Jacek Kłopotowski. 23 października Katedra Matematyki i Ekonomii Matematycznej SGH

= = a na podstawie zadania 6 po p. 3.6 wiemy, że. b 1. a 2 ab b 2

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

1.1 Klasyczny Model Regresji Liniowej

Stosowana Analiza Regresji

Wstęp do metod numerycznych Uwarunkowanie Eliminacja Gaussa. P. F. Góra

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Natalia Neherbecka. 11 czerwca 2010

Stosowana Analiza Regresji

Rozdział 8. Regresja. Definiowanie modelu

#09. Systemy o złożonej strukturze

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Metoda największej wiarogodności

Testowanie hipotez statystycznych

Lokalna odwracalność odwzorowań, odwzorowania uwikłane

Równania trygonometryczne z parametrem- inne spojrzenie

Własności statystyczne regresji liniowej. Wykład 4

Weryfikacja hipotez statystycznych

Układy równań i równania wyższych rzędów

Uogolnione modele liniowe

Zawansowane modele wyborów dyskretnych

Testowanie hipotez statystycznych

2. Szybka transformata Fouriera

Kongruencje twierdzenie Wilsona

Metoda najmniejszych kwadratów

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Rys. 1. Rozwiązanie zadania rozpoczniemy od wyznaczenia wartość momentów zginających wywołanych działaniem siły 20[kN]. Rys. 2

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Ćwiczenie 5 PROGNOZOWANIE

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych. Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

x x 1. Przedmiot identyfikacji System x (1) x (2) : x (s) a 1 a 2 : a s mierzone, a = zestaw współczynników konkretyzujacych F ()

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

UBEZPIECZENIE NA ŻYCIE Z LOSOWĄ STOPĄ PROCENTOWĄ

Testowanie hipotez statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Metody Ekonometryczne

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Ekonometria egzamin 07/03/2018

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Prawa wielkich liczb, centralne twierdzenia graniczne

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Testy post-hoc. Wrocław, 6 czerwca 2016

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

Rozkłady wielu zmiennych

WYKŁAD 8 ANALIZA REGRESJI

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Modele zapisane w przestrzeni stanów

MACIERZE. ZWIĄZEK Z ODWZOROWANIAMI LINIOWYMI.

Wykład 4 Udowodnimy teraz, że jeśli U, W są podprzetrzeniami skończenie wymiarowej przestrzeni V to zachodzi wzór: dim(u + W ) = dim U + dim W dim(u

Stosowana Analiza Regresji

VI. Równania różniczkowe liniowe wyższych rzędów

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Przekształcenia liniowe

PROGRAMOWANIE KWADRATOWE

Metody systemowe i decyzyjne w informatyce

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Metoda najmniejszych kwadratów

DRGANIA MECHANICZNE. materiały uzupełniające do ćwiczeń. Wydział Samochodów i Maszyn Roboczych studia inżynierskie

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez statystycznych

Wprowadzenie do analizy korelacji i regresji

Przestrzenie liniowe

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Równania różniczkowe liniowe wyższych rzędów o stałych współcz

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Matematyka ubezpieczeń majątkowych r.

Ekonomia matematyczna Dynamiczny model wymiany rynkowej (Arrowa-Hurwicza)

Markowa. ZałoŜenia schematu Gaussa-

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Czasowy wymiar danych

Opis wykonanych badań naukowych oraz uzyskanych wyników

Tydzień nr 9-10 (16 maja - 29 maja), Równania różniczkowe, wartości własne, funkcja wykładnicza od operatora - Matematyka II 2010/2011L

Dynamiczne modele liniowe w badaniach okresowych

ALGEBRA LINIOWA Z ELEMENTAMI GEOMETRII ANALITYCZNEJ. 1. Ciała

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

Aproksymacja. j<k. L 2 p[a, b] l 2 p,n X = Lemat 1. Wielomiany ortogonalne P 0,P 1,...,P n tworza przestrzeni liniowej Π n. Dowód.

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

13 Układy równań liniowych

Prawdopodobieństwo i statystyka

1.5. ZWIĄZKI KONSTYTUTYWNE STRONA FIZYCZNA

Analiza numeryczna Lista nr 3 (ćwiczenia) x x 2 n x.

Transkrypt:

UOGÓLNIONA MIARA DOPASOWANIA W MODELU LINIOWYM Wojciech Zieliński Katedra Ekonoetrii i Statystyki, SGGW Nowoursynowska 159, PL-0-767 Warszawa wojtekzielinski@statystykainfo Streszczenie: W odelu regresji liniowej stosowane są dwie iary wpływu ziennych niezależnych na zienna zależną: współczynnik deterinacji oraz współczynnik korelacji cząstkowej W pracy zaproponowane jest uogólnienie tych iar i skonstruowana jest iara wpływu grupy ziennych niezależnych z wyłączenie wpływu pozostałych ziennych niezależnych Słowa kluczowe: iara dopasowania, współczynnik deterinacji, korelacja cząstkowa, analiza regresji Załóży, że obserwacje Y i pewnej ziennej losowej ożey przedstawić w postaci Y i = β 1 x 1i + + β p x pi + ε i, i = 1,, n, ( ) gdzie x ki, k = 1,, p, i = 1,, n, są znane, β 1,, β p są nieznanyi współczynnikai regresji, natoiast ε i, i = 1,, n są ziennyi losowyi o rozkładach noralnych o zerowej wartości oczekiwanej i wariancji σ Jedny z pytań stawianych w analizie odeli ( ) jest pytanie o wpływ ziennych niezależnych na cechę Y W zastosowaniach wykorzystuje się w zasadzie dwie iary: irę łącznego wpływu wszystkich ziennych niezależnych oraz iarę wpływu pojedynczych ziennych (z eliinacją wpływu pozostałych) Jest to powszechnie znany współczynnik deterinacji oraz współczynnik korelacji cząstkowej Ścisłe określenia tych pojęć ożna znaleźć w bardzo bogatej literaturze poświęconej analizie regresji (w spisie literatury podanych znaleźć kilka takich książek) Podane iary niestety nie udzielają odpowiedzi na pytania o wpływ grup wybranych ziennych niezależnych na zienną zależną, np jak zierzyć wpływ ziennej x 1 oraz x z wyłączenie pozostałych ziennych? W dalszy ciągu zaproponowana jest taka iara Pokazano również, że współczynnik deterinacji oraz współczynnik korelacji cząstkowej sa szczególnyi przypadkai tej ogólniejszej iary W dalszych rozważaniach znacznie wygodniej jest się posługiwać zapisai acierzowyi Model liniowy ( ) w zapisie acierzowy a postać Y = Xβ + ε, gdzie Y = [Y 1,, Y n jest wektore obserwacji, β = [β 1, β p jest wektore nieznanych 1

paraetrów, ε = [ε 1,, ε n jest wektore błędów losowych oraz x 11 x p1 x 1 x p X = x 1n x pn jest acierzą eksperyentu Zgodnie z poczynionyi założeniai wektor losowy Y a n-wyiarowy rozkład noralny: Y N n (Xβ, σ I n ) Niech teraz X = [X 1 X, gdzie acierze X 1 oraz X są acierzai o wyiarach odpowiednio n (p q) i n q Niech wektor paraetrów β będzie podzielony odpowiednio na dwa podwektory β 1 i β zgodnie z podziałe acierzy X Interesuje nas zierzenie wpływu na zienną zależną ziennych zawartych w acierzy X Niech β oznacza estyator wektora β w odelu z acierzą X β = (X X) 1 X Y, natoiast niech β 1 będzie estyatore najniejszych kwadratów wektora β w odelu z ograniczeniai β = 0 (Zieliński 007): β 1 = β (X X) 1 A [A(X X) 1 A 1 A β Tutaj A = [0 q (p q) I q jest acierzą ograniczeń, tzn β = 0 jest równoważne teu, że Aβ = 0 (0 oznacza, w zależności od kontekstu, wektor lub acierz zerową, I q oznacza acierz jednostkową wyiaru q) Wektor obserwacji Y ożey zapisać jako Y X β 1 = (X β X β 1 ) + (Y X β + X β 1 ) Zauważy, że wektory X β X β 1 i Y X β + X β 1 są ortogonalne A zate Y X β 1 = X β X β 1 + Y X β + X β 1, gdzie oznacza kwadrat długości wektora (w norie euklidesowej) Jako iarę wpływu ziennych zawartych w acierzy X przyjujey Twierdzenie Zienna losowa R (X ) = X β X β 1 Y X β 1 R (X ) 1 R (X ) n q q

a niecentralny rozkład F z (q, n q) stopniai swobody i paraetre niecentralności β A [A(X X) 1 A 1 Aβ, gdzie A = [0 q (p q) I q Dowód W dowodzie korzystay z dobrze znanych faktów dotyczących rozkładów prawdopodobieństwa for liniowych i kwadratowych wektorów losowych o wielowyiarowy rozkładzie noralny Łatwo sprawdzić, że R (X ) 1 R (X ) = X β X β 1 Y (X β X β 1 ) = β A [A(X X) 1 A 1 A β Y (I n A [A(X X) 1 A 1 A)Y Macierz I n A [A(X X) 1 A 1 A jest idepotentna, więc w ianowniku ay zienną losową o centralny rozkładzie chi-kwadrat z (n q) stopniai swobody Ponieważ wektor losowy a rozkład N p (β, σ (X X) 1 ), więc w liczniku ay zienną losową o niecentralny rozkładzie chi-kwadrat z q stopniai swobody i paraetre niecentralności β A [A(X X) 1 A 1 Aβ Licznik i ianownik są niezależnyi ziennyi losowyi i stąd wynika teza twierdzenia Pokażey teraz, że współczynnik deterinacji oraz współczynnik korelacji cząstkowej sa szczególny przypadkai iary R (X ) Współczynnik deterinacji jest iarą wpływu wszystkich ziennych niezależnych x 1,, x na zienną Y w odelu W zapisie acierzowy Y i = β 0 + β 1 x 1i + + x i + ε i, i = 1,, n 1 x 11 x 1 1 x X = 1 x 1 x 1n x n Macierz X i wektor paraetrów ożna podzielić na x 11 x 1 x X 1 = 1 n, X = 1 x x 1n x n W ty odelu ay p = + 1, q = oraz [ X X = n 1 nx X 1 n X X, β = β 0 β 1, β 1 = [β 0, β = β 1 [, (X X) 1 M k = k L 3

gdzie L 1 = X X 1 n X 1 n 1 nx, k = 1 n 1 nx L oraz M = 1 n + k Lk (ogólny wzór na odwrotność blokowej acierzy ożna znaleźć w np Rao 198, Zieliński 007) Estyator najniejszych kwadratów wektora β w pełny odelu a postać [ [ M k 1 β = n k L X [ M1 Y = n + k X k1 n + LX Y, tzn β 0 = (M1 n + k X )Y oraz β = (k1 n + LX )Y Estyator wektora β 1 w odelu z ograniczeniai określonyi acierzą A = [0 I wyraża się wzore ( [ [ ( [ [ M k 0 β 1 = I +1 M k 0 [0 k L I I k L I [ [ [ 1 k = L 1 β0 k β = L 1 β 1 [ = n 1 ny Ȳ = 0 0 0 0 ) 1 [0 I ) β 0, gdzie Ȳ = 1 n n i=1 Y i Ponieważ X β 1 = Ȳ 1 n, więc (Ŷ = X β) X β X β 1 = (Ŷ Ȳ 1 n) (Ŷ Ȳ 1 n) = n (Ŷi Ȳ ) i=1 oraz Y X β 1 = (Y Ȳ 1 n) (Y Ȳ 1 n) = n (Y i Ȳ ) i=1 Współczynnik deterinacji, wyrażany zwyczajowo w procentach, określony jest więc w następujący sposób ( D = R Ŷ i (X ) 100% = Ȳ ) 100% (Yi Ȳ ) Z twierdzenia otrzyujey Wniosek Zienna losowa D 100 D n a niecentralny rozkład F z (, n ) stopniai swobody i paraetre niecentralności β X (I n 1 n 1 n1 n)x β 4

Współczynnik korelacji cząstkowej jest iarą wpływu jednej ze ziennych niezależnych na zienną Y w odelu Y i = β 0 + β 1 x 1i + + x i + ε i, i = 1,, n Wyprowadziy odpowiedni wzór dla ziennej x 1 Dla uproszczenia zapisu odel zapisujey w postaci Y i = β 0 + β x i + + x i + β 1 x 1i + ε i, i = 1,, n W zapisie acierzowy 1 x 1 x 1 x 11 1 x X = x x 1, β = 1 x n x n x 1n Macierz X i wektor paraetrów ożna podzielić na 1 x 1 x 1 x 11 1 x X 1 = x, x x = 1 1 x n x n x 1n W ty odelu gdzie [ X X X = 1 X 1 X 1x x X 1 x x L =, β 1 =, (X X) 1 = 1 x x x X 1(X 1 X 1) 1 X 1 x, β 0 β β 1 β 0 β, β = [β 1 [ M k k L k = L(X 1X 1 ) 1 x X 1, M = (X 1X 1 ) 1 Lkk Ograniczenia opisane są za poocą wektora [0 1 Po wykonaniu odpowiednich obliczeń otrzyujey, że iarą wpływu ziennej x 1 na Y jest R (x )= (x (I n X 1 (X 1X 1 ) 1 X 1)Y) (Y (I n X 1 (X 1 X 1) 1 X 1 )Y)(x (I n X 1 (X 1 X 1) 1 X 1 )x ) Współczynnik korelacji cząstkowej iędzy Y a x 1 określony jest jako R (x ) i oznaczany R Y (x1 )(x,,x ) Znak tego współczynnika jest oczywiście zgodny ze znakie x (I n X 1 (X 1X 1 ) 1 X 1)Y Z twierdzenia 18 otrzyujey następujący Wniosek Zienna losowa R Y (x 1 )(x,,x ) 1 R Y (x 1 )(x,,x ) (n 1) a niecentralny rozkład F z (1, n 1) stopniai swobody i paraetre niecentralności β x (I n X 1 (X 1X 1 ) 1 X 1)x 5

Dodatkowa zienna Niech Y = Xβ + ε Przypuśćy, że do odelu włączay jeszcze jedną zienną niezależną, tzn Y = Xβ+zγ+η = Wδ+η, gdzie W = [X z, δ = [β γ oraz η jest wektore błędów losowych Tutaj z jest wektore n-wyiarowy reprezentujący włączaną zienną, natoiast γ jest nieznany współczynnikie regresji Wyznaczyy współczynnik R (W) i porównay go z R (X) Estyatore najniejszych kwadratów wektora δ jest oczywiście δ = (W W) 1 W Y May [ W X W = X X z z X z z oraz (W W) 1 = 1 b [ b(x X) 1 + aa a a 1 gdzie a = (X X) 1 X z oraz b = z (I n X(X X) 1 X )z Zate Ponieważ więc [ β z (I n X(X X) 1 X )Y z δ = (I n X(X X) 1 X )z (X X) 1 X z z (I n X(X X) 1 X )Y z (I n X(X X) 1 X )z W δ = X β + z (I n X(X X) 1 X )Y z (I n X(X X) 1 X )z (I n X(X X) 1 X )z, W δ = X β + (z (I n X(X X) 1 X )Y) z (I n X(X X) 1 X )z Zate R (W) R (X), tzn odel z dodatkową zienną nie gorzej odtwarza zienną zależną niż odel bez niej Literatura BORKOWSKI B, DUDEK H, SZCZESNY W 003: Ekonoetria, wybrane zagadnienia, PWN, Warszawa DRAPER N R, SMITH H 1973: Analiza regresji stosowana, PWN, Warszawa RAO C R 198: Modele liniowe statystyki ateatycznej, PWN, Warszawa SEBER G A F 1977: Linear Regression Analysis, Wiley, New York ZIELIŃSKI W 007: Teoretyczne podstawy ekonoetrycznych jednorównaniowych odeli liniowych, Wydawnictwo SGGW, Warszawa 6