EKONOMETRIA prowadzący: Piotr Piwowarski
Termin konsultacji: poniedziałek 13:15 14:45 wtorek 13:15 14:45 pokój 1101/1102 jedenaste piętro e-mail: piotr.piwowarski@poczta.umcs.lublin.pl strona internetowa: serwisy.umcs.lublin.pl/piotr.piwowarski
Zaliczenie ćwiczeń: 2 kolokwia 3-4 zadania otwarte do rozwiązania można mieć do dyspozycji wzory i kalkulator
Zakres realizowanego materiału: 1. Dobór zmiennych objaśniających do modelu liniowego metoda analizy macierzy współczynników korelacji, metoda wskaźników pojemności informacyjnej, korelacja wieloraka; 2. Szacowanie parametrów modeli liniowych klasyczną metodą najmniejszych kwadratów, weryfikacja modeli liniowych; 3. Ocena dopasowania modelu do danych empirycznych, estymacja parametrów modeli; 4. Testy istotności składnika losowego; 5. Uogólniona metoda najmniejszych kwadratów; 6. Modele nieliniowe sprowadzalne do liniowych; 7. Modele wielorównaniowe;
BIBLIOGRAFIA: Nowak E., Zarys metod ekonometrii. Zbiór zadań, PWN, Warszawa 2007; Podgórska M., Ekonometria, SGH, Warszawa 2008; Kukuła K., Wprowadzenie do ekonometrii w przykładach i zadaniach, PWN, Warszawa 2007; Sobczyk M., Statystyka Matematyczna, C.H. Beck, 2010.
Dobór zmiennych objaśniających do modelu liniowego
Procedura doboru zmiennych objaśniających: 1. Na podstawie posiadanej wiedzy sporządzenie zestawu tzw. potencjalnych zmiennych objaśniających, którymi są wszystkie najważniejsze wielkości oddziałujące na zmienną objaśnianą. 2. Zebranie danych statystycznych będących realizacjami zmiennej objaśnianej i potencjalnych zmiennych objaśniających. Otrzymuje się wektor y obserwacji zmiennej objaśnianej i macierz X obserwacji zmiennych objaśniających. 3. Eliminacja potencjalnych zmiennych objaśniających odznaczających się zbyt niskim poziomem zmienności. 4. Obliczenie współczynnika korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi. 5. Przeprowadzenie redukcji zbioru potencjalnych zmiennych objaśniających za pomocą wybranej metody statystycznej.
Eliminacja potencjalnych zmiennych objaśniających odznaczających się zbyt niskim poziomem zmienności Miarą poziomu zmienności jest współczynnik zmienności: v i = S i x i gdzie x i - średnia arytmetyczna zmiennej X i ; S i - odchylenie standardowe zmiennej X i ; n x ti, t=1 x i = n = n x ti x i 2 t=1 S i n. Należy wybrać krytyczną wartość v *. Zmienne spełniające nierówność v i v *, uznaje się za zmienne o niskim poziomie zmienności i eliminuje się ze zbioru potencjalnych zmiennych objaśniających.
Przykład: Lata Produkcja (Y) Zatrudnienie (X 1 ) Wartość maszyn (X 2 ) Czas przestoju (X 3 ) Nakłady inwestycyjne (X 4 ) 2001 10 6 8 14 12 2002 10 6 8 14 12 2003 16 10 12 18 12 2004 16 10 12 18 14 2005 12 8 8 18 10 2006 14 10 8 18 12 2007 20 12 14 24 14 2008 20 12 16 24 12 2009 20 12 16 26 12 2010 22 14 18 26 10 Przy założonej wartości krytycznej v * = 0,15 sprawdzić czy potencjalne zmienne objaśniające odznaczają się odpowiednio wysoką zmiennością
Należy w pierwszej kolejności obliczyć średnią dla każdej zmiennej objaśniającej: x 1 =10, x 2 =12, x 3 =20, x 4 =12. Lata x t1 -x 1 x t2 -x 2 x t3 -x 3 x t4 -x 4 (x t1 -x 1 ) 2 (x t2 -x 2 ) 2 (x t3 -x 3 ) 2 (x t4 -x 4 ) 2 2001-4 -4-6 0 16 16 36 0 2002-4 -4-6 0 16 16 36 0 2003 0 0-2 0 0 0 4 0 2004 0 0-2 2 0 0 4 4 2005-2 -4-2 -2 4 16 4 4 2006 0-4 -2 0 0 16 4 0 2007 2 2 4 2 4 4 16 4 2008 2 4 4 0 4 16 16 0 2009 2 4 6 0 4 16 36 0 2010 4 6 6-2 16 36 36 4 Σ 0 0 0 0 64 136 192 16
Odchylenia standardowe każdej ze zmiennych: S 1= 64 10 =2,530, S 2= 136 10 =3,688, S 3= 192 = 10 =4,382, S 16 4 10 =1,265 Współczynniki zmienności przyjmują następujące wartości: v 1 = 2,530 10 =0,253, v 2 = 3,688 12 =0,307, v 3 = 4,382 20 =0,219, v 4 = 1,265 12 =0,105 Współczynnik zmienności dla zmiennej X 4 jest mniejszy od przyjętej wartości krytycznej w związku z tym odrzucamy ją ze zbioru potencjalnych zmiennych.
Zadanie 1. Dane są następujące obserwacje zmiennych X 1, X 2, X 3 : t 1 2 3 4 5 6 x t1 18 22 25 27 30 34 x t2 4 4,1 4 4,1 4,1 4 x t3 8 3 7 4 9 11 Przy krytycznej wartości współczynnika zmienności 0,10 ocenić przydatności poszczególnych zmiennych ze względu na stopień zróżnicowania ich wartości.
Obliczenie współczynnika korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi Do oceny siły zależności pomiędzy zmienną objaśnianą a zmiennymi objaśniającymi oblicza się współczynnik korelacji: r i = n y t y x ti x i t=1 n n y t y 2 x ti x i 2 t=1 t=1 Współczynniki te przedstawiane są w postaci wektora korelacji: R 0 =[r1 r 2.. r m]
Do oceny siły zależności pomiędzy zmiennymi objaśniającymi oblicza się współczynniki korelacji według wzoru: r ij = n t=1 n x ti x i x tj x j t=1 n x ti x i 2 x tj x j 2 t=1 Współczynniki te przedstawiane są w postaci macierzy korelacji: r 12 r 1m R=[1 r 21 1 r 2m 1] r m1 r m2
Zadanie 2. Na podstawie następujących danych dla zmiennej objaśnianej Y oraz zmiennych objaśniających X 1, X 2 : t 1 2 3 4 5 y t 2 2,1 2,5 2,7 3,2 x t1 11 13 21 31 29 x t2 1,1 1,2 1,4 2,1 2,2 obliczyć współczynniki korelacji zmiennej Y ze zmiennymi X 1, X 2 oraz zmiennej X 1 ze zmienną X 2.
Przeprowadzenie redukcji zbioru potencjalnych zmiennych objaśniających za pomocą wybranej metody statystycznej Metoda analizy macierzy współczynników korelacji sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i zarazem słabo skorelowane między sobą. Dla zadanego poziomu istotności γ oraz dla n-2 stopni swobody wyznacza się krytyczną wartość współczynnika korelacji: I * 2 r *= I * 2 n 2 gdzie I * - wartość statystyki odczytanej z tablicy t-studenta dla danego γ oraz dla n-2 stopni swobody. (krytyczna wartość r * może również być z góry podana przez badacza)
Procedura doboru zmiennych jest następująca: 1. Ze zbioru potencjalnych zmiennych objaśniających eliminuje się te zmienne, dla których prawdziwa jest nierówność: r i r * ponieważ są to zmienne za słabo skorelowane ze zmienną objaśnianą; 2. Z pozostałych zmiennych wybiera się taką zmienną objaśniającą X h dla, której: r h = max { r i i } 3. Ze zbioru pozostałych potencjalnych zmiennych objaśniających eliminuje się te zmienne, dla których: r hi r * ponieważ są to zmienne zbyt silnie skorelowane ze zmienną objaśniającą X h. Kroki 2 i 3 kontynuuje się aż do wyczerpania zbioru potencjalnych zmiennych objaśniających.
Przykład: Dla podanej macierzy i wektora współczynników korelacji obliczonych na podstawie danych dla 28 lat wybrać zmienne objaśniające do liniowego modelu ekonometrycznego. 0,06 0,08 R 0 =[ 0,59 ] 1,00 0,09 0,35 0,17 0,62 0,40 0,16 0,55 0,13 0,54, 0,15 0,10 R=[ ] 0,09 1,00 0,06 0,38 0,00 0,15 0,22 0,11 0,35 0,06 1,00 0,33 0,11 0,20 0,45 0,02 0,17 0,38 0,33 1,00 0,20 0,07 0,44 0,07 0,62 0,00 0,11 0,20 1,00 0,22 0,17 0,11 0,40 0,15 0,20 0,07 0,22 1,00 0,19 0,47 0,16 0,22 0,45 0,44 0,17 0,19 1,00 0,05 0,72 0,55 0,11 0,02 0,07 0,11 0,47 0,05 1,00 γ = 0,10. Z tablic testu t-studenta dla założonego poziomu istotności i n-2=26 I * = 1,706 zatem: r *= 1,706 2 1,706 2 28 2 =0,318
Najpierw ze zbioru potencjalnych zmiennych objaśniających eliminujemy te zmienne, które są słabiej skorelowane ze zmienną objaśnianą niż 0,318. Są to zmienne X 2,X 3,X 4,X 6,X 7. Teraz wybieramy zmienną najsilniej skorelowaną ze zmienną objaśnianą jest to X 8, na koniec eliminujemy wszystkie z pozostałych zmiennych zbyt silnie skorelowane ze zmienną X 8, w tym przypadku jest to zmienne X 1. Powtarzamy 2 i 3 krok jedyną potencjalną zmienną, która pozostała jest jeszcze tylko zmienna X 5, więc ją obok zmiennej X 8 bierzemy do modelu.
Zadanie 3. Dla podanej macierzy i wektora współczynników korelacji obliczonych na podstawie danych dla 25 zakładów wybrać zmienne objaśniające do liniowego modelu ekonometrycznego, przy poziomie istotności γ= 0,05. =[ 0,43 R 0 ] 0,53 0,28 0,54 0,58 0,04 0,59, R=[ 1,00 0,40 0,25 0,26 0,49 0,28 0,08 0,40 1,00 0,74 0,62 0,84 0,31 0,62 0,25 0,74 1,00 0,53 0,64 0,14 0,41 0,26 0,62 0,53 1,00 0,69 0,16 0,43 0,49 0,84 0,64 0,69 1,00 0,13 0,55 0,28 0,31 0,14 0,16 0,13 1,00 0,03 0,08 0,62 0,41 0,43 0,55 0,03 1,00]
Zadanie 4. Dla podanej macierzy i wektora współczynników korelacji obliczonych na podstawie danych dla 15 lat wybrać zmienne objaśniające do liniowego modelu ekonometrycznego, przy poziomie istotności γ= 0,05. 0,82 0,57 0,90 0,93 0,37 0,29 0,47 0,72 0,82 1,00 0,51 0,74 0,21 0,44 0,60 0,53 0,97 0,57 0,51 1,00 0,19 0,13 0,79 0,56 0,24 R 0 =[0,90 0,88 0,37, R=[1,00 0,90 0,74 0,19 1,00 0,89 0,23 0,41 0,82 0,93 0,21 0,13 0,89 1,00 0,48 0,38 0,77 0,91 0,37 0,44 0,79 0,23 0,48 1,00 0,64 0,35 0,72 0,29 0,60 0,56 0,41 0,38 0,64 1,00 0,58 0,48] 0,47 0,53 0,24 0,82 0,77 0,35 0,58 1,00]
Metoda wskaźników pojemności informacyjnej polega na takim doborze zmiennych objaśniających, żeby były silnie skorelowane ze zmienną objaśnianą, a jednocześnie słabo skorelowane pomiędzy sobą. Rozpatruje się wszystkie kombinacje zmiennych objaśniających: L = 2 m -1 Dla każdej z tych L kombinacji oblicza się wskaźniki pojemności informacyjnej: indywidualne i integralne.
Indywidualne wskaźniki pojemności informacyjnej: h lj = r j 2 m l 1 r, (l = 1, 2,, L, j = 1, 2,, m ij l) i=1 i j Integralne wskaźniki pojemności informacyjnej: H l = j=1 m l h lj, (l = 1, 2,, L) Indywidualne i integralne wskaźniki pojemności informacyjnej są unormowane w przedziale [0; 1]. Przyjmują one większe wartości gdy zmienne objaśniające są silniej skorelowane ze zmienną objaśnianą i słabiej skorelowane pomiędzy sobą. Jako zmienne objaśniające należy wybrać taką kombinację, w której wartość wskaźnika integralnej pojemności informacyjnej jest największa.
Przykład: Podany jest wektor i macierz współczynników korelacji: R 0 =[ 0,43 ] 0,80 0,18 0,63, R=[ 1 0,64 0,14 0,41 ] 0,64 1 0,13 0,55 0,14 0,13 1 0,03 0,41 0,55 0,03 1 Za pomocą metody wskaźników pojemności informacyjnej wybrać zmienne objaśniające.
Ponieważ są cztery zmienne objaśniające należy rozpatrzeć L = 15 kombinacji tych zmiennych: C 1 = (X 1 ), C 5 = (X 1, X 2 ), C 11 = (X 1, X 2, X 3 ), C 2 = (X 2 ), C 6 = (X 1, X 3 ), C 12 = (X 1, X 2, X 4 ), C 3 = (X 3 ), C 7 = (X 1, X 4 ), C 13 = (X 1, X 3, X 4 ), C 4 = (X 4 ), C 8 = (X 2, X 3 ), C 14 = (X 2, X 3, X 4 ), C 9 = (X 2, X 4 ), C 15 = (X 1, X 2, X 3, X 4 ). C 10 = (X 3, X 4 ), I tak dla kombinacji jednoelementowych: H 1 = h 11 = r 1 2 = (0,43) 2 = 0,185 H 2 = h 22 = r 2 2 = (-0,80) 2 = 0,640 H 3 = h 33 = r 32 = (0,18) 2 = 0,032 H 4 = h 44 = r 42 = (0,63) 2 = 0,370
Dla kombinacji dwuelementowych wskaźnik integralny jest sumą dwóch wskaźników indywidualnych: 2 H 5 =h 51 h 52 = r 1 1 r 12 r 2 1 r 21 =0,113 0,390=0,503 2 H 6 =h 61 h 62 =0,162 0,028=0,190 H 7 =h 71 h 74 =0,131 0,281=0,412 H 8 =h 82 h 83 =0,566 0,029=0,595 H 9 =h 92 h 94 =0,413 0,255=0,668 H 10 =h 10,3 h 10,4 =0,031 0,385=0,416 Dla kombinacji trójelementowych wskaźnik integralny jest sumą trzech wskaźników indywidualnych: r 1 2 2 H 11 =h 11,1 h 11,2 h 11,3 = 1 r 12 r 13 r 2 1 r 21 r 23 r 3 1 r 31 r 32 =0,104 0,362 0,026=0,492 H 12 =h 12,1 h 12,2 h 12,4 =0,090 0,292 0,202=0,584 H 13 =h 13,1 h 13,3 h 13,4 =0,119 0,028 0,276=0,423 H 14 =h 14,2 h 14,3 h 14,4 =0,381 0,028 0,251=0,660 Dla ostatnie kombinacji wskaźnik integralny jest sumą czterech wskaźników indywidualnych: r 1 2 H 15 =h 15,1 h 15,2 h 15,3 h 15,4 = 1 r 12 r 13 r 14 r 2 1 r 21 r 23 r 24 r 3 1 r 31 r 32 r 34 r 4 1 r 41 r 42 r 43 =0,585 2 2 2 2
Maksymalna wartość wskaźnika integralnej pojemności informacyjnej wynosi 0,668 i dotyczy kombinacji C 9, do której należą zmienne X 2 i X 4. Oznacza to, iż w modelu liniowym opisującym zmienną objaśnianą Y zmiennymi objaśniającymi będą powyższe zmienne. Model będzie miał postać: Y =α 0 α 1 X 2 α 2 X 4 ε.
Zadanie 5. Wektor współczynników korelacji pomiędzy zmienną Y i zmiennymi X 1, X 2, X 3 oraz macierz współczynników korelacji między zmiennymi X 1, X 2, X 3 przedstawiają się następująco: R 0 =[ 0,01 0,76 0,89], R= [ 1 0,05 0,01 ] 0,05 1 0,80 0,01 0,80 1 Stosując metodę wskaźników pojemności informacyjnej wybrać zmienne objaśniające do modelu. Zadanie 6. Współczynniki korelacji pomiędzy zmiennymi Y, X 1, X 2 wynoszą: r 1 = -0,8, r 2 = -0,7, r 12 = 0,6 Za pomocą wskaźnika pojemności informacyjnej wybrać zmienne objaśniające modelu.
Zadanie 7. Współczynnik korelacji między zmienną Y i zmiennymi X 1, X 2 wynoszą: r 1 = 0,6, r 2 = 0,3. Wskaźnik integralnej pojemności informacyjnej kombinacji C 3 = (X 1, X 2 ) wynosi: H 3 = 0,3. Ile wynosi współczynnik korelacji między zmiennymi X 1 i X 2?
Współczynnik korelacji wielorakiej mierzy siłę związku liniowego zmiennej objaśnianej Y ze zmiennymi objaśnianymi X 1, X 2,, X k. Współczynnik ten zdefiniowany jest w następujący sposób: det W 1 R= det R gdzie: det(r) wyznacznik macierzy współczynników korelacji zmiennych objaśniających X 1, X 2,, X k łączonych parami, det(w) wyznacznik macierzy: W = [ 1 R T ] 0 R 0 R Współczynnik korelacji wielorakiej jest unormowany w przedziale [0; 1]. Przyjmuje większe wartości gdy związek zmiennej objaśnianej ze zmiennymi objaśniającymi jest silniejszy.,
Przykład: Podany jest wektor i macierz współczynników korelacji: R 0 =[0,7 0,9 0,1 0,5] R=[1,0 0,8 0,2 0,4, 0,8 1,0 0,1 0,6 0,2 0,1 1,0 0,3 0,4 0,6 0,3 1,0]. Za pomocą współczynnika korelacji wielorakiej wybrać optymalną kombinację zmiennych spośród dwuelementowych kombinacji zmiennych objaśniających.
Rozpatrujemy wszystkie dwuelementowe kombinacje zmiennych objaśniających: C 1 =(X 1, X 2 ), C 2 =(X 1, X 3 ), C 3 =(X 1, X 4 ), C 4 =(X 2, X 3 ), C 5 =(X 2, X 4 ), C 6 =(X 3, X 4 ). Dla pierwszej kombinacji: R 01 = [ 0,7 0,9], R 1= [ 1,0 0,8 0,8 1,0], zatem macierz W ma następującą postać dla pierwszej kombinacji: W 1 =[ 1,0 0,7 0,9 0,7 1,0 0,8 0,9 0,8 1,0]. det(r 1 ) = 0,360, det(w 1 ) = 0,068 otrzymujemy więc R 1 = 0,901.
W analogiczny sposób należy rozpatrzeć pozostałe kombinacje dwuelementowe: det(r 2 ) = 0,960, det(w 2 ) = 0,508 otrzymujemy więc R 2 = 0,686, det(r 3 ) = 0,840, det(w 3 ) = 0,380 otrzymujemy więc R 3 = 0,740, det(r 4 ) = 0,990, det(w 4 ) = 0,188 otrzymujemy więc R 4 = 0,900, det(r 5 ) = 0,640, det(w 5 ) = 0,120 otrzymujemy więc R 5 = 0,902, det(r 6 ) = 0,910, det(w 6 ) = 0,680 otrzymujemy więc R 6 = 0,503. Maksymalna wartość współczynnika korelacji wielorakiej to 0,902; odnosi się to do kombinacji C 5 zawierającej zmienne X 2 i X 4. Zatem model liniowy będzie wyglądał następująco: Y =α 0 α 1 X 2 α 2 X 4 ε
Zadanie 8. Wektor współczynników korelacji pomiędzy zmienną Y i zmiennymi X 1, X 2, X 3 oraz macierz współczynników korelacji między zmiennymi X 1, X 2, X 3 przedstawiają się następująco: R 0= [ 0,6 0,9 0,8], [ 1,0 0,5 0,3 ] R= 0,5 1,0 0,9 0,3 0,9 1,0 Zbudować liniowy model ekonometryczny opisujący zmienną Y w zależności od dwóch zmiennych objaśniających stosując współczynnik korelacji wielorakiej. Zadanie 9. Wektor współczynników korelacji pomiędzy zmienną Y i zmiennymi X 1, X 2, X 3, X 4 oraz macierz współczynników korelacji między zmiennymi X 1, X 2, X 3, X 4 przedstawiają się następująco: R 0 =[0,4 0,5 0,7, 0,6] R=[1,0 0,5 0,4 0,6 0,5 1,0 0,2 0,3 0,4 0,2 1,0 0,8 0,6 0,3 0,8 1,0]
Zbudować liniowy model ekonometryczny opisujący zmienną Y w zależności od dwóch zmiennych objaśniających stosując współczynnik korelacji wielorakiej. Zadanie 10. Współczynniki korelacji pomiędzy zmiennymi Y, X 1, X 2 wynoszą: r 1 = -0,7, r 2 = -0,8, r 12 = 0,5 Ile wynosi współczynnik korelacji wielorakiej pomiędzy zmienną Y a zmiennymi X 1, X 2.
Szacowanie parametrów modeli liniowych klasyczną metodą najmniejszych kwadratów
Liniowy model ekonometryczny z jedną zmienną objaśniającą ma postać ogólną: Y = β + αx + ε Wartość a jest oceną parametru α, natomiast wartość b jest oceną parametru β. Oceny a i b otrzymuje się stosując następujące wzory: a= n t=1 y t y x t x n t=1 x t x 2 ; b= y a x, gdzie x i y oznaczają średnie arytmetyczne zmiennych Y oraz X.
Ocenę wariancji odchyleń losowych modelu liniowego z jedną zmienną objaśniającą otrzymujemy ze wzoru: S e 2 = n t=1 e t 2 n 2 gdzie e t jest różnicą pomiędzy wartością empiryczną, a teoretyczną zmiennej objaśnianej w okresie t. Standardowe błędy szacunku parametrów α i β wyznacza się ze wzorów: S S a = e n 2 x t n t=1, x t x 2 S b =S e. n t=1 n x t x 2 t=1,
Zadanie 11. Cena jednostkowa sprzedaży produktu (Y) oraz koszt jednostkowy zakupu (X) pewnego półproduktu w latach 2002 2010 kształtował się następująco: lata 2002 2003 2004 2005 2006 2007 2008 2009 2010 y t 5 5 8 6 7 10 10 10 11 x t 3 3 5 4 5 6 6 6 7 Oszacować parametry strukturalne, odchylenia standardowe reszt oraz standardowe błędy szacunku parametrów strukturalnych modelu liniowego opisującego zależność ceny jednostkowej sprzedaży od koszt jednostkowego zakupu. Zadanie 12. Zmienna Y w siedmiu kolejnych latach przyjęła wartości: t 1 2 3 4 5 6 7 y t 8 13 15 17 18 20 21 Oszacować parametry strukturalne, odchylenie standardowe składnika resztowego oraz standardowe błędy szacunku parametrów strukturalnych.
Zadanie 13. Cena pewnego produktu w latach 2002 2009 była następująca: lata 2002 2003 2004 2005 2006 2007 2008 2009 y t 8 7 8 10 12 12 13 15 Oszacować parametry strukturalne, odchylenie standardowe reszt oraz standardowe błędy szacunku parametrów strukturalnych modelu liniowego opisującego zależność ceny produktu w danym roku od ceny produktu w roku poprzednim. Zadanie 14. Udział braków w ogólnej ilości wyprodukowanych wyrobów wyrażony w promilach w pewnym zakładzie produkcyjnym w 7 kolejnych latach kształtował się następująco: lata 1 2 3 4 5 6 7 y t 13 12 10 9 8 6 5 Oszacować parametry strukturalne, odchylenie standardowe składnika losowego oraz standardowe błędy szacunku parametrów strukturalnych trendu liniowego udziału braków w ilości wytworzonych wyrobów.
Liniowy model ekonometryczny z wieloma zmiennymi objaśniającymi ma postać ogólną: Y =α 0 +α 1 X 1 +α 2 X 2 ++α k X k +ε. W dalszych rozważaniach zastosujemy poniższą symbolikę: y=[ y 1 y 2 y n] - wektor obserwacji zmiennej objaśnianej, x 11 x 12 x 1k X =[1 1 x 21 x 22 x 2k. 1 x n1 x n2 x nk] - macierz obserwacji zmiennych objaśniających,
- a 1 a=[a0 k] a 2 a - e=[e 1 e 2 e n] wektor ocen parametrów strukturalnych, wektor reszt modelu. Dla tak zdefiniowanych wektorów kryterium najmniejszych kwadratów może być zapisane następująco: gdzie: e = y Xa. S=e T e min,
Wzór na wyznaczenie wektora a ocen parametrów strukturalnych modelu jest następujący: a=( X T X ) 1 X T y. Wariancje odchyleń losowych szacuje się przy wykorzystaniu wzoru: n 2 e t S 2 e = et e n k 1 = t=1 n k 1 = yt y a T X T y n k 1.
Macierz wariancji i kowariancji ocen parametrów strukturalnych szacuje się na podstawie wzoru: D 2 (a)=s e 2 ( X T X ) 1, w macierzy tej elementy znajdujące się na przekątnej są wariancjami V(a i ) ocen parametrów strukturalnych. S (a i )= V (a i ), natomiast wielkości S(a i ) są standardowymi błędami szacunku parametrów strukturalnych.
Zadanie 15. Mając następujące dane dotyczące zmiennych Y, X 1, X 2 : t 1 2 3 4 5 y t 1 3 2 4 5 x t1 2,5 2 2,5 4 4 x t2 0 0 0 1 1 oszacować parametry strukturalne, wariancję odchyleń losowych oraz standardowe błędy szacunku parametrów strukturalnych model liniowego opisującego zależności zmiennej Y od zmiennych X 1 i X 2. Zadanie 16. Na podstawie poniższych danych (t=1, 2, 3, 4, 5): ŷ=4,5+2x 1 +2,5 x 2, ( X T X ) 1 =[ 2 1 0,5 1 1,5 0 0,5 0 ], X T 0,5 y=[ 10 8 15], yt y=129. a) oszacować średnie błędy szacunku parametrów strukturalnych, b) ocenić dopasowanie modelu do danych empirycznych.
Zadanie 17. Na podstawie następujących obserwacji zmiennych Y, X 1, X 2, X 3 : t 1 2 3 4 5 y t 3 3 4 5 5 x t1 0 1 1 1 2 x t2 0 0 1 0 1 x t3 2 2 1 1 1 Oszacować parametry strukturalne modelu liniowego
Weryfikacja modeli liniowych
Ocena dopasowania modelu do danych empirycznych sprawdzenie czy stworzony model w wystarczającym stopniu wyjaśnia zachowanie zmiennej objaśnianej. Oprócz odchylenia standardowego reszt modelu, podstawowymi miarami są, współczynnik zmienności losowej, współczynnik zbieżności i współczynnik determinacji.
Współczynnik zmienności losowej jest zdefiniowany następująco: W e = S e y 100 ;(wyrażony w procentach). Współczynnik ten zawiera informację, jaki procent średniej arytmetycznej zmiennej objaśnianej modelu stanowi odchylenie standardowe reszt. Jeśli dla założonego wcześniej poziomu krytycznego W * zachodzi nierówność: W e W *, to model może być uznany za dostatecznie dobrze dopasowany do danych empirycznych.
Współczynnik zbieżności: φ 2 = n t=1 n t=1 e t 2 ( y t y) 2, zawiera się on w przedziale [0;1], przekazuje informacje jaka część całkowitej zmienności zmiennej objaśnianej nie jest wyjaśniana przez model. Współczynnik determinacji: R 2 = n t=1 n t=1 ( ŷ t y) 2 a T X T y 1 n (1T y) 2 = ( y t y) 2 y T y 1, n (1T y) 2 zawiera się on w przedziale [0;1], przekazuje informacje jaka część całkowitej zmienności zmiennej objaśnianej jest opisana przez wartości teoretyczne tej zmiennej.
Pomiędzy współczynnikiem determinacji i zbieżności ma miejsce następująca równość: φ 2 +R 2 =1. Natomiast pierwiastek ze współczynnika determinacji, R jest współczynnikiem korelacji wielorakiej. Aby stwierdzić czy dopasowanie modelu do danych empirycznych jest dostatecznie duże, można poddać analizie hipotezę o istotności współczynnika korelacji wielorakiej. Hipotezy są postaci: H 0 :[R=0]; H 1 :[R 0]; Sprawdzianem tej hipotezy jest statystyka: F = R2 n k 1 2 ( ), 1 R k Statystyka ta ma rozkład F Fishera-Snedecora o m 1 = k oraz m 2 = n k 1, stopniach swobody.
Z tablicy testu F dla zadanego poziomu istotności γ oraz dla m 1 i m 2 stopni swobody odczytuje się wartość krytyczną F *. Jeśli F F *, to nie ma podstaw do odrzucenia hipotezy H 0. Oznacza to, iż współczynnik korelacji wielorakiej jest nieistotnie różny od zera, a dopasowanie modelu do danych jest zbyt niskie. Jeśli F > F *, to hipotezę H 0 należy odrzucić na rzecz hipotezy H 1. Oznacza to, iż współczynnik korelacji wielorakiej jest istotny, a stopień dopasowania modelu ekonometrycznego do danych jest dostatecznie wysoki.
Zadanie 18. Na podstawie danych na temat przychodów (Y), kosztów zatrudnienia (X 1 ), i zysków (X 2 ) z okresu pięciu lat: t 1 2 3 4 5 y t 2 2 3 3 5 x t1 0 1 0 1 1 x t2 0 0 0 1 1 oszacowano model liniowy: Ŷ =2,5 0,5 X 1 +2 X 2. Obliczyć współczynnik zmienności losowej, zbieżności i determinacji.
Zadanie 19. Zmienne Y 1, Y 2 przyjęły w 6 latach wartości: t 1 2 3 4 5 6 y t1 16 17 18 21 24 24 y t2 46 47 48 51 54 54 e t1 1-2 0 2 2-3 e t2 2 0-3 -2 2 1 Dla zmiennej Y 1, Y 2 oszacowano modele w zależności od zmiennych odpowiednio X 1, X 2 oraz X 3, X 4 : Y 2 =32+1,3 X 3 +0,54 X 4. Y 1 =15+0,18 X 1 +3,7 X 2 Który model jest lepiej dopasowany do danych empirycznych. Zadanie 20. Na podstawie rocznych danych z okresu 1997 2011 oszacowano parametry liniowego modelu kosztów (Y) względem wielkości produkcji (X 1 ) oraz ilości maszyn produkcyjnych (X 2 ): Ŷ =13+2,5 X 1 +0,4 X 2. Współczynnik korelacji wielorakiej wynosi 0,7. Przy poziomie istotności γ = 0,05 zweryfikować hipotezę o istotności tego współczynnika.
Badanie istotności parametrów strukturalnych α 1,α 2,,α k dla liniowego modelu ekonometrycznego ma na celu sprawdzenie, czy zmienne objaśniające mają istotny wpływ na zmienną objaśnianą. Dla każdego i = 1,2,,k weryfikuje się hipotezę zerową H 0 :[α i =0] wobec hipotezy alternatywnej H 1 :[α i 0]. Sprawdzianem tej hipotezy jest statystyka: I i = a i S (a i ). Z tablic testu t-studenta dla przyjętego poziomu istotności γ oraz n-k-1 stopni swobody odczytuje się wartość krytyczną I *. Jeśli zachodzi nierówność I i I * - nie ma podstaw do odrzucenia hipotezy H 0; Jeśli zachodzi nierówność I i > I * - hipotezę H 0 odrzucamy na rzecz H 1.
Zadanie 21. Na podstawie obserwacji zmiennych Y, X 1, X 2 na przestrzeni 5 lat oszacowano parametry strukturalne modelu: Ŷ = 0,25+1,25 X 1 +0,25 X 2, oraz macierz wariancji i kowariancji ocen parametrów strukturalnych: D (a)=[ 0,094 2 0,031 0,094 0,031 0,156 0,156 0,094 0,156 0,219 ]. Przyjmując poziom istotności γ = 0,10 zbadać istotność parametrów strukturalnych przy zmiennych X 1, X 2. Zadanie 22. Na podstawie 30-elementowej próby oszacowano parametry strukturalne oraz standardowe błędy szacunku parametrów strukturalnych następującego modelu: Ŷ =100+21 X 1 +6 X 2 9 X 3, S(a 0 ) = 10, S(a 1 ) = 3, S(a 2 ) = 10, S(a 3 ) = 1. Na poziomie istotności γ = 0,01 zbadać istotność parametrów strukturalnych powyższego modelu.
Badanie własności odchyleń losowych badanie losowości Weryfikacja hipotezy o losowości rozkładu odchyleń losowych ma na celu ocenę trafności doboru postaci modelu. Do weryfikacji hipotezy: H 0 :[Ŷ = f(x 1, X 2,, X k )] wobec hipotezy alternatywnej H 1 :[Ŷ f(x 1, X 2,, X k )] służy test liczby serii. Ciąg reszt jest uporządkowany względem rosnących wartości jednej ze zmiennych objaśniających (lub jednostek czasu) modelu. Dla tak uporządkowanego ciągu oblicza się liczbę serii S reszt modelu. Serią jest każdy podciąg złożony wyłącznie z reszt niedodatnich lub nieujemnych.
Z tablic testu serii dla danej liczby reszt dodatnich i ujemnych n 2 i n 1 oraz przyjętego poziomu istotności γ, odczytuje się krytyczne wartości serii S 1 * i S 2*. Jeśli S 1 * < S < S 2 * to nie ma podstaw do odrzucenia hipotezy H 0 wpp. Odrzucamy hipotezę H 0 na rzecz hipotezy H 1. W przypadku zachowanie hipotezy H 0 postać modelu została dobrana poprawnie. W przypadku wybrania hipotezy H 1 postać modelu została dobrana błędnie
Zadanie 23. Na podstawie danych kwartalnych z lat 2007-2011 oszacowano model zmiennej Y względem zmiennych X 1, X 2 : Ŷ =110+0,25 X 1 +244X 2. Reszty modelu przyporządkowane poszczególnym kwartałom wynoszą: t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 e t 2-9 7 10-6 -4 0-12 14 5 3-8 14-10 6-12 Przy poziomie istotności γ = 0,05 zweryfikować hipotezę o liniowości modelu opisującego zależności zmiennej Y od zmiennych X 1, X 2.
Badanie własności odchyleń losowych badanie normalności rozkładu Sprowadza się ono do weryfikacji hipotezy, że dystrybuanta odchyleń jest równa dystrybuancie rozkładu normalnego. Weryfikujemy więc hipotezę: H 0 :[F(ε) = F N (ε)] wobec hipotezy alternatywnej H 1 :[F(ε) F N (ε)]. Do weryfikacji hipotezy służy np. test Hellwiga i test Shapiro-Wilka
Procedura testu Hellwiga jest następująca: 1. Przeprowadza się standaryzację reszt według wzoru: u t = e t e, (t = 1, 2,, n); Ŝ e S e e średnia arytmetyczna reszt, ze wzoru: S e = - odchylenie standardowe reszt obliczane n t=1 (e t e) 2 2. Zestandaryzowane reszty porządkuje się według wartości niemalejących tak, że u (1) u (2) u (n) 3. Z tablic dystrybuanty rozkładu normalnego odczytuje się wartości dystrybuanty Φ(u (t) ) = P(u < u (t) ). n.
4.Wyznacza się tzw. cele I t (t = 1, 2,, n), którymi są przedziały o rozpiętości 1/n powstałe po podzieleniu odcinka [0, 1] na n równych części. 5. Wartości dystrybuanty Φ(u (t) ) przyporządkowuje się odpowiednim celom i określa się liczbą cel pustych K. 6. Z tablic testu zgodności Hellwiga dla danej liczby obserwacji n oraz dla przyjętego poziomu istotności γ odczytuje się wartości krytyczne K 1 i K 2. 7. Jeśli K 1 K K 2 to nie ma podstaw do odrzucenia hipotezy H 0. Odchylenia losowe mają wówczas rozkład normalny. Natomiast w przeciwnym przypadku hipotezę H 0 należy odrzucić na rzecz hipotezy H 1. Odchylenia losowe nie mają wówczas rozkładu normalnego.
Procedura testu Shapiro-Wilka: 1. Porządkuje się reszty według wartości niemalejących. 2. Oblicza się wartość statystyki: W = [n/ 2] [ t=1 a n t +1 (e (n t+1) e (t) )] 2 n t=1 (e t e) 2. gdzie: a n-t+1 = współczynnik Shapiro-Wilka. 3. Z tablic testu Shapiro-Wilka dla przyjętego poziomu istotności γ odczytuje się wartość krytyczną W *. 4. Jeśli W W *, nie ma podstaw do odrzucenia hipotezy H 0. Odchylenia losowe mają wówczas rozkład normalny. Natomiast w przeciwnym przypadku hipotezę H 0 należy odrzucić na rzecz hipotezy H 1. Odchylenia losowe nie mają wówczas rozkładu normalnego.
Zadanie 24. Dane są reszty pewnego modelu 1, 3, -4, 0, -3, -2, 5, -3, 1, 2. Za pomocą wybranego testu zweryfikować hipotezę o normalności rozkładu odchyleń losowych. Przyjąć poziom istotności γ =0,1.
Badanie własności odchyleń losowych badanie autokorelacji Autokorelacja odchyleń losowych oznacza liniową zależność między odchyleniami z różnych jednostek czasu. Miarą siły i kierunku autokorelacji odchyleń losowych ε t z okresu t i odchyleń losowych ε t-τ z okresu t-τ jest współczynnik korelacji: ρ τ = ρ(ε t,ε t τ ), nazywany współczynnikiem korelacji rzędu τ. Oszacowaniem tego współczynnika jest współczynnik autokorelacji reszt określony wzorem: r τ = n t=τ+1 n t=τ+1 (e t e t )(e t τ e t τ ), n (e t e t ) 2 (e t τ e t τ ) 2 t=τ+1 Do weryfikowania hipotezy H 0 :[ρ 1 = 0], wobec hipotezy alternatywnej H 1 :[ρ 1 0] służy test Durbina-Watsona.
Sprawdzeniem tej hipotezy w wypadku autokorelacji dodatniej (r 1 > 0) jest statystyka: d= n t=2 (e t e t 1 ) 2 n t=1 Z tablicy testu Durbina-Watsona dla przyjętego poziomu istotności γ i danej liczby obserwacji n oraz liczby zmiennych objaśniających k odczytuje się dwie wartości krytyczne d l i d u. Jeśli d > d u to nie ma podstaw do odrzucenia hipotezy H 0 ; współczynnik autokorelacji jest nieistotny. Natomiast jeśli d < d l, to hipotezę H 0 odrzucamy na rzecz hipotezy H 1 ; współczynnik autokorelacji jest istotny. Jeśli natomiast d l d d u to przy pomocy testu Durbina-Watsona nie można podjąć żadnej decyzji. W przypadku autokorelacji ujemnej (r 1 < 0) oblicza się wartość statystyki: d ' =4 d, i dalej postępuje się analogicznie jak poprzednio. e t 2,
Badanie autokorelacji odchyleń losowych dowolnego rzędu można przeprowadzić także wykorzystując test istotności współczynnika korelacji. Dzięki temu można zweryfikować hipotezę H 0 :[ρ τ = 0], wobec hipotezy alternatywnej H 1 :[ρ τ 0], sprawdzianem tej hipotezy jest statystyka: I τ = r τ n τ 2 1 r τ 2 Natomiast z tablicy t-studenta dla poziomu istotności γ i m = n τ -2 stopni swobody odczytuje się wartość krytyczną I *. Jeśli I τ I *, nie ma podstaw do odrzucenia hipotezy H 0 : współczynnik autokorelacji rzędu τ jest nieistotny, wpp. Hipotezę H 0 odrzucamy na rzecz hipotezy H 1 : współczynnik autokorelacji rzędu τ jest istotny.
Zadanie 25. Dla modelu: Ŷ =32+0,35 X 1 0,46 X 2, którego parametry oszacowano metodą najmniejszych kwadratów, otrzymano ciąg reszt: t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e t -2 3-1 2-4 2 0 1-1 0-4 3-2 3 0 Obliczyć wspólczynnik autokorelacji reszt pierwszego rzędu. Przy poziomie istotności γ = 0,05 zbadać za pomocą testu Durbina-Watsona, czy występuje autokorelacja między odchyleniami ε t i ε t-1. Współczynnik autokorelacji reszt r1= -0,67.
Badanie własności odchyleń losowych badanie stałości wariancji Weryfikujemy hipotezę o równości wariancji odchyleń dwóch skrajnych grup obserwacji. H 0 :[σ 2 ε.1 = σ 2 ε.2], wobec hipotezy alternatywnej H 1 :[σ 2 ε.1 < σ 2 ε.2]. Do sprawdzenia tej hipotezy wykorzystujemy test F (Fischera-Snedecora). Sprawdzianem tej hipotezy jest test: F= S 2 e.2 2, S e.1 gdzie S 2 e.1, S 2 e.2 wariancja resztowa n 1 pierwszych elementów i wariancja resztowa n 2 ostatnich elementów. n 1 (e t e 1 ) 2 S 2 t=1 e.1 = n 1 k 1, S e.2 n 2 t=n n = 2 +1 (e t e 2 ) 2 n 2 k 1.
Z tablicy test F dla poziomu istotności γ oraz m1 = n2 - k 1 i m2 = n1 k 1 odczytuje się wartość krytyczną F*. Jeśli F F* nie ma podstaw do odrzucenia hipotezy H 0. Wariancja odchyleń losowych jest stała w czasie. Jeśli F > F* hipotezę H 0 należy odrzucić na rzecz hipotezy H 1. W miarę upływu czasu wariancja odchyleń losowych wzrasta.
Zadanie 26. Dane są następujące wartości reszt liniowego modelu tendencji rozwojowej: t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 e t -1 2-3 2 0-3 3 1-2 -4 5-11 8-20 12-21 18 14 Przy poziomie istotności γ = 0,05 zweryfikować za pomocą testu F hipotezę o równości wariancji odchyleń losowych w 7 pierwszych i 7 ostatnich okresach.
Uogólniona metoda najmniejszych kwadratów
Uogólniona metoda najmniejszych kwadratów ma zastosowanie do szacowania parametrów modeli liniowych przy niespełnieniu założenia o stałości wariancji odchyleń losowych lub założenia o braku autokorelacji odchyleń. Macierz wariancji i kowariancji odchyleń losowych może być określona jako: D 2 (ε)=σ 2 V, gdzie: V dowolna dodatnio określona macierz symetryczna stopnia n; σ 2 nieznany stały parametr. Wektor ocen parametrów strukturalnych ma postać: a=( X T V 1 X ) 1 X T V 1 y
Wektor a można także otrzymać dwuetapowo. Najpierw wyznaczając macierz wagową P: V 1 =P T P, i oblicza się ważone obserwacje zmiennych: y * =Py, X * =PX, następnie wyznacza się wektor ocen parametrów strukturalnych: a=( X * T X * ) 1 X * T y *. Praktyczne zastosowanie UMNK jest uwarunkowane znajomością macierz V. Macierz tę należy oszacować.
W wypadku niestałości wariancji odchyleń losowych macierz V jest macierzą diagonalną o postaci: 1 0 0 V =[v 0 v 2 0 n] 0 1 0 n], v 2. 0 0 v 1 0 0 v P=[ =[ V 1 1 v 1 0 0 Odpowiadająca im macierz wagowa ma postać: 1 0 0 v 1 1 0 0 n] v 2, 1 0 0 v gdzie za v t można przyjąć: v t = x t lub v t = e t.
W wypadku autokorelacji odchyleń losowych najczęściej zakłada się, że ciąg {ε t }: ε t = ρε t 1 +η t, gdzie ρ <1. Wtedy ρ t = ρ τ, a macierz V jest macierzą współczynników autokorelacji odchyleń losowych postaci: =[ 1 V 2 ρ ρ ρ n 1 1] ρ 1 ρ ρ n 2 ρ n 1 ρ n 2 ρ n 3, 2[ V 1 = 1 1 ρ 1 ρ 0 0 0 ρ 1+ ρ 2 ρ 0 0 0 ρ 1+ ρ 2 0 0 0 0 0 ρ 0 0 0 0 1+ ρ 2 ρ 0 ] 0 0 ρ 1,
a macierz wagowa P ma postać: ρ ρ P=[ 1 0 0 0 2 0 1 ρ 0 0 0 0 1 0 0 0 0 0 ρ 0 0 0 0 1 ρ 0 0 0 0 1 ]
Ocena r współczynnika autokorelacji ρ można wyznaczyć według wzoru: n 1 (n k 1) e t e t+1 t=1 r= n 2 (n 1) e t t=1 gdzie e t reszty modelu oszacowanego MNK. Wariancję odchyleń losowych szacuje się według wzoru: S e 2 = et V 1 e n k 1, a macierz wariancji i kowariancji według wzoru: D 2 (a)=s e 2 ( X T V 1 X ) 1, w dwóch powyższych wzorach e oznacza wektor reszt modelu oszacowanego UMNK.,
Zadanie 27. Sformułowano liniowy model o postaci : Ŷ =α 0 +α 1 X +ε, Zaobserwowane wartości zmiennych są następujące: t 1 2 3 4 y t 3 4 8 11 x t 1 2 4 6 Wiadomo, że wariancja odchyleń losowych w czasie nie jest stała, a macierz V jest podana: V =[0,01 0 0 0 0 0,04 0 0 0 0 0,16 0 0 0 0 0,25], Uogólnioną metodą najmniejszych kwadratów oszacować parametry strukturalne modelu. Zadanie 28. Dla pewnego modelu oszacowanego klasyczną metodą najmniejszych kwadratów na podstawie 6 obserwacji otrzymano współczynnik autokorelacji reszt pierwszego rzędu r = 0,6. Wyznaczyć macierz wagową P w celu zastosowania uogólnionej metody najmniejszych kwadratów przy istnieniu autokorelacji odchyleń losowych.
Zadanie 29. Na podstawie danych: t 1 2 3 4 5 6 7 y t 10 11 20 15 30 21 40 Oszacowano metodą najmniejszych kwadratów trend liniowy: Ŷ =3,857+4,286 t Reszty tego trendu wynoszą: t 1 2 3 4 5 6 7 e t 1,86-1,43 3,28-6 4,71-8,57 6,14 Za pomocą uogólnionej metody najmniejszych kwadratów oszacować parametry strukturalne trendu liniowego zmiennej Y przyjmując za elementy macierzy V wartości bezwzględne reszt trendu oszacowanego klasyczną metodą najmniejszych kwadratów. Zadanie 30. Na podstawie danych z 5 kolejnych lat oszacowano KMNK model: Ŷ =30+21 X, dla którego otrzymano następujące reszty: t 1 2 3 4 5 e t -7-6 1 6 6 Obliczyć współczynnik autokorelacji reszt oraz wyznaczyć elementy macierzy P w celu zastosowania UMNK przy istnieniu autokorelacji odchyleń losowych pierwszego rzędu.
Modele nieliniowe sprowadzalne do liniowych
Wyboru postaci analitycznej dla modelu opisującego zależność między zjawiskami ekonomicznymi można dokonać na podstawie wiedzy ekonomicznej o badanych prawidłowościach: Przykład 1. Jeśli na podstawie wiedzy o badanych zależnościach wiadomo, że przyrosty zmiennej objaśnianej względem zmiennych objaśniających są stałe to sugeruje to postać liniową modelu: Ŷ =α 0 +α 1 X 1 +α 2 X 2 ++α k X k. W modelu tym przyrost krańcowy zmiennej objaśnianej Y jest stały względem zmiennej X i i równy parametrowi strukturalnemu. Przykład 2. Jeśli wiadomo, że elastyczność zmiennej objaśnianej względem zmiennych objaśniających jest stała, to model powinien mieć postać potęgową: Ŷ =α 0 X 1 α 1 X 2 α 2 X k α k.
Przykład 3. Jeśli na podstawie wiedzy o badanych zależnościach wnioskujemy, że jednostkowemu przyrostowi zmiennej objaśniającej towarzyszą coraz mniejsze przyrosty zmiennej objaśnianej, to należy zastosować model o postaci: Ŷ =α 0 +α 1 logx. Przykład 4. Jeśli wiadomo, że jednostkowemu przyrostowi zmiennej objaśniającej odpowiadają coraz większe przyrosty zmiennej objaśnianej, to model może mieć postać wykładniczą: Ŷ =α 0 α 1 X 1. Tego typu zależność spotykamy często w badaniach kosztów całkowitych produkcji w zależności od wielkości produkcji.
Zadanie 31. Zaproponować postać analityczną modelu tendencji rozwojowej produkcji globalnej (P) pewnej gałęzi gospodarki narodowej przy założeniu, że stosunek przyrostu produkcji do wielkości produkcji z roku poprzedniego oscyluje wokół pewnej stałej liczby. Zadanie 32. Zaproponować postać analityczną modelu opisującego zależność poziomu produkcji (Y) zakładu przemysłowego od wartości produkcyjnego majątku trwałego (X 1 ) i zatrudnienia robotników (X 2 ) przy założeniu, że krańcowe wydajności majątku trwałego i zatrudnienia są stałe. Zadanie 33. Wiadomo, że wydatki na żywność na jednego członka rodziny (W) wzrastają wolniej niż dochód na jednego członka rodziny (D). Zaproponować postać analityczną modelu wydatków na żywność względem dochodów.
Wybór postaci analitycznej modelu na podstawie wykresu rozrzutu punktów empirycznych. Najczęstsze postaci analityczne modelu: liniowa: Ŷ i =β i +α i X i, hiperboliczna: Ŷ i = β i +α i 1 X i, logarytmiczna: Ŷ i =β i +α i logx i, wielomianowa: Ŷ i =α 0i +α 1i X i +α 2i X i 2 ++α pi X i p.
W celu stworzenia modelu ekonometrycznego z wieloma zmiennymi objaśniającymi dla każdej zmiennej objaśniającej sporządza się oddzielny wykres rozrzutu punktów (X ij, Y i ) (dla i=1,2,,n). Następnie nadaje się postać analityczną funkcjom regresji zmiennej objaśnianej względem pojedynczych zmiennych objaśniających dbając jednocześnie o to, aby były to funkcje liniowe względem parametrów strukturalnych i ewentualnie nieliniowe względem zmiennych objaśniających. Te cztery zaproponowane powyżej postacie analityczne spełniają ten postulat. Ostateczny model ekonometryczny powstaje przez zsumowanie poszczególnych funkcji regresji, które są przy zmiennych objaśniających, oraz wyrazu wolnego. Można to zapisać w następujący sposób: k Ŷ = i=1 f i ( X i )+α 0. Jest to model liniowy względem parametrów strukturalnych i ewentualnie nieliniowy względem zmiennych objaśniających.
Przykład. Zaproponować postać analityczną modelu opisującego zależność wydajności pracy robotników - % wykonania normy (Y) od stażu pracy w latach (X 1 ) i wieku w latach (X 2 ). t Y X 1 X 2 t Y X 1 X 2 1 84 1 19 11 110 6 47 2 92 2 23 12 102 5 49 3 80 0,5 21 13 108 7,5 48 4 85 2 23 14 112 8,5 46 5 94 2,5 25 15 113 7 28 6 89 3 21 16 115 8 27 7 113 9 35 17 105 7 45 8 118 9,5 31 18 116 11 43 9 111 3,5 25 19 121 11 40 10 102 4 25 20 122 12 35 Na podstawie tych informacji możemy stworzyć wykresy dla zmiennej Y oraz X 1, a także dla zmiennej Y oraz X 2.
130 130 120 120 110 110 Y 100 90 Y 100 90 80 80 70 70 60 0 2 4 6 8 10 12 14 60 15 20 25 30 35 40 45 50 55 X 1 Rozmieszczenie punktów empirycznych na wykresach wskazuje, że do opisu związku wydajności pracy ze stażem pracy można zastosować funkcję regresji logarytmicznej: Ŷ =α 01 +α 1 logx 1, a do opisu związku wydajności pracy z wiekiem kwadratową funkcję regresji: Ŷ =α 02 +α 2 X 2 +α 3 X 2 2, Postać analityczna modelu ma więc postać: Ŷ =α 0 +α 1 logx 1 +α 2 X 2 +α 3 X 2 2 Jest to model nieliniowy względem zmiennych objaśniających i liniowy względem parametrów strukturalnych. X 2
Zadanie 34. Zaproponować postać analityczną modelu Ŷ = f ( X ) mając następujące dane: t 1 2 3 4 5 6 7 8 9 y t 74 62 51 35 28 20 15 8 10 x t 2,2 2,2 2,3 2,4 2,6 2,9 3,2 3,6 4 Zadanie 35. Zaproponować postać analityczną trendu zmiennej Y mając następujące jej obserwacje w 15 kolejnych okresach: t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 y t 45 53 62 64 64 68 65 68 67 66 70 70 71 77 80 Zadanie 36. Zaproponować postać analityczną modelu Ŷ = f ( X ) mając następujące dane: t 1 2 3 4 5 6 7 8 9 10 y t 43 61 39 25 27 26 35 52 63 59 x t 11,2 11,3 12,4 13 14,3 15,7 16,7 17,6 17,6 18,1 Zadanie 37. Mając obserwacje zmiennych Y, X 1, X 2, X 3 stworzyć model opisujący zależność zmiennej Y od zmiennych X 1, X 2, X 3 t 1 2 3 4 5 6 7 8 9 10 y t 32 38 50 52 66 83 85 96 97 101 x t1 53 54 54 58 61 66 75 79 88 99 x t2 7 4,4 4,1 2,7 2,2 2,6 1,8 1,6 2,3 1,6 x t3 25 48 54 70 80 81 93 88 90 98
Dobór zmiennych objaśniających do modelu nieliniowego względem zmiennych objaśniających, a jednocześnie liniowego względem parametrów strukturalnych może być przeprowadzony na podstawie wektora i macierzy współczynników korelacji pomiędzy zmienną objaśnianą i liniowymi przekształceniami potencjalnych zmiennych objaśniających. Podobny dobór zmiennych objaśniających może być przeprowadzony dla potęgowego modelu ekonometrycznego: Ŷ =α 0 X 1 α 1 X 2 α 2 X k α k. Model ten sprowadza się do postaci liniowej przez jego zlogarytmowanie: log Ŷ =logα 0 +α 1 logx 1 +α 2 logx 2 ++α k logx k. Po podstawieniach: V =log Ŷ, β=logα 0, Z 1 =log X 1, Z 2 =log X 2,, Z k =log X k, otrzymujemy model liniowy zmiennej V względem zmiennych Z 1,Z 2,,Z k : V = β+α 1 Z 1 +α 2 Z 2 ++α k Z k. W tym wypadku wektor i macierz współczynników korelacji obliczamy w oparciu o liniowe przekształcenia wszystkich zmiennych.
Zadanie 38. Wyniki pomiarów zmiennej Y oraz potencjalnych zmiennych objaśniających X 1, X 2, X 3 są następujące: t 1 2 3 4 5 y t 3,2 3,4 3,4 3,6 3,9 x t1 1 1 10 100 100 x t2 5 8 6 6 10 x t3 10 5 2,5 3,33 2 Wyznaczyć wektor i macierz współczynników korelacji dla zmiennej Y i transformat zmiennych X 1, X 2, X 3. Stosując metodę wskaźników pojemności informacyjnej zbudować model. Mamy podane następujące postaci zależności: Y 1 =α 01 +α 11 logx 1, Y 2 =α 02 +α 12 X 2, Y 1 3 =α 03 +α 13 X 3.
Zadanie 39. Funkcje regresji zmiennej Y względem potencjalnych zmiennych objaśniających X 1, X 2, X 3, X 4 są następujące: Y 1 =α 01 +α 11 X 1 +α 21 X 1 2 +α 31 X 1 3, Y 1 2 =α 02 +α 12 X 2, Y 3 =α 03 +α 13 X 3 +α 23 X 3 2, Y 4 =α 04 +α 14 logx 4. Współczynniki korelacji pomiędzy zmienną Y oraz liniowymi transformatami zmiennych X 1, X 2, X 3, X 4 oraz współczynniki korelacji pomiędzy transformatami zmiennych X 1, X 2, X 3, X 4 są następujące: 0,93 R 0 =[0,81 0,41, 0,33 0,63 0,17] R=[ 1,00 0,81 0,82 0,40 0,25 0,59 0,22 0,81 1,00 0,86 0,45 0,45 0,38 0,14 0,82 0,86 1,00 0,51 0,42 0,44 0,12 0,40 0,45 0,51 1,00 0,05 0,28 0,23 0,25 0,45 0,42 0,05 1,00 0,04 0,22 0,59 0,38 0,44 0,28 0,04 1,00 0,38 0,22 0,14 0,12 0,23 0,22 0,38 1,00] Przeprowadzić redukcję zbioru transformat liniowych potencjalnych zmiennych objaśniających za pomocą metody analizy macierzy współczynników korelacji, przyjmując krytyczną wartość współczynnika korelacji r * = 0,5; zbudować model dla zmiennej Y
Szacowanie parametrów modeli nieliniowych. Model nieliniowy należy sprowadzić do postaci liniowej, tak aby przekształcone równanie miało postać liniową względem parametrów strukturalnych lub i funkcji. Najpierw za pomocą KMNK szacuje się parametry modelu przekształconego, następnie oblicza się wartości ocen parametrów modelu pierwotnego. Zadanie 40. Jednostkowe koszty produkcji w mln zł (Y) oraz wielkości produkcji w sztukach (X) w 8 zakładach produkujących ten sam wyrób kształtują się następująco: Zakład 1 2 3 4 5 6 7 8 y t 10 11 12 13 15 15 16 20 x t 10 5 4 4 2,5 2 2 1 Do opisu tej zależności zaproponowano model hiperboliczny Y = β+α 1 X +ε. Oszacować parametry strukturalne, odchylenie standardowe składnika losowego oraz standardowe błędy szacunku parametrów strukturalnych.
Zadanie 41. Na podstawie następujących obserwacji zmiennych Y i X: t 1 2 3 4 5 y t 20 21 23 26 29 x t 5 8 11 12 14 Oszacować parametry strukturalne dwóch typów modeli opisujących zależność zmiennej Y od zmiennej X: a) potęgowego, b) wykładniczego. Zadanie 42. Na podstawie następujących obserwacji zmiennych Y i X: t 1 2 3 4 y t 14 13 10 15 x t 1 1 2 4 Oszacować parametry strukturalne modelu: Y =α 0 +α 1 X +α 2 X 2 +ε. Zadanie 43. Na podstawie następujących obserwacji zmiennych Y, X 1 i X 2 : t 1 2 3 4 5 y t 1 2 3 4 5 x t1 2 2 2 1 1 x t2 3 3 2 2 2 Oszacować parametry strukturalne modelu: Y =α 0 +α 1 X 1 X 2 +ε
Zadanie 44. Zbudowano model: Y =α 0 +α 1 1 X 1 +α 2 X 2 +α 3 X 2 2 +ε. Mając następujące obserwacje zmiennych X 1 i X 2 : t 1 2 3 4 5 x t1 2 5 8 4 5 x t2 2 3 4 5 6 Zbudować macierz obserwacji X potrzebną do oszacowania parametrów strukturalnych powyższego modelu KMNK. Zadanie 45. Zbudowano model: Y =α 0 +α 1 X 2 X 1 +α 2 X 3 +ε. Mając następujące obserwacje zmiennych X 1 i X 2 : t 1 2 3 4 5 x t1 4 5 8 10 15 x t2 60 60 64 70 75 x t3 28 31 39 47 52 Zbudować macierz obserwacji X potrzebną do oszacowania parametrów strukturalnych powyższego modelu KMNK.
Badanie dopasowania modelu do danych empirycznych W przypadku modeli liniowych oraz modeli nieliniowych ze względu na zmienne objaśniające, a jednocześnie liniowych ze względu na parametry strukturalne mają zastosowanie wzory oceny dopasowania przedstawione dla modeli linowych. Ocena dopasowania dla modeli nieliniowych ze względu zarówno na zmienne objaśniające jak i na parametry strukturalne może być przeprowadzana za pomocą wskaźnika średniego względnego poziomu reszt o postaci: P= 1 n e t. n t=1 ŷ t Im mniejsze są wartości wskaźnika P, tym lepsze jest dopasowanie modelu do danych empirycznych
Zadanie 46. Na podstawie następujących danych: t 1 2 3 4 5 y t 4 4 2 1 1 x t 2 2 3 5 8 1 Oszacowano model: Ŷ = 0,0616+0,1346 X,oblicz wskaźnik średniego względnego poziomu reszt. Zadanie 47. Na podstawie następujących danych: t 1 2 3 4 5 y t 2 2 5 5 10 x t 0,1 0,2 0,5 0,5 1 Oszacowano model: Ŷ = 8,17 X X +0,359,oblicz wskaźnik średniego względnego poziomu reszt.
Modele wielorównaniowe
Postać strukturalna modelu wielorównaniowego Postać strukturalna modelu wielorównaniowego jest następująca: BY +ΓZ =ε, gdzie: - wektor zmiennych endogenicznych bez opóźnień czasowych, Y =[Y 1 Y 2 Y m] B=[ 1 β 21 β 12 1 β m1 β m2 β 1m β 2m 1 - ] macierz param. dla zmiennych endogenicznych,
- 1 Z =[Z Z 2 k] Z Γ =[ γ 11 γ 21 wektor zmiennych z góry ustalonych, γ 12 γ 22 γ m1 γ m2 - ε=[ε 1 ε 2 ε m] γ 1k γ 2k γ mk] - macierz param. przy zmiennych z góry ustalonych, wektor odchyleń losowych.
Postać zredukowana modelu wielorównaniowego Postać zredukowana modelu wielorównaniowego jest następująca: Y = Π T Z +η, gdzie: 11 Π =[π T π 21 π m1 - η=[η 1 η 2 η m] π 12 π 22 π m2 π 1k π 2k π mk] - macierz param. przy zmiennych z góry ustalonych, wektor odchyleń losowych postaci zredukowanej.
Między parametrami postaci zredukowanej i postaci strukturalnej istnieją następujące zależności: Π T = B 1 Γ, η=b 1 ε. Zadanie 48. Dany jest następujący model: W t =α 1 P t +α 2 W t 1 +α 3 S t 1 +α 4 +ε 1, P t = β 1 W t +β 2 W t 1 + β 3 S t 1 + β 4 +ε 2. a) Napisać postać strukturalną modelu, b) Napisać postać zredukowaną modelu, c) Wyrazić parametry i odchylenia losowe postaci zredukowanej jako funkcje tych wielkości z postaci strukturalnej.
Klasyfikacja modeli wielorównaniowych Ze względu na powiązania pomiędzy zmiennymi endogenicznymi nieopóźnionymi w czasie modele wielorównaniowe klasyfikuje się na: modele proste, modele rekurencyjne, modele o równaniach współzależnych. Rozpoznanie klasy modelu wielorównaniowego dokonuje się poprzez badanie macierzy B. Jeśli macierz B: jest macierzą diagonalną lub może okazać się taką po przenumerowaniu równań modelu to model nazywamy prostym, jest macierzą trójkątną lub może okazać się taką macierzą po przenumerowaniu równań lub zmianie miejsc zmiennych w równaniach to model nazywamy rekurencyjnym; jeśli macierz B nie jest macierzą diagonalną lub trójkątną to model jest modelem o równaniach współzależnych.
Zadanie 49. Rozpoznać klasę poniższych modeli: a) Y 1 =γ 11 Z 1 +γ 12 Z 2 +γ 1 +ε 1, Y 2 =β 21 Y 1 +γ 22 Z 2 +γ 2 +ε 2 ; b) Y 1 =α 1 Y 2 +γ 11 Z 1 +γ 12 Z 2 +γ 1 +ε 1, Y 2 =γ 21 Z 1 +γ 23 t+γ 2 +ε 2, Y 3 = β 31 Y 1 + β 32 Y 2 +γ 3 +ε 3 ; c) Y 1 = β 12 Y 2 +γ 11 Z 1 +γ 1 +ε 1, Y 2 =β 21 Y 1 +γ 22 Z 2 +γ 2 +ε 2 ; d) X t =α 1 X t 1 +α 2 X t 2 +α 3 X t 3 +α 4 +ε 1, Y t =β 1 Y t 1 + β 2 X t 2 +β 3 +ε 2 ; e) Y 1 =α 1 logx +α 2 +ε 1, Y 2 = β 1 Y 1 2 + β 2 X 2 +β 3 +ε 2, Y 3 =γ 1 1 Y 2 +γ 2 X 3 +γ 3 +ε 3 ;
Szacowanie parametrów modeli prostych i rekurencyjnych W tych dwóch rodzajach modeli nie występuje sprzężenie zwrotne pomiędzy nieopóźnionymi w czasie zmiennymi endogenicznymi. Dlatego każde równanie może być rozpatrzone osobno i traktowane jako model jednorównaniowy. Parametry każdego równania mogą zostać oszacowane osobno za pomocą klasycznej metody najmniejszych kwadratów. Zadanie 50. Zbudowano model dwurównaniowy: Y 1 =α 1 t+α 2 +ε 1, Y 2 =β 1 Y 1 + β 2 +ε 2. Mając następujące dane: t 1 2 3 4 5 y t1 1 1 2 2 4 y t2 3 4 6 5 8 Oszacować parametry strukturalne, standardowe błędy szacunku parametrów strukturalnych oraz wariancję odchyleń losowych poszczególnych równań.
Zadanie 51. Dany jest model dwurównaniowy: Y 1 =α 11 Z 1 +α 12 Z 2 +α 13 +ε 1, Y 2 =α 21 Z 1 +α 22 Z 2 +α 23 +ε 2. Oszacować parametry strukturalne, wariancję odchyleń losowych poszczególnych równań i standardowe błędy szacunku parametrów strukturalnych mając następujące dane: t 1 2 3 4 y t1 2 1 3 1 y t2 4 1 2 2 z t1 1 1 0 0 z t2 1 0 1 0 Zadanie 52. Zbudować następujący model: Y 1 =α 1 Z +α 2 +ε 1, Y 2 = β 1 Y 1 + β 2 +ε 2, Y 3 =γ 1 Y 2 +γ 2 +ε 3. Oszacować parametry strukturalne, standardowe błędy szacunku parametrów strukturalnych oraz wariancję odchyleń losowych poszczególnych równań modelu mając następujące dane: t 1 2 3 4 5 y t1 2 1 1 0 1 y t2 2 3 4 5 6 y t3 4 4 5 6 6 z t 1 1 2 3 3
Identyfikowalność modeli o równaniach współzależnych Przed przystąpieniem do szacowania parametrów modeli o równaniach współzależnych należy zbadać identyfikowalność poszczególnych równań. Jeśli równanie jest identyfikowalne, to można oszacować jego parametry. Jeśli równanie nie jest identyfikowalne, to nie można oszacować jego parametrów. Cały model o równaniach współzależnych jest identyfikowalny, jeśli wszystkie jego równania są identyfikowalne.
Twierdzenie. Warunkiem koniecznym i dostatecznym tego, aby i-te równanie wchodzące w skład modelu o m równaniach współzależnych było identyfikowalne, jest by macierz A i parametrów znajdujących się przy zmiennych, które są w modelu, a nie występują w równaniu, którego identyfikowalność jest badana, była rzędu m-1. Niech k i oznacza liczbę zmiennych, które znajdują się w modelu a nie występują w równaniu, którego identyfikowalność jest badana. Jeśli: k i = m 1, to równanie jest jednoznacznie identyfikowalne; k i > m 1, to równanie jest niejednoznacznie indentyfikowalne; k i < m 1, to równanie jest nieidentyfikowalne. Rozróżnienie to jest istotne z punktu widzenia metody szacowania parametrów modelu o równaniach współzależnych.