Dobó zmiennych do modelu ekonometycznego
Metody dobou zmiennych do modelu ekonometycznego opate na teście F
Model zedukowany ya 0 +a x+a x+.+a x Model pełny ya 0 +a x+a x+.+a x +a + x + + +a k x k
Częściowy test F k 0 j + H : α j k gdzie: 0 H : α j 0 j + F (, n( k ) ) SSER SSE SSEF n k F SSE R SSE F - suma kwadatów eszt modelu zedukowanego, - suma kwadatów eszt pełnego modelu, n liczba obsewacji, k liczba zmiennych objaśniających w pełnym modelu, liczba zmiennych objaśniających w modelu zedukowanym.
Metoda eliminacji wstecznej 0) Zaczynamy od modelu ze wszystkimi zmiennymi objaśniającymi. )Dla każdej zmiennej wyznaczamy statystykę częściową F, tak jakby była ona ostatnią zmienną objaśniającą włączaną do modelu. Z modelu usuwamy zmienną, dla któej istotność statystyki częściowej F jest α Poceduę kontynuujemy do momentu, gdy nie ma zmiennej objaśniającej, któa mogłaby być wyłączona z modelu
KROK 0. Budujemy egesję dla wszystkich sześciu zmiennych objaśniających. Taktując ją jako model pełny wyznaczamy statystykę SSE R 63935500 KROK. Budujemy modele egesji zedukowanej z pięcioma zmiennymi usuwając z modelu pełnego po jednej zmiennej objaśniającej. Dla każdego modelu obliczamy statystykę SSE R i wyznaczamy statystykę F testu częściowego oaz jej istotność, tabela 4. Tabela 4. Statystyki modelu pełnego i zedukowanego (kok ). Zmienne w modelu SSE F Istotność F Model pełny: Z(t-7) 639355000 Tempeatua Punkt Rosy Wilgotność Ciśnienie Pędkość Wiatu Model zedukowany bez zmiennej Z(t-7) 435050000 5,0907 0,00 Model zedukowany bez zmiennej Tempeatua 644677000 0,0080 0,99 Max Model zedukowany bez zmiennej Punkt Rosy 6655000 0,09066 0,769 Model zedukowany bez zmiennej Wilgotność 80870000 0,660883 0,43 Model zedukowany bez zmiennej Ciśnienie 66908000 0,09578 0,76 Model zedukowany bez zmiennej Pędkość Wiatu 774000 0,547999 0,47
Maksymalna istotność statystyki F odpowiada zmiennej Tempeatua i jest większa od pzyjętego poziomu istotności 0,. Zmienną Tempeatua usuwamy z modelu. Nie wnosi ona dodatkowej infomacji do modelu, w któym występują pozostałe zmienne - zatem eliminujemy ją z modelu.
W kolejnym koku z tego samego powodu eliminujemy z modelu kolejną zmienną objaśniającą: Ciśnienie, Ostatecznie w modelu zostają następujące zmienne objaśniające Z t- Pędkość wiatu, Wilgotność, Punkt osy.
Końcowy model Multiple Regession Analysis ----------------------------------------------------------------------------- Dependent vaiable: Z t ----------------------------------------------------------------------------- Standad T Paamete Estimate Eo Statistic P-Value ----------------------------------------------------------------------------- CONSTANT -930,4 460,4-0,63397 0,5356 Z t- 0,89443 0,094798 9,43887 0,0000 PunkRosy -597,988 339,43 -,767 0,0983 Wilgotnosc 78,639 355,83,9666 0,044 Pedkosc wiatu 675,34 4,5,6466 0,5 -----------------------------------------------------------------------------
Step 0: --------- 6 vaiables in the model. 3 d.f. fo eo. R-squaed 86,35% Adjusted R-squaed 80,05% MSE 4,98E7 Step : --------- Removing vaiable Tempeatua with F-to-emove 0,083 istotność0,99 5 vaiables in the model. 4 d.f. fo eo. R-squaed 86,4% Adjusted R-squaed 8,3% MSE 4,60484E7
Step --------- Removing vaiable Ciśnienie with F-to-emove 0,435 istotność 0,78 4 vaiables in the model. 5 d.f. fo eo. R-squaed 85,8% Adjusted R-squaed 8,03% MSE 4,43055E7 Step 3: --------- Max watość statystyki F dla Pędkość wiatu with F-to-emove,69506 istotność0,054 <0, 4 vaiables in the model. 6 d.f. fo eo. Final model selected
Metoda dobou w pzód 0) Statujemy z modelem bez zmiennych objaśniających. ) Rozpatujemy wszystkie k modeli z jedną zmienną objaśniającą. Wybieamy model o max watości statystyki F (pzy czym istotność statystyki F musi być < α ) ) Badamy zmienne poza modelem. Wyznaczamy dla nich statystyki częściowe F. Do modelu włączamy jedną zmienną o max watości statystyki częściowej F (pzy czym istotność statystyki F < α musi być ) Poceduę kontynuujemy do momentu, gdy nie ma zmiennej objaśniającej, któa mogłaby być włączona do modelu
Step 0: --------- 0 vaiables in the model. 9 d.f. fo eo. R-squaed 0,00% Adjusted R-squaed 0,00% MSE,465E8 Step : --------- Adding vaiable Zt- with F-to-ente 6, vaiables in the model. 8 d.f. fo eo. R-squaed 77,53% Adjusted R-squaed 76,9% MSE 5,84544E7 Final model selected.
Końcowy model Zˆ t 36759, + 0,83395Z t
Metoda kokowa 0) Statujemy z modelem bez zmiennych objaśniających. ) Rozpatujemy wszystkie k modeli z jedną zmienną objaśniającą. Wybieamy model o max watości statystyki F (pzy czym istotność statystyki F musi być < Pin ) ) Badamy zmienne poza modelem. Wyznaczamy dla nich statystyki częściowe F. Do modelu włączamy jedną zmienną o max watości statystyki częściowej F (pzy czym istotność statystyki F musi być > Pout ) Spawdzamy, czy po włączeniu nowej zmiennej wszystkie zmienne spełniają kyteium pozostania w modelu Poceduę kontynuujemy do momentu, gdy nie ma poza modelem zmiennej objaśniającej, któa mogłaby być włączona do modelu oaz nie ma w modelu zmiennej, któa mogłaby być usunięta.
Oblicz watość statystyki F dla każdej zmiennej poza modelem Czy jest pzynajmniej jedna zmienna istotna p<pin NIE STOP TAK Włącz do modelu zmienną o największej istotności ( o najmniejszym p) Oblicz watość statystyki częściowej F dla wszystkich zmiennych właczonych do modelu Czy istnieje zmienna o watości p>pout TAK Usuń tą zmienną NIE
Metody dobou zmiennych do modelu ekonometycznego opate o współczynnik koelacji
Zmienne objaśniające w liniowym modelu ekonometycznym powinny być: silnie skoelowane ze zmienną objaśnianą, słabo skoelowane między sobą, silnie skoelowane z innymi zmiennymi objaśniającymi, któe nie weszły do modelu (są ich epezentantami).
Estymato zgodny współczynnika koelacji ( )( ) ( ) ( ) y y x x y y x x n i i n i i n i i i Zał. Cechy X, Y mają dwuwymiaowy ozkład nomalny
Dzień Y Z [KWh] X Z(t-7) [KWh] X Tempeatua [F] X3 Punkt Rosy [F] X4 Wilgotność [%] X5 Ciśnienie [In] X6 Pędkość Wiatu [MPH] 0-08 968 94643 5 5 00 30, 9 0-09 334 39965 5 50 00 30,0 4 0-0 34 4060 57 50 00 9,8 0-4748 3586 6 54 94 9,59 8 0-33730 3848 68 57 94 9,77 9 0-3 3564 40086 77 57 94 9,9 0-4 3500 50664 6 57 00 30,09 7 0-5 9408 968 75 57 00 30,06 3 0-6 30408 334 73 55 00 30,04 6 0-7 3358 34 66 55 94 30,4 9 0-8 38843 4748 53 5 00 30,33 4 0-9 4707 33730 55 54 00 30,7 0-0 376 3564 60 5 00 30,36 0-46486 3500 60 45 00 30,4 6 0-96706 9408 64 45 93 30,48 9 0-3 38388 30408 66 43 00 30,39 0-4 3747 3358 59 48 93 30,5 6 0-5 775 38843 6 50 87 30,06 8 0-6 3867 4707 60 55 88 9,89 0-7 8554 376 53 43 87 30,06 6
Wekto współczynników koelacji R ZMIENNA Z Z(t-7) [KWH] 0,88 Tempeatua [F] -0,5 Punkt Rosy [F] -0,0 Wilgotność [%] 0,0 Ciśnienie [In] -0, Pędkość Wiatu [MPH] 0,0
Test istotności współczynnika koelacji Zał.:. Cechy X, Y mają dwuwymiaowy ozkład nomalny H H ( Zt, Zt ) 0 ( Z, Z ) 0 0 : ρ : ρ t t t n 0,88 0,88 0 7,86 t 7,86 > t, ( 8), 734 0 Odzucamy hipotezę H 0na kozyść H Współczynnik koelacji jest istotnie óżny od zea
METODA GRAFOWA
Współczynnik koelacji R 0 L m -wekto współczynników koelacji zmiennej objaśnianej y ze zmiennymi objaśniającymi X j ( j,,..., m) R... m... m............ m m... mm - maciez współczynników koelacji zmiennych objaśniających.
Maciez współczynników koelacji R 0 ZMIENNA Z (t-7) [KW h] Z(t-7),00 Tempeatu a [F] Tempeatua [F] -0,0,00 Punkt Rosy [F] Punkt Rosy [F] 0,7 0,4,00 Wilgotno ść [%] Wilgotność [%] -0, -0,04 0,4,00 Ciśnien ie [In] Ciśnienie [In] -0,30-0,4-0,49 0,8,00 Pędkość Wiatu [MPH] Pędkość Wiatu [MPH] -0,0 0,6-0, -0,4-0,,00
Kytyczny współczynnik koelacji * t α t α ( n ) ( n ) + n - kytyczny współczynnik koelacji ij ( X, X ) 0 * < ρ i j
n0 alfa0, * α t t α + n,734,734 + 0 0,378
Ustalenie zmiennych istotnie skoelowanych Jeśli dla pay zmiennych X i, X j zachodzi * ij to pzyjmujemy, że koelacja pomiędzy tymi zmiennymi jest istotna statystycznie. W pzeciwnym pzypadku * ij < koelację uznajemy za nieistotną.
Budowa maciezy koelacji istotnej R 0 ( 0 ij) 0 0 ij jeśli koelacja pomiędzy zmiennymi objaśniającymi X i, X j jest nieistotna, 0 ij jeśli koelacja pomiędzy zmiennymi objaśniającymi X i, X j jest istotna,
ZMIENNA Z (t-7) [KWh] Tempeatua [F] Punkt Rosy [F] Wilgotność [%] Ciśnienie [In] Pędkość Wiatu [MPH] Z(t-7),00 R 0 Tempeatua [F] -0,0,00 Punkt Rosy [F] 0,7 0,4,00 *0,378 Wilgotność [%] -0, -0,04 0,4,00 Ciśnienie [In] -0,30-0,4-0,49 0,8,00 Pędkość Wiatu [MPH] -0,0 0,6-0, -0,4-0,,00 ZMIENNA Z (t-7) [KWh] Tempeatua [F] Punkt Rosy [F] Wilgotność [%] Ciśnienie [In] Pędkość Wiatu [MPH] Z(t-7) [KWH] R 0 Tempeatua [F] 0 Punkt Rosy [F] 0 Wilgotność [%] 0 0 0 Ciśnienie [In] 0 0 0 Pędkość Wiatu [MPH] 0 0 0 0
Gaf koelacji G (V,A) Wiezchołkami gafu są zmienne objaśniające X,,X n. Pzyjmuje się, że jeśli element 0 ij maciezy R 0 jest ówny, to łuk pomiędzy wiezchołkami występuje w gafie, w pzeciwnym pzypadku bak takiego łuku.
Gaf koelacji G(V, A) P R Z C W T P W
Gaf G(V,A) może być gafem niespójnym. Jeśli gaf G składa się z kilku spójnych podgafów, to zmienne występujące w dwóch óżnych podgafach są ze sobą nieskoelowane. Z każdej spójnej składowej gafu do modelu ekonometycznego wybieamy jedną zmienną objaśniającą.
Wybó zmiennych jest dwukyteialny Pioytetowym kyteium jest maksymalna liczba powiązań z innymi zmiennymi, to znaczy, że do modelu wchodzi ta zmienna, któa jest skoelowana z największą liczbą innych zmiennych objaśniających. Jeśli zmiennych spełniających to kyteium jest kilka, to wybieamy tą zmienną objaśniajacą, któa jest najbadziej skoelowana ze zmienną objaśnianą Y.
Gaf koelacji G(V, A) ZMIENNA Z Z(t-7) [KWH] Z 0,88 Tempeatua [F] T -0,5 Punkt Rosy [F] PR -0,0 Wilgotność [%] W 0,0 Ciśnienie [In] C -0, Pędkość Wiatu [MPH] PW 0,0 T P R C Z P W W Ya 0 +a Z+a PR+a 3 PW
Multiple Regession Analysis ----------------------------------------------------------------------------- Dependent vaiable: Z(t) ----------------------------------------------------------------------------- Standad T Paamete Estimate Eo Statistic P-Value ----------------------------------------------------------------------------- CONSTANT -493,6 4769,6 -,0300 0,383 Z(t-7) 790,788 43,889,83 0,0858 Wilgotność 0,8633 0,099096 8,7659 0,0000 Pędkość Wiatu 78,03 377,5,93034 0,075 ----------------------------------------------------------------------------- Analysis of Vaiance ----------------------------------------------------------------------------- Souce Sum of Squaes Df Mean Squae F-Ratio P-Value ----------------------------------------------------------------------------- Model 3,885E9 3,9375E9 5,80 0,0000 Residual 8,046E8 6 5,0404E7 ----------------------------------------------------------------------------- Total (Co.) 4,68349E9 9 R-squaed 8,8708 pecent R-squaed (adjusted fo d.f.) 79,659 pecent Standad Eo of Est. 7080,99 Mean absolute eo 596,84 Dubin-Watson statistic,6588
Metoda Hellwiga
Definicja: KOMBINACJA DOWOLNY PODZBIÓR ZMIENNYCH OBJAŚNIAJĄCYCH: h j + j i j ij j tej -pojemność indywidualna zmiennej objaśniającej H l h j X j K l - pojemność integalnal tej kombinacji zmiennych objaśniających WYBIERAMY PODZBIÓR o MAX POJEMNOŚCI INTEGRALNEJ
0,7744 0,88 t t Z Z h H pedkoscwiatu otnosc wi t Z K X j h h h h H l j + + lg KOMBINACJA Zt- KOMBINACJA Zt-, Wilgotność, Pedkośćwiatu 0,779 0,0085 0,0003 0,763 0,0085 0,4) ( 0,0) ( 0,0 0,0003 0,4) ( 0,) ( 0,0 0,763 0,0) ( 0,) ( 0,88 lg, P, P P P,P lg, lg lg lg,p lg, + + + + + + + + + + + + + + H h h h otnosc edkoscwiatu Wi Z edkoscwiatu edkoscwiatu edkoscwiatu edkoscwiatu otnosc Wi Z otnosz Wi otnosc Wi otnosc Wi edkoscwiatu Z otnosz Wi Z Z Z t t t t t t
Model Zˆ t 36759, + 0,83395Z t