Dobór zmiennych do modelu ekonometrycznego

Podobne dokumenty
Dobór zmiennych objaśniających do liniowego modelu ekonometrycznego

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Matematyka ubezpieczeń majątkowych r.

Ekonometria, lista zadań nr 6 Zadanie 5 H X 1, X 2, X 3

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Regresja liniowa wprowadzenie

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Metody optymalizacji. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

(LMP-Liniowy model prawdopodobieństwa)

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

Tradycyjne mierniki ryzyka

Testy post-hoc. Wrocław, 6 czerwca 2016

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Kognitywistyka II r. Teoria rzetelności wyników testu. Teorie inteligencji i sposoby jej pomiaru (4) Rzetelność czyli dokładność pomiaru

Rozdział 8. Regresja. Definiowanie modelu

Zmienne zależne i niezależne

Ekonometria dla IiE i MSEMat Z7

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Metodologia badań psychologicznych. Wykład 12. Korelacje

TECHNIKI INFORMATYCZNE W ODLEWNICTWIE

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Regresja liniowa w R Piotr J. Sobczyk

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Wprowadzenie do analizy korelacji i regresji

PAKIETY STATYSTYCZNE

Egzamin z ekonometrii wersja IiE, MSEMAT

Siła tarcia. Tarcie jest zawsze przeciwnie skierowane do kierunku ruchu (do prędkości). R. D. Knight, Physics for scientists and engineers

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Graf skierowany. Graf zależności dla struktur drzewiastych rozgrywających parametrycznie

Ekonometria Ćwiczenia 19/01/05

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

należą do grupy odbiorników energii elektrycznej idealne elementy rezystancyjne przekształcają energię prądu elektrycznego w ciepło

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

II.6. Wahadło proste.

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

WYKŁAD 11 OPTYMALIZACJA WIELOKRYTERIALNA

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Ćwiczenia IV

KURS GEOMETRIA ANALITYCZNA

Model klasyczny gospodarki otwartej

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Ekonometria - wykªad 8

Matematyka i statystyka matematyczna dla rolników w SGGW

Regresja - zadania i przykłady.

Permutacyjna metoda oceny istotności regresji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

5. Rozwiązywanie układów równań liniowych

Egzamin z ekonometrii - wersja ogólna

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Budowa modelu i testowanie hipotez

Czasowy wymiar danych

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

5. Model sezonowości i autoregresji zmiennej prognozowanej

Egzamin z ekonometrii wersja ogolna

Ocena siły oddziaływania procesów objaśniających dla modeli przestrzennych

Stosowana Analiza Regresji

Statystyka w analizie i planowaniu eksperymentu

WYKŁAD 1. W przypadku zbiornika zawierającego gaz, stan układu jako całości jest opisany przez: temperaturę, ciśnienie i objętość.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Uwagi: LABORATORIUM WYTRZYMAŁOŚCI MATERIAŁÓW. Ćwiczenie nr 16 MECHANIKA PĘKANIA. ZNORMALIZOWANY POMIAR ODPORNOŚCI MATERIAŁÓW NA PĘKANIE.

KINEMATYCZNE WŁASNOW PRZEKŁADNI

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

4. Średnia i autoregresja zmiennej prognozowanej

Weryfikacja hipotez statystycznych

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Próba określenia miary jakości informacji na gruncie teorii grafów dla potrzeb dydaktyki

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Analiza autokorelacji

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Wykład 8 Dane kategoryczne

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

EKONOMETRYCZNA PROGNOZA ODPŁYWÓW Z BEZROBOCIA

Regresja - zadania i przykłady.

Analiza składowych głównych. Wprowadzenie

Hipoteza: Dziewczynki częściej niż chłopcy mają sprecyzowane plany dotyczące dalszego kształcenia (dlaczego?)

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

1. Ciało sztywne, na które nie działa moment siły pozostaje w spoczynku lub porusza się ruchem obrotowym jednostajnym.

Wydział Matematyki. Testy zgodności. Wykład 03

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Transkrypt:

Dobó zmiennych do modelu ekonometycznego

Metody dobou zmiennych do modelu ekonometycznego opate na teście F

Model zedukowany ya 0 +a x+a x+.+a x Model pełny ya 0 +a x+a x+.+a x +a + x + + +a k x k

Częściowy test F k 0 j + H : α j k gdzie: 0 H : α j 0 j + F (, n( k ) ) SSER SSE SSEF n k F SSE R SSE F - suma kwadatów eszt modelu zedukowanego, - suma kwadatów eszt pełnego modelu, n liczba obsewacji, k liczba zmiennych objaśniających w pełnym modelu, liczba zmiennych objaśniających w modelu zedukowanym.

Metoda eliminacji wstecznej 0) Zaczynamy od modelu ze wszystkimi zmiennymi objaśniającymi. )Dla każdej zmiennej wyznaczamy statystykę częściową F, tak jakby była ona ostatnią zmienną objaśniającą włączaną do modelu. Z modelu usuwamy zmienną, dla któej istotność statystyki częściowej F jest α Poceduę kontynuujemy do momentu, gdy nie ma zmiennej objaśniającej, któa mogłaby być wyłączona z modelu

KROK 0. Budujemy egesję dla wszystkich sześciu zmiennych objaśniających. Taktując ją jako model pełny wyznaczamy statystykę SSE R 63935500 KROK. Budujemy modele egesji zedukowanej z pięcioma zmiennymi usuwając z modelu pełnego po jednej zmiennej objaśniającej. Dla każdego modelu obliczamy statystykę SSE R i wyznaczamy statystykę F testu częściowego oaz jej istotność, tabela 4. Tabela 4. Statystyki modelu pełnego i zedukowanego (kok ). Zmienne w modelu SSE F Istotność F Model pełny: Z(t-7) 639355000 Tempeatua Punkt Rosy Wilgotność Ciśnienie Pędkość Wiatu Model zedukowany bez zmiennej Z(t-7) 435050000 5,0907 0,00 Model zedukowany bez zmiennej Tempeatua 644677000 0,0080 0,99 Max Model zedukowany bez zmiennej Punkt Rosy 6655000 0,09066 0,769 Model zedukowany bez zmiennej Wilgotność 80870000 0,660883 0,43 Model zedukowany bez zmiennej Ciśnienie 66908000 0,09578 0,76 Model zedukowany bez zmiennej Pędkość Wiatu 774000 0,547999 0,47

Maksymalna istotność statystyki F odpowiada zmiennej Tempeatua i jest większa od pzyjętego poziomu istotności 0,. Zmienną Tempeatua usuwamy z modelu. Nie wnosi ona dodatkowej infomacji do modelu, w któym występują pozostałe zmienne - zatem eliminujemy ją z modelu.

W kolejnym koku z tego samego powodu eliminujemy z modelu kolejną zmienną objaśniającą: Ciśnienie, Ostatecznie w modelu zostają następujące zmienne objaśniające Z t- Pędkość wiatu, Wilgotność, Punkt osy.

Końcowy model Multiple Regession Analysis ----------------------------------------------------------------------------- Dependent vaiable: Z t ----------------------------------------------------------------------------- Standad T Paamete Estimate Eo Statistic P-Value ----------------------------------------------------------------------------- CONSTANT -930,4 460,4-0,63397 0,5356 Z t- 0,89443 0,094798 9,43887 0,0000 PunkRosy -597,988 339,43 -,767 0,0983 Wilgotnosc 78,639 355,83,9666 0,044 Pedkosc wiatu 675,34 4,5,6466 0,5 -----------------------------------------------------------------------------

Step 0: --------- 6 vaiables in the model. 3 d.f. fo eo. R-squaed 86,35% Adjusted R-squaed 80,05% MSE 4,98E7 Step : --------- Removing vaiable Tempeatua with F-to-emove 0,083 istotność0,99 5 vaiables in the model. 4 d.f. fo eo. R-squaed 86,4% Adjusted R-squaed 8,3% MSE 4,60484E7

Step --------- Removing vaiable Ciśnienie with F-to-emove 0,435 istotność 0,78 4 vaiables in the model. 5 d.f. fo eo. R-squaed 85,8% Adjusted R-squaed 8,03% MSE 4,43055E7 Step 3: --------- Max watość statystyki F dla Pędkość wiatu with F-to-emove,69506 istotność0,054 <0, 4 vaiables in the model. 6 d.f. fo eo. Final model selected

Metoda dobou w pzód 0) Statujemy z modelem bez zmiennych objaśniających. ) Rozpatujemy wszystkie k modeli z jedną zmienną objaśniającą. Wybieamy model o max watości statystyki F (pzy czym istotność statystyki F musi być < α ) ) Badamy zmienne poza modelem. Wyznaczamy dla nich statystyki częściowe F. Do modelu włączamy jedną zmienną o max watości statystyki częściowej F (pzy czym istotność statystyki F < α musi być ) Poceduę kontynuujemy do momentu, gdy nie ma zmiennej objaśniającej, któa mogłaby być włączona do modelu

Step 0: --------- 0 vaiables in the model. 9 d.f. fo eo. R-squaed 0,00% Adjusted R-squaed 0,00% MSE,465E8 Step : --------- Adding vaiable Zt- with F-to-ente 6, vaiables in the model. 8 d.f. fo eo. R-squaed 77,53% Adjusted R-squaed 76,9% MSE 5,84544E7 Final model selected.

Końcowy model Zˆ t 36759, + 0,83395Z t

Metoda kokowa 0) Statujemy z modelem bez zmiennych objaśniających. ) Rozpatujemy wszystkie k modeli z jedną zmienną objaśniającą. Wybieamy model o max watości statystyki F (pzy czym istotność statystyki F musi być < Pin ) ) Badamy zmienne poza modelem. Wyznaczamy dla nich statystyki częściowe F. Do modelu włączamy jedną zmienną o max watości statystyki częściowej F (pzy czym istotność statystyki F musi być > Pout ) Spawdzamy, czy po włączeniu nowej zmiennej wszystkie zmienne spełniają kyteium pozostania w modelu Poceduę kontynuujemy do momentu, gdy nie ma poza modelem zmiennej objaśniającej, któa mogłaby być włączona do modelu oaz nie ma w modelu zmiennej, któa mogłaby być usunięta.

Oblicz watość statystyki F dla każdej zmiennej poza modelem Czy jest pzynajmniej jedna zmienna istotna p<pin NIE STOP TAK Włącz do modelu zmienną o największej istotności ( o najmniejszym p) Oblicz watość statystyki częściowej F dla wszystkich zmiennych właczonych do modelu Czy istnieje zmienna o watości p>pout TAK Usuń tą zmienną NIE

Metody dobou zmiennych do modelu ekonometycznego opate o współczynnik koelacji

Zmienne objaśniające w liniowym modelu ekonometycznym powinny być: silnie skoelowane ze zmienną objaśnianą, słabo skoelowane między sobą, silnie skoelowane z innymi zmiennymi objaśniającymi, któe nie weszły do modelu (są ich epezentantami).

Estymato zgodny współczynnika koelacji ( )( ) ( ) ( ) y y x x y y x x n i i n i i n i i i Zał. Cechy X, Y mają dwuwymiaowy ozkład nomalny

Dzień Y Z [KWh] X Z(t-7) [KWh] X Tempeatua [F] X3 Punkt Rosy [F] X4 Wilgotność [%] X5 Ciśnienie [In] X6 Pędkość Wiatu [MPH] 0-08 968 94643 5 5 00 30, 9 0-09 334 39965 5 50 00 30,0 4 0-0 34 4060 57 50 00 9,8 0-4748 3586 6 54 94 9,59 8 0-33730 3848 68 57 94 9,77 9 0-3 3564 40086 77 57 94 9,9 0-4 3500 50664 6 57 00 30,09 7 0-5 9408 968 75 57 00 30,06 3 0-6 30408 334 73 55 00 30,04 6 0-7 3358 34 66 55 94 30,4 9 0-8 38843 4748 53 5 00 30,33 4 0-9 4707 33730 55 54 00 30,7 0-0 376 3564 60 5 00 30,36 0-46486 3500 60 45 00 30,4 6 0-96706 9408 64 45 93 30,48 9 0-3 38388 30408 66 43 00 30,39 0-4 3747 3358 59 48 93 30,5 6 0-5 775 38843 6 50 87 30,06 8 0-6 3867 4707 60 55 88 9,89 0-7 8554 376 53 43 87 30,06 6

Wekto współczynników koelacji R ZMIENNA Z Z(t-7) [KWH] 0,88 Tempeatua [F] -0,5 Punkt Rosy [F] -0,0 Wilgotność [%] 0,0 Ciśnienie [In] -0, Pędkość Wiatu [MPH] 0,0

Test istotności współczynnika koelacji Zał.:. Cechy X, Y mają dwuwymiaowy ozkład nomalny H H ( Zt, Zt ) 0 ( Z, Z ) 0 0 : ρ : ρ t t t n 0,88 0,88 0 7,86 t 7,86 > t, ( 8), 734 0 Odzucamy hipotezę H 0na kozyść H Współczynnik koelacji jest istotnie óżny od zea

METODA GRAFOWA

Współczynnik koelacji R 0 L m -wekto współczynników koelacji zmiennej objaśnianej y ze zmiennymi objaśniającymi X j ( j,,..., m) R... m... m............ m m... mm - maciez współczynników koelacji zmiennych objaśniających.

Maciez współczynników koelacji R 0 ZMIENNA Z (t-7) [KW h] Z(t-7),00 Tempeatu a [F] Tempeatua [F] -0,0,00 Punkt Rosy [F] Punkt Rosy [F] 0,7 0,4,00 Wilgotno ść [%] Wilgotność [%] -0, -0,04 0,4,00 Ciśnien ie [In] Ciśnienie [In] -0,30-0,4-0,49 0,8,00 Pędkość Wiatu [MPH] Pędkość Wiatu [MPH] -0,0 0,6-0, -0,4-0,,00

Kytyczny współczynnik koelacji * t α t α ( n ) ( n ) + n - kytyczny współczynnik koelacji ij ( X, X ) 0 * < ρ i j

n0 alfa0, * α t t α + n,734,734 + 0 0,378

Ustalenie zmiennych istotnie skoelowanych Jeśli dla pay zmiennych X i, X j zachodzi * ij to pzyjmujemy, że koelacja pomiędzy tymi zmiennymi jest istotna statystycznie. W pzeciwnym pzypadku * ij < koelację uznajemy za nieistotną.

Budowa maciezy koelacji istotnej R 0 ( 0 ij) 0 0 ij jeśli koelacja pomiędzy zmiennymi objaśniającymi X i, X j jest nieistotna, 0 ij jeśli koelacja pomiędzy zmiennymi objaśniającymi X i, X j jest istotna,

ZMIENNA Z (t-7) [KWh] Tempeatua [F] Punkt Rosy [F] Wilgotność [%] Ciśnienie [In] Pędkość Wiatu [MPH] Z(t-7),00 R 0 Tempeatua [F] -0,0,00 Punkt Rosy [F] 0,7 0,4,00 *0,378 Wilgotność [%] -0, -0,04 0,4,00 Ciśnienie [In] -0,30-0,4-0,49 0,8,00 Pędkość Wiatu [MPH] -0,0 0,6-0, -0,4-0,,00 ZMIENNA Z (t-7) [KWh] Tempeatua [F] Punkt Rosy [F] Wilgotność [%] Ciśnienie [In] Pędkość Wiatu [MPH] Z(t-7) [KWH] R 0 Tempeatua [F] 0 Punkt Rosy [F] 0 Wilgotność [%] 0 0 0 Ciśnienie [In] 0 0 0 Pędkość Wiatu [MPH] 0 0 0 0

Gaf koelacji G (V,A) Wiezchołkami gafu są zmienne objaśniające X,,X n. Pzyjmuje się, że jeśli element 0 ij maciezy R 0 jest ówny, to łuk pomiędzy wiezchołkami występuje w gafie, w pzeciwnym pzypadku bak takiego łuku.

Gaf koelacji G(V, A) P R Z C W T P W

Gaf G(V,A) może być gafem niespójnym. Jeśli gaf G składa się z kilku spójnych podgafów, to zmienne występujące w dwóch óżnych podgafach są ze sobą nieskoelowane. Z każdej spójnej składowej gafu do modelu ekonometycznego wybieamy jedną zmienną objaśniającą.

Wybó zmiennych jest dwukyteialny Pioytetowym kyteium jest maksymalna liczba powiązań z innymi zmiennymi, to znaczy, że do modelu wchodzi ta zmienna, któa jest skoelowana z największą liczbą innych zmiennych objaśniających. Jeśli zmiennych spełniających to kyteium jest kilka, to wybieamy tą zmienną objaśniajacą, któa jest najbadziej skoelowana ze zmienną objaśnianą Y.

Gaf koelacji G(V, A) ZMIENNA Z Z(t-7) [KWH] Z 0,88 Tempeatua [F] T -0,5 Punkt Rosy [F] PR -0,0 Wilgotność [%] W 0,0 Ciśnienie [In] C -0, Pędkość Wiatu [MPH] PW 0,0 T P R C Z P W W Ya 0 +a Z+a PR+a 3 PW

Multiple Regession Analysis ----------------------------------------------------------------------------- Dependent vaiable: Z(t) ----------------------------------------------------------------------------- Standad T Paamete Estimate Eo Statistic P-Value ----------------------------------------------------------------------------- CONSTANT -493,6 4769,6 -,0300 0,383 Z(t-7) 790,788 43,889,83 0,0858 Wilgotność 0,8633 0,099096 8,7659 0,0000 Pędkość Wiatu 78,03 377,5,93034 0,075 ----------------------------------------------------------------------------- Analysis of Vaiance ----------------------------------------------------------------------------- Souce Sum of Squaes Df Mean Squae F-Ratio P-Value ----------------------------------------------------------------------------- Model 3,885E9 3,9375E9 5,80 0,0000 Residual 8,046E8 6 5,0404E7 ----------------------------------------------------------------------------- Total (Co.) 4,68349E9 9 R-squaed 8,8708 pecent R-squaed (adjusted fo d.f.) 79,659 pecent Standad Eo of Est. 7080,99 Mean absolute eo 596,84 Dubin-Watson statistic,6588

Metoda Hellwiga

Definicja: KOMBINACJA DOWOLNY PODZBIÓR ZMIENNYCH OBJAŚNIAJĄCYCH: h j + j i j ij j tej -pojemność indywidualna zmiennej objaśniającej H l h j X j K l - pojemność integalnal tej kombinacji zmiennych objaśniających WYBIERAMY PODZBIÓR o MAX POJEMNOŚCI INTEGRALNEJ

0,7744 0,88 t t Z Z h H pedkoscwiatu otnosc wi t Z K X j h h h h H l j + + lg KOMBINACJA Zt- KOMBINACJA Zt-, Wilgotność, Pedkośćwiatu 0,779 0,0085 0,0003 0,763 0,0085 0,4) ( 0,0) ( 0,0 0,0003 0,4) ( 0,) ( 0,0 0,763 0,0) ( 0,) ( 0,88 lg, P, P P P,P lg, lg lg lg,p lg, + + + + + + + + + + + + + + H h h h otnosc edkoscwiatu Wi Z edkoscwiatu edkoscwiatu edkoscwiatu edkoscwiatu otnosc Wi Z otnosz Wi otnosc Wi otnosc Wi edkoscwiatu Z otnosz Wi Z Z Z t t t t t t

Model Zˆ t 36759, + 0,83395Z t