4. Weryfikacja modelu

Podobne dokumenty
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Prawdopodobieństwo i statystyka

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Badanie stacjonarności szeregów czasowych w programie GRETL

Wykład 3 Hipotezy statystyczne

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 5.

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Wprowadzenie do analizy korelacji i regresji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Weryfikacja hipotez statystycznych

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

STATYSTYKA MATEMATYCZNA

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Kolokwium ze statystyki matematycznej

KORELACJE I REGRESJA LINIOWA

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Własności statystyczne regresji liniowej. Wykład 4

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Przykład 2. Stopa bezrobocia

Rozdział 8. Regresja. Definiowanie modelu

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Prawdopodobieństwo i rozkład normalny cd.

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Metody Ilościowe w Socjologii

Wybrane rozkłady zmiennych losowych i ich charakterystyki

WYKŁAD 5 TEORIA ESTYMACJI II

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Przykład 1 ceny mieszkań

166 Wstęp do statystyki matematycznej

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

METODY STATYSTYCZNE W BIOLOGII

Pobieranie prób i rozkład z próby

Podstawy rachunku prawdopodobieństwa (przypomnienie)

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

DRGANIA WŁASNE RAM OBLICZANIE CZĘSTOŚCI KOŁOWYCH DRGAŃ WŁASNYCH

Prognozowanie na podstawie modelu ekonometrycznego

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Estymacja punktowa i przedziałowa

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Sygnały stochastyczne

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wnioskowanie statystyczne. Statystyka w 5

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Estymacja parametrów w modelu normalnym

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Rozkłady statystyk z próby

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna

Hipotezy statystyczne

Hipotezy statystyczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Testowanie hipotez statystycznych.

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Transkrypt:

4. Weryfiacja modelu Wyznaczenie wetora parametrów struturalnych uładu ończy etap estymacji. Kolejnym etapem jest etap weryfiacji modelu. Przeprowadza się ją w dwóch ujęciach: merytorycznym i statystycznym. 4.. Weryfiacja merytoryczna modelu 4... Współczynni oincydencji Jeśli modelowane jest zjawiso, o tórym teoria eonomii nie stanowi, wówczas analizę merytoryczną można oprzeć na obliczeniu i interpretacji współczynniów orelacji między zmiennymi występującymi w modelu. Zestawia się macierze R r r M r K oraz R r M r K r r M K L L O L r r K K M (por. część ). Żądamy, aby szacowany przez nas model był oincydentny. Mówimy, że model jest oincydentny, jeśli dla ażdej zmiennej objaśniającej modelu spełniony jest warune sgn r sgn,,,...,k Jeśli model nie jest oincydentny, wtedy należy powrócić do wcześniejszych etapów modelowania eonometrycznego i zmienić zestaw zmiennych objaśniających albo analityczną postać zależności. la przyładu rozważanego w części 3 (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) współczynni orelacji pomiędzy zmienną objaśnianą i zmienną objaśniającą r, 97935. Ponieważ,9558863 więc widoczne jest, że. Model jest więc oincydentny. sgn r sgn 4.

la przyładu (model eonometryczny opisujący producję firmy) mamy dwie zmienne objaśniające. Współczynnii orelacji pomiędzy zmienną objaśnianą i zmiennymi objaśniającymi oraz parametry struturalne uładu dane są macierzami R, 9566,, 9574, 46464, 567376, 488897 Widoczne jest, że r sgn w pełni oincydentny. sgn, sgn sgn Model jest więc r 4... Współczynni determinacji W sensie algebraicznym wyznaczenie wetora parametrów struturalnych uładu w przypadu regresji liniowej, czyli wyznaczenie równania y... + + x + x + K xk jest tożsame z wyznaczeniem pewnej hiperpłaszczyzny w przestrzeni R K+. Jaość dopasowania tej hiperpłaszczyzny do danych empirycznych można zmierzyć przy pomocy współczynnia determinacji R : R ε ε ( Y Y ) ( Y Y ) Występujący w ostatnim wzorze ułame nosi nazwę współczynnia zbieżności φ : ε ε φ ( Y Y ) ( Y Y ) czyli R φ la jednorównaniowego modelu eonometrycznego z wyrazem wolnym wartość współczynnia R jest liczbą z przedziału [; ]. R oznacza, że wszystie punty empiryczne leżą na wyznaczonej hiperpłaszczyźnie. R 4.

oznacza, że niezerowy jest tylo wyraz wolny. W pratyce przyjmuje się, że model jest dobrze dopasowany, gdy R >,6. prawdzimy, ja wygląda współczynni determinacji dla przyładu (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach). Obliczymy najpierw współczynni zbieżności φ : ε ε φ czyli φ,4866 Y Y Y Y ( ) ( ) tąd współczynni determinacji R : R φ czyli R,95934 a więc model jest bardzo dobrze dopasowany. la przyładu (model eonometryczny opisujący producję firmy) współczynni zbieżności φ : φ,43899 tąd współczynni determinacji R : R,956 a więc i tutaj wg R model jest bardzo dobrze dopasowany. Gdy liczba K+ szacowanych parametrów struturalnych modelu jest niewiele mniejsza od liczby obserwacji N, do oceny dopasowania modelu można stosować tzw. sorygowany współczynni determinacji: R R K ( R N K przy czym R R. Uzasadnieniem dla wprowadzenia orety jest to, że może się w tej sytuacji zdarzyć, iż średnia wadratów reszt ε ε/n jest mała i wywołuje zbyt optymistyczny obraz dopasowania. orygowany współ- R nie jest unormowany (może przyjmować wartości czynni determinacji ujemne). 4.3 )

4..3. Efet atalizy Współczynni determinacji R jest miarą dopasowania modelu eonometrycznego do danych empirycznych, lecz informacja, jaą niesie o modelu, może być fałszywa jeśli w modelu występują zmienne, tóre nazywamy atalizatorami. W taim przypadu istnieje możliwość uzysania wysoiej wartości współczynnia determinacji, mimo że charater i siła powiązań zmiennych objaśniających i zmiennej objaśnianej nie uzasadniają taiego wyniu. Zjawiso to nazywamy efetem atalizy w modelu eonometrycznym. Występuje ono, gdy zmienne objaśniające są wzajemnie silnie sorelowane. Badanie występowania efetu atalizy prowadzi się przy pomocy badania miary, nazywanej natężeniem efetu atalizy η : η R H gdzie H jest integralną pojemnością informacyjną zestawu zmiennych objaśniających modelu. Ze względu na interpretację i możliwość porównywania różnych modeli oreśla się względne natężenie efetu atalizy W η : W η η % R la przyładu (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) obie macierze orelacji, R oraz R są jednoelementowe: R [r ] [,97935]; R [r ] [ ] Indywidualna pojemność informacyjna zmiennej objaśniającej X jest równa r, 97935 K {X} Z {} h, 959 H h,9596 r Współczynni determinacji R,95934. Oznacza to, że w ooło 96 procentach liczba uczniów szół podstawowych może być wyjaśniona przez liczbę ludności w powiatach. 4.4

Natężeniem efetu atalizy: η R H,95934 -,9596,7974 a względne natężenie efetu atalizy W η,834 %. Istnieją zatem niłe podstawy do przypuszczenia, że ocena jaości modelu na podstawie współczynnia determinacji może być obarczona poważniejszym błędem. la przyładu (model eonometryczny opisujący producję firmy) macierze orelacji, R oraz R mają postać:, 9566 R,, 9574 R, 959, 959 Liczba zmiennych L. tąd liczba ombinacji L 3. Wypiszemy poszczególne ombinacje, policzymy indywidualną pojemność informacyjną elementów ażdej ombinacji, a następnie integralną pojemność informacyjną ażdej ombinacji. r, 9566 K {X I } Z {} h, 95 H h,95 r, 9574, r K {X II } Z {} h 966 H h,966 r r, 9566 K 3 {X I, X II } Z 4 {; } h 3, 4776 r + r, 959 r, 9574 h 3, 4784 r + r, 959 a względne natężenie efetu atalizy W η, %. Istnieją zatem niłe podstawy do przypuszczenia, że ocena jaości modelu na podstawie współczynnia determinacji może być obarczona poważniejszym błędem. 4.5 H 3 h 3 +h 3,4776+,4784,956 Współczynni determinacji R,956. Oznacza to, że w bliso 96 procentach producja firmy w mld zł (y) może być opisana wartością środów trwałych (mld zł) i czasem przestoju maszyn (dni). Natężenie efetu atalizy: η R H,,956 -, 956,

4.. Weryfiacja statystyczna modelu Podczas weryfiacji statystycznej głównym przedmiotem zainteresowania obl jest wetor reszt modelu ε Y X Y Y. Uważa się go za empiryczną realizację sładnia losowego modelu. Przy pomocy odpowiednich testów przeprowadza się, m.in., nastepujace badania: badanie losowości sładnia losowego, badanie symetrii rozładu sładnia losowego, badanie stacjonarności sładnia losowego, badanie wartości oczeiwanej sładnia losowego, badanie autoorelacji sładnia losowego, badanie homosedastyczności sładnia losowego, badanie normalności sładnia losowego. Ostatnie badanie wynia z przyjęcia założenia 7 (część 3). Weryfiacja własności sładnia losowego modelu eonometrycznego słada się ja widać z wielu roów. Niepowodzenie w badaniu jaiejolwie pożądanej cechy sładnia losowego powinno spowodować powrót do wcześniejszych etapów modelowania (zmiana postaci analitycznej modelu, zmiana zestawu zmiennych objaśniających, zmiana metody szacunu parametrów) i rozpoczęcie procedury weryfiacyjnej od początu. W pratyce stosuje się nieiedy ompromisy, godząc się na model gorzej oszacowany, ale mający inne orzystne z puntu widzenia badacza cechy. 4.6

4... Błędy szacunu parametrów Estymatorem wariancji sładnia losowego (resztowego) w metodzie najmniejszych wadratów jest N ε ε K ( Y X ) ( Y X ) N K Y Y Y X N K N Y ε K N K to liczba nazywana ilością stopni swobody. Odchylenie standardowe sładnia resztowego: Macierz wariancji i owariancji estymatorów parametrów: ( ) ( X X ) Jest to macierz wadratowa stopnia K +. zczególne znaczenie mają elementy lezące na jej głównej przeątnej są to wariancje estymatorów parametrów struturalnych. Średnie błędy szacunu parametru n - są to pierwiasti z wariancji estymatorów parametrów struturalnych. Błędy te tworzą macierz oznaczaną M KK ( ) ( ) M ( ) K Poszczególne elementy tej macierzy informują, ile średnio wynoszą błędy oszacowania odpowiednich parametrów struturalnych modelu. Średni względny błąd szacunu n-tego parametru n wyznacza się jao liczbę ( ) n n %. 4.7

Oszacujemy błędy szacunu parametrów dla przyładu (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach). Estymator wariancji sładnia losowego: 6536,555 Odchylenie standardowe sładnia losowego: 88,84 354 483 343,,, 343, 4 Macierz wariancji i owariancji: ( ) Średnie błędy szacunu parametru n : 8, 877,, 7559,9558863 Ponieważ ( ) X X więc średni względny błąd szacunu będzie 8, 877 dla %, 7%, 75, dla %, %, 9558863 X Y W eonometrii przyjęta jest onwencja podawania średnich błędów szacunu parametrów struturalnych łącznie z oszacowaniem modelu. la liniowej postaci modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach zapiszemy więc y, 75 +, 9558863 ( 8, 877 ) (, ) x 4.8

la przyładu (model eonometryczny opisujący producję firmy): Estymator wariancji sładnia losowego: ε ε, 3748 N K Odchylenie standardowe sładnia losowego: Macierz wariancji i owariancji: ( ) ( X X ), 5594, 99775, 77, 476 Średnie błędy szacunu parametru n : Ponieważ, 46464, 567376, 488897, 77, 536, 388 33, 476, 388, 3567, 734, 44, 8887 więc średni względny błąd szacunu będzie dla, 734 % 4, 63%, 46464 dla, 55 % 3, 97%, 567376 dla, 8887 % 39, %, 488897 W eonometrii przyjęta jest onwencja podawania średnich błędów szacunu parametrów struturalnych łącznie z oszacowaniem modelu. la liniowej postaci modelu eonometrycznego zapiszemy więc y, 46464+, 567376 X I +, 488897 X II (, 734) (, 44) (, 889) 4.9

4... alsze onsewencje przyjęcia założeń Gaussa-Marowa Wróćmy jeszcze raz do estymacji parametrów,,,,... K. W liniowym jednorównaniowym modelu z K zmiennymi objaśniającymi X, X,..., X K obserwacje x n, xn,..., xnk, n,,... N są ustalonymi liczbami, zaś ε n zmienną losową o rozładzie normalnym z wartością oczeiwaną i estymatorem wariancji σ oreślonym poprzez wariancję reszt ε ε N K. Estymator macierzy wariancji i owariancji szacowania parametrów strutu- ralnych ma postać ( ) ) X X ( zaś średnie błędy szacunu parametru n (pierwiasti z wariancji estymatorów parametrów struturalnych czyli z wyrazów na głównej przeątnej macierzy ( )) tworzą macierz oznaczaną M KK ( ) ( ) M ( ) K M K tandardowy błąd szacunu parametru struturalnego jest oceną odchylenia standardowego wartości estymatora parametru struturalne- go, jaie przyjmuje on w próbach, sładających się z N obserwacji. tandardowy błąd szacunu powinien być ja najmniejszy w stosunu do oceny parametru struturalnego. W pratyce przyjmuje się, że jeśli liczba stopni swobody jest więsza niż to nie powinien on przeraczać 5% jej wartości bezwzględnej. W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) warune ten jest spełniony; w przyładzie (model eonometryczny opisujący producję firmy) nie. 4.

4..3. Przedziały ufności dla parametrów struturalnych Chcąc zbudować przedział ufności dla parametru,,,,... K przy współczynniu ufności (- ) (tzn. przy poziomie istotności ) należy t, N K t. wyznaczyć z tablic rozładu statystyi t tudenta wartość * Wówczas przedział ufności dla parametru jest postaci ( t*, + t* ) t* ( ), + t* ( ) ( ), t UWAGA: Wartość t N K * można obliczyć za pomocą funcji statystycznej ROZKŁA..OW(, N K ) w aruszu alulacyjnym Excel. W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach), gdzie mamy, 7559,9558863 oraz 8, 877, przy poziomie istotności,, oraz N3, K znajdujemy t* 3, 585 t,,. Znajdujemy tu następujące przedziały ufności dla parametrów struturalnych: dla ( 59, 3; 4, 8) dla (, 95;, 96) Można zatem sądzić na 99%, że przedstawione dla przyładu przedziały ufności obejmują nieznane, a szacowane metodą najmniejszych wadratów parametry struturalne. 4.

W przyładzie (model eonometryczny opisujący producję firmy) mamy dla, oraz N, K t * 3, 49948, a stąd dla, 46464, 567376, 488897 oraz, 734, 44, 8887 przedziały ( 6, 47; 5, 648) (, 3;, 348) (, 78;, 44) Można sądzić na 99%, że przedstawione dla przyładu przedziały ufności obejmują nieznane, a szacowane metodą najmniejszych wadratów parametry struturalne. la poziomu istotności,5 przedziały ufności przyjmują postać ( 4, 55; 3, 683) (, 3;, 93) (, 36 ;, 99) czyli to, że przedstawione dla przyładu przedziały ufności obejmują nieznane, a szacowane metodą najmniejszych wadratów parametry struturalne, jest wtedy pewne na 95%. Widoczne jest, że parametry struturalne w przyładzie są znacznie lepiej oszacowane niż w przyładzie. 4.

4.3. estowanie hipotez dotyczących wartości parametrów struturalnych 4.3. Istotność ocen parametrów struturalnych na podstawie rozładu statystyi t tudenta Przypuszcza się, że parametr struturalny,,,,... K, przyjmuje pewną ustaloną wartość. W sposób formalny przypuszczenie to może być zapisane jao hipoteza zerowa: H : wobec hipotezy alternatywnej H : Jeśli hipoteza zerowa jest prawdziwa, to statystya t N K stopniami swobody. Zatem bezwzględna ma rozład t tudenta z wartość tej statystyi nie powinna przeraczać wartości rytycznej, co oznacza, że obszar rytyczny testu oreślony jest przez t N, K t* relację a więc wartość statystyi gdzie jest poziomem istotności. Z ( t t ) P, N K t nie powinna należeć do zbioru Z: ( t ) ( t ) ;, N K, N K ; 4.3

W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach), gdzie mamy, 7559,9558863 ( 59, 3; 4, 8 ) oraz przedziały ufności (, 95;, 96) spróbujemy zweryfiować na poziomie istotności,5 hipotezę ( ) H : tatystya t 5, 35. la N3, K znajdujemy wartość rytyczną statystyi t tudenta t, ; t*,. Oznacza to, że 8, 877 zbiór Z ma tutaj postać: Z ( ;, ) (, ) ; t Z, więc można odrzucić hipotezę zerową. Oznacza to, że Ja widać, parametr struturalny różni się istotnie od wartości -. Zwróćmy uwagę na to, że przy poziomie istotności, nie ma podstaw do odrzucenia hipotezy H, gdyż wówczas t* 3 6, co oznacza, że zbiór Z ma tutaj postać: Z ( ; 3, 6) ( 3, 6 ) ; t, ;, i wówczas t Z (bo t,4546 < 3, 6 ). 4.4

prawdźmy jeszcze hipotezę H : tatystya 477, 9. Przy poziomie istotności, mamy, t, t ; t, ; 3 6, tzn. Z ( ; 3, 6) ( 3, 6; ), zaś dla,5, Z ;,, ;. mamy,, tzn ( ) ( ) t t ; ) czyli odrzucamy hipotezę ze- W obu przypadach rową na rzecz hipotezy >, (tzn. t Z H : zczególnym przypadiem rozważanych hipotez są taie, ja ta ostatnia, tzn. H :,,,,... K H : Zwłaszcza bowiem w sytuacji, gdy oceny parametrów niewiele różnią się od zera może powstać wątpliwość, czy parametry struturalne fatycznie nie są równe zeru. Jeśli hipoteza zerowa jest prawdziwa, to statystya t,,,,... K, ma rozład t tudenta z N K stop- niami swobody. W przypadu odrzucenia hipotezy zerowej mówi się wówczas o statystycznej istotności parametru,,,,... K 4.5

W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) parametry i są statystycznie istotne. Mamy bowiem, 755 dla t 58, 464 8, 877, 9558863 dla t 477, 9, a dla poziomu istotności, mamy ( ; 3, 6) ( 3, 6; ) Z, co oznacza, że dla obu parametrów należy odrzucić hipotezę zerową. W przyładzie (model eonometryczny opisujący producję firmy) test statystycznej istotności dla poszczególnych estymat parametrów struturalnych wygląda następująco: dla, 46464 t -, 378, 734 dla, 567376 t, 5763, 44 dla, 488897 t, 55673, 8887 Ponieważ dla poziomu istotności, mamy t * 3, 49948, zaś dla,5 t *, 36463, więc widać, że na poziomie istotności, nie ma podstaw do odrzucenia hipotezy zerowej, zaś na poziomie,5 statystycznie istotne są parametry i. 4.6

4.3. Wartość p Na folii 4. podano, że jeśli liczba stopni swobody jest więsza niż to standardowy błąd szacunu parametru nie powinien on przeraczać 5% wartości bezwzględnej estymaty parametru struturalnego. Jest ta dlatego, że przy poziomie istotności,5 wartość rytyczną statystyi t tudenta t * jest w przybliżeniu równa. Jeśli zatem Mamy wówczas * < 5%, to t / > dla,,,... K. t > t, to zaś oznacza statystyczną istotność parametru. Więszość programów analizy regresji liniowej w tabeli wyniów, obo informacji o standardowych błędach szacunu i wartościach empirycznych statystyi t tudenta, podaje wartość p. Jest to rytyczny poziom istotności dla testu t tudenta, tzn. p P(t N-K- t ) (wartość prawdopodobieństwa nazywana rytycznym poziomem istotności, dla tórego rytyczna wartość statystyi t tudenta jest niemniejsza niż wartość empiryczna statystyi t tudenta dla danego parametry struturalnego). Jest to zatem tai poziom prawdopodobieństwa, przy tórym nie ma podstaw do odrzucenia hipotezy zerowej przy obliczonej na podstawie próby wartości empirycznej statystyi. Wartość p ustala się, wyznaczając t /, a następnie olejno podstawiając różne wartości do funcji ROZKŁA..OW(, N K ) w aruszu alulacyjnym Excel obliczając wartość t, N K t* dopóty, dopói nie będzie ona nieznacznie więsza od t. Przyjmując, że poziom istotności ustala się zwyle w badaniach eonomicznych na jao,5, hipotezę zerową odrzuca się na rzecz hipotezy alternatywnej, gdy p,5. 4.7

W przyładzie (model eonometryczny opisujący producję firmy) dla poszczególnych parametrów struturalnych mamy następujące wartości p : dla p,89 dla p,45 dla p,378 Ja widać, dla i zachodzi nierówność p,5. W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) dla poszczególnych parametrów struturalnych mamy: dla p <, dla p <, 4.3.3. Istotność ocen zestawu parametrów struturalnych na podstawie rozładu statystyi F nedecora Hipotezy statystyczne mogą dotyczyć nie tylo pojedynczych parametrów struturalnych, ale taże całego ich zestawu. Rozważmy hipotezę zerową: H wobec hipotezy alternatywnej :... K H : co najmniej jeden z parametrów,,,,...k, jest różny od zera. 4.8

Można wyazać, że przy prawdziwości hipotezy H statystya F ( N K ) K R R ma rozład F nedecora z parametrami m K oraz m N K Parametr m nazywamy liczbą stopni swobody. utaj R to znany współczynni determinacji, oreślany ze wzoru R Y ε ε Y NY sąd R ϕ Y ε ε Y NY zaś R czyli pierwiaste ze współczynnia determinacji to współczynni orelacji wieloraiej. Procedura testowania jest następująca:. Na podstawie próby obliczamy wartość empiryczną statystyi F.. la zadanego poziomu istotności oraz parametrów m i m odczytujemy z tablic lub obliczamy w aruszu alulacyjnym Excel (stosując ), to hipotezę H odrzucamy. Nato- funcję ROZKŁA.F.OW(; m ; m )) wartość rytyczną F*. Z F*; F (czyli jeżeli F > F * miast jeśli F Z (gdy F F * ), to nie ma podstaw do odrzucenia H. 3. Wyznaczamy zbiór Z: ( ) 4. Jeżeli Z W przyładzie (model eonometryczny opisujący producję firmy) mamy: H : oraz m K ; m N K 7;, 5; R, 956 tąd 7, 956 F 76,3, 43899 oraz F 4, 7374 * czyli Z ( 4,7374; ) F Z Ponieważ, więc hipotezę H odrzucamy, co oznacza, że co najmniej jeden z parametrów struturalnych jest różny od zera. 4.9

W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) mamy: H : oraz m K ; m N K 3 ;, 5; R, 959. tąd, 959 F 57, 95 oraz F 4, 8443, 49 F Z * czyli Z ( 4,8443; ) Ponieważ, więc hipotezę H odrzucamy, co oznacza, że co najmniej jeden z parametrów struturalnych jest różny od zera. 4.3.4. Badanie efetu wprowadzania nowych zmiennych na podstawie rozładu statystyi F nedecora Rozważmy model podstawowy, w tórym mamy K zmiennych objaśniajacych i K + parametrów struturalnych,,,,...k. Postać modelu: y + x + x +... + + ε K xk o tych K zmiennych objaśniających dodajemy jeszcze L zmiennych. Postać modelu będzie tu następująca: y K K K + K + K + LxK + L + x + x +... + x + x +... + + µ gdzie µ to sładni losowy w modelu rozszerzonym. 4.

o zbadania łącznego efetu wprowadzonych zmiennych służy hipoteza: H : K + K +... K + L H : co najmniej jeden z parametrów, K+,K+,...K+L, jest różny od zera Procedura testowania jest następująca:. zacujemy za pomocą metody najmniejszych wadratów parametry modelu podstawowego oraz parametry modelu rozszerzonego. Reszty w modelu podstawowym oznaczamy ε n zas w modelu rozszerzonym µ n, n,,..., N.. Obliczamy wartość empiryczna statystyi F oreśloną w sposób następujący: N N εn µ n L n n F N µ n N K L n Przy prawdziwości hipotezy zerowej statystya F ma rozład F nedecora z m L oraz m N K L stopniami swobody. 3. la zadanego poziomu istotności oraz dla liczby stopni swobody m L oraz m N K L odczytujemy z tablic lub obliczamy w Excelu (funcja ROZKŁA.F.OW(; m ; m )) wartość rytyczną Z F*;. F*. Wyznaczamy zbiór Z: ( ) F (czyli jeżeli F > F * ), to hipotezę H odrzucamy. Nato- F Z (gdy F F * ), to nie ma podstaw do odrzucenia H. 4. Jeżeli Z miast jeśli 4.

4.4. Przyczyny brau statystycznej istotności parametrów Bra statystycznej istotności parametru struturalnego może wyniać z fatycznego brau związu pomiędzy zmienną objaśniającą a zmienną objaśnianą, ale może też być spowodowany innymi przyczynami: nisą jaością danych statystycznych małą liczebnością próby niewłaściwie dobranym zespołem zmiennych objaśniających niewłaściwą postacią analityczną modelu Bada się to następującymi sposobami: 4.4.. Badanie normalności reszt metodą JB W tym celu obliczamy współczynni asymetrii M 3 A, gdzie ε N 3 ε, M 3 3 ε n N N n oraz współczynni supienia M 4 N 4 K, M 4 4 ε n. N n Następnie oblicza się statystyę JB N A + ( K 3 ) 6 4 Ma ona rozład χ. W następnym rou wyznaczamy wartość rytyczną statystyi χ * (funcja ROZKŁA.CHI.OW(, N -K - )). Badana hipoteza: H : sładni losowy ma rozład normalny ; hipoteza H jest jej zaprzeczeniem. to nie ma podstaw do odrzucenia H, czyli reszty mają roz- Jeśli JB χ * ład normalny. 4.

W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) mamy: 3 N3, ε ε 776, 478, M 3 ε n 66554, 95 N N M N 4 4 ε n N n 3779349565 M 3 Współczynni asymetrii A, 4 3 M 4 Współczynni supienia K, 43 4 Następnie oblicza się statystyę N n JB N 6 A + 4 ( K 3 ) 4, 547 Wartość rytyczna statystyi dla,5 χ * 9,67 JB < χ * normalny. - nie ma podstaw do odrzucenia H, czyli reszty mają rozład 4.4.. Badanie symetrii sładnia losowego Niech m oznacza liczbę odchyleń in plus (lub zamiennie in minus) pomiędzy wartościami obserwowanymi Y a wyliczonymi w modelu (teoretycznymi) Ŷ. Hipoteza dotycząca symetrii sładnia losowego przedstawia się następująco: H : (fracja reszt dodatnich ½); hipoteza alternatywna: H : (fracja reszt dodatnich <> ½). 4.3

Weryfiujemy ją testem istotności: m N t, m m N N N tóry dla N 3 ma rozład tudenta o N- stopniach swobody, natomiast dla N > 3 ma rozład normalny. N liczba obserwacji Jeżeli hipoteza zerowa jest odrzucana (t > t*) to należy zmodyfiować model (np. nowa postać analityczna). Jeżeli hipoteza zerowa nie jest odrzucana (t < t*) to przechodzimy do następnego etapu. W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) mamy: B J K W Kie Ko Op Ost P an -K tar tasz Wło X 76 55 9 35 37 67 96 58 87 747 59 38 75 43 69 85 858 83 97 98 59 78 9 48 3 Y dane 5 993 7 473 3 9 78 7 4 934 8 89 3 57 7 7 5 887 7 839 6 83 4 338 Yo X 6 88 7 76 495 7 685 7 87 4 55 534 3 76 7 6 6 9 8 38 6 364 3 499 Y-Yoε -95-33 56 393-85 38-75 44-89 -34-479 449 839 Wtedy mamy m 6 (cztery odchyłi >) wśród N obserwacji. N 3 m N est istotności: t, 67 ; t*, dla,5. m m N N N Ponieważ t < t*, więc spośród hipotez H : (fracja reszt dodatnich ½); H : (fracja reszt dodatnich <> ½) przyjmuje się H, co oznacza, że sładni losowy jest symetryczny. Wniose: nie jest potrzebna nowa postać analityczna modelu, np. jaaś dodatowa zmienna. 4.4

4.4.3. Badanie losowości reszt modelu O losowości sładnia losowego ε sądzimy stawiając hipotezę zerową H : ε jest czysto losowy, wobec hipotezy alternatywnej H : ε nie jest czysto losowy. Badanie losowości ma na celu zweryfiowanie hipotezy o trafności doboru postaci analitycznej modelu. Procedura: a) Porządujemy niemalejąco jedną ze zmiennych objaśniających wraz z wetorem reszt ε ; b) Obliczamy liczbę serii reszt o taich samych znaach (olejnych sewencji o taich samych znaach); c) Z tablic testu liczby serii (są na ońcu) dla liczby reszt dodatnich n, liczby reszt ujemnych n oraz przyjętego poziomu istotności, odczytujemy rytyczną liczbę serii * (tablica dla ) i * (tablica dla -). Jeśli * < < * to nie ma podstaw do odrzucenia hipotezy zerowej, zatem reszty mają charater losowy. W przyładzie (liniowa postać modelu eonometrycznego opisującego liczbę uczniów w zależności od liczby ludności w powiatach) po uporządowaniu względem zmiennej X mamy: X 3767 4369 483 5938 7655 789 8397 85858 87747 935 9859 75 9658 Y 3 357 4338 4934 5993 683 5887 77 7 7473 7839 889 978 Y-Xalfa 56, 44,3 838,7 38,8-95,4 449, -33,8-89,3-84,9-33,3-478,5-74,8 39,9 Mamy 5 serii reszt o taich samych znaach, przy czym n 6, n 7. W tablicach dla,5 nie ma podanej wartości rytycznej dla taich danych, co oznacza, że * 3; dla *. Mamy więc * < < *, co oznacza, że hipoteza H jest prawdziwa. 4.5

4.4.4. Badanie homosedastyczności W lasycznej metodzie najmniejszych wadratów załada się, że wariancja sładnia losowego ε n jest stała niezależnie od liczby obserwacji dla zmiennych (tzn. dla n,...,n) Własność ta nosi nazwę homosedatyczności. Równość wariancji w podpróbach homogenicznych ze względu na wariancję sładnia losowego można przeprowadzić w oparciu o test Goldfelda- Quandta. tałość wariancji sładnia losowego jest weryfiowana przez hipotezę o równości wariancji dwóch srajnych podprób obserwacji. la podprób o najmniejszej i najwięszej wariancji (o liczebnościach odpowiednio n, n ) budujemy równania regresji, a następnie stawiamy hipotezę zerową: H : przy ontrhipotezie: H : Procedura: a) Porządujemy niemalejąco jedną ze zmiennych objaśniających (podejrzana o zachowanie psujące homosedatyczność), a wraz z nią pozostałe zmienne; b) Wybieramy dwie srajne próby, jedna o liczbie obserwacji o. N/3 (nie więcej niż pierwsze N/3 danych), drugą o liczbie obserwacji taże o. N/3 (nie więcej niż ostatnie N/3 danych) c) la obu prób budujemy model regresji liniowej, a następnie dla obu ε ε prób obliczamy estymatory wariancji ze wzoru (ja w N K p. 9) schematu obliczeń), i. d) Obliczamy (w liczniu musi być więsza z wariancji, czyli to więsza z tych dwóch wariancji). Jeśli hipoteza H jest prawdziwa, to ma rozład F Fishera-nedecorna; Obliczamy F* dla zadanego poziomu istotności oraz parametrów m n - K- i m n -K- odczytujemy z tablic lub obliczamy w aruszu alulacyjnym Excel (stosując funcję ROZKŁA.F.OW(; m ; m )). Jeśli F F* to nie ma podstaw do odrzucenia hipotezy H. 4.6