Wykłady z Ekonometrii



Podobne dokumenty
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Etapy modelowania ekonometrycznego

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Wprowadzenie do analizy korelacji i regresji

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

3. Modele tendencji czasowej w prognozowaniu

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Stanisław Cihcocki. Natalia Nehrebecka

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Ekonometria. Zajęcia

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

166 Wstęp do statystyki matematycznej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

PDF created with FinePrint pdffactory Pro trial version

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Przykład 1 ceny mieszkań

MODELE LINIOWE. Dr Wioleta Drobik

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Przykład 2. Stopa bezrobocia

Niestacjonarne zmienne czasowe własności i testowanie

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Analiza regresji - weryfikacja założeń

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Weryfikacja modelu. Paweł Cibis 6 kwietnia 2006

Statystyka matematyczna dla leśników

Ćwiczenia IV

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Proces modelowania zjawiska handlu zagranicznego towarami

KORELACJE I REGRESJA LINIOWA

Metody Ilościowe w Socjologii

Prognozowanie na podstawie modelu ekonometrycznego

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Weryfikacja hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Zmienne zależne i niezależne

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Analiza autokorelacji

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Analiza współzależności zjawisk

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Metody numeryczne Wykład 4

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Stanisław Cichocki Natalia Neherbecka

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

5. Model sezonowości i autoregresji zmiennej prognozowanej

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

4. Średnia i autoregresja zmiennej prognozowanej

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Analiza zależności liniowych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

3. Analiza własności szeregu czasowego i wybór typu modelu

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Ekonometria Ćwiczenia 19/01/05

Następnie przypominamy (dla części studentów wprowadzamy) podstawowe pojęcia opisujące funkcje na poziomie rysunków i objaśnień.

Stanisław Cichocki. Natalia Nehrebecka

Własności statystyczne regresji liniowej. Wykład 4

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Rozkład Gaussa i test χ2

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Testy nieparametryczne

Pochodna i różniczka funkcji oraz jej zastosowanie do rachunku błędów pomiarowych

Zastosowanie Excela w matematyce

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Transkrypt:

Dr Adam Kucharski Spis treści 1 Ekonometria pojęcia podstawowe 2 1.1 Idea modelu ekonometrycznego............................ 2 1.2 Równanie stochastyczne a deterministyczne..................... 2 1.3 Metoda Najmniejszych Kwadratów.......................... 3 2 Model regresji liniowej 5 2.1 Schemat Gaussa-Markowa............................... 5 2.2 Klasyfikacja modeli ekonometrycznych........................ 6 3 Statystyczna weryfikacja jakości modelu 6 3.1 Współczynnik determinacji.............................. 7 3.2 Istotność oszacowań parametrów........................... 8 3.3 Autokorelacja składnika losowego........................... 9 4 Weryfikacja merytoryczna 11 4.1 Interpretacja parametrów modelu........................... 11 4.2 Zmienne zero-jedynkowe................................ 11 5 Modele ekonometryczne a prognozowanie 13 5.1 Prognozowanie na podstawie modelu jednorównaniowego.............. 13 5.2 Modele trendu..................................... 14 6 Przykład estymacji modelu jednorównaniowego 15 6.1 Sformułowanie problemu................................ 15 6.2 Szacowanie parametrów modelu............................ 15 6.3 Interpretacja otrzymanych wyników......................... 16 6.4 Ocena jakości otrzymanego modelu.......................... 17 6.5 Prognoza........................................ 20 7 Modele wielorównaniowe 20 7.1 Rodzaje modeli wielorównaniowych.......................... 20 7.2 Identyfikacja...................................... 21 7.3 Estymacja parametrów modeli wielorównaniowych................. 22 7.4 Przykład zastosowania Pośredniej MNK....................... 23 7.5 Przykład zastosowania Podwójnej MNK....................... 24 7.6 Analiza mnożnikowa.................................. 25

1 Ekonometria pojęcia podstawowe 1.1 Idea modelu ekonometrycznego Model stanowi uproszczony sposób opisywania skomplikowanych zjawisk. Odwzorowuje te elementy, które są ważne z punktu widzenia prowadzonej analizy. Pomija się te, które wydają się nieistotne. Ma to swoje zalety, ale również wady. Oznacza bowiem konieczność przyjmowania odnośnie badanych zjawisk silnych założeń, których spełnienie bywa utrudnione. Punktem wyjścia modeli ekonomicznych są istniejące teorie ekonomiczne, często skomplikowane lub wręcz abstrakcyjne. Należy pamiętać, że same teorie podlegają zmianom w czasie (np z powodu politycznego i społecznego zaangażowania samych ekonomistów) co rzutuje na samą budowę modeli. Techniczną stroną tego procesu zajmuje się zaś ekonometria. Ekonometria jako nauka wywodzi swoje korzenie z ekonomii matematycznej oraz statystyki matematycznej przede wszystkim ze zjawiska korelacji zmiennych. Model ekonometryczny to równanie lub układ równań (wraz z towarzyszącymi założeniami) opisujące związki między wybranymi zmiennymi. Cele, dla których sięga się po modele ekonometryczne dadzą się streścić następująco: 1. poznanie zachowań i zależności łączących podmioty ekonomiczne oraz poznanie funkcjonowania układów gospodarczych; 2. porządkowanie informacji statystycznych pozwalające wyodrębnić trendy, wahania sezonowe i losowe; 3. testowanie hipotez ekonomicznych; 4. prognozowanie zjawisk ekonomicznych i przeprowadzanie analiz polityk gospodarczych; Modele ekonometryczne zazwyczaj bazują na danych statystycznych, często zagregowanych, zniekształconych przez błędy obserwacji. Dane te nie pochodzą z kontrolowanych eksperymentów. 1 Ewentualne ich poprawienie nie jest możliwe, a stanowią jedyną dostępną rejestrację statystyczną zachowania się zjawisk lub podmiotów ekonomicznych. Dlatego musimy przyjmować założenia, z których części nie da się nawet zweryfikować. Dane statystyczne mają zazwyczaj postać szeregów należących do jednej z poniższych kategorii (najczęściej spotyka się pierwsze z nich): 1. szeregi czasowe; 2. szeregi przekrojowe; 3. szeregi przekrojowo-czasowe; 1.2 Równanie stochastyczne a deterministyczne Wykorzystanie danych statystycznych, zebranych jako obserwacje dokonane na konkretnych obiektach powoduje, że przykładowa zależność między dochodem (Y) a konsumpcją (C) dla kolejnych obserwacji może wyglądać jak na rysunku 1. Na podstawie wykresu widać, że do jego opisu nie da się użyć żadnej elementarnej i deterministycznej funkcji matematycznej, choć chmura punktów wskazuje na istnienie zależności o charakterze liniowym. Zachowanie się obu przedstawionych wielkości ekonomicznych względem siebie wymaga wprowadzenia pewnej dodatkowej zmiennej, wyjaśniającej odchylenia punktów 1 Jak to jest możliwe w naukach eksperymentalnych takich jak fizyka czy chemia. 2 z 26

C Y Rysunek 1: Przykładowa zależność między konsumpcją a dochodem odpowiadających obserwacjom od funkcji liniowej. Dlatego równanie opisujące zależność między konsumpcją a dochodem zapiszemy następująco: C i = α 0 + α 1 Y i + ε i (1) Indeks i oznacza, że konsumpcja i dochód mają postać szeregów statystycznych. Symbol ε i nazywamy składnikiem losowym równania. Wprowadzenie go dało możliwość sięgnięcia po prostą funkcję liniową, jako sposób opisania zależności między badanymi zmiennymi. Równanie, w którym wprowadzono składnik losowy nazywamy stochastycznym. Przyczyny uwzględniania składnika losowego w modelach ekonometrycznych są następujące: 1. indeterminizm zachowania się zjawisk (lub podmiotów) ekonomicznych; 2. niedoskonałości pomiaru, które zawierają się w ε i ; 3. wady w konstrukcji modelu np błędy w specyfikacji czy niepoprawna postać funkcyjna; 1.3 Metoda Najmniejszych Kwadratów Choć postać równania (1) jest poprawna, nie znamy jego parametrów. Każda z trzech zaprezentowanych na kolejnym wykresie funkcji jest liniowa i teoretycznie nadaje się do opisu zależności między konsumpcją a dochodem. Należy znaleźć te parametry, które dadzą najbardziej satysfakcjonującą postać funkcji z punktu widzenia pewnego przyjętego kryterium. Ekonometria zajmuje się głównie poszukiwaniem parametrów opisujących wpływ jednych zmiennych na inne. Analizując rysunek 2 nasuwa się stwierdzenie, że najlepszą będzie funkcja przebiegająca jednocześnie najbliżej wszystkich punktów. Wydaje się, że jest to funkcja numer 2, ale powstaje pytanie: jak zyskać pewność co do dokonanego wyboru? Należy zbadać odległości dzielące rzeczywiste punkty od naszej hipotetycznej prostej i wybrać wariant o najmniejszych zmierzonych w ten sposób błędach. Minimalizuje się więc pewną funkcję kary, która przyjmuje wartości tym większe im wspomniana odległość jest większa. Ponieważ jednak punkty leżą tak nad jak i pod prostą, więc nie można użyć prostej sumy popełnianych błędów gdyż wartości dodatnie będą znosić się z ujemnymi. Spośród różnych dostępnych wariantów, niewątpliwie najpopularniejszą jest minimalizacja sumy kwadratów odległości punktów od prostej. Stąd też wzięła się jej nazwa Metoda Najmniejszych Kwadratów (MNK). Używając tej metody możliwa jest estymacja parametrów modelu stochastycznego. Nie wchodząc w matematyczne szczegóły dotyczące wyprowadzenia, wzór 3 z 26

C (1) (2) (3) Y Rysunek 2: Możliwe funkcje liniowe dla analizowanego przypadku pozwalający otrzymać oszacowania parametrów równania przy pomocy MNK jest następujący: ˆα = (X T X) 1 X T y (2) gdzie: ˆα wektor oszacowań parametrów równania; X macierz obserwacji na zmiennych objaśniających; y wektor obserwacji na zmiennej objaśnianej; Wektor ˆα zawiera liczbowe wartości oszacowanych parametrów, które wskażą najkorzystniejszą dla danych obserwacji postać funkcji. Estymacja to jednak tylko jeden (i to wcale nie pierwszy) z etapów analizy ekonometrycznej. Badanie tego typu da się podzielić na następujące fazy: 1. Specyfikacja zmiennych i relacji modelu: określenie celu badania; wybór zmiennych wybór postaci analitycznej modelu na podstawie: teorii ekonomii; zebranych danych i posiadanego doświadczenia; związków korelacyjnych między zmiennymi; 2. Gromadzenie danych statystycznych; 3. Estymacja parametrów; 4. Weryfikacja modelu: statystyczna; merytoryczna; 5. Praktyczne wykorzystanie modelu: analiza zależności; wnioskowanie o przyszłości; 4 z 26

2 Model regresji liniowej 2.1 Schemat Gaussa-Markowa Naturalną tendencją podczas budowy modeli jest dążenie do możliwie najprostszego sposobu opisu zjawiska. Stąd wzięło się częste sięganie po liniową postać regresji jako najlepiej odpowiadającą temu założeniu. Okazuje się, że w sporej liczbie przypadków takie podejście zdaje egzamin. Aby jednak można było użyć MNK do estymacji parametrów modelu liniowego, konieczne jest spełnienie określonych założeń zwanych założeniami schematu Gaussa-Markowa: 1. model jest niezmienniczy ze względu na obserwacje (parametry i postać funkcji nie ulegają zmianie); 2. model jest liniowy względem parametrów 2 ; 3. zmienne objaśniające są nielosowe, a ich wartości są ustalonymi liczbami rzeczywistymi; 4. składnik losowy ma rozkład normalny; 5. wartość oczekiwana składnika losowego jest równa 0 (zakłócenia mają tendencję do wzajemnego znoszenia się); 6. składnik losowy jest sferyczny macierz wariancji-kowariancji D 2 (ε i ) jest diagonalna, o takich samych elementach na przekątnej głównej 3 ; 7. informacje zawarte w próbie są jedynymi, na podstawie których estymuje się parametry modelu; 8. liczba obserwacji powinna być wyższa niż liczba szacowanych parametrów. Część powyższych założeń dotyczy (wprowadzonego wcześniej) składnika losowego, który stanowi abstrakcyjny sposób wyjaśniania takiego a nie innego zachowania się obserwacji. W konsekwencji nie jesteśmy w stanie poznać składnika wprost, znamy za to jego przybliżenie resztę z modelu. Równanie po oszacowaniu (dla przypadku jednej zmiennej objaśniającej) ma postać: Ŷ i = ˆα 0 + ˆα 1 X i (3) Daszek nad parametrami oznacza, że są to już konkretne wartości, dlatego w równaniu (3) nie występuje składnik losowy. Podstawiając do równania obserwacje jakimi dysponujemy dla zmiennej X otrzymamy wartości Y wynikające z równania (czyli Ŷi) zwane wartościami teoretycznymi zmiennej objaśnianej. Oczywiście nie będą one dokładnie odpowiadać rzeczywistym realizacjom tej zmiennej, ponieważ większość punktów leży powyżej lub poniżej linii regresji. Występującą w tej sytuacji różnicę: e i = Y i Ŷi (4) nazywamy resztą z modelu. Można więc (choć praktykuje się to rzadko) zapisać równanie (3) jako: Ŷ i = ˆα 0 + ˆα 1 X i + e i (5) Zapis podany w (5) pokazuje, że reszty z modelu (a jest ich tyle ile obserwacji) mogą być traktowane jako przybliżona realizacja składnika losowego. Tak więc nie znamy składnika losowego jako takiego, znamy natomiast reszty, które mają podobne własności. 2 Należy zauważyć, że model musi być liniowy względem parametrów, ale nie względem zmiennych. Dzięki temu używa się modeli nieliniowych sprowadzanych przy pomocy stosownych przekształceń do postaci liniowej. 3 Mówimy, że składnik losowy jest homoskedastyczny i nieskorelowany 5 z 26

2.2 Klasyfikacja modeli ekonometrycznych Same modele mogą być klasyfikowane według różnych kryteriów. Wymieńmy te najpowszechniej spotykane: 1. Ze względu na formę związku między zmiennymi: (a) liniowe; (b) nieliniowe; 2. Ze względu na ilość zależności: (a) jednorównaniowe; (b) wielorównaniowe; 3. Ze względu na dynamikę: (a) statyczne; (b) dynamiczne (w tym autoregresyjne); 4. Ze względu na wartości poznawcze: (a) przyczynowo-skutkowe; (b) tendencji rozwojowej; 5. Ze względu na zakres badania: (a) mikroekonomiczne; (b) makroekonomiczne; Nas najbardziej interesować będzie pierwsze kryterium. Przypomnijmy, że jedno z założeń schematu Gaussa-Markowa wymaga, aby równanie było liniowe względem parametrów. Dlatego do poniższego modelu: Y i = e α 0 X α 1 i e ε i (6) nie można zastosować metody najmniejszych kwadratów. Zlogarytmujmy jednak (6) stronami: ln Y i = α 0 + α 1 ln X i + ε i (7) Otrzymaliśmy równanie nieliniowe nadal względem zmiennych, ale za to liniowe względem parametrów co było naszym celem. Sprowadzanie równań nieliniowych do postaci liniowej jest często spotykaną praktyką ponieważ pozwala skorzystać z dobrodziejstw MNK. Oczywiście sama sposób sprowadzania różni się w zależności od postaci funkcyjnej modelu. 3 Statystyczna weryfikacja jakości modelu Fakt, że po użyciu MNK otrzymaliśmy estymatory parametrów modelu nie oznacza jeszcze, że można spocząć na laurach. Otrzymane wyniki muszą zostać sprawdzone pod kątem jakości. Dokonuje się tego na dwóch poziomach: statystycznym i merytorycznym. Na początek zajmijmy się weryfikacją statystyczną. 6 z 26

3.1 Współczynnik determinacji Znając reszty z modelu można spróbować sobie odpowiedzieć czy zachowanie się zmiennych objaśniających dobrze odwzorowuje zachowanie zmiennej objaśnianej. Oczywiście można to zrobić, analizując każdą resztę z osobna 4. Jednak jakiekolwiek wnioski jesteśmy w stanie wyciągnąć tylko dla szeregów o niewielkiej liczbie obserwacji, kiedy nie przytłacza nas duża ilość danych. W pozostałych przypadkach konieczne staje się sięgnięcie po miary uśrednione. Da się wykazać, że między wartościami empirycznymi, teoretycznymi a resztami zachodzi związek: (Y i Ȳ )2 = (Ŷi Ȳ )2 + e 2 i (8) i i i co można zapisać: SST = SSR + SSE (9) gdzie: SST zmienność całkowita (suma kwadratów odchyleń wartości empirycznych od średniej arytmetycznej Y); SSR zmienność objaśniona (suma kwadratów odchyleń wartości teoretycznych od średniej arytmetycznej Y); SSE zmienność nieobjaśniona. Dzieląc (9) stronami przez SST otrzymamy: 1 = SSR SST + SSE SST Element SSR występujący w (10) nosi nazwę współczynnika determinacji i oznaczamy go SST symbolem: R 2. Jest to syntetyczna miara opisująca dopasowanie wartości teoretycznych do rzeczywistych. Przyjmuje wartości z przedziału 0, 1 5. Im bliżej 1 (100%) tym lepsze dopasowanie modelu do danych, a więc oszacowania są lepszej jakości. Dla R 2 = 1 wszystkie punkty empiryczne należą do linii regresji (zaś wszystkie reszty są równe 0). Tylko na pierwszy rzut oka wiadomo co to jest wysokie R 2, choć dążenie do jak najwyższych jego wartości jest zupełnie zrozumiałe. Interpretacja współczynnika determinacji jest możliwa, kiedy zachodzą następujące warunki: 1. relacja między zmiennymi musi być liniowa; 2. parametry muszą być szacowane przy pomocy MNK, gdyż inaczej współczynnik może przyjmować dowolne wartości; 3. model musi zawierać wyraz wolny, w przeciwnym razie zachodzi: R 2 (, 1 W modelach o więcej niż jednej zmiennej objaśniającej R 2 rośnie ze wzrostem liczby szacowanych parametrów. Aby uniknąć tej wady oblicza się skorygowany współczynnik determinacji: (10) R 2 = 1 (1 R 2 ) n 1 n k (11) Różnica między R 2 a R 2 rośnie ze wzrostem liczby zmiennych objaśniających. Skorygowany współczynnik determinacji ma następujące własności: 1. Jeżeli R 2 = 1 wówczas R 2 = 1. 4 Pamiętając, że różnice między wartościami: rzeczywistą i teoretyczną powinny być jak najmniejsze. 5 Często praktykuje się podawanie wartości R 2 w procentach. 7 z 26

2. R2 może przyjmować wartości ujemne. Poniższe rysunki prezentują wartości współczynnika determinacji w zależności od zachowania się relacji między zmienną objaśniającą a objaśnianą przy założeniu, że użyto liniowej funkcji regresji. Y X Y X Y X Rysunek 3: R 2 1 Rysunek 4: R 2 0 Rysunek 5: R 2 0 Przypadki zaprezentowane na rysunkach (4) oraz (5) mimo podobnej wartości współczynnika determinacji różnią się dość znacznie. W pierwszej sytuacji nie ma praktycznie żadnej zależności między zmiennymi, w drugiej zaś występuje ona, lecz ma charakter nieliniowy (w tym wypadku opisany parabolą). 3.2 Istotność oszacowań parametrów Współczynnik determinacji jest komfortową w zastosowaniu miarą ponieważ odnosi się do całego równania i ma wygodną interpretację. Z uwagi jednak na obarczenie pewnymi wadami, weryfikację statystyczną należy wzbogacić o inne elementy. Wiemy, że parametry modelu pokazują wpływ jaki wywiera jedna zmienna na inną. Można więc sprawdzić, czy związki zachodzące w równaniu są rzeczywiście istotne. Jeżeli zmienne: objaśniania i objaśniająca nie są ze sobą powiązane wówczas, biorąc pod uwagę założenia schematu Gaussa-Markowa, odpowiedni parametr powinien być równy zero 6. Skonstruujmy w tej sytuacji następujący zespół hipotez statystycznych dotyczących dowolnego z parametrów: H 0 : α i = 0 H 1 : α i 0 Tworzą one podstawę tzw. testu istotności t-studenta należącego do grupy metod weryfikacji statystycznej. Sprawdzaniem powyższego zespołu hipotez jest statystyka: t αi = ˆα i σˆαi (12) gdzie: σˆαi średni błąd estymatora. Statystyka dana wzorem (12) ma rozkład t-studenta o n-k stopniach swobody. Z uwagi na konstrukcję hipotezy alternatywnej, w teście tym występuje obustronny obszar odrzucenia rozpatrywany względem odczytanej z tablic wartości krytycznej. Interpretacja wyników jest następująca: zero. 6 Z uwagi na obecność składnika losowego, praktycznie nie zdarza się sytuacja, w której parametr jest równy 8 z 26

1. Jeżeli t αi > t kryt wówczas (przy przyjętym z góry poziomie istotności) odrzucamy H 0 na korzyść H 1. Zmienna objaśniająca w istotny sposób wpływa na zmienną objaśnianą. 2. Jeżeli t αi < t kryt wówczas (przy przyjętym z góry poziomie istotności) nie mamy podstaw do odrzucenia hipotezy zerowej, a więc uznajemy dany parametr za nieistotny statystycznie. Konsekwencje braku istotności są bardzo poważne. Oznaczają bowiem, że umieszczona w równaniu zmienna objaśniająca znalazła się tam niepotrzebnie. W takiej sytuacji należy ją usunąć i dokonać reestymacji równania. 3.3 Autokorelacja składnika losowego Z autokorelacją mamy do czynienia, kiedy składniki losowe dotyczące różnych obserwacji są ze sobą skorelowane. Z taką sytuacją spotykamy się najczęściej w przypadku szeregów czasowych. Przyczyny występowania autokorelacji są różne: 1. natura procesów gospodarczych np serie klęsk trwające przez wiele okresów; 2. wpływ zdarzeń najbliższej przeszłości na podejmowane decyzje; 3. niepoprawna postać funkcyjna modelu np nie uwzględnienie cyklu gospodarczego; 4. wadliwa struktura dynamiczna modelu: brak opóźnionych zmiennych w charakterze zmiennych objaśniających; 5. pominięcie ważnej zmiennej objaśniającej. Najpoważniejszą konsekwencją występowania autokorelacji jest obciążenie estymatora wariancji składnika losowego. Kierunek obciążenia bywa różny. Dla autokorelacji dodatniej wariancja ta jest niedoszacowana co prowadzi do pozornie większej dokładności ocen parametrów. W konsekwencji otrzymujemy zawyżone statystyki t-studenta. Najczęściej zakłada się występowanie schematu autoregresyjnego pierwszego rzędu (tzw schemat AR(1)), w którym występuje powiązanie między składnikami losowymi z sąsiednich okresów: ε t = ρε t 1 + η t (13) gdzie: ρ współczynnik autokorelacji; η t N(0, σ η ) Szczególną własnością zjawisk ekonomicznych jest to, że pozostają one ze sobą zawsze w jakimś związku. Z tego powodu autokorelacja, choć niepożądana, jest właściwie nie do uniknięcia. Nasze działania zmierzają więc po pierwsze do określenia siły autokorelacji, a następnie do podjęcia decyzji odnośnie przeciwdziałania jej skutkom. Najprościej byłoby policzyć współczynnik autokorelacji, lecz należy pamiętać, iż nie znamy wprost składnika losowego. Z tego powodu po raz kolejny wykorzystamy jego przybliżenie czyli reszty z modelu. Niestety oznacza to, że możemy poznać jedynie estymator wartości ρ. Istnieje kilka sposobów na obliczenie ˆρ: n e t e t 1 ˆρ 1 = t=2 n t=1 e 2 t (14) 9 z 26

Ponieważ w (14) tracimy w liczniku jeden stopień swobody, można estymator ˆρ policzyć inaczej: ˆρ 2 = n k n 1 ˆρ 1 (15) Najczęściej jednak dla schematu AR(1) wykonuje się test Durbina-Watsona. Zakłada się w nim następujący zespół hipotez: Sprawdzianem testu jest statystyka: H 0 : ρ = 0 H 1 : ρ > 0 lub ρ < 0 d = n (e t e t 1 ) 2 t=2 n e 2 t t=1 (16) Jej wartości należą do przedziału 0, 4. Z tablic odczytujemy dwie wartości krytyczne: dolną d L i górną d U. Interpretacja wyników testu znalazła się w tabeli: Tabela 1: Weryfikacja testu Durbina-Watsona Kierunek autokorelacji ˆρ > 0 ˆρ < 0 Decyzja d d U, 2 d 2, 4 d U przyjąć H 0 d d L, d U d 4 d U, 4 d L brak rozstrzygnięcia d 0, d L d 4 d L, 4 odrzucić H 0 Aby dało się zastosować test Durbina-Watsona muszą zachodzić następujące warunki: 1. w równaniu powinien występować wyraz wolny; 2. należy dysponować co najmniej 15 obserwacjami; 3. w modelu nie powinna występować opóźniona zmienna objaśniana w charakterze zmiennej objaśniającej. W wypadku kiedy ostatnie z założeń nie jest spełnione można sięgnąć po statystykę: ( h = 1 d ) n 2 1 nˆσ Y 2 (17) gdzie: ˆσ Y 2 estymator wariancji parametru przy opóźnionej zmiennej objaśnianej. Statystyka h ma rozkład asymptotycznie normalny o wartości oczekiwanej równej 0 i odchyleniu standardowym równym 1. Jeżeli test potwierdzi występowanie statystycznie istotnej autokorelacji w modelu należy podjąć działania zmierzające do wyeliminowania jej skutków. Stosuje się jedno z poniższych rozwiązań: 1. respecyfikacja modelu; 10 z 26

2. użycie innych niż klasyczna MNK metod estymacji np uogólnionej metody najmniejszych kwadratów (UMNK); 3. wprowadzenie opóźnionych zmiennych. 4 Weryfikacja merytoryczna 4.1 Interpretacja parametrów modelu Jeżeli współczynnik R 2 oraz statystyki t-studenta mają zadowalające wartości, wówczas można przejść od weryfikacji statystycznej do merytorycznej. Ma ona na celu sprawdzenie zgodności otrzymanych wyników z poczynionymi wcześniej założeniami. Podczas weryfikacji merytorycznej wyodrębnimy dwa etapy: 1. określenie poprawności znaków przy parametrach; 2. interpretacja wartości oszacowanych parametrów. W obu przypadkach pomoc może stanowić teoria ekonomii. Często (choć nie zawsze) z góry znamy znak stojący przy relacjach między konkretnymi wartościami ekonomicznymi. Jako przykład może posłużyć uzależnienie popytu na dobra podstawowe od dochodu czy ceny. Nieco bardziej skomplikowana jest interpretacja oszacowanych parametrów. Nie zawsze bowiem znamy rząd wielkości odpowiadający sile wpływu zmiennej objaśniającej na objaśnianą. Spotyka się tu raczej wskazówki (np elastyczność względem zmiennej powinna być mniejsza od 1) niż konkretne, sztywne zasady. Dodatkowo sprawę komplikuje fakt, że inaczej interpretuje się parametry w równaniu liniowym niż w którymkolwiek z nieliniowych. Osobnego zwrócenia uwagi wymaga wyraz wolny. Z jednej strony jego obecność jest wymagana np ze względu na własności współczynnika determinacji. Z drugiej nie zawsze ma on sens merytoryczny, jak dzieje się na przykład w przypadku zlinearyzowanych modeli nieliniowych. 4.2 Zmienne zero-jedynkowe Jeśli chodzi zarówno o weryfikację merytoryczną jak i statystyczną problem może stanowić niekiedy samo zachowanie się danych. Przyjrzyjmy się sytuacji przedstawionej na rysunku 6. Y X Rysunek 6: Nietypowe zachowanie danych Jedna z obserwacji przyjęła wartość nietypowo wysoką w porównaniu do pozostałych danych. Zastosowanie MNK w tej sytuacji doprowadzi do modelu o bardzo niskim R 2 a nawet do przyjęcia hipotezy o braku istotności oszacowań. Z uwagi na skromną liczbę obserwacji nie jest możliwa rezygnacja z części spośród nich, aby uniknąć wymienionych wad. 11 z 26

Jeżeli spojrzeć na to szerzej, nie powinniśmy sprawiać wrażenia zaskoczonych. Zjawiska ekonomiczne podlegają w niektórych okresach (takich jak wojny czy gwałtowne recesje lub boom gospodarczy) raptownym wahaniom. Przyjmują wtedy wartości skrajnie odbiegające od okresów, które w tej sytuacji można nazwać normalnymi lub typowymi. Wyróżnimy 3 grupy takich nietypowych zachowań: 1. obserwacje nietypowe występujące w pojedynczych, nieregularnych okresach; 2. obserwacje nietypowe trwające przez kilka okresów z rzędu; 3. obserwacje nietypowe regularnie się powtarzające. Zazwyczaj nie jesteśmy w stanie zrezygnować z danych dotyczących nietypowych okresów. Ewentualne skrócenie próby ma daleko idące konsekwencje podczas estymacji. Z drugiej strony brak kroków zaradczych oznacza modele o słabych własnościach statystycznych i merytorycznych. Jako wyjście proponuje się stosowanie zmiennych zero-jedynkowych. Zmienną taką definiuje się następująco: U i = { 0, dla obserwacji typowych; 1, dla obserwacji nietypowych. (18) Zmienne zero-jedynkowe tworzone są więc sztucznie, zgodnie z naszymi potrzebami 7. Wprowadza się je następnie do równania i szacuje parametry w tradycyjny sposób. W zależności od użycia mogą one wywoływać zmianę któregoś z pozostałych parametrów w wybranych okresach. Równanie (19) prezentuje korektę wyrazu wolnego: Y i = α 0 + α ou i + α i X i + ε i (19) Y X Rysunek 7: Zmienna zero-jedynkowa dla wyrazu wolnego Niekiedy należy zmienić współczynnik kierunkowy równania: Y i = α 0 + (α 1 + α 1U i )X i + ε i (20) Sytuację z równania (20) ilustruje rysunek 8. Możliwe jest również połączenie rozwiązań zaproponowanych w (19) oraz (20) dla jednego modelu. 7 Należy jednak zachowywać umiar przy wprowadzaniu zmiennych zero-jedynkowych. Ich użycie musi być odpowiednio umotywowane. 12 z 26

Y X Rysunek 8: Zmienna zero-jedynkowa dla współczynnika kierunkowego Oddzielnego omówienia wymaga wykorzystanie sezonowych zmiennych zero-jedynkowych. Ze zjawiskiem sezonowości spotykamy się często korzystając z danych kwartalnych. Jest to sytuacja regularnego powtarzania się obserwacji nietypowych 8. Zakładając, że mamy do czynienia właśnie z sezonowością kwartalną proponuje się następujący sposób użycia zmiennych sztucznych: Y t = α 0 + α 1 X t + α 2 U 1t + α 3 U 2t + α 4 U 3t + ε t (21) Równanie (21) stanowi rozszerzenie modelu z korektą wyrazu wolnego. Różnica polega na tym, że w tym przypadku wyraz wolny jest korygowany w każdym kwartale przez inny parametr (przykładowo za sezonowość w pierwszym z nich odpowiada parametr przy U 1t ). Powyższe zmienne mierzą odchylenie sezonowe względem wybranego (w naszym przykładzie czwartego) kwartału. Zachowanie się zmiennej Y t w czwartym kwartale oddaje wyraz wolny. Należy pamiętać, że w szeregach zmiennych tego typu wartość 1 regularnie się powtarza do końca okresu, z którego pochodzą dane. Przykładowo dla równania (21) macierz X wyglądałaby następująco: 1 X 1 1 0 0 1 X 2 0 1 0 1 X 3 0 0 1 1 X 4 0 0 0 1 X 5 1 0 0 X = 1 X 6 0 1 0 1 X 7 0 0 1 1 X 8 0 0 0..... 1 X n... 5 Modele ekonometryczne a prognozowanie 5.1 Prognozowanie na podstawie modelu jednorównaniowego Aby wykonać prognozę na podstawie modelu ekonometrycznego, musi on charakteryzować się dobrymi własnościami. Jego jakość ocenia się przy pomocy miar takich jak współczynnik determinacji czy istotność oszacowań. Równie ważna jest weryfikacja merytoryczna, czyli znaki a 8 Jako przykład może posłużyć wzrost spożycia napojów gazowanych w okresie letnim. 13 z 26

w przypadku modeli nieliniowych wartości elastyczności. Same prognozy mogą mieć charakter punktowy (wynikiem jest konkretna wartość liczbowa) lub przedziałowy (otrzymujemy przedział, który z określonym prawdopodobieństwem zawiera przyszłą realizację zmiennej prognozowanej). Dodatkowo zakładamy, że relacje między zmiennymi pozostaną stałe w czasie. Oznacza to, że postać funkcyjna modelu oraz wzajemne oddziaływanie zmiennych są stałe z okresem prognozy włącznie. To założenie (szczególnie w realiach ekonomicznych) jest bardzo silne. Podobne założenia czynimy w przypadku omawianych poniżej modeli trendu. Składnik losowy również pozostaje stały w czasie co oznacza, że nie powinny pojawić się nowe zmienne wpływające na prognozowane zjawisko przy okazji zmieniając już ustalone relacje. W okresie prognozowanym musimy znać wartości zmiennych objaśniających. Kiedy nie jest możliwe, w sukurs przychodzą metody prognozowania szeregów czasowych. Można również konstruować dodatkowe równania, służące otrzymaniu przyszłych wartości pożądanych zmiennych. Zazwyczaj takie postępowanie prowadzi do otrzymania układu powiązanych ze sobą równań. Niekiedy zaś (w analizach określonych scenariuszy) zakłada się z góry wartości zmiennych egzogenicznych co upodabnia postępowanie do analizy mnożnikowej. Prognozy na podstawie modeli ekonometrycznych, w których uwzględnia się fakt sezonowości zmiennych, zakładają istnienie sezonowości również w okresie prognozy. Sezonowość ta ma zachowany dotychczasowy okres wahań. 5.2 Modele trendu Niektóre zmienne mają skłonność do systematycznych zmian w czasie np. stale rosną lub maleją. Mówimy, że zawierają trend i staramy się skonstruować możliwie najprostszą sztuczną zmienną reprezentującą czas. Przy addytywnym wprowadzeniu składnika losowego otrzymujemy szczególny przypadek równania linii regresji. Potrzebujemy jedynie informacji o zmiennej objaśnianej, nie zaś objaśniających co stanowi wielce korzystną okoliczność. Postać modelu może być różna, a jej wybór zależy od przesłanek dotyczących mechanizmu rozwojowego zmiennej. Przykłady postaci funkcji trendu: liniowa y t = α + βt Stały kierunek rozwoju zjawiska wyznacza współczynnik kierunkowy prostej. Wyraża on stały przyrost wartości zmiennej prognozowanej. wykładnicza y t = e α+βt, β > 0 y t = αβ t, β > 1 W równaniu pierwszym β a w drugim ln β jest stopą wzrostu. wielomianowa y t = α 0 + α 1 t + α 2 t 2 Kolejne trzy funkcje stosuje się w sytuacji, kiedy stwierdzamy występowanie zmniejszających się przyrostów np. dla względnego nasycenia rynku z powodu pojawiających się produktów konkurencyjnych. logarytmiczna potęgowa y t = α + β ln t, β > 0 y t = αt β, 0 < β < 1 14 z 26

ilorazowa y t = αt β + t, α, β > 0 W przypadku malejącego przyrostu ryzyko prognozowania jest mniejsze bo zmienne zachowują się dość stabilnie. logistyczna y t = α, α, δ > 0, β > 1 1 + β exp δt Funkcji logistycznej używamy kiedy zjawisko jest ograniczone do pewnej przestrzeni (np. rozwój nowych gałęzi przemysłu). Najpierw następuje szybki wzrost, potem tempo maleje do asymptoty wyznaczonej przez parametr alfa. Określenie rodzaju trendu wymaga sporej ilości obserwacji. Postać funkcji dobiera się empirycznie, na podstawie analizy wykresu. Kiedy obserwacji nie ma zbyt wiele, do szeregu da się dopasować więcej niż jedną funkcję. W takiej sytuacji wybieramy tę o najprostszej postaci analitycznej. Używając KMNK do szacowania parametrów trzeba pamiętać o sprowadzeniu równania do postaci liniowej względem parametrów. Modele trendu mogą być (jak każde modele ekonometryczne) rozszerzane o zmienne zero-jedynkowe. Poniższy prosty przykład stanowi ilustrację sposobu, w jaki wykonuje się prognozy w oparciu o model trendu. Przykład prognoz dla funkcji ŷ t = 2 + 3t w kilku wybranych okresach: Okres (t) Prognoza 1 2+3*1=5 3 2+3*3=11 10 2+3*10=32 12 2+3*12=38 6 Przykład estymacji modelu jednorównaniowego 6.1 Sformułowanie problemu Należy oszacować parametry liniowego modelu jednorównaniowego opisującego popyt na pewne dobro (Y) w zależności od dochodów (X). Równanie to ma postać: Y t = α 0 + α 1 X t + ε t (22) Zbadać jego jakość przy pomocy współczynnika determinacji oraz testu istotności. Zebrane dane na temat zmiennych: objaśnianej (Y) i objaśniającej (X) w kolejnych okresach (t) są następujące: 6.2 Szacowanie parametrów modelu Y t 5 6 7 7 8 9 X t 3 3 5 4 6 7 Dane do zadania można zapisać w postaci macierzowej. Ponieważ w modelu występuje wyraz wolny (α 0 ) więc pierwsza kolumna macierzy obserwacji na zmiennych objaśniających składać 15 z 26

się będzie z samych jedynek. 5 1 3 6 1 3 7 1 5 Y = X = 7 1 4 8 1 6 9 Powyższe dane zostaną wykorzystane do estymacji parametrów modelu przy pomocy metody najmniejszych kwadratów. Wzór na estymator parametrów jest następujący: 1 7 α = (X T X) 1 X T y (23) Na początek wyznaczymy macierz X T X: [ 1 1 1 1 1 1 X T X = 3 3 5 4 6 7 ] 1 3 1 3 1 5 1 4 1 6 1 7 [ 6 28 = 28 144 ] W następnym kroku należy macierz odwrócić. Skorzystamy w tym celu ze wzoru na odwracanie macierzy dwa na dwa. Wyznacznik macierzy X T X jest równy 80 (6 144 28 28). Stąd macierz odwrotna jest następująca: (X T X) 1 = 1 80 [ 144 28 28 6 ] = [ 1,8 0,35 0,35 0,075 ] Jako kolejny wyznaczymy wektor X T y: [ 1 1 1 1 1 1 X T y = 3 3 5 4 6 7 ] 5 6 7 7 8 9 [ 42 = 207 ] Możemy teraz przystąpić do ostatniego kroku czyli szacowania parametrów. Podstawiamy do wzoru (23): [ ] [ ] [ ] 1,8 0,35 42 3,15 α = = 0,35 0,075 207 0,825 6.3 Interpretacja otrzymanych wyników Otrzymaliśmy następujące równanie: Ŷ t = 3,15 + 0,825X t (24) 16 z 26

Parametr α 0 = 3,15 oznacza, że w przypadku braku dochodu popyt wynosi 3,15 jednostki. Jest to tzw. popyt autonomiczny. Parametr α 1 = 0,825 oznacza, że wzrost dochodów o jednostkę pieniężną spowoduje wzrost popytu o 0,825 jednostki przy pozostałych warunkach niezmienionych. W tym miejscu warto przyjrzeć się znakowi parametru przy zmiennej objaśniającej. Jest on dodatni. Jako, że objaśniamy popyt przy pomocy wydatków, wydaje się logiczne oraz ekonomicznie uzasadnione, że ze wzrostem wydatków rośnie popyt na dane dobro. Taki właśnie znak stoi przy X t. Mając oszacowane parametry można wyznaczyć teoretyczne wartości zmiennej objaśnianej. Podstawiamy dochód z kolejnych okresów do (24). W efekcie obliczone zostaną wartości wynikające z równania linii regresji. Poniżej znajdują się przykładowe obliczenia dla pierwszych trzech okresów. ŷ 1 = 3,15 + 0,825 3 = 5,625 ŷ 2 = 3,15 + 0,825 3 = 5,625 ŷ 3 = 3,15 + 0,825 5 = 7,275 Jak widać wartości popytu wynikające z równania linii regresji różnią się od wartości rzeczywistych. Różnica: e t = y t ŷ t (25) nosi nazwę reszty z modelu. Poniżej znalazły się wszystkie wartości teoretyczne zmiennej objaśnianej oraz wszystkie reszty. Y t Ŷ t e t 5 5,625-0,625 6 5,625 0,375 7 7,275-0,275 7 6,450 0,550 8 8,100-0,100 9 8,925 0,075 6.4 Ocena jakości otrzymanego modelu Współczynnik determinacji (oznaczany jako R 2 ) służy do oceny dopasowania całego modelu do danych rzeczywistych. Może więc być wyliczany bezpośrednio z reszt modelu lub na podstawie cząstkowych wyliczeń poczynionych jeszcze na etapie szacowania parametrów. W tym drugim wypadku wykorzystuje się następujący wzór (z niego właśnie skorzystamy w niniejszym przykładzie): R 2 = αt X T y nȳ 2 y T y nȳ 2 (26) Wyznaczymy kolejne składowe wzoru (26). [ ] [ ] α T X T 42 y = 3,15 0,825 = 303,075 207 17 z 26

y T y = t 5 6 [ ] yt 2 7 = 5 6 7 7 8 9 = 304 7 8 9 Średnia arytmetyczna ze zmiennej objaśnianej (ȳ) wynosi 7, zaś liczba obserwacji (czyli n) równa się 6. Podstawiamy do wzoru (26): R 2 = 303,075 6 72 304 6 7 2 = 0,9075 Interpretacja 1: Model objaśnia zachowanie się zmiennej objaśnianej w 90,75%. Interpretacja 2: Zmienność zmiennej objaśnianej została wyjaśniona zmiennością zmiennych objaśniających w 90,75%. Wartość współczynnika determinacji rośnie ze wzrostem liczby zmiennych objaśniających, nie można opierać się tylko i wyłącznie na nim. Z tego powodu analizę jakości oszacowań rozszerza się o zbadanie własności pojedynczych estymatorów. Wykorzystamy do tego celu test istotności t-studenta. W teście tym występuje następujący zestaw hipotez: H 0 : α i = 0 H 1 : α i 0 Stawiamy więc hipotezę, że dany parametr jest równy zero (statystycznie nieistotny) wobec hipotezy alternatywnej, która zakłada iż istotnie różni się on od zera. Sprawdzianem tego testu jest statystyka: t αi = ˆα i σ αi (27) σ αi to odchylenie standardowe danego parametru. Aby jednak skorzystać ze wzoru (27) należy najpierw wyznaczyć wariancję reszt. Wykorzystany zostanie następujący wzór (k liczba szacowanych parametrów): Po podstawieniu otrzymamy: σ 2 e = 1 n k (yt y α T X T y) (28) σe 2 = 1 (304 303,075) = 0,23 6 2 Odchylenie standardowe parametru oblicza się mnożąc wariancję reszt przez odpowiedni element przekątnej główne macierzy (X T X) 1, po czym wyciąga się pierwiastek. Jako, że oszacowano dwa parametry, potrzebne będą dwa odchylenia standardowe. σ α0 = 0,23 1,8 = 0,643 σ α1 = 0,23 0,075 = 0,131 Na ich podstawie obliczamy wartości statystyk t-studenta: t α0 = 3,15 0,643 = 4,9 t α1 = 0,825 0,131 = 6,3 18 z 26

Aby zweryfikować hipotezy o istotności każdego z parametrów, z tablic rozkładu t-studenta odczytujemy wartość krytyczną. Potrzebne do tego są dwa parametry: poziom istotności i liczba stopni swobody. Poziom istotności przyjmiemy na poziomie 0,05 a liczba swobody to różnica między liczbą obserwacji a liczbą szacowanych parametrów. W naszym przypadku wynosi ona 6 2 = 4. Wartość krytyczna odczytana z tablic wynosi 2,78. Porównujemy moduły statystyk t-studenta z wartością krytyczną: 4,9 > 2,78 6,3 > 2,78 W obu przypadkach moduły statystyk dla parametrów okazały się większe od wartości krytycznej. Oznacza to iż obie statystyki znalazły się w obszarze odrzucenia. Powiemy, że odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej, która mówi, że dany parametr istotnie różni się od zera. Oznacza to na przykład, że X t ma istotny wpływ na zachowanie się Y t. 1. Znaki przy parametrach są poprawne. 2. Wartość współczynnika determinacji wskazuje na wysoki poziom objaśnienia modelu. 3. Obydwa parametry okazały się istotne statystycznie. Otrzymano więc wiarygodny model o dobrych własnościach statystycznych. Badanie występowania autokorelacji zostanie przeprowadzone przy pomocy testu Durbina- Watsona. Sprawdza się w nim następujący zestaw hipotez: H 0 : ρ = 0 H 1 : ρ 0 Hipoteza zerowa zakłada brak autokorelacji i jest to sytuacja dla nas pożądana. W odróżnieniu, przyjęcie hipotezy alternatywnej oznacza, że współczynnik korelacji jest istotnie różny od zera i występuje autokorelacja składnika losowego. Test Durbina-Watsona opiera się o wektor reszt z modelu. Na ich podstawie dokonuje się najpierw obliczeń cząstkowych, które znalazły się w tabeli poniżej: e t e 2 t (e t e t 1 ) (e t e t 1 ) 2 0,625 0,391 0,375 0,141 1,000 1,000 0,275 0,076 0,650 0,423 0,550 0,303 0,825 0,681 0,100 0,010 0.650 0,423 0,075 0,006 0,175 0,031 0,927 2,558 Teraz wystarczy tylko podstawić do wzoru i obliczyć wartość statystyki DW. DW = (et e t 1 ) 2 e 2 t = 2,558 0,927 = 2,76 Wartość DW jest większa od dwóch więc sprowadzimy ją poniżej tej wartości: DW = 4 DW = 4 2,76 = 1,24 19 z 26

Przed dokonaniem interpretacji należy wyznaczyć, na podstawie tablic statystycznych, wartości krytyczne rozkładu Durbina-Watsona. Potrzebne do tego parametry to: 1. liczba obserwacji (u nas n=6) 2. liczba szacowanych parametrów (u nas k=2) UWAGA! Tablice konstruowane są od 15 obserwacji więc, z formalnego punktu widzenia, nie możemy wykorzystać tego testu. Zrobimy to jednak, lecz wyłącznie w celu zapoznania się z weryfikacją tego typu hipotez. Przyjmijmy zatem, że d L = 0,98 a d U = 1,57. W takiej sytuacji wartość statystyki równa 1,24 znalazła się w obszarze niekonkluzywności testu (bo 0,98 < 1,24 < 1,57). Nie możemy stwierdzić, czy w modelu występuje autokorelacja czy nie. Gdyby statystyka obliczona na podstawie reszt okazała się wyższa od d U wtedy stwierdzilibyśmy brak autokorelacji składnika losowego. Statystyka DW mniejsza od d L oznacza występowanie autokorelacji składnika losowego. 6.5 Prognoza Załóżmy teraz, że chcemy wykonać prognozę punktową na kolejne dwa okresy, czyli siódmy i ósmy. Potrzebujemy do tego celu wartości dochodów w tych okresach. Niech będą dane 9 : X7 = 9 a X8 = 12. Prognozy popytu we wspomnianych okresach wyglądają następująco: Y 7 = 3,15 + 0,825 9 = 10,575 Y 8 = 3,15 + 0,825 12 = 13,05 Zwróćmy uwagę na to, że parametry i postać równania w okresach prognozowanych nie uległy zmianie. Nie rozstrzygaliśmy również, skąd pochodzą wartości zmiennej objaśniającej w okresach siódmym i ósmym, gdyż nie stanowi to przedmiotu zainteresowania naszego przykładu. 7 Modele wielorównaniowe 7.1 Rodzaje modeli wielorównaniowych Istnieje stosunkowo niewielka grupa zjawisk (szczególnie ekonomicznych), które da się opisać w całości przy pomocy pojedynczego równania regresji. Zazwyczaj opisuje ono zbyt mały wycinek rzeczywistości zaś między zmiennymi tworzącymi takie równanie mogą zachodzić dodatkowe związki, często jednoczesne. Z tego powodu sięga się po modele wielorównaniowe. Rozważmy następujący układ równań: y 1t = α 11 y 2t + β 10 + β 11 x 1t + ε 1t y 2t = α 21 y 1t + β 20 + β 21 x 1t + ε 2t y 3t = α 31 y 2t + β 30 + β 31 x 2t + ε 3t Powyższy zapis, analogiczny do tego występującego w modelach jednorównaniowych zastępuje się często następującym: y 1t + α 11 y 2t + β 10 + β 11 x 1t = ε 1t y 2t + α 21 y 1t + β 20 + β 21 x 1t = ε 2t y 3t + α 31 y 2t + β 30 + β 31 x 2t = ε 3t 9 Gwiazdka oznacza, że mamy do czynienia z prognozą. 20 z 26

W modelach wielorównaniowych zmienne objaśniane w jednym równaniu mogą być zmiennymi objaśniającymi w innym. Oprócz tego występują tam także równania pozbawione składnika losowego tzw. tożsamości. Z tego powodu konieczna staje się zmiana używanej dotychczas nomenklatury zmiennych. Wyodrębnimy następujące rodzaje zmiennych: endogeniczne są one przez model objaśniane i wchodzą w interakcje z innymi zmiennymi; egzogeniczne pochodzą spoza systemu. Nie są opisywane przez model, choć wpływają na zmienne endogeniczne; z góry ustalone tworzą je zmienne, których wartości nie są wyznaczone przez model. Chodzi tu o zmienne egzogeniczne i endogeniczne opóźnione. Z uwagi na to, że rozpatrywane modele mają często duże rozmiary (liczące sobie setki bądź nawet tysiące równań) przyjęło się wykorzystywać do analiz zapis macierzowy. Ponieważ poruszać się będziemy w ramach modeli liniowych, w których opóźnienia zmiennych sięgają najdalej jeden okres wstecz możemy zapisać: AY + A 1 Y 1 + BX = E W stosunku do modeli wielorównaniowych czyni się założenia podobnie jak w przypadku wariantu jednorównaniowego. Składniki losowe dla poszczególnych równań powinny mieć wartość oczekiwaną równą zero oraz stałą wariancję. Nie powinna występować korelacja między składnikami z różnych okresów. Nie można jednak wykluczyć skorelowania składników losowych z tego samego okresu lecz z różnych równań. Innym założeniem, tym razem charakterystycznym dla modelu wielorównaniowego jest założenie o kompletności układu. Uznajemy je za spełnione jeżeli macierz parametrów stojących przy zmiennych endogenicznych jest nieosobliwa. Stanie się tak w sytuacji kiedy model liczy tyle równań ile występuje w nim zmiennych endogenicznych. Modele wielorównaniowe mogą być dzielone wg różnych kryteriów. Przykładowo na statyczne i dynamiczne czy liniowe i nieliniowe. Nas jednak najbardziej interesuje podział modeli na klasy różniące się rodzajem powiązań między zmiennymi endogenicznymi z różnych równań. Wyróżnimy więc modele: proste brak powiązań jednoczesnych między zmiennymi endogenicznymi, co pozwala traktować każde równanie oddzielnie. Macierz A jest diagonalna; rekurencyjne zależności między zmiennymi endogenicznymi mają charakter sprzężeń jednokierunkowych. Równania można tak uporządkować, że macierz A będzie trójkątna; współzależne zależności między zmiennymi endogenicznymi mają charakter sprzężeń zwrotnych. Macierzy współczynników nie da się uporządkować w żaden szczególny sposób. Duże modele mogą mieć charakter modeli blokowo-rekurencyjnych. Zawierają one fragmenty rekurencyjne i współzależne. 7.2 Identyfikacja W ekonometrii zidentyfikować równa się stwierdzić, że parametr modelu jest tożsamy z parametrem teorii opisującej działanie systemu. Badanie identyfikacji powinno poprzedzać estymację z uwagi na warunek zgodności estymatorów. Rozważmy następujący model: y 1t = a 11 y 2t + b 12 x 1t + ε 1t (29) y 1t = a 21 y 2t + ε 2t (30) 21 z 26

Po dodaniu stronami i podzieleniu przez 2 otrzymamy: y 1t = 1 2 (a 11 + a 21 )y 2t + 1 2 b 12x 1t + 1 2 (ε 1t + ε 2t ) (31) Otrzymane równanie jest stochastycznie nie do odróżnienia od równania (29). Po oszacowaniu nie da się powiedzieć czy otrzymano ocenę a 11 czy 1/2(a 11 + a 21 ). Szacujemy bowiem postać: y 1t = β 1 y 2t + β 2 x 1t + ν t (32) y 1t = γ 1 y 2t + ξ t (33) Równanie (30) różni się od (31) więc wiadomo, że γ 1 to a 21. Dlatego możemy powiedzieć, że zidentyfikowaliśmy parametr a 21. Równanie (29) jest nieidentyfikowalne a (30) identyfikowalne. Model uznajemy za identyfikowalny kiedy wszystkie jego równania są identyfikowalne, a pojedyncze równanie jest identyfikowalne gdy jego parametry są identyfikowalne. Oznaczmy przez M + liczbę zmiennych endogenicznych występujących w równaniu z parametrem różnym od zera, zaś przez K liczbę zmiennych z góry ustalonych w równaniu z parametrem równym zero. Na tej podstawie określimy kryterium identyfikowalności: równanie jest jednoznacznie identyfikowalne gdy wykluczono z niego tyle zmiennych z góry ustalonych ile pozostawiono w nim objaśniających zmiennych endogenicznych (nie licząc zmiennej objaśnianej). Zachodzi wtedy: M + 1 = K ; równanie jest niejednoznacznie (nadmiernie) identyfikowalne gdy wykluczono z niego więcej zmiennych z góry ustalonych niż pozostawiono endogenicznych zmiennych objaśniających. Zachodzi wtedy: M + 1 < K ; równanie jest nieidentyfikowalne gdy wykluczono z niego mniej zmiennych z góry ustalonych niż pozostawiono endogenicznych zmiennych objaśniających. (M + 1 > K ); 7.3 Estymacja parametrów modeli wielorównaniowych Model przedstawiony w taki sposób, aby dokładnie odzwierciedlać stosowny fragment teorii zapisywany jest w postaci strukturalnej, czyli: AY + A 1 Y 1 + BX = E Jeżeli jednak dokonamy następujących przekształceń: AY = A 1 Y 1 + BX + E Y = A 1 A 1 Y 1 + A 1 BX + A 1 E Otrzymamy postać zredukowaną. Po stronie zmiennych objaśniających występują w niej tylko zmienne z góry ustalone. Przyjmijmy oznaczenia: Po podstawieniu otrzymamy: D 0 = A 1 B D 1 = A 1 A 1 V = A 1 E Y = D 1 Y 1 + D 0 X + V Modele wielorównaniowe, ze względu na swoją specyfikę wymagają przeważnie szczególnych metod estymacji. Podstawowym kryterium jest tutaj klasa modelu. Jeżeli w modelu prostym 22 z 26

MNK-estymator jest zgodny wtedy można szacować parametry każdego równania oddzielnie, w dowolnej kolejności. W modelu prostym każde równanie może być traktowane oddzielnie ponieważ między zmiennymi endogenicznymi nie występują żadne związki. Należy pamiętać, że zmienne egzogeniczne nie są związane z żadnym konkretnym równaniem i mogą występować jednocześnie w kilku spośród równań tworzących model. Zresztą ta zasada dotyczy wszystkich wersji modeli wielorównaniowych. W przypadku modelu rekurencyjnego również da się szacować równanie po równaniu tyle, że kolejność estymacji narzucają nam związki między zmiennymi endogenicznymi. W pewnych szczególnych przypadkach trzeba użyć jednak 2MNK. W przypadku modeli współzależnych problem stanowią jednoczesne sprzężenia między zmiennymi endogenicznymi z poszczególnych równań. Ogólnie spotykane tutaj estymatory dadzą się podzielić na: równaniowe szacuje się w nich parametry kolejnych równań bez wykorzystywania informacji o tym jak wyglądają pozostałe równania, w szczególności tożsamości (do tej kategorii zaliczyć można m.in. PMNK i 2MNK); systemowe szacują model jako całość, uwzględniając postać równań oraz ograniczenia narzucone na parametry (zaliczymy tu 3MNK); Estymatory systemowe mają sporo zalet, ale mają też wady: 1. ewentualne błędy w pojedynczym równaniu przerzucają się na pozostałe równania; 2. liczba obserwacji nie może być mniejsza od liczby parametrów całego modelu co wyklucza te metody z zastosowania do modeli o dużych rozmiarach; Ze względu na powyższe najczęściej używa się 2MNK i KMNK ponieważ nie udało się udowodnić, że dają one prognozy gorszej jakości od metod bardziej wyrafinowanych. Poniżej omówione zostaną dwie z metod estymacji modeli współzależnych: pośrednia i podwójna MNK. Obie przebiegają dwuetapowo tyle, że pierwsza z nich wymaga jednoznacznej identyfikowalności modelu. Zbiorczo da się je przedstawić następująco: Etap I Etap II PMNK Szacowanie parametrów postaci zredukowanej Rozwiązanie układu równań: { D0 = A 1 B D 1 = A 1 A 1 2MNK Szacowanie parametrów postaci zredukowanej Estymacja każdego równania oddzielnie z wykorzystaniem estymatorów dla tych zmiennych endogenicznych, które w danym równaniu pełnią rolę zmiennych objaśniających 7.4 Przykład zastosowania Pośredniej MNK Oszacować parametry modelu: y 1t + α 11 y 2t + β 10 + β 11 x 1t = ε 1t y 2t + α 21 y 1t + β 20 + β 21 x 2t = ε 2t wiedząc, że po oszacowaniu postaci zredukowanej otrzymano parametry: y 1t = 3 x 1t + x 2t y 2t = 2 + 2x 1t 5x 2t 23 z 26

Łatwo sprawdzić, że model jest jednoznacznie identyfikowalny. Tworzymy macierze parametrów obu postaci (strukturalnej i zredukowanej): [ ] [ ] [ ] 1 α11 β10 β 11 0 3 1 1 A = B = D 0 = α 21 1 β 20 0 β 21 2 2 5 Rozwiązanie układu w postaci podanej powyżej może nastręczać trudności, dlatego dokonamy jego przekształcenia: AD 0 = B Stąd mamy: [ ] [ ] [ ] 1 α11 3 1 1 β10 β 11 0 = α 21 1 2 2 5 β 20 0 β 21 Po wymnożeniu powstaje następujący układ równań: 3 + 2α 11 = β 10 3α 21 + 2 = β 20 1 + 2α 11 = β 11 α 21 + 2 = 0 1 5α 11 = 0 α 21 5 = β 21 Po jego rozwiązaniu otrzymamy: α 11 = 0,2 β 10 = 3,4 β 11 = 0,6 α 21 = 2 β 20 = 8 β 21 = 3 Podstawiamy do postaci strukturalnej: y 1t + 0,2y 2t 3, 4 + 0,6x 1t = e 1t y 2t + 2y 1t 8 + 3x 2t = e 2t 7.5 Przykład zastosowania Podwójnej MNK Oszacować parametry modelu: y 1t + α 11 y 2t + β 10 + β 11 x 1t + β 11 x 2t = ε 1t Dysponując danymi: y 2t + α 21 y 1t + β 20 + β 21 x 3t = ε 2t y 1t y 2t x 1t x 2t x 3t 1 7 1 4 18 3 9 2 7 11 4 10 2 9 9 6 11 3 11 8 6 10 4 12 8 Powyższy model jest nadmiernie identyfikowalny, a więc nie można zastosować PMNK. Szacujemy parametry postaci zredukowanej, otrzymując: y 1t = 2,12 0,12x 1t + 0,72x 2t + 0,02x 3t y 2t = 9,08 0,92x 1t + 0,52x 2t 0,18x 3t Po wyznaczeniu wartości teoretycznych zmiennych endogenicznych na podstawie postaci zredukowanej otrzymamy: 24 z 26

ŷ 1t ŷ 2t 1 7 2,90 8,9 4,30 10,3 5,60 10,6 6,20 10,2 Wartości teoretyczne obu zmiennych endogenicznych podstawiamy do postaci strukturalnej i szacujemy parametry po raz drugi używając MNK. Oto oszacowania postaci strukturalnej: 7.6 Analiza mnożnikowa y 1t 0,11y 2t 1,11 0,22x 1t + 0,78x 2t = e 1t y 2t + 0,1y 1t + 12,24 0,3x 3t = e 2t Ekonomia interesuje się często zachowaniem zmiennych endogenicznych wywołanym zmianami zmiennych egzogenicznych. Odpowiedzi na to pytanie można poszukać w postaci zredukowanej. Y = D 1 Y 1 + D 0 X + V Dokonujemy eliminacji opóźnionych zmiennych endogenicznych podstawiając sekwencyjnie kolejne opóźnienia o jeden okres. Y 1 = D 1 Y 2 + D 0 X 1 + V 1 Y = D 1 (D 1 Y 2 + D 0 X 1 + V 1 ) + D 0 X + V Kontynuując proces podstawiania i cofając się o t-s okresów otrzymujemy ostatecznie postać końcową: S 1 S 1 Y = D S 1 Y S + D s 1D 0 X s + D s 1V s s=0 Mnożniki są pochodną zmiennych endogenicznych względem zmiennych egzogenicznych. Tworzą one macierz: U s = y (m)t x (k)t s = D s 1D 0 Wyróżniamy następujące rodzaje mnożników: Bezpośrednie wyrażają natychmiastowy, realizujący się w bieżącym okresie wpływ zmiennych egzogenicznych. Tworzą je elementy macierzy D 0. Występują również w postaci zredukowanej. Pośrednie mierzą efekt zmiany zmiennych egzogenicznych w kolejnych okresach (s > 0). Tworzą je elementy macierzy: D 1 D 0, D 2 1 D 0,... Skumulowane mierzą łączny skutek zmiany zmiennych egzogenicznych po S okresach. Są sumą mnożników bezpośrednich i pośrednich. Mnożniki wyrażają wpływ zmiennych egzogenicznych na endogeniczne wynikający z poszczególnych równań i ten, który jest rezultatem powiązań w całym modelu. s=0 25 z 26