Wybór postaci analitycznej modelu ekonometrycznego
Wybór postaci analitycznej modelu ekonometrycznego jest jednym z najtrudniejszych etapów badań. Jest on szczególnie uciążliwy, gdy rozpatrujemy modele z większą liczbą zmiennych objaśniających. Praktycznie istnieją trzy sposoby podejścia do tego zagadnienia: 1. Sposób źródłowy wykorzystujący teorię ekonomii. Ten sposób wyboru postaci analitycznej jest najbardziej poprawny z punktu widzenia wartości poznawczej modelu. Określoną postać analityczną model ekonometryczny w takim przypadku przyjmuje na drodze: teoria ekonomii - układ równań różniczkowych model ekonometryczny. Model ekonometryczny przyjmuje wówczas taka postać analityczną, jaka powstaje w wyniku całkowania odpowiedniego równania (równań) różniczkowego. Należy jednak podkreślić, iż tylko nieliczne teorie ekonomii opracowane zostały do tego stopnia, by można było ocenić ich ścisłość.
2. Sposób wynikowy polega na statystycznej analizie posiadanego materiału empirycznego (w zasadzie abstrahując od jakichkolwiek teorii ekonomii) i na jej podstawie przyjmowanie odpowiedniego rodzaju zależności. Oznacza to, że wybieramy taką funkcję (bądź klasę funkcji), która najlepiej z punktu widzenia przyjętego kryterium (na przykład odchylenia standardowego) opisuje posiadany materiał empiryczny. Z reguły tego rodzaju postępowanie przy wyborze postaci analitycznej ogranicza możliwości stosowania modeli ekonometrycznych w praktyce. 3. Sposób mieszany oparty na dwóch powyższych. W sposobie tym postać analityczną przyjmuje się głównie na podstawie materiału empirycznego, ale uwzględnia się wiedzę teoretyczną o badanym procesie ekonomicznym (na przykład istnienie poziomu nasycenia).
W przypadku wyboru postaci analitycznej w sposób źródłowy i wynikowy, gdy mamy do czynienia z modelem z jedną zmienną objaśniającą, etap ten sprowadza się w zasadzie do graficznej analizy danych empirycznych. Metody tego typu prezentowane są w wielu opracowaniach z zakresu ekonometrii i statystyki, a są to między innymi: metoda heurystyczna, metoda oceny wzrokowej. Aby za pomocą takich metod wybrać postać analityczną modelu, trzeba dla każdej postaci hipotetycznej przejść przez etap estymacji i weryfikacji, i dopiero ponownie wracając do etapu wyboru postaci analitycznej dokonać wyboru najlepszej funkcji opisującej badaną prawidłowość.
Jeżeli mamy do czynienia z modelami ekonometrycznymi z wieloma zmiennymi objaśniającymi pomocna w ustalaniu postaci analitycznej jest analiza rozkładów poszczególnych zmiennych (w modelu związku dla danych przekrojowych) oraz analiza funkcji trendów poszczególnych zmiennych (w modelu związku dla danych w postaci szeregów czasowych). W modelach związków dla danych przekrojowych: 1) jeżeli wszystkie zmienne w modelu mają rozkłady normalne (lub zbliżone do normalnych) i są niezależne, wówczas model tworzy wielowymiarowy rozkład normalny (ślad rozkładu eliptyczny), co jednoznacznie wskazuje na liniową postać modelu związku;
2) jeżeli rozkłady zmiennych w modelu są asymetryczne, ale mają zbliżone parametry rozkładu, to w myśl twierdzeń granicznych, możemy przyjąć, że zależność między tymi zmiennymi jest liniowa; 3) jeżeli wielowymiarowy rozkład obserwacji zmiennych w modelu nie tworzy rozkładu eliptycznosymetrycznego, wówczas badamy jednorodność zbioru obserwacji; jeżeli zbiór jest niejednorodny przeprowadzamy klasyfikację na względnie jednorodne podzbiory; dla podzbiorów jednorodnych, które spełniają 1) przyjmujemy liniową zależność pomiędzy zmiennymi; jeżeli 1) nie spełniają przyjmujemy postać nieliniową; 4) w pozostałych przypadkach poszukujemy nieliniowej (ale o najprostszym z możliwych zapisie matematycznym) postaci analitycznej modelu związku.
W modelach związku dla danych w postaci szeregów czasowych: 1) jeżeli trendy wszystkich zmiennych są liniowe lub ogólniej rzecz biorąc wielomianowe, wówczas zależność między zmiennymi może mieć charakter liniowy; 2) jeżeli trendy poszczególnych zmiennych są nieliniowe (ale monotoniczne), a kształt nieliniowości jest zbliżony, wówczas model związku może przyjąć postać liniową; 3) jeżeli trendy poszczególnych zmiennych są nieliniowe (i nie monotoniczne) różnego kształtu, wówczas możliwości jest wiele, najkorzystniej jest jednak przeprowadzić periodyzację zmiennych lub związku na jednorodne podokresy, a następnie w jednorodnych podzbiorach ustalić zależności tak jak 1) lub 2);
4) w pozostałych przypadkach poszukujemy nieliniowej (ale o najprostszym z możliwych zapisie matematycznym) postaci analitycznej modelu związku. Z punktu widzenia postaci analitycznej, modele ekonometryczne można dzielić na modele liniowe oraz nieliniowe. Przy czym modele nieliniowe możemy z kolei podzielić na modele nieliniowe sensu stricto oraz na nieliniowe, dla których istnieje liniowa transformacja.
Proces przekształcania modeli nieliniowych w liniową transformację nosi nazwę linearyzacji. Należy zwrócić uwagę, że określając postać analityczną modelu ekonometrycznego należy kierować się wyborem funkcji jak najmniej skomplikowanej pod względem matematycznym. Prostota modelu wiąże się z reguły z bardziej czytelną jego interpretacją ekonomiczną. Dlatego też, jeżeli jest to tylko merytorycznie uzasadnione stosuje się w pierwszej kolejności modele liniowe, w następnej nieliniowe z liniową transformantą, a dopiero w ostateczności modele nieliniowe sensu stricto.
Transformacja liniowa jest zatem rozwiązaniem kompromisowym. Z jednej strony dążymy do pełnej merytorycznej poprawności postaci analitycznej, a z drugiej liczymy się zawsze z możliwościami szacunku parametrów modelu. Znane i stosunkowo proste metody estymacji parametrów modeli ekonometrycznych zakładają z reguły liniowość modelu (lub przynajmniej liniowość modelu względem parametrów, niekoniecznie zmiennych). Przykładem funkcji nieliniowych, które są liniowe względem parametrów a nieliniowe względem zmiennych są funkcje wielomianowe Y k i 1 i X i.
Funkcje nieliniowe nie zawsze spełniają ten wymóg. Jeżeli wymóg ten nie jest spełniony, wówczas uciekamy się do transformacji liniowej, polegającej na sprowadzeniu funkcji nieliniowych do liniowych za pomocą zamiany zmiennych, albo też za pomocą podstawień. Warunkiem koniecznym (jednak nie dostatecznym) zastosowania procedury transformacji liniowej jest wymóg, aby liczba parametrów modelu nieliniowego była co najmniej równa k+1 (gdzie k liczba zmiennych modelu).
Jej postać analityczna jest następująca: Y=α 0 α 1X, przy założeniu, że α 0 >0, α 1 >0. Przekształcenie do postaci liniowej odbywa się poprzez logarytmowanie. Zatem linearyzacja przebiega następująco: ln ln ln y y y y ln ln 0 0 0 X 1 0 X X 1 ln ln X 1 ln. 1
Funkcja wykładnicza znajduje najczęściej zastosowanie jako model tendencji rozwojowej (w którym występuje tylko jedna zmienna objaśniająca zmienna czasowa t). Ponadto ma zastosowanie: - w przypadku, gdy tempo wzrostu danej wielkości jest stałe, na przykład w badaniu dynamiki dochodu narodowego; - w analizie rynku, przy badaniu na dobra nowe, w fazie rozpowszechniania; - w demometrii; - jest także jedną z typowych funkcji kosztów całkowitych.
X y 0 1 przy założeniu, że α 0 >0, α 1 >0.
0 1 y e X 0 1X y 10
Funkcja potęgowa jednej zmiennej ma postać: Y=α 0 X α1. Przekształcenie do postaci liniowej odbywa się podobnie jak w przypadku funkcji wykładniczej: ln ln ln y y y X y ln 0 0 ln 0 0 1 X ln 1 1 X ln ln 1 X.
Funkcja potęgowa jest jedną z najczęściej stosowanych postaci, gdyż nadaje się do opisu różnego rodzaju zależności, zarówno liniowych jak i krzywoliniowych. Tego typu funkcja ma zastosowanie: - w analizie rynku przy badaniu popytu na dobra nowe, wówczas α 1 >0 oraz gdy dane dobro rośnie ale w tempie malejącym; - dla α 1 >0 dobrze aproksymuje zależność indywidualnej wydajności pracy od czasu dojazdu do pracy; - w demometrii, przy szacowaniu potencjału życiowego ludności.
y X 0 1
Postać analityczna w tym wypadku wygląda następująco: Y=α 0 +α 1 logx, przy założeniu, że α 0 >0, α 1 >0. Sprowadzenie funkcji do postaci liniowej odbywa się poprzez odpowiednie podstawienia. y log y 0 z log X 0 1 z. 1 X
Zastosowania w tym przypadku są następujące: - dla α 1 >0 dobrze aproksymuje krzywe Engla dla dóbr wyższego rzędu (dóbr względnie luksusowych lub inaczej półluksusowych), gdy popyt na te dobra rośnie, ale w tempie malejącym; - opisuje udział procentowy pracowników na przykład inżynieryjno-technicznych w stosunku do ogółu zatrudnionych w przemyśle; - dla α 0 =0, α 1 >0 jest funkcją kosztów całkowitych jest to konsekwencją hipotezy, że funkcja kosztów całkowitych jest funkcją odwrotną do funkcji produkcji.
y 0 1 log X
Dla funkcji hiperbolicznej postać analityczna jest często następująca: 1 Y=α 0 +α 1, X przy założeniu, że α 1 >0. W wyniku podstawienia otrzymujemy następującą postać zlinearyzowaną: 1 y 0 1 X 1 z X y 0 1z. Dla α 0 0, α 1 >0 jest funkcją kosztów przeciętnych, gdy funkcja kosztów całkowitych jest funkcją liniową.
y 0 1 1 X przy założeniu, że α 1 >0.
Zastosowanie tego typu funkcji ma miejsce głównie w ekonometrycznej analizie kosztów produkcji. Dla przykładu wielomian stopnia trzeciego ma postać: Y=α 0 +α 1 X 1 + α 2 X 22 +α 3 X 33, A jego wykres, gdy parametry spełniają warunki: α 0 >0, α 1 >0, α 3 >0, α 2 <0, α 22 <3α 1 α 3.
Wielomian stopnia drugiego ma przebieg zmienności dobrze znany z elementarnego kursu matematyki. Y=α 0 +α 1 X 1 + α 2 X 22, I tak dla α 2 <0, α 1 >0 dobrze opisuje zależności indywidualnej wydajności pracy od wieku pracownika, przebieg zmienności tej funkcji jest z reguły zgodny z obserwacjami empirycznymi najpierw wydajność pracy rośnie coraz szybciej, a później coraz wolniej (optymalny wiek produkcyjny), a następnie maleje coraz to szybciej i wreszcie coraz to wolniej dążąc do zera, gdy x->. Tego typu funkcję linearyzujemy również metodą podstawiania.
Głównym zastosowaniem funkcji Törquista pierwszego rodzaju jest opis popytu na dobra podstawowe, czyli pierwsze potrzeby w zależności od dochodów: X Y, 0, 0. X przy czym parametr α interpretowany jest jako tzw. poziom nasycenia, czyli asymptota pozioma wykresu funkcji. W celu oszacowania parametrów tej funkcji transponuje się ją do postaci liniowej poprzez odwrócenie obu stron równania: 1 X 1 1 1, czyli, Y X Y X 1 1 1 po podstawieniu: Y', a0, a1, X ', Y X otrzymujemy postać liniową modelu: Y ' a0 a1 X '.
X Y, 0, 0. X
, X Y 0, 0, 0, X gdzie parametr Y=α jest asymptotą poziomą funkcji natomiast X=-β asymptotą pionową. Parametr γ z kolei jest poziomem X, przy którym pojawia się objaśniane zjawisko Y. W celu oszacowania parametrów tej funkcji transponuje się ją do postaci liniowej poprzez przemnożenie obu stron równania przez mianownik (X+β): X Y X, czyli Y X X, X Y 1 dalej YX Y X : x, więc Y, X X Y 1 stąd Y, po podstawieniu X X Y 1 a0, a1, a2, X ', X", X X otrzymujemy postać liniową: Y a 0 a1 X ' a2x ".
Funkcja ta jest dobrą aproksymantą krzywej Engla dla dóbr i usług wyższego rzędu. Parametr γ jest minimalną wielkością dochodu, przy którym powstają wydatki na dane dobro wyższego rzędu. Łatwo dostrzec, że jeżeli jest on równy zeru, to model ten staje się modelem takim jak uprzednio. X Y, 0, 0, 0, X
X, X Y 0, 0, 0, X Funkcja Törnquista III rodzaju służy do określania zależności pomiędzy dochodami a wydatkami na dobra luksusowe. Parametr α nie odgrywa tu już roli poziomu nasycenia, gdyż model ten nie ma asymptoty poziomej, lecz skośną, o postaci: y=αx-α(β+γ). Z modelu tego można odczytać, że popyt na dobro luksusowe jest realizowany wtedy, gdy dochody są większe od X=γ. Etapy transformacji tej funkcji są analogiczne do poprzedniego modelu.
X, X Y 0, 0, 0, X
Zmienną objaśniającą w modelu logistycznym jest często czas, jest to więc model tendencji rozwojowej: Y a, ct a 0, b 0, c 0 1 be,
Opisane wcześniej modele nieliniowe były sprowadzane do modelu regresji liniowej przez transformację zmiennych lub przekształcenie całego modelu. Występują jednak również także zależności nieliniowe, które wymagają specyficznych metod przekształceń i szacowania parametrów. Przykładem takiego modelu jest krzywa logistyczna, która znajduje zastosowanie w badaniach makro- i mikroekonomicznych. W makroekonomii służy często do opisu wzrostu gospodarki narodowej lub liczebności populacji ludzkiej, w zagadnieniach mikroekonomicznych zaś jest dobrą aproksymantą funkcji popytu. Funkcja ta pisuje zjawiska, które charakteryzują się przechodzeniem od szybkiego wzrostu do coraz wolniejszego tempa, które stabilizuje się na pewnym poziomie, zwanym poziomem nasycenia.
Wśród metod wyznaczania tendencji rozwojowej wyróżnia się m.in.: 1. średnie ruchome zwykłe i scentrowane 2. metody analityczne. Średnia ruchoma zwykła eliminuje wahania przypadkowe. Stosowana jest do wyodrębnienia trendu w szeregach, w których nie występują wahania okresowe. Średnia arytmetyczna zwykła jest to średnia arytmetyczna nieparzystej liczby kolejnych wyrazów szeregu. Średnia ruchoma scentrowana eliminuje wahania okresowe i przypadkowe. Jest to średnia arytmetyczna liczona z parzystej liczby d wyrazów szeregu czasowego. W celu wyeliminowania wahań okresowych stosuje się średnią ruchomą o długości równej okresowi wahań albo wielokrotności tego okresu.
Metody analityczne polegają na założeniu, że tendencję rozwojową można przedstawić za pomocą pewnej funkcji matematycznej: P t =f(t). Nie ma jednoznacznych metod wyboru postaci analitycznej trendu. Do najczęściej wykorzystywanych sposobów wyznaczania postaci trendu należą: 1. Wykorzystywanie teorii ekonomii do określania mechanizmu rozwoju zjawiska w czasie. Postać trendu wynika często z teorii ekonomii tłumaczącej mechanizm rozwoju badanego zjawiska w czasie. 2. Metoda graficzna. Prosty wykres szeregu czasowego pozwala ostawić hipotezę o analitycznej postaci trendu. Analiza graficzna polega na sporządzeniu wykresu szeregu dynamicznego na układzie współrzędnych prostokątnych.
Na podstawie analizy wykresu i znajomości przebiegu określonych funkcji matematycznych można sformułować hipotezę o postaci analitycznej funkcji trendu. Jeżeli na wykresie punkty empiryczne układają się w przybliżeniu wzdłuż prostej odpowiednio w układzie współrzędnych (t, lny t ), (lnt, y t ) oraz (lnt, lny t ) można mówić wtedy o istnieniu trendu wykładniczego, logarytmicznego i potęgowego. 3. Metoda empiryczna polega na przyjęciu za funkcję trendu każdej funkcji charakteryzującej się tym, że wartości szeregu czasowego różnią się od niej w sposób losowy. Buduje się kilka różnych funkcji trendu i wybiera się tę, która jest najlepiej dopasowana do danych empirycznych. Badanie, czy dana funkcja zmiennej czasowej t może być uznana za trend polega na zbadaniu reszt za pomocą odpowiednich testów statystycznych.
4. Metoda analizy dynamicznych własności równania trendu polega na sformułowaniu hipotezy co do postaci funkcji trendu na podstawie analizy przyrostów absolutnych lub względnych. I tak dla przykładu: Funkcja liniowa posiada stałe przyrosty absolutne rzędu pierwszego Δy t = y t - y t-1. Funkcja kwadratowa posiada stałe przyrosty absolutne rzędu drugiego: Δ 2 y t = Δy t - Δy t-1. Wielomian stopnia trzeciego posiada stałe przyrosty absolutne rzędu trzeciego: Δ 3 y t = Δ 2 y t - Δ 2 y t-1. Funkcja wykładnicza posiada stałe przyrosty względne rzędu pierwszego: yt yt 1. y t 1
5. Metoda uśrednionych gradientów polega na analizie przyrostów absolutnych lub względnych. Stosuje się tu dodatkową procedurę polegającą na wyeliminowaniu wahań losowych za pomocą wartości przeciętnych przyrostów z sąsiednich okresów.