STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 31 Marusz Doszyń Unwersytet Szczecńsk ZASTOSOWANIE METOD EKONOMETRYCZNYCH DO BADANIA HETEROGENICZNOŚCI OBIEKTÓW Streszczene W artykule scharakteryzowano powązana mędzy parametram trzech rodzajów model: dla danych przekrojowych, danych panelowych (model z ustalonym efektam), danych w postac szeregów czasowych. Omówono ekonometryczne metody badana heterogencznośc obektów. W przykładze emprycznym proponowane w artykule procedury wykorzystano do oszacowana efektów ndywdualnych charakteryzujących skłonność do konsumpcj ludnośc województw w Polsce w latach 1998 2005. Słowa kluczowe: heterogenczność obektów, modele ekonometryczne dla danych przekrojowych, modele dla danych panelowych z ustalonym efektam, modele szeregów czasowych. Wprowadzene Dysponując danym przekrojowym lub danym panelowym, trzeba meć na uwadze fakt, że analzowane obekty różną sę od sebe w sposób, który często jest trudno zaobserwować bezpośredno. Wele zmennych (cech) mających stotne znaczene z punktu wdzena modelowanych procesów ne poddaje sę bezpośrednej obserwacj. W przypadku osób do takch zmennych można zalczyć na przykład pozom ntelgencj czy różnego rodzaju cechy o charakte-
84 METODY ILOŚCIOWE W EKONOMII rze psychologcznym. Heterogenczność przedsęborstw może wynkać z różnc w gospodarnośc, skutecznejszego zarządzana, wększej nnowacyjnośc czy lepszej motywacj pracownków. Szczególną grupę przyczyn zróżncowana obektów tworzą skłonnośc ludzke. Zgodne z defncją prof. J. Hozera, skłonność to nachylene postawy względem czegoś lub kogoś zwększające prawdopodobeństwo pewnych zdarzeń [4; 2]. Take skłonnośc, jak skłonność do konsumpcj, oszczędzana, nwestowana, ryzyka czy kooperacj, wpływają na różnce w zachowanach, przyczynając sę tym samym do heterogencznośc obektów, która pownna być uwzględnana w modelowanu ekonometrycznym. Podobne jak w przypadku szeregów czasowych uwzględna sę upływ czasu (przez wprowadzane do model zmennej czasowej lub badane zntegrowana zmennych), tak mając do czynena z danym przekrojowym lub panelowym, należy uwzględnć heterogenczność obektów. 1. Metodologa badana Heterogenczność obektów uwdaczna sę wtedy, gdy dysponuje sę danym przekrojowym lub panelowym. W przypadku danych panelowych obserwacje dotyczą tych samych obektów analzowanych w określonym przedzale czasu. W modelach budowanych na podstawe szeregów czasowych wpływ czynnków specyfcznych dla danego obektu jest zazwyczaj stały, a tym samym trudny do wyodrębnena. Jeżel analzowanych jest n obektów w określonym okrese (momence) t, to model lnowy (dla danych przekrojowych) można zapsać następująco: k t = t + l=1 y α β x + c + u (1) l l, t gdze: y t wartość zmennej objaśnanej w -tym obekce w badanym okrese t, α t, β l parametry modelu, l = 1,, k, k lczba zmennych objaśnających, α t wyraz wolny dla rozważanego okresu, x, wartość l-tej zmennej objaśnającej w -tym obekce w okrese t, l t t t
MARIUSZ DOSZYŃ ZASTOSOWANIE METOD EKONOMETRYCZNYCH DO BADANIA HETEROGENICZNOŚCI OBIEKTÓW 85 c t wpływ czynnków specyfcznych dla -tego obektu w danym okrese t, u t składnk losowy odpowadający obserwacj w -tym obekce w okrese t. W modelu (1) heterogenczność obektów przejawa sę w bezpośredno neobserwowalnym parametrze c t. Obrazuje on wpływ czynnków specyfcznych dla danego obektu, nnych nż te, które zostały uwzględnone bezpośredno w modelu w postac zmennych objaśnających x lt,. Jednym ze sposobów pozwalających na uwzględnene zróżncowana obektów jest wprowadzane do zboru zmennych objaśnających zmennej zero-jedynkowej d z, która w danym równanu ma wartość równą jednośc dla -tego obektu oraz zeru dla pozostałych: d z 1, = 0, gdy z = gdy z (2) gdze = 1, 2,, n. Poneważ przy wprowadzanu kolejnych zmennych d z zmenają sę oceny parametrów, dla każdego okresu t można oszacować n model o postac: k t = αt + l= 1 y β x, + δ d + u (3) l l t gdze z = 1, 2,, n. Dla każdego okresu t szacuje sę n model, a zatem każdemu t odpowada n ocen każdego z parametrów modelu (3). Na podstawe modelu (3) uzyskuje sę węc n ocen parametru δ zt dla danego okresu t. Oceny te odzwercedlają wpływ czynnków charakterystycznych dla badanych obektów 1. Oblczone w ten sposób oceny parametrów przy zmennych zero-jedynkowych to tak zwane reszty predyktywne, a wyznaczone dla tych ocen wartośc statystyk t-studenta to z kole reszty studentyzowane. Na margnese warto dodać, że na podstawe model typu (3) można równeż bezpośredno analzować wpływ różnego rodzaju skłonnośc na zjawska gospodarcze. W takm przypadku zmenna d = 1, jeśl obekt wykazuje daną z zt z t 1 Innym sposobem umożlwającym uwzględnene heterogencznośc obektów w modelach dla danych przestrzennych jest wprowadzene do modelu zmennych zastępczych (proxy varables). Zob. [6].
86 METODY ILOŚCIOWE W EKONOMII skłonność, a zero, gdy obekt ne ma skłonnośc. To, czy obekt (osoba, grupa społeczna) cechuje sę badaną skłonnoścą, można ustalć na przykład metodą anketową. W tym podejścu potrzebna jest dodatkowa wedza, zazwyczaj o charakterze psychologcznym, a zmenna d z może być równa 1 w węcej nż jednym przypadku. Wracając do modelu (3), uwzględnene wszystkch n zmennych zero- -jedynkowych, których wartość wynos 1 dla danego obektu, w zborze zmennych objaśnających w równanu (3) jest nemożlwe dlatego, że lczba zmennych objaśnających byłaby wększa od lczby obserwacj (n + k + 1 > n). Tego typu problemy ne występują w wypadku danych panelowych, a węc odnoszących sę do tych samych obektów obserwowanych w przynajmnej klku okresach (momentach) [3; 6]. Model dla danych panelowych z ustalonym efektam można zapsać jako: 2 gdze ε ~ IN( 0, σ ) t. y t k = β l x + α + ε l=1 l, t t (4) W modelu (4) każdemu obektow odpowada nny wyraz wolny α, który uwzględna heterogenczność obektów. Parametr α odzwercedla czynnk specyfczne dla danego obektu. Przyjmuje sę założene, że czynnk te są stałe w czase. Przy właścwej konstrukcj modelu czynnk specyfczne mogą odzwercedlać wpływ różnego rodzaju skłonnośc na badane zjawska. Przykładowo, jeżel model (4) jest funkcją oszczędnośc uwzględnającą w zborze zmennych objaśnających x l, t wszystke stotne czynnk obektywne (dochód, stopę procentową tp.), to można postawć hpotezę, że efekty ndywdualne α odzwercedlają wpływ skłonnośc do oszczędzana. Do precyzyjnego określena wpływu skłonnośc do oszczędzana potrzebna jest wedza (główne o charakterze psychologcznym) na temat tego, czy dana osoba wykazuje skłonność do oszczędzana. Jeżel tak, wartość zmennej wynos jeden, jeżel ne zero. Wprowadzając do modelu zmenne zero-jedynkowe można bezpośredno określć wpływ analzowanych skłonnośc. Często jednak ekonometryk ne dysponuje tego typu wedzą. W takm przypadku można oszacować efekty ndywdualne, które przy właścwej specyfkacj modelu,
MARIUSZ DOSZYŃ ZASTOSOWANIE METOD EKONOMETRYCZNYCH DO BADANIA HETEROGENICZNOŚCI OBIEKTÓW 87 czyl po uwzględnenu wszystkch stotnych zmennych o charakterze obektywnym, odzwercedlają wpływ danej skłonnośc 2. Model dla danych panelowych z ustalonym efektam można przedstawć równeż w postac macerzowej: y = Xβ + Dα + ε (5) y1 X1 T y 2 = X2 + 0 β yn Xn 0 0 T 0 0 α1 ε1 0 α 2 + ε2 T α n εn (6) gdze: y X D wektor o wymarze nt x 1, gdze n lczba obektów, a T lczba okresów, macerz o wymarze nt x k, składająca sę z obserwacj dokonanych na zmennych x, dla kolejnych obektów, l t macerz blokowo-dagonalna o wymarze nt x n, w której na głów- o wymarze T x 1, składa- nej przekątnej znajdują sę wektory ( ) T jące sę z jedynek, α wektor o wymarze n x 1 składający sę z wyrazów wolnych dla kolejnych obektów, ε wektor zakłóceń losowych o wymarze nt x 1. Zmenne zero-jedynkowe zawarte w macerzy D pozwalają na uwzględnene wpływu czynnków charakterystycznych dla danego obektu. W omawanych modelach można równeż uwzględnć wpływ czasu, na przykład przez wprowadzene do modelu zmennej czasowej t. Model (5) można przedstawć w dwojak sposób. W postac (6) obserwacje pogrupowano tak, że powstały szereg czasowe dla kolejnych obektów 3. Dla -tego obektu model (6) ma postać: 2 Za czynnk obektywne uznaje sę te, które bezpośredno ne zależą od właścwośc (struktury) obektu (osoby, zborowośc, przedsęborstwa ect). W przypadku ludz są to czynnk wynkające z różnych cech osobowośc, możlwośc, wyznawanych norm, stylu życa ect, które często konstytuują różnego rodzaju skłonnośc. 3 Jest to tzw. stos szeregów czasowych (stacked tme seres). Inną możlwoścą jest uporządkowane obserwacj tak, że mamy do czynena z danym przekrojowym dla kolejnych okresów. Jest to tzw. stos danych przekrojowych (stacked cross sectons).
88 METODY ILOŚCIOWE W EKONOMII y X β α + ε, = 1, 2,, n (7) = + T y1 x1, y2 = x1, yt x1, 1 2 T x x x 2, 1 2, 2 2, T xk, 1 β1 1 ε1 x k, 2 β2 + 1 + ε2 α xk, T βk 1 ε T (8) W modelach (7) (8) występują szereg czasowe zmennych dla -tego obektu. Take przedstawene zmennych kolejno dla wszystkch obektów daje w rezultace model (6). Czynnk specyfczne przejawają sę w wyraze wolnym α. Można zauważyć, że w modelach dla danych czasowych stałe w czase czynnk specyfczne dla danego -tego obektu przejawają sę w wyraze wolnym α. W modelach szeregów czasowych jest jeden efekt ndywdualny w postac wyrazu wolnego, z założenem, że wpływ czynnków specyfcznych jest stały w czase. Analzując model dla danych przekrojowych (3) oraz model dla danych panelowych (6), można wykazać, że w modelu (6) efekty ndywdualne dla danego obektu są średną z sumy wyrazów wolnych α t oraz parametrów δ zt (z założenem, że wpływ zmennych objaśnających x l, t w każdym rozważanym modelu jest dentyczny): gdze = 1, 2,, n oraz z =. T ( α + δ ) t zt t 1 α = = α. + = δ z. (9) T T Jak łatwo zauważyć, α = 1 T α to średn wyraz wolny w modelach. / t= 1 dla danych przekrojowych dla -tego obektu w analzowanym okrese, a T t= 1 t δ. = 1/ T δ średna reszta predyktywna dla danego obektu. Reszty z zt predyktywne odpowadają parametrom przy zmennych zero-jedynkowych d z. Jak to wcześnej przedstawono, stosując modele dla danych przekrojowych uzyskuje sę n ocen parametru dla każdego okresu t. Tym samym dla każdego obektu otrzymuje sę T ocen parametru α t oraz δ zt. Suma uśrednonych (względem czasu) ocen parametrów daje efekty ndywdualne w modelu dla
MARIUSZ DOSZYŃ ZASTOSOWANIE METOD EKONOMETRYCZNYCH DO BADANIA HETEROGENICZNOŚCI OBIEKTÓW 89 danych panelowych (6). Należy przy tym pamętać, że zależność (9) jest spełnona wówczas, gdy wpływ zmennych objaśnających x, w modelach dla danych przestrzennych modelu dla danych panelowych jest tak sam. Model (6) to model szeregów czasowych dla n obektów. Można węc oszacować oddzelne dla każdego obektu model o postac (7). Przyjmując, że wpływ zmennych objaśnających w modelu (6) modelach typu (7) dla kolejnych obektów jest dentyczny, efekty ndywdualne w modelu dla danych panelowych będą odpowadały wyrazom wolnym w modelach szeregów czasowych dla poszczególnych obektów. Reasumując, można zauważyć, że efekty ndywdualne w poszczególnych rodzajach model są ze sobą ścśle powązane. Pojawa sę pytane: czy wyznaczać je na podstawe model dla danych przekrojowych (dla kolejnych okresów), model w postac szeregów czasowych (dla kolejnych obektów) czy na podstawe model panelowych sensu strcto? Przewaga model panelowych polega na tym, że są one szacowane z wykorzystanem znaczne wększej lczby obserwacj, których jest nt. Jeżel estymatory parametrów są zgodne, to szacunk parametrów mają wększą precyzję. W modelach przekrojowych lczba obserwacj dla każdego okresu t jest równa n, z kole w modelach szeregów czasowych występuje T obserwacj dla każdego obektu. Szacowane model dla danych panelowych jest uzasadnone wtedy, gdy oceny parametrów przy zmennych objaśnających ne zmenają sę stotne z okresu na okres (w modelach dla danych przestrzennych) lub przy szacowanu model dla kolejnych obektów (w modelach szeregów czasowych). Przyjmując następujące hpotezy zerowe: H :, 0 β.1 = β.2 = = β.t = β H 0 : β 1. = β 2. = = β n. = β, gdze: β.1, β.2,, β.t wektory parametrów przy zmennych objaśnających w modelach dla danych przestrzennych dla t = 1, 2,, T, β 1., β 2.,, βn. wektory parametrów w modelach szeregów czasowych dla = 1, 2,, n, β wektor parametrów w modelu dla danych panelowych. l t
90 METODY ILOŚCIOWE W EKONOMII Jeżel ne ma podstaw do odrzucena hpotez zerowych, to lepsze własnośc mają estymatory parametrów w modelu dla danych panelowych. Jeśl hpotezę zerową należy odrzucć, bardzej zasadne jest szacowane model dla danych przekrojowych lub model szeregów czasowych 4. 2. Przykład empryczny W przykładze emprycznym podjęto próbę rozstrzygnęca, czy lepszym wyjścem jest oszacowane efektów ndywdualnych na podstawe modelu z ustalonym efektam, czy na podstawe model szeregów czasowych estymowanych oddzelne dla poszczególnych obektów. Wykorzystano dane dotyczące kształtowana sę wydatków na towary usług konsumpcyjne w zł na osobę ( y t ) oraz dochodów do dyspozycj ludnośc w zł na osobę ( t ) x w poszczególnych województwach w Polsce w latach 1998 2005. Zmenne urealnono wyrażono w cenach na pozome z 2005 roku. Dane pochodzą z Rocznka statystycznego województw GUS. Model z ustalonym efektam po oszacowanu ma następującą postać 5 : yˆ t = ˆ α p + 0,482 xt, S e = 21, 570, R 2 = 0, 883 (10) ( 7,163) Oceny efektów ndywdualnych ( αˆ p ) modelu (10) podano w perwszej kolumne tabel 1. W kolejnych dwóch kolumnach zameszczono oceny wyrazów βˆ otrzy- wolnych ( ) αˆ oraz oceny parametrów przy zmennej objaśnającej ( ) βˆ ne różną sę stotne statystyczne od oceny parametru ˆ β = 0, 482 przy analogcznej zmennej w modelu z ustalonym efek- mane po oszacowanu model szeregów czasowych oddzelne dla każdego województwa. W celu rozstrzygnęca, czy do oceny efektów ndywdualnych lepej zastosować model dla danych panelowych z ustalonym efektam, czy modele szeregów czasowych, zweryfkowano hpotezy, zakładające, że oceny parametrów przy zmennej objaśnającej w modelach szeregów czasowych dla poszczególnych województw ( ) 4 Do zweryfkowana powyższych hpotez można zastosować na przykład test bazujący na rozkładze t-studenta lub rozkładze F. 5 W nawase pod oceną parametru znajduje sę wartość statystyk t-studenta.
MARIUSZ DOSZYŃ ZASTOSOWANIE METOD EKONOMETRYCZNYCH DO BADANIA HETEROGENICZNOŚCI OBIEKTÓW 91 tam (10). W tym celu posłużono sę testem t-studenta. Empryczne pozomy stotnośc ujęto w ostatnej kolumne tabel 1. Przy pozome stotnośc α = 0,05 we wszystkch przypadkach ne ma podstaw do odrzucena hpotezy zerowej. Zastosowane modelu dla danych panelowych z ustalonym efektam jest zatem lepszym sposobem szacowana efektów ndywdualnych. Wynka to z tego, że lczba obserwacj jest wększa, a tym samym dokładnejsze oceny parametrów. Przyjmując roboczą hpotezę, że w modelu (10) uwzględnono główne, stotne czynnk kształtujące wydatk konsumpcyjne województw, można stwerdzć, że efekty ndywdualne są powązane ze skłonnoścą do konsumpcj. Jak wdać, najwększą skłonnoścą do konsumpcj cechowal sę meszkańcy województwa mazoweckego, a najmnejszą województwa warmńsko-mazurskego. Tabela 1. Oceny efektów ndywdualnych otrzymane na podstawe modelu αˆ, oceny parametrów model szeregów czasowych dla danych panelowych ( ) p dla poszczególnych województw oraz empryczne pozomy stotnośc w teśce na brak różnc mędzy parametram model szeregów czasowych ( ) β a parametrem przy zmennej objaśnającej w modelu z ustalonym efektam Województwo αˆ p αˆ βˆ p emp Dolnośląske 337,631 586,253 0,132 0,485 Kujawsko-pomorske 288,451 133,211 0,724 0,515 Lubelske 292,596 177,698 0,674 0,177 Lubuske 347,660 522,770 0,218 0,772 Łódzke 344,734 253,869 0,611 0,681 Małopolske 321,284 362,118 0,421 0,680 Mazowecke 375,102 182,453 0,707 0,194 Opolske 343,285 265,291 0,597 0,668 Podkarpacke 287,679 183,747 0,665 0,671 Podlaske 305,163 437,532 0,266 0,096 Pomorske 319,641 276,219 0,541 0,833 Śląske 345,221 589,060 0,148 0,619 Śwętokrzyske 287,419 408,454 0,276 0,601 Warmńsko-mazurske 281,736 452,408 0,207 0,161 Welkopolske 299,968 271,040 0,524 0,880 Zachodnopomorske 335,419 430,025 0,347 0,710 Źródło: oblczena własne.
92 METODY ILOŚCIOWE W EKONOMII Podsumowane Reasumując, w artykule przedstawono powązana mędzy trzema rodzajam model: modelam dla danych przekrojowych, modelam dla danych panelowych z ustalonym efektam oraz modelam szeregów czasowych. Wykazano, że efekty ndywdualne w modelach dla danych panelowych są jednocześne wyrazam wolnym w modelach szeregów czasowych (z założenem, że wpływ zmennych objaśnających w każdym omawanym modelu jest tak sam). Indywdualne efekty w modelach dla danych panelowych to średne wartośc sumy ocen wyrazów wolnych oraz reszt predyktywnych w modelach dla danych przestrzennych, gdze wartośc te uśredna sę w czase (równeż z założenem, że wpływ zmennych objaśnających jest dentyczny). W przykładze emprycznym zastosowano zaproponowaną w artykule procedurę do oszacowana efektów ndywdualnych charakteryzujących specyfkę (skłonność do konsumpcj) województw w Polsce w latach 1998 2005. Lteratura 1. Doszyń M., Analza wpływu skłonnośc na zjawska ekonomczne na podstawe model ekonometrycznych dla danych panelowych, Studa Prace Wydzału Nauk Ekonomcznych Zarządzana nr 11, Szczecn 2008. 2. Doszyń M., Statystyczno-ekonometryczna analza skłonnośc ludzkch, Wydawnctwo Naukowe Unwersytetu Szczecńskego, Szczecn 2008. 3. Greene W., Econometrc analyss, ffth edt., Prentce Hall, New York 2003. 4. Hozer J., Doszyń M., Ekonometra skłonnośc, PWE, Warszawa 2004. 5. Hozer J., Zawadzk J., Zmenna czasowa jej rola w badanach ekonometrycznych, PWN, Warszawa 1990. 6. Wooldrdge J.M., Econometrc Analyss of Cross Secton and Panel Data, MIT, Massachusetts 2002.
MARIUSZ DOSZYŃ ZASTOSOWANIE METOD EKONOMETRYCZNYCH DO BADANIA HETEROGENICZNOŚCI OBIEKTÓW 93 APPLICATION OF ECONOMETRIC METHODS IN ANALYZING OBJECTS HETEROGENEITY Summary In the artcle connectons between three types of models were ntroduced: models for cross secton data, models for panel data and models of tme seres. Possbltes of analyzng objects heterogenety by means of presented models were dscussed. In the emprcal example procedure proposed n the artcle was used to estmate ndvdual effects descrbng propensty to consume n vovodshps n Poland n years 1998 2005. Keywords: object s heterogenety, models for cross secton data, panel data models wth fxed effects. Translated by Marusz Doszyń
94 METODY ILOŚCIOWE W EKONOMII