Analiza zależności przestrzennych między wdrożeniem ICT a poziomem PKB per capita w krajach Ameryki Łacińskiej w latach 2000-2013. Ewa Lechman Wydział Zarządzania i Ekonomii Politechnika Gdańska eda@zie.pg.gda.pl Abstract This paper is designed to examine the spatial dependency regarding Information and Communication Technologies adoption versus economic growth in Latin American countries over the period 2000-2013. It examines whether geographic proximity play a role in crosscountry diffusion of economic growth which is predominantly subjected to the level of ICT penetration. To this aim the spatial dependency and spatial heterogeneity are observed, and to report on the prospected relationships the spatial lag, spatial autoregressive and spatial error models are used. All statistical data are exclusively derived from International Telecommunication Union 2015 and World Economic Outlook 2015 databases. 1. Wprowadzenie Według zaproponowanego przez W.Toblera [Tobler 1970], pierwszego prawa geografii, zlokalizowane w przestrzeni geograficzne obiekty są ze sobą wzajemnie powiązane, co może powodować powstawanie między nimi wzajemnych interakcji. Jednocześnie można zauważyć pewne prawidłowości polegające na tym, że obiekty bliższe są ze sobą bardzie powiązane niż obiekty bardziej od siebie oddalone. Powyższe daje podstawy do przypuszczeń, że odległość geograficzna między np. krajami, ma istotny wpływ na poziom zależności pomiędzy badanymi zjawiskami i/lub procesami w analizowanej przestrzeni, przyjmując założenie, że procesy te mogą mieć charakter procesów ekonomicznych [LeSage and Pace 2009]. Przyjmując arbitralne założenie, że w danej przestrzeni można zauważyć i poddać kwantyfikacji analizowane między zmiennymi zależności, to wówczas nazywamy je zależnościami przestrzennymi [Anselin 2003] [ang. spacial dependency]. Z drugiej strony można zaobserwować przestrzenną heterogeniczność [LeSage 1999] [ang. spatial heterogeinity], co oznacza, że pewne obserwowalne cechy danych obiektów mają znaczący wpływ na zróżnicowanie przestrzenne otoczenia. Według Anselina [1988], z punktu widzenia prowadzonych procedur badawczych, zjawisko obserwowanych zależności przestrzennych oraz przestrzennej heterogeniczności, można zdefiniować, jako tzw. efekty przestrzenne, które mogą być silną determinantą zjawisk zachodzących w badanych obiektach. Biorąc pod uwagę fakt, że większość zjawisk i procesów społeczno-ekonomicznych może być w sposób pośredni, bądź też bezpośredni uwarunkowana przez efekty przestrzenne, powyższe wymaga uwzględnienia tych ostatnich w procedurach ekonometrycznego modelowania. Zapoczątkowany przez Klassena oraz Paelincka [Klassen i Paelinck, 1979], nowy nurt badań łączących w sobie aspekty przestrzenne i ekonomiczne jednocześnie, pozwala na uchwycenie relacji zachodzących pomiędzy zjawiskami i/lub wielkościami ekonomicznymi przy uwzględnieniu faktu, iż procesy te mogą być silnie uwarunkowane przestrzennymi zależnościami między analizowanymi obiektami, stanowiąc jednocześnie źródło dodatkowej informacji. 1
2. Cel analizy. Celem artykułu jest zaprezentowanie procedur testujących przestrzenne autokorelacje, oraz procedur wyboru modelu przestrzennego. Aby zrealizować powyższe przeprowadzono ilościową analizę mającą na celu weryfikację istniejących zależności między poziomem produktu krajowego brutto per capita a stopniem wdrożenia ICT w 24 krajach Ameryki Łacińskiej w okresie 2000-2013, jak również ocena czy zidentyfikowane zależności są uwarunkowane przestrzennie. Przyjmujemy arbitralnie założenie, że wartość PKB per capita w danym kraju jest uzależniona od poziomu wdrożenia telefonii stacjonarnej, telefonii komórkowej, oraz rozprzestrzenienia sieci Internet. W związku z powyższym należy założyć, że tzw. odległości zarówno pojmowane stricte, jako odległość fizyczna [geograficzna], oraz odległość ekonomiczna [rozumiana, jako stopień zróżnicowania odnośnie poziomu PKB per capita], mają istotny wpływ na zależności między poziomem PKB per capita w danym kraju a poziomem wdrożenia nowoczesnych technologii informacyjnych i komunikacyjnych. W pierwszej części analizy, zostanie zweryfikowana hipoteza o istnieniu statystycznie istotnych autokorelacji przestrzennych, dla 4 analizowanych zmiennych PKB per capita [GDPpc i,y ], liczby użytkowników telefonii stacjonarnej na 100 mieszkańców [FTL i,y ], liczby użytkowników telefonii komórkowej na 100 mieszkańców [MCS i,y ] oraz penetracji sieci Internet, która wskazuje na odsetek osób indywidualnych mających dostęp do tejże sieci [IU i,y ], gdzie i oznacza kraj, zaś y rok. W drugim etapie, poddajemy estymacji 3 rodzaje modeli: klasyczny model regresji liniowej oszacowany przy zastosowaniu metody najmniejszych kwadratów; oraz dwa modele pozwalające na identyfikację efektów przestrzennych, tj. model opóźnień przestrzennych [ang. Spatial Lag Model (SLM), Spatial Autoregressive Model (SAR)], oraz model zakładający autokorelację składnika losowego [model błędu przestrzennego, ang. Spatial Error Model (SEM)]. Wszystkie wykorzystane dane statystyczne pochodzą z baz międzynarodowych: Międzynarodowego Związku Telekomunikacyjnego [International Telecommunication Union] 2015 oraz IMF World Economic Outlook 2015. 3. Identyfikacja przestrzennych autokorelacji w krajach Ameryki Łacińskiej. Lata 2000 oraz 2013. Istnienie zjawiska przestrzennej autokorelacji oznacza, że mamy do czynienia ze statystycznie istotną korelacji pomiędzy wartościami analizowanej zmiennej Y 1 a położeniem badanych obiektów w przestrzeni. Powyższe oznacza również, że dane zjawisko, które jest obserwowane w jednym obiekcie [np. kraju] stanowi ważną determinantę zmniejszenia lub zwiększenia prawdopodobieństwa wystąpienia zjawisk identycznych w obiektach sąsiednich, tj. bliskich geograficznie. Zidentyfikowanie zjawiska przestrzennej autokorelacji implikuje odejście od klasycznych analiz statystycznych i ekonometrycznych, gdzie arbitralnie przyjmuje się założenie o przestrzennej niezależności badanych obserwacji. Natomiast zaobserwowanie przestrzennej autokorelacji wskazuje, iż pomiędzy badanymi obiektami istnieje zależność, determinująca charakter, kierunek oraz siłę relacji między nimi. Przyjmuje się, że klasyczną miarą autokorelacji przestrzennej jest statystyka I Morana [Moran 1950]. Zakładając, dla danej macierzy wag przestrzennych, że i oraz j reprezentują wybrane w przestrzeni obiekty, charakteryzowane określonymi cechami, to formalny zapis globalnego współczynnika I Morana jest zdefiniowany według formuły: I = * [1], 2
gdzie W oznacza przyjętą macierz wag; w ij to waga połączeń między jednostką [obiektem] i a j; x i oraz x j prezentują wartości danej zmiennej dla obiektu i oraz j; zaś oznacza wartość średnią danej zmiennej. Z definicji wartość statystyki I mieście się w przedziale <-1;1>; gdzie występowanie dodatniej przestrzennej autokorelacji oznacza, iż wartości cech przypisane obiektom bliskim są zbieżne [podobne], zaś występowanie ujemnej autokorelacji przestrzennej oznacza, iż wartości cech obiektów bliskich znacznie się różnią. Przyjmuje się, że ujemna statystyka I Morana oznacza występowanie tzw. wysp, to znaczy obiektów istotnie różniących się od swoich sąsiadów pod względem przypisanych im cech. W przypadku, gdy wartość statystyki I Morana jest równa bądź bliska zero, można uznać, że wartości danych obserwacji w analizowanych obiektach cechuje losowe rozmieszczenie. Poniżej zaprezentowano, wyniki oszacowań globalnych statystyk I Morana [Rys. 1 i 2 oraz Tabela 1 i 2], dla 4 wybranych zmiennych GDPpc i,y, FTL i,y, MCS i,y oraz IU i,y [w latach 2000 oraz 2013], dla 24 krajów Ameryki Łacińskiej. Odpowiednie współczynniki przestrzennej autokorelacji oszacowano dla: macierzy wag przestrzennych, tj. odległości geograficznych [utworzono w tym celu binarną macierz sąsiedztwa pierwszego rzędu] oraz macierzy wag odległości ekonomicznych [utworzono macierz sąsiedztwa wykorzystując metodologię szacowanie odległości Euklidesowych, gdzie za wartość referencyjną przyjęto poziom PKB per capita odpowiednio w latach 2000 oraz 2013]. Rys. 1. Przestrzenna autokorelacja dla zmiennych [macierz wag geograficznych] GDPpc i,y, FTL i,y, MCS i,y oraz IU i,y. Ameryka Łacińska. Lata 2000 oraz 2013. 3
Źródło: opracowanie własne. Uwagi: na osiach X - wartości zmiennych standaryzowane; na osiach Y wartości zmiennych standaryzowane opóźnione przestrzennie. Obliczenia z wykorzystaniem macierzy wag przestrzennych dla odległości geograficznych. Tabela 1. Współczynniki globalnej autokorelacji przestrzennej I Morana [dla macierzy wag geograficznych] dla zmiennych GDPpc i,y, FTL i,y, MCS i,y oraz IU i,y. Ameryka Łacińska. Lata 2000 oraz 2013. I Moran pseudo p-value I Moran pseudo p-value GDPpc_2000 -.0001.37 MCS_2000.05.26 GDPpc_2013.046.28 MCS_2013 -.01.40 FTL_2000.019.31 IU_2000.10.14 FTL_2013.12.15 IU_2013.32.01 Źródło: obliczenia własne. W przypadku PKB per capita zarówno w roku 2000 jak i 2013, obserwujemy wyraźny brak autokorelacji przestrzennej pomiędzy badanymi obiektami. Powyższe można stwierdzić przede wszystkim analizując odpowiednie wartości współczynnika I Morana, które w obu przypadkach jest bliska zero [patrz Tabela 1]. Brak istnienia przestrzennej autokorelacji w przypadku zmiennej GDPpc i,y, sugeruje, że nie można wykazać statystycznej i istotnej zależności pomiędzy wartości produktu krajowego brutto per capita, a przestrzennym rozmieszczeniem analizowanych gospodarek. Dla obu lat 2000 oraz 2013, oszacowane statystyki pseudo p-value są znacznie wyższe od 0.05 1, co potwierdza hipotezę o braku statystycznie istotnej korelacji między wartością GDPpc i,y w danym roku, a zmienną obrazującą jej przestrzenne opóźnienie. Powyższe wnioski potwierdza również analiza graficzna badanych relacji [patrz Rys.1]. Na obu wykresach, punkty prezentujące poszczególne kraje są relatywnie równomiernie rozłożone pomiędzy 4 ćwiartki układu współrzędnych, co potwierdza brak globalnej przestrzennej autokorelacji. Analogiczne wnioski odnośnie przestrzennych autokorelacji, jak w przypadku zmiennej GDPpc i,y, można wysnuć na podstawie analizy statystyki I Morana dla zmiennej MCS i,y. Wartości [0.05] oraz [-0.01] odpowiednio w latach 2000 oraz 2013, wskazują, że nie ma statystycznie istotnej relacji miedzy położeniem kraju a wartością MCS i,y. Podobne relacje w zasadzie ich brak, jest wykazany w przypadku zmiennej FTL i,y. Pomimo, że w roku 2013, wartość I Morana wyniosła [0.12], to przy pseudo p-val.>0.05 nie można uznać tego oszacowania za statystycznie istotne. W przypadku zmiennej IU i,y, wartości statystyki I Morana dla lat 2000 oraz 2013 znacznie się różnią. W roku 2000, obserwujemy brak przestrzennej autokorelacji, tj. geograficzna odległość między obiektami [krajami] jest statystycznie nie istotna z punktu widzenia odsetka populacji wykorzystującej Internet w danej gospodarce. Natomiast w roku 2013, wartość I=0.32 zaś pseudo p-value=0.01. Świadczy to o istnieniu przestrzennej autokorelacji w przypadku zmiennej IU i,y, tj. w przypadku gospodarek znajdujących się w I 1 Szacunek dla 999 permutacji. 4
ćwiartce układu współrzędnych, niskim wartościom IU i,2013 w danym kraju i towarzyszą niskie wartości w obiektach sąsiednich; zaś wysokim wartościom IU i,2013 w danym kraju i towarzyszą wysokie wartości w krajach sąsiednich. Na podstawie powyższego, można więc uznać, że stosując macierz wag dla odległości geograficznych, statystycznie istotne autokorelacje przestrzenne są zauważone jedynie w roku 2013 dla zmiennej IU i,y, zaś w pozostałych przypadkach badane kraje cechuje silna przestrzenna heterogeniczność. Dodatkowo, szacujemy globalne statystyki I Morana dla zmiennych FTL i,y, MCS i,y oraz IU i,y, przyjmując macierz wag przestrzennych oszacowaną dla odległości ekonomicznych [oddzielnie dla roku 2000 oraz 2013]. Rys.2. Przestrzenna autokorelacja dla zmiennych [macierz wag ekonomicznych] zmiennych FTL i,y, MCS i,y oraz IU i,y. Ameryka Łacińska. Lata 2000 oraz 2013. Źródło: opracowanie własne. Uwagi: na osiach X - wartości zmiennych standaryzowane; na osiach Y wartości zmiennych standaryzowane opóźnione przestrzennie. Obliczenia z wykorzystaniem macierzy wag przestrzennych szacowanych według odległości ekonomicznych [dla GDP per capita w roku 2000 oraz 2013]. Tabela 2. Współczynniki globalnej autokorelacji przestrzennej I Morana [dla macierzy wag ekonomicznych]. ] dla zmiennych FTL i,y, MCS i,y oraz IU i,y. Ameryka Łacińska. Lata 2000 oraz 2013. I Moran pseudo p-value I Moran pseudo p-value GDPpc_2000 MCS_2000.15.00 GDPpc_2013 MCS_2013.02.05 FTL_2000.19.00 IU_2000.12.00 FTL_2013.20.00 IU_2013.26.00 Źródło: obliczenia własne. 5
W przypadku zastosowaniu macierzy wag odległości ekonomicznych, w roku 2000, wartość statystyki globalnej I Morana dla wszystkich 3 zmiennych FTL i,y, MCS i,y oraz IU i,y była dodatnia i statystycznie istotna i wynosiła odpowiednio [0.19], [0.15] oraz [0.12]. Powyższy wynik wskazuje na fakt, że w badanym przypadku mamy do czynienia z występowanie przestrzennej autokorelacji, to znaczy, że kraje o względnie wysokich wartościach wskaźników ICT są obiektami bliskimi ekonomicznie, czyli takimi gdzie wartość produktu krajowego brutto per capita jest również relatywnie wysoka, i na odwrót. W przypadku roku 2013, wyniki są podobne, tj. możemy wysunąć wniosek o przestrzennej autokorelacji. Wyjątek stanowi zmienna MCS i,2013, gdzie wartość I Morana jest niska i wykazuje brak statystycznej istotności. Oznacza to, że kraje do siebie podobne pod względem wartości MCS i,y nie są jednocześnie bliskimi sąsiadami ekonomicznymi, co może wskazywać na to, że poziom wdrożenia MCS i,y nie jest silnie zależny od poziomu PKB per capita danego kraju. 4. Analiza zależności między poziomem PKB per capita a wdrożeniem ICT w krajach Ameryki Łacińskiej. Przykład wykorzystania regresji przestrzennej. W celu ustalenia czy w przypadku relacji PKB per capita i poziomu wdrożenia ICT w badanych krajach Ameryki Łacińskiej, daje się obserwować przestrzenna zależność czy też raczej heterogeniczność, zostaną wykorzystane metody ekonometryczne w obszarze modelowania przestrzennego. Według Anselina [Anselin 1988], ogólna postać przestrzennego modelu regresji liniowej może być zapisana, jako [Kossowski 2009]: Y = X + W 1 y + [2] przyjmując, że = W 2 +. W 1 oraz W 2 są oszacowanymi i standaryzowanymi macierzami wag przestrzennych stopnia n [macierz W 1 odnosi się do relacji przestrzennych zachodzących w odniesieniu do zmiennej zależnej; zaś macierz W 2 jest związana z autokorelacją przestrzenną składnika losowego], zaś parametry i to współczynniki autoregresyjne przestrzennie opóźnione. Y reprezentuje zmienną zależną, X zmienną niezależną, zaś parametr - stałą modelu regresji, która jest niezależna od relacji o charakterze przestrzennym. Do celów analiz empirycznych najczęściej są wykorzystywane 3 rodzaje modeli, które są zredukowaną formą równania [2]. Modelami tymi są: klasyczny model regresji liniowej (LRM Linear Regression Model]; model opóźnienia [przesunięcia] przestrzennego [SAR Spatial Autoregressive Model], w których zależność przestrzenna jest raportowana w odniesieniu do zmiennej zależnej [Y], a oszacowane parametry przestrzenne wskazują na siłę i kierunek analizowanych zależności w kategoriach przestrzennych [Janc 2007]; model błędu przestrzennego [SEM Spatial Error Model], pozwalający na ocenę zależności przestrzennej błędu losowego, gdzie zidentyfikowana zależność przestrzenna wskazuje na istnienie przestrzennie skorelowanych zmiennych mających wpływ na badanie zjawisko, ale nie uwzględnionych w modelu. Wersje analityczne modeli można zapisać, jako: gdzie = =0, gdzie: 0, =0, oraz gdzie: =0, ƺ = W 2 +. LRM: y = X + [3], SAR: y = X + W 1 y + [4], SEM: y = X + ƺ [5], 6
Procedura służąca ocenie zależności przestrzennych przy wykorzystaniu modelowania ekonometrycznego jest złożona z kilku etapów. Pierwszym etapem jest estymacja modelu liniowego [przy użyciu OLS], dla zbioru uprzednio wybranych zmiennych. Na tym etapie dokonujemy również oceny przestrzennej autokorelacji reszt modelu liniowego [I Moran`s error statistics], z wykorzystaniem statystyki I Morana. Jeżeli, wartości statystyki I Morana jest statystycznie istotna, to istnieją podstawy do zastosowania odpowiedniego modelu przestrzennego. Wykorzystanie statystyki I Morana pozwala na stwierdzenie, czy w danym przypadku analizowanych zależności mamy do czynienia z zależnością o charakterze przestrzennym, natomiast stosując jedynie powyższą statystykę nie można ustalić rodzaju autokorelacji przestrzennej [Olejnik 2013]. Natomiast powyższe można określić na podstawie analizy przeprowadzonej w oparciu o testy mnożnika Lagrang`a [LM - Lagrange Multiplier] 2 na autokorelację składnika losowego. W przypadku, gdy testy te wypadną pomyślnie, tj. wykazują statystyczną istotność to istnieją podstawy do zastosowania modelu SAR lub SEM [Burridge 1980]. W poprzedniej sekcji, analizie poddaliśmy przestrzenne zależności odnośnie 4 zmiennych: GDPpc i,y, FTL i,y, MCS i,y oraz IU i,y, które charakteryzowały gospodarki Ameryki Łacińskiej. Wykorzystując macierze wag przestrzennych dla odległości geograficznych, otrzymane wyniki wskazują raczej na istnienie przestrzennej heterogeniczności, niż autokorelacji. Jedynie w przypadku zmiennej IU i,y dla roku 2013, wartość statystyki wskazywałaby na istnienie przestrzennych autokorelacji. Natomiast, w przypadku zastosowania macierzy wag ekonomicznych [dla GDPpc i,2000 oraz GDPpc i,2013 ], wyniki wskazywały na istnienie statystycznie istotnej autokorelacji przestrzennej 3. Poprzednie analizy dotyczące identyfikacji przestrzennych autokorelacji, uzupełniamy szacując modele przestrzenne dla 4 wybranych zmiennych. Jako zmienną zależną przyjmujemy wartość produktu krajowego brutto per capita w roku 2000 oraz 2013 [GDPpc i,2000 oraz GDPpc i,2013 ], zaś jako zmienne objaśniające przyjmujemy poziom wdrożenia i wykorzystania ICT [FTL i,2000, FTL i,2013, MCS i,2000, MCS i,2013, IU i,2000 oraz IU i,2013 ]. Wyniki oszacowań prezentujemy poniższej. a) Identyfikacja efektów przestrzennych w modelach SAR oraz SEM dla macierzy wag odległości geograficznych. Analizując z wykorzystaniem modeli przestrzennej autoregresji i/lub błędu przestrzennego, należy się najpierw odnieść do modelu klasycznej liniowej regresji w przypadku wybranych zmiennych. Tabel 3 [poniżej] zawiera wyniki oszacowania klasycznego modelu regresji liniowej wraz z diagnostyką potencjalnych zależności przestrzennych pomiędzy krajami [biorąc pod uwagę wybrane zmienne]. Postać analityczną LRM można zapisać, jako: Y y = X 1,y 1,y + X 2,y 2,y + X 3,y 3,y + [6], gdzie za Y przyjęto poziom PKB per capita w roku y, zaś X n stanowią poszczególne zmienne w obszarze ICT. Oszacowania modelu LRM, dokonano oddzielnie dla lat 2000, 2011 oraz 2013, wykorzystując macierz wag odległości geograficznych. Oszacowany model dla roku 2000, wykazuje najniższy współczynnik determinacji R-squared, oraz najwyższy parametr AIC, co sugeruje, że przyjęte zmienne ICT najsłabiej wyjaśniają zmienność w wartości PKB per 2 Możliwy jest również wybór modelu na podstawie tzw. odpornych testów mnożnika Lagrang`a [Robust LM], natomiast mogą one wykazywać brak wrażliwości w przypadku, gdy pojawią się lokalne błędy specyfikacji modelu. 3 Wyjątek stanowił przypadek dla zmiennej MCS i,2013, gdzie raportowano przestrzenną heterogeniczność. 7
capita. Co więcej diagnostyka statystki I Morana wskazuje, że w tym przypadku (rok 2000) wykorzystanie modelu przestrzennej autoregresji i/lub modelu błędu przestrzennego nie jest zasadne. Oszacowane analogiczne modele dla lat 2011 oraz 2013 wykazuję znacznie wyższe R-squared [.96] oraz [.98] odpowiednio, czemu towarzyszy niższy współczynnik AIC. Może to sugerować, że w roku 2011 oraz 2013 przyjęte zmienne ICT znacznie lepiej niż w 2000 roku wyjaśniają zmienność PKB per capita między badanymi krajami. Oszacowane parametry dla MCS i,y oraz IU i,y dla lat 2011 oraz 2013, są dodatnie i statystyczne istotne co może sugerować, że między nimi i wartością PKB per capita istnieje dodatnia relacja. Również oszacowane dla lat 2011 oraz 2013 statystyki I Morana, mogą sugerować, że w badanym przypadku jest uzasadnione zastosowanie modelu przestrzennego opóźnienia (SAR) i/lub modelu błędu przestrzennego. Co więcej na podstawie wartości mnożnika Lagrang`a dla błędu przestrzennego można uznać, że będzie zasadne stosowanie modelu błędu przestrzennego. Tabela 3. Relacja GDPpc i,y versus ICT 4 i,y,t. Kraje Ameryki Łacińskiej. Lata 2000, 2011, 2013.Model LRM. Wyniki estymacji LRM 2000 [macierz wag odległości geograficznych] R-squared.69 Log Likelihood -30.4 Prob [F-stat].00 AIC 68.9 Vars. t-stat Prob. LnFTL i.2000 2.09 3.6.00 LnMCS i.2000.58 1.3.21 LnIU i.2000 -.69-1.7.10 Test Jarque-Bera [Prob] 2.2 [.32] Breusch-Pagan [Prob] 18.2 [.00] Diagnostyka zależności przestrzennych Value Prob. Moran`s I [error] 1.5.13 Lagrange Multiplier [lag].15.69 Lagrange Multiplier [error] 1.2.27 Wyniki estymacji LRM 2011 [macierz wag odległości geograficznych] R-squared.96 Log Likelihood -8.5 Prob [F-stat].00 AIC 25.0 Vars. Coeff. t-stat Prob. LnFTL i.2011.19.68.50 LnMCS i.2011 1.24 7.6.00 LnIU i.2011.72 2.6.01 Test Jarque-Bera [Prob] 4.2 [.12] Breusch-Pagan [Prob] 2.3 [.51] Diagnostyka zależności przestrzennych Value Prob. Moran`s I [error] 2.1.03 Lagrange Multiplier [lag] 1.2.27 Lagrange Multiplier [error] 1.8.17 Wyniki estymacji LRM 2013 [macierz wag odległości geograficznych] R-squared.98 Log Likelihood -2.0 Prob [F-stat].00 AIC 12.1 Vars. Coeff. t-stat Prob. LnFTL i.2013 -.00 -.04.96 LnMCS i.2013 1.1 8.2.00 LnIU i.2013 1.07 5.3.00 Test Jarque-Bera [Prob] 1.4 [0.49] Test Breusch-Pagan [Prob] 8.4 [.03] Diagnostyka zależności przestrzennych Value Moran`s I [error] 3.12.00 Lagrange Multiplier [lag] 2.3.12 Lagrange Multiplier [error] 4.8.02 Źródło: obliczenia własne. Uwagi: stała modelu oszacowana wyłączona z raportu. Zmienna zależna: LnGDPpc i,y ; zmienne objaśniające: LnFTL i,y, LnMCS i,y oraz LnMCS i,y. 4 t oznacza rodzaj technologii ICT. Prob. 8
W celu weryfikacji wyników zebranych w Tabeli 3, estymujemy model przestrzennej autoregresji (SAR) oraz model przestrzennego błędu (SEM), odpowiednio dla lat 2000, 2011 oraz 2013. Postaci analityczne odpowiednich modeli można formalnie zapisać, jako: y = X 1,y + X 2,y + y W 1, y + [7], gdzie: 0, =0, oraz y =X 1,y + X 2,y + ƺ [8], lub: y = X 1,y + X 2,y + [ y W 1,y + ] [9], gdzie: =0, ƺ = W 2 +, przyjmując oznaczenia jak w przypadku specyfikacji [6]. W 1,y odpowiada macierzy wag przestrzennych, zaś parametry y oraz y to współczynniki przy zmiennych przestrzennie opóźnionych. Parametr Rho [ ] interpretujemy, jako tzw. parametr przenoszenia, tj. jego wartość wskazuje o ile [%] zmieni się wartość wskaźnika w danym kraju, gdy w krajach sąsiednich poziom ten zmieni się o 1%. Wyniki odpowiednich oszacowań zostały przedstawione w Tabelach 4 (model SAR) oraz 5 (model SEM). Tabela 4. Relacja GDPpc i,y versus ICT i,y,t. Kraje Ameryki Łacińskiej. Lata 2000, 2011, 2013. Model SAR. Wyniki estymacji modelu SAR 2000 [macierz wag odległości geograficznych] R-squared.70 Log Likelihood -30.3.24 [.62] AIC 70.6 Test Breusch-Pagan [Prob] 18.6 [.00] W_LnGDPpc i.2000 [lag coeff.] Rho[ 2000 ].13.64.52 LnFTL i.2000 2.16 3.9.00 LnMCS i.2000.57 1.4.15 LnIU i.2000 -.74-1.9.05 Wyniki estymacji modelu SAR 2011 [macierz wag odległości geograficznych] R-squared.96 Log Likelihood -7.8 1.3 [.24] AIC 25.6 Test Breusch-Pagan [Prob] 1.8 [.60] W_LnGDPpc i.2010 [lag coeff.] Rho[ 2010 ].13 1.24.21 LnFTL i.2010.24.96.33 LnMCS i.2010 1.3 8.4.00 LnIU i.2010.63 2.4.01 Wyniki estymacji modelu SAR 2013 [macierz wag odległości geograficznych] R-squared.98 Log Likelihood -.67 2.8 [.09] AIC 11.3 Test Breusch-Pagan [Prob] 9.1 [.02] W_LnGDPpc i.2013 [lag coeff.] Rho[ 2013 ] -.12-1.8.06 LnFTL i.2013 -.03 -.21.83 LnMCS i.2013 1.06 8.7.00 LnIU i.2013 1.14 6.5.00 Źródło: obliczenia własne. Uwagi: stała modelu oszacowana wyłączona z raportu. Zmienna zależna: LnGDPpc i,y ; zmienne objaśniające: LnFTL i,y, LnMCS i,y, lniu i,y oraz W_LnGDPpc i,y [Rho_y]. 9
Na podstawie wyników zebranych w Tabeli 4, można zauważyć, że każdym roku, wyniki testów na tzw. przestrzenną zależność [spatial dependency] wypadły niepomyślnie [w każdym przypadku prob>0.05], sugerując, że zastosowanie modelu przestrzennego opóźnienia dla analizowanych relacji jest bezzasadne. Wyniki te można potwierdzić, analizując wartości i statystyczne istotności parametru Rho, stojącego przy zmiennej przestrzennie opóźnionej [W_LnGDPpc i,y ], który w każdym roku okazała się być statystycznie nieistotny. Wskazuje to na fakt, iż wprowadzenie do modelu zmiennej opóźnionej przestrzennie, było bezzasadne i nie poddaje się ekonomicznie logicznej interpretacji. Natomiast parametry wskazujące na relację między PKB per capita a MCS i,y oraz IU i,y są dodatnie, i dla lat 2011 oraz 2013, statystycznie istotne, co może sugerować, że proces wdrożenia ICT ma dodatni wpływ na wzrost PKB per capita w badanych krajach Ameryki Łacińskiej. Z trzech analizowanych modeli SAR, model dla roku 2013 wykazuje najwyższe R-squared [.98] i najniższe AIC [11.3] co sugeruje, że w tym roku związki między poziomem PKB per capita a ICT były najsilniejsze, natomiast nie uwarunkowane przestrzennie. Wyniki przedstawione w Tabeli 5, stanowią zestawienie oszacowanych modeli błędu przestrzennego, dla analogicznych relacji, również w latach 2000, 2011 oraz 2013. Tabela 5. Relacja GDPpc i,y versus ICT i,y,t. Kraje Ameryki Łacińskiej. Lata 2000, 2011, 2013.Model SEM. Wyniki estymacji modelu SEM 2000 [macierz wag odległości geograficznych] R-squared.73 Log Likelihood -29.6 1.7 [.19] AIC 67.2 Test Breusch-Pagan [Prob] 18.5 [.00] Lambda [ 2000 ].38 1.7.07 LnFTL i.2000 1.87 4.2.00 LnMCS i.2000.75 2.01.04 LnIU i.2000 -.58-1.75.07 Wyniki estymacji modelu SEM 2011 [macierz wag odległości geograficznych] R-squared.97 Log Likelihood -6.53 3.9 [.04] AIC 21.0 Test Breusch-Pagan [Prob] 4.6 [.19] Lambda [ 2011 ].57 3.4.00 LnFTL i.2011.08.36.71 LnMCS i.2011 1.06 8.3.00 LnIU i.2011.99 3.4.00 Wyniki estymacji modelu SEM 2013 [macierz wag odległości geograficznych] R-squared.98 Log Likelihood 1.63 7.4 [.00] AIC 4.7 Test Breusch-Pagan [Prob] 7.2 [.06] Lambda [ 2013 ].64 4.2.00 LnFTL i.2013 -.18-1.2.19 LnMCS i.2013 1.09 9.8.00 LnIU i.2013 1.3 7.9.00 Źródło: obliczenia własne. Uwagi: stała modelu oszacowana wyłączona z raportu. Zmienna zależna: LnGDPpc i,y ; zmienne objaśniające: LnFTL i,y, LnMCS i,y, lniu i,y oraz Lambda_y. Na podstawie testów dotyczących przestrzennej zależności, można uznać, że zastosowanie podejścia modelowania przestrzennego jest zasadne w przypadku lat 2011 oraz 2013. 10
Wartości parametru [ y ] wykazują w obu latach (2011 oraz 2013) statystyczną istotność, co można interpretować, jako że istnienie przestrzennych autokorelacji jest spowodowane działaniem przypadkowych i niepoddających się modelowaniu czynników, i/lub błędów pomiaru. Oba modele SEM dla lat 2011 oraz 2013 wykazują bardzo wysoki R-squared, przy czym model dla roku 2013 ma znacząco niższą wartość współczynnika kryterium informacyjnego Akaike [4.7], co sugeruje dobrą postać modelu pod względem doboru liczby i jakości zmiennych objaśniających. Podobnie jak w modelach SAR dla lat 2011 oraz 2013, parametry przy zmiennych MCS i,y oraz IU i,y są dodatnie i statystyczne istotne, co może wskazywać, na to, że wdrożenie ICT ma pozytywny i znaczący wpływ na wartość PKB per capita w analizowanych gospodarkach. Poniżej, prezentujemy wyniki analogicznej analizy relacji PKB per capita do wdrożenia ICT w Ameryce Łacińskiej w latach 2000, 2011 oraz 2013, stosując tym razem macierze odległości ekonomicznych do oszacowań odpowiednich modeli przestrzennej autokorelacji oraz błędu przestrzennego. b) Identyfikacja efektów przestrzennych w modelach SAR oraz SEM z przyjęciem macierzy wag odległości ekonomicznych. W poniższej sekcji przeprowadzono analizę zależności między wartością PKB per capita z wdrożeniem ICT, wykorzystując ekonometryczne modele przestrzenne, ale tym razem stosując macierze wag dla odległości ekonomicznych (według wartości PKB per capita w danym roku). Zakładamy jednocześnie, że pomiędzy analizowanymi krajami istnieją znaczne zależności pomiędzy obiektami [krajami] według podobieństwa w poziomie produktu krajowego brutto per capita. Podobnie jak w poprzedniej sekcji, najpierw szacujemy model liniowy, testując jednocześni zasadność podejścia przestrzennego poprzez test na przestrzenną autokorelację reszt modelu liniowego poprzez analizę statystyk globalnych I Morana. W każdym z analizowanych przypadków postacie analityczne wykorzystanych modeli LRM, SAR oraz SEM są analogiczne jak w przypadku stosowania macierzy wag geograficznych w poprzedniej sekcji. Wyniki oszacowań modelów LRM, SAR oraz SEM zostały przedstawione w Tabelach 6-8. Tabela 6. Relacja GDPpc i,y versus ICT i,y,t. Kraje Ameryki Łacińskiej. Lata 2000, 2011, 2013. Model LRM. Wyniki estymacji LRM 2000 [macierz wag odległości ekonomicznych] R-squared.69 Log Likelihood -30.4 Prob [F-stat] 13.1 [.00] AIC 68.9 Vars. t-stat Prob. LnFTL i.2000 2.00 3.6.00 LnMCS i.2000.58 1.3.21 LnIU i.2000 -.69-1.7.10 Test Jarque-Bera [Prob] 2.2 [.32] Breusch-Pagan [Prob] 18.2 [.00] [Diagnostyka zależności przestrzennych Value Prob. Moran`s I [error] n.a. n.a. Lagrange Multiplier [lag].03.85 Lagrange Multiplier [error] 1.9.16 Wyniki estymacji LRM 2011 [macierz wag odległości ekonomicznych] R-squared.96 Log Likelihood -8.5 Prob [F-stat] 165.5 [.00] AIC 25.0 Vars. Coeff. t-stat Prob. LnFTL i.2011.19.68.50 LnMCS i.2011 1.24 7.6.00 LnIU i.2011.72 2.6.01 Test Jarque-Bera [Prob] 4.1 [.12] Breusch-Pagan [Prob] 2.2 [.51] 11
Diagnostyka zależności przestrzennych Value Prob. Moran`s I [error].59.54 Lagrange Multiplier [lag].00.92 Lagrange Multiplier [error].39.52 Wyniki estymacji LRM 2013 [macierz wag odległości ekonomicznych] R-squared.98 Log Likelihood -2.0 Prob [F-stat] 325.5 [.00] AIC 12.1 Vars. Coeff. t-stat Prob. LnFTL i.2013 -.00 -.04.96 LnMCS i.2013 1.1 8.2.00 LnIU i.2013 1.0 5.3.00 Test Jarque-Bera [Prob] 1.4 [.49] Test Breusch-Pagan [Prob] 8.4 [.03] Diagnostyka zależności przestrzennych Value Prob. Moran`s I [error] -.37.70 Lagrange Multiplier [lag].15.69 Lagrange Multiplier [error].85.35 Źródło: obliczenia własne. Uwagi: stała modelu oszacowana wyłączona z raportu. Zmienna zależna: LnGDPpc i,y ; zmienne objaśniające: LnFTL i,y, LnMCS i,y oraz LnMCS i,y. Tabela 7. Relacja GDPpc i,y versus ICT i,y,t. Kraje Ameryki Łacińskiej. Lata 2000, 2011, 2013. Model SAR. Wyniki estymacji modelu SAR 2000 [macierz wag odległości ekonomicznych] R-squared.73 Log Likelihood -29.1 2.6 [.10] AIC 68.3 Test Breusch-Pagan [Prob] 16.0 [.00] W_LnGDPpc i.2000 [lag coeff.] Rho[ 2000 ] -.74-1.15.24 LnFTL i.2000 2.19 4.4.00 LnMCS i.2000.61 1.6.11 LnIU i.2000 -.51-1.3.18 Wyniki estymacji modelu SAR 2011 [macierz wag odległości ekonomicznych] R-squared.96 Log Likelihood -8.5.01 [.91] AIC 27.0 Test Breusch-Pagan [Prob] 2.3 [.50] W_LnGDPpc i.2010 [lag coeff.] Rho[ 2010 ] -.02 -.11.91 LnFTL i.2010.20.74.45 LnMCS i.2010 1.2 6.8.00 LnIU i.2010.73 2.8.00 Wyniki estymacji modelu SAR 2013 [macierz wag odległości ekonomicznych] R-squared.98 Log Likelihood -1.9.15 [.69] AIC 13.9 Test Breusch-Pagan [Prob] 7.9 [.04] W_LnGDPpc i.2013 [lag coeff.] Rho[ 2013 ].04.40.68 LnFTL i.2013 -.04 -.22.82 LnMCS i.2013 1.1 8.1.00 LnIU i.2013 1.0 5.6.00 12
Źródło: obliczenia własne. Uwagi: stała modelu oszacowana wyłączona z raportu. Zmienna zależna: LnGDPpc i,y ; zmienne objaśniające: LnFTL i,y, LnMCS i,y, lniu i,y oraz W_LnGDPpc i,y [Rho_y]. Tabela 8. Relacja GDPpc i,y versus ICT i,y,t. Kraje Ameryki Łacińskiej. Lata 2000, 2011, 2013. Model SEM. Wyniki estymacji modelu SEM 2000 [macierz wag odległości ekonomicznych] R-squared.34 Log Likelihood -28.4 4.0 [.04] AIC 64.8 Test Breusch-Pagan [Prob] 23.7 [.00] Lambda [ 2000 ] 4.6 3.1.00 LnFTL i.2000 1.1 1.7.07 LnMCS i.2000 1.2 2.9.00 LnIU i.2000 -.79-1.7.07 Wyniki estymacji modelu SEM 2011 [macierz wag odległości ekonomicznych] R-squared.96 Log Likelihood -8.0 1.0 [.31] AIC 24.0 Test Breusch-Pagan [Prob] 2.3 [.05] Lambda [ 2011 ] -.94-1.1.26 LnFTL i.2011.18.72.46 LnMCS i.2011 1.2 8.4.00 LnIU i.2011.72 2.9.00 Wyniki estymacji modelu SEM 2013 [macierz wag odległości ekonomicznych] R-squared.98 Log Likelihood -.79 2.5 [.10] AIC 9.6 Test Breusch-Pagan [Prob] 8.5 [.03] Lambda [ 2013 ] -.45 -.82.41 LnFTL i.2013 -.01 -.09.92 LnMCS i.2013 1.1 9.6.00 LnIU i.2013 1.0 6.1.00 Źródło: obliczenia własne. Uwagi: stała modelu oszacowana wyłączona z raportu. Zmienna zależna: LnGDPpc i,y ; zmienne objaśniające: LnFTL i,y, LnMCS i,y, lniu i,y oraz Lambda_y. Przedstawione w Tabeli 6, wyniki oszacowań modelu LRM wskazują na ich relatywnie dobre dopasowanie do danych empirycznych, natomiast z analizy potencjalnych zależności przestrzennych wynika (patrz: odpowiednie statystyki I Morana), że w badanym przypadku stosowanie modeli przestrzennych (SAR i/lub SEM) nie jest zasadne. Aby potwierdzić powyższe, szacujemy odpowiednie modele SAR i SEM dla badanych zależności w latach 2000, 2011 oraz 2013. Oszacowane modele błędu przestrzennego SAR 2000, SAR 2011 oraz SAR 2013, wskazują na statystyczną nieistotność składnika opóźnionego przestrzennie, tj. W_LnGDPpc i,y. Oznacza to, że w przypadku badanych obiektów odległość tutaj raczej rozumiana, jako zróżnicowanie pod względem poziomu rozwoju gospodarczego, ekonomiczna nie jest istotnym czynnikiem determinującym zależności pomiędzy analizowanymi zmiennymi, czyli poziomem PKB per capita i wdrożeniem ICT. Oznacza to również, że wprowadzenie do szacowanym modeli współczynnika przestrzennie opóźnionego było bezzasadne, nie poddaje się ekonomicznej interpretacji, co z kolei potwierdza wyniki diagnostyki statystyk zależności przestrzennych I Morana prezentowanych w Tabeli 6. Oszacowane parametry dla MCS i,y oraz IU i,y dla modeli SAR 2011 oraz SAR 2013 13
wskazują na dodatnią relację między tymi zmiennymi i wartością PKB per capita, co jest logicznie zbieżne z wynikami analogicznych oszacowań ale dla modeli z przyjętymi macierzami wag odległości geograficznych. Natomiast wyniki oszacowań modeli błędu przestrzennego, wskazują na zasadność podejścia przestrzennego do analizy danych empirycznych, jedynie w roku 2000. Z oszacowań dla roku 2000, wynika, że danym przypadku występuje istotna autokorelacja przestrzenna składnika losowego, co daje podstawy do przypuszczeń, że relacje między badanymi w modelu zmiennymi są determinowane działaniem przypadkowych i niepoddających się modelowaniu czynników. W dwóch kolejnych badanych latach 2011 oraz 2013, na podstawie współczynnika Lambda, można uznać, że stosowanie modeli SEM nie znajduje uzasadnienia, jako że dla danego współczynnika Lambda wartości prob>0.05. Oszacowania 6 modeli przestrzennych SAR 2000, SAR 2011, SAR 2013, SEM 2000, SEM 2011 oraz SEM 2013, wskazują jednoznacznie, że danym przypadku tj. analizie ilościowej zależności przestrzennych pomiędzy krajami Ameryki Łacińskiej dla zmiennych GDP i,y(pc), IU i,y oraz MCS i,y, stosowanie podejścia przestrzennego nie znajdowało uzasadnienia w 5 na 6 przypadków. 5. Podsumowanie. Zasadniczym celem artykułu była ocena zasadności zastosowania ekonometrycznych modeli przestrzennej autokorelacji oraz błędu przestrzennego do analizy zależności między poziomem PKB per capita a wdrożeniem ICT w 24 gospodarkach Ameryki Łacińskiej w latach 2000-2013. Analizę przeprowadzono dla lat 2000, 2011 oraz 2013, stosując dwa podejścia:, tj. wykorzystując z modelach SAR i SEM macierze wag geograficznych przyjmując założenie, że kierunek i siła zależności między badanymi zmiennymi jest determinowana odległością geograficzną między poszczególnymi krajami [czyli ich rozmieszczeniem w przestrzeni], oraz wykorzystując macierze wag ekonomicznych zakładając, że analizowane relacje są uwarunkowane zróżnicowaniem ekonomicznym gospodarek. Przeprowadzona w początkowym etapie badań, analiza globalnych statystyk I Morana, przy zastosowaniu macierzy wag odległości geograficznych, wskazują na brak przestrzennej autokorelacji dla wybranych zmiennych [wyjątkiem jest zmienna IU i,y w roku 2013]. Natomiast, przy zastosowaniu macierzy wag ekonomicznych, globalne statystyki I Morana wskazują na istnienie przestrzennej autokorelacji. Powyższe wyniki, nie zostały jednak potwierdzone, przy zastosowaniu odpowiednio modeli SAR i SEM, zarówno dla macierzy wag odległości geograficznych i ekonomicznych. W większości analizowanych przypadków, oszacowania parametrów Rho dla modeli SAR, oraz Lambda dla modeli SEM, wskazywały na to, że badane relacje PKB per capita versus ICT, nie są uwarunkowane lokalizacją analizowanych krajów. Można, więc uznać, że w przypadku analizy relacji potencjalnego wpływu ICT na poziom PKB per capita nie jest uwarunkowany przestrzennie, natomiast siła i kierunek owych relacji poddają się innych niż lokalizacja, czynnikom. Referencje: 1. Anselin L.(1988. Lagrange Multiplier Test Diagnostics for Spatial Dependence and Spatial Heterogeneity, Geographical Analysis, 20. 2. Anselin L. (1988), Spatial Econometrics: Method and Models, Kluwer Academic Publishers, Netherlands. 3. Anselin L., Florax R. J. G. M., Rey, S. J. (2004), Advances in Spatial Econometrics. Methodology, Tools and Applications, Springer-Verlag, Berlin. 14
4. Arbia G. (2006), Spatial Econometrics, Springer-Verlag GmbH. 5. Baltagi B. H. (2005). Econometrics analysis of panel data. John Wiley & Sons. New York. 6. Bivand R. (1981), Modelowanie geograficznych układów czasoprzestrzennych, PWN, Warszawa-Poznan 7. Bivand, R., S., Pebesma, E. J., Gómez-Rubio, V. (2008), Applied Spatial Data Analysies with R, Springer, New York. 8. Burridge P., (1980), On the Cliff Ord Test for Spatial Correlation, Journal of the Royal Statistical Society, B, 42 (1), 107 108. 9. Clif A., Ord J. (1973), Apatial Autocorrelation, Pion, London. 10. Fujita M., Krugman P. R.(2001). Venables A. J., The Spatial Economy: Cities, Regions and International Trade, The mit Press, Cambridge. 11. Geary R. (1954), The contiguity ratio and statistical mapping, TEhe Incorporated Statistician, 5, s. 115-145. 12. Getis A., Mur, J. Zoller, H. (2004), Spatial Econometrics and Spatial Statistics, Palgrave Macmillan. 13. Haining R. P. (2005), Spatial Data Analysis. Theory and Practice, Cambridge University Press, 3rd ed., Cambridge. 14. Janc, K. (2007). Wpływ kapitału ludzkiego na efektywność gospodarek lokalnych w Polsce przykład zastosowania regresji przestrzennej,[w:] P. Brezdeń, S. Grykień (red.). Od lokalnego do globalnego wymiaru gospodarowania przestrzenią nowe jakości przestrzeni społeczno-ekonomicznej, 89-99. 15. Klaassen J. H. P., Paelinck L. H., Wagenaar S. (1982), Systemy przestrzenne, PWN, Warszawa 16. Kopczewska K. (2006), Ekonometria i statystyka przestrzenna, CeDeWu, Warszawa. 17. Kossowski T. (2009). Konwergencja przestrzenna aspekty teoretyczne. Biuletyn Instytutu Geografii Społeczno Ekonomicznej i Gospodarki Przestrzennej Uniwersytetu im. Adama Mickiewicza w Poznaniu, Seria Rozwój Regionalny i Polityka Regionalna, 8, 7-20. 18. LeSage J.P., Pace R. K. (2009), Introduction to Spatial Econometrics, CRC Press. 19. Moran P. (1948), The interpretation of statistical maps, Journal of the Royal Statistical Society, Series B,10, s. 243-251. 20. Olejnik, A. (2013). Wybrane metody testowania modeli regresji przestrzennej. Przegląd Statystyczny, 60(3), 381-393. 21. Pietrzak M. (2010), Problem identyfikacji struktury danych przestrzennych, Acta Universitatis Nicolai Copernici, Ekonomia XLI, Wydawnictwo UMK. 22. Pietrzykowski R.(2010). Przestrzenna ujęcie rynku nieruchomości mieszkaniowych w latach 2007 2010. Zeszyty Naukowe Uniwersytetu Szczecińskiego. Finanse. Rynki Finansowe. Ubezpieczenia 2010, nr 616 (29) 23. Pietrzykowski R., Wicki L. (2011). Regional differentiation in absorption of CAP funds on agri-environmental programmes in Poland, 2011, Economic Science for Rural Development. Proceedings of the International Scientific Conference 2011, nr 26. 24. Suchecki B. (2010), Ekonometria przestrzenna. Metody i modele analizy danych przestrzennych, Wydawnictwo C.H.Beck, Warszawa 25. Szulc E. (2007), Ekonometryczna analiza wielowymiarowych procesów gospodarczych, Wydawnictwo UMK, Toruń 2007. 26. Tobler W.R. (1970). A Computer Movie Simulating Urban Growth in the Detroit Region. Economic Geography, Vol. 46, Supplement: Proceedings. International Geographical Union. Commission on Quantitative Methods (Jun., 1970), pp. 234-240 27. Zelias A. (red) (1991), Ekonometria przestrzenna, PWE, Warszawa. 15
16