Zjawisko autokorelacji przestrzennej na przykładzie statystyki I



Podobne dokumenty
INFRASTRUKTURA I EKOLOGIA TERENÓW WIEJSKICH INFRASTRUCTURE AND ECOLOGY OF RURAL AREAS

WPŁYW KAPITAŁU LUDZKIEGO NA EFEKTYWNOŚĆ GOSPODAREK LOKALNYCH W POLSCE - PRZYKŁAD ZASTOSOWANIA REGRESJI PRZESTRZENNEJ 1

PRZESTRZENNA ANALIZA AKTYWNOŚCI PLANISTYCZNEJ GMIN WOJEWÓDZTWA MAŁOPOLSKIEGO

WYKORZYSTANIE NARZĘDZI STATYSTYKI PRZESTRZENNEJ DO IDENTYFIKACJI KLUCZOWYCH OŚRODKÓW ROZWOJU WOJEWÓDZTWA KUJAWSKO-POMORSKIEGO*

Ćwiczenie 2 GEODA i5 ogólne informacje i obliczanie statystyki Morana

Iwona Müller-Frączek, Michał Bernard Pietrzak

AUTOKORELACJA PRZESTRZENNA WYKORZYSTANIA POZABUDŻETOWYCH ŚRODKÓW W GMINACH WOJEWÓDZTWA MAŁOPOLSKIEGO SYSTEMS IT FOR AGRICULTURAL BUSINESSES

Wprowadzenie do analizy korelacji i regresji

KONCEPCJA I ZASTOSOWANIE MODYFIKACJI MACIERZY WAG W PRZESTRZENNYCH BADANIACH EKONOMICZNYCH

Ćwiczenie 2 GEODA i5 ogólne informacje i obliczanie statystyki Morana

WYKORZYSTANIE METOD STATYSTYCZNEJ ANALIZY PRZESTRZENNEJ W BADANIACH EKONOMICZNYCH

Analiza zależności przestrzennych między wdrożeniem ICT a poziomem PKB per capita w krajach Ameryki Łacińskiej w latach

Ocena spójności terytorialnej pod względem infrastruktury technicznej obszarów wiejskich w porównaniu z miastami

WPŁYW WYBORU METODY KLASYFIKACJI NA IDENTYFIKACJĘ ZALEŻNOŚCI PRZESTRZENNYCH ZASTOSOWANIE TESTU JOIN-COUNT

WPŁYW WYBORU METODY KLASYFIKACJI NA IDENTYFIKACJĘ ZALEŻNOŚCI PRZESTRZENNYCH ZASTOSOWANIE TESTU JOIN-COUNT

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

Wykorzystanie przestrzennego modelu regresji przełącznikowej w analizie stopy bezrobocia dla Polski

Modele Markowa w analizie dynamiki zróżnicowania regionalnego dochodu w krajach UE

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

MODELOWANIE PRZESTRZENNE CHARAKTERYSTYK RYNKU PRACY

WYKORZYSTANIE ODLEGŁOŚCI EKONOMICZNEJ W PRZESTRZENNEJ ANALIZIE STOPY BEZROBOCIA DLA POLSKI

Kilka uwag o testowaniu istotności współczynnika korelacji

INFRASTRUKTURA I EKOLOGIA TERENÓW WIEJSKICH INFRASTRUCTURE AND ECOLOGY OF RURAL AREAS

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

PROBLEM IDENTYFIKACJI STRUKTURY DANYCH PRZESTRZENNYCH

ANALIZA STRUKTURY EKONOMICZNYCH PROCESÓW PRZESTRZENNYCH NA PRZYKŁADZIE PKB W WYBRANYCH KRAJACH EUROPEJSKICH

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Metody Ilościowe w Socjologii

Mieczysław Kowerski. Program Polska-Białoruś-Ukraina narzędziem konwergencji gospodarczej województwa lubelskiego

Radosław Cellmer Analiza zjawiska autokorelacji przestrzennej cen transakcyjnych na rynku nieruchomości lokalowych

O ZASTOSOWANIU METOD PLANOWANIA EKSPERYMENTÓW W ANALIZIE DANYCH PRZESTRZENNYCH

PRZESTRZENNY MODEL PANELOWY DLA NAKŁADÓW NADZIAŁALNOŚĆ INNOWACYJNĄ PRZEDSIĘBIORSTW PRZEMYSŁOWYCH W POLSCE W LATACH

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Testy post-hoc. Wrocław, 6 czerwca 2016

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Ekonometryczne modele nieliniowe

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

OeconomiA copernicana. Iwona Müller-Frączek, Michał Bernard Pietrzak Uniwersytet Mikołaja Kopernika w Toruniu

Własności statystyczne regresji liniowej. Wykład 4

Metoda Johansena objaśnienia i przykłady

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

Analiza korespondencji

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Institute of Economic Research Working Papers. No. 21/2014

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Ekonometria. Zajęcia

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

DWUETAPOWA PROCEDURA BUDOWY PRZESTRZENNEJ MACIERZY WAG Z UWZGLĘDNIENIEM ODLEGŁOŚCI EKONOMICZNEJ

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Potencjał demograficzny a poziom rozwoju gospodarczego podregionów w Polsce w okresie

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

W1. Wprowadzenie. Statystyka opisowa

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Ekonometria_FIRJK Arkusz1

PODAŻ CIĄGNIKÓW I KOMBAJNÓW ZBOŻOWYCH W POLSCE W LATACH

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

OGŁOSZENIE O ZAMÓWIENIU nr 1/2013 (POWYŻEJ 14 tys. EURO)

MODELE LINIOWE. Dr Wioleta Drobik

Analiza autokorelacji

UKŁAD TERYTORIALNY I CECHY AGLOMERACJI A PRODUKTYWNOŚĆ W GOSPODARCE MIAST I REGIONÓW

Hierarchiczna analiza skupień

Etapy modelowania ekonometrycznego

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Rozdział 8. Regresja. Definiowanie modelu

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

STATYSTYKA MATEMATYCZNA

Zmienne zależne i niezależne

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

STATYSTYKA MATEMATYCZNA

Lokalne naśladownictwo podatkowe czy naśladownictwo w opłatach za lokalne usługi publiczne?

PRZESTRZENNA ANALIZA ZRÓŻNICOWANIA REGIONALNEGO WOJEWÓDZTW W POLSCE ZE WZGLĘDU NA POZIOM NAWOŻENIA

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

PRZEWODNIK PO PRZEDMIOCIE

Michał Kusy, StatSoft Polska Sp. z o.o.

XIII PODLASKIE FORUM GIS Rok mapy zderzenie tradycji z przyszłością Supraśl 2016

wersja elektroniczna - ibuk

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

METODY STATYSTYCZNE W BIOLOGII

Metody ekonometrii przestrzennej w analizie konwergencji gospodarczej regionów Unii Europejskiej

KORELACJE I REGRESJA LINIOWA

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze

Elementy statystyki wielowymiarowej

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ekonomicznych w rolnictwie

Pokój z widokiem: hedoniczne modele cen mieszkań. dr hab. Emilia Tomczyk Instytut Ekonometrii SGH

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Metody analizy przestrzennej. Liczba godzin stacjonarne: Wykłady: 30 Ćwiczenia: 30. niestacjonarne: Wykłady: 18 Ćwiczenia: 18

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO ANALIZA ZBIEŻNOŚCI STRUKTUR ZATRUDNIENIA W WYBRANYCH KRAJACH WYSOKOROZWINIĘTYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna i ekonometria

Transkrypt:

Źródło: Janc K., 2006, Zjawisko autokorelacji przestrzennej na przykładzie statystyki I Morana oraz lokalnych wskaźników zależności przestrzennej (LISA) wybrane zagadnienia metodyczne (w:) Komornicki T., Podgórski Z. (red.), Idee i praktyczny uniwersalizm geografii, Dokumentacja Geograficzna, nr 33, IGiPZ PAN, Warszawa, s. 76-83. Krzysztof Janc Zakład Zagospodarowania Przestrzennego, Instytut Geografii i Rozwoju Regionalnego Uniwersytet Wrocławski Kuźnicza 49/55, 50-138 Wrocław janck@wp.pl Zjawisko autokorelacji przestrzennej na przykładzie statystyki I Morana oraz lokalnych wskaźników zależności przestrzennej (LISA). Wybrane zagadnienia metodyczne. 1 Streszczenie Celem artykułu jest przedstawienie statystyki I Morana służącej określeniu siły i charakteru autokorelacji przestrzennej oraz opartych na niej lokalnych wskaźników zależności przestrzennej. Dodatkowo pokazano możliwość ich zastosowania w analizach zjawisk społeczno-ekonomicznych. W tym celu zbadano zróżnicowanie regionalne Europy względem wartości Produktu Krajowego Brutto. Analizę PKB przeprowadzono dla 257 regionów (NUTS 2) 27 europejskich państw. Na podstawie analizy wskaźników autokorelacji przestrzennej można stwierdzić, że mogą one być bardzo przydatne w geografii społecznoekonomicznej. Abstract The main aim of the paper is to show one of the spatial autocorrelation measure - Moran s I statistic, and local indicators of spatial association. An additional aim is to show the possibility of applying spatial autocorrelation statistics in analysis of socio-economic phenomena based on Gross Domestic Product example. Analysis of GDP was carried out based on 257 regions (NUTS 2) from 27 European states. Based on spatial autocorrelation statistics analysis one can conclude that these measures are very useful in economic geography. Słowa kluczowe autokorelacja przestrzenna, statystyka I Morana, LISA, Produkt Krajowy Brutto Key words spatial autocorrelation, Moran s I statistic, LISA, Gross Domestic Product Wstęp Autokorelacja przestrzenna jest sytuacją, w której...występowanie jednego zjawiska w jednej jednostce przestrzennej powoduje zwiększanie się lub zmniejszanie prawdopodobieństwa występowania tego zjawiska w sąsiednich jednostkach (Bivand, 1980). Zjawisko autokorelacji należy powiązać z tzw. Pierwszym Prawem Geografii Toblera, który w 1970 roku stwierdził, że...[w przestrzeni] wszystko jest związane ze wszystkim innym, przy czym bliższe rzeczy są bardziej związane niż rzeczy odległe (Miller, 2004). Zjawisko autokorelacji przestrzennej jest więc konsekwencją występowania zależności przestrzennej (spatial dependency). Wymienić należy dwie główne przyczyny występowania zjawiska zależności przestrzennej. Po pierwsze - dane analizowane w badaniach przestrzennych są ściśle związane z jednostkami odniesienia (regiony, powiaty, gminy, 1 Praca naukowa finansowana ze środków budżetowych na naukę w latach 2005-2007 jako część projektu badawczego Zróżnicowanie przestrzenne kapitału ludzkiego w Polsce (grant 2 PO4E 032 28).

regiony kodowe itd.). Takie przyporządkowanie nie odzwierciedla dokładnie natury większości zjawisk, gdyż granice istniejące tylko na mapie nie są zazwyczaj ogranicznikami ludzkiej aktywności. Drugą przyczyną jest fakt, że przestrzenny wymiar społecznoekonomicznej działalności ludzi jest w znacznym stopniu kształtowany przez dystans i lokalizacje, co przejawia się w znanych w geografii teoriach i koncepcjach takich jak: dyfuzja innowacji i postaw, hierarchia miejsc, bieguny wzrostu (LeSage, 1999). Zjawisko autokorelacji przestrzennej jest więc niezwykle istotne w analizie danych przestrzennych. Zagadnienie to jest integralną częścią grupy metod ilościowych wchodzących w zakres analizy przestrzennej (spatial analysis). W analizie przestrzennej można wyróżnić dwie dziedziny zainteresowań: ekonometrię przestrzenną oraz statystykę przestrzenną. Ekonometria przestrzenna, której rozwój datuje się od momentu ukazania pierwszej monografii poświęconej temu zjawisku napisanej przez Paelnicka i Klaassena (1983), zajmuje się specyfikacją, estymacją, weryfikacją modeli współzależności z uwzględnieniem komponentu przestrzennego (modelowanie przestrzenne). Od końca lat osiemdziesiątych obserwowany jest żywiołowy rozwój ekonometrii przestrzennej, związany głównie ze sposobami estymacji i specyfikacji modeli przestrzennych oraz testami służącymi wykryciu autokorelacji przestrzennej, jej rodzaju, dopasowania modeli (m.in. Anselin, 1988;2002; Anselin, Bera, 1998; LeSage, 1999; Smirnov, Anselin, 2001). Statystyka przestrzenna służy identyfikacji wzorców zależności przestrzennej oraz przestrzennej heterogeniczności. Stosuje się w tym celu globalne i lokalne miary autokorelacji przestrzennej. Należy podkreślić, że ekonometria przestrzenna i statystyka przestrzenna są ze sobą ściśle związane i zazwyczaj uzupełniają się podczas procesu badawczego. Jak podkreśla Fortheringham (1997) analiza przestrzenna pozwala na lepsze zrozumienie przez geografów procesów przestrzennych. Na istotność zależności przestrzennej i możliwości określenia autokorelacji przestrzennej w polskiej literaturze geograficznej zwracali uwagę m.in. Bivand (1980), Czyż (1978) i Ratajczak (1980). Niewielkie możliwości zastosowania w praktyce statystyk autokorelacji przestrzennej, wynikające ze skomplikowanej i czasochłonnej procedury obliczeniowej, spowodowały brak szerszego nimi zainteresowania. Współcześnie, gdy możliwości obliczeniowe komputerów są bardzo duże oraz powszechnie stosowane są metody GIS, możliwym stało się obliczenia statystyk autokorelacji przestrzennej z dużą dokładnością nawet dla bardzo dużych zbiorów jednostek przestrzennych. Celem artykułu jest przybliżenie jednej z miar służącej określeniu autokorelacji przestrzennej wraz z lokalnymi wskaźnikami zależności przestrzennej opartymi na niej. Ponadto pokazano możliwości ich praktycznego zastosowania do analiz przestrzennych w geografii społecznoekonomicznej. Możliwość wykorzystania miar autokorelacji przestrzennej ukazano na przykładzie analizy zróżnicowania wartości Produktu Krajowego Brutto dla regionów (NUTS 2) 27 krajów europejskich 25 należących do Unii Europejskiej i 2, które prawdopodobnie dołączą do niej (Rumunia i Bułgaria). W pracy do obliczenia statystyk autokorelacji przestrzennej oraz lokalnych wskaźników zależności przestrzennej wykorzystano oprogramowanie GeoDa TM 0.9.5-i. Statystyka I Morana oraz lokalne wskaźniki zależności przestrzennej Jakiekolwiek analizy uwzględniające zjawisko zależności przestrzennej wymagają określenia tzw. wag przestrzennych. Wagi przestrzenne reprezentują relacje przestrzenne zapisane za pomocą grafu lub macierzy. W przypadku zapisu macierzowego najpierw tworzy się macierz sąsiedztwa, w której zapisane są relacje pomiędzy jej elementami (gdzie i=1,2,...,n; j=1,2,...,n). Macierz sąsiedztwa pomiędzy i a j jest macierzą składającą się z wartości binarnych. Wartość 0 oznacza brak sąsiedztwa pomiędzy i a j, zaś wartość 1 przyznaje się dla elementu spełniającego warunek sąsiedztwa. Najczęściej wagi uzyskuje się poprzez

standaryzację macierzy sąsiedztwa. Wagi przestrzenne można określić w następujący sposób (Anselin, Bera, 1998): - określenie styczności wspólna granica wyrażona przez styczność liniową lub punktową; - określenie dystansu odległość fizyczna, liczba k-najbliższych sąsiadów; - inne np. dystans społeczny, ekonomiczny. W przypadku wag bazujących na styczności można określić rząd tej wagi. I tak wagi pierwszego rzędu uwzględniają wszystkie jednostki j posiadają styczne punkty lub linie z i. Wagi drugiego rzędu zawierają również jednostki styczne do sąsiadów i. Wagi oparte o dystansie fizycznym uwzględniają wszystkie jednostki mieszczące się w założonym zakresie odległości od i. Specyficzną ich odmianą są wagi uwzględniające k-najbliższych sąsiadów, w których liczba jednostek otoczenia jest dla każdej jednostki taka sama. Macierz jest standaryzowana przez wiersze, tak aby suma w każdym wierszu równała się 1. W przypadku wag opartych na k-najbliższych sąsiadów standaryzacja przebiega podobnie, przy czym jednostki wagi są zawsze takie same dla danej liczby sąsiadów np. dla 4- najbliższych sąsiadów wszystkie jednostki mają wagę 0,25, dla 5-najbliższych sąsiadów zawsze 0,2. Wybór wag zależy od natury problemu oraz od dodatkowych, nieuwzględnionych w zbiorze danych informacji znajomość lokalnych realiów (LeSage, 1999). Dobór wag w dużym stopniu wpływa na uzyskane wyniki. Brak jest ogólnie przyjętych wytycznych, w jakich przypadkach należy stosować poszczególne rodzaje wag. Getis i Altstadt (2004) podają jednak kilka reguł pomocnych przy konstruowaniu macierzy wag: powinno się preferować jak najmniej skomplikowane rodzaje wag (np. styczność pierwszego rzędu zamiast styczności wyższego rzędu); korzystniejsze jest stosowania macierzy niedoszacowanej (mniej sąsiadów) niż przeszacowanej (dodatkowi sąsiedzi); powinno się analizować relatywnie dużą liczbę jednostek przestrzennych (powyżej 60). Jak podają Abreu i inni (2005) w badaniach nad wzrostem ekonomicznym najpopularniejsze są macierze bazujące na styczności - 38% ogółu stosowanych wag. Jedną z powszechnie stosowanych miar służących określeniu siły i charakteru autokorelacji przestrzennej jest statystyka I Morana 2 : I ij n i= 1 j= 1 = n gdzie: w - waga połączeń pomiędzy jednostką i a j; ij W n n w ( x x)( x i= 1 i ( x x) i 2 j x) W - macierz wag (suma wszystkich jej elementów); x, - wartości zmiennych w jednostce przestrzennej i oraz j; i x j x - średnia arytmetyczna wartości zmiennej dla wszystkich jednostek. Statystyka Morana może przybierać dwie postacie w zależności od przyjętego założenia normalności bądź randomizacji. Stąd też momenty do testowania hipotezy zerowej oblicza się przy założeniu normalności bądź randomizacji (Bivand, 1980). Wartość statystyki Morana mieści się w zakresie od -1 do 1. Wartość 0 oznacza brak autokorelacji, ujemne wartości 2 Do innych statystyk służących określeniu autokorelacji przestrzennej zalicza się: statystykę c Geary ego; * statystykę J.C. (join-count), statystyki G i G, statystykę O (zob. Ratajczak, 1980; Ludwiczak 1991; Florax, Nijkamp, 2003; Kopczewska, 2006).

ujemną autokorelację, co oznacza występowanie różnych wartości koło siebie. Zróżnicowanie przestrzenne, jakie uzyskano by z przedstawienia zjawiska o dużej ujemnej autokorelacji, przypominałoby więc układ szachownicy. Wartości dodatnie oznaczają dodatnią autokorelację, czyli występowanie podobnych wartości koło siebie. Oznacza to, iż mamy do czynienia ze skupiskami (klastrami) przestrzennymi. Należy podkreślić, że podobieństwo lub niepodobieństwo pomiędzy jednostkami rozpatrywane jest w aspekcie wysokich bądź niskich wartości. Wartości wysokie, niskie określane są po uprzedniej standaryzacji względem średniej wartości. Statystyki służące określeniu autokorelacji przestrzennej mogą być wykorzystywane do identyfikacji układów przestrzennych. W tym celu stosuje się lokalne wskaźniki zależności przestrzennej. W powszechnym użyciu znalazł się akronim LISA (Local Indicators of Spatial Association) zaproponowany przez Anselina (1995). Proponuje on, aby mianem LISA określano każdą statystykę spełniającą następujące kryteria: LISA dla każdej obserwacji wskazują na stopień znaczenia przestrzennej koncentracji podobnych wartości wokół analizowanej obserwacji (jednostki przestrzennej); suma LISA dla wszystkich obserwacji jest proporcjonalna do globalnego wskaźnika przestrzennej zależności. LISA umożliwiają więc określenie podobieństwa jednostki przestrzennej względem sąsiadów oraz istotność statystyczną tego związku. Jako lokalne wskaźniki zależności przestrzennej można stosować * lokalne wersje statystyki I Morana, G i G, c Geary ego (Anselin, 1995; Ord, Getis, 1995;2001; Kopczewska, 2006). W artykule jako LISA wykorzystano statystykę I Morana. Stąd też można użyć określenia lokalnej statystyki Morana w przypadku LISA, w odróżnieniu od globalnej statystki Morana określającej autokorelację przestrzenna dla całego zbioru jednostek. W wyniku zastosowania LISA, opartych na statystyce Morana, otrzymuje się dla każdej jednostki przestrzennej jedno z 5 możliwych rozwiązań: 1. Jednostka z wysoką wartością z sąsiadami o podobnej wartości (hot spot). 2. Jednostka z niską wartością z sąsiadami o podobnej wartości (cold spot). 3. Jednostka z wysoką wartością z sąsiadami o niskiej wartości potencjalna jednostka odstająca (outlier). 4. Jednostka z niską wartością potencjalna z sąsiadami o wysokiej wartości potencjalna jednostka odstająca (outlier). 5. Jednostka bez istotnej statystycznie lokalnej autokorelacji. Jak zauważono wcześniej, to czy jednostka przybiera wysokie lub niskie wartości zależy od średniej, stąd też w tak wyodrębnionych skupiskach nie tyle istotny jest rozstęp pomiędzy wartościami, co pewna homogeniczność struktur przestrzennych. Uzyskuje się w ten sposób swoistego rodzaju typologię jednostek względem rodzaju i istotności statystycznej występujących zależności przestrzennych. Z powyższego wynika, że LISA są jedną z procedur, umożliwiających pomiar zróżnicowań lokalnych. Według Fotheringhama (1997; 2000) w geografii ilościowej można wyróżnić cztery główne dziedziny badań (technik statystycznych) odnoszące się do związków przestrzennych z uwzględnieniem lokalnych zróżnicowań. Są to: punktowe analizy lokalnych wzorców (m.in. Automaty Analizy Geograficznej Geographical Analysis Machine - GAM); lokalne miary jednozmiennych zależności przestrzennych (LISA); lokalne miary wielozmiennych zależności przestrzennych (m.in. Geograficznie Ważona Regresji Geographically Weighted Regression - GWR); matematyczne modele przepływów. GAM (stosowane głównie do zjawisk punktowych), bazując na różnego rodzaju algorytmach, umożliwia wykrycie skupisk przestrzennych poprzez pokrycie obszaru kołami (lub owalami) o różnych rozmiarach i porównywaniu wartości zmiennej w ich granicach (Conley i inni, 2005). Warto podkreślić, że w odróżnieniu od GAM, LISA sprawdzają się lepiej w przypadku dużych zbiorów danych. GWR jest metodą rozszerzającą tradycyjne modele regresji. Zakładając większy wpływ jednostek bliżej położonych niż bardziej odległych od pewnego

punktu, kalibruje się model, tak aby obszar lokalnego wpływu pozwalał uzyskać najlepiej dopasowany model (Brunsdon i inni, 1998). Metoda ta jest najodpowiedniejsza dla złożonych i dużych zbiorów danych, i w odróżnieniu od LISA, pozwala określić poziom zróżnicowań lokalnych dla wielu zmiennych. Matematyczne modele przepływów używane są głównie do analiz migracji, wyboru miejsca zamieszkania i innych zachowań ludności, poprzez estymacje parametrów odpowiednich modeli matematycznych (Fortheringham, 1997). Głównymi więc cechami odróżniającymi te modele od LISA, jest położenie akcentu, na określeniu w jaki sposób ludzie dokonują wyboru pomiędzy alternatywnymi możliwościami w przestrzeni oraz zastosowanie ściśle sformalizowanych matematycznych modeli tych zachowań. Przykład zastosowania statystyk zależności przestrzennej PKB w Europie Do zobrazowania możliwości wykorzystania miary autokorelacji przestrzennej postanowiono zbadać zróżnicowanie regionalne wartość PKB według parytetu siły nabywczej na jednego mieszkańca w odniesieniu do średniej unijnej dla roku 1998 i 2002. Statystyki I Morana obliczono na podstawie macierzy wag bazujących na styczności (pierwszego i drugiego rzędu) oraz różnej liczbie k-najbliższych sąsiadów (tab. 1). Tab. 1. Autokorelacja przestrzenna dla PKB w regionach Europy na podstawie statystyki I Morana w roku 1998 i 2002. Tab 1. Spatial autocorrelation of GBP in European regions based on Moran I statistic for year 1998 and 2002. WAGA 1998 2002 styczność 1 rzędu 0,58 0,53 styczność 2 rzędu 0,53 0,49 5 sąsiadów 0,57 0,52 10 sąsiadów 0,54 0,49 15 sąsiadów 0,50 0,45 20 sąsiadów 0,48 0,44 Źródło: Opracowanie własne na podstawie Bazy Danych EUROSTAT.. Source: Author s own study based on EUROSTAT Database. Dla obu lat występuje wyraźna autokorelacja przestrzenna. Ma ona charakter dodatni, czyli w analizowanym przypadku występuje tendencja do skupiania się jednostek o podobnej wartości PKB w sąsiedztwie. Spadek wartości wskaźnika autokorelacji przestrzennej pomiędzy 1998 a 2002 rokiem informuje o zachodzącym procesie dywergencji. Spadek ten oznacza, że nastąpiło osłabienia zależności przestrzennej. Uwzględniając krótki odstęp czasu (4 lata) zmniejszenie się zależności przestrzennej nie może być duży, jednak świadczy o wyraźnej tendencji. Dla obu lat wraz ze wzrostem dystansu spada wartość autokorelacji przestrzennej. Jest to potwierdzeniem faktu, wpływu odległości na kształtowanie się zależności przestrzennej. Charakterystycznym jest, że spadek wartości statystyki Morana nie jest bardzo duży, co świadczy o znaczącej zależności przestrzennej nie tylko pomiędzy jednostkami położonymi blisko siebie, lecz również bardziej odległymi. Interesujące rezultaty osiąga się przy wykluczeniu części jednostek uwzględnionych do obliczenia statystyki I. Przy wykluczeniu 6 jednostek, dla których PKB osiąga największe wartości, statystyka Morana dla roku 2002 osiąga wartość 0,72 (dla wagi 5 najbliższych sąsiadów). W przypadku pominięcia regionów o najniższych wartościach PKB (większość regionów Europy Środkowo-Wschodniej) wartość ta wynosi 0,25. Można więc stwierdzić, że jednostki o najwyższych wartościach PKB w dużym stopniu wpływają na zmniejszenie się zależności przestrzennej. Oznacza to, że są to jednostki silnie odstające od swojego otoczenia pod względem wartości analizowanej cechy. Bardzo duży spadek wartości statystyki I w przypadku pominięcia regionów z nowych państw członkowskich, świadczy o stosunkowo

małej zależności przestrzennej w krajach zachodnioeuropejskich. Występują zatem większe zróżnicowania pomiędzy sąsiednimi jednostkami. Można wnioskować, że brak jest dużych, zwartych obszarów o podobnych wartościach PKB w sąsiednich jednostkach. Należy zauważyć, że aż tak znaczne obniżenie wartości statystyki I wynika z jednorodności nowych krajów unijnych, odznaczających się niskim poziomem PKB w stosunku do średniej unijnej. Znając obraz przestrzennego zróżnicowania Europy w zakresie rozwoju gospodarczego, gdzie obecnie jednostkami dominującymi są duże metropolie, należy podkreślić dużą trafność analizy opartej na mierze autokorelacji przestrzennej. Kolejnym krokiem winno być dokładne rozpoznanie struktur i zależności przestrzennych, co umożliwia analiza LISA. Do określenia LISA wykorzystano wagę uwzględniającą 5 najbliższych sąsiadów. Wybór tej wagi, opartej na dystansie, podyktowany był faktem nieuwzględniania w wagach opierających się na styczności sąsiadów dla jednostek o charakterze wyspowym wysp oraz regionów zawartych wewnątrz innych regionów (Praga, Berlin, Londyn Wewnętrzny). Nieuwzględnienie sąsiedztwa dla wysp (m.in. Baleary, Kreta) byłoby zasadne przy analizie zjawisk społecznych takich jak poziom przestępczości, gdzie znaczenie osobistych kontaktów i interakcji międzyludzkich w znacznym stopniu wpływa na kształtowanie się poziomu zjawiska. W przypadku PKB, zależnego w dużej mierze od polityki, sytuacji państwa, merytorycznie zasadniejsze uwzględnienie jest wag opierających się na liczbie najbliższych sąsiadów. Istotność statystyczna dla lokalnej statystyki I została określona na poziomie 0,05. Wyniki dla roku 1998 i 2002 przedstawiono na rycinie 1. Ryc. 1. Typy zależności przestrzenne na podstawie wartości LISA w Europie w latach1998 i 2002 (A-1998; B-2002). Fig. 1. Type of spatial association based on LISA value in Europe for year 1998 and 2002 (A- 1998; B-2002). Źródło: Opracowanie własne na podstawie Bazy Danych EUROSTAT.. Source: Author s own study based on EUROSTAT Database. Wysokie wartości globalnej statystyki Morana znajdują potwierdzenie w obrazie uzyskanym na podstawie LISA. Można, bowiem wyróżnić dla obu lat wyraźne skupiska przestrzenne (klastry) jednostek o podobnych wartościach. Z jednej strony występuje zwarty,

homogeniczny obszar o niskich wartościach w Europie Środkowo-Wschodniej, z drugiej zaś występuje kilka skupisk o wysokich wartościach w Europie Zachodniej. Zmiany pomiędzy dwoma analizowanymi latami są niewielkie. W przypadku środkowo-wschodniej części kontynentu zmiany mają charakter jednostkowy, co świadczy o utrwalonej, niskiej w stosunku do reszty Europy pozycji. Zmniejszenie się obszarów o wysokich, istotnych statystycznie, lokalnych, zależnościach przestrzennych zauważalne jest w przypadku północy Włoch, południa Niemiec, części Francji. Należy podkreślić, iż zmiany te występują na obszarze tzw. Błękitnego Banana (Europejskiego Banana), czyli obszaru, który uznawany był za centrum rozwojowe kontynentu. Osłabienie zależności przestrzennej właśnie na tym obszarze wydaję się potwierdzać, że we współczesnych badaniach nad europejska przestrzenią gospodarczą właściwsza jest forsowana obecnie koncepcja Pentagonu. Koncepcja ta podkreśla znaczenie policentryczności rozwoju, gdyż za centrum rozwojowe kontynentu uznaje się obszar zawarty pomiędzy 5 głównymi metropoliami (Londyn, Paryż, Mediolan, Monachium, Hamburg), przy czym uwypukla się dominującą rolę dużych ośrodków miejskich jako biegunów rozwoju. Wzrost obszaru, na którym występuje koncentracja jednostek o wysokich wartościach PKB na południu Wielkiej Brytanii, świadczy o wzrastającej zależności przestrzennej na tym obszarze. Wzrost ten należy wiązać z wpływem Londynu, jako jednego z głównych centrów rozwojowych kontynentu, na otoczenie. Ciekawa wydaje się analiza jednostek odstających. W przypadku Budapesztu nastąpiła zmiana jego związku z sąsiedztwem. Powiększyła się dysproporcja pomiędzy regionem stołecznym a otoczeniem, co spowodowane było dynamicznym rozwojem związanym z rangą stolicy. Jest to proces znany z państw postsocjalistycznych, gdzie najszybszy rozwój ekonomiczny występuje najpierw w miastach stołecznych, co związane jest z inwestycjami i kumulacją potencjału rozwojowego. Podobna sytuacja występuje w przypadku Berlina, Lizbony. Jednostki, w których PKB jest niski, sąsiadujące z jednostkami o wysokich jego wartościach, występują w pobliżu niektórych dużych aglomeracji, co świadczy o istotnych w tych przypadkach różnicach pomiędzy dużymi regionami miejskimi a ich otoczeniem. Można więc w tym przypadku znaleźć odniesienia do wcześniejszych rozważań na temat policentryczności rozwoju kontynentu i kumulacji rozwoju w aglomeracjach. Powyższa analiza potwierdza wnioski wynikające z analizy globalnej statystyki Morana o konwergencji w zakresie wartości PKB. Podsumowanie Analiza globalnej statystyki I Morana oraz lokalnych wskaźników zależności przestrzennej może być z powodzeniem wykorzystywane w analizach geograficznych. Statystyki autokorelacji przestrzennej, informując o rodzaju i sile zależności przestrzennej, umożliwiają pełniejsze niż tradycyjnie stosowane miary, określenie związków pomiędzy jednostkami odniesienia oraz określenie struktur przestrzennych. Szczególnie cenne wydaje się być zastosowanie wskaźników zależności przestrzennej do analiz struktur przestrzennych w aspekcie rozważań nad konwergencją czy dywergencją rozwoju. Jak pokazała analiza zróżnicowania PKB w Europie statystyki te umożliwiają uchwycenie zmian zachodzących w przestrzeni. Uwzględniając fakt żywego zainteresowania geografów koncepcjami odnoszącymi się do polaryzacji przestrzeni wydaje się zasadnym szersze zastosowanie analizy przestrzennej i postawieniu jej ponad tradycyjne używane wskaźniki i metody. Szeroko stosowane obecnie metody w większości nie uwzględniają przestrzennych związków pomiędzy jednostkami bądź nie uwzględniają istotności statystycznej tych związków.

Literatura Abreu M., De Groot H.L.F., Florax R.J.G.M., 2005, Space and Growth: a Survey of Empirical Evidence and Methods, Région et Développement, no. 21, pp. 13-44. Anselin L., 1988, Lagrange Multiplier Test Diagnostics for Spatial Dependence and Spatial Heterogeneity, Geographical Analysis, vol. 20, pp. 1-17. Anselin L., 1995, Local Indicators of Spatial Association LISA, Geographical Analysis, vol. 27, no. 2. pp. 93-115. Anselin L., 2002, Under the Hood. Issues in the Specification and Interpretation of Spatial Regression Models., Agricultural Economics, vol. 27, pp. 247-267. Anselin L., Bera A., 1998, Spatial Dependence in Linear Regression Models with an Introduction to Spatial Econometrics (in:) Ullah A., Giles D. (Eds.), Handbook of Applied Economic Statistics, Marcel Dekker, New York, pp. 237-289. Baza Danych EUROSTAT (epp.eurostat.cec.eu.int). Bivand R., 1980, Autokorelacja przestrzenna a metody analizy statystycznej w geografii (w:) Chojnicki Z. (red.), Analiza regresji w geografii, PWN, Poznań, s. 23-38. Brunsdon C., Fotheringham A.S., Charlton M., 1998, Geographically Weighted Regression - Modelling Spatial Non-stationarity, The Statistician, vol. 47, pp. 431-443. Conley J., Gahegan M., Macgil J., 2005, A Genetic Approach to Detecting Clusters in Point Data Sets, Geographical Analysis, vol. 37, pp. 286-314. Czyż T., 1978, Metody generalizacji układów przestrzennych, PWN, Poznań, ss. 89. Florax R.J.G.M., Nijkamp P., 2003, Misspecification in Linear Spatial Regressions Models, Tinbergen Institute Discussion Paper, no. 81, Amsterdam, p. 28. Fotheringham A.S., 1997, Trends in Quantitative Methods I: Stressing the Local, Progress in Human Geography, vol. 21, pp. 88-96. Fotheringham A.S., 2000, Context-dependent spatial analysis: a Role for GIS?, Journal of Geographical Systems, vol. 2, pp. 71-76. Getis A., Aldstadt J., 2004, Constructing the Spatial Weights Matrix Using a Local Statistics, Geographical Analysis, vol. 36, no. 2, pp. 90-104. Kopczewska K., 2006, Ekonometria i statystyka przestrzenna z wykorzystaniem programu R CRAN, CeDeWu, Warszawa, ss. 161. LeSage J., 1999, Spatial Econometrics (in:) Loveridge S. (ed.) The Web Book of Regional Science, Regional Research Institute, West Virginia University, Morgantown, p. 279 (dokument elektroniczny, dostępny z: www.rri.wvu.edu/regscweb). Ludwiczak B., 1991, Korelacja przestrzenna (w:) Zeliaś A. (red.) Ekonometria przestrzenna, PWE, Warszawa, s. 97-121. Miller H.J., 2004, Tobler s First Law and Spatial Analysis, Annals of the Association of American Geographers, vol. 94, no. 2, pp. 284-289. Ord J.K., Getis A., 1995, Local Spatial Autocorrelation Statistics: Distributional Issues and an Application, Geographical Analysis, vol. 27, pp. 286-306. Ord J.K., Getis A., 2001, Testing for Local Spatial Autocorrelation in the Presence of Global Autocorrelation, Journal of Regional Science, vol. 41, pp. 411-432. Paelnick J.H.P., Klaassen L.H., 1983, Ekonometria przestrzenna, PWN, Warszawa, ss. 211. Ratajczak W., 1980, Analiza i modele wpływu czynników społeczno-gospodarczych na kształtowanie się sieci transportowej, PWN, Poznań, ss. 140. Smirnov O., Anselin L., 2001, Fast Maximum Likelihood Estimation of Very Large Spatial Autoregressive Models: a Characteristic Polynomial Approach, Computational Statistics & Data Analysis, vol. 35, pp. 301-319.