ZASTOSOWANIE KRIGINGU RESZT LOKALNEGO MODELU REGRESJI DO INTERPOLACJI PRZESTRZENNEJ ŚREDNIEJ ROCZNEJ TEMPERATURY POWIETRZA W POLSCE

Podobne dokumenty
ZASTOSOWANIE REGRESJI WAŻONEJ GEOGRAFICZNIE DO INTERPOLACJI PRZESTRZENNEJ MIEJSKIEJ WYSPY CIEPŁA WE WROCŁAWIU

ZASTOSOWANIE REGRESJI WAŻONEJ GEOGRAFICZNIE DO MODELOWANIA MIEJSKIEJ WYSPY CIEPŁA WE WROCŁAWIU

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

INFOBAZY 2014 VII KRAJOWA KONFERENCJA NAUKOWA INSPIRACJA - INTEGRACJA - IMPLEMENTACJA

Załącznik 1.1. Lokalizacja punktów pomiaru miąższości wybranych pokładów węgla w KWK Murcki (opróbowanie wiertnicze i górnicze)

Rozdział 8. Regresja. Definiowanie modelu

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Prof. dr hab. Zbigniew Ustrnul Kraków, 5 czerwca 2015 r.

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Metody Ilościowe w Socjologii

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ćwiczenia IV

Ewelina Henek, Agnieszka Wypych, Zbigniew Ustrnul. Instytut Meteorologii i Gospodarki Wodnej Państwowy Instytut Badawczy (IMGW-PIB)

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

4. Średnia i autoregresja zmiennej prognozowanej

dr hab. Maciej Kryza Stanowisko:

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ACTA UNIVERSITATIS LODZIENSIS

KONSTRUKCJA MAP TEMPERATURY POWIETRZA POLSKI Z WYKORZYSTANIEM GIS CONSTRUCTION OF THE AIR TEMPERATURE MAPS FOR POLAND USING GIS

Zamiana punktowych danych wilgotności objętościowej gleby na rozkłady powierzchniowe

Stanisław Cichocki. Natalia Nehrebecka

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

WPŁYW SZYBKOŚCI STYGNIĘCIA NA WŁASNOŚCI TERMOFIZYCZNE STALIWA W STANIE STAŁYM

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Motto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.

Modelowanie glikemii w procesie insulinoterapii

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ekonometria. Zajęcia

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wprowadzenie do analizy korelacji i regresji

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Analiza wykonalności dla wskaźnika: dostępność obszarów pod zabudowę

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO

INSTYTUT METEOROLOGII I GOSPODARKI WODNEJ PAŃSTWOWY INSTYTUT BADAWCZY Oddział we Wrocławiu. Görlitz

estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Analiza współzależności zjawisk

Infrastruktura pomiarowo badawcza

5. Model sezonowości i autoregresji zmiennej prognozowanej

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Analiza regresji - weryfikacja założeń

ACTA UNIVERSITATIS LODZIENSIS

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Stosowana Analiza Regresji

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Inteligentna analiza danych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WYKORZYSTANIE MODELI AUTOREGRESJI DO PROGNOZOWANIA SZEREGU CZASOWEGO ZWIĄZANEGO ZE SPRZEDAŻĄ ASORTYMENTU HUTNICZEGO

PRACA LICENCJACKA SPECJALNOŚĆ: GEOINFORMACJA PROPONOWANA PROBLEMATYKA W ROKU AKADEMICKIM 2016/2017

7.4 Automatyczne stawianie prognoz

Testy nieparametryczne

3. Modele tendencji czasowej w prognozowaniu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wykład 5: Statystyki opisowe (część 2)

Ćwiczenie 5 PROGNOZOWANIE

Prognozy zmian poziomu oceanu a El Niño 2015/2016 system Prognocean Plus jako usługa nowej generacji dla Nauki Polskiej.

Klimat w Polsce w 21. wieku

TEMATYKA PRAC DYPLOMOWYCH MAGISTERSKICH STUDIA STACJONARNE DRUGIEGO STOPNIA ROK AKADEMICKI 2011/2012

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

ALGORYTM UZUPEŁNIANIA BRAKUJĄCYCH DANYCH W ZBIORACH REJESTROWANYCH NA STACJACH MONITORINGU POWIETRZA

Analiza wykonalności dla wskaźnika: zmiany obszarów użytkowanych rolniczo

Projektowanie systemów pomiarowych. 02 Dokładność pomiarów

CYKLICZNE ZMIANY MIEJSKIEJ WYSPY CIEPŁA W WARSZAWIE I ICH PRZYCZYNY. Cyclic changes of the urban heat island in Warsaw and their causes

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Ekonometria Ćwiczenia 19/01/05

MODELE LINIOWE. Dr Wioleta Drobik

Recenzja. 1. Ogólna charakterystyka rozprawy

Wprowadzenie. Małgorzata KLENIEWSKA. nawet już przy stosunkowo niewielkim stężeniu tego gazu w powietrzu atmosferycznym.

ACTA UNIVERSITATIS LODZIENSIS KSZTAŁTOWANIE SIĘ WIELKOŚCI OPADÓW NA OBSZARZE WOJEWÓDZTWA MIEJSKIEGO KRAKOWSKIEGO

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Analiza autokorelacji

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Regresja logistyczna (LOGISTIC)

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Etapy modelowania ekonometrycznego

ANALIZA METROLOGICZNA WYNIKÓW BADAŃ NA PRZYKŁADZIE ŁOŻYSK ŚLIZGOWYCH

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Przyczynowość Kointegracja. Kointegracja. Kointegracja

CHARAKTERYSTYKA I ZASTOSOWANIA ALGORYTMÓW OPTYMALIZACJI ROZMYTEJ. E. ZIÓŁKOWSKI 1 Wydział Odlewnictwa AGH, ul. Reymonta 23, Kraków

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ

SPIS TREŚCI. Do Czytelnika... 7

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Sieć monitoringu miejskiej wyspy ciepła w Warszawie Zróżnicowanie mikroklimatyczne wybranych osiedli

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Zmiany klimatu a zagrożenie suszą w Polsce

Przykład 2. Stopa bezrobocia

Transkrypt:

PRZEGLĄD GEOFIZYCZNY Rocznik LVII 2012 Zeszyt 1 Mariusz SZYMANOWSKI Zakład Kartografii UWr Wrocław Maciej KRYZA Zakład Klimatologii i Ochrony Atmosfery UWr Wrocław ZASTOSOWANIE KRIGINGU RESZT LOKALNEGO MODELU REGRESJI DO INTERPOLACJI PRZESTRZENNEJ ŚREDNIEJ ROCZNEJ TEMPERATURY POWIETRZA W POLSCE THE APPLICATION OF LOCAL REGRESSION RESIDUAL KRIGING FOR SPATIAL INTERPOLATION OF ANNUAL MEAN AIR TEMPERATURE IN POLAND Przestrzenna interpolacja danych, jako podstawowy sposób pozyskania przestrzennych rozkładów elementów klimatu, jest jednym z podstawowych problemów metodycznych współczesnej klimatologii. Obecnie można zaobserwować ciągły wzrost zainteresowania i oczekiwań ze strony wielu dyscyplin naukowych pozyskaniem dokładnej, ciągłej przestrzennie informacji o wysokiej rozdzielczości przestrzennej i czasowej. Dotyczy to wszystkich elementów klimatu, wśród których jednak dominującą rolę pełnią opady atmosferyczne i temperatura powietrza. Ponieważ z reguły nie chodzi w takim wypadku o stronę czysto poznawczą, ale o możliwość wykorzystania danych przestrzennych jako wejściowych do dalszych analiz, oczekiwania nie dotyczą opracowania zbioru map o charakterze przeglądowym, ale zweryfikowanej informacji cyfrowej. Ze względu na stosunkowo dobrą znajomość praw fizycznych i czynników decydujących o rozkładzie temperatury powietrza może się ona wydawać łatwym do uprzestrzennienia elementem. Należy jednak pamiętać, że informacją wejściową w procesie interpolacji są dane pomiarowe ze stacji meteorologicznych, które rozmieszczone są stosunkowo rzadko i z założenia mają być reprezentatywne dla

74 M. Szymanowski, M. Kryza znacznych obszarów (np. w Polsce to ok. 200 stacji sieci IMGW). Dodatkowo stacje lokalizowane są tak, aby nie oddawały w nadmiernym stopniu efektów oddziaływania czynników meteorologicznych w skali lokalnej, co niejednokrotnie może stać na przeszkodzie w opracowaniu wiarygodnego rozkładu przestrzennego temperatury powietrza o wysokiej rozdzielczości przestrzennej. W ostatnich latach można zaobserwować znaczący postęp w metodyce tworzenia rozkładów przestrzennych elementów klimatu. Dzieje się tak głównie za przyczyną rozwoju i upowszechnienia Systemów Informacji Geograficznej (GIS). Środowisko to pozwala na dostęp do różnorodnych algorytmów interpolacji przestrzennej. Obecnie brak jest jednolitych schematów interpolacji obowiązujących czy to w skali całego kontynentu, czy w sąsiadujących regionach. Akcja COST719 (Dobesch i in., 2007; Tveito i in., 2008) oraz dwie konferencje Spatial Interpolation in Climatology and Meteorology, które odbyły się w Budapeszcie w latach 2004 (Szalai i in., 2007) i 2009, pozwoliły na podsumowanie dorobku i wskazanie najczęściej używanych metod spacjalizacji temperatury powietrza. W zdecydowanej większości aplikacji w przypadku danych uśrednionych w zakresie lat i miesięcy decydowano się na zastosowanie metod wielowymiarowych, a więc uwzględniających w procesie interpolacji dodatkowe zmienne objaśniające. Jako potencjalne predyktory rozkładu temperatury wykorzystywano wysokość, współrzędne geograficzne oraz odległość od morza (Ustrnul, Czekierda, 2003; Szalai i in., 2007; Tveito i in., 2008). Oczywiście nie w każdym przypadku okazywały się one czynnikami istotnymi statystycznie, jak np. szerokość geograficzna w Słowenii (Tveito i in., 2008). Najczęściej stosowaną metodą był kriging resztowy (residual kriging RK), który wykorzystano do tworzenia map średniej rocznej i miesięcznych temperatury w Hiszpanii, Fennoskandii, Słowenii i Polsce (Tveito i in., 2008; Ustrnul, Czekierda, 2003). W Portugalii, oprócz RK, w przypadku niektórych miesięcy preferowano kokriging (Tveito i in., 2008), a w Niemczech wybrano metodę regresji wieloczynnikowej (Klimaatlas, 2001). Na Węgrzech natomiast została zastosowana dedykowana metoda MISH (Szalai i in., 2007). Są dwa podstawowe powody, dla których zagadnień metodycznych związanych z interpolacją elementów klimatu nie można uznać z zamknięte. Po pierwsze, istnieje potrzeba poszukiwania algorytmu, który w większym stopniu uwzględni charakterystyki lokalne i regionalne pola temperatury, mając jednocześnie cechy, które mogą go predestynować do stania się metodą uniwersalną w interpolacji elementów klimatu. Po drugie, szczegółowe analizy statystyczne wskazują na to, że z punktu widzenia metodycznego istnieją znaczące zastrzeżenia co do stosowania globalnego modelu regresji w warunkach niestacjonarności procesu przestrzennego, z czym na ogół mamy do czynienia w wypadku danych klimatologicznych (Szymanowski, Kryza, 2011). Propozycja rozwiązania tych dwóch problemów stanowi jednocześnie podstawowy cel artykułu. Testowi został poddany algorytm oparty na krigingu reszt lokalnego modelu regresji, a wyniki porównane z trady-

Zastosowanie krigingu reszt lokalnego modelu regresji 75 cyjną interpolacją za pomocą modelu globalnego. Do zaprezentowania podstawowych cech algorytmu interpolacji poddano średnią roczną temperaturę w roku 1996. Dane i obszar opracowania W procedurze interpolacji jako wejściowe zostały wykorzystane dane ze stacji meteorologicznych polskich oraz zagranicznych z jednostopniowej strefy wokół Polski. Łącznie uwzględniono dane ze 140 stacji klimatologicznych uzyskanych z IMGW oraz ze 110 stacji synoptycznych, które pobrano z ogólnodostępnych baz i portali internetowych opisanych poniżej. W celu wyeliminowania niejednorodności związanych z różnymi sposobami obliczania średniej dobowej, wszystkie obliczenia tej średniej wykonano według algorytmu obowiązującego w sieci IMGW dla stacji klimatologicznych: (T06+T18+T MAX +T MIN )/4. W tym celu, oprócz danych o temperaturach ekstremalnych (T MAX, T MIN ), konieczne było pozyskanie informacji pomiarowej z terminów 06 i 18 UTC. Temperatury ekstremalne pozyskano z bazy Global Summary of the Day (GSOD), jedynie w przypadku stacji niemieckich, które są w tej bazie słabo reprezentowane, posłużono się materiałami zamieszczonymi na stronie internetowej Deutscher Wetterdienst. Dane terminowe pozyskano z depesz synoptycznych zamieszczonych na stronie National Climatic Data Center (NCDC) oraz pobrano z portalu OGIMET. W razie potrzeby kontroli lub uzupełnienia korzystano także z serwisów: TuTiempo.net, Mundomanz.com oraz portalu Russia s Weather Server Weather Archive. Ostatecznie do analizy zgromadzono materiał ze 197 stacji polskich i 53 zagranicznych (rys. 1). Procedura interpolacyjna przedstawiona w artykule została rozwinięta w ramach prac prowadzonych podczas realizacji projektu badawczego nr N N306 155038. Autorzy dysponowali dwoma zestawami danych dotyczącymi średniej rocznej temperatury powietrza w Polsce z lat 1996 i 2000. Rezultaty interpolacji zostaną przedstawiono na przykładzie średniej rocznej temperatury powietrza w roku 1996, który był najzimniejszym rokiem z 10-lecia 1996-2005, analizowanego w ramach wspomnianego projektu. Przyczyny wyboru tego przykładu przedstawiono w dalszej części artykułu. Metody opracowania Kriging resztowy jest metodą dwuetapową. W pierwszym etapie następuje wyjaśnienie części deterministycznej zmienności przestrzennej interpolowanego elementu za pomocą modelu regresji. W etapie drugim część niewyjaśniona, reszty regresji, jest interpolowana za pomocą krigingu zwyczajnego (ordinary kriging

76 M. Szymanowski, M. Kryza OK). Uzyskane w obydwu etapach warstwy są następnie sumowane (Hengl, 2007). W dotychczasowych implementacjach krigingu resztowego w klimatologii w etapie deterministycznym był stosowany globalny model regresji wieloczynnikowej (Multiple Linear Regression MLR; Ustrnul, Czekierda, 2003). Jednymi z podstawowych problemów metodycznych przy stosowaniu globalnego modelu regresji są: założenie stacjonarności procesu przestrzennego, brak niezależności danych (autokorelacja przestrzenna) i heteroscedastyczność (zależność wariancji lokalnej od średniej lokalnej). Stacjonarność przestrzenna oznacza, że w każdej części analizowanego obszaru proces podlega takim samym uwarunkowaniom, a określone oddziaływanie czynników sprawczych przynosi takie same rezultaty. Bardzo trudno o spełnienie takiego założenia w klimatologii, gdzie z reguły mamy do czynienia z procesami niestacjonarnymi. Rozwiązaniem tego problemu może być zastosowanie lokalnego modelu regresji, ogólnego modelu liniowego (GLM) lub modelu autoregresji przestrzennej (SAR). W pracy zastosowano lokalny model regresji liniowej GWR (Geographically Weighted Regression), w którym przyjmuje się założenie niestacjonarności procesu przestrzennego (Fotheringham i in., 2002). Model GWR może być wyrażony jako y u, v ) ( u, v ) x i 0 ( i i k gdzie (u i, v i ) to współrzędne i-tego punktu, a β k (u i, v i ) jest realizacją funkcji β k (u, v) w punkcie i, β 0 to wyraz wolny, a ε i oznacza reszty regresji. Podstawową cechą odróżniającą GWR od MLR jest uzależnienie procesu od położenia w przestrzeni, w związku z czym współczynniki regresji (β) nie są stałe, jak w MLR, ale zmieniają się wraz z lokalizacją. Istotą GWR jest konstrukcja lokalnych modeli regresji opartych na macierzy sąsiedztwa (spatial kernel) z zastosowaniem funkcji wagowej (weigthing function, kernel function). Wagi zmniejszają się wraz z odległością punktu danych od punktu regresji. Kriging resztowy zbudowany na modelu lokalnym regresji w artykule oznaczono jako GWRK, w odróżnieniu od krigingu resztowego na modelu globalnym MLRK. Utworzenie modelu regresji jest poprzedzone opracowaniem zbioru potencjalnych predyktorów (zmiennych objaśniających), które w celu wykonania interpolacji muszą być ciągłymi przestrzennie warstwami o rozdzielczości zgodnej z planowaną rozdzielczością warstwy końcowej, którą w tym opracowaniu przyjęto jako 250 m. Przyjęta rozdzielczość warstwy wynikowej jest kompromisem między możliwościami obliczeniowymi a potrzebą zachowania szczegółowości wejściowej informacji, szczególnie w kontekście modelu terenu i obliczonych na jego podstawie warstw pochodnych. Do zbioru zmiennych objaśniających, oprócz tradycyjnie uwzględnianych: wysokości nad poziomem morza (cyfrowy model terenu SRTM, rozdzielczość 3, przetransformowany do układu współrzędnych 1992 i poddany resamplingowi do rozdzielczości opracowania), współrzędnych (tutaj k i i ik i

Zastosowanie krigingu reszt lokalnego modelu regresji 77 X i Y w układzie 1992) i odległości od morza, dodano: nachylenie stoków, indeks fenowy oraz współczynnik wklęsłości/wypukłości (Szymanowski i in., 2007), a także roczne sumy całkowitego promieniowania potencjalnego, obliczone za pomocą modułu r.sun (Kryza i in., 2010). Dodatkowo uwzględniono także procentowy udział powierzchni naturalnych i sztucznych w otoczeniu każdego punktu na podstawie bazy Corine Land Cover 2000. Aby uwzględnić wpływ predyktora z określonego otoczenia punktów pomiaru i interpolacji, warstwy zmiennych objaśniających uśredniono filtrem typu focal mean w kołowym otoczeniu rastra o promieniu 1250, 2500 i 5000 m. Dobór zmiennych do modelu przeprowadzono metodą regresji krokowej postępującej z uwzględnieniem: a) istotności statystycznej na poziomie ufności 95% (p<0,05), b) braku korelacji między zmiennymi wyrażonego za pomocą współczynnika inflacji wariancji VIF, przy ogólnym założeniu, że VIF<10, c) znaku współczynnika regresji zmiennej (β) w modelu zgodnym z charakterem procesu fizycznego (podejście deterministyczne). Zmienne, które zostały dobrane w tej procedurze, uwzględniono zarówno w modelu MLR, jak i GWR. Do specyfikacji modelu GWR przyjęto gaussowski model funkcji wagowej w zmiennej, definiowanej liczbą punktów, macierzy sąsiedztwa. Wielkość macierzy dobrano na podstawie analizy skorygowanego kryterium informacyjnego Akaike (AICc), współczynnika determinacji i analizy znaków współczynników β zmiennych objaśniających w całym obszarze analizy. W związku z założeniem podejścia deterministycznego, a więc zachowaniu możliwości fizycznej interpretacji lokalnego modelu regresji, kierowano się zasadą, że żaden ze współczynników regresji (β) nie zmienia znaku w obszarze analizy. Porównanie modeli MLR i GWR zostało dokonane za pomocą podstawowych statystyk (dopasowany współczynnik determinacji r 2, statystyka F, błąd standardowy estymacji) i analizy wariancji ANOVA. Autokorelacja przestrzenna reszt regresji została określona za pomocą statystyki I Morana. Ocenę jakości interpolacji wykonano na podstawie błędów oceny krzyżowej typu leave-one-out (cross-validation CV), posługując się zbiorczymi miarami diagnostycznymi: ME (średni błąd), MAE (średni błąd bezwzględny) i RMSE (pierwiastek błędu średniokwadratowego). Ponieważ stosowany pakiet statystyczny R nie miał procedury pozwalającej na automatyczną realizację CV dla interpolatorów dwuetapowych (MLRK oraz GWRK), został przygotowany skrypt, który realizował takie zadanie. Skrypt korzysta z możliwości systemu Linux (skrypty Shell realizacja zadań oparta na pętlach) oraz pakietu statystycznego R (biblioteki gstat i spgwr). Analizy wykonano za pomocą oprogramowania GIS (GRASS, ArcGIS) oraz pakietu statystycznego R z biblioteką spgwr oraz gstat.

78 M. Szymanowski, M. Kryza Wyniki Specyfikacja MLR przeprowadzona według opisanych kryteriów pozwoliła na włączenie do modelu pięciu zmiennych niezależnych: współrzędnych X i Y, wysokości, odległości od morza oraz procentowego udziału powierzchni sztucznych w otoczeniu o promieniu 5 km. Znaki współczynników regresji β, zgodnie z deterministycznym podejściem do modelu regresji, wskazują na spadek średniej rocznej temperatury powietrza wraz ze wzrostem wielkości wymienionych zmiennych. Model charakteryzuje się bardzo wysokim współczynnikiem determinacji r 2 = 0,94 i stosunkowo niewielkim błędem estymacji, 0,35 C (tab. 1). Jednak pomimo dobrych statystyk, reszty modelu wykazują istotną statystycznie tendencję do skupiania się (tab. 1), co pozwala na wysunięcie wniosku o nieprawidłowej specyfikacji modelu w warunkach niestacjonarności procesu przestrzennego. W takiej sytuacji zasadne jest zastosowanie modelu lokalnego GWR. Została dobrana optymalna wielkość macierzy sąsiedztwa, pozwalająca na zachowanie możliwości fizycznej interpretacji każdego modelu lokalnego 63 punkty (tab. 2). Model lokalny odznacza się nieco lepszym od MLR współczynnikiem determinacji i dopasowaniem do obserwacji, wyrażonym niższym AICc (tab. 2). Także analiza wariancji ANOVA potwierdziła, że model GWR jest lepszy od modelu MLR. Jej wynik wskazuje na obniżenie przez model lokalny sumy kwadratów reszt o 9,4 w porównaniu do 30,2 modelu MLR. Zaletą modelu GWR jest także to, że otrzymujemy, niezbędne do wykonania interpolacji, przestrzenne rozkłady współczynników regresji β. Model GWR dostarcza także informacji o wielkości współczynników determinacji lokalnych modeli regresji, przypisanych do punktów pomiarowych. Stwarza to możliwość oceny stopnia wyjaśnienia zmienności cechy w różnych obszarach, a więc pośrednio stopnia niepewności oszacowania. Tabela 1. Podsumowanie analizy regresji i autokorelacji przestrzennej reszt modelu globalnego MLR Table 1. Summary of the regression analysis and spatial autocorrelation of regression residuals for the global MLR model Liczba zmiennych niezależnych r 2 Kryterium informacyjne Akaike AICc Statystyka F Błąd standardowy estymacji Statystyka I Morana Wartość oczekiwana E(I) = -0.004 5 0,94 195,1 790,9 0,35 0,099 (p = 0,00) Przeprowadzona analiza reszt modelu GWR wskazała, podobnie jak w przypadku reszt MLR, na występowanie autokorelacji przestrzennej reszt (tab. 2). Daje to możliwość dopasowania modelu semiwariogramu opisanego więcej niż jednym parametrem (Hengl, 2007), a więc różnego od losowego modelu semiwariancji (model efektu samorodka) i rozszerzenia modelu regresyjnego o kriging

Zastosowanie krigingu reszt lokalnego modelu regresji 79 reszt. W ramach realizowanego projektu grantowego przeprowadzono analizę reszt modeli regresji na podstawie danych o różnym stopniu agregacji (od średniej rocznej do średniej dobowej), która wykazała, że w 85% przypadków (na łączną sumę 69) zachodziła dodatnia autokorelacja przestrzenna reszt. W przypadku temperatury średniej rocznej dysponowano jedynie dwoma zbiorami danych, z lat 1996 i 2000. W tym ostatnim przypadku nie stwierdzono istotnej statystycznie autokorelacji reszt, więc nie było podstaw do rozszerzenia modelu regresji o komponent geostatystyczny. Aby pozostawić możliwość porównania wyników wszystkich modeli, jako podstawowy do analizy wybrano średnią roczną temperaturę w roku 1996. Tabela 2. Podsumowanie analizy regresji i autokorelacji przestrzennej reszt modelu lokalnego GWR Table 2. Summary of the regression analysis and spatial autocorrelation of regression residuals for the local GWR model Wielkość macierzy sąsiedztwa Ogólny r 2 Min. r 2 Max. r 2 informacyjne Akaike Kryterium AICc Statystyka I Morana Wartość oczekiwana E(I) = -0,004 63 0,95 0,92 0,96 185,0 0,059 (p = 0,02) Pomimo stwierdzenia istotnej autokorelacji dodatniej reszt, modelowanie semiwariancji było dość kłopotliwe i nie mogło być przeprowadzone w sposób automatyczny. Wynikało to z charakteru rozmieszczenia stacji, zwłaszcza w obszarach górskich, gdzie blisko położone stacje często są poddane działaniu odmiennych procesów fizycznych decydujących o temperaturze powietrza. W konsekwencji mogą w takich przypadkach wystąpić znaczne różnice reszt modelu regresji w blisko położonych punktach. W ramach projektu korzystano z procedury półautomatycznej z zastosowaniem narzędzi biblioteki gstat, dostępnej w pakiecie statystycznym R, opisanej przez Pebesmę (2004). Arbitralnie podjęto decyzję o traktowaniu modelu interpolacyjnego jako wiernego nie uwzględniano modelu nuggetowego. Semiwariancje w analizowanym przypadku nie wykazywały charakteru anizotropowego. W omnikierunkowym modelu teoretycznym użyto funkcji sferycznej o semiwariancji progowej równej 0,1 i zasięgu 200 km. Do obliczeń zastosowano kriging zwyczajny oparty na wszystkich dostępnych punktach. Wielkość i przestrzenny charakter korekty wprowadzonej w odniesieniu do modelu regresji przez kriging reszt przedstawiono na rys. 1. Zmiany sięgają do ok. ±1 C i są największe w obszarach górskich. W pozostałych regionach kraju korekta jest mniejsza (do ±0,4 C), często także mniejsza od błędu pomiarowego (0,1 C). Wyniki oceny CV dla czterech wybranych metod są zbliżone (tab. 3). Jedynie średni błąd (ME) metod kombinowanych (MLRK i GWRK) jest mniejszy niż

80 M. Szymanowski, M. Kryza Rys. 1. Interpolowane reszty modelu GWR średniej temperatury powietrza w roku 1996 wraz z błędami oceny krzyżowej metody GWR Fig. 1. Interpolated residuals of GWR model for mean air temperature in year 1996 and the crossvalidation errors of GWR Tabela 3. Wyniki oceny krzyżowej użytych metod interpolacji (ME średni błąd, MAE średni błąd bezwzględny, RMSE pierwiastek błędu średniokwadratowego, MAX błąd maksymalny, MIN błąd minimalny) Table 3. Cross-validation errors of used interpolation methods (ME mean error, MAE mean absolute error, RMSE root mean square error, MIN minimum error, MAX maximum error) Metoda ME MAE RMSE MIN MAX MLR MLRK GWR GWRK 0,0528 0,0337 0,0496 0,0209 0,2350 0,2237 0,2324 0,2390 0,3220 0,3095 0,3184 0,3291-1,1566-1,0074-1,0463-0,9955 1,1628 1,1064 1,1884 1,1061 modeli regresji (MLR i GWR). Pozostałe średni błąd absolutny (MAE), pierwiastek błędu średniokwadratowego (RMSE), jak i błędy ekstremalne i zakres charakteryzują się podobnymi wielkościami (tab. 3). Jedyne poważniejsze różnice związane są z rozkładami przestrzennymi błędów CV, które w metodach składających się tylko z części deterministycznej (MLR, GWR) wykazują tendencję do

Zastosowanie krigingu reszt lokalnego modelu regresji 81 skupiania się wielkości podobnych tworzą się strefy z tendencją do przeszacowywania lub niedoszacowania wielkości temperatury przez model, zwłaszcza w obszarach górskich (rys. 1). Zjawisko to jest częściowo eliminowane przez rozszerzenie procedury o komponent geostatystyczny. W analizowanym przypadku można zaobserwować ograniczenie tendencji do przeszacowania w strefie szczytowej Karpat (rys. 2). Rys. 2. Pole średniej rocznej temperatury powietrza w Polsce w roku 1996 estymowane metodą GWRK wraz z błędami oceny krzyżowej metody GWRK Fig. 2. Mean annual air temperature in Poland in the year 1996 estimated using GWRK method and the cross-validation errors of GWRK Podsumowanie Zaproponowana metoda krigingu reszt lokalnego modelu regresji (GWRK) potwierdza swoją przydatność do interpolacji przestrzennej średniej rocznej temperatury powietrza w Polsce. Może być jednak efektywnie stosowana jedynie w przypadku stwierdzenia dodatniej autokorelacji przestrzennej reszt modelu regresji. Ponieważ liczba przypadków ze średnią roczną temperaturą była ograniczona do dwóch (raz autokorelację stwierdzono, a raz nie), brak jest podstaw do

82 M. Szymanowski, M. Kryza twierdzenia, że GWRK można traktować jako metodę uniwersalną. W części deterministycznej modelu należy podkreślić zasadność stosowania regresji ważonej geograficznie zamiast globalnej regresji wieloczynnikowej w warunkach niestacjonarności procesu przestrzennego. Dodatkowo GWR, opierając się na tym samym zbiorze zmiennych objaśniających, pozwala na podkreślenie siły oddziaływania tych zmiennych i różnic regionalnych, co w rezultacie daje podstawy do tworzenia wiarygodnych map o wysokiej rozdzielczości przestrzennej. Rozszerzenie modelu regresji o kriging reszt pozwala na bardziej precyzyjną estymację, jednocześnie powodując ograniczenie tendencji do tworzenia stref przeszacowania lub niedoszacowania temperatury powietrza przez model regresji. Jeżeli nawet GWRK nie może predestynować do miana metody uniwersalnej w odniesieniu do średniej rocznej temperatury powietrza, to wstępne prace autorów wskazują na taką możliwość w odniesieniu do pola temperatury o mniejszym stopniu agregacji (średnie dobowe). Metoda ta dała także bardzo dobre wyniki przy zastosowaniu do lokalnego pola temperatury w mieście w warunkach miejskiej wyspy ciepła (Szymanowski, Kryza, 2011). Praca finansowana ze środków na naukę w latach 2010 2012 jako projekt badawczy nr N N306 155038. Materiały wpłynęły do redakcji 2 IV 2012. Literatura Deutscher Wetterdienst, http://www.dwd.de, dostęp: 02.2012 Dobesch H., Dumolard P., Dyras I. (red.), 2007, Spatial interpolation for climate data: the use of GIS in climatology and meteorology. ISTE, Londyn, ss. 284. Fotheringham A.S., Brunsdon C., Charlton M.E., 2002, Geographically weighted regression. John Wiley & Sons, ss. 269. Global Summary of the Day, http://www.ncdc.noaa.gov/cgi-bin/res40.pl, dostęp: 01.2011 Hengl T., 2007, A practical guide to geostatistical mapping of environmental variables. Luxembourg, Office for Official Publications of the European Communities, ss. 143. Klimaatlas Bundesrepublik Deutschland, 2001, Deutscher Wetterdienst, Offenbach a. Main, t. 1. Kryza M., Szymanowski M., Migała K., Pietras M., 2010, Spatial information on total solar radiation: Application and evaluation of the r.sun model for the Wedel Jarlsberg Land, Svalbard. Polish Polar Research, 31 (1), 17-32. Mundomanz.com, http://www.mundomanz.com/meteo_p/main?l=1, dostęp: 01-04.2011. National Climatic Data Center, http://www1.ncdc.noaa.gov/pub/data/noaa, dostęp: 01.2011. OGIMET, http://www.ogimet.com/synops.phtml.en, dostęp: 01-04.2011. Pebesma E.J., 2004, Multivariable geostatistics in S: the gstat package. Computers & Geosciences, 30, 683-691. Russia s Weather Server Weather Archive, http://meteo.infospace.ru/wcarch/html/index.sht, dostęp: 01-04.2011.

Zastosowanie krigingu reszt lokalnego modelu regresji 83 Szalai S., Bihari Z., Szentimrey T., Lakatos M. (red.), 2007, Proc. of Int. Conf. Spatial Interpolation Techniques in the Meteorology and Climatology, Budapest, 25-29 Oct 2004, Office for Official Publications of the European Communities, Luxembourg, ss. 257. Szymanowski M., Kryza M., 2011, Local regression models for spatial interpolation of urban heat island an example from Wrocław, SW Poland. Theoretical and Applied Climatology, DOI:10.1007/s00704-011-0517-6. Szymanowski M., Kryza M., Smaza M., 2007, A GIS approach to spatialize selected climatological parameters for wine-growing in Lower Silesia, Poland. Proc. Bioclimatology and Natural Hazards, Zvolen-Polana 17-20 IX 2007, CD-ROM. TuTiempo.net, http://www.tutiempo.net/en, dostęp: 01-04.2011. Tveito O.E., Wegehenkel M., van der Wel F., Dobesch H. (red.), 2008, The use of geographic information systems in climatology and meteorology. Final Report, COST Action 719. Luxembourg: Office for Official Publications of the European Communities, ss. 247. Ustrnul Z., Czekierda D., 2003, Zróżnicowanie przestrzenne warunków termicznych powietrza Polski z wykorzystaniem GIS. Warszawa, IMGW, ss. 83. Streszczenie Podstawowym celem opracowania jest przedstawienie procedury przestrzennej interpolacji średniej rocznej temperatury powietrza w Polsce z wykorzystaniem krigingu reszt lokalnego modelu regresji (regresji ważonej geograficznie). Interpolacji przestrzennej dokonano na podstawie danych z roku 1996, obejmujących 250 stacji meteorologicznych z Polski i najbliższego sąsiedztwa. Dokonano porównania modeli regresji globalnej i lokalnej za pomocą szeregu miar statystycznych. Stwierdzono, że w związku z niestacjonarnością pola temperatury model lokalny jest lepiej dopasowany do danych pomiarowych niż globalny model regresji. Obydwa modele zostały rozszerzone o interpolację reszt regresji (kriging resztowy) i wykorzystane do wykonania map średniej rocznej temperatury powietrza. Wyniki interpolacji uzyskane czterema metodami zostały porównane za pomocą metody oceny krzyżowej. Stwierdzono, że rozszerzenie modeli regresji przez komponent geostatystyczny podnosi jakość interpolacji, głównie przez eliminację stref systematycznego przeszacownia/niedoszacowania. W związku z metodyczną poprawnością stosowania modelu lokalnego w warunkach niestacjonarności za najlepszą metodę w analizowanym przypadku uznano kriging reszt oparty na regresji ważonej geograficznie. S ł owa kluczowe: regresja ważona geograficznie, kriging resztowy, GIS, temperatura powietrza, Polska Summary The main aim of the paper is to perform the spatial interpolation of the annual mean air temperature in Poland using geographically weighted regression residual kriging. The interpolation has been done for a set of data for year 1996, covering 250 meteorological stations from Poland and its surroundings. Global and local regression models have been compared using various statistics. It has been stated that local model approach is better suited for spatial modeling of air temperature than the global one, as it takes into account non-stationarity of the spatial process. Both models have been extended by the interpolation of regression residuals, and used for mapping air temperature field,

84 M. Szymanowski, M. Kryza and the interpolation results have been evaluated with the cross-validation (CV) approach. The incorporation of the spatially interpolated residuals leads to significant improvement of the results, especially by eliminating the zones of systematic over- or underestimations. Because local regression is better justified in terms of statistical specification, the residual kriging based on geographically weighted regression is recommended for spatial modeling of annual mean air temperature, instead of widely applied global regression based residual kriging models. Key words: geographically weighted regression, residual kriging, GIS, air temperature, Poland Mariusz Szymanowski mariusz.szymanowski@uni.wroc.pl Zakład Kartografii, Uniwersytet Wrocławski Maciej Kryza maciej.kryza@uni.wroc.pl Zakład Klimatologii i Ochrony Atmosfery, Uniwersytet Wrocławski