Modelowanie i Analiza Danych Przestrzennych Andrzej Leśniak Katedra Geoinformatyki i Informatyki Stosowanej Akademia Górniczo-Hutnicza w Krakowie Katedra Geoinformatyki i Informatyki Stosowanej AGH Konsultacje: wtorek godz. 10:00 11:00 lesniak_et_agh.edu.pl Materiały: home.agh.edu.pl/~lesniak Oceny: - Kolokwium z wykładów - Kolokwium z ćwiczeń
Plan wykładu. Wstęp Modelowanie i analiza danych przestrzennych a systemy GIS (oprogramowanie, zastosowanie). Modele danych przestrzennych. Rodzaje analiz przestrzennych. Powtórka - podstawowe definicje i twierdzenia statystyki matematycznej Prosta regresja liniowa i nieliniowa Analiza punktowych wzorców przestrzennych Metody analizy danych punktowych elementy geostatystyki Przestrzenna autokorelacja i autoregresja Regresja wielowymiarowa Literatura: 1. Houlding S. W., Practical geostatistics : modeling and spatial analysis, Springer, 2000. 2. Haining, R. P. Spatial data analysis : theory and practice, Cambridge University Press, 2004. 3. Schabenberger, O., Gotway, C., A., Statistical methods for spatial data analysis. Chapman & Hall/CRC / Taylor & Francis Group, 2005. 4. Applied GIS and spatial analysis, John Stillwell, J., Graham Clarke, G., John Wiley & Sons, 2004. GIS Oszałamiająca kariera technologii która pojawiła się niecałe pół wieku temu i której podstawą są dane przestrzenne i prowadzone w oparciu o nie analizy OBIEKT PRZESTRZENNY Komponent opisowy Komponent przestrzenny (np. nazwa państwa, liczba ludności) W przestrzeni 2D lub 3D geometria (położenie w przestrzeni geograficznej, kształt, orientacja itp., np. poligon, linia, punkt) topologia (przestrzenne relacje występujące pomiędzy obiektami, np. graniczenie, przecinanie się, zawieranie)
Zastosowanie analiz przestrzennych. Typowe obszary zastosowań systemów wykorzystujących technologie analiz przestrzennych (w tym GIS-u) : 1) Urzędy administracji centralnej oraz lokalnej (np. zarządzanie gruntami, planowania przestrzennego). 2) Administracja budynków mieszkalnych (mapa budynków). 3) Urzędy statystyczne. 4) Służby ratownicze (szybka lokalizacja miejsca wypadku, wspomaga zarządzanie sytuacjami kryzysowymi) 5) Wojsko (planowanie, dowodzenie logistyka). 6) Ośrodki geodezyjno-kartograficzne (tworzenie map). 7) Dziedziny z końcówką -ogia w nazwie (np. geologia, sejsmologia, archeologia). 8) Ochrona środowiska (prognozy, analiza zanieczyszczeń, zarządzanie parkami narodowymi). 9) Leśnictwo i rolnictwo (mapy upraw, mapy terenów leśnych). 10) Firmy transportowe. 11) Medycyna. 12) Turystyka. 13) Porty lotnicze. 14).. Reprezentacja środowiska przyrodniczego Różnoskalowa reprezentacja wybranej części powierzchni Ziemi lub jej najbliższego otoczenia. Wierna reprezentacja środowiska przyrodniczego nie jest możliwa ze względu na jego nieskończoną złożoność.wybór stopnia szczegółowości reprezentacja środowiska odgrywa kluczowe znaczenie w tworzeniu reprezentacji. Środowisko przyrodnicze może być reprezentowane przez: obiekty dyskretne Cechy: policzalność; zdefiniowane granice; można rozróżnić na podstawie wymiarów; należą do jednej z kategorii: punkty, linie, obszary; pola (wektorowe, skalarne) Cechy: reprezentacja ciągła wyrażona przez zmienne, których wartości mogą być określone w dowolnym punkcie pola; pola mogą być rozróżniane na podstawie stopnia ich zróżnicowania i wygładzenia; h=f(x,y)
Modele danych przestrzennych. Podstawowe modele danych: 1. CAD 2. Rastrowy 3. Wektorowy 4. Sieci 5. TIN 6. Obiektowy Modele danych przestrzennych. Wybór odpowiedniego modelu danych warunkuje m.in.: Sposób przechowywania danych. Rodzaje analiz, jakie można przeprowadzić. Sposób wyświetlania informacji. Rodzaje zależności pomiędzy obiektami. W projektach GIS wybór odpowiedniego modelu danych ma kluczowe znaczenie. Od przyjętego modelu świata rzeczywistego zależy bowiem dokładności i przydatności otrzymanych wyników.
Model CAD (ang. Computer-Aided Design) W systemie CAD obiekty rzeczywiste reprezentowane są za pomocą punktów, linii i wieloboków, gładkich krzywych. Wady: Obiekty zdefiniowane we współrzędnych rysunku a nie we współrzędnych geograficznych; Trudno powiązać poszczególne obiekty z atrybutami (brak niepowtarzalnych identyfikatorów); Nie uwzględniają powiązań pomiędzy obiektami (informacja niezbędna w przypadku analiz przestrzennych); Model rastrowy. Rastrowy model danych wykorzystuje do reprezentacji obiektów macierz elementów (pikseli). W komórkach rastra przechowywane są wartości atrybutów. W pewnych systemach każdemu pikselowi może być przypisanych kilka różnych cech, które przechowywane są w tabeli atrybutów. Metadane zawarte są w nagłówku pliku. Typowe metadane zawierają informacje o: współrzędnych geograficznych górnego lewego narożnika siatki; wielkości komórki; liczbie komórek w wierszach i kolumnach; przyjętym odwzorowaniu kartograficznym;
Model wektorowy. Prosty Topologiczny Prosty model wektorowy (spaghetti) Elementami prostego modelu wektorowego są: punkty, linie, polilinie, powierzchnie. Każdy obiekt definiowany jest niezależnie od innych obiektów. Istotne jest uporządkowanie współrzędnych. Model wektorowy (prosty)
Polilinia Poligon a b c d e Polilinia: a segment liniowy b zwykła c - złożona d zamknięta e monotoniczna f niemonotoniczna f Poligon: a prosty b złożony c - wypukły d monotoniczny e poligon z oknem f region (zbiór poligonów) Prosty model wektorowy. W sytuacji złożonych obiektów powierzchniowych pojawia się problem ich opisu za pomocą jednego ciągu punktów. W celu rozwiązania tego problemy tworzy się dodatkowe (fikcyjne) w obrębie obiektu. Złożony obiekt powierzchniowy (jezioro z wyspą na środku)
Prosty model wektorowy. 1 2 Zalety: Wady: Prostota: łatwe wprowadzanie danych do bazy (obiekty są niezależne). Opis kompletny pod względem geometrycznym. Brak informacji o topologii. W celu wykrycia związków przestrzennych między obiektami konieczne jest wykorzystanie metod geometrii analitycznej. Redundancja danych (strata pamięci, konieczność zapewnienia identyczności). Ryzyko niezgodności danych Brak ograniczeń dotyczących położenia obiektów np. brak punktów przecięcia dla przecinających się poligonów czy linii Model wektorowy (topologiczny) W topologicznym modelu wektorowym wyodrębnia się trzy rodzaje elementów topologicznych: Zerowymiarowe (punkty węzłowe). Jednowymiarowe (linie graniczne). Dwuwymiarowe (obszary). Dla wymienionych elementów można zapisać wszystkie wzajemne relacje. Elementy klasy wyższej budowane są zawsze z elementów klasy niższej. Topologiczny model wektorowy.
Topologiczny model wektorowy. Zapisywanie relacji. Przypisywanie relacji topologicznych do elementów zerowymiarowych. Granice obszarów: Topologiczny model wektorowy. Zapis relacji. Przypisywanie relacji topologicznych do elementów jednowymiarowych.
Model TIN TIN (ang. Triangulated Irregular Network ) służy do reprezentacji powierzchni w systemach GIS (modelowanie 2.5 D) za pomocą sąsiadujących ze sobą i nie pokrywających się trójkątów. TIN tworzy się na podstawie zbioru punktów o znanych współrzędnych x, y, z. Możliwość dostosowania rozmiarów trójkątów tak aby jak najlepiej odzwierciedlić zmienność modelowanego parametru. Model obiektowy Obiekt jest podstawową, najmniejszą jednostką obiektowego modelu danych i składa się ze wszystkich właściwości, które opisują jego stan oraz metod, które opisują jego zachowanie. Cechy geometryczne traktowane są jako każda inna właściwości obiektu i nie są w żaden sposób wyróżniane. Obiekty przestrzenne tego samego typu są grupowane w klasach obiektów. Wszystkie obiekty w obrębie jednej klasy charakteryzuje ten sam typ wzajemnych relacji, które mogą zachodzić także z obiektami z innych klas. Zalety obiektowych modeli: Kapsułkowanie (każdy model zawiera jednocześnie opis swojego stanu i zachowania); Dziedziczenie (zdolność do wielokrotnego wykorzystywania jednej lub wszystkich właściwości obiektu w odniesieniu do innego obiektu); Polimorfizm (każdemu obiektowi możemy przypisać specyficzne dla niego sposoby rysowania, tworzenia i usuwania);
Przykłady analiz przestrzennych Rodzaj analizy przestrzennej, dokładność jej wyników zależą od modelu danych z jakiego korzystamy. Przykłady analiz przestrzennych: klasyfikacja; buforowanie; analiza sieciowa; obliczanie powierzchni i długości; wizualizacja; Klasyfikacja Obiekty na mapie mogą być wizualizowane w sposób zależny od ich atrybutów opisowych.
Buforowanie Wokół obiektów wyznaczana jest strefa o wielkości określanej za pomocą promienia podanego przez użytkownika. Selekcja obiektów Selekcja obiektów: Poprzez lokalizację; Poprzez atrybut;
Przykład analizy przestrzennej Wyszukiwanie najlepszej lokalizacji dla: Hotelu; Wysypiska śmieci; Stoku narciarskiego; Analiza danych przestrzennych Analiza danych przestrzennych jest kwintesencją systemów geoinformacyjnych ponieważ dotyczy wszelkiego rodzaju przekształceń i obliczeń, których celem jest odpowiednie przygotowanie informacji przestrzennej do celów decyzyjnych i naukowych. Analiza danych przestrzennych ujawnia ukryte prawidłowości! Istnieją różne poziomy analizy danych przestrzennych, od bardzo prostych pomiarów do skomplikowanych modeli. W naukach o Ziemi opracowano wiele metod analizy danych przestrzennych, jednak nadal ogromną rolę odgrywa postrzeganie i rozpoznawanie kształtów, jakie odbywa się w oku i mózgu człowieka.
Analiza danych przestrzennych Analiza przestrzenna to zbiór procedur, których wynik obliczeń zależy od położenia danych wejściowych. Metody analizy danych przestrzennych: Kwerenda (zapytanie użytkownika baz danych). Pomiar (wyznacza proste charakterystyki geometryczne obiektów). Przekształcenie (operacja, w której dane przestrzenne ulegają zmianie w wyniku zastosowania operatorów geometrycznych, arytmetycznych lub logicznych). Charakterystyki opisowe (ich celem jest opis zbioru danych za pomocą kilku liczb, są one przestrzennym odpowiednikiem parametrów statystycznych). Metody optymalizacyjne (używane w celu wskazania najlepszej lokalizacji obiektu na podstawie dobrze zdefiniowanych kryteriów). Testowanie hipotez (wnioskowanie na podstawie ograniczonego zbioru danych w celu sformułowania pewnego uogólnienia odnoszącego się do populacji generalnej). Analiza danych przestrzennych. Kwerenda. Kwerenda to zapytanie użytkownika bazy danych. Nie następuje tu żadna zmiana danych, a poszukiwane są jedynie dane spełniające odpowiednie kryteria. Przeszukiwanie bazy danych za pomocą kwerend dostarcza różnych informacji zestawionych według wymagań użytkownika. Formułowanie kwerend: z wykorzystaniem języka SQL (ang. Structured Query Language ). komendy głosowe (często wykorzystywane w systemach nawigacji drogowej). Przykład kwerendy w języku SQL: SELECT nazwa_miasta FROM baza_danych WHERE liczba_mieszkanców>20000;
Analiza danych przestrzennych. Kwerenda w QGIS. Dane: Mapa wektorowa lotnisk na terenie Alaski (zielone punkty). Zadanie: Szukamy lotnisk o charakterze militarnym, które położone są na obszarach powyżej 200 m n.p.m. Istotne atrybuty: Nazwa Wysokość n.p.m. Charakter lotniska Lokalizacja lotnisk dla obszaru Alaski. Tabela trybutów warstwy: airports Analiza danych przestrzennych. Kwerenda w QGIS. Rozwiązanie: Korzystamy z kreatora zapytań w programie QGIS. Fragment kwerendy SQL Wybrane lotniska (czerwone punkty). Możliwość budowania bardziej złożonych zapytań.
Analiza danych przestrzennych. Pomiar. Pomiar wyznacza proste charakterystyki geometryczne obiektów (długość, pole powierzchni, kształt). Wiele analiz przestrzennych wymaga pomiarów kartometrycznych, gdy np. chcemy poznać pole powierzchni działek albo odległość między dwoma punktami. Tradycyjne pomiary na mapach są bardzo pracochłonne, jednak można je łatwo zautomatyzować, jeśli dysponujemy mapami w postaci cyfrowej. To właśnie możliwość szybkiego pomiaru powierzchni dała impuls do rozwoju pierwszego programu GIS! Analiza danych przestrzennych. Pomiar. Odległość i długość Należy pamiętać: Polilinia jest tylko przybliżeniem geometrii prawdziwego obiektu (np. koryto rzeki ma zazwyczaj łagodne krzywizny natomiast w reprezentacji GIS otrzymujemy ostre załomy). Przebieg linii na mapie jest zawsze jej rzutem ortogonalnym na płaską powierzchnię. Różnica pomierzonej długości od długości rzeczywistej może być znaczna, zwłaszcza gdy linia ma w rzeczywistości duże nachylenie. Podobny problem przy obliczaniu powierzchni działek. Wynik pomiaru długości obiektu za pomocą programu GIS jest prawie zawsze zaniżony. W systemach geoinformacyjnych, gdzie jest dostępny cyfrowy model terenu, możemy obliczyć poprawną długość i powierzchnię obiektów!
Analiza danych przestrzennych. Przekształcenia. Bufory. Wyznaczenie obszaru oddalonego od obiektu (punktu, prostej, poligonu) o określoną odległość. Rezultatem zastosowania tej analizy jest obszar lub kilka obszarów (poligonów), które mogą być na przykład złączone (merge) w miejscach, w których się nakładają. W przypadku danych rastrowych wyznaczenie bufora polega na wskazaniu pikseli, które są oddalone od analizowanego obiektu o zadany promień. Analizy przestrzenne. Przekształcenia. Bufory. Bufor: Może mieć stałą lub zmienną szerokość. Może być wygenerowany wokół obiektu lub po jednej z jego stron. Może być zakończony w formie zaokrąglonej lub kwadratowej. Można stworzyć bufory w różnych odległościach od elementów. Bufory można przecinać, nakładać, różnicować, sumować itp.
Bufory w QGIS Dane: Mapa wektorowa głównych rzek Alaski (linie niebieskie). Mapa wektorowa linii kolejowej na Alasce (linie czerwone). Mapa wektorowa budynków Alaski (pomarańczowe punkty). Zadanie: Wybierz te budynki, które znajdują się w odległości mniejszej niż 50 km od rzek i równocześnie w odległości mniejszej niż 100 km od linii kolejowej. Bufory w QGIS Rozwiązanie: Korzystając z opcji Bufor budujemy bufor o wielkości 50km wzdłuż rzek (Poligon1) Korzystając z opcji Bufor budujemy bufor o wielkości 100km wzdłuż linii kolejowych (Poligon2). Korzystając z opcji Iloczyn wyznaczamy obszar wspólny (Poligon3) dla wcześniej utworzonych buforów Korzystając z opcji Wybór przez lokalizację szukamy budynków położonych w obrębie Poligon3.
Analizy sieciowe Model sieciowy składa się z linii i węzłów, które połączone są topologicznie. Dla linii zdefiniowane są kierunki przepływu. Wyróżniamy przepływ jedno- i dwukierunkowy. Podczas tworzenia modelu sieciowego określa się właściwości poszczególnych jego elementów np.: - utrudnienia przepływu, - warunki w węzłach, - bariery. Analizy sieciowe Analizy sieciowe służą przede wszystkim do wyznaczania optymalnej ścieżki pomiędzy obiektami w sieci. Kryterium optymalizacji: czas, odległość, koszty. Przykłady: znalezienie optymalnego połączenia pod względem postawionych warunków; analiza lokalizacji czyli znalezienie najbliżej położonego obiektu (bank, szpital) od wskazanego miejsca; analiza alokacji czyli znalezienie wszystkich dróg oddalonych od punktu początkowego o zadaną wartość; analiza trasowania czyli wyznaczania optymalnej trasy przebiegającej przez n zadanych punktów. obliczanie czasu przejazdu z punktu A do B.
Analizy sieciowe Analiza danych przestrzennych. Przekształcenia. Interpolacja przestrzenna. Interpolacja przestrzenna wykorzystuje cechę autokorelacji do szacowania wartości w danym punkcie na podstawie danych pomiarowych. Powszechnie stosowane metody interpolacji: Wieloboki Thiessena. Metoda odwrotnych odległości. Kriging.
Analiza danych przestrzennych. Przekształcenia. Interpolacja przestrzenna. Metoda odwrotnych odległości Jedna z najczęściej stosowanych metod interpolacji przestrzennej. W metodzie tej wartość zmiennej w punkcie interpolacji jest wyznaczana jako średnia ważona z otaczających punktów pomiarowych. Istnieje kilka metod wyznaczania współczynników wagowych. Najpowszechniejszy jest wzór, w którym współczynnik wagowy jest odwrotnością kwadratu odległości. Analiza danych przestrzennych. Przekształcenia. Interpolacja przestrzenna. Kriging to geostatystyczna metoda interpolacji. Metoda ta wykorzystuje w swoich obliczeniach informacje o zmienności przestrzennej wartości badanego parametru, opisanej semiwariogramem.