Przestrzenne dane statystyczne w służbie mieszkańca i przedsiębiorcy dr inż. Janusz Dygaszewicz Dyrektor Departamentu Systemów Teleinformatycznych, Geostatystyki i Spisów Główny Urząd Statystyczny Prezes Europejskiego Forum Geografii i Statystyki EFGS Członek Europejskiego Komitetu Wykonawczego ONZ dla Globalnego Zarządzania Danymi Geoprzestrzennymi UN-GGIM: EUROPE 09.05.2019 Warszawa 1
Misja statystyki publicznej Dostarczanie wiarygodnych, rzetelnych, niezależnych i wysokiej jakości informacji statystycznych największy zasób informacyjny klasyfikacje standardy metainformacyjne ustandaryzowany proces produkcji statystycznej nowoczesne techniki zbierania danych nomenklatury nowoczesne rozwiązania IT referencyjność publikowanych danych doświadczenie 2
Moc danych statystycznych Nowelizacja ustawy o statystyce publicznej z dnia 9 kwietnia 2015 r. (Dz. U. poz. 855) zapewniła m.in.: szeroki dostęp statystyki publicznej do danych administracyjnych, wzmocnienie roli Prezesa GUS: określanie zawartości informacyjnej i jakości źródeł administracyjnych, kształtowanie prowadzonych, modernizowanych i powstających systemów administracji publicznej co pozwala na zapewnienie stosowania w nich standardów identyfikacyjnych, klasyfikacyjnych i definicyjnych. 3
Zasada 3R Wyniki obliczeń, opracowań i analiz dokonanych na podstawie zebranych danych statystycznych są powszechnie dostępne Równoprawność każdy zainteresowany ma jednakowe prawo dostępu do informacji Równorzędność nie wyróżnia się podmiotów, dla których przeznaczone byłyby określone informacje Równoczesność informacje są podawane do powszechnej wiadomości w jednym określonym czasie, bez czynienia jakichkolwiek wyjątków 4
Różnorodność dostępnych danych 5
Przestrzenne Bazy Adresowe dane przestrzenne opracowane w statystyce Statystyczne punkty adresowe: Prawie 6,5 milionów punktów adresowych dla budynków mieszkalnych Granice podziału statystycznego: Rejony statystyczne (ponad 34 tys.) Obwody spisowe (ponad 187 tys.) 6
Materiały źródłowe Mapy statystyczne z granicami podziału statystycznego Szkice sytuacyjne z informacją adresową Ortofotomapa Ewidencja gruntów i budynków PRG (Państwowy Rejestr Granic) LPIS (Land Parcel Identification System) Drogi i ulice PRNG (Państwowy Rejestr Nazw Geograficznych) BDOT (Baza Danych Obiektów Topograficznych) 7
Portal Geostatystyczny Połączenie danych statystycznych i informacji przestrzennej najniższego poziomu punktu adresowego w interaktywnych prezentacjach przestrzennych BANK DANYCH LOKALNYCH NARODOWY SPIS POWSZECHNY LUDNOŚCI I MIESZKAŃ 2011 POWSZECHNY SPIS ROLNY 2010 Nieskończona liczba interaktywnych wizualizacji wynikowych informacji statystycznych w postaci kartogramów, kartodiagramów, siatek i raportów 8
9
Prezentacja zjawiska tematycznego za pomocą kartogramu 10
Prezentacja zjawiska tematycznego za pomocą kartodiagramu złożonego 11
Możliwość wygenerowania raportu i zapisania w pliku.doc lub.xls stat.gov.pl 12
Dane w siatkach kilometrowych 13
14 14
15
Przestrzenne Dane Statystyczne w Systemie Informacyjnym Państwa (PDS) Poszerzenie zakresu oraz dostępności informacji statystycznych i metod analiz geostatystycznych wykorzystujących zasoby statystyki publicznej 16
Czas trwania projektu Projekt PDS jest realizowany od 2018-07-01 do 2021-06-30 17
Projektowane e-usługi 18
[US-05] Usługa wspomagająca wzbogacanie treści Usługi w ramach projektu PDS [US-04] Usługa modelowania geostatystycznego [US-03] Usługa geostatystycznych analiz eksploracyjnych Usługa dostępu do danych i analiz geostatystycznych [US-01] Urządzenia komputerowe [US-02] Urządzenia mobilne [US-06] Usługa wspierająca aktualizację wybranych obiektów rejestru TERYT PDS Dane statystyczne Dane użytkownika Dane georeferencyjne 19
Usługi rozbudowywane W ramach podzespołu rozpoczęto prace koncepcyjne związane z modernizacją i projektowaniem usług: US-01 Usługa dostępu z urządzeń komputerowych do wynikowych informacji statystycznych zgromadzonych w Portalu z możliwością wykonywania zaawansowanych analiz przestrzennych oraz do danych i metadanych infrastruktury informacji przestrzennej; US-02 Usługa dostępu z urządzeń mobilnych do wynikowych informacji statystycznych zgromadzonych w Portalu oraz do ich wizualizacji na mapach; 20
US-01 Usługa dostępu z urządzeń komputerowych do wynikowych informacji statystycznych zgromadzonych w Portalu z możliwością wykonywania zaawansowanych analiz przestrzennych oraz do danych i metadanych infrastruktury informacji przestrzennej Kategorie tematyczne założeń do rozbudowy: mapy tematyczne interfejs aplikacji mapowej siatki kilometrowe wykorzystanie produktów systemu społeczność infrastruktura informacji przestrzennej inne 21
Wyliczenie dynamicznej siatki podziału przestrzennego Komórki siatki podziału przestrzennego dostosowane do gęstości rozmieszczenia populacji Większa precyzja prezentowanych danych w gęsto zaludnionych obszarach przy jednoczesnym zachowaniu tajemnicy statystycznej 22
Wykorzystanie produktów systemu zagadnienia związane z eksportem produktów aplikacji mapowej Portalu Geostatystycznego w formie wydruków i innych plików. Przykładowe zagadnienia: Umożliwienie łatwego importu / eksportu danych w otwartych formatach danych przestrzennych do edycji m.in. w aplikacjach open source. Umożliwienie eksportu map tematycznych w formie wektorowej do edycji w zewnętrznych aplikacjach; Umożliwienie zagnieżdżenia produktu aplikacji mapowej na innej stronie poprzez blok kodu HTML; Umożliwienie edycji i przesuwania elementów prezentacji tematycznej na wydruku (np. diagramy, etykiety); Publikacja danych w formie otwartych połączonych danych (linked open data). 23
Społeczność zagadnienia związane z użytkownikami i ich wzajemną interakcją. Przykładowe zagadnienia: Umożliwienie zapisu produktów aplikacji mapowej przez użytkowników w formie prywatnej lub publicznej; Umożliwienie dzielenia się z tworzonymi produktami z innymi użytkownikami w ramach społeczności PDS lub w mediach społecznościowych (dedykowane linki); Stworzenie repozytorium analiz przestrzennych / produktów aplikacji mapowej, gdzie dostępne będą wszystkie produkty oznaczone jako publiczne. 24
US-02 Usługa dostępu z urządzeń mobilnych do wynikowych informacji statystycznych zgromadzonych w Portalu oraz do ich wizualizacji na mapach Główne założenia rozbudowy tej usługi: Rozbudowa narzędzi tworzenia map tematycznych Rozszerzone wykorzystanie usług lokalizacji Społeczność Optymalizacja działania aplikacji 25
US-03 Usługa umożliwiająca zastosowanie eksploracyjnych analiz danych przestrzennych wykorzystujących informacje statystyczne udostępniane przez Portal Efektem budowy usługi będzie m.in. możliwość: Identyfikacji, opisu i prezentacji graficznej rozkładu przestrzennego analizowanych zmiennych; Wykrycia nietypowych obserwacji; Określenia przestrzennych powiązań, współzależności i występowania skupień; Zbadania heterogeniczności lub autokorelacji przestrzennej stat.gov.pl 26
Geostatystyczne analizy eksploracyjne Statystyki tendencji centralnej Statystyki dyspersji Czy zmienić lokalizację punktu usługowego? Który z punktów usługowych jest bardziej dostępny dla klientów? Podatność przejścia klientów do konkurencyjnego punku usługowego? 27
Analiza dotychczasowej działalności biznesowej strefa oddziaływania Odległość po sieci dróg Odległość w linii prostej Czas dojazdu 28
US-04 Usługa umożliwiająca wykonanie analiz z zakresu modelowania geostatystycznego Efektem budowy usługi będzie m.in. możliwość: Zbudowania i zastosowania modelu pozwalającego na wnioskowanie (estymowanie) o wartości zmiennej objaśnianej na podstawie wyników badania próby losowej (tj. na podstawie zebranych danych); Wizualizacji oraz publikowania uzyskanych wyników analiz. stat.gov.pl 29
Analiza dotychczasowej działalności biznesowej 1500 1000 500 0 PU1 PU2 Dochód 3 000-4 000 PLN Wykształcenie Średnie Wiek 40-50 lat 30
Budowa modelu analitycznego 2000 1000 0 PU1 PU2 Dochód 3 000-4 000 PLN Wykształcenie Średnie Wiek 40-50 lat f x 1, x 2, x 3, 31
Estymowanie wyników biznesowych Prognozowany obrót 400000 300000 200000 100000 0 PU3 PU4 PU5 f x 1, x 2, x 3, 32
Interpolacja przestrzenna Lokalizacja punktów pomiarowych Interpolacja kriging Powierzchnia rzeczywista stat.gov.pl 33
US-05 Usługa wspomagająca wzbogacanie treści własnych użytkownika o informacje i analizy geostatystyczne udostępniane przez Portal Efektem budowy usługi będzie m.in. możliwość: Wykonania analizy własnych treści użytkownika w celu wykrywania powtórzeń, podobieństw oraz kategoryzacji tekstu. Wybranie najbardziej pasujących do wykrytych słów oraz fraz kluczowych obiektów w Systemie PDS oraz ustalenie zależności pomiędzy wyszukanymi obiektami w Systemie PDS, w celu wytypowania analiz dostępnych w Systemie PDS. Na podstawie ustalonych zależności konfigurowanie i udostępnianie w postaci graficznej wybranych przez użytkownika analiz przestrzennych. Wykrywanie trendów zainteresowań użytkowników danymi tematami. stat.gov.pl 34
US-05 Usługa wspomagająca wzbogacanie treści własnych użytkownika o informacje i analizy geostatystyczne udostępniane przez Portal Reguły Użytkownik Wybrane analizy geostatystyczne Metadane Dane 35
US-06 Usługa wspierająca aktualizację wybranych obiektów rejestru TERYT wraz z powiązanymi z nimi obiektami georeferencyjnymi Efektem budowy usługi będzie usprawnienie procesu przygotowania warstw przestrzennych w statystyce publicznej: aktualizacji TERYT i Przestrzennych Baz Adresowych (PBA); integracji z systemami zewnętrznymi (danych z Ewidencji Miejscowości, Ulic i Adresów (EMUiA) udostępnianych przez rejestr PRG) 36
Plan zaangażowania użytkowników projektu PDS Zaangażowanie użytkowników w projektowanie produktów na wszystkich etapach budowy systemu. Obecnie przygotowana została ankieta, w której użytkownicy będą zgłaszali swoje potrzeby. Ankieta dostępna na stronie geo.stat.gov.pl Wnioski z ankiety posłużą do określenia wymagań dla systemu. 37
Wolne i Otwarte Oprogramowanie Open source to oprogramowanie o dostępnym źródle dzięki czemu każdy może sprawdzić funkcjonalności i poziom bezpieczeństwa oprogramowania. Dostępne źródło pozwala na tworzenie własnego, dostosowanego dokładnie do potrzeb oprogramowania. Istnieje wiele przykładów WiOO: stat.gov.pl 38
Wykorzystanie open source w statystyce Manifest Open pierwszy krok do stworzenia strategii Open source Strategia Open Source dokument strategiczny, wskazujący drogę do wykorzystania możliwości wolnego oprogramowania stat.gov.pl 39
Działalność europejska na rzecz integracji danych statystycznych i geoprzestrzennych Główny Urząd Statystyczny od kilku lat bierze czynny udział w wielu międzynarodowych projektach inicjowanych w ramach Europejskiego Systemu Statystycznego (ESS) w zakresie wykorzystania informacji geograficznych w statystyce oraz koordynowanych przez takie organizacje jak Eurostat, UN-GGIM Europe i UNECE 40
Platformy komunikacji na rzecz współpracy i integracji działań w zakresie łączenia danych statystycznych i geoprzestrzennych w Europie GISCO UN-GGIM: Europe WG on Data Integration DATA INTEGRATION EFGS UNECE GEOSTAT 41
Model 10-poziomowy harmonizacji przestrzennej 42
Działalność na rzecz integracji danych statystycznych i geoprzestrzennych Polska aktywnie promuje integrację informacji statystycznych i geoprzestrzennych oraz wdrażanie Globalnych Ram Odniesienia Przestrzennego dla Statystyki poprzez aktywny udział w Globalnym i Regionalnym Komitecie ONZ UN-GGIM. Globalne Ramy Odniesienia Przestrzennego dla Statystyki (GSGF) 43
Dziękuję za uwagę dr inż. Janusz Dygaszewicz Główny Urząd Statystyczny j.dygaszewicz@stat.gov.pl stat.gov.pl 44