Centrum Informacji o Środowisku UNEP/GRID-Warszawa ul. Sobieszyńska 8, 00-764 Warszawa. Instytut Geografii i Przestrzennego Zagospodarowania PAN

Podobne dokumenty

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Testy nieparametryczne

Sprawozdanie z realizacji I etapu prac Umowy z dnia 24 lipca 2012 (nr 192/2012), której przedmiotem jest:

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Oszacowanie i rozkład t

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Wnioskowanie statystyczne. Statystyka w 5

aktualny stan realizacji zadań ministra właściwego do spraw budownictwa, gospodarki przestrzennej i mieszkaniowej wynikających z przepisów ustawy z

Estymacja punktowa i przedziałowa

Spis treści 3 SPIS TREŚCI

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Statystyka matematyczna dla leśników

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Estymacja parametrów rozkładu cechy

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

STATYSTYKA INDUKCYJNA. O sondażach i nie tylko

Porównywanie populacji

Grupowanie materiału statystycznego

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

WNIOSKOWANIE STATYSTYCZNE

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Pobieranie prób i rozkład z próby

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Estymacja przedziałowa. Przedział ufności

Weryfikacja hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

W1. Wprowadzenie. Statystyka opisowa

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Metody Statystyczne. Metody Statystyczne.

Estymacja parametro w 1

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Analiza niepewności pomiarów

Zawartość. Zawartość

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

BADANIA STATYSTYCZNE W ZAKRESIE PLANOWANIA PRZESTRZENNEGO I REWITALIZACJI NA RZECZ POLITYKI SPÓJNOŚCI

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Testowanie hipotez statystycznych

Rozkłady statystyk z próby. Statystyka

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

laboratoria 24 zaliczenie z oceną

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. Strona 1

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Wykład ze statystyki. Maciej Wolny

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Sposoby prezentacji problemów w statystyce

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

METODY STATYSTYCZNE W BIOLOGII

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Podstawowe definicje statystyczne

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Wnioskowanie bayesowskie

ESTYMACJA. Przedział ufności dla średniej

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

166 Wstęp do statystyki matematycznej

Opis przedmiotu: Probabilistyka I

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Wykład 9 Testy rangowe w problemie dwóch prób

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 9 Wnioskowanie o średnich

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Statystyka matematyczna i ekonometria

Z-LOGN1-006 Statystyka Statistics

Podstawowe pojęcia statystyczne

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

1.1 Wstęp Literatura... 1

Metody doboru próby do badań. Dr Kalina Grzesiuk

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Prognoza demograficzna dla gmin województwa dolnośląskiego do 2035 roku

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Planowanie przestrzenne w świetle ustawy z dnia 4 marca 2010 r. o infrastrukturze informacji przestrzennej

Transkrypt:

Centrum Informacji o Środowisku UNEP/GRID-Warszawa ul. Sobieszyńska 8, 00-764 Warszawa Instytut Geografii i Przestrzennego Zagospodarowania PAN ul. Twarda 51/55, 00-818 Warszawa Sprawozdanie z realizacji II etapu prac Umowy z dnia 24 lipca 2012 (nr 192/2012), której przedmiotem jest opracowanie metodyki prognozowania informacji o zasobach danych, umożliwiającej wyliczenie wskaźników dla tematu zagospodarowanie przestrzenne dla całej Polski. Warszawa, październik 2012 Strona 1 z 18

Zespół realizujący: Koordynator: mgr Maria Andrzejewska (Centrum UNEP/GRID-Warszawa) Koordynacja merytoryczna: dr hab. Jerzy Solon (Instytut Geografii i Przestrzennego Zagospodarowania PAN) mgr Andrzej Affek autor wiodący, (Instytut Geografii i Przestrzennego Zagospodarowania PAN) mgr Barbara Hejłasz (Centrum UNEP/GRID-Warszawa) mgr Monika Rusztecka (Centrum UNEP/GRID-Warszawa) Opracowanie jest sprawozdaniem z prac wykonanych w ramach Umowy z dnia 24 lipca 2012 roku (nr 192/2012) w Warszawie pomiędzy: Skarbem Państwa - Ministrem Transportu, Budownictwa i Gospodarki Morskiej Zamawiającym, a Narodową Fundacją Ochrony Środowiska - Centrum Informacji o Środowisku UNEP/GRID-Warszawa Wykonawcą. Strona 2 z 18

Zawartość 1. Wstęp...5 2. Analiza reprezentatywności próby...6 3. Wyniki ankiety... 10 4. Wyniki estymacji... 11 5. Wskaźnik monitorowania ilości zbiorów danych przestrzennych w temacie Land use dla całej Polski na szczeblu gminy... 15 6. Porównanie danych (ankieta Land use w gminach dane GUS)... 17 7. Wnioski optymalizacyjne... 17 8. Literatura... 18 Strona 3 z 18

Zakres opracowania Przedmiotem niniejszego opracowania jest prezentacja wyników prac mających na celu przygotowanie metodyki prognozowania (estymacji) informacji o zasobach danych przestrzennych, umożliwiającej obliczenie wskaźników monitoringu dla tematu zagospodarowanie przestrzenne, z III załącznika Dyrektywy INSPIRE. Zakres prac obejmował analizę wyników przeprowadzonego badania ankietowego (etap I realizacji Umowy) w celu określenia reprezentatywnej próby gmin, która umożliwia obliczenie wskaźników monitoringu dla całej Polski w trzech wariantach: 1. dla studium uwarunkowań i kierunków zagospodarowania przestrzennego oraz miejscowych planów zagospodarowania przestrzennego, 2. dla rejestrów z zakresu zagospodarowania przestrzennego, 3. dla obu powyższych przypadków łącznie. Mając na uwadze definicję tematu zagospodarowanie przestrzenne oraz metodykę monitoringu jego wskaźników przyjęto założenie, że analizy będą wykonane w następujących wariantach: 1. dla studium uwarunkowań i kierunków zagospodarowania przestrzennego oraz miejscowych planów zagospodarowania przestrzennego; 2. dla studium uwarunkowań i kierunków zagospodarowania przestrzennego; 3. dla miejscowych planów zagospodarowania przestrzennego wskazanych w studium uwarunkowań i kierunków zagospodarowania przestrzennego. Założenie to wynika bezpośrednio z faktu iż rejestry z zakresu zagospodarowania przestrzennego nie mają charakteru danych przestrzennych, tym samym nie są przedmiotem obowiązku monitorowania stanu infrastruktury informacji przestrzennej. Niniejsze opracowanie składa się następujących części: 1. Raportu z syntezą analizy wyników oraz wnioskami i rekomendacjami. 2. Załączników prezentujących wyniki automatycznej analizy danych pozyskanych w ramach badania ankietowego: a. Analizę reprezentatywności próby b. Wyniki badania ankietowego c. Tabelę zmiennych badanych w ankiecie. Analizy zostały wykonane w oprogramowaniu do analiz statystycznych SPSS oraz w oprogramowaniu narzędziowym ESRI ArcGIS. Strona 4 z 18

1. Wstęp Prognozowanie (estymacja) to dział wnioskowania statystycznego będący zbiorem metod pozwalających na uogólnianie wyników badania próby losowej na całą populację oraz szacowanie błędów wynikających z tego uogólnienia. W niniejszym opracowaniu estymacji na ogólnopolską populację gmin podlegać będą wybrane charakterystyki ujęte w badaniu ankietowym Land use w gminach realizowanym na zamówienie Ministra Transportu, Budownictwa i Gospodarki Morskiej. Charakterystyki te dotyczą liczby i powierzchni zbiorów danych przestrzennych dotyczących planowania i zagospodarowania przestrzennego na poziomie gmin. Dane te posłużą do wyliczenia wskaźników dla tematu zagospodarowanie przestrzenne dla całej Polski. W niniejszym opracowaniu zastosowano metodę estymacji parametrycznej, polegającej na znajdowaniu nieznanych wartości parametrów rozkładu (średnia, udział procentowy). Przedstawiono dwa sposoby szacowania poszukiwanej wartości parametrów: estymację punktową i przedziałową. W estymacji punktowej oceną wartości szukanego parametru jest konkretna wartość uzyskana z próby (estymator), natomiast w estymacji przedziałowej operuje się pojęciem przedziału ufności, czyli przedziału, do którego z pewnym prawdopodobieństwem należy szukana wartość. W opracowaniu przyjęto przedział ufności taki, że z prawdopodobieństwem równym 95% można stwierdzić, że szukana wartość należy do tego przedziału. Estymacja taka jest uprawniona tylko wówczas, gdy próba gmin biorących udział w badaniu ankietowym jest próbą reprezentatywną dla całej populacji gmin w Polsce. Próbę można nazwać reprezentatywną, gdy wystarczająco dobrze odzwierciedla strukturę istotnych z punktu widzenia badacza cech populacji. Cechy istotne gmin w tym badaniu to wartości zmiennych kontrolnych mogących mieć związek z planowaniem i zagospodarowaniem przestrzennym. Strona 5 z 18

2. Analiza reprezentatywności próby Celem analizy reprezentatywności było uzyskanie odpowiedzi na pytanie czy gminy-respondenci uczestniczące w badaniu ankietowym są reprezentatywne dla gmin w Polsce. Wytypowano 15 zmiennych kontrolnych o znanych wartościach dla wszystkich gmin w Polsce, które są bezpośrednio lub pośrednio związane z planowaniem przestrzennym. Następnie porównano wartości tych zmiennych dla gmin biorących udział w ankiecie z wartościami zmiennych dla pozostałych polskich gmin. Sprawdzono także reprezentatywność próby gmin pod względem położenia w przestrzeni. Analizowano następujące zmienne kontrolne: L p. NAZWA OPIS 1. zabud Udział procentowy terenów zabudowanych w 2010 roku 2. rolne Udział procentowy gruntów ornych w 2010 roku 3. lasy Udział procentowy lasów w 2010 roku 4. natura Udział procentowy obszarów NATURA 2000 w 2010 roku 5. POW_HA Powierzchnia gminy w ha w 2010 roku 6. UR_HA Powierzchnia użytków rolnych w 2010 roku 7. LUD10 Wielkość populacji w 2010 roku 8. 9. 10. 11. 12. 13. PO_2010 PP_2010 ODR_2010 UWZ_2010 PO10p PP10p Powierzchnia gminy (ha) objęta obowiązującymi MPZP w 2010 roku - ogółem Powierzchnia gminy (ha) objęta MPZP w trakcie sporządzania w 2010 roku Powierzchnia gruntów rolnych (ha), dla których zmieniono przeznaczenie na cele nierolnicze w 2010 roku Liczba wydanych pozytywnych decyzji o ustaleniu warunków zabudowy w 2010 roku Procent terenów gminy (ha) objęty obowiązującymi MPZP w 2010 roku Procent terenów gminy (ha) objęty MPZP w trakcie sporządzania w 2010 roku Strona 6 z 18

14. ODR10p Procent terenów gminy (ha), dla których zmieniono przeznaczenie na cele nierolnicze w 2010 roku 15. dochód_ogółem Dochód gminy ogółem w 2011 roku Wyniki szczegółowego badania reprezentatywności próby, także w podziale na rodzaje gmin i typy funkcjonalne wg Komornickiego i Śleszyńskiego (2008), zamieszczone są w załączniku 2. W poniższej tabeli przedstawiono informację o kodach stosowanych dla poszczególnych typów funkcjonalnych gmin. Typy funkcjonalne gmin 1. DR rdzenie obszarów metropolitalnych (tzw. MEGA s) 2. DP strefy zewnętrzne obszarów metropolitalnych 3. GR rdzenie innych miast powiatowych grodzkich 4. GP strefy zewnętrzne innych miast powiatowych grodzkich 5. M 6. MK 7. MT miasta powiatowe bez wyraźnej specjalizacji funkcjonalnej, na ogół z rozwiniętymi funkcjami przemysłowymi, czasem z funkcjami przyrodniczymi i rolniczymi pozostałe miasta powiatowe miasta powiatowe z rozwiniętą funkcją komunikacyjną spełnienie warunków dla typów K1 lub K2 - w miastach powiatowych miasta powiatowe z rozwiniętą funkcją turystyczną spełnienie warunków dla typu T w miastach powiatowych 8. K1 korytarze transportowe z intensywnym użytkowaniem (przemysł, turystyka) 9. K2 korytarze transportowe z ekstensywnym użytkowaniem (w tym rolnictwo i ochrona przyrody) 10. P gminy o rozwiniętej funkcji przemysłowej, niebędące stolicami powiatów 11. T gminy o rozwiniętej funkcji turystycznej 12. TP gminy o rozwiniętych funkcjach przemysłowych i turystycznych 13. R gminy o rozwiniętej funkcji rolniczej 14. RE gminy o rozwiniętej funkcji rolniczej wraz z obszarami cennymi przyrodniczo 15. E gminy z obszarami cennymi przyrodniczo 16. I inne gminy pozostałe gminy bez wyraźnej specjalizacji funkcjonalnej Strona 7 z 18

Zbiorcze wyniki porównania 15 zmiennych kontrolnych przedstawia tabela 1. Podstawowe wnioski wypływające z analizy reprezentatywności próby są następujące: liczebność próby jest satysfakcjonująca, dająca możliwość stosowania zróżnicowanych metod statystycznych i wychwycenia nawet niewielkich różnic na istotnym statystycznie poziomie, próba jest reprezentatywna w wymiarze geograficznym (przestrzennym), zaobserwowano jedynie lekką nadreprezentatywność gmin Polski północnozachodniej, w podziale na rodzaje gmin wyniki dla gmin wiejskich są najbardziej reprezentatywne, a dla gmin miejskich najmniej reprezentatywne, dla trzech typów funkcjonalnych gmin (TP, MT, DR) próba jest za mało liczna, żeby była reprezentatywna, najbardziej reprezentatywne wyniki uzyskano dla gmin o typach funkcjonalnych GR, MK, P, E, RE, K1 i M, ankietowane gminy wiejskie i w typie funkcjonalnym R charakteryzują się zdecydowanie większą powierzchnią obowiązujących MPZP, niż gminy nieankietowane, ankietowane gminy miejskie i miejsko-wiejskie charakteryzują się istotnie większym dochodem ogólnym gminy i większym zaludnieniem od ich nieankietowanych odpowiedników, pośrednio można domniemywać, że wartości zmiennych ujętych w ankiecie związanych z dochodem gminy dla gmin miejskich i wiejsko-miejskich oraz z powierzchnią obowiązujących MPZP dla gmin wiejskich będą wyższe niż dla populacji ogólnopolskiej; wartości te jako estymatory wartości dla populacji mogą być zawyżone. Strona 8 z 18

Tab. 1 Istotne różnice wartości zmiennych kontrolnych (> wartość większa w ankiecie, << różnica istotna na poziomie p<0,01) zabud rolne lasy natura POW_HA UR_HA LUD10 PO_2010 PP_2010 ODR_2010 UWZ_2010 PO10p PP10p ODR10p dochód_og ółem Cała próba W podziale na rodzaje gmin W podziale na typy funkcjonalne >> < < >> >> > > >> > >> >> Miejskie > > > > > Wiejskie >> >> Miejsko - wiejskie >> > > >> DR DP < < GR > GP > << < < M > > MK > MT K1 > > K2 < > > < > P > T < >> TP R >> > >> > RE E I < < Strona 9 z 18

3. Wyniki ankiety Szczegółowe wyniki badania ankietowego Land use w gminach przedstawione są w załączniku 3. do opracowania. Opracowano wyniki dla 354 zmiennych zawartych w ankiecie, dla kilku zmiennych także w podziale na rodzaje gmin i typy funkcjonalne. W zależności od charakterystyki pozycji w ankiecie (zmiennej) wyniki prezentowane są w różnej formie: statystyki opisowe (średnia, wartość minimalna i maksymalna, odchylenie standardowe i suma) dla zmiennych ciągłych na skali przedziałowej (m.in. dla powierzchni, udziałów procentowych) tabele częstości występowania dla zmiennych nominalnych i porządkowych o niewielkiej liczbie kategorii (np. odpowiedzi TAK/NIE) wykresy słupkowe dla zmiennych porządkowych o większej liczbie odpowiedzi histogramy rozkładu liczebności odpowiedzi (dla zmiennych o rozkładach znacznie odbiegających od rozkładu normalnego). Dla wybranych zmiennych przeprowadzono analizy korelacyjne i badanie różnic statystykami nieparametrycznymi. Strona 10 z 18

4. Wyniki estymacji Estymacja przedziałowa wartości średniej rozkładu oparta jest na przyjęciu za prawdziwe centralnego twierdzenia granicznego, mówiącego, że rozkład wartości średnich z prób losowych dąży do rozkładu normalnego. Przedziały ufności dla proporcji (procentów) zostały policzone z zastosowaniem zmodyfikowanej metody Walda zaproponowanej w 1998 roku przez Agresti i Coull (1998). W tabeli 1 przedstawiono średnią liczbę zbiorów danych przestrzennych wraz z 95% przedziałem ufności, oraz udział procentowy gmin, które nie posiadają takich zbiorów, wraz z 95% przedziałem ufności. Tab. 1 Liczba zbiorów danych przestrzennych w podziale na rodzaje gmin Rodzaj gmin N Średnia liczba zbiorów danych przestrzennych w gminie w próbie ogólnopolska (p=95%) Procent gmin bez zbiorów danych przestrzennych w próbie ogólnopolski (p=95%) Sumaryczna liczba zbiorów danych przestrzennych dotyczących planowania i zagospodarowania przestrzennego w gminie. Liczba zbiorów danych przestrzennych SUiKZP Liczba zbiorów danych przestrzennych MPZP miejskie 64 56,05 od 8,4 do 103,7 40,6% 29,5% - 52,9% wiejskie 175 0,49 od 0,2 do 0,77 86,3% 80,4% - 90,7% miejsko -wiejskie 72 3,63 od 1,4 do 8,7 80,6% 69,9% - 88,2% Łącznie 311 12,65 2,67 22,62 75,6% 70,5% - 80,0% miejskie 61 5,92 (0) -12,09 82,0% 70,3% - 89,8% wiejskie 173 0,08 (0) - 0,17 97,7% 94,0% - 99,3% miejsko -wiejskie 75 0,01 (0)- 0,04 98,7% 92,1% - (100%) Łącznie 309 1,21 (0) - 2,43 94,8% 91,7% - 96,9% miejskie 64 12,61 (0) 26,93 70,3% 58,2% - 80,2% wiejskie 174 0,76 0,003 1,51 93,7% 88,9% - 96,6% miejsko -wiejskie 74 3,12 (0) 8,04 94,6% 86,5% - 98,3% Łącznie 312 3,75 0,59 6,91 89,1% 85,1% - 92,1% Liczba zbiorów danych przestrzennych MPZP wskazanych w SUiKZP Łącznie 304 1,20 0,15 2,24 91,8% 88,1% - 94,4% Strona 11 z 18

Przykładowy wniosek, jaki można wyciągnąć z tabeli 1, to stwierdzenie, że z 95% prawdopodobieństwem od 94% do 99,3% gmin wiejskich w Polsce nie posiada zbiorów danych przestrzennych SUiKZP. Tab. 2 Liczba zbiorów danych przestrzennych w Polsce Liczba zbiorów danych przestrzennych w Polsce estymacja punktowa estymacja przedziałowa (p=95%) Sumaryczna liczba zbiorów danych przestrzennych dotyczących planowania i 31 359 Od 6 619 do 56 075 zagospodarowania przestrzennego w gminie. Liczba zbiorów danych przestrzennych SUiKZP 3 000 Od 375 do 6 024 Liczba zbiorów danych przestrzennych MPZP 9 296 Od 1 450 do 17 142 Liczba zbiorów danych przestrzennych MPZP wskazanych w SUiKZP 2 795 Od 372 do 5 553 Z tabeli 2 jeden z płynących wniosków brzmi następująco: z 95% prawdopodobieństwem sumaryczna liczba zbiorów danych przestrzennych w Polsce nie przekracza 56 075 i nie jest mniejsza niż 6 619. Można także skorzystać w procesie wnioskowania z estymatorów punktowych, jednak z uwagi na szerokie przedziały ufności przy założonym 95% prawdopodobieństwie, opieranie się jedynie na wartości punktowej jest ryzykowne. Tak szerokie przedziały ufności wynikają nie tyle z niedostatecznej wielkości próby, co z dużych wartości odchylenia standardowego analizowanych zmiennych. Innymi słowy, fakt, że rozkłady liczby i powierzchni zbiorów danych przestrzennych w polskich gminach charakteryzują się rozkładami u-kształtnymi (duża liczba gmin bez zbiorów i ze znaczną liczbą zbiorów), wpływa na trudność w precyzyjnym oszacowaniu średniej liczby zbiorów. Strona 12 z 18

Tab. 3 Powierzchnia zbiorów danych przestrzennych Sumaryczna powierzchnia zbiorów danych przestrzennych dotyczących planowania i zagospodarowania przestrzennego w gminie. Powierzchnia zbiorów danych przestrzennych SUiKZP Powierzchnia zbiorów danych przestrzennych MPZP Powierzchnia zbiorów danych przestrzennych MPZP wskazanych w SUiKZP N Średnia powierzchnia w gminie (ha) w populacji w próbie ogólnopolskiej (p=95%) 311 1346,1 861,1 1831,0 3 336 882 309 622,3 290,9 953,8 1 542 788 312 517,7 235,7 799,7 1 283 401 304 283,9 116,9-450,9 703 754 Całkowita powierzchnia w Polsce (ha)* estymacja estymacja przedziałowa punktowa* (p=95%)* od 2 134 667 do 4 539 099 od 721 082 do 2 364 494 od 584 331 do 1 982 471 od 289 705 do 1 117 802 *prezentowane dane należy traktować jako wejściowe do obliczenia wskaźników monitoringu DSi1 Wybrany wniosek płynący z wyników umieszczonych w tabeli 3 brzmi następująco: z 95% prawdopodobieństwem można sądzić, że powierzchnia zbiorów danych przestrzennych MPZP w Polsce jest niemniejsza niż 584 331 ha i niewiększa niż 1 982 471 ha. Tab. 4 Metadane zgodne z dyrektywą INSPIRE Procent Liczba gmin w Polsce Gminy posiadające metadane do SUiKZP zgodne z dyrektywą INSPIRE Gminy posiadające metadane do MPZP zgodne z dyrektywą INSPIRE N w populacji estymacja estymacja w próbie ogólnopolskiej przedziałowa punktowa (p=95%) (p=95%) 311 2,57% 1,22% -5,08% 64 30-126 312 1,28% 0,38% - 3,37% 32 9-84 Wybrany wniosek płynący z wyników umieszczonych w tabeli 4 brzmi następująco: z 95% prawdopodobieństwem można założyć, że liczba gmin w Polsce Strona 13 z 18

posiadających metadane do MPZP zgodne z dyrektywą INSPIRE jest niemniejsza niż 9 i niewiększa niż 84. Aby można było jednoznacznie odpowiedzieć na pytanie, czy jest to próba wystarczająca pod względem liczebności, należałoby określić wielkość niepewności, na którą jesteśmy w stanie przystać przy interpretacji wyników. Wielkością niepewności (błędu) w tego typu analizach statystycznych jest wielkość przedziałów ufności przy założonym, dość arbitralnym, ale powszechnie stosowanym poziomie istotności równym 0,05 (także w tym raporcie). Np. jeżeli oczekiwaną informacją z 95% prawdopodobieństwem jest stwierdzenie, że liczba gmin w Polsce z metadanymi do SUiKZP zgodnymi z dyrektywą INSPIRE wynosi 64 (+ 62, -34) to taka próba jest odpowiednia. Jeżeli oczekiwana informacja ma być precyzyjniejsza, to próba powinna być większa. Na podstawie posiadanych danych można wyliczyć wielkość próby konieczną do otrzymania odpowiednio węższych przedziałów ufności. Strona 14 z 18

5. Wskaźnik monitorowania ilości zbiorów danych przestrzennych w temacie Land use dla całej Polski na szczeblu gminy Zgodnie z Decyzją Komisji z dnia 5 czerwca 2009 r. w sprawie wykonywania dyrektywy 2007/2/WE Parlamentu Europejskiego i Rady w zakresie monitorowania i sprawozdawczości dla celów monitorowania liczby i powierzchni zbiorów danych przestrzennych, dotyczących zagospodarowania przestrzennego stosowany jest wskaźnik DSi1.3. Wskaźnik ten określa zakres pokrycia terytorium państwa zbiorami danych przestrzennych odpowiadających określonemu tematowi z załącznika III do dyrektywy 2007/2/WE. Wskaźnik DSi1.3 dla każdego tematu załącznika III do dyrektywy 2007/2/WE obliczany jest poprzez podzielenie sumy wszystkich obszarów pokrytych zbiorami danych przestrzennych odpowiadających danemu tematowi przez sumę obszarów wymaganych dla zbiorów danych przestrzennych dla danego tematu. Przez obszar wymagany rozumie się obszar, który powinien być pokryty zbiorem danych przestrzennych dla danego tematu. DSi1.3 = powierzchnia obszarów pokrytych zbiorami danych przestrzennych powierzchnia obszarów wymaganych dla zbiorów danych przestrzennych W przypadku tematu zagospodarowanie przestrzenne obszar wymagany może być określony w różny sposób w zależności od tego, czy wskaźnik obliczany jest dla zbiorów danych przestrzennych odnoszących się do dokumentów SUiKZP, do dokumentów MPZP wskazanych do sporządzenia w SUiKZP, czy też sumarycznie do dokumentów SUiKZP oraz MPZP. W poniższym raporcie obliczone zostały wskaźniki dla każdego z wymienionych przypadków. Obliczając wskaźnik DSi1.3 w odniesieniu do zbiorów danych przestrzennych SUiKZP, za powierzchnię wymaganą należy przyjąć powierzchnię całego kraju. Wskaźnik DSi1.3 w odniesieniu do zbiorów danych przestrzennych MPZP można obliczyć dla dokumentów, które zostały wskazane w SUiKZP Strona 15 z 18

do sporządzenia. Jedynie w tym przypadku możliwe jest określenie sumy obszarów wymaganych dla zbiorów danych przestrzennych MPZP. Dla danych przestrzennych odnoszących się do pozostałych kategorii MPZP niemożliwe jest określenie obszaru wymaganego, jednak dane te można uwzględnić w sumarycznym wskaźniku odnoszącym się do danych przestrzennych dokumentów SUiKZP oraz MPZP, w którym za powierzchnię wymaganą można przyjąć powierzchnię całej Polski. W ankiecie informacje o sumarycznej liczbie zbiorów danych przestrzennych i powierzchni nimi objętej były zbierane w drugim jej dziale. Tab. 5 Wskaźnik DSi1.3 dla tematu zagospodarowanie przestrzenne Zbiory danych przestrzennych SUiKZP Całkowita powierzchnia w Polsce pokryta zbiorami danych przestrzennych (km 2 ) estymacja punktowa 15 427,88 estymacja przedziałowa (p=95%) od 7 210,82 do 23 644,94 Sumaryczna powierzchnia obszaru wymaganego dla całej Polski (km 2 ) Wskaźnik DSi1.3 estymacja punktowa 312 679,67 4,93% estymacja przedziałowa (p=95%) od 2,31% do 7,56% Zbiory danych przestrzennych MPZP wskazanych w SUiKZP 7 037,54 od 2 897,05 do 11 178,02 69 945,70* 10,06% od 4,14% do 15,98% Zbiory danych przestrzennych dotyczących planowania i zagospodarowania przestrzennego w gminie (MPZP oraz SUiKZP) 33 368,82 od 21 346,67 do 45 390,99 312 679,67 10,67% * na podstawie badania GUS z 2011 roku (powierzchnia terenów wskazanych w studium do sporządzenia miejscowego planu zagospodarowania przestrzennego) od 6,83% do 14,52% Na podstawie przeprowadzonych obliczeń oraz wyników zamieszczonych w tabeli 5 można wnioskować, że z 95% prawdopodobieństwem wskaźnik DSi1.3 dla tematu zagospodarowanie przestrzenne określony sumarycznie dla zbiorów danych przestrzennych dotyczących planowania i zagospodarowania przestrzennego w gminie (MPZP oraz SUiKZP) w Polsce jest niemniejszy niż 6,83% i niewiększy niż 14,52%. Strona 16 z 18

6. Porównanie danych (ankieta Land use w gminach dane GUS) W ankiecie Land use w gminach zamieszczono pozycję, która ma swój odpowiednik w Bazie Danych Regionalnych GUS. Jest to pytanie, które weryfikujące opracowanie i uchwalonie SUiKZP. Między danymi z ankiety a danymi z badania GUS z 2011 roku odnotowano 100% zgodność, jeśli chodzi o dokumenty SUiKZP. W badanej próbie tylko jedna gmina (gmina Borki) nie posiada sporządzonego SUiKZP, co zadeklarowała zarówno w ankiecie, jak również w badaniu GUS. Ze względu na to, że w ankiecie został wprowadzony podział na kategorie MPZP, nie jest możliwe porównanie ankiety z badaniem prowadzonym przez GUS, gdyż nie jest możliwe zidentyfikowanie odpowiadających sobie pozycji w zakresie sporządzonych dokumentów MPZP. 7. Wnioski optymalizacyjne Znając charakterystyki rozkładów zmiennych można w kolejnych latach dla zadanego z góry przedziału ufności określić liczebność próby, wystarczającą do przeprowadzenia estymacji. Należy jednak wziąć pod uwagę, że aktualnie udział procentowy gmin posiadających zbiory danych przestrzennych jest bardzo mały. Dla tak małych wartości konstrukcja wiarygodnego przedziału ufności (np. p=95%) wymaga dość licznej próby. Jeżeli przedziały ufności zawarte w tym opracowaniu są satysfakcjonujące, to wielkość próby należy utrzymać. Liczebność próby będzie mogła zostać ograniczona tylko w sytuacji, gdy satysfakcjonujący będzie jeszcze bardziej rozległy przedział ufności. Wnioski optymalizacyjne na kolejne lata prowadzenia monitoringu liczby i powierzchni zbiorów danych przestrzennych są następujące: ograniczyć liczbę pytań w ankiecie do kluczowych, niezbędnych do prognozowania stanu zbiorów danych przestrzennych w gminach i wyliczenia wskaźników Land use; mniejsza liczba pytań to zwiększy procent wypełnionych ankiet, a także podniesie wiarygodność odpowiedzi, Strona 17 z 18

zrezygnować w ankiecie z podziału na znaczną liczbę kategorii MPZP i pozostawić jedynie dwie kategorie 1) wszystkie MPZP, 2) MPZP wskazane do sporządzenia w SUiKZP, umieścić w ankiecie 2-3 pytania kontrolne, tożsame z pytaniami PP-1, umożliwi to monitoring wiarygodności danych zbieranych metodami ankietowymi (w wykonanej ankiecie było 1 pytanie kontrolne, które pokazało 100% zgodność obu źródeł danych), kontynuować ocenę reprezentatywności dla kolejnych prób; liczbę zmiennych kontrolnych można ograniczyć do tych, które różnicowały próbę w tym badaniu, ze względu na duże rozdrobnienie typów funkcjonalnych gmin proponuje się kontynuację analizy w kolejnych latach w oparciu o zagregowane typy funkcjonalne, ze względu na odmienną charakterystykę planowania przestrzennego w miastach proponuje się rozłączne traktowanie tej populacji gmin; do wyodrębnienia większych ośrodków miejskich mogłoby posłużyć zagregowany podział na typy funkcjonalne, proponuje się także połączenie monitoringu ilości zbiorów danych przestrzennych na poziomie gmin do badania PP-1 (Planowanie przestrzenne w gminie); do wypełnienia wskaźników Land use wystarczyłyby zaledwie 3-4 dodatkowe pytania, zniknąłby wówczas automatycznie problem estymacji, dane byłyby jednoznaczne i precyzyjne. 8. Literatura Agresti, A., and Coull, B. A. (1998), Approximate is better than "exact" for interval estimation of binomial proportions, The American Statistician, 52: 119-126. Komornicki T., Śleszyński P., 2008, Struktura funkcjonalna gmin a postępy w pracach planistycznych (2004 2006). Studia Regionalne i Lokalne, 3,33. Decyzja Komisji z dnia 5 czerwca 2009 r. w sprawie wykonywania dyrektywy 2007/2/WE Parlamentu Europejskiego i Rady w zakresie monitorowania i sprawozdawczości. Strona 18 z 18