PRÓBA ZASTOSOWANIA SIECI NEURONOWEJ TYPU SOM W BADANIU PRZESTRZENNEGO ZRÓŻNICOWANIA POWIATÓW W POLSCE.



Podobne dokumenty
Departament Koordynacji Polityki Strukturalnej. Fundusze unijne. a zróżnicowanie regionalne kraju. Warszawa, 27 marca 2008 r. 1

Rozwody w Polsce w ujęciu regionalnym

DZIAŁALNOŚĆ GOSPODARCZA PRZEDSIĘBIORSTW O LICZBIE PRACUJĄCYCH DO 9 OSÓB W 2008 R.

Sytuacja młodych na rynku pracy

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

GŁÓWNY URZĄD STATYSTYCZNY Urząd Statystyczny w Katowicach

SYTUACJA DEMOGRAFICZNA W WOJEWÓDZTWIE KUJAWSKO-POMORSKIM W 2005 R.

Powierzchnia województw w 2012 roku w km²

II. BUDOWNICTWO MIESZKANIOWE

Przekazujemy Państwu efekt pierwszego etapu prac nad Programem Rozwoju Miasta Łomża dotyczącego gospodarki.

Ocena potencjału gospodarczego w świetle wskaźników rozwoju gospodarczego

Działalność gospodarcza przedsiębiorstw o liczbie pracujących do 9 osób w 2015 r.

1. Analiza wskaźnikowa Wskaźniki szczegółowe Wskaźniki syntetyczne

GŁÓWNY URZĄD STATYSTYCZNY Urząd Statystyczny w Katowicach

Ewolucja poziomu zatrudnienia w sektorze przedsiębiorstw

Produkt Krajowy Brutto. Rachunki Regionalne w 2014 roku

Średnia wielkość powierzchni gruntów rolnych w gospodarstwie za rok 2006 (w hektarach) Jednostka podziału administracyjnego kraju

Platforma C. Czynniki demograficzne

Klasówka po szkole podstawowej Historia. Edycja 2006/2007. Raport zbiorczy

Żłobki i kluby dziecięce w 2013 r.

Produkt Krajowy Brutto. Rachunki Regionalne w 2013 roku

Wyniki analizy statystycznej opartej na metodzie modelowania miękkiego

Urząd Statystyczny w Lublinie

Analiza dynamiki i poziomu rozwoju powiatów w latach

Stan i ruch naturalny ludności. w województwie zachodniopomorskim w 2016 r.

CHARAKTERYSTYKA I OCENA SYSTEMU TRANSPORTU

Synteza wyników pomiaru ruchu na drogach wojewódzkich w 2010 roku

Wojewódzki Urząd Pracy w Białymstoku. Wojewódzka Rada Rynku Pracy Białymstoku 2 czerwca 2017 roku

Tabela 1.1 Statystyczny wizerunek Szczecina na tle innych dużych miast Polski, województwa zachodniopomorskiego i kraju Lp. 1. Liczba ludności (tys.)

Miasto OPOLE WYBRANE DANE STATYSTYCZNE W OPOLU. Powierzchnia w km² Województwo ,6. w wieku produkcyjnym 53,7 56,1 58,4

Miasto CHORZÓW WYBRANE DANE STATYSTYCZNE W KATOWICE. Powierzchnia w km² Województwo ,2

WYBRANE DANE STATYSTYCZNE

Miasto GORZÓW WIELKOPOLSKI

WYBRANE DANE STATYSTYCZNE

Ocena sytuacji demograficznej Gdańska ze szczególnym uwzględnieniem jednostki pomocniczej Wrzeszcz Górny

RYNEK PRACY/ADAPTACYJNOŚĆ ZASOBÓW PRACY W WOJEWÓDZTWIE DOLNOŚLĄSKIM

WYBRANE DANE STATYSTYCZNE

WYBRANE DANE STATYSTYCZNE

Miasto BYTOM WYBRANE DANE STATYSTYCZNE W KATOWICE. Powierzchnia w km² Województwo ,2

Źródło danych statystycznych i definicji. Uwagi ogólne

Miasto TYCHY WYBRANE DANE STATYSTYCZNE W KATOWICE. Powierzchnia w km² Województwo ,2

Działalność badawcza i rozwojowa w Polsce w 2013 r. Główne wnioski

WYBRANE DANE STATYSTYCZNE

MAZOWIECKI RYNEK PRACY LUTY 2014 R.

Badanie krajowego i zagranicznego ruchu turystycznego w Województwie Zachodniopomorskim w roku 2014 Streszczenie raportu wyniki desk research

OCENA SYTUACJI SPOŁECZNO-GOSPODARCZEJ WIELKOPOLSKI PÓŁNOCNEJ

Klasówka po gimnazjum biologia. Edycja 2006\2007. Raport zbiorczy

Działalność badawcza i rozwojowa w Polsce w 2012 r.

Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych.

WYBRANE DANE STATYSTYCZNE

Analiza wydajności pracy w rolnictwie zachodniopomorskim

Miasto GDYNIA WYBRANE DANE STATYSTYCZNE Powierzchnia w km² Województwo w wieku produkcyjnym 59,7 61,6 63,8 59,2

WYBRANE DANE STATYSTYCZNE

WYBRANE DANE STATYSTYCZNE

Czy rynek pracy potrzebuje absolwentów szkół wyższych? Analiza porównawcza pomiędzy regionami.

Miasto SIEDLCE WYBRANE DANE STATYSTYCZNE W WARSZAWIE. Powierzchnia w km² Województwo ,4

Żłobki i kluby dziecięce w 2012 r.

Przemiany społeczno demograficzne w województwie świętokrzyskim w latach

Sytuacja na podlaskim rynku pracy w 2017 roku

Potencjał demograficzny

WYBRANE DANE STATYSTYCZNE

Miasto ZIELONA GÓRA WYBRANE DANE STATYSTYCZNE W ZIELONEJ GÓRZE. Powierzchnia w km² Województwo ,8

Spis tabel. Tabela 5.6. Indeks rywalizacyjności oraz efektywna liczba partii w wyborach

Rys Zmiany liczby pracujących w grupach miast w Polsce w latach

Miasto: Szczecin. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,2 52,7 55,8 57,7

Miasto: Sopot. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 17. Miasto Województwo ,8 59,8 63,7 65,4

Zmiany demograficzne i ich wpływ na przemiany społecznogospodarcze na przykładzie wybranych obszarów wzrostu i stagnacji

Wpływ funduszy europejskich perspektywy finansowej na rozwój społeczno-gospodarczy Polski Wschodniej. Andrzej Regulski 28 września 2015 r.

Opracował: mgr inż. Krzysztof Opoczyński. Zamawiający: Generalna Dyrekcja Dróg Krajowych i Autostrad. Warszawa, 2001 r.

ATRAKCYJNOŚĆ INWESTYCYJNA POLSKICH REGIONÓW NA TLE REGIONÓW EUROPY

Emerytury nowosystemowe wypłacone w grudniu 2018 r. w wysokości niższej niż wysokość najniższej emerytury (tj. niższej niż 1029,80 zł)

WYBRANE DANE(a) STATYSTYCZNE 2010

Miasto: Opole. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 97. Miasto Województwo ,5 50,4 53,7 56,1

Miasto: Katowice. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,7 54,7 56,7 58,4

Stan i ruch naturalny ludności w województwie kujawsko-pomorskim w 2010 r.

Informacja o sytuacji na rynku pracy województwa pomorskiego i realizacji przez Samorząd Województwa Pomorskiego zadań w zakresie polityki rynku pracy

Miasto: Kielce. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,0 53,3 57,1 59,2

STAN I RUCH NATURALNY LUDNOŚCI W WOJEWÓDZTWIE ŚWIĘTOKRZYSKIM W 2007 ROKU

WYBRANE DANE(a) STATYSTYCZNE 2010

WYBRANE DANE(a) STATYSTYCZNE 2010

WYBRANE DANE(a) STATYSTYCZNE 2010

Miasto: Olsztyn. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 88. Miasto Województwo ,6 48,8 51,9 53,7

Miasto: Rzeszów. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,1 50,1 52,6 54,6

WOJEWÓDZTWO PODLASKIE W LICZBACH RAPORT Z WYNIKÓW NARODOWEGO SPISU POWSZECHNEGO LUDNOŚCI I MIESZKAŃ Kobiety Mężczyźni.

Rozwój społeczny i gospodarczy województwa mazowieckiego a presja na środowisko

Synteza wyników pomiaru ruchu na drogach wojewódzkich w 2005 roku

WYBRANE DANE(a) STATYSTYCZNE 2010

Ocena spójności terytorialnej pod względem infrastruktury technicznej obszarów wiejskich w porównaniu z miastami

FUNKCJONOWANIE KLAS ŁĄCZONYCH W POLSKIM SYSTEMIE EDUKACJI Dr hab. prof. UR Ryszard Pęczkowski

WYBRANE DANE(a) STATYSTYCZNE 2010

Dolnośląski O/W Kujawsko-Pomorski O/W Lubelski O/W. plan IV- XII 2003 r. Wykonanie

Sytuacja zawodowa osób z wyższym wykształceniem w Polsce i w krajach Unii Europejskiej w 2012 r.

Migracje wewnętrzne w Polsce a rozwój społeczno- -ekonomiczny województw

Miasto: Leszno. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 32. Miasto Województwo ,1 53,1 56,4 58,7

WYBRANE DANE(a) STATYSTYCZNE 2010

WYBRANE DANE(a) STATYSTYCZNE 2010

WYBRANE DANE STATYSTYCZNE

Miasto: Rybnik. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,7 51,4 53,4 54,6

Miasto: Zielona Góra. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 58. Miasto Województwo ,4

Miasto: Kraków. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,5 53,4 56,1 57,8

Transkrypt:

PRÓBA ZASTOSOWANIA SIECI NEURONOWEJ TYPU SOM W BADANIU PRZESTRZENNEGO ZRÓŻNICOWANIA POWIATÓW W POLSCE. Dr Kamila Migdał Najman Dr Krzysztof Najman Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański K.Najman@panda.bg.univ.gda.pl kmn@panda.bg.univ.gda.pl SOPOT 2002

Na różnorodne skutki procesu przemian systemowych i strukturalnych, dokonywanych w Polsce pod koniec XX wieku wskazują liczni autorzy, m.in. Z. Czyżowska (1995), Z. Chojnicki (1996), M. Kałaska i J. Witkowski (1996), M. Szostak (1996). Do pozytywnych następstw przemian zalicza się odzyskanie suwerenności państwowej, powstanie demokratycznego ustroju politycznego, umocnienie samorządu terytorialnego, rozwinięcie innych form samorządności, rozwój gospodarki rynkowej, upodmiotowienie społeczeństwa, zmiana otoczenia międzynarodowego i geopolitycznego Polski. Powstaje nowy porządek polityczny, gospodarczy, społeczny. Wszystko to przyczynia się do stworzenia nowych szans rozwoju społeczno-gospodarczego kraju. Jednak obok pozostających starych zagrożeń pojawiają się nowe, które utrudniają i opóźniają proces przekształcania systemu politycznego i gospodarczego. Zaliczyć do nich możemy przede wszystkim zacofanie cywilizacyjne i techniczne, zagrożenia ekologiczne, pewne przyzwyczajenia i nawyki nie sprzyjające rozwojowi przedsiębiorczości, inicjatywy, innowacyjności i aktywności zawodowej ludności. Do nowych zagrożeń zaliczyć możemy rosnące niezadowolenie ludzi oczekujących szybkiej poprawy, utrzymujący się poziom bezrobocia, wzrost patologii społecznej, trudności mieszkaniowe, stosunkowo niskie dochody ludności. 1 Wszystkie te cechy oddziałują z różną siłą w różnych rejonach Polski. Związane jest to ze zróżnicowaniem kraju pod względem warunków historycznych, naturalnych, i społeczno ekonomicznych. Celem badania, jest próba analizy zróżnicowania przestrzennego powiatów w Polsce 10 lat po transformacji. Analiza prowadzona będzie na podstawie danych statystycznych obejmujących 307 powiatów badanych ze względu na 9 zmiennych demograficznych i 14 zmiennych ekonomicznych według stanu na rok 2000. Obiektem analizy są powiaty Polski. Analiza nie uwzględnia powiatu warszawskiego i miast na prawach powiatu. Zastosowaną metodą analityczną jest sieć neuronowa typu SOM. 1 Eugeniusz Z. Zdrojewski, Przemiany ludnościowe w województwach nadmorskich, Wiadomości Statystyczne, Listopad 1998

METODA BADAWCZA Mapa Samoorganizująca (Self Organizing Map SOM) znana również jako sieć neuronowa Kohonena nazwana tak od jej twórcy, fińskiego profesora Teuvo Kohonen a - jest jednym z bardziej zaawansowanych modeli sieci neuronowych. Oparta jest na nie nadzorowanym uczeniu, co oznacza, że nie jest potrzebna żadna interwencja podczas jej uczenia. Dostarcza topologicznego odwzorowania z przestrzeni wielowymiarowej na dwuwymiarową mapę neuronów. Mapa zazwyczaj uformowana jest jako dwuwymiarowa siatka i dlatego jest odwzorowaniem z przestrzeni wielowymiarowej na płaszczyznę. 2 Może być zastosowana w tym samym czasie do wizualizacji skupisk w zbiorze danych i do wizualizacji zbioru wielowymiarowych danych na płaszczyźnie. Zachowuje nieliniowe relacje między jednostkami i lokuje bliskie sobie jednostek bliżej siebie na mapie. Zazwyczaj, neurony na mapie połączone są z sąsiadującymi neuronami przez relacje sąsiedztwa dyktując w ten sposób strukturę (topologię) sieci. Typowa topologia sieci to prostokątna bądź heksagonalna (sześciokątna) siatka albo zamknięty bądź otwarty łańcuch. Na rysunku 1 przedstawione są relacje sąsiedztwa między neuronami. 3 Rysunek 1. Różne topologie sieci SOM: prostokątna, heksagonalna, łańcuch otwarty i zamknięty. Prostokątna Heksagonalna 2 Self-Organizing Maps, T. Kohonen, Sprinder-Verlag 1997, s. 85-87 3 Neural Network Design, M. T. Hagen, H.B. Demuth, M. Beale, PWS Publishing Company ITP 1996, s. 14-12 14-14

Łańcuch otwarty Łańcuch zamknięty 4 Każdy z tych neuronów połączony jest z wektorem wejściowym obiektu wejściowego za pomocą wag synaptycznych, które są modyfikowane podczas uczenia sieci. Wszystkie wagi łączą się z pojedynczym neuronem na mapie tworząc zbiór nazywany prototypem. Po udanym treningu, prototypy reprezentują utworzone skupiska o podobnych własnościach. Jeśli nie istnieją wyraźne skupiska w zbiorze danych, metoda odwzorowania samoorganizującej mapy ujawnia pasma gór i wąwozów. Pierwsze są często strefą nieregularnie ukształtowaną z wysoką tendencją do tworzenia skupisk, podczas gdy drugie rozdzielają zbiór danych na obszary, które mają odmienne właściwości. Podczas procesu uczenia, dla każdego neurony na mapie obliczana jest między jego prototypem a wektorem wejściowym odległość Euklidesowa. Neuron, który ma najmniejszą odległość wygrywa współzawodnictwo wraz ze swoim prototypem oraz najbliższymi sąsiadami. Aktualizują one swoje wagi i cała grupa prototypu (wraz z sąsiadami) przesuwa się w kierunku wektorów wejściowych. O intensywności uczenia się neuronów będących w bezpośrednim sąsiedztwie neuronu wygrywającego decyduje przyjęta funkcja sąsiedztwa. Najczęściej stosowanymi są funkcje: gaussowska, ucięta gaussowska, bubble i ep. Ocena jakości mapy wykonywana jest najczęściej na podstawie 4 typów błędów. Jest to: błąd kwantyzacji, błąd topograficzny, błąd dystorsji i liczba martwych neuronów. Błąd kwantyzacji określa poziom specjalizacji neuronów. Błąd topograficzny ocenia jakość rozciągnięcia mapy na obiekty wejściowe. 5 Błąd dystorsji mierzy zagęszczenie obiektów przy pojedynczym neuronach. Liczba martwych neuronów to stosunek liczby neuronów aktywnych do nieaktywnych. Optymalnie skonstruowana sieć SOM to sieć o wysokiej specjalizacji neuronów, tj. o małym błędzie kwantyzacji. To sieć prawidłowo rozciągnięta na badane obiekty, zajmująca w przestrzeni ten sam obszar, tj. mały błąd topograficzny. Gdy obiekty zajmują przestrzeń na bazie trójkąta to sieć powinna być rozciągnięta w taki właśnie trójkąt. Neurony powinny być w miarę równomiernie przydzielone poszczególnym 4 Nałęcz Maciej (red.), Sieci neuronowe, tom 6, Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2000, s. 183 5 Więcej o roli sąsiedztwa i własnościach poszczególnych funkcji można znaleźć w: Vesanto J., Data Mining Techniques Based on the Self Organizing Map, Thesis for the degree of Master of Science in Engineering, Helsinki University of Technology, 1997, s. 6, 17-18

obiektom. Niski błąd dystorsji będzie świadczył o tym, że wszystkie obiekty mają tę samą liczbę neuronów wyspecjalizowanych do ich rozpoznawania. Sieć nie może być również nadmiarowa, czyli posiadać zbyt dużej liczby neuronów. Siatka neuronów powinna zawierać ich tyle, ile potrzeba do rozpoznawania wszystkich obiektów, ale nie więcej. Każdy dodatkowy martwy neuron (neuron, który nie uczestniczy w uczeniu) to jedynie dodatkowy czas analiz, nie zrekompensowany żadną dodatkową wiedzą. Ponieważ każdy rodzaj błędu ma inne znaczenie i wagę w opisie sieci, a także przyjmuje wartości z innego przedziału liczbowego dla celów tej analizy zbudowano syntetyczny wskaźnik, błąd całkowity, jako funkcję czterech powyższych błędów według reguły: Błąd całkowity= 0.4 x błąd kwantyzacji + 0.4 x błąd topologiczny + 0.1 x błąd dystorsji + 0.1 liczba martwych neuronów. Głównym powodem stosowania SOM w analizie danych jest to, że: jest metodą nieparametryczną, nie wymaga a priori żadnych założeń, co do rozkładów analizowanych zmiennych. Jest metodą, która wykrywa niespodziewane układy, struktury czy wzorce podczas uczenia się, bez subiektywnego wpływu analityka. 6 Doskonale radzi sobie z różnorodnymi typami danych w pojedynczym zbiorze danych. PRZEBIEG BADANIA Do opisu powiatów wybrano 23 zmienne, z podziałem na zmienne demograficzne i ekonomiczne. Do zmiennych demograficznych zostały wybrane następujące dane statystyczne: - ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym, - ludność na 1 km 2, - przyrost naturalny na 1000 ludności, - małżeństwa na 1000 ludności, - rozwody na 1000 ludności, - urodzenia żywe na 1000 ludności, - zgodny ogółem na 1000 ludności, - migracje wewnętrzne ludności: saldo migracji, - zgony niemowląt na 1000 urodzeń żywych. 6 Self-Organizing Maps, T. Kohonen, Sprinder-Verlag, 1997, s. xxx, 162-165

Do zmiennych ekonomicznych zostały wybrane następujące dane statystyczne: - pracujący na 1000 ludności, pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i rybactwo w %, - pracujący: przemysł i budownictwo w %, - pracujący: usługi rynkowe w %, - pracujący: usługi nierynkowe w %, - bezrobotni zarejestrowani ogółem, - bezrobotne kobiety ogółem, - przeciętne miesięczne wynagrodzenie brutto w zł, - stopa bezrobocia w %, - dochody budżetów gmin na 1 mieszkańca w zł, - wydatki budżetów gmin inwestycyjne w %, - nakłady inwestycyjne w przedsiębiorstwach według lokalizacji na 1 mieszkańca w zł, - wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w zł, - podmioty gospodarki narodowej zarejestrowane w rejestrze REGON: osoby prawne i jednostki organizacyjne nie mające osobowości prawnej. Zbiór danych objął wszystkie powiaty (307) z wyłączeniem powiatu warszawskiego i miast na prawach powiatu 7. Zbiór danych pochodzi z publikacji Powiaty w Polsce z 2001 roku. WYNIKI BADAŃ CHARAKTERYSTYKA POWIATÓW BADANYCH ZE WZGLĘDU NA ZMIENNE DEMOGRAFICZNE W analizie demograficznego zróżnicowania powiatów budowane były sieci o wymiarach 6x6 do 19x19. Dla każdej z nich stosowano każdą z czterech funkcji sąsiedztwa. Za każdym razem wyznaczano wszystkie miary jakości sieci. Dalszej analizie poddana została sieć o najmniejszym błędzie całkowitym. Optymalna sieć miała wymiar 13x13 7 Powiaty te tak bardzo różnią się od innych, że zawsze stanowią osobna klasę. Dodanie ich do zbioru danych nie wnosi, więc dodatkowego czynnika poznawczego. Zachowanie ich w zbiorze danych powoduje dodatkowo problemy klasyfikacyjne innych powiatów ze względu na duże różnice w aktywizacji neuronów między powiatami miejskimi a innymi.

neuronów z funkcją sąsiedztwa typu gaussowskiego. Przyjęto topologię heksagonalną 8. Błędy sieci były następujące: błąd kwantyzacji = 0.1509 błąd topograficzny = 0.1726 błąd dystorsji = 0.0294 liczba martwych neuronów = 11% błąd całkowity = 0.1436 Aktywność poszczególnych neuronów pobudzanych kolejnymi zmiennymi przedstawiona jest na rysunku 2. Na podstawie macierzy stanów neuronów dokonana została metodą k-średnich klasyfikacja powiatów na względnie jednorodne grupy. Klasyfikację tą przedstawiono na rysunku 3. Zmienne demograficzne: - zmienna 1 - ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym, - zmienna 2 - ludność na 1 km 2, - zmienna 3 - przyrost naturalny na 1000 ludności, - zmienna 4 - małżeństwa na 1000 ludności, - zmienna 5 - rozwody na 1000 ludności, - zmienna 6 - urodzenia żywe na 1000 ludności, - zmienna 7 - zgodny ogółem na 1000 ludności, - zmienna 8 - migracje wewnętrzne ludności: saldo migracji, - zmienna 9 - zgony niemowląt na 1000 urodzeń żywych. 8 Do badania tego typu danych można zastosować schemat połączeń neuronów prostokątny lub heksagonalny. Ze względu na większą liczbę sąsiadów w schemacie heksagonalnym, łatwiej przy jej pomocy analizować bardzo złożone struktury danych. Przyjęto, więc ten schemat a priori we wszystkich analizach.

Rysunek 2. Pobudzenie neuronów przez poszczególne zmienne demograficzne. Źródło: Opracowanie własne Rysunek 3. Klasyfikacja powiatów ze względu na zmienne demograficzne na bazie optymalnej sieci. Źródło: Opracowanie własne

Z mapy wynika, że przestrzenne zróżnicowanie powiatów badanych ze względu na zmienne demograficzne pogrupować można na trzy grupy powiatów. Przenosząc tak uzyskane informacje na mapę administracyjną Polski uzyskujemy końcowy wynik analizy - Rysunek 4. Należy tu dodać, że tak uzyskany podział administracyjny nie dzieli powiatów na lepsze i gorsze. Wyróżnione zostały jedynie obszary różniące się między sobą. Ocena spoczywa w ręku analityka. Rysunek 4. Przestrzenne zróżnicowanie powiatów Polski w 2000 roku badanych ze względu na zmienne demograficzne. Źródło: Opracowanie własne

Tabela 1. Średnia badanych cech dla wyodrębnionych trzech grup powiatów i średnia krajowa bez powiatu warszawskiego i miast na prawach powiatu*. Nazwa cechy Grupa 1 Grupa 2 Grupa 3 Średnia krajowa* Ludność w wieku nieprodukcyjnym na 100 69,4 74,8 62,6 68,3 osób w wieku produkcyjnym Ludność na 1 km 2 89,7 63,9 139,1 101 Przyrost naturalny na 1000 ludności 2,9-0,7 0,1 1,1 Małżeństwa na 1000 ludności 5,8 5,6 5,3 5,6 Rozwody na 1000 ludności 0,7 0,5 1,0 0,8 Urodzenia żywe na 1000 ludności 11,7 10,5 9,5 10,6 Zgony ogółem na 1000 ludności 8,7 11,3 9,4 9,6 Migracje wewnętrzne ludności: saldo -6,5-115,9 89 1,0 migracji Zgony niemowląt na 1000 urodzeń żywych 7,7 7,8 8,3 8,0 Pierwszą grupę stanowi 124 powiatów występujących w północnej, północno-zachodniej, centralnie zachodniej i południowo-wschodniej części kraju. Aż 80 % powiatów zakwalifikowanych do grupy pierwszej znajduje się w województwie pomorskim, warmińsko-mazurskim, kujawsko-pomorskim, wielkopolskim, małopolskim i podkarpackim. Cechą charakterystyczną tych powiatów jest najbardziej zbliżony poziom liczby ludności na 1 km 2 w porównaniu z średnią krajową (bez miast na prawach powiatu). Powiaty te charakteryzują się zdecydowanie wysokim, dodatnim przyrostem naturalnym na 1000 ludności jak i wyższym poziomem zawieranych małżeństw na 1000 ludności. W grupa ta charakteryzuje się niższym poziomem zgonów niemowląt na 1000 urodzeń żywych przy najwyższym poziomie urodzeń żywych na 1000 ludności. Saldo migracji wewnętrznej jest na dość niskim ujemnym poziomie. Drugą grupę stanowią 74 powiaty skoncentrowane głównie w części środkowej i wschodniej kraju. Powiaty te w 60% położone są w województwie łódzkim, mazowieckim, świętokrzyskim, podlaskim i lubelskim. Powiaty, które znalazły się w tej grupie w bardzo ciekawy sposób nałożyły się na administracyjne granice tych województw. Do grupy tej zaliczymy powiaty o dość wysokim ujemnym przyroście naturalnym na 1000 ludności, niskiej gęstości zaludnienia na 1 km 2, gdzie liczba zawartych małżeństw jest na poziomie średniej krajowej (bez miast na prawach powiatu). Powiaty te charakteryzuje stosunkowo najniższy poziom rozwodów na 1000 ludności, ale za to najwyższy poziom zgonów ogółem

na 1000 ludności. W powiatach tych saldo migracji wewnętrznej przyjmuje zazwyczaj bardzo wysoką wartość ujemną. Trzecią grupę stanowi 109 powiatów ciągnących się zdecydowanie wzdłuż granicy zachodniej, zachodniej części granicy południowej i będących w bezpośrednim położeniu wokół miast na prawach powiatu. Województwo zachodniopomorskie, lubuskie, dolnośląskie, opolskie i śląskie obejmuje w 84% powiaty z tej właśnie grupy. Cechą charakterystyczną jest wysoka gęstość zaludnienia na 1 km 2 przy niewielkim poziomie przyrostu naturalnego na 1000 ludności. W powiatach tych występuje w porównaniu z pozostałymi grupami niższy poziom zawieranych małżeństw na 1000 ludności. Za to są to raczej powiaty o stosunkowo najwyższym poziomie rozwodów na 1000 ludności. W grupie tej przy dość wysokim poziomie zgonów niemowląt na 1000 urodzeń żywych, urodzenia żywe na 1000 ludności należą raczej do najniższych. Saldo migracji wewnętrznej w przeciwieństwie do średniej krajowej (bez miast na prawach powiatów) przyjmuje w tych powiatach zazwyczaj dość wysoką wartość dodatnią. CHARAKTERYSTYKA POWIATÓW BADANYCH ZE WZGLĘDU NA ZMIENNE EKONOMICZNE Polska tworzy niewątpliwie złożoną strukturę przestrzenno-ekonomiczną. Występują obszary, w których w większym bądź mniejszym stopniu następuje pobudzanie rozwoju gospodarki, często struktura ekonomiczna ma charakter monofunkcyjny a jednocześnie narastają różnego typu problemy umożliwiające dalszy rozwój. W wielu przypadkach pewne obszary charakteryzują się nadmierną koncentracją ludności, infrastruktury gospodarczej, technicznej w przeciwieństwie do obszarów, które nadal cechują się typowo rolniczym charakterem. Pewne opóźnianie bądź zaniechanie zmian strukturalnych wynika z braku zdolności do samodzielnej regeneracji, zdeformowaną strukturą zatrudnienia w jednej gałęzi gospodarki i bardzo niskim udziałem sfery usług, trwałą nierównowagą między podażą własnych zasobów pracy a zapotrzebowaniem gospodarki. Problemem jest, więc bifurkacja powiatów polegająca na stałym powiększaniu się zróżnicowań w pozycji ekonomicznej. 9 Podobnie jak poprzednio budowano sieci o rozmiarach od 6x6 do 19x19 dla wszystkich typów funkcji sąsiedztwa. Optymalna sieć miała wymiar 7x7 neuronów z funkcją sąsiedztwa 9 Runge Jerzy, Struktura rynku pracy regionu tradycyjnego i jego otoczenia na przykładzie województwa katowickiego, Wydawnictwo Uniwersytetu Śląskiego, Katowice 1996, s. 10-19

typu uciętego gaussowskiego. Podobnie przyjęto topologię heksagonalną. Błędy sieci były następujące : błąd kwantyzacji = 0.3167 błąd topograficzny = 0.2378 błąd dystorsji = 0.1109 liczba martwych neuronów = 0% błąd całkowity = 0.2329 Aktywność poszczególnych neuronów pobudzanych kolejnymi zmiennymi ekonomicznymi przedstawiona jest na rysunku 5. W wyniku klasyfikacji metodą k-średnich uzyskano podział powiatów na 5 grup. Klasyfikacja ta pokazana jest na rysunku 6. Przenosząc te informację na mapę administracyjną uzyskujemy końcowy wynik analizy Rysunek 7. Zmienne ekonomiczne: - zmienna 1 - pracujący na 1000 ludności - zmienna 2 - pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i rybactwo w %, - zmienna 3 - pracujący: przemysł i budownictwo w %, - zmienna 4 - pracujący: usługi rynkowe w %, - zmienna 5 - pracujący: usługi nierynkowe w %, - zmienna 6 - bezrobotni zarejestrowani ogółem, - zmienna 7 - bezrobotne kobiety ogółem, - zmienna 8 - przeciętne miesięczne wynagrodzenie brutto w zł, - zmienna 9 - stopa bezrobocia w %, - zmienna 10 - dochody budżetów gmin na 1 mieszkańca w zł, - zmienna 11 - wydatki budżetów gmin inwestycyjne w %, - zmienna 12 - nakłady inwestycyjne w przedsiębiorstwach według lokalizacji na 1 mieszkańca w zł, - zmienna 13 - wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w zł, - zmienna 14 - podmioty gospodarki narodowej zarejestrowane w rejestrze REGON: osoby prawne i jednostki organizacyjne nie mające osobowości prawne.

Rysunek 5. Pobudzenie neuronów przez poszczególne zmienne ekonomiczne. Źródło: Opracowanie własne Rysunek 6. Klasyfikacja powiatów ze względu na zmienne ekonomiczne na bazie optymalnej sieci. Źródło: Opracowanie własne

Rysunek 7. Przestrzenne zróżnicowanie powiatów Polski w 2000 roku badanych ze względu na zmienne ekonomiczne. Źródło: Opracowanie własne Pierwszą grupę stanowi 48 powiatów zdecydowanie w większości położonych wokół dużych miast, takich jak: Warszawa, Katowice, Poznań, Wrocław, Szczecin, Opole, Gdańsk i Bielsko-Biała. W grupie tej znalazły się powiaty o najniższym udziale pracujących w rolnictwie 30,7% za to najwyższym w przemyśle i budownictwie 34% i usługach rynkowych 18,2%. Są to powiaty o najwyższym przeciętnym wynagrodzeniu brutto wynoszącym 1959,6 zł i najniższej stopie bezrobocia wynoszącej 13,3%. Ów wysoki poziom płac wynikać może zarówno z niskich stóp bezrobocia, jak i wysokiego poziomu wydajności pracy. W większości jest to grupa powiatów charakteryzujących się najwyższymi dochodami budżetów gmin na jednego mieszkańca, najwyższymi wydatkami budżetów gmin inwestycyjnych w %, najwyższymi nakładami inwestycyjnymi w przedsiębiorstwach i wartością brutto środków trwałych w przedsiębiorstwach w przeliczeniu na jednego mieszkańca w zł. Powiaty te

charakteryzują się najwyższą liczbą podmiotów gospodarczych zarejestrowanych w rejestrze REGON. Tabela 2. Średnia badanych cech dla wyodrębnionych pięciu grup powiatów i średnia krajowa bez powiatu warszawskiego i miast na prawach powiatu*. Nazwa cechy Grupa 1 Grupa 2 Grupa 3 Grupa 4 Grupa 5 Średnia krajowa* Pracujący na 1000 ludności 357, 4 318,8 397,9 302,6 444,6 373,3 Pracujący: rolnictwo, 30,7 42,5 61,7 34,6 70,1 50,8 łowiectwo, leśnictwo, rybołówstwo i rybactwo w % Pracujący: przemysł i 34,9 25,9 17,5 30,0 12,1 22,4 budownictwo w % Pracujący: usługi rynkowe 18,2 13,7 8,9 16,4 6,8 12,0 w % Pracujący: usługi 16,3 17,9 11,9 19,1 11,0 14,9 nierynkowe w % Bezrobotni zarejestrowani 5714,8 5292,6 10993,4 10466,8 5039,2 6656,6 ogółem Bezrobotne kobiety ogółem 3311,8 2940,9 5861,5 5830,1 2648,0 3645,4 Przeciętne miesięczne 1959,6 1573,3 1635,4 1626,72 1596,2 1656,2 wynagrodzenie brutto w zł Stopa bezrobocia w % 13,3 22,2 17,9 25,7 15,3 18,6 Dochody budżetów gmin 1334,7 1180,5 1096,8 1172,2 1081,1 1160,9 na 1 mieszk. w zł Wydatki budżetów gmin 23,1 19,7 22,2 19,9 18,9 20,2 inwestycyjne w % Nakłady inwestycyjne w 2285,5 883,5 827,0 1085,3 644,2 1046,7 przedsiębiorstwach wg lokalizacji na 1 mieszkańca w zł Wartość brutto środków 25752,4 8299,2 9559,8 10549,8 6498,4 10891,3 trwałych w przedsiębiorstwach na 1 mieszkańca w zł Podmioty gospodarki narodowej zarejestrowane w rejestrze REGON ogółem 862,7 461,2 717,2 789,9 373,6 571,3 Drugą grupę stanowi 75 powiatów zlokalizowanych w większości w Polsce zachodniej. Powiaty z części centralnej, południowo-wschodniej i wschodniej jedynie w pojedynczych przypadkach reprezentują tą grupę. Bardzo widoczny jest podział powiatów należących do tej grupy na zachodnią i wschodnią część Polski. Powiaty te charakteryzują się dość niską liczbą zarejestrowanych podmiotów gospodarczych w rejestrze REGON, dość wysoką stopą

bezrobocia i niskim udziałem pracujących na 1000 ludności. W grupie tej przeciętne wynagrodzenie brutto jest na najniższym poziomie gdzie udział pracujących w usługach nierynkowych jest jednym z wyższych. W powiatach tych wartość brutto środków trwałych w przedsiębiorstwach w przeliczeniu na jednego mieszkańca jest również dość niski. Trzecią grupę stanowi 31 powiatów znajdujących się w części centralnej kraju i południowowschodniej. Są to w większości powiaty zlokalizowane w najbliższym sąsiedztwie byłych mniejszych miast wojewódzkich. Powiaty te charakteryzują się dość wysokim udziałem pracujących na 1000 ludności, stopą bezrobocia zbliżoną do średniej krajowej gdzie udział pracujących w rolnictwie jest dość wysoki a w przemyśle i budownictwie dość niski. Czwartą grupę stanowi 48 powiatów znajdujących się głównie w części północnej Polski. Powiaty te charakteryzują się najwyższym udziałem pracujących w usługach nierynkowych, dość wysokim udziałem pracujących w usługach rynkowych, przemyśle i budownictwie i jednym z niższych w rolnictwie. Można przypuszczać, że przyczyna tego stanu tkwi w dużej atrakcyjności turystycznej regionów nadmorskich. W grupie tej stopa bezrobocia jest na najwyższym poziomie gdzie liczba pracujących na 1000 ludności jest najniższa. Jest to rejon, w którym dokonano likwidacji PGR-ów lub redukcji zatrudnienia w górnictwie (byłe województwo wałbrzyskie), co doprowadziło do wysokiego bezrobocia strukturalnego. 10 Piątą grupę stanowi 105 powiatów znajdujących się w Polsce centralnej i wschodniej. Cechą charakterystyczną jest wysoki udział pracujących na 1000 ludności przy najniższym poziomie pracujących w przemyśle, budownictwie, usługach rynkowych i nierynkowych. Liczba podmiotów gospodarczych zarejestrowanych w rejestrze REGON jest tu najniższa a stopa bezrobocia jedna z niższych. Ta dość niska stopa bezrobocia wynika raczej z ukrytego bezrobocia gdzie zdecydowana większość pracujących pracuje w rolnictwie. Tereny te to obszary z dominacją rolnictwa, w których udział rolnictwa prywatnego jest w granicach 90%. 11 Dochody budżetów gmin na jednego mieszkańca, wydatki budżetów gmin inwestycyjne, nakłady inwestycyjne w przedsiębiorstwach, wartość środków trwałych w przedsiębiorstwach jest w tej grupie na najniższym poziomie. Jest to rejon słabiej rozwinięty, mniej uprzemysłowiony, z gorzej rozwiniętą infrastrukturą. 10 Tokarski Tomasz, Rogut Aleksandra [2000], Zróżnicowanie struktury pracujących a odpływy z bezrobocia, Wiadomości Statystyczne nr 3/2000 11 Kaczorowski Paweł, Aleksandra Rogut, Tomasz Tokarski [2001], Sektorowe zmiany strukturalne gospodarki w ujęciu regionalnym, Wiadomości Statystyczne nr 9/2001

PODSUMOWANIE Uzyskane wyniki wydają się interesujące. Z przeprowadzonej analizy wynika, że różne czynniki w różnym stopniu wpływają na zróżnicowanie powiatów w Polsce. Zaproponowana metoda nie wyjaśnia jednak, dlaczego tak się dzieje, że sąsiadujące ze sobą powiaty są tak odmienne. Autorzy także nie podejmą się takiej interpretacji. Na podstawie przeprowadzonej analizy można by wysunąć wnioski, które mogłyby przyczynić się do zmiany polityki regionalnej, rozwojów regionów i zahamowania pogłębiającej się dysproporcji między powiatami. LITERATURA 1. Neural Network Design, M. T. Hagen, H.B. Demuth, M. Beale, PWS Publishing Company ITP 1996 2. Self-Organizing Maps, T. Kohonen, Sprinder-Verlag 1997, 3. Visual Explorations in Finance with Self-Organizing Maps, G. Deboeck, T. Kohonen, Springer-Verlag 1998 4. E. Z. Zdrojewski, Przemiany ludnościowe w województwach nadmorskich, Wiadomości Statystyczne, Listopad 1998 5. J. Runge, Struktura rynku pracy regionu tradycyjnego i jego otoczenia na przykładzie województwa katowickiego, Wydawnictwo Uniwersytetu Śląskiego, Katowice 1996, 6. T. Tokarski, A. Rogut [2000], Zróżnicowanie struktury pracujących a odpływy z bezrobocia, Wiadomości Statystyczne nr 3/2000 7. P. Kaczorowski, A. Rogut, T. Tokarski [2001], Sektorowe zmiany strukturalne gospodarki w ujęciu regionalnym, Wiadomości Statystyczne nr 9/2001 8. Nałęcz Maciej (red.), Sieci neuronowe, tom 6, Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2000