Mirosław Krzyśko, Agnieszka Majka, Waldemar Wołyński

Podobne dokumenty
MODYFIKACJA KOSZTOWA ALGORYTMU JOHNSONA DO SZEREGOWANIA ZADAŃ BUDOWLANYCH

Znaczenie kapitału ludzkiego w budowie spójności społeczno-gospodarczej w wymiarze lokalnym (na przykładzie woj. mazowieckiego)

Analiza zatrudnienia w nowej UE z wykorzystaniem FPCA. Uniwersytet Rzeszowski Ćwiklińskiej 2, Rzeszów

σ-ciało zdarzeń Niech Ω będzie niepustym zbiorem zdarzeń elementarnych, a zbiór F rodziną podzbiorów zbioru Ω spełniającą warunki: jeśli A F, to A F;

TEORIA OBWODÓW I SYGNAŁÓW LABORATORIUM

Optymalizacja harmonogramów budowlanych - problem szeregowania zadań

ZASTOSOWANIE ANALIZY KORESPONDENCJI W BADANIU AKTYWNOŚCI TURYSTYCZNEJ EMERYTÓW I RENCISTÓW

Grupowanie sekwencji czasowych

wtedy i tylko wtedy, gdy rozwiązanie i jest nie gorsze od j względem k-tego kryterium. 2) Macierz części wspólnej Utwórz macierz

Matematyka dyskretna. Wykład 2: Kombinatoryka. Gniewomir Sarbicki

( ) + ( ) T ( ) + E IE E E. Obliczanie gradientu błędu metodą układu dołączonego

A. Cel ćwiczenia. B. Część teoretyczna

Monitoring zawodów deficytowych i nadwyżkowych w województwie zachodniopomorskim w 2011 roku

Prawdopodobieństwo i statystyka

ANALIZA WSKAŹNIKA ZATRUDNIENIA W KRAJACH NOWEJ UE Z WYKORZYSTANIEM FPCA

Monitoring zawodów deficytowych i nadwyżkowych w województwie zachodniopomorskim w 2013 roku

Algebra liniowa z geometrią analityczną

PLAN WYKŁADU OPTYMALIZACJA GLOBALNA ALGORYTM MRÓWKOWY (ANT SYSTEM) ALGORYTM MRÓWKOWY. Algorytm mrówkowy

Koła rowerowe malują fraktale

Wykorzystanie metody DEA w przestrzenno-czasowej analizie efektywności inwestycji

4.15 Badanie dyfrakcji światła laserowego na krysztale koloidalnym(o19)

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze

DSP-MATLAB, Ćwiczenie 5, P.Korohoda, KE AGH. Ćwiczenie 5. Przemysław Korohoda, KE, AGH

Optymalizacja harmonogramów budowlanych - problem szeregowania zadań

Modelowanie przez zjawiska przybliżone. Modelowanie poprzez zjawiska uproszczone. Modelowanie przez analogie. Modelowanie matematyczne

Podstawy rachunku prawdopodobieństwa (przypomnienie)

Zastosowanie metody PCA do opisu wód naturalnych

Zależność między poziomem wykształcenia a czasem pozostawania bez pracy bezrobotnych w Polsce

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 5.

Równanie Fresnela. napisał Michał Wierzbicki

Koła rowerowe kreślą fraktale

Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce

Uchwała Nr 42/2015 Komitetu Monitorującego Regionalny Program Operacyjny Województwa Podlaskiego na lata z dnia 29 października 2015 r.

Pomiary napięć przemiennych

OCENA JAKOŚCI PROCESU LOGISTYCZNEGO PRZEDSIĘBIORSTWA PRZEMYSŁOWEGO METODĄ UOGÓLNIONEGO PARAMETRU CZĘŚĆ II

ALGEBRA Z GEOMETRIĄ ANALITYCZNĄ

dr Bartłomiej Rokicki Katedra Makroekonomii i Teorii Handlu Zagranicznego Wydział Nauk Ekonomicznych UW

Wybrane rozkłady zmiennych losowych i ich charakterystyki

10. Redukcja wymiaru - metoda PCA

Kierunki racjonalizacji jednostkowego kosztu produkcji w przedsiębiorstwie górniczym

URZĄD STATYSTYCZNY W WARSZAWIE ul. 1 Sierpnia 21, Warszawa PRODUKT KRAJOWY BRUTTO W WOJEWÓDZTWIE MAZOWIECKIM W LATACH

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

Matematyka Dyskretna - zagadnienia

(U.3) Podstawy formalizmu mechaniki kwantowej

Mieczysław Kowerski. Program Polska-Białoruś-Ukraina narzędziem konwergencji gospodarczej województwa lubelskiego

Wykład 5: Statystyki opisowe (część 2)

Ćwiczenie 4 Badanie wpływu asymetrii obciążenia na pracę sieci

BELKI CIĄGŁE STATYCZNIE NIEWYZNACZALNE

Programowanie wielocelowe lub wielokryterialne

Sygnały stochastyczne

A i A j lub A j A i. Operator γ : 2 X 2 X jest ciągły gdy

Prognozowanie notowań pakietów akcji poprzez ortogonalizację szeregów czasowych 1

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO

Wykład 21: Studnie i bariery cz.1.

ZARYS METODY OPISU KSZTAŁTOWANIA SKUTECZNOŚCI W SYSTEMIE EKSPLOATACJI WOJSKOWYCH STATKÓW POWIETRZNYCH

Polski handel zagraniczny zwierzętami żywymi oraz produktami pochodzenia zwierzęcego z krajami Unii Europejskiej

Uwaga 1.1 Jeśli R jest relacją w zbiorze X X, to mówimy, że R jest relacją w zbiorze X. Rozważmy relację R X X. Relację R nazywamy zwrotną, gdy:

KONCEPCJA SYSTEMU BONIFIKAT DLA ODBIORCÓW ZA NIEDOTRZYMANIE PRZEZ DOSTAWCĘ WYMAGANEGO POZIOMU JAKOŚCI NAPIĘCIA

Hierarchiczna analiza skupień

Colloquium 3, Grupa A

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Metody Lagrange a i Hamiltona w Mechanice

Miasto: Rzeszów. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,1 50,1 52,6 54,6

Monitoring zawodów deficytowych i nadwyżkowych w województwie zachodniopomorskim w 2014 roku

RANKING ZAWODÓW DEFICYTOWYCH I NADWYŻKOWYCH W POWIECIE MIASTA ŚWIĘTOCHŁOWICE

4. Weryfikacja modelu

Programowanie wielocelowe lub wielokryterialne

Wpływ zamiany typów elektrowni wiatrowych o porównywalnych parametrach na współpracę z węzłem sieciowym

Analiza składowych głównych. Wprowadzenie

Metody numeryczne. Instytut Sterowania i Systemów Informatycznych Wydział Elektrotechniki, Informatyki i Telekomunikacji Uniwersytet Zielonogórski

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t.

Metody probabilistyczne Rozwiązania zadań

jest scharakteryzowane przez: wektor maksymalnych żądań (ang. claims), T oznaczający maksymalne żądanie zasobowe zadania P j

Wykres linii ciśnień i linii energii (wykres Ancony)

Piła, listopad 2001 rok

WAHADŁO SPRĘŻYNOWE. POMIAR POLA ELIPSY ENERGII.

Miasto: Kielce. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,0 53,3 57,1 59,2

WYBRANE DANE(a) STATYSTYCZNE 2010

Sterowanie Ciągłe. Używając Simulink a w pakiecie MATLAB, zasymulować układ z rysunku 7.1. Rys.7.1. Schemat blokowy układu regulacji.

Miasto: Olsztyn. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 88. Miasto Województwo ,6 48,8 51,9 53,7

Zastosowanie syntetycznych mierników dynamiki struktury w analizie zmian aktywności ekonomicznej ludności wiejskiej

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

WYBRANE DANE(a) STATYSTYCZNE 2010

DRGANIA WŁASNE RAM OBLICZANIE CZĘSTOŚCI KOŁOWYCH DRGAŃ WŁASNYCH

RAPORT Z REALIZACJI. Strategii Rozwoju Województwa Małopolskiego na lata za okres

FOLIA POMERANAE UNIVERSITATIS TECHNOLOGIAE STETINENSIS TURYSTYKA W SZCZECINIE W ODNIESIENIU DO BADAŃ ANKIETOWYCH

Zaliczenie wykładu Technika Analogowa Przykładowe pytania (czas zaliczenia minut, liczba pytań 6 8)

FOLIA POMERANAE UNIVERSITATIS TECHNOLOGIAE STETINENSIS Folia Pomer. Univ. Technol. Stetin. 2009, Oeconomica 273 (56), 7 16

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

WOJEWÓDZKI URZĄD PRACY W SZCZECINIE. Monitoring zawodów deficytowych i nadwyżkowych w województwie zachodniopomorskim w I półroczu 2013 roku

WYBRANE DANE STATYSTYCZNE

WYBRANE DANE STATYSTYCZNE

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

WYBRANE DANE STATYSTYCZNE

WYBRANE DANE(a) STATYSTYCZNE 2010

WYBRANE DANE(a) STATYSTYCZNE 2010

Miasto: Zielona Góra. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r. 58. Miasto Województwo ,4

Miasto: Kraków. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,5 53,4 56,1 57,8

WYBRANE DANE(a) STATYSTYCZNE 2010

Miasto: Katowice. WYBRANE DANE(a) STATYSTYCZNE Powierzchnia w km2 w 2013 r Miasto Województwo ,7 54,7 56,7 58,4

Transkrypt:

PRZEGLĄD STATYSTYCZNY R. LXIII ZESZYT 1 2016 MIROSŁAW KRZYŚKO 1,3, AGNIESZKA MAJKA 2, WALDEMAR WOŁYŃSKI 3 OCENA ZRÓŻNICOWANIA POZIOMU ŻYCIA MIESZKAŃCÓW WOJEWÓDZTW W LATACH 2003 2013 ZA POMOCĄ SKŁADOWYCH GŁÓWNYCH DLA WIELOWYMIAROWYCH DANYCH FUNKCJONALNYCH ORAZ ANALIZY SKUPIEŃ 1. WSTĘP Badanie poziomu życia i jego zróżnicowania nabiera szczególnego znaczenia w onteście analizy stopnia przemian gospodarczych, porównania rozwoju wybranych obszarów czy wsazania dysproporcji życia społeczeństwa zamieszującego dany region. Dzięi taim ocenom można wsazać dystans dzielący poszczególne regiony, wyodrębnić grupy o zbliżonym poziomie życia, uchwycić podobieństwa i różnice występujące pomiędzy poziomem życia w poszczególnych jednostach administracyjnych czy oreślić zagrożenia danego regionu. Wstępując do Unii Europejsiej (UE) Polsa włączyła się w realizację polityi spójności mającej na celu promowanie harmonijnego rozwoju całego terytorium UE poprzez działania prowadzące do zmniejszenia zróżnicowania w rozwoju jej regionów, a tym samym do wzmocnienia spójności gospodarczej, społecznej i terytorialnej Wspólnoty. Efetem tej polityi powinno być wyrównywanie dysproporcji w poziomie życia mieszańców poszczególnych regionów UE. W ramach polityi spójności w latach 2007 2013 Polsa otrzymała łącznie 67 mld euro, czyli 20% całego budżetu UE przeznaczonego na ten cel. Biorąc pod uwagę, że wszysto co dzieje się w społeczeństwie i w gospodarce zmienia się w miarę upływu czasu, zasadne wydaje się spojrzenie na zmiany, jaie nastąpiły w zróżnicowaniu poziomu życia mieszańców poszczególnych regionów Polsi. Celem artyułu jest ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013. 1 Państwowa Wyższa Szoła Zawodowa im. Prezydenta Stanisława Wojciechowsiego, Wydział Zarządzania, ul. Nowy Świat 4, 62-800 Kalisz, Polsa, autor prowadzący orespondencję, e-mail: mrzyso @amu.edu.pl. 2 Uniwersytet Rzeszowsi, Wydział Eonomii, Katedra Metod Ilościowych i Informatyi Gospodarczej, ul. Ćwilińsiej 2, 35-601 Rzeszów, Polsa. 3 Uniwersytet im. Adama Miciewicza w Poznaniu, Wydział Matematyi i Informatyi, ul. Umultowsa 87, 61-614 Poznań, Polsa.

82 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi Nowością tej pracy jest fat rozpatrywania lat 2003 2013 łącznie, a nie oddzielnie ażdego rou. Można to było osiągnąć po przeształceniu danych oryginalnych w postaci szeregów czasowych dla ażdej cechy oddzielnie na wetorowe funcje ciągłe oreślone na ustalonym przedziale czasowym zwane wielowymiarowymi danymi funcjonalnymi (patrz Jacques, Preda, 2014 oraz Góreci i inni, 2014). Do oceny przestrzennego zróżnicowania poziomu życia zastosowano analizę sładowych głównych dla wielowymiarowych danych funcjonalnych (patrz secja 3) oraz dendrytową metodę analizy supień (patrz secja 4). Metody te pozwoliły na wyodrębnienie grup województw o zbliżonym poziomie wartości rozpatrywanych cech dla całego rozpatrywanego oresu łącznie. Wszystie obliczenia wyonane zostały przy użyciu programu R. 2. DOBÓR ZMIENNYCH ORAZ ICH UNITARYZACJA Na podstawie przesłane merytorycznych ustalono zestaw zmiennych diagnostycznych dotyczących wielu aspetów życia, taich ja: wynagrodzenia, ryne pracy, opiea zdrowotna i społeczna, omuniacja i infrastrutura gospodarcza, sytuacja mieszaniowa, oświata i ultura, środowiso, bezpieczeństwo. Przy doborze zmiennych ierowano się oniecznością w miarę wszechstronnego opisu poziomu życia, dostępnością i ompletnością danych statystycznych. Wybrane zmienne miały charater wsaźniowy. Na liście zmiennych diagnostycznych znalazły się: wynagrodzenia i ryne pracy: x 1 przeciętne miesięczne wynagrodzenie brutto w zł (w podmiotach gospodarczych o liczbie pracujących powyżej 9 osób), x 2 przeciętny miesięczny dochód rozporządzalny na 1 osobę, x 3 stopa bezrobocia rejestrowanego w % (d), x 4 liczba pracujących na 1000 mieszańców, x 5 odsete pracujących w rolnictwie (d), x 6 odsete pracujących w usługach, x 7 bezrobotni z wyształceniem wyższym w ogólnej liczbie ludności w wieu producyjnym (d), x 8 bezrobotni pozostający bez pracy powyżej 24 miesięcy w ogólnej liczbie bezrobotnych (d), x 9 ludność w wieu producyjnym na 1 tys. osób w wieu nieproducyjnym, x 10 ludność w wieu poproducyjnym na 1 tys. osób w wieu producyjnym (d); opiea zdrowotna i społeczna: x 11 wydati budżetowe w dziale ochrona zdrowia na 1 mieszańca w zł, x 12 liczba learzy na 1 tys. mieszańców, x 13 liczba mieszańców przypadających na 1 apteę ogólnodostępną (d), x 14 placówi stacjonarnej opiei społecznej na 1 tys. ludności;

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 83 infrastrutura gospodarcza: x 15 rozdzielcza sieć wodociągowa w m na 100 m 2, x 16 rozdzielcza sieć analizacyjna w m na 100 m 2, x 17 rozdzielcza sieć gazowa w m na 100 m 2, x 18 gęstość dróg (drogi o twardej nawierzchni w m na 100 m 2 ), x 19 liczba ludności przypadająca na 1 placówę pocztową (d); zasoby mieszaniowe: x 20 wydati budżetowe w dziale gospodara mieszaniowa na 1 mieszańca w zł, x 21 przeciętna powierzchnia mieszań w przeliczeniu na 1 osobę, x 22 liczba mieszań na 1 tys. ludności, x 23 odsete mieszań wyposażonych w wodociąg, x 24 odsete mieszań wyposażonych w łazienę, x 25 odsete mieszań wyposażonych w gaz sieciowy; oświata, ultura i rereacja: x 26 odsete dzieci w wieu 3 6 lat objętych wychowaniem przedszolnym, x 27 studenci szół wyższych na 10 tys. ludności, x 28 liczba uczniów szół podstawowych przypadających na 1 omputer z dostępem do Internetu (d), x 29 liczba uczniów szół ponadgimnazjalnych przypadających na 1 omputer z dostępem do Internetu (d), x 30 wydati budżetowe w dziale ultura i sport na 1 mieszańca w zł, x 31 liczba lubów sportowych na 1 tys. ludności, x 32 sięgozbiór bibliote na 1 tys. ludności, x 33 domy i ośrodi ultury, luby i świetlice na 10 tys. mieszańców; bezpieczeństwo i środowiso: x 34 przestępstwa stwierdzone w zaończonych postępowaniach przygotowawczych w przeliczeniu na 10 tys. mieszańców (d), x 35 nałady na środi trwałe służące ochronie środowisa na 1 mieszańca, x 36 odpady wytworzone na 1 m 2 (poza odpadami omunalnymi) (d), x 37 lesistość w %. Literą (d) oznaczono destymulanty. Pozostałe cechy są stymulantami. W celu ujednolicenia wartości rozpatrywanych cech, tóre są wyrażone w różnych jednostach pomiarowych i mają różne przedziały zmienności, przeprowadzono ich unitaryzację zerowaną (por. np. Walesia, 2014). Niech X ij będzie wartością cechy X zaobserwowaną w i-tym województwie oraz j-tym rou, gdzie = 1,,37, i = 1,,16, j = 1,,11. Wówczas zunitaryzowana wartość z ij wartości X ij ma postać:

84 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi z ij Z ] x - min x ] rj = [ ] max x - x ] rj \ ij i ij i ij ij, gdy cecha X jest stymulantą,, gdy cecha X jest destymulantą, gdzie r = max x -min x j jest rozstępem -tej cechy w j-tym rou. Równoważnie, zunitaryzowane wartości z ij można zapisać w postaci: i ij z ij = b j x ij + a j, i ij gdzie b j = r 1, j a j min ix ij =- r, (1) j w przypadu stymulant oraz b j = r 1, j a j max ix ij =- r, (2) j w przypadu destymulant. Niech x j, s 2 j oraz r j będą odpowiednio: wartością średnią, wariancją oraz rozstępem cechy X w j-tym rou. Wówczas zunitaryzowane wartości tych wielości są równe: zr ij Z ] xr - min x ] rj = [ ] max x - xr ] rj \ dla = 1,,37, j = 1,,11. ij i ij i ij ij, gdy cecha X jest stymulantą,, gdy cecha X jest destymulantą, s 2 j su 2 j =, r 2 j r j = 1,

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 85 Jeśli s lj jest owariancją między cechami X oraz X j w j-tym rou, gdzie l, to owariancja danych zunitaryzowanych jest równa: s lj = b j b lj s lj, gdzie b j oraz b lj dane są wzorem (1) dla stymulant oraz wzorem (2) dla destymulant. Widzimy, że po unitaryzacji zerowanej rozstęp wszystich cech we wszystich latach jest stały i równy 1, natomiast wariancje i owariancje w danym rou są proporcjonalne do wariancji i owariancji cech bez unitaryzacji zerowanej w tym rou. 3. WIELOWYMIAROWE FUNKCJONALNE SKŁADOWE GŁÓWNE W rozdziale tym omówiona zastanie analiza sładowych głównych dla wielowymiarowych danych funcjonalnych (MFPCA) (por. Jacques, Preda, 2014; Góreci i inni, 2014). Klasycznymi pozycjami z zaresu metod statystycznych dla jednowymiarowych danych funcjonalnych są monografie Ramsaya, Silvermana (2005) oraz Horvátha, Kooszi (2012). Załóżmy, że obserwujemy p-wymiarowy proces stochastyczny X(t) = = (X 1 (t), X 2 (t),,x p (t))' z ciągłym parametrem t I. Dalej załóżmy, że E(X(t)) = 0 p i X(t) L2 ^ I h, gdzie L 2(I) jest przestrzenią Hilberta funcji całowalnych z wadratem na przedziale I z iloczynem salarnym postaci: 1 u^th, v^t h2= # ul^t hv^thdt. Ponadto załóżmy, że -ta sładowa procesu X(t) może być reprezentowana przez sończoną liczbę ortonormalnych funcji bazowych {φ b } B X ^th= / c { ^th, t I, = 1,2,,p, b b b = 0 gdzie c b są zmiennymi losowymi taimi, że E(c b ) = 0, Var(c b ) <, = 1,2,,p, b = 0,,B. Niech = ^c, f, c, f, c, f, c h l, c 10 1B1 p0 pbp R S { l 1^t h 0 f S 0 { l 2^t h f U ^ t h = S S f f f S 0 0 f T gdzie { ^th= `{ ^th, f, { ^th j l, = 1,2,,p. 0 B I V 0 W 0 W W, (3) f W { l p^thw X

86 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi Używając notacji macierzowej proces X(t) ma następującą reprezentację Poszuujemy zmiennej losowej X(t) = Φ(t)c, t I, E(c) = 0, Var(c) = Σ c. U = 1 u^th, X^th2= ul^thx^thdt p mającej masymalną wariancję dla wszystich u(t) L2 ^Ih taich, że < u(t), u(t) > = 1. Możemy założyć, że wetor funcji wagowych u(t) oraz proces X(t) należą do tej samej przestrzeni, tzn. funcja u(t) może być przedstawiona w następującej postaci: # u(t) = Φ(t)u, gdzie u R K+p, K = B 1 + + B p. Wtedy oraz < u(t), X(t) > = < Φ(t)u, Φ(t)c > = u' < Φ(t), Φ(t) > c = u'c E(< u(t), X(t) >) = u'e(c) = u' 0 = 0, I Niech Var(< u(t), X(t) >) = u'e(cc')u = u' Σ c u. m = sup Var^1 u^t h, X^t h2h= Var`1 u ^th, X^ th 2j = ul R u, 1 1 p u^ thd L 2 ^I h 1 c 1 gdzie < u 1 (t), u 1 (t) > = u' 1 u 1 = 1. Zmienną losową U 1 = < u 1 (t), X(t) > = u' 1 c nazywać będziemy pierwszą funcjonalną sładową główną, a funcję wetorową u 1 (t) pierwszym wetorem funcji wagowych. Następnie szuamy drugiej funcjonalnej sładowej głównej U 2 = < u 2 (t), X(t) > = u' 2 c, masymalizującej Var(< u(t), X(t) >) = u' Σ c u taiej, że < u 2 (t), u 2 (t) > = u' 2 u 2 = 1 oraz niesorelowanej z pierwszą funcjonalną sładową główną U 1, tzn. spełniającą warune < u 1 (t), u 2 (t) > = u' 1 u 2 = 0. Ogólnie -ta funcjonalna sładowa główna U = < u (t), X(t) > = u' c spełnia waruni: m = sup Var^1 u^t h, X^t h2h= Var`1 u ^th, X^ th 2j = ul R u, p u^ thd L 2 ^I h < u κ1 (t), u κ2 (t) > = δ κ1 κ 2 ; κ 1,κ 2 = 1,,. Parę (λ, u (t)) będziemy nazywać -tym uładem głównym procesu X(t). c

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 87 Rozważmy teraz zagadnienie sładowych głównych dla wetora losowego c. -ta sładowa główna U * = < u, c > tego wetora spełnia waruni: c = sup Var^1 u, c 2h= sup uvar l ^chu= sup u d R K+ p udrk+ p udrk+ p u' κ1 u κ2 = δ κ1 κ 2, ulr u = ul R u, c c gdzie κ 1,κ 2 = 1,,, K = B 1 + + B p. Parę (γ, u ) nazywać będziemy -tym uładem głównym wetora c. Wyznaczenie -tego uładu głównego wetora c jest równoważne z wyznaczeniem wartości własnych oraz odpowiadających im wetorów własnych macierzy owariancji Σ c spełniających warune u' 1 u 2 = δ 1 2. Z powyższych rozważań wynia następujące twierdzenie. Twierdzenie -ty uład główny (λ,u (t)) procesu stochastycznego X(t) jest związany z -tym uładem głównym (γ, u ) wetora losowego c następującymi zależnościami: λ = γ, u (t) = Φ(t)u, t I, gdzie = 1,, K + p, K = B 1 + B 2 + + B p. Analiza sładowych głównych dla wetora losowego c bazuje na macierzy Σ c. W pratyce macierz ta nie jest znana. Możemy ją oszacować na podstawie n niezależnych realizacji x 1 (t), x 2 (t),, x n (t) procesu losowego X(t). W typowych sytuacjach dane pochodzą z obserwacji zmiennych w dysretnych momentach czasowych. Proces transformacji taich danych dysretnych do danych funcjonalnych wyonujemy osobno dla ażdej zmiennej X 1,X 2,,X p. Niech x j oznacza obserwowaną wartość zmiennej X, = 1,2,,p w j-tym momencie czasowym t j, gdzie j = 1,2,,J. Zatem dane sładają się z pj par (t j, x j ). Te dane dysretne wygładzamy za pomocą funcji ciągłych x (t), gdzie t I (por. Ramsay, Silverman, 2005). Niech I będzie zbiorem zwartym taim, że t j I, dla j = 1,,J. Załóżmy, że funcja x (t) ma następującą reprezentację B x ^th= / c { ^th, t I, = 1,,p, (4) b b b = 0 gdzie {φ b } są ortonormalnymi funcjami bazowymi, a c 0, c 1,, c B są współczynniami. Niech x = (x 1, x 2,, x J )', c = (c 0, c 1,, c B )' oraz Φ (t) będzie macierzą wymiaru J (B + 1) zawierającą wartości φ b (t j ), b = 0,1,,B, j = 1,2,,J, = 1,,p. Współczynni c we wzorze (4) jest oszacowany metodą najmniejszych wadratów ta, aby minimalizował funcję:

88 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi S(c ) = (x Φ (t)c )' (x Φ (t)c ), = 1,,p. Różniczując S(c ) względem wetora c, otrzymujemy estymator najmniejszych wadratów postaci: -1 c = `U l^t hu ^ h Ul t t j ^ th x, = 1,,p. Stopień gładości funcji x (t) zależy od wartości B (mała wartość B oznacza więsze wygładzenie rzywej). Optymalną wartość B możemy ustalić przy pomocy bayesowsiego ryterium informacyjnego BIC (por. Schwarz, 1978; Shmueli, 2010). Załóżmy, że dysponujemy n niezależnymi parami wartości (t j,x ij ), = 1,,p, i = 1,,n, j = 1,,J. Dane te wygładzamy za pomocą funcji ciągłych postaci: B i x ^th= / ct { ^th, = 1,,p, i = 1,,n, t I. i ib b b = 0 Spośród wszystich wartości B 1, B 2,, B n wybieramy jedną wspólną wartość B jao modę z wartości B 1, B 2,, B n oraz załadamy, że funcje x i (t) mają postać B x ^th= / ct { ^th, = 1,,p, i = 1,,n, t I. i ib b b = 0 Dane postaci {x 1 (t),, x n (t)} noszą nazwę danych funcjonalnych (por. Ramsay, Silverman, 2005). Ogólnie załóżmy, że n niezależnych realizacji x 1 (t), x 2 (t),, x n (t) może być przedstawionych w postaci x i (t) = Φ(t)ĉ i gdzie Φ(t) dane jest wzorem (3) oraz że wetory ĉ i = (ĉ 10,, ĉ 1B1,,ĉ p0,, ĉ pbp )' są scentrowane, i = 1,2,,n. Oznaczmy Ĉ = (ĉ 1,ĉ 2,,ĉ n ). Wtedy 1 R t c = n CC tt l. Niech ct 1 H ct 2 H f H ct s będą niezerowymi wartościami własnymi macierzy R t c, a û 1,û 2,,û s odpowiadającymi im wetorami własnymi, gdzie s = ran( R t ). c Ponadto -ty uład główny procesu losowego X(t) wyznaczony na podstawie próby ma następującą postać: `mt = ct,ut ^th= U^thut j, = 1,,s. Współrzędne rzutu i-tej realizacji x i (t) procesu X(t) na ierune wyznaczony przez -tą funcjonalna sładową główną są równe:

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 89 Ut = t, t = 1 U^thut t t c u t 1 h h2 t t, U^th i 2 l l i 1 u^t h xi^ h2 c = u U^t, U^ t i = c i, dla i = 1,2,,n, = 1,2,,s. Ogólnie współrzędne rzutu i-tej realizacji x i (t) procesu X(t) na płaszczyznę wyznaczoną przez dwie pierwsze funcjonalne sładowe główne są równe: ^utl ct, utl ct h, i = 1,2,,n. 1 i 2 i 4. DENDRYTOWA ANALIZA SKUPIEŃ Omówimy teraz róto metodę analizy supień bazującą na dendrycie. Z puntu widzenia teorii grafów dendryt jest synonimem drzewa. Dendryt lub drzewo jest grafem spinającym (ażde dwa wierzchołi łączy jaaś droga), tóry nie zawiera cyli. Minimalny dendryt, to tai dendryt, w tórym suma wag przy rawędziach jest minimalna. Najczęściej wagami są odległości. Konstrucja dendrytu podana została przez grupę matematyów wrocławsich w pracy Flore i inni (1951a). Metoda ta znana pod nazwą tasonomia wrocławsa została spopularyzowana w pracach Flore inni (1951b) oraz Peral (1953). Istnieją dwie niezwyle proste procedury postępowania pozwalające sonstruować minimalny dendryt. Pierwszą z nich jest algorytm Krusala: 1. Wybieramy rawędź o najmniejszej długości. 2. Z pozostałych rawędzi wybieramy tę o najmniejszej długości, tóra nie prowadzi do cylu (z połączeń o jednaowych długościach wybieramy dowolne). 3. Powtarzamy poprzedni ro do zaończenia budowy minimalnego dendrytu. Algorytm Prima rozpoczyna od drzewa sładającego się z jednego wierzchoła, ciągle dodając najrótszą rawędź drzewa. Najrótszy dendryt można wyorzystać w analizie supień. Idea polega na usunięciu z minimalnego dendrytu wszystich rawędzi, tórych długość jest więsza od wspólnej wartości rytycznej d. Wyliczamy wartość średnią x oraz odchylenie standardowe s z długości wszystich rawędzi najrótszego dendrytu i przyjmujemy d = x + s. Wierzchołi, tóre pozostają połączone w minimalnym dendrycie tworzą supienie. Zaprezentowana tutaj metoda jest szerzej omówiona w secji 10.3 podręcznia Dziechciarza (2003). 5. WYNIKI BADAŃ EMPIRYCZNYCH Analizą objęto 16 województw Polsi (n = 16). Na prezentowanych dalej wyresach poszczególne województwa są oznaczone numerami przedstawionymi w tabeli 1. Analizowane dane obejmują ores 11 lat, od 2003 do 2013 rou (J = 11). Każde województwo scharateryzowano za pomocą 37 cech, zgrupowanych w 6 podzbiorach obrazujących różnorodne aspety życia mieszańców danego regionu, ja: wynagrodzenia i ryne pracy;

90 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi opiea zdrowotna i społeczna; infrastrutura gospodarcza; zasoby mieszaniowe; oświata, ultura i rereacja oraz bezpieczeństwo i środowiso. Numeryczne oznaczenia województw Tabela 1. Nr Województwo Nr Województwo 1 dolnośląsie 9 podarpacie 2 ujawso-pomorsie 10 podlasie 3 lubelsie 11 pomorsie 4 lubusie 12 śląsie 5 łódzie 13 świętorzysie 6 małopolsie 14 warmińso-mazursie 7 mazowiecie 15 wielopolsie 8 opolsie 16 zachodniopomorsie Źródło: opracowanie własne. Dane pierwotne zostały poddane unitaryzacji zerowanej (patrz secja 2), a następnie przeształcone do wielowymiarowych danych funcjonalnych. Posłużono się funcjami bazowymi Fouriera. Przedział czasowy I = [0,11] został podzielony na momenty czasowe następująco: t 1 = 0,5 (2003), t 2 = 1,5 (2004),, t 11 = 10,5 (2013). Następnie dla wszystich 37 cech łącznie oraz oddzielnie dla ażdej z 6 grup cech zostały sonstruowane funcjonalne sładowe główne. Każde z 16 województw zostało przedstawione jao punt w uładzie dwóch pierwszych funcjonalnych sładowych głównych. Kolejno dla wszystich grup cech zostały zbudowane dendryty (por. Flore i inni, 1951) na podstawie tablicy wzajemnych odległości eulidesowych między województwami w przestrzeni wszystich funcjonalnych sładowych głównych. Odległości te są równe odległościom eulidesowym w oryginalnej przestrzeni danych funcjonalnych. Dendryty te rozpięto na puntach reprezentujących poszczególne województwa i wyorzystano do analizy supień. W ażdym z dendrytów policzono wartość średnią x długości rawędzi oraz odchylenie standardowe s tych długości. Krawędzie, tórych długość była więsza od d = x + s zaznaczone są na rysunach linią przerywaną. W ten sposób uzysano podział województw na względnie jednorodne supienia.

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 91 Rysune 1. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie wszystich 37 cech Źródło: opracowanie własne. Analiza przeprowadzona w oparciu o wszystie 37 cech diagnostycznych pozwoliła wyodrębnić cztery grupy województw względnie jednorodnych pod względem poziomu życia mieszańców. Dwie z nich to grupy jednoelementowe: woj. śląsie i woj. mazowiecie. Kolejną grupę utworzyły województwa: dolnośląsie, pomorsie, wielopolsie, zachodniopomorsie, lubusie, opolsie, małopolsie, ujawso- -pomorsie, łódzie i warmińso-mazursie. Grupę czwartą utworzyły cztery województwa ściany wschodniej, często oreślane mianem wschodniej ściany płaczu : podarpacie, podlasie, świętorzysie i lubelsie. Województwa te są najuboższymi regionami Polsi, a do momentu wejścia w strutury UE Bułgarii i Rumunii, były też uznawane za najuboższe w całej Wspólnocie. Niepoojącym wydaje się taże fat, iż w świetle badań prowadzonych przez OECD we współpracy z Ministerstwem Rozwoju Regionalnego a taże danych z ostatniego Spisu Powszechnego, różnice w rozwoju gospodarczym i społecznym polsich regionów pogłębiają się. Z raportu Przegląd Regionalny Polsi 2012 opracowanego przez Ministerstwo Rozwoju Regionalnego wynia, iż mimo długoletnich działań oraz liczonej w miliardach euro pomocy z Unii Europejsiej przepaść między Polsą wschodnią a resztą raju niebezpiecznie rośnie. Najwolniej dystans do średniej unijnej nadrabiały województwa o najniższym poziomie PKB per capita (województwa Polsi Wschodniej i woj. zachodniopomorsie). Pięć województw Polsi Wschodniej nadal znajdowało się w grupie 20 europejsich regionów NUTS 2 o najniższym poziomie PKB per capita, z poziomem tego wsaźnia w relacji do średniej unijnej od 42% (lubelsie) do 47% (świętorzysie). Wyorzystując podzbiory cech diagnostycznych wyodrębniono grupy województw względnie jednorodnych pod względem poszczególnych aspetów ształtujących ogólny poziom życia mieszańców. Uzysane wynii zaprezentowano na rysunach 2 7.

92 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi Rysune 2. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie cech opisujących wynagrodzenie i ryne pracy Źródło: opracowanie własne. Cechy charateryzujące wynagrodzenia i ryne pracy podzieliły województwa Polsi na trzy grupy. Jedną z nich tworzą województwa: lubelsie, świętorzysie, podarpacie i podlasie. Województwa te, będące typowo rolniczym regionem naszego raju, charateryzuje relatywnie wysoi odsete zatrudnionych w rolnictwie, mała onurencyjność gospodari, nisi poziom bezpośrednich inwestycji zagranicznych w sali raju co niewątpliwie wpływa na bardzo nisi poziom dochodów ludności oraz relatywnie wysoie bezrobocie. Drugą grupę, względnie jednorodną pod względem poziomu wynagrodzeń i sytuacji na rynu pracy, utworzyło 11 województw. Trzecią grupą stanowi województwo mazowiecie, w tórym przeciętne miesięczne wynagrodzenia brutto w analizowanych 11 latach wahały się pomiędzy 129,8% (w rou 2003) a 123,1% (w rou 2013) średniej rajowej. Woj. mazowiecie jest jednym z dwóch województw Polsi, w tórych przeciętne miesięczne wynagrodzenia przeraczają średnią rajową, przy czym dystans wynagrodzeń w drugim, tj. w woj. śląsim do średniej rajowej jest zdecydowanie mniejszy. W mazowiecim obserwuje się też relatywnie nisi poziom bezrobocia. Pod względem opiei zdrowotnej i społecznej województwo mazowiecie po raz olejny nie weszło w sład żadnej z grup względnie jednorodnych utworzonych z pozostałych województw. Wiele przewag województwa mazowieciego wynia niewątpliwie z fatu, iż jest to region ze stolicą raju, mamy tu zloalizowaną dużą bazę aademicą z najwięszą uczelnią medyczną w Polsce, dużą liczbę szpitali i learzy (przyładowo w rou 2010 na terenie tego województwa działało 14% ogółu szpitali publicznych i 12% ogółu szpitali niepublicznych, pracowało tu bliso 30 tys. (tj. 17%) spośród 172 tys. pracujących learzy w Polsce).

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 93 Rysune 3. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie cech opisujących opieę zdrowo tną i społeczną Źródło: opracowanie własne. Grupy względnie jednorodne pod względem poziomu opiei zdrowotnej i społecznej utworzyły województwa: łódzie z dolnośląsim i lubelsim, opolsie z warmińso-mazursim i grupę trzecią dziesięć pozostałych województw. Rysune 4. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie cech opisujących infrastruturę gospodarczą Źródło: opracowanie własne. Aż 13. spośród szesnastu województw utworzyło grupę względnie jednorodną pod względem wyposażenia i stanu infrastrutury gospodarczej. Poza wspomnianą grupą znalazły się postrzegane jao najzasobniejsze pod względem infrastrutury technicznej województwa śląsie i małopolsie (usytuowane wzdłuż międzynarodo-

94 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi wych szlaów omuniacyjnych i transportowych, z najwięszym w raju zagęszczeniem sieci drogowej i olejowej oraz wodno-analizacyjnej) oraz podarpacie, tóre cechuje słaba dostępność omuniacyjna, wyniająca z niedostatecznej i nisiej jaości sieci drogowej i olejowej, nisie tempo rozwoju infrastrutury teleinformatycznej (zwłaszcza szeroopasmowego dostępu do Internetu) oraz wymagający rozbudowy i modernizacji stan infrastrutury omunalnej i energetycznej. Rysune 5. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie cech opisujących zasoby mieszaniowe Źródło: opracowanie własne. Analiza przeprowadzona w oparciu o cechy obrazujące stan zasobów mieszaniowych w latach 2003 2013 pozwoliła na wyodrębnienie czterech grup województw o zbliżonym poziomie rozpatrywanych cech. Jedną z tych grup, tworzy (po raz olejny jednoosobowo ) województwo mazowiecie, w tórym notuje się najwięszą liczbę mieszań na 1 tys. mieszańców i najwięszą powierzchnię użytową mieszania w przeliczeniu na 1 osobę. W wyniu analizy przeprowadzonej w oparciu o cechy opisujące wyposażenie i stan oświaty, ultury i rereacji w poszczególnych województwach wyodrębniono grupę względnie jednorodną w sład, tórej weszło aż 14 województw Polsi. Poza nią znalazły się jedynie województwa śląsie i podarpacie. Oddalenie województwa podarpaciego od pozostałych wynia z fatu, iż mamy tu do czynienia z relatywnie najwięszą liczbą lubów sportowych w przeliczeniu na 10 tys. mieszańców ale też z jednym z najniższych w sali raju odsetiem dzieci objętych wychowaniem przedszolnym. W śląsim, z olei, mamy najsłabsze wyposażenie szół w omputery z dostępem do Internetu oraz relatywnie małą liczbę lubów sportowych oraz domów, lubów i ośrodów ultury w przeliczeniu na liczbę mieszańców.

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 95 Rysune 6. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie cech opisujących oświatę, ulturę i rereację Źródło: opracowanie własne. Rysune 7. Województwa w uładzie dwóch pierwszych funcjonalnych sładowych głównych grupowanie na podstawie cech opisujących bezpieczeństwo i środowiso Źródło: opracowanie własne. Grupowanie w oparciu o cechy opisujące bezpieczeństwo i środowiso doprowadziło do wyodrębnienia dwóch grup względnie jednorodnych, z tórych jedna liczyła jedenaście, a druga dwa województwa. Poziom rozpatrywanych cech w pozostałych województwach: śląsim, dolnośląsim i lubusim, wyłączył je poza grupy względnie jednorodne. W ażdym z tych trzech województw notuje się relatywnie wysoą przestępczość, w śląsim i dolnośląsim najwyższe w sali raju ilości wytwarzanych odpadów na 1 m 2 (lubusie pod tym względem plasuje się na ostatnich pozycjach w raningu województw). Odmienność lubusiego jest taże wyniiem

96 Mirosław Krzyśo, Agniesza Maja, Waldemar Wołyńsi dużego zalesienia tego województwa udział lasów w całowitej powierzchni jest tu najwyższy w Polsce i przeracza 50% (podczas, gdy w olejnym pod tym względem, woj. podarpacim wynosi o. 38%). Podsumowując, warto zauważyć, że pozycję województwa śląsiego, w tórym poziom życia mieszańców w latach 2003 2013 był relatywnie najwyższy (rys. 1) determinowały przede wszystim: wyposażenie w infrastruturę gospodarczą, wysoi poziom wynagrodzeń, dobra sytuacja na rynu pracy oraz posiadane zasoby mieszaniowe. O położeniu woj. mazowieciego zdecydowały najwyższy w Polsce poziom wynagrodzeń, dobra sytuacja na rynu pracy, sytuacja w zaresie opiei zdrowotnej i społecznej oraz oświaty, ultury i rereacji. Z olei o położeniu czwartej, wyodrębnionej w oparciu o 37 cech diagnostycznych, grupy województw o relatywnie najniższym poziomie życia mieszańców, tj. grupy woj. ściany wschodniej, zdecydowały: najniższe z obserwowanych w raju wynagrodzenia, trudna sytuacja na loalnych rynach pracy oraz słabe zasoby mieszaniowe. LITERATURA Diechciarz J., (red.), (2003), Eonometria. Metody, przyłady, zadania, Wydanie 2 poprawione, Wydawnictwo AE we Wrocławiu. Flore K., Łuaszewicz J., Peral J., Steinhaus H., Zubrzyci S., (1951a), Sur la Liaison et la Division des Points d un Ensemble Fini, Colloquium Mathematicum, 2, 282 285. Flore K., Łuaszewicz J., Peral J., Steinhaus H., Zubrzyci S., (1951b), Tasonomia wrocławsa, Przegląd Antropologiczny, 17, 193 211. Góreci T., Krzyśo M., Wasza Ł., Wołyńsi W., (2014), Methods of Reducing Dimension for Functional Data, Statistics in Transition New Series, 15 (2), 231 242. Horváth L., Koosza P., (2012), Inference for Functional Data with Applications, Springer. Jacques J., Preda C., (2014), Model-Based Clustering for Multivariate Functional Data, Computational Statistics & Data Analysis, 71, 92 106. Krusal J. B., (1956), On the Shortest Spanning Subtree of a Graph and the Travelling Salesman Problem, Proceedings of the American Mathematical Society, 7, 48 50. Peral J., (1953), Tasonomia wrocławsa, Przegląd Antropologiczny, 19, 209 221. Prim R. C., (1957), Shortest Connection Networs and Some Generalizations, Bell System Technical Journal, 36, 1389 1401. Ramsay J. O., Silverman B. W., (2005), Functional Data Analysis, Second Edition, Springer. Schwarz G., (1978), Estimating the Dimension of a Model, Annals of Statistics, 6, 461 464. Shmueli G., (2010), To Explain or to Predict? Statistical Science, 25 (3), 289 310. Walesia M., (2014), Przegląd formuł normalizacji wartości zmiennych oraz ich własności w statystycznej analizie wielowymiarowej, Przegląd Statystyczny, 61 (4), 363 372.

Ocena zróżnicowania poziomu życia mieszańców województw w latach 2003 2013 97 OCENA ZRÓŻNICOWANIA POZIOMU ŻYCIA MIESZKAŃCÓW WOJEWÓDZTW W LATACH 2003 2013 ZA POMOCĄ SKŁADOWYCH GŁÓWNYCH DLA WIELOWYMIAROWYCH DANYCH FUNKCJONALNYCH ORAZ ANALIZY SKUPIEŃ Streszczenie W artyule przedstawiono ocenę zróżnicowania poziomu życia mieszańców województw w latach 2003 2013. Do oceny zastosowano analizę sładowych głównych dla wielowymiarowych danych funcjonalnych oraz dendrytową analizę supień. Metody te pozwoliły na wyodrębnienie względnie jednorodnych grup województw o zbliżonym poziomie rozpatrywanych cech dla całego rozpatrywanego oresu łącznie. Słowa luczowe: wielowymiarowe dane funcjonalne, funcjonalna analiza danych, analiza sładowych głównych ESTIMATION OF DIVERSITY OF LIVING STANDARDS IN POLISH VOIVODSHIPS IN 2003 2013 USING PRINCIPAL COMPONENTS FOR MULTIDIMENSIONAL FUNCTIONAL DATA AND CLUSTER ANALYSIS Abstract The paper presents an estimation of life standard diversity for residents of Polish voivodships in 2003 2013. The principal component analysis was applied for multidimensional functional data and the dendrite method was used for cluster analysis. These methods made it possible to isolate relatively homogeneous groups of voivodships that had similar values of characteristics under consideration, for the whole period at issue. Keywords: multivariate functional data, functional data analysis, principal components analysis