FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS Katedra Zastosowań Matematyki, Akademia Rolnicza ul. Monte Cassino 6, 70-466 Szczecin Abstract. The papers present a trial of forecasting of amount of unemployed by the regions in 00 006, as an example of forecasting distributions of variables with seasonal variations. In first step the distribution analysis of exploring data was made. Then the ex post forecasts of parameters of distributions was made. In last step there was built forecasts of distributions of amount of unemployed. Słowa kluczowe: bezrobocie, modelowanie rozkładów, prognozowanie rozkładów. Key words: distribution forecasting, distribution modelling, unemployment. WSTĘP W pracy została podjęta próba budowy prognoz rozkładów liczby bezrobotnych według miast i powiatów w latach 00 006. W aproksymacji rozkładów empirycznych brano pod uwagę kilka typów rozkładów zmiennych losowych ciągłych (, gamma, logarytmiczno-normalny, normalny, Erlanga, Frecheta). W trakcie analizy parametrów charakteryzujących jakość modelowania, okazało się, że rozkłady empiryczne najlepiej aproksymowane są za pomocą rozkładu logarytmiczno-normalnego. Rozkład ten został wybrany do prognozowania. Prognozy ocen wartości średniej i wariancji wyznaczono na podstawie modeli szeregu czasowego z wahaniami sezonowymi. Wykorzystanie tej metody determinowane jest występowaniem jednego typu rozkładu w całym badanym okresie. Celem pracy było sprawdzenie przydatności wybranych metod do prognozowania rozkładów wybranych zmiennych. MATERIAŁ I METODY Materiałem empirycznym wykorzystanym w pracy była liczba bezrobotnych według miast i powiatów w latach 00 006. Jest to przykład prognozowania rozkładów zmiennych wykazujących wahania sezonowe. Rozkłady empiryczne badanych zmiennych zostały poddane aproksymacji za pomocą rozkładów teoretycznych zmiennych losowych ciągłych. Rozkład liczby bezrobotnych był aproksymowany za pomocą rozkładu logarytmiczno-normalnego (Forlicz 986): (ln x m) f ( x) = exp () πσx σ

74 M. Goc gdzie: m średnia, σ wariancja. Dopasowanie rozkładów do danych empirycznych na etapie aproksymacji zostało zbadane za pomocą testu zgodności χ (Domański 979). Hipotezę o zgodności rozkładów testowano na poziomie istotności α = 0,05. Dopasowanie prognoz rozkładów do rozkładów empirycznych zbadano za pomocą wskaźnika podobieństwa struktur W p oraz testu Andersona-Darlinga. Wskaźnik podobieństwa struktur (Kordos 973) obliczany jest ze wzoru: W p k = gi fi () gdzie: g i częstość względna rozkładu empirycznego, f i częstość względna rozkładu teoretycznego. Wskaźnik ten przyjmuje wartość równą (lub 00%), gdy rozkłady są całkowicie zgodne, natomiast wartości wskaźnika poniżej 0,95 wkazują na dość znaczne rozbieżności. Test Andersona-Darlinga wyrażony jest następującym wzorem: gdzie: F (x) dystrybuanta empiryczna, i= AD = max AD( x) = max x x F( x) F( x) F( x)( F( x)) F (x) dystrybuanta teoretyczna. Wartość krytyczna tego testu dla α = 0,05 wynosi 0,787. Przy budowie prognoz rozkładów zostanie wykorzystana metoda ekstrapolacji parametrów rozkładów, na podstawie trendu (Kordos 973), która polega na wyznaczeniu na podstawie znanych wartości parametrów rozkładów w ciągu k okresów, czyli m, m,..., mk oraz σ, σ,..., σ k, m i σ jako funkcji czasu, przy oznaczeniu tych funkcji odpowiednio przez: m t = ϕ(t) (4) (3) σ t = ψ (t) (5) Aby uzyskać wartości parametrów w okresie prognozowanym T, podstawiamy t = T i otrzymujemy szukane oceny m T i σ T. Ponadto obliczone zostaną błędy ex post oszacowanych w ten sposób prognoz, a następnie wyznaczone zostaną prognozy rozkładów. WYNIKI I DYSKUSJA Analizie poddano miesięczną liczbę bezrobotnych w okresie od stycznia 00 do sierpnia 006 roku. Dane empiryczne charakteryzowały się wahaniami sezonowymi. W pierwszym etapie dokonano aproksymacji rozkładów empirycznych liczby bezrobotnych, według miast i powiatów, za pomocą rozkładu logarytmiczno-normalnego. Wyniki prezentuje tab..

Prognozowanie rozkładów liczby bezrobotnych... 75 Tabela. Wyniki aproksymacji rozkładów empirycznych liczby bezrobotnych według miast i powiatów Rok Miesiąc χ Rozkład df Rok Miesiąc χ Rozkład df 00 003 004 styczeń 4,8 LN styczeń 3,97 LN luty 3,79 LN luty 4,8 LN marzec 5,8 LN marzec 6, kwiecień 5,06 LN kwiecień 8,67 maj 4,87 LN maj 5,48 LN czerwiec 3,83 LN czerwiec 3,46 LN 005 lipiec 6,6 lipiec 0, sierpień 7,79 sierpień 5,09 LN wrzesień 3,0 LN wrzesień 4,8 LN październik,7 LN październik 4,7 LN listopad 3,93 LN listopad 3,77 LN grudzień 7,45 grudzień 4,46 LN styczeń 6,6 styczeń,75 LN luty 6,6 luty,88 LN marzec 3,68 marzec,87 LN kwiecień,44 kwiecień,9 LN 006 maj 9,99 maj 3,8 LN czerwiec 5,8 LN czerwiec,75 LN lipiec 5,99 LN lipiec,34 LN sierpień 5,04 LN sierpień,96 LN wrzesień 5,68 LN październik 4,64 LN listopad 5,83 LN grudzień 4,56 LN styczeń 5,3 LN luty 5, LN marzec 5,9 LN kwiecień 5,9 LN maj,84 czerwiec 8,3 lipiec 6,5 sierpień 5,09 LN wrzesień 6,00 LN październik 5,9 LN listopad 4,46 LN grudzień 5,88 LN LN rozkład logarytmiczno-normalny. W miesiącach, w których nie został podany typ rozkładu, nie udało się dopasować rozkładu teoretycznego do rozkładu empirycznego (wartość współczynnika χ była większa od wartości krytycznej χ 0,05). Wstępna analiza danych pozwala stwierdzić, że rozkłady liczby bezrobotnych charakteryzowały się bardzo silną asymetrią prawostronną, co oznacza, że przeważała liczba miast i powiatów z małą liczbą bezrobotnych. W całym badanym okresie rozkład liczby bezrobotnych aproksymowany był przez jeden typ rozkładu. W związku z tym, przeprowadzone analizy pozwalają na budowę prognoz rozkładów, przy zastosowaniu metody ekstrapolacji parametrów rozkładów na podstawie trendu.

76 M. Goc W dalszym toku badań oszacowano modele ekonometryczne opisujące kształtowanie się parametrów rozkładów liczby bezrobotnych. Wykorzystano do tego modele szeregów czasowych ze stałą sezonowością: liniowy, kwadratowy, I stopnia oraz II stopnia. Okres estymacyjny został skrócony do lat 00 005.Wyniki zaprezentowano w tab.. Tabela. Wybrane parametry struktury stochastycznej modeli parametrów rozkładów liczby bezrobotnych Parametr Model m σ R V S [%] D-W R V S [%] D-W Liniowy 0,8008,39 0,056 0,885 0,99 0,8 Kwadratowy 0,9897 0,3 0,765 0,964 0,57 0,86 Wykładniczy I stopnia 0,7938,4 0,054 0,8768,05 0,66 Wykładniczy II stopnia 0,9905 0,30 0,8 0,964 0,59 0,800 Wszystkie oszacowane modele dawały wysokie dopasowanie do danych empirycznych, na co wskazują duże wartości wskaźników determinacji oraz małe wartości współczynników zmienności. Dla parametrów rozkładów liczby bezrobotnych najlepszym modelem opisującym kształtowanie się parametru m okazał się model drugiego stopnia, natomiast dla parametru σ model kwadratowy. Oszacowania parametrów strukturalnych oraz struktury stochastycznej szacowanych modeli parametrów rozkładów liczby bezrobotnych przedstawia tab. 3. Tabela 3. Oszacowania parametrów strukturalnych oraz struktury stochastycznej modeli parametrów rozkładów liczby bezrobotnych Parametr liniowy kwadratowy I stopnia II stopnia Model liniowy kwadratowy m σ I stopnia II stopnia α 0,000 7 0 5 0,0000 0,000044 α 0,0096 0,00334 0,0055 0,008 0,0005 0,00 0,0077 0,00390 α 0,009,9486 0,6944 0,6664 0,793 0,744,754,93 d 0 0,0479 0,0455 0,097 0,033 0,00536 0,0054 0,0873 0,0793 d 0 0,04797 0,04904 0,046 0,059 0,0047 0,00474 0,0495 0,0459 d 03 0,04 0,045 0,05 0,07 0,0035 0,003507 0,06 0,05 d 04 0,063 0,0558 0,008595 0,008 7,6 0 5 8,40 0 6 0,0004 8,8 0 6 d 05 0,058 0,07 0,00798 0,0086 0,00406 0,003948 0,040 0,036 d 06 0,069 0,084 0,0086 0,0094 0,0078 0,00637 0,00963 0,009 d 07 0,0859 0,00 0,0095 0,003 0,00337 0,0035 0,06 0,009 d 08 0,0346 0,047 0,008 0,07 0,00388 0,00376 0,0333 0,09 d 09 0,069 0,076 0,0394 0,043 0,007 0,00647 0,00936 0,009 d 0 0,033 0,033 0,069 0,069 0,0063 0,0063 0,00566 0,005679 d 0,0046 0,094 0,007 0,00 0,00036 0,00059 0,0006 0,000697 d 0,00668 0,00853 0,00359 0,0045 0,005 0,004777 0,0694 0,064 R 0,8008 0,9897 0,7938 0,9905 0,885 0,964 0,8768 0,964 V SE [%],39 0,3,4 0,30 0,99 0,57,05 0,57 DW 0,056 0,765 0,054 0,8 0,8 0,86 0,66 0,86 W tabeli pogrubioną czcionką oznaczono parametry statystycznie nieistotne.

Prognozowanie rozkładów liczby bezrobotnych... 77 Następnie na podstawie oszacowanych modeli zostały obliczone prognozy miesięczne ex post parametrów rozkładów na 8 kolejnych miesięcy (od stycznia do sierpnia 006 roku). Tabela 4 zawiera wartości średnich błędów względnych prognoz ex post parametrów rozkładów otrzymanych na podstawie szacowanych modeli. Tabela 4. Średnie względne błędy prognoz ex post parametrów rozkładów wyznaczonych na podstawie szacowanych modeli MAPE (h=8) [%] Parametr Model liniowy kwadratowy I stopnia II stopnia m 4,4,07 4,40, σ,53,53,66,47 Najmniejsze wartości błędów prognoz ekstrapolacyjnych dla średniej dawał model kwadratowy, a dla wariancji model drugiego stopnia. Rysunki i prezentują kształtowanie się prognoz ex post, obliczonych na podstawie oszacowanych modeli, na tle rzeczywistego kształtowania się danych parametrów.,9,90,88,86,84,8,80,78,76,74,7,70,68,66 0.006 03.006 05.006 07.006 0.006 04.006 06.006 08.006 Rys.. Prognozy ex post parametru m (średnia) średnia model liniowy model kwadratowy model I stopnia model II stopnia W ostatnim etapie badań zbudowano prognozy rozkładów liczby bezrobotnych dla czerwca, lipca i sierpnia 006 roku. Do budowy prognoz rozkładów wybrano modele, które dla danych parametrów dały najmniejsze błędy prognoz ex post. Dla średniej był to model kwadratowy, natomiast dla wariancji model II stopnia. W tabeli 5 zaprezentowano wartości wskaźnika podobieństwa struktur oraz testu Andersona-Darlinga dla prognoz rozkładów i rozkładów empirycznych badanych zmiennych.

78 M. Goc 0,34 0,3 0,30 0,308 0,306 0,304 0,30 0,300 0,98 0,96 0,94 0,9 0,90 0,88 0.006 03.006 05.006 07.006 0.006 04.006 06.006 08.006 wariancja model liniowy model kwadratowy model I stopnia model II stopnia Rys.. Prognozy ex post parametru σ (wariancja) Tabela 5. Wskaźniki podobieństwa struktur oraz testu Andersona-Darlinga dla prognoz rozkładów i rozkładów empirycznych liczby bezrobotnych Liczba bezrobotnych Miesiąc A-D Czerwiec 006 r. 0,9650 0,5873 Lipiec 006 r. 0,959 0,4730 Sierpień 006 r. 0,958 0,486 W p 55 50 45 Częstości względne [%] 40 35 30 5 0 5 0 5 0 0,00 3,09 6,08 9,307,406 5,505 8,604,703 4,80 7,90 3,000 Liczba bezrobotnych Liczba bezrobotnych [tys.] Rys. 3. Porównanie rozkładu empirycznego (linia ciągła) i rozkładu prognozowanego (linia przerywana) liczby bezrobotnych w czerwcu 006 roku [tys.]

Prognozowanie rozkładów liczby bezrobotnych... 79 Dla rozkładów liczby bezrobotnych wszystkie wartości wskaźnika podobieństwa struktur wynosiły powyżej 0,95, co oznacza dobre dopasowanie rozkładów prognozowanych do rozkładów empirycznych. Również wartości testu Andersona-Darlinga były mniejsze od wartości krytycznej, przy zadanym poziomie istotności. Najlepsze dopasowanie rozkładu prognozowanego do rozkładu empirycznego uzyskano dla czerwca 006 roku. Na rysunku 3 przedstawiono porównanie rozkładu empirycznego i rozkładu prognozowanego liczby bezrobotnych w czerwcu 006 roku. WNIOSKI Z przeprowadzonych analiz wynika, że zaproponowane metody dają dość dobre prognozy rozkładów zmiennych charakteryzujących się wahaniami sezonowymi. Jedynym warunkiem korzystania z powyższych metod jest to, że rozkłady te powinny charakteryzować się tym samym typem rozkładu w czasie. Należałoby również rozważyć zastosowanie innych miar dopasowania rozkładów empirycznych i prognozowanych w sytuacji, gdy nie jest znana liczba klas rozdzielczych. PIŚMIENNICTWO Domański C. 979. Statystyczne testy nieparametryczne. PWE, Warszawa, 88 89. Forlicz S. 986. Rozkłady asymetryczne zmiennej losowej. Pr. Nauk. AE Wroc. 8. Kordos J. 973. Metody analizy i prognozowania płac i dochodów ludności. PWE, Warszawa, 6, 4. Zeliaś A. 997. Teoria prognozy. PWE, Warszawa.