CHUDY-LASKOWSKAKatarzyna 1 PISULA Tomasz 2 Prognoza liczby wypadków drogowych w Polsce WSTĘP Bezpieczeństwo w ruchu drogowym jest problemem niezwykle aktualnym i dotykającym wszystkich mieszkańców nie tylko Polski ale także krajów UE. Problem ten wiąże się z działalnością transportową będącą fundamentem rozwoju gospodarki i społeczeństwa. Wyznacznikiem bezpieczeństwa na drodze jest ilość wypadków a także ilość osób rannych i ofiar śmiertelnych biorących udział w zdarzeniach na drodze. W 2005 roku rząd stworzył Krajowy Program Bezpieczeństwa Ruchu Drogowego GAMBIT (zob. [6]) w którym przyjęto że Polską, dalekosiężną i etycznie uprawnioną, wizją bezpieczeństwa ruchu drogowego będzie WIZJA ZERO. Idea ta kontynuowana jest w zapisach Narodowego Programu Bezpieczeństwa Ruchu Drogowego na lata 2013 2020. Wizja Zero to program realizowany w Szwecji od 1995 roku, którego założeniem jest całkowite zlikwidowanie ofiar śmiertelnych oraz poważnych obrażeń odniesionych w wypadkach drogowych. Założenia programu opierają się na czterech filarach: Życie ludzkie jest ważniejsze niż jakikolwiek czynnik ekonomiczny. Odpowiedzialność za bezpieczeństwo systemu ponoszą politycy stanowiący prawo, zarządcy dróg i projektanci, a nie kierowcy. System drogowy musi być stworzony przewidując, że kierowca popełnia błędy i jest omylny. Uwzględniając niedomagania fizyczne (np. osób starszych). Przepisy powinny wychodzić naprzeciw kierowcom, a ci powinni dążyć do podniesienia bezpieczeństwa (zob. [5]). Istotą tego podejścia jest obarczenie odpowiedzialnością za bezpieczeństwo w ruchu drogowym nie tylko użytkowników dróg ale także wszystkie osoby odpowiedzialne za budowę, konserwację i modernizację systemów transportowych oraz producentów samochodów. Polska jak i pozostałe kraje Europy podjęły działania, które mają spowodować zmniejszenie wypadkowości i poprawienie bezpieczeństwa ruchu drogowego(zob. [3]). Dzięki temu w dokumentach przyjmowanych przez Rząd w Polsce znalazły się zapisy dotyczące poprawy bezpieczeństwa na drogach: Strategia Rozwoju Kraju 2020, Strategia Rozwoju Transportu do roku 2020, Strategia Sprawne Państwo oraz Narodowy Program Zdrowia na lata 2007 2015. W Narodowym Programie Bezpieczeństwa Ruchu Drogowego na lata 2013 2020 wyznaczono kilka priorytetowych działań na które należy zwrócić uwagę w kolejnych latach i które mają na celu poprawienie warunków panujących na drodze. Są to: bezpieczny człowiek- w ramach tego priorytetu przewiduje się kształtowanie bezpiecznych zachowań uczestników ruchu drogowego oraz ochronę uczestników ruchu drogowego, bezpieczne drogi- w ramach którego planowane jest wdrożenie standardów bezpieczeństwa ruchu drogowego eliminujących największe zagrożenia w ruchu drogowym oraz rozwój systemu zarządzania bezpieczeństwem infrastruktury drogowej, bezpieczna prędkość - gdzie kształtowane będą zachowania kierowców w zakresie jazdy z bezpieczną prędkością oraz usprawnienie systemu zarządzania prędkością, bezpieczny pojazd- priorytet mający na celu usprawnienie działań dotyczących kontroli stanu technicznego pojazdów oraz doskonalenie systemów bezpieczeństwa w pojazdach, 1 Politechnika Rzeszowska, Wydział Zarządzania, Katedra Metod Ilościowych, 35-959 Rzeszów, al. Powstańców Warszawy 10, +48 17 865-1906, kacha877@prz.edu.pl 2 Politechnika Rzeszowska, Wydział Zarządzania, Katedra Metod Ilościowych, 35-959 Rzeszów, al. Powstańców Warszawy 10, +48 17 865-1842, tpisula@prz.edu.pl 2710
ratownictwo i opieka powypadkowa- obejmująca integrację i rozwój Krajowego Systemu Ratownictwa oraz usprawnienie systemu pomocy ofiarom wypadków drogowych, system zarządzania bezpieczeństwem ruchu drogowego - do którego należeć będzie usprawnienie struktur organizacyjnych bezpieczeństwa ruchu drogowego i koordynacji, wprowadzenie spójnego systemu przepisów prawa w zakresie bezpieczeństwa ruchu drogowego, wprowadzenie stabilnego finansowania bezpieczeństwa ruchu drogowego, wprowadzenie jednolitego systemu monitoringu i komunikacji oraz badań bezpieczeństwa ruchu drogowego i transferu wiedzy (zob. [7]). Wypadki stanowią znaczący problem społeczno ekonomiczny z powodu masowości zjawiska oraz tragicznych i traumatycznych jego konsekwencji. Instytut Badawczy Dróg i Mostów na zlecenie Sekretariatu KRBRD przygotował raport pt. Metoda oraz wycena kosztów wypadków i kolizji drogowych na sieci dróg w Polsce na koniec 2012 roku z wyodrębnieniem średnich kosztów społeczno-ekonomicznych zdarzeń drogowych na sieci TEN-T. Koszty te w 2012 roku szacowane były na około 30 mld zł. Duża liczba wypadków wpływa w sposób oczywisty na duże koszty społeczno-ekonomiczne. Dlatego analiza zmian dynamiki wypadkowości w Polsce jest bardzo ważnym problemem badawczym. W artykule podjęto zatem próbę przeanalizowania tego zjawiska. Celem artykułu jest prognoza liczby wypadków w Polsce w ujęciu miesięcznym. Do konstrukcji prognozy wykorzystano cztery modele szeregów czasowych: autoregresyjny z trendem kwadratowym, trendów jednoimiennych okresów, wygładzania wykładniczego oraz model sieci neuronowych. Dane zgromadzone zostały w odstępach miesięcznych i obejmują okres od stycznia 2000 do sierpnia 2014 roku. Prognozę skonstruowano na kolejny rok od września 2014 do września 2015. Dane pochodziły ze strony głównej Komendy Policji. Obliczenia wykonano z użyciem programu Statistica 10 oraz arkusza kalkulacyjnego Excel. 1 ANALIZA SEZONOWOŚCI WYPADKÓW DROGOWYCH W POLSCE Liczba wypadków drogowych w Polsce od 1998 roku ulega zmniejszeniu. Analizując dane dotyczące poziomu wypadków w ujęciu miesięcznym (rys. 1) dostrzec można wyraźne wahania addytywne wraz z utrzymującą się tendencją spadkową.jednak w rankingu UE, Polska zajmowała ostatnie miejsce pod względem liczby zabitych w wypadkach drogowych przypadających na mln mieszkańców w 2011 roku. (największy wskaźnik 110 osób, najmniejszy posiadała Wielka Brytania - 32 osoby). A więc obecny poziom bezpieczeństwa na drodze pozostawia wiele do życzenia. Rys.1. Liczba wypadków drogowych w Polsce w latach 2000 2014. Rysunek 1 przedstawia dynamikę zmian liczby wypadków drogowych w poszczególnych latach w ujęciu miesięcznym w Polsce w okresie od 2000 do 2014 roku. Przeprowadzono test mający na celu sprawdzenie, czy średnia liczba wypadków drogowych w poszczególnych latach różni się istotnie od siebie.wartość statystyki testowej dla nieparametrycznego testu ANOVA Kruskalla Wallisa wynosi KW-H=78,9 (prawdopodobieństwo testowe p=0,0000),co świadczy o tym, że hipotezę o równości 2711
średniego poziomu wypadków drogowych w poszczególnych latach należy zdecydowanie odrzucić. Mamy do czynienia z systematycznym spadkiem średniej wypadkowości w poszczególnych latach. Rysunek 2 przedstawia średnie wartości, dla liczby wypadków drogowych w Polsce w poszczególnych miesiącach badanego okresu 2000 2014. Rys.2. Porównanie średniej liczby wypadków drogowych w Polsce w poszczególnych miesiącach w latach 2000 2014 Z rysunku 2 wynika, że najmniej wypadków drogowych zdarza się w Polsce w miesiącach zimowych i wczesnowiosennych styczeń kwiecień. Najmniejszą średnią odnotowano w miesiącach lutowych (2756).Duża liczba wypadków w miesiącach letnich spowodowana jest zwiększonym natężeniem ruchu związanym z okresem wakacyjnym. Zwiększona liczba wypadków w miesiącach jesiennych jest zjawiskiem obserwowanym od kilku lat. W okresie tym pogarszają się warunki atmosferyczne oraz warunki drogowe i wcześnie zapada zmrok. Wtedy najczęściej dochodzi do potrąceń pieszych, gdyż stają się oni gorzej widoczni. W miesiącach zimowych odnotowuje się znaczne zmniejszenie liczby wypadków i ich ofiar w związku z trudnymi warunkami atmosferycznymi [10, s. 15]. Najwięcej wypadków zdarza się w październikowych średnio4537. W końcowych miesiącach roku listopadowych i grudniowych znowu można zauważyć znaczny spadek liczby wypadków, choć i tak jest to wysoki poziom. Test nieparametryczny Kruskalla-Wallisa (statystyka KW-H=80,68 i prawdopodobieństwo testowe p=0,000) wskazują, że poziom wypadkowości w Polsce w poszczególnych miesiącach znacznie się od siebie różni. Przeprowadzona wstępna analiza danych dotyczących wypadków drogowych pozwala na stwierdzenie, że mają one charakter sezonowy (miesięczny) z tendencją spadkową dlatego do prognozy wypadków na kolejne okresy zostały wybrane modele szeregów czasowych, pozwalające na konstrukcję prognoz sezonowych. 2712
2 MODELE WKORZYSTYWANE DO SEZONOWEJ PROGNOZY WYPADKÓW DROGOWYCH W POLSCE 2.1 Model autoregresyjny z trendem kwadratowym Do prognozowania liczby wypadków drogowych w Polsce zastosowano model autoregresyjny z trendem kwadratowym (zob. [8, s. 11]). Przebieg liczby wypadków w latach 2010 2014w ujęciu sezonowym miesięcznym wskazuje na to, że mamy do czynienia z trendem kwadratowym. Do oszacowania funkcji trendu wykorzystano regresję wieloraką. Otrzymane oszacowania dla funkcji trendu są następujące: Yt 4370,707 0,053 2 t (1) (91,11826) (0,00607) gdzie: Yt - wielkość wypadków drogowych w Polsce, t - czas. Oszacowana funkcja trendu nie zawiera zmiennej czasowej t w pierwszej potędze, gdyż oszacowany parametr strukturalny był nieistotny. W celu identyfikacji ewentualnych autoregresyjnych zależności dla badanego szeregu czasowego dokonano dwukrotnego różnicowania tego szeregu z opóźnieniem 1 w celu eliminacji trendu, a następnie wyznaczono autokorelacje wzajemne tak przekształconego szeregu dla horyzontu opóźnień 24 okresów (2 lata). Otrzymany autokorelogram szeregu przedstawia rysunek 3. Z analizy korelogramu wynika, że istnieją istotne zależności liczby wypadków z opóźnieniami 7, 12, 16 20, 23 i 24. W modelu autoregresyjnym wprowadzono zatem dodatkowo zmienne: yt 7, yt 12, yt 16, yt 20, yt 23, yt 24 jako zmienne niezależne i jeszcze raz oszacowano model regresji. Ostateczny model autoregresyjny obejmował tylko te zmienne opóźnione, dla których parametry strukturalne były istotne statystycznie. Ostateczny model autoregresyjny jest postaci: 2 t 7414,651 0,090 0,439 t 16 0,561 t 20 0,334 t 23 (638,9767) (0,0081) (0,0630) (0,0536) (0,0590) Y t y y y (2) Oszacowany model autoregresyjny z trendem kwadratowym posiada wszystkie parametry strukturalne statystycznie istotne, co potwierdzają wartości statystyk t-studenta (zob. tab. 1) oraz zerowe wartości prawdopodobieństw testowych p-value, a także duża wartość statystyki F-Snedecora istotności całego modelu. Tab. 1. Oszacowania parametrów modelu autoregresyjnego Zmienna Parametr modelu (oszacowanie) Błąd standardowy oszacowania Statystyka t-studenta t(147) Prawdopodobieństwo testowe p-value Wyraz wolny 7414,651 638,9767 11,6039 0,0000 t 2-0,090 0,0081-11,1145 0,0000 Y t-16-0,439 0,0630-6,9735 0,0000 Y t-20-0,561 0,0536-10,4720 0,0000 Y t-23 0,334 0,0590 5,6525 0,0000 Błąd standardowy estymacji: 405,5 Statystyka F-Snedecora F(4,147)=119,66, p<0,00000 Skorygowany współczynnik determinacji: R 2 =0,7586 Współczynnik korelacji wielorakiej: R=0,8746 Posiada on również dobre własności prognostyczne, gdyż skorygowany współczynnik determinacji wynosi 0,76. Zatem model autoregresyjny wyjaśnia w 76% modelowaną zależność liczby wypadków w Polsce od przyjętych zmiennych opóźnionych wypadkowości w poprzednich okresach. 2713
Reszty modelu autoregresyjnego powinny posiadać rozkład normalny. Zbadano zatem normalność rozkładu reszt analizowanego modelu z wykorzystaniem testu normalności Shapiro-Wilka oraz Kołmogorowa-Smirnowa. Statystyka testowa dla testu Shapiro-Wilka wynosi W=0,99153, a prawdopodobieństwo testowe p=0,483, co oznacza że nie ma podstaw do odrzucenia hipotezy o normalności rozkładu reszt. Wartość statystyki dla testu K-S posiada dość małą wartość i wynosi D=0,06097 (p>0,20), co również sugeruje na normalność rozkładu reszt. Funkcja autokorelacji WYPADKI : D(-1); D(-1) (Błędy standardowe to oceny białego szumu) Opóźnienie Korelacja S.E Q p 1 -,498,0752 43,84,0000 2 +,079,0749 44,96,0000 3 +,016,0747 45,00,0000 4 -,123,0745 47,74,0000 5 +,063,0743 48,46,0000 6 -,130,0741 51,54,0000 7 +,179,0738 57,42,0000 8 -,146,0736 61,36,0000 9 -,082,0734 62,61,0000 10 +,034,0732 62,83,0000 11 +,019,0730 62,90,0000 12 +,227,0727 72,64,0000 13 -,084,0725 73,98,0000 14 +,056,0723 74,59,0000 15 -,011,0721 74,62,0000 16 -,152,0718 79,07,0000 17 +,059,0716 79,75,0000 18 -,036,0714 80,01,0000 19 +,119,0711 82,83,0000 20 -,194,0709 90,28,0000 21 -,003,0707 90,28,0000 22 +,067,0705 91,17,0000 23 -,149,0702 95,68,0000 24 +,370,0700 123,6,0000 0 0-1,0-0,5 0,0 0,5 1,0 Rys. 3. Autokorelogram reszt oszacowanego modelu autoregresyjnego. Przedział ufności Rysunek 4 przedstawia analizowany szereg czasowy dla liczby wypadków drogowych oraz prognozę otrzymaną z wykorzystaniem oszacowanego modelu autoregresyjnego. Rys. 4. Prognoza liczby wypadków drogowych z wykorzystaniem modelu autoregresyjnego. 2.2 Model trendów jednoimiennych okresów Metoda trendów jednoimiennych okresów wykorzystuje związek między obserwacjami pochodzącymi z różnych lat dla tego samego okresu. W badanym przypadku okresami 2714
jednoimiennymi są miesiące. Procedura polega na oszacowaniu parametrów analitycznej funkcji trendu oddzielnie dla poszczególnych faz cyklu (zob. np. [4, s. 194]). Prognoza wyznaczana jest za pomocą ekstrapolacji oszacowanej funkcji trendu dla każdej fazy cyklu. Stosowanie tej metody wymusza przyjęcie zasady status quo, tzn., że utrzyma się zaobserwowana tendencja dla każdej z faz cyklu (12). Każdy szereg czasowy odnoszący się do określonej fazy cyklu opisany jest modelem liniowym o postaci (3) gdzie: Dla uprzednio przygotowanych danych wyznaczono trendy miesięczne za pomocą prostych modelitrendów liniowych bazujących na zmiennej czasowej t (tab. 2). Rys. 5. Graficzna prezentacja wypadków miesięcznych w badanym okresie 2000-2014. Parametry modeli oszacowano metodą najmniejszych kwadratów. Ponieważ analizowane dane mają charakter miesięczny skonstruowanych zostało 12 liniowych modeli, które posłużyły do prognozy na kolejny rok. Tab. 2. Wyniki estymacji parametrów strukturalnych modeli trendów jednoimiennych okresów Liczba miesięcy Równanie modelu Liczba miesięcy Równanie modelu Styczeń (15) y=-102,1t+3830 Lipiec (15) y=-133,3t+5432 Luty (15) y=-115,7t+3683 Sierpień (15) y=-144,9t+5560 Marzec (15) y=-116,4t+4052 Wrzesień (14) y=-122,1t+5315 Kwiecień (15) y=-120,7t+4402 Październik (14) y=-146,7t+5637 Maj (15) y=-143t+5209 Listopad (14) y=-145,5t+5114 Czerwiec (15) y=-142,7t+5427 Grudzień (14) Y=-130,6t+4886 2715
Prognozę dla liczby wypadków drogowych w Polsce dla roku 2015 otrzymaną na podstawie modelu trendów jednoimiennych okresów przedstawia rysunek 6. Rys. 6. Prognoza liczby wypadków z wykorzystaniem modelu trendów jednoimiennych okresów 2.3 Model wyrównywania wykładniczego Istota wygładzania wykładniczego polega na tym, że szereg czasowy zmiennej prognozowanej wygładza się za pomocą średniej ruchomej ważonej a wagi ustalone są według funkcji wykładniczej. Prognoza oparta jest na średniej ważonej aktualnych i historycznych wartości szeregu. Kluczowym elementem jest wybór wartości parametrów modelu. W literaturze podaje się kilka sposobów wyboru parametrów (zob. np. [2, s.71]). Jeśli poszczególne składowe zmieniają się szybko, to uważa się że wartości parametrów wygładzania należy ustalić na poziomie bliskim jedności, w przeciwnym wypadku na poziomie bliskim zera. W zależności od postaci modelu szacuje się od jednego do trzech parametrów. Każdy parametr odpowiada za jedną ze składowych szeregu (trend oraz wahania sezonowe: addytywne bądź multiplikatywne). Parametr (alfa) jest to stały parametr wygładzania procesu, niezbędny we wszystkich modelach, przyjmuje wartości z przedziału 0,1. Jeśli = 0 to wszystkie wygładzone wartości będą równe wartości początkowej. Jeśli = 1 to każda wygładzona wartość (prognoza) będzie równa odpowiedniej poprzedniej wartości. Im jest bliższe 0 tym wolniej będą maleć wagi tzn. tym wolniej zniknie efekt obserwacji poprzedzających. Parametr (delta) jest parametrem wygładzania sezonowego i wymaga określenia tylko w przypadku modeli sezonowych. Może przybierać wartości z przedziału 0,1. Jeśli = 0 to przewiduje się, że składnik sezonowy dla danego punktu w czasie jest identyczny jak przewidywany dla odpowiedniego momentu podczas poprzedniego cyklu. Parametr γ (gamma) i ϕ (fi) to parametry wygładzania trendu. Parametr γ określany jest dla modeli trendu liniowego i wykładniczego oraz dla modeli trendu gasnącego bez sezonowości. Parametr ϕ wyznacza się dla modeli trendu gasnącego. Analogicznie do składnika sezonowego, gdy składnik trendu jest włączony do procesu wyrównywania wykładniczego, dla każdego momentu czasu obliczany jest niezależny składnik trendu i jest on modyfikowany jako funkcja 2716
błędu prognozy i odpowiedniego parametru. Jeśli parametr γ wynosi 0 (zero), to składnik trendu jest stały dla wszystkich wartości szeregu czasowego. Jeśli parametr ten jest równy 1, to składnik trendu jest maksymalnie modyfikowany w każdym kroku przez odpowiedni błąd prognozy. Wartości parametru, które znajdują się po środku reprezentują mieszankę tych dwóch sytuacji skrajnych. Parametr γ jest parametrem modyfikacji trendu i określa jak silnie zmiany trendu wpłyną na oceny składnika systematycznego dla późniejszych prognoz, to znaczy jak szybko trend zostanie "wygaszony" lub wzmocniony. Oszacowane prognozy na podstawie modelu z trendem gasnącym oraz wahaniami addytywnymi przedstawia rysunek 7. Rys. 7. Prognoza liczby wypadków z wykorzystaniem modelu wygładzania wykładniczego 2.4 Model sieci neuronowych Sieci neuronowe są dobrym narzędziem, które można wykorzystać do prognozowania szeregów czasowych. Dokładny opis, istotę sieci neuronowych, ich topologie, rodzaje i możliwości zastosowań są szeroko omawiane w literaturze (zob. np. prace [1], [9]). W publikacji wykorzystano pakiet analiz statystycznych Statistica 10 PL i dostępny w nim moduł sztuczne sieci neuronowe. Umożliwia on prognozowanie szeregów czasowych z wykorzystaniem sieci neuronowych typu perceptron wielowarstwowy MLP (Multilayer Perceptron) z jedną warstwą neuronów ukrytych oraz sieci o topologii radialnych funkcji bazowych RBF (Radial Basis Functions). Do prognozy wykorzystano sieci typu MLP, w których warstwę wejściową stanowiło 12 neuronów przetwarzających informacje reprezentujące 12 wejściowych szeregów czasowych, liczby wypadków drogowych w Polsce dla 12 kolejnych opóźnień miesięcznych(roczny okres sezonowości): yt 1, yt 2,..., yt 12. Liczba neuronów w warstwie ukrytej wahała się od 2 20neuronów, zaś warstwę wyjściową stanowił pojedynczy neuron, reprezentujący wartości wyjściowe szeregu czasowego dla liczby wypadków y t. Próbę uczącą stanowił losowy podzbiór 80% obserwacji badanego szeregu czasowego, zaś próbę testową podzbiór 20%. Jako funkcje aktywacji neuronów w warstwie ukrytej i wyjściowej brano pod uwagę funkcję: liniową, logistyczną, wykładniczą oraz tangens hiperboliczny. Zaś jako funkcję błędu uczenia przyjęto minimalizację sumy kwadratów błędów na wyjściu sieci 2717
neuronowej. Wykorzystując moduł automatycznego poszukiwania najlepszych sieci w programie Statistica wytypowano 3 sieci spośród 20 przebadanych różnych ich kombinacji (różna liczba neuronów ukrytych, różne funkcje aktywacji), dla których błąd uczenia dla próby testowej był najmniejszy. Jako algorytm uczenia zastosowano algorytm iteracyjny BFGS(Broyden Fletcher Goldfarb Shanno) zob. np. [1, s. 288]. Tabela 3 przedstawia 3 najlepiej wytrenowane sieci neuronowe, które mogą być wykorzystane w prognozie wypadków drogowych. Do ostatecznej prognozy wykorzystano sieć numer 3 o topologii MLP 12-2-1 z wykładniczymi funkcjami aktywacji neuronów. Tab. 3. Najlepsze sieci neuronowe typu MLP zaproponowane do prognozy wypadkowości w Polsce. Sieć Nazwa sieci Jakość (uczenie) Jakość (testowanie) Błąd (uczenie) Błąd (testowanie) Aktywacja (ukryte) Aktywacja (wyjściowe) 1 MLP 12-5-1 0,906768 0,931268 55939,59 42405,62 Tanh Wykładnicza 2 MLP 12-8-1 0,907136 0,936179 55923,00 39115,72 Logistyczna Logistyczna 3 MLP 12-2-1 0,911288 0,930565 53330,46 41307,31 Wykładnicza Wykładnicza Sieć ta posiadała największą jakość poprawność prognozy, dla próby uczącej (ponad 91%) oraz wysoką jakość (ponad 93%) dla próby uczącej, która nie była brana pod uwagę w procesie uczenia sieci. Rysunek 8 przedstawia prognozę wypadków drogowych dla obserwacji historycznych oraz prognozowane wartości liczby wypadków drogowych w Polsce na rok 2015 z zastosowaniem wybranej sieci neuronowej. Rys. 8. Prognoza z wykorzystaniem sieci neuronowej MLP 12-2-1. 3 ANALIZA JAKOŚCI DOPASOWANIA MODELI PROGNOSTYCZNYCH Porównując jakość badanych modeli wyznaczono prognozy wygasłe, na obserwacje historyczne w okresie styczeń 2000 - sierpień 2014. Do obliczenia miar dokładności prognoz przyjęto następujące błędy prognoz wygasłych: ME Mean Error (błąd średni prognozy) 2718
1 1 k n t n t ME y y (4) k t 0 MAE Mean Absolute Error (średni błąd bezwzględny prognozy) 1 1 k n t n t k t 0 MAE y y (5) MPE Mean Percentage Error (średni błąd procentowy prognozy) k 1 1 yn t yn t MPE 100% k (6) y t 0 MAPE Mean Percentage Error (średni błąd procentowy) k 1 1 yn t yn t MAPE 100% k (7) y gdzie: y - obserwowana wartość historyczna liczby wypadków drogowych w Polsce, n t t 0 yn t- prognozowana wartość wypadków w okresie n-t, k długość horyzontu prognozy Tabela 4 przedstawia porównanie wyznaczonych błędów prognozy dla 3 analizowanych modeli prognostycznych. Dla modelu trendu jednoimiennych okresów, wyznaczenie prognoz dla obserwacji historycznych nie było możliwe. Wartości błędów (zwłaszcza średniego bezwzględnego błędu procentowego), 6-9 % wskazują na dość dobre dopasowanie modeli do danych historycznych. Dlatego należy ufać, że prognozy na kolejne miesiące przyszłych lat będą również efektywne. Tab. 4. Błędy prognoz wygasłych dla rozpatrywanych modeli prognozowania wypadkowości w Polsce Model prognostyczny Błąd średni ME - Mean Error Średni błąd bezwzględny - MAE Mean Absolute Error Średni błąd procentowy MPE Mean Percentage Error[%] Średni bezwzględny błąd procentowy MAPE Mean Absolute Percentage Error[%] WNIOSKI Autoregresyjny n t n t Wyrównywanie wykładnicze Trendów jednoimiennych okresów Sieć neuronowa MLP 12-2-1 Próba ucząca Próba testowa 2,37-49,11 0,111-6,44 7,15 318,4 218,25 212,29 243 214,03-1,37% -1,89% -0,83% -1,12% -0,93% 9,2% 6,24% 6,17% 7% 6,59% Ostateczną prognozę dla wypadkowości w Polsce wyznaczono jako średnią ważoną z wartości prognoz wyznaczonych 4 rozpatrywanymi modelami prognostycznymi. Wagi uzależniono od wartości odwrotności średnich procentowych błędów bezwzględnych prognozy dla każdego modelu. Tabela 5 przedstawia prognozy dla kolejnych 13 miesięcy roku, wyznaczone każdą z rozpatrywanych metod oraz prognozę średnią. Rysunek 9 przedstawia dynamikę wypadkowości w 2719
Polsce w latach 2000 2014oraz prognozę w rocznym horyzoncie czasu (od IX 2014 do IX 2015 roku). Tab. 5. Prognoza liczby wypadków drogowych w Polsce w rocznym horyzoncie prognozy w okresie od września 2014 do września 2015. Data - miesiąc Prognoza Prognoza Prognoza Prognoza Prognoza trendów wyrównywanie sieci średnia autoregresyjny jednoimiennych wykładnicze neuronowe ważona okresów Wrzesień 2014 3306 3377 3484 3357 3388 Październik 2014 3097 3494 3437 3341 3364 Listopad 2014 2721 2994 2932 3014 2930 Grudzień 2014 2349 2903 2927 2671 2747 Styczeń 2015 1827 1988 2196 2349 2106 Luty 2015 1712 1722 1832 2294 1894 Marzec 2015 1850 2085 2190 2406 2150 Kwiecień 2015 1979 2394 2471 2597 2388 Maj 2015 2513 3013 2921 2855 2853 Czerwiec 2015 2548 3255 3144 3047 3038 Lipiec 2015 2715 3362 3299 3158 3171 Sierpień 2015 2485 3403 3242 3226 3140 Wrzesień 2015 2886 3368 3361 3220 3238 Rys. 9. Dynamika prognozy wypadkowości w Polsce w 2015 roku. Bezpieczeństwo w ruchu drogowym stanowi ważny problem w obecnych czasach. Świat staje się coraz bardziej mobilny i zatłoczony. Polska pod względem wypadkowości zajmuje końcowe miejsca w rankingu ale można stwierdzić, że na polu wypadkowości z roku na rok obserwujemy pewne małe sukcesy. Do 1997 roku liczba wypadków posiadała tendencję wzrostową natomiast obecnie stan ten się poprawia. 2720
Z przeprowadzonych badań wynikają następujące wnioski: wyznaczone prognozy dla liczby wypadków drogowych w Polsce dla 2015 roku pokazują zachowanie się tendencji spadkowej, obliczone błędy prognozy świadczą o tym, że wybór metod był odpowiedni. działania podjęte przez rząd (sformułowanie i działanie według planów strategicznych mających na celu podniesienie bezpieczeństwa w ruchu drogowym) dają widoczne efekty. Wypadki drogowe zależą od wielu czynników. W artykule oparto się na danych historycznych uwzględniających jedynie upływ czasu (zmienną czasową t). Wyniki analizy mogą posłużyć do formułowania dalszych działań naprawczych w obszarze bezpieczeństwa ruchu drogowego oraz mogą stanowić przyczynek do dalszych badań uwzględniających większą ilość czynników mających wpływ na poziom wypadkowości w Polsce. Streszczenie Bezpieczeństwo w ruchu drogowym to temat, który dotyczy każdego z nas, ponieważ uczestnikami ruchu są piesi, kierowcy, a także inne osoby przebywające w pojeździe lub na pojeździe znajdującym się na drodze. W dobie rozwijającej się cywilizacji i poprawy warunków bytu, przybywa środków lokomocji. Świat staje się bardziej mobilny, większość osób nie pracuje w obrębie swego miejsca zamieszkania ale do pracy dojeżdża kilkanaście a nawet kilkadziesiąt kilometrów. Stąd ruch na drodze zwłaszcza w godzinach rannych jest niezwykle wzmożony. Dlatego ważnym staje się problem bezpieczeństwa uczestników ruchu drogowego. Wypadki w ruchu drogowym były, są i zapewne będą zdarzały się w przyszłości lecz z analizy wynika że jest ich coraz mniej. W artykule podjęto próbę ustalenia prognozy dla ilości wypadków drogowych w Polsce dla roku 2015. Z racji obserwowanej sezonowości wypadków drogowych do predykcji zostaną wykorzystane modele sezonowe: wygładzania wykładniczego, sieci neuronowych i trendów jednoimiennych okresów. Prognoza zostanie przeprowadzona z wykorzystaniem pakietu Statystycznego Statistica 10.0 PL oraz arkusza kalkulacyjnego EXCEL. Forecastof road accidents in Poland Abstract Traffic safety is a subject that concerns all of us, as the pedestrians, drivers and other occupants of the vehicle or on the vehicle on the road are participants in traffic. In an era of expanding civilization and the improvement of living conditions the number of means of transport attains. The world is becoming more mobile, most people do not work within their place of residence but commute to work a dozen or even dozens of kilometers. Hence, the traffic on the road especially in the morning is extremely heavy. Therefore, it becomes an important issue of road safety. Road traffic crashes have been and probably will happen in the future, but the analysis shows that there are fewer and fewer. This paper attempts to determine the forecast for the amount of traffic accidents in Poland for the year 2015. Because of the observed seasonality of traffic accidents for the prediction the seasonal models such as exponential smoothing, neural networks and trends of univariate periods will be applied. The forecast will be carried out using the Statistical Package 10.0 Statistica PL and EXCEL spreadsheet. BIBLIOGRAFIA 1. Bishop C. M., Neural networks for pattern recognition, Oxford University Press, Oxford 1995. 2. Cieślak M., Prognozowanie gospodarcze. Metody i zastosowania, Wydawnictwo Naukowe PWN, Warszawa 2005. 3. Globalny Plan Dekady Działań na rzecz Bezpieczeństwa Ruchu Drogowego 2011-2020, ITS BRD 2011, nr 1, http://www.who.int/roadsafety/decade_of_action/plan/plan_english.pdf. 4. Goryl A., Jędrzejczyk Z., Kukuła K., Osiewalski J. Walkosz A., Wprowadzenie do ekonometrii, Wydawnictwo Naukowe PWN, Warszawa 2009. 5. Grygier M., Wizja Zero: idealistyczne bzdury, czy wizja przyszłości?, www.moto.wp.pl. 2721
6. Krajowy Program Bezpieczeństwa Ruchu Drogowego 2005-2007-2013, GAMBIT 2005, Warszawa 2005. 7. Narodowy Program Bezpieczeństwa Ruchu Drogowego 2013-2020, Dokument przyjęty przez KRBRD uchwałą nr 5/2013 z dnia 20.06.2013 r., Warszawa, czerwiec 2013. 8. Sokołowski A., Przykłady prognozy ekonomicznej, Statsoft Polska, Kraków, http://statsoft.pl/ Portals/0/Downloads/Przyklady_prognozy_ekonomicznej.pdf. 9. Tadeusiewicz, R., Sieci neuronowe. Akademicka Oficyna Wydawnicza, Warszawa 1993. 10. Wypadki drogowe w Polsce w 2013 roku, Komenda Główna Policji, Biuro Prewencji i Ruchu Drogowego, Wydział Ruchu Drogowego, Warszawa 2014. 2722