PAMUŁA Teresa Model predykcji natężenia ruchu pojazdów z użyciem sztucznych sieci neuronowych WSTĘP Charakterystyki natężenia ruchu pojazdów są warunkiem identyfikacji trendów w podziale ruchu w sieci dróg, określania przepustowości dróg oraz zmienności ruchu w czasie. Opis danych ruchu drogowego odgrywa kluczową rolę w funkcjonowaniu Inteligentnych Systemów Transportowych (ITS). Systemy te dostarczają użytkownikom dróg, informacji pomocnych do szybkiego przemieszczania się w sieci ulic oraz umożliwiają organom nadzoru ruchu drogowego dostosowanie strategii zarządzania ruchem do aktualnych warunków ruchu []. Sieci neuronowe () są skutecznym narzędziem do klasyfikacji oraz identyfikacji cech parametrów ruchu drogowego [2], [6]. Ze względu na swoje właściwości, polegające przede wszystkim na zdolności odwzorowania wieloparametrowych zależności w toku uczenia, są wykorzystywane do prognozowania wartości natężeń ruchu w różnych horyzontach czasowych. Przewidywanie krótkoterminowe natężenia ruchu jest szczególnie przydatne do podejmowania decyzji sterujących na skrzyżowaniach [4], []. Modelowanie przebiegu natężeń ruchu za pomocą jest elementem adaptacyjnych algorytmów sterowania ruchem [], []. Zastosowanie do szacowania natężenia ruchu wymaga starannego określenia parametrów i struktury sieci, ich prawidłowego wytrenowania oraz przetestowania. Struktura sieci określona przez liczbę warstw i rodzaje połączeń wewnętrznych sieci decyduje o jej elastyczności w procesie uczenia. admiernie rozbudowana struktura sieci może stracić zdolność do ekstrakcji cech danych wejściowych i odpowiadać zapamiętanymi danymi. Przygotowanie sekwencji treningowych, w wielu przypadkach decyduje o sukcesie dokładnego modelowania zjawisk - w tym przypadku natężenia ruchu. Dodatkowo trudnym zadaniem, w przygotowaniu sekwencji, związanym z użyciem rzeczywistych danych pomiarowych jest eliminacja szumu pomiaru [2], [4]. Rozmiar okna oraz współczynnik wygładzania to kluczowe parametry, które są optymalizowane w celu osiągnięcia pożądanej jakości sekwencji treningowych jak i ciągów testowych dla walidacji działania sieci. W artykule przedstawiono porównanie własności predykcyjnych opracowanego neuronowego modelu predykcji z modelem prognozowania wykorzystującym regresję wielokrotną. Przygotowany model zawiera dwuwarstwową sztuczną sieć neuronową. Do trenowania i walidacji wykorzystano dane z rzeczywistych pomiarów w sieci drogowej miasta Gliwice. W badaniach uwzględnione zostały trzy klasy szeregów czasowych wyznaczone na podstawie analizy statystycznej [9] związane z charakterem ruchu w różnych dniach tygodnia. Wyniki predykcji znajdą zastosowanie do wyboru planów sygnalizacji w obrębie skrzyżowań oraz do wspomagania obszarowego zarządzania ruchem. Opracowanie modelu oparto na historycznych danych o przebiegu ruchu drogowego. Rozdział pierwszy artykułu przedstawia zasoby pomiarowe wykorzystane w pracy. W drugim rozdziale zaproponowano rozwiązanie neuronowego modelu wskazując na specyfikę struktury związaną z zadaniem predykcji natężeń ruchu. Kolejny rozdział prezentuje konstrukcję modelu predykcji opartego na regresji wielokrotnej. Rozwiązanie to stosowane jest w zadaniach prognozowania. Wyniki porównania predykcji dla obu modeli zestawiono w tabelach w rozdziale czwartym. a zakończenie podsumowano wyniki badań i zaproponowano dalsze tematy badawcze mające na celu poprawienie wyników predykcji. Wydział Transportu, Politechnika Śląska, Krasińskiego 8, 40-09 Katowice, teresa.pamula@polsl.pl 4946
. AKWIZYCJA I WYBÓR DAYCH DO PREDYKCJI Baza danych natężenia ruchu została przygotowana z użyciem danych z detektorów pojazdów umieszczonych na głównej drodze dojazdowej do Gliwic. Gliwice znajdujące się na obrzeżach aglomeracji Śląskiej z liczbą prawie 200 tys. mieszkańców i rozbudowanym systemem transportowym stanowią reprezentatywny dla średniej wielkości miast poligon pomiarowy. Uzyskane pomiary obejmują szeroki zakres natężeń ruchu i pozwalają obserwować utrwalone schematy przebiegów zmienności. Mapa na rysunku przedstawia położenie detektorów. Detektory rejestrowały strumienie wideo z kamer zamontowanych nad pasami ruchu. Wiarygodność danych została potwierdzona przez ręczne liczenie pojazdów przeprowadzane w losowych odstępach czasu w trakcie zbierania pomiarów do bazy danych. Rys.. Lokalizacja detektorów atężenie ruchu było rejestrowane w interwałach 5 minutowych w okresie od sierpnia 20 do 3 maja 202 roku. Do badań dane zostały przeliczone na 30 min natężenia ruchu obliczane w odstępach 5 minutowych. Przeprowadzono analizę statystyczną zarejestrowanych pomiarów i zaobserwowano charakterystyczne zachowanie zmienności natężeń ruchu w zależnościom dni pomiarów. W dniach roboczych szczyty ruchu pokrywały się w czasie, w soboty przypadały później w ciągu dnia, a w dni świąteczne natężenie ruchu nie miało wyraźnych ekstremów. Bazując na doświadczeniach w optymalizacji działania sieci neuronowych zaproponowano podział danych o ruchu na 4 klasy obejmujące pomiary z dni roboczych (od poniedziałku do piątku), sobót, niedziel i świąt [8]. W artykule pominięto analizę klasy dni świątecznych, ze względu na duże różnice natężenia ruchu np. między pierwszym a drugim dniem Świąt Bożego arodzenia czy Wielkanocy. Przygotowano ciągi uczące dla sieci neuronowej z użyciem danych o natężeniu ruchu z miesięcy: sierpnia, września, listopada, stycznia i marca. Do testów opracowanego modelu użyto losowo wybranych danych z pozostałych miesięcy. Zaobserwowana w pomiarach dynamika zmian natężeń ruchu wskazuje, że 5 minutowy, pokrywający się z okresem pomiaru, horyzont predykcji uwzględnia najszybsze zmiany natężeń w potokach ruchu. Do predykcji przyjęto okno czasowe o długości 6 okresów pomiarowych. Oznacza to, że wprowadzane do modelu predykcji dane o ruchu, określają sześć wcześniejszych wartości 4947
natężeń ruchu w okresie 30 min. Wynikiem działania modelu jest przewidywana wartość natężenia ruchu po upływie następnych 5 minut. 2. MODEL PREDYKCJI Z UŻYCIEM SIECI EUROOWEJ Do predykcji natężenia ruchu zaproponowano sieć jednokierunkową z sigmoidalną funkcją przejścia dla każdego neuronu. Rozważano wykorzystanie sieci rekurencyjnej i z funkcjami radialnymi, ale niewielka przewaga jakości predykcji po wstępnych eksperymentach nie przeważyła decyzji o ich wykorzystaniu w modelowaniu. Wrażliwe na zmiany parametrów procedury uczenia dodatkowo zniechęcały do zastosowania. Wybrano dwuwarstwową strukturę sieci, ponieważ odwzorowanie własności przebiegów wymaga wielowymiarowego obszaru decyzyjnego. Uwzględnione muszą zostać cechy ruchu takie, jak cykliczność zmian, fluktuacje zmian, różne prędkości, przyspieszenia zmian. 2.. Struktura sieci neuronowej Zaproponowana sieć ma strukturę 6-8-. a wejście sieci podawane jest 6 kolejnych poprzednich pomiarów wartości natężeń ruchu stanowiących wektor wejściowy. Zastosowano 5 minutowy okres pomiarowy co oznacza, że sieć otrzymuje na wejściu półgodzinne okna ruchu w interwałach 5-minutowych. Okno czasowe zawiera 6 elementów szeregu czasowego natężeń. Liczbę neuronów w warstwie ukrytej określono doświadczalnie. Jako kryterium oceny wyboru przyjęto błąd predykcji. Sprawdzono sieci mające 6, 2 oraz 8 neuronów w warstwie ukrytej. ajlepszą siecią okazała się sieć zawierającą 8 neuronów w warstwie ukrytej. Strukturę sieci przedstawia rys. 2. Sieć posiada jedno wyjście, które odpowiada następnej wartości natężenia ruchu w analizowanym szeregu czasowym. Rys. 2. Struktura zastosowanej sieci neuronowej Dla każdej klasy ruchu opracowano odrębną sieć neuronową. Wagi neuronów w sieciach uzyskano metodą propagacji wstecznej z wykorzystaniem zbioru ciągów uczących. 2.2. Ciąg uczący i parametry procesu uczenia Przygotowano ciągi uczące dla badanych klas ruchu o długości od 2000 do 3000 wektorów. Dla klasy reprezentującej dni robocze ciąg uczący był najdłuższy, dla sobót i niedziel krótszy. Proces uczenia kończył się, gdy błąd średniokwadratowy (RMS) osiągał wartość od 0,025 do 0,034. Mniejszą wartość błędu uzyskiwano dla klasy dni roboczych co wynikało z dokładniejszej powtarzalności wartości szeregu czasowego niż w przypadku klasy sobót czy niedziel. Współczynnik uczenia przyjmował wartości z zakresu 0,5 do 0,9, a momentum od 0,4 do 0,7. 3. MODEL PREDYKCJI Z UŻYCIEM REGRESJI WIELOKROTEJ W celu porównania wyników predykcji za pomocą sieci neuronowej zaproponowano sprowadzenie zagadnienia współzależności zmiennych losowych (danych o natężeniu ruchu) do zależności funkcyjnej. W tym celu wykorzystano wielokrotną regresję liniową stosowaną w zadaniach prognozowania. 4948
Model predykcji natężenia ruchu z użyciem wielokrotnej regresji liniowej dla sześciu danych wejściowych zdefiniowano następująco: q(t+) = m *q(t-5) + m 2 *q(t-4)+ m 3 *q(t-3)+ m 4 *q(t-2)+ m 5 *q(t-)+ m 6 *q(t)+b gdzie: q(t+) wartość prognozowana natężenia ruchu, q(t-5) q(t) sześć poprzednich wartości natężenia będących podstawą prognozy, m, m2, m3, m4, m5, m6 współczynniki odpowiadające odpowiednim wartościom natężenia ruchu, b stała równania. Współczynniki funkcji regresji zostały wyliczone metodą najmniejszych kwadratów. Wykorzystano jako dane wejściowe wartości wektorów, przygotowanych dla sieci, ciągów uczących. Podobnie jak w przypadku sieci wyliczana wartość funkcji stanowiła przewidywana wartość natężenia ruchu w kolejnym okresie pomiarowym. Przygotowano modele regresji dla każdej klasy ruchu. Sprawdzono korelacje między uzyskiwanymi wartościami a rzeczywistymi. Współczynnik determinacji R 2 wahał się w przedziale (0,98-0,99) co świadczy o dobrej zgodności predykcji. 4. WYIKI TESTÓW Po wytrenowaniu 6 sieci (po 3 klasy dla każdego z detektorów) sprawdzono poprawność ich działania. Zestaw wektorów testowych składał się z danych o natężeniu ruchu z jednej doby i zawierał 288 ciągów, po 6 wartości natężenia ruchu w każdym ciągu. astępna, 7 wartość, była prognozowana. Dane testowe nie były częścią zestawu użytego do trenowania sieci. Sprawdzono losowo wybrane dni. Rys.3. Wyniki predykcji dla dnia roboczego 27.09.20 Dane z ciągu uczącego zostały wykorzystane także do obliczenia współczynników funkcji regresji wielokrotnej dla sześciu zmiennych. Wartość tej funkcji dla sekwencji sześciu kolejnych danych o natężeniu ruchu była wartością prognozowaną. a rysunku 3 przedstawiono wykresy dla danych pomiarowych wartości rzeczywistych oraz wartości predykcji dla obu modeli dla detektora nr i dnia roboczego 27.09.20 roku. Przebiegi prognoz obu modeli zachowują charakter zmian przebiegu natężeń ruchu. Model zaniża wartości, natomiast regresja wielokrotna daje wartości oscylujące wokół rzeczywistych natężeń. Przeprowadzono analizę błędów predykcji obliczając dla wyznaczonych wartości: średni błąd predykcji ME (mean error), 4949
ME n ( q n q f ) średni błąd bezwzględny (MAE): MAE q n q f n średni bezwzględny błąd procentowy MAPE (mean absolute percentage error), MAPE n q n q q n f *00% pierwiastek błędu średniokwadratowego RMSE (root mean squared error) RMSE n ( q n q f 2 ). gdzie: całkowita liczba analizowanych danych, q n wartości zmierzone, q f wartości prognozowane dla n-tego pomiaru (q n ) Tabele, 2 przedstawiają zestawienie wyznaczonych błędów dla detektorów i klas związanych z dniami tygodnia dla liczącego 6 pomiarów, 30 min okna czasowego. Znak średniego błędu pozwala wnioskować o odchyleniu wartości prognoz. W przypadku potwierdza się obserwacja z rysunku 3, czyli uzyskiwane prognozy są mniejsze wartości od rzeczywistych. Tab. Tabela wyników prognozy dla detektora Klasa szeregu Model neuronowy det Model regresyjny det czasowego ME MAE MAPE RMSE ME MAE MAPE RMSE Pon-Pt 4,53 8,68 6%,50 0,3 8,03 6% 0,8 Sobota -5,56 9,30 4%,28-0,8 7,06 8% 9,4 iedziela -5,89 9,62 5%,77-0,09 6,9 8% 9,29 Tab 2. Tabela wyników prognozy dla detektora 2 Klasa szeregu Model neuronowy det2 Model regresyjny det2 czasowego ME MAE MAPE RMSE ME MAE MAPE RMSE Pon-Pt -,35 7,63 6% 0,7 0,09 7,47 5% 9,93 Sobota -2,77 7,79 4% 9,33-0,26 5,59 6% 7,58 iedziela -2,95 6,87 0% 9,9-0, 5,87 7% 8,29 Błędy średnie predykcji modelu z regresją wielokrotną również potwierdzają graficzną ilustrację. Dla obu modeli występuje około 30% różnica między wartościami MAE i RMSE co wskazuje na występowanie podobnego rozrzutu wartości błędów. W wielu przypadkach wartości prognoz znacząco odbiegały od mierzonych wartości. Średni bezwzględny błąd procentowy MAPE w przypadku modelu regresji wielokrotnej zachowuje bliską, średniej 6%, wartość dla wszystkich klas ruchu, natomiast sieciowy model wykazuje prawie dwukrotnie większe błędy dla ruchu w soboty i dni świąteczne. WIOSKI Uzyskane wyniki porównania modeli predykcji z użyciem sieci neuronowej i regresji wielokrotnej wskazują na niewielkie różnice w zachowaniu. Średni błąd prognozy wyniósł 6%. Oba modele 4950
wykazują zbliżony rozrzut wartości prognoz. Model sieciowy zaniża wartości prognoz, a w przypadku ruchu w soboty i dni świąteczne generuje gorsze prognozy. ajlepsze wyniki predykcji uzyskano dla ruchu w dni robocze. Analiza danych pomiarowych i zachowań modeli wskazują, że aby zmniejszyć błąd prognozy należy uwzględnić dodatkowe parametry, takie jak pory roku, święta, wakacje, zdarzenia losowe itp. Planuje się uzupełnienie badań z użyciem rozszerzonej struktury sieci. Rozszerzona sieć zawierałaby sparametryzowane wejścia reprezentujące dodatkowe warunki prognozowania. Uzyskanie wyniki predykcji pozwalają na zastosowanie zaproponowanego modelu do wyboru planów sygnalizacji w obrębie skrzyżowań oraz do wspomagania obszarowego zarządzania ruchem. Streszczenie W artykule zaproponowano wykorzystanie zbioru sieci neuronowych do predykcji wartości natężeń ruchu. Predykcja natężenia ruchu wykorzystywana w systemach sterowania ruchem pozwala zwiększyć płynność ruchu i poprawić jego bezpieczeństwo. Opracowany model predykcji wykorzystuje klasyfikację danych ze względu na charakter ruchu (w zależności od typu dnia, np. dni robocze, święta). Wyznaczanie nowych wartości natężeń dla każdej z klas określane jest z użyciem odrębnej sieci neuronowej. Dokonano walidacji modelu z użyciem historycznych danych otrzymanych z Centrum Sterowania Ruchem w Gliwicach. Baza danych obejmuje dane o natężeniu ruchu z 0 miesięcznego okresu rejestracji w 203 roku. atężenia rejestrowane były w odstępach 5 minutowych. Uzyskane wyniki predykcji porównano z wynikami uzyskanymi z użyciem modelu opartego na regresji wielokrotnej. The traffic flow forecasting model using neural network Abstract The paper presents the properties of a proposed neural network for prediction of values of road traffic flow. Prediction of traffic flow is used in traffic control systems for streamlining the flow and enhancing the safety of traffic. The proposed prediction model uses traffic flow data divided into classes based on the character of the traffic flow (related to day type eg. work days, holidays). The flows are predicted within each of the classes with separate neural networks. The model was validated with real traffic data acquired from the Road Traffic Control Centre in Gliwice. The data base encompasses values of road traffic flow registered during 0 months of 203. The values of traffic flow were registered every 5 minutes. The prediction results are compared to prediction values obtained from a traffic model based on multiple regression. BIBLIOGRAFIA. Cai, C., Wong, C.K., Heydecker, B.G. Adaptive traffic signal control using approximate dynamic programming, Transportation Research Part C, 7(5), pp. 456-474, 2009. 2. Chrobok, R., Kaumann, O., Wahle, J., Schreckenberg, M.: Different methods of traffic forecast based on real data. European Journal of Operational Research 55 (3), pp. 558 568, 2004. 3. Chen H., Grant-Muller S., Mussone L., Montgomery F.: A study of hybrid neural network approaches and the effects of missing data on traffic forecasting, eural Computing and Applications vol. 0, pp. 277 286, 200. 4. Man-Chun Tan, S. C. Wong, Jian-Min Xu, Zhan-Rong Guan, Peng Zhang: An Aggregation Approach to Short-Term Traffic Flow Prediction, IEEE Transactions on Intelligent Transportation Systems, vol. 0, pp. 60-69, 2009. 5. Karlaftis, M.G., Vlahogianni, E.I.,: Statistical methods versus neural networks in transportation research: differences, similarities and some insights. Transportation Research, Part C. Emerging Technologies 9 (3), pp. 387 399, 20. 6. Pamuła T.: Road traffic parameters prediction in urban traffic management systems using neural networks, Transport Problems, Vol. 6, Issue 3, Wyd. Pol. Śląskiej, pp. 23-29, 20. 7. Pamuła T.: Prognozowanie natężenia ruchu pojazdów na skrzyżowaniu za pomocą sieci neuronowej. Zeszyty aukowe PŚl. nr 862 Transp. z. 74, s. 67-74, 202. 495
8. Pamuła T.: Traffic flow analysis based on the real data using neural networks. Telematics in the transport environment. Selected papers. Ed. Jerzy Mikulski. Berlin : Springer, s. 364-37, 202. 9. Pamuła T.: Classification and prediction of traffic flow based on real data using neural networks, Archive of Transport, vol. 24 no. 4, s. 59-522, 202. 0. Quek C., Pasquier M., Boon B., Lim S.: POP-TRAFFIC A ovel Fuzzy eural Approach to Road Traffic Analysis and Prediction IEEE Transactions On Intelligent Transportation Systems, Vol. 7, o. 2, pp. 33-46, 2006.. Srinivasan D., Choy M. C., and Cheu R. L.: eural networks for real-time traffic signal control, IEEE Trans. Intelligent Transportation Systems, vol. 7, no. 3, pp.26-27, Sep. 2006. 2. Vlahogianni E.I., Karlaftis M.G., Golias J.C.: Optimized and meta-optimized neural networks for short-term traffic flow prediction:agenetic approach, Transportation Research Part C vol.3, pp.2 234, 2005. 4952