Prognozowanie zanieczyszczeń atmosferycznych przy użyciu sieci neuronowych prof. zw. dr hab. inż. Stanisław Osowski dr inż. Krzysztof Siwek Politechnika Warszawska Kontynuacja prac Prace prowadzone w roku 2009 dotyczyły dwóch tematów: 1. przetestowania opracowanego w roku 2008 predyktora zanieczyszczeń powietrza pyłem zawieszonym PM10 na danych pomiarowych pochodzących ze stacji Otwock oraz 2. przetestowanie i skorygowanie opracowanego w 2008 roku predyktora zanieczyszczeń powietrza atmosferycznego pyłem zawieszonym PM10 na danych pomiarowych pochodzących ze stacji w Wielkopolsce 1
Ocena trudności problemu Wart. średnia: 33.87 μg/m 3 Odch. standardowe: 21.18 μg/m 3 stosunek tych wielkości: 0.625 Zawartość pyłu mechanicznego PM10 w powietrzu atmosferycznym zmierzona w stacji Ursynów wartości średniodobowe w latach 2005-2007 Ocena trudności problemu Wart. średnia: 59.37 μg/m 3 Odch. standardowe: 39.82 μg/m 3 stosunek tych wielkości: 0.671 Zawartość pyłu mechanicznego PM10 w powietrzu atmosferycznym zmierzona w stacji Otwock wartości średniodobowe w roku 2009 2
Ocena trudności problemu Wart. średnia: 35.93 μg/m 3 Odch. standardowe: 26.36 μg/m 3 stosunek tych wielkości: 0.734 Zawartość pyłu mechanicznego PM10 w powietrzu atmosferycznym zmierzona w stacji Poznań wartości średniodobowe w roku 2009 Czynniki mające wpływ na prognozę Czynniki mające największy wpływ na wielkość zanieczyszczenia powietrza to: wartość zanieczyszczenia w poprzednich dniach (lub godzinach) warunki meteorologiczne: siła wiatru, kierunek wiatru, temperatura, wilgotność oraz ciśnienie typ dnia (roboczy, świąteczny, weekend) pora roku (sezon grzewczy, okresy przejściowe, lato) lub zmiany dzienne tych wartości 3
Ocena trudności problemu Stacja pomiarowa Otwock Zależność zawartości PM10 w dwóch kolejnych dniach Korelacja pomiędzy PM10 i wilgotnością Korelacja pomiędzy PM10 i temperaturą Ocena trudności problemu Stacja pomiarowa Poznań Zależność zawartości PM10 w dwóch kolejnych dniach Korelacja pomiędzy PM10 i wilgotnością Korelacja pomiędzy PM10 i temperaturą 4
Predyktor opracowany w 2008r Predyktor wykorzystuje: Metody neuronowe sieci neuronowe SVM Metody statystyczne bagging Eliminacja komponentów szumowych z wielu prognoz przy zastosowaniu ślepej separacji sygnałów Predykcja przy użyciu SVM PM10(t) PM10(t-1) PM10(t+1) Schemat ogólny sieci neuronowej do prognozowania 5
Eliminacja komponentów szumowych z wielu prognoz Schemat dekompozycji BSS z usuwaniem składowych szumowych Dodatkowe badania przeprowadzone w 2009r Przystosowanie predyktora do predykcji 2 wartości na jeden i dwa dni naprzód Zastosowanie predyktora opartego na kaskadowym połączeniu wielu predyktorów Przystosowanie predyktora do prognozy wartości PM2,5 Wykorzystanie informacji o dynamice zmian cech wpływających na prognozę: dobowej zmiany wartości zanieczyszczenia 6
Model kaskadowy (zespół predyktorów) Zastosowanie predyktora opartego na kaskadowym połączeniu wielu predyktorów Próby zastosowania klasyfikacji Błąd predykcji kierunku nachylenia zmian wynosi: ok. 10-15% Błąd klasyfikacji zmiany, której wartość przekracza 25ug/m3 wynosi ~3-5% na 1 dzień naprzód i ~5-8% na 2 dni naprzód Oznacza to, że możliwe jest zgrubne oszacowanie kierunku zmian poziomu zanieczyszczenia Dobowe zmiany zawartości PM10 (wykres przyrostów) 7
Błędy prognozy Średni bezwzględny błąd procentowy MAPE 1 MAPE n n j 1 Średni błąd bezwzględny MAE 1 MAE n P( j) Pˆ( j) 100% P( j) n j 1 P( j) Pˆ( j) Błąd średniokwadratowy RMSE Współczynnik korelacji Ryd R std ( y) std ( d) p 1 d i y i p i 1 2 Indeks zgodności IA 1 p p d d y d i i i 1 i 1 d y i i 2 2 Wyniki badań eksperymentalnych Wyniki testowania na danych z Ursynowa z roku 2008: MAPE = 26,84% (wyniki dotyczą predykcji jednodniowej PM10, nie była badana predykcja dwudniowa) Wyniki testowania na danych PM10 z roku 2009 na ze stacji Otwock PM10 Błąd MAPE Względna poprawa predykcja jednodniowa 21.26% 20.79% predykcja dwudniowa 26.52% - Porównanie wyników predykcji PM10 i PM2,5 ze stacji Otwock PM10 PM2,5 prognoza jednodniowa 21,26 % 23,76% prognoza dwudniowa 26,52 % 29,43 % 8
Predykcja PM10 - Otwock Główne okno programu do predykcji Predykcja PM10 - Otwock Predykcja jednodniowa Predykcja stężenia PM10: a) przebiegi sygnału rzeczywistego i predyktorów, b) błędy predykcji 9
Predykcja PM10 - Otwock Predykcja dwudniowa Predykcja stężenia PM10: a) przebiegi sygnału rzeczywistego i predyktorów, b) błędy predykcji Predykcja PM2,5 - Otwock Predykcja jednodniowa Predykcja stężenia PM2,5: a) przebiegi sygnału rzeczywistego i predyktorów, b) błędy predykcji 10
Predykcja PM2,5 - Otwock Predykcja dwudniowa Predykcja stężenia PM2,5: a) przebiegi sygnału rzeczywistego i predyktorów, b) błędy predykcji Predykcja PM10 - Poznań Predykcja jednodniowa Predykcja stężenia PM10: a) przebiegi sygnału rzeczywistego i predyktorów, b) błędy predykcji 11
Predykcja PM10 - Poznań Predykcja dwudniowa Predykcja stężenia PM10: a) przebiegi sygnału rzeczywistego i predyktorów, b) błędy predykcji Wyniki liczbowe Wyniki w formie błędów MAPE testowania predyktorów na jeden dzień naprzód testowanie uczenie Ursynów PM10 Ursynów PM10 26,84 % Otwock PM10 Poznań PM10 Otwock PM2,5 Otwock PM10 21,26 % 72,93 % 36,37 % Poznań PM10 70,05 % 73,79 % 78,00 % Otwock PM2,5 31,66 % 40,37 % 23,76 % Wyniki w formie błędów MAPE testowania predyktorów na dwa dni naprzód (w roku 2008 nie opracowano predyktora na 2 dni naprzód) testowanie uczenie Ursynów PM10 Otwock PM10 Poznań PM10 Otwock PM2,5 Ursynów PM10 - - - - Otwock PM10-26,52 % 65,99 % 37,18 % Poznań PM10-43,02 % 42,27 % 43,94 % Otwock PM2,5-36,44 % 50,65 % 29,43 % 12
Wnioski z przeprowadzonych badań W trakcie prac prowadzonych w roku 2009 opracowano i przetestowano szereg koncepcji predyktorów zanieczyszczeń atmosferycznych PM10 i PM2,5. W wyniku prac okazało się, że idea uniwersalnego predyktora nie spełnia swojego zadania. Najlepszym rozwiązaniem dającym najmniejsze błędy prognozy jest zastosowanie specjalizowanych predyktorów pracujących na danych pochodzących z jednej stacji pomiarowej. Wnioski z przeprowadzonych badań Koszt budowy i uczenia predyktora jest na tyle niewielki (kilka megabajtów pamięci dyskowej oraz jednorazowo kilkanaście godzin zautomatyzowanego procesu uczenia sieci neuronowej), że celowym wydaje się właśnie takie rozwiązanie. Nie ma różnicy pomiędzy sposobem uczenia predyktora do prognozy wartości PM10 i PM2,5 (jedyna różnica w danych wejściowych dla predyktora). Opracowane rozwiązania mogą z powodzeniem być stosowane w praktyce w celu monitoringu i zapobiegania przekroczeniom norm stężeń zanieczyszczeń atmosferycznych. 13
Plany na przyszłość Uczenie predyktora na danych rejestrowanych z możliwie dużą częstością (np. co 3 godziny) zamiast na danych średniodobowych Opracowanie predyktora do prognozy przyrostów dobowych zamiast wartości aktualnych Opracowanie predyktora służącego jedynie do klasyfikacji sieć ma jedynie wskazywać stan przekroczenia norm w następnym dniu Połączenie obu rozwiązań Dziękuję za uwagę 14