APROKSYMACJA POZIOMU IMISJI NA STACJACH MONITORINGU POWIETRZA ZA POMOCĄ AUTONOMICZNYCH MODELI NEURONOWYCH

Podobne dokumenty
ALGORYTM UZUPEŁNIANIA BRAKUJĄCYCH DANYCH W ZBIORACH REJESTROWANYCH NA STACJACH MONITORINGU POWIETRZA

Porównanie dokładności różnych metod predykcji stężeń zanieczyszczeń powietrza

Aproksymacja stężeń zanieczyszczeń powietrza za pomocą neuronowych modeli szeregów czasowych

Prognozowanie zanieczyszczeń atmosferycznych przy użyciu sieci neuronowych

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

Projekt Sieci neuronowe

Sprawozdanie z badań jakości powietrza wykonanych ambulansem pomiarowym w Tarnowskich Górach w dzielnicy Osada Jana w dniach

Jakość danych pomiarowych. Michalina Bielawska, Michał Sarafin Szkoła Letnia Gdańsk

Modelowanie przestrzennych rozkładów stężeń zanieczyszczeń powietrza wykonywane w Wojewódzkim Inspektoracie Ochrony Środowiska w Warszawie w ramach

Wojewódzki Inspektorat Ochrony Środowiska w Łodzi, ul. Lipowa 16

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

Dopasowywanie modelu do danych

Walidacja metod analitycznych Raport z walidacji

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Znaczenie modelowania w ocenie jakości powietrza. EKOMETRIA Sp. z o.o.

AM1 85,1 98, ,2 AM2 97,8 97, ,3 AM3 97,3 98,7-96,0 97,0 98,6 AM5 96,5 92,2 96,0-95,5 96,2 AM8 98,5 97,8 98,4-96,1 98,7

Dorota Kaleta Katedra Ochrony Powietrza, Politechnika Śląska, Gliwice

METODA PROGNOZOWANIA SZEREGÓW CZASOWYCH PRZY UŻYCIU SZTUCZNYCH SIECI NEURONOWYCH

5.3. Sporządzenie modelu rozprzestrzeniania się zanieczyszczeń.

5. Model sezonowości i autoregresji zmiennej prognozowanej

Stan czystości powietrza wg pomiarów Agencji Regionalnego Monitoringu Atmosfery Aglomeracji Gdańskiej.

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

PODSUMOWANIE WYNIKÓW

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza wyników otrzymanych ze stacji monitorowania jakości powietrza zlokalizowanych na terenie Mielca. Pył zawieszony PM10 LISTOPAD-GRUDZIEŃ 2018

SYSTEM OCENY JAKOŚCI POWIETRZA W WOJEWÓDZTWIE MAZOWIECKIM. Wojewódzki Inspektorat Ochrony Środowiska w Warszawie Dominik Kobus

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

Wprowadzenie do analizy korelacji i regresji

Monitoring jakości powietrza w województwie łódzkim

Wykonawca dr hab. inż. Wojciech Dąbrowski

Korzystanie z telefonów komórkowych przez kierujących pojazdami w Polsce w 2014 roku

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Wpływ zawilgocenia ściany zewnętrznej budynku mieszkalnego na rozkład temperatur wewnętrznych

Korzystanie z telefonów komórkowych przez kierujących pojazdami w Polsce w 2015 roku

Zmienne zależne i niezależne

ZAŁĄCZNIK NR 3 RAPORT (QA/QC) Z OCENY JAKOŚCI OBLICZEŃ ROZPRZESTRZENIANIA SIĘ ZANIECZYSZCZEŃ ZA ROK 2015

Zintegrowane środowisko informatyczne jako narzędzie modelowania i dynamicznej wizualizacji jakości powietrza. Tomasz Kochanowski

Strona znajduje się w archiwum.

WYZNACZANIE WARTOŚCI PODSTAWOWYCH PARAMETRÓW TECHNICZNYCH NOWOCZESNYCH KOMBAJNÓW ZBOŻOWYCH PRZY UŻYCIU SSN

Analiza korelacyjna i regresyjna

Powiat starachowicki

Wprowadzenie. Małgorzata KLENIEWSKA. nawet już przy stosunkowo niewielkim stężeniu tego gazu w powietrzu atmosferycznym.

OCENA JAKOŚCI POWIETRZA W WOJEWÓDZTWIE PODKARPACKIM ZA ROK 2014

Wprowadzenie do teorii prognozowania

Dobór zestawu maszyn do robót ziemnych w aspekcie minimalizacji emisyjności CO 2

INFORMACJA O POMIARACH ZANIECZYSZCZEŃ POWIETRZA ATMOSFERYCZNEGO w Rumi Październik Grudzień 2015

TOM I Aglomeracja warszawska

Prognoza jakości powietrza na obszarze pogranicza polsko-czeskiego dla rejonu Śląska i Moraw

Wykonawca dr hab. inż. Wojciech Dąbrowski

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Czym oddychamy? Adam Ludwikowski Mazowiecki Wojewódzki Inspektor Ochrony Środowiska

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Analiza metod prognozowania kursów akcji

Jakość powietrza na obszarze podkarpackich uzdrowisk w 2016 roku w zakresie SO 2, NO 2, PM10, PM2,5, b(a)p i ozonu SPIS TREŚCI WPROWADZENIE...

Komunikat MWIOŚ z dnia 4 grudnia 2013r. w sprawie zanieczyszczenia powietrza w Płocku

3. Modele tendencji czasowej w prognozowaniu

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Walory klimatyczne Kościerzyny i powiatu kościerskiego na tle uwarunkowań prawnych dotyczących gmin uzdrowiskowych

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

Badanie transformatora

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH DO PROGNOZOWANIA CEN NA GIEŁDZIE ENERGII

4. Średnia i autoregresja zmiennej prognozowanej

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

NAPŁYWY KIERUNKOWE ZANIECZYSZCZEŃ POWIETRZA JAKO JEDNO Z KRYTERIUM OCENY REPREZENTATYWNOŚCI OBSZAROWEJ AUTOMATYCZNYCH STACJI MONITORINGU POWIETRZA

Wyznaczanie sprawności grzejnika elektrycznego i ciepła właściwego cieczy za pomocą kalorymetru z grzejnikiem elektrycznym

SZTUCZNA INTELIGENCJA WE WSPOMAGANIU PROCESU PROGNOZOWANIA W PRZEDSIĘBIORSTWIE

Zastosowania sieci neuronowych

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

SKUTKI ZANIECZYSZCZENIA POWIETRZA W

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

PROGNOZOWANIE PORÓWNAWCZE ENERGII PROCESOWEJ ZESTAWÓW MASZYN DO ROBÓT ZIEMNYCH JAKO CZYNNIKA RYZYKA EMISYJNOŚCI CO2

Analiza współzależności zjawisk

Niepewności pomiarów

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

OCENA JAKOŚCI POWIETRZA W WOJEWÓDZTWIE PODKARPACKIM ZA ROK 2014

ZAPYTANIE OFERTOWE. na wykonanie zadania

Badanie transformatora

STRESZCZENIE. 1. Wprowadzenie

ZANIECZYSZCZENIE POWIETRZA W WOJEWÓDZTWIE ŚWIĘTOKRZYSKIM

Statystyka i Analiza Danych

Sieci neuronowe w Statistica

ANALIZA STANU JAKOŚCI POWIETRZA W WOJEWÓDZTWIE ZACHODNIOPOMORSKIM NA TLE KRAJU WG OCENY JAKOŚCI POWIETRZA ZA 2015 ROK

WYKORZYSTANIE MODELI AUTOREGRESJI DO PROGNOZOWANIA SZEREGU CZASOWEGO ZWIĄZANEGO ZE SPRZEDAŻĄ ASORTYMENTU HUTNICZEGO

Pomiar rezystancji metodą techniczną

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

System pomiarów jakości powietrza w Polsce

Indeksy dynamiki (o stałej i zmiennej podstawie)

Wyznaczanie budżetu niepewności w pomiarach wybranych parametrów jakości energii elektrycznej

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Ćwiczenie z fizyki Doświadczalne wyznaczanie ogniskowej soczewki oraz współczynnika załamania światła

LABORATORIUM Z FIZYKI

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR ANALIZA WŁASNOŚCI OPCJI SUPERSHARE

Agnieszka Nowak Brzezińska

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO

Wpływ rozwoju elektromobilności w Polsce na zanieczyszczenie powietrza

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Transkrypt:

APROKSYMACJA POZIOMU IMISJI NA STACJACH MONITORINGU POWIETRZA ZA POMOCĄ AUTONOMICZNYCH MODELI NEURONOWYCH Szymon HOFFMAN Katedra Chemii, Technologii Wody i Ścieków, Politechnika Częstochowska ul. Dąbrowskiego 9, - Częstochowa, szymon@is.pcz.czest.pl STRESZCZENIE W analizie wykorzystano dane zarejestrowane w okresie wieloletnim na stacjach monitoringu powietrza, działających w tym samym regionie. Badano dokładność aproksymacji stężeń chwilowych różnych zanieczyszczeń powietrza. Do predykcji stężeń użyto autonomicznych modeli neuronowych, dla których jedynym źródłem wiedzy o aproksymowanych wartościach są zależności występujące w historycznych danych rejestrowanych w sieciach monitoringu powietrza. Błąd modelowania, obliczony na podstawie porównania danych rzeczywistych i danych uzyskanych w wyniku aproksymacji, przyjęto w porównaniach jako miarę dokładności różnych metod modelowania. Wykonana analiza pozwoliła wybrać najdokładniejsze techniki modelowania, które można rekomendować do aproksymacji stężeń poszczególnych zanieczyszczeń powietrza. 1. Wprowadzenie Dane zbierane w sposób ciągły na stacjach monitoringu powietrza nigdy nie są kompletne. Gdy kompletność wyników dla danej serii pomiarowej jest za mała, wtedy pojawia się potrzeba wprowadzenia wartości modelowanych do luk pomiarowych [1-]. W przeciwnym wypadku seria pomiarowa zostaje uznana za niekompletną i nie powinna być wykorzystywana do oceny jakości powietrza [3]. Obowiązujące akty prawne nie rekomendują określonych metod modelowania. Najprostszą metodą uzupełniania serii pomiarowej jest interpolacja liniowa. Jednak dla dłuższych luk pomiarowych ta technika aproksymacji jest mało dokładna. Dokładniejsze mogą być metody eksplorujące wiedzę zgromadzoną w danych historycznych, zarejestrowanych na wybranej stacji monitoringu i na stacjach sąsiednich. Modele umożliwiające predykcję stężeń bez konieczności wykorzystywania danych zewnętrznych, pochodzących spoza systemu monitoringu, nazwano modelami autonomicznymi []. Wśród modeli autonomicznych można wyróżnić dwa podstawowe typy modele regresyjne i modele szeregów czasowych. Modele regresyjne eksplorują zależności obserwowane między różnymi seriami pomiarowymi, natomiast modele szeregów czasowych bazują na autoregresji charakteryzującej poszczególne serie czasowe. Wybór metody modelowania powinien zapewniać możliwie najwyższą dokładność predykcji. Zasadniczym celem przeprowadzonych badań było porównanie dokładności różnych typów modeli autonomicznych i znalezienie wśród nich optymalnych metod modelowania dla poszczególnych zanieczyszczeń powietrza. Przyjęto, że istnieje potrzeba modelowania luki pomiarowej, obejmującej pewien fragment serii czasowej wybranego zanieczyszczenia powietrza, przy założeniu, że są dostępne kompletne dane dotyczące innych zanieczyszczeń i parametrów meteorologicznych z okresu obejmującego lukę oraz dane z modelowanej serii czasowej poprzedzające taką lukę pomiarową. Dla kolejnych przypadków w tak zdefiniowanej luce pomiarowej porównywano błędy predykcji różnych metod modelowania. 153

W przypadku modeli regresyjnych wykorzystywano dostępne dane dla rozpatrywanego przypadku, tzn. dane zarejestrowane w tym samym dniu i o tej samej godzinie. W przypadku modeli szeregów czasowych kolejne przypadki w luce pomiarowej traktowano jako następujące po sobie kroki prognozy i przypisywano im wartości błędów otrzymane dla równoważnych horyzontów prognozy. Do budowy modeli predykcyjnych wykorzystano sieci neuronowe, ponieważ umożliwiają one optymalną aproksymację modelowanych zmiennych. W prezentowanej pracy analizie poddano wieloletni zbiór danych zarejestrowanych na kilku stacjach monitoringu powietrza usytuowanych w centralnej Polsce. Aproksymację stężeń przeprowadzono dla stężeń zarejestrowanych na stacji monitoringu w Radomiu.. Metodyka badań W analizie wykorzystano dane zarejestrowane w latach - na ośmiu stacjach monitoringu powietrza działających w różnych miejscowościach województw łódzkiego i mazowieckiego. Lokalizację stacji ilustruje mapa przedstawiona na rys. 1. Odpowiednim stacjom przypisano nazwy związane z ich usytuowaniem: Widzew, Gajew, Granica, Piotrków Trybunalski, Legionowo, Radom, Tłuszcz, Ursynów. 75 km Płock Wisła Legionowo Tłuszcz Kutno Granica Warszawa Siedlce Gajew Ursynów Łódź Widzew Wisła Tomaszów Mazowiecki Puławy Piotrków Trybunalski Radom Radomsko Skarżysko Kamienna Starachowice Kielce Rys. 1. Lokalizacja rozpatrywanych stacji monitoringu powietrza Analizowano serie czasowe stężeń chwilowych podstawowych zanieczyszczeń powietrza (O 3, NO, NO, PM 1, SO, CO). Wykorzystano także rejestrowane na stacjach monitoringu dane meteorologiczne, w tym kierunek i prędkość wiatru, temperaturę, natężenie promieniowania słonecznego, wilgotność względną. W pracy przeprowadzono modelowanie stężeń zanieczyszczeń powietrza pochodzących ze stacji monitoringu Radom, a następnie dokonano oceny jakości modelowania poprzez porównanie modelowanych stężeń ze stężeniami rzeczywistymi. Predykcję stężeń każdego z zanieczyszczeń powietrza wykonano za pomocą różnych metod modelowania. We wszystkich metodach wielkością modelowaną (wyjściem modelu) było stężenie wybranego zanieczyszczenia w określonym czasie. Modele różniły się liczbą i charakterem zmiennych objaśniających oraz techniką modelowania. Wygenerowano trzy podstawowe grupy modeli: 1. Modele szeregów czasowych (Time-Series Linear). Wejściami modeli były stężenia wybranego do modelowania zanieczyszczenia zarejestrowane w godzinach wcześniejszych. Wszystkie modele szeregów czasowych miały stałą liczbę 15

() wartości opóźnionych, stanowiących wejścia do modelu. W obrębie grupy modeli wygenerowano modele różniące się horyzontem prognozy, czyli liczbą kroków od ostatniej z wartości opóźnionych do wartości prognozowanej. Przyjęto następujące horyzonty prognozy: 1,, 3,, 5,,, 1,. Taki zakres horyzontów prognozy pozwolił ocenić jakość modelowania predykcyjnego w -godzinnym okresie. Do analizy szeregów czasowych wykorzystano liniowe sieci neuronowe. Wyjątkowo w przypadku aproksymacji za pomocą analizy szeregów czasowych ograniczono się do modeli liniowych. Dotychczasowe doświadczenia wykazują, że modele nieliniowe nie poprawiają w sposób istotny jakości modelowania [5].. Modele regresji wielowymiarowej (Multiple Regression Perceptron). W modelach tych predyktorami stężenia wybranego zanieczyszczenia były mierzone na tej samej stacji monitoringu stężenia innych zanieczyszczeń, a także dzień i godzina pomiaru oraz dane meteorologiczne. Do analizy regresji wykorzystano nieliniowe sieci neuronowe o strukturze tzw. perceptronu. W każdym modelu perceptronowym przyjęto architekturę sieci z pięcioma neuronami umieszczonymi w pojedynczej warstwie ukrytej. Taka stosunkowo prosta budowa sieci neuronowej pozwala na efektywną eksplorację wiedzy ukrytej w danych []. 3. E Modele regresji wielowymiarowej eksplorujące dane pochodzące z sąsiednich stacji monitoringu (Eexternal Multiple Regression - Perceptron). W modelach tych predyktorami stężenia wybranego zanieczyszczenia były stężenia tego samego zanieczyszczenia zarejestrowane w tym samym czasie na innych sąsiednich stacjach monitoringu powietrza. Do modelowania stężeń zanieczyszczeń na stacji monitoringu Widzew-Łódź wykorzystano dane pochodzące z siedmiu innych stacji usytuowanych w województwach łódzkim i mazowieckim (rys. 1). Zastosowana sieć miała architekturę perceptronu, analogiczną do sieci typu. Obliczenia przeprowadzono korzystając z programu STATISTICA Data Mining. W przypadku każdej sieci neuronowej zbiór wszystkich przypadków został losowo podzielony na trzy podzbiory: zbiór uczący (5% przypadków), zbiór weryfikujący (5% przypadków), zbiór testujący (5% przypadków). W porównaniach modeli wykorzystano cztery różne kategorie błędu predykcji, wynikające z porównania stężeń rzeczywistych i modelowanych: - wartość współczynnika korelacji Pearsona (r), - wartość pierwiastka z błędu średniokwadratowego (RMSE), - wartość średniego błędu bezwzględnego ( e ), - stosunek RMSE do odchylenia standardowego (RMSE/s). Wartości RMSE i e są użytecznym kryterium przy porównywaniu sieci modelujących stężenie wybranego zanieczyszczenia na konkretnej stacji monitoringu. Kryteriami bardziej uniwersalnymi są współczynnik korelacji i stosunek RMSE/s. Te dwie miary błędu umożliwiają porównanie dokładności predykcji stężeń różnych zanieczyszczeń powietrza. 3. Wyniki Na wykresach przedstawiono zmiany wartości błędów modelowania w zależności od horyzontu prognozy (rys. -7). Poszczególne rysunki ilustrują wyniki otrzymane kolejno dla O 3, NO, NO, CO, SO, PM 1. Dla każdego z wymienionych zanieczyszczeń zaprezentowano wykresy zmian wartości czterech różnych kategorii błędu: RMSE, e, RMSE/s i r, dla horyzontów prognozy w zakresie od 1 do godzin. Na poszczególnych wykresach porównano wyniki dla modeli wygenerowanych 3 różnymi technikami predykcji, w tym dla modeli szeregów czasowych (), dla nieliniowych model regresji wielowymiarowej (MR- 155

Wartość RMSE/s Wartość RMSE/s P) i dla nieliniowych modeli regresji wielowymiarowej eksplorujących dane pochodzące z sąsiednich stacji monitoringu (E). Do przygotowania wykresów wykorzystano błędy modelowania, których dokładne wartości zostały podane we wcześniejszej publikacji [7]. 1 1 1 1 E 1 1 1 1 E 1,, 1,, E,7,7,,,5, E,5,,3,3,,,1,1,, Rys.. Błąd modelowania stężeń chwilowych O 3 w zależności od horyzontu prognozy (Modele,, E, Radom -) 1 1 1 1 E 1 1 1 1 E 1, 1,, E,,7,,7, E,5,5,,,3,3,,,1,1,, Rys. 3. Błąd modelowania stężeń chwilowych NO w zależności od horyzontu prognozy (Modele,, E, Radom -) 15

Wartość RMSE/s Wartość RMSE/s 1 1 1 E 1 E 1, 1,,,7 E,,7 E,,,5,,5,,3,3,,,1,1,, Rys.. Błąd modelowania stężeń chwilowych NO w zależności od horyzontu prognozy (Modele,, E, Radom -) 5 5 5 5 35 3 5 15 E 35 3 5 15 E 1 1 5 5 1,, 1,,,7 E,7 E,,,5,5,,,3,3,,,1,1,, Rys. 5. Błąd modelowania stężeń chwilowych CO w zależności od horyzontu prognozy (Modele,, E, Radom -) 157

Wartość RMSE/s Wartość RMSE/s 1 1 1 E 1 E 1, 1,,,7, E,,7, E,5,5,,,3,3,,,1,1,, Rys.. Błąd modelowania stężeń chwilowych SO w zależności od horyzontu prognozy (Modele,, E, Radom -) 35 3 5 15 1 E 35 3 5 15 1 E 5 5 1, 1,,, E,7, E,7,,5,5,,,3,3,,,1,1,, Rys. 7. Błąd modelowania stężeń chwilowych PM 1 w zależności od horyzontu prognozy (Modele,, E, Radom -). Dyskusja wyników i podsumowanie Modele regresyjne i E mają stałą wartość błędu, niezależną od horyzontu prognozy. Tylko modele charakteryzują się zmienną wartością błędów predykcji w 15

miarę wydłużania horyzontu prognozy (luki pomiarowej). W przypadku tych modeli wartości błędów RMSE, e, RMSE/s stopniowo rosną w miarę wydłużania horyzontu prognozy. Odmiennie zachowują się wartości współczynnika korelacji, które stopniowo maleją, w miarę pogarszania się jakości prognozy. Analiza którejkolwiek z miar błędów prowadzi do wniosku, że jakość modelowania w grupie modeli silnie zależy od długości luk pomiarowych. Te prawidłowości są obserwowane dla wszystkich zanieczyszczeń powietrza. Tylko dla krótkich luk pomiarowych modele mogą być dokładniejsze od pozostałych. W tab. 1- zestawiono najdokładniejsze metody modelowania stężeń poszczególnych zanieczyszczeń powietrza dla kolejnych horyzontów prognozy. W przypadku stężeń ozonu modele zapewniają najwyższą jakość predykcji w lukach pomiarowych o długościach 1 godziny (tab. 1). Rekomendacja optymalnej metody nie zależy od rozpatrywanego rodzaju błędu. Następne przypadki w lukach pomiarowych powinny być modelowane metodą regresji. Tabela 1. Najdokładniejsze modele stężeń O 3 dla luk pomiarowych o różnej długości. 1 >1 RMSE e RMSE/s r W przypadku stężeń NO modele są wyjątkowo mało dokładne, nawet dla najkrótszych horyzontów prognozy. Model regresyjny typu jest natomiast wyjątkowo dokładny, nawet w porównaniu do analogicznych modeli dla innych zanieczyszczeń. Współczynnik korelacji dla tego modelu wynosi 5. Rozpatrując wszystkie miary błędu model należy rekomendować do prognozowania stężeń NO już od pierwszego przypadku w luce (tab. ). Tabela. Najdokładniejsze modele stężeń NO dla luk pomiarowych o różnej długości. 1 >1 RMSE e RMSE/s r W przypadku stężeń NO modele zapewniają najwyższą jakość predykcji tylko w pierwszym kroku prognozy (tab. 3). Następne przypadki w lukach pomiarowych powinny być modelowane metodą regresji. Tabela 3. Najdokładniejsze modele stężeń NO dla luk pomiarowych o różnej długości. 1 >1 RMSE e RMSE/s r W przypadku stężeń CO, dla horyzontów prognozy dłuższych niż 1 godz. najdokładniejszym modelem jest model regresyjny typu (tab. ). Dla pierwszego kroku prognozy wyższą 159

dokładność zapewnia model, ale tylko przy traktowaniu wartości średniego błędu bezwzględnego e jako kryterium jakości predykcji. Tabela. Najdokładniejsze modele stężeń CO dla luk pomiarowych o różnej długości. 1 >1 RMSE e RMSE/s r Najlepsze rezultaty w modelowaniu stężeń SO dla pierwszych przypadków luk pomiarowych daje metoda (tab. 5). Rozpatrując kategorię średniego błędu bezwzględnego e ta metoda okazuje się najdokładniejsza dla luk pomiarowych nieprzekraczających godzin. Wartości innych błędów pozwalają rekomendować modele do uzupełniania dwóch pierwszych przypadków w lukach pomiarowych. Dla dłuższych luk pomiarowych najdokładniejszymi modelami stają się modele. Tabela 5. Najdokładniejsze modele stężeń SO dla luk pomiarowych o różnej długości. 1 3 > RMSE e RMSE/s r Dla stężeń PM 1 najlepsze wyniki modelowania w pierwszym kroku prognozy daje zawsze metoda (tab. ). Dla drugiego kroku prognozy o rekomendacji rozstrzyga kryterium błędu. Analizując wartości średniego błędu bezwzględnego e można rekomendować modele szeregów czasowych. Po porównaniu wartości innych miar błędów, w drugim kroku prognozy dokładniejsze okazują się modele regresyjne typu. Te modele zapewniają najlepszą dokładność predykcji w każdym następnym kroku prognozy. Tabela. Najdokładniejsze modele stężeń PM 1 dla luk pomiarowych o różnej długości. 1 > RMSE e RMSE/s r Uzyskane wyniki wskazują, że dla danych rejestrowanych na stacji monitoringu powietrza w Radomiu największą dokładność predykcji zapewniają modele i. Dokładność modeli regresji wielowymiarowej eksplorujących dane pochodzące z sąsiednich stacji monitoringu (E) jest dla wszystkich zanieczyszczeń mniejsza od dokładności wewnętrznych modeli regresyjnych (). Dlatego ta metoda nie może być rekomendowana do predykcji luk pomiarowych, o ile pozostałe z metod mogłyby być zastosowane. Niedokładność modeli E może wynikać z wyjątkowo nieregularnej emisji zanieczyszczeń pierwotnych pochodzących z lokalnych źródeł emisji znajdujących się w pobliżu stacji monitoringu powietrza w Radomiu, a także z usytuowania tej stacji na skraju obszaru monitorowanego przez pozostałe stacje pomiarowe. 1

NO jest jedynym zanieczyszczeniem, dla którego w całej luce pomiarowej największą dokładność aproksymacji stężeń zapewniają modele typu. Metoda szeregów czasowych może być zalecana do predykcji tylko w pierwszym kroku prognozy dla luk pomiarowych w seriach czasowych stężeń O 3, NO, CO. Wyjątkowo, można rozpatrywać stosowanie modeli do uzupełniania większej liczby przypadków - pierwszych 1- przypadków w luce dla serii czasowej stężeń PM 1 oraz - przypadków w luce dla serii czasowej stężeń SO. Wybór metody modelowania dla kolejnych miejsc luki pomiarowej jest jednoznaczny wtedy, gdy podczas wypełniania brakujących danych przyjmie się tylko jedną z miar błędów jako kryterium wyboru metody modelowania. Oceny dokładności wynikające z analizy różnych miar błędów nie są tak bardzo rozbieżne, aby można było odrzucić którąś z tych miar jako niewłaściwe kryterium oceny. 5. Wnioski Na podstawie przeprowadzonej analizy sformułowano następujące wnioski: 1. Dla każdego z zanieczyszczeń powietrza należy rekomendować inne metody predykcji, ponieważ występują duże różnice w możliwościach modelowania stężeń poszczególnych zanieczyszczeń powietrza.. W celu zapewnienia optymalnej dokładności predykcji należy uwzględnić zmianę sposobu modelowania w miarę wydłużania horyzontu prognozy. 3. W przypadku NO zasadne jest stosowanie dla całej luki pomiarowej modeli regresji wielowymiarowej typu.. Stężenia zanieczyszczeń takich jak O 3, NO, CO, SO, PM 1 można efektywnie modelować metodą szeregów czasowych, ale tylko dla bardzo krótkich horyzontów prognozy (1- godzin), po których regresyjne metody modelowania okazują się dokładniejsze. 5. Podczas wypełniania brakujących danych należy przyjąć tylko jedną z miar błędów jako kryterium wyboru metody modelowania. Wtedy wybór dla kolejnych miejsc luki pomiarowej będzie jednoznaczny. Wnioski wynikające z przeprowadzonej analizy odnoszą się tylko do danych zarejestrowanych na stacji monitoringu powietrza w Radomiu i tylko do metod modelowania wykorzystywanych w autonomicznych modelach neuronowych. W wykonanym porównaniu nie uwzględniono innych możliwych technik modelowania, w tym interpolacji, która może być konkurencyjna dla krótkich luk w seriach czasowych. Praca naukowa została wykonana w ramach badań własnych Politechniki Częstochowskiej BW -1/. W analizie wykorzystano wyniki uzyskane w projekcie badawczym nr 1 T9D 37 3. Literatura 1. Plaia A., Bondı A.L.: Single imputation method of missing values in environmental pollution data sets. Atmospheric Environment, (), is. 3, 731 733.. Gentili S., Magnaterra L., Passerini G.: An introduction to the statistical filling of environmental data time series. In Latini G., Passerini G. (Eds.): Handling Missing Data: Applications to Environmental Analysis. Wit Press, Southampton, Boston. 11

1 3. Rozporządzenie Ministra Środowiska z dnia 17 grudnia r. w sprawie dokonywania oceny poziomów substancji w powietrzu (Dz. U. Nr 5, poz. 31).. Hoffman S.: Treating missing data at air monitoring stations. In Pawłowski L., Dudzińska M. R., Pawłowski A. (Eds.): Environmental Engineering, Taylor & Francis Group, London 7, 39-353. 5. Hoffman S.: Short-Time forecasting of atmospheric NO x concentration by neural networks. Environmental Engineering Science, 3 (),, 3-9.. Hoffman S.: Zastosowanie sieci neuronowych w modelowaniu regresyjnym stężeń zanieczyszczeń powietrza. Wydawnictwa Politechniki Częstochowskiej, Częstochowa. 7. Hoffman S., Jasiński R.: Uzupełnianie brakujących danych w systemach monitoringu powietrza. Wydawnictwo Politechniki Częstochowskiej, Częstochowa 9.