Przewody wodociągowe, sieci neuronowe, uszkodzenia Małgorzata KUTYŁOWSKA* PRZEWIDYWANIE RODZAJU USZKODZEŃ PRZEWODÓW WODOCIĄGOWYCH ZA POMOCĄ KLASYFIKUJĄCYCH SIECI NEURONOWYCH Celem pracy jest analiza i ocena przydatności stosowania sztucznych sieci neuronowych do prognozowania rodzaju uszkodzeń występujących na przewodach wodociągowych. Informacje o zaobserwowanych awariach sieci wodociągowej w Głogowie z lat 1995-2003 posłużyły do uczenia sieci neuronowej, natomiast sprawdzenie poprawności modelu (prognoza) wykonano na zbiorze danych z lat 2007-2010. Wyniki prognozy za pomocą klasyfikujących sieci neuronowych są obiecujące, gdyż uszkodzenie typu korozja zostało przyporządkowane ze stuprocentową dokładnością, natomiast pęknięcie zostało błędnie zidentyfikowane jedynie w osiemnastu przypadkach na 198. Wyniki uzyskane z zastosowaniem wybranego modelu wielowarstwowego perceptronu (MLP 8-3-2) potwierdziły, występującą w praktyce eksploatacyjnej analizowanej sieci wodociągowej, zależność rodzaju uszkodzeń rurociągów od ich materiału. 1. WSTĘP 1.1. SZTUCZNE SIECI NEURONOWE Sztuczne sieci neuronowe (SSN) wydają się być bardzo obiecującym narzędziem do przewidywania wybranych zjawisk w inżynierii środowiska, co wykazano w pracy [3]. W ostatnich latach obserwuje się znaczny postęp związany nie tylko ze stosowaniem nowych technologii, ale także z możliwością wykorzystania, poza tradycyjnymi modelami matematycznymi, sztucznych sieci neuronowych do prognozowania niestacjonarnych i zmiennych zjawisk zachodzących w powietrzu, w systemach dystrybucji wody i usuwania ścieków oraz w technologii uzdatniania wody i oczyszczania ścieków. Sztuczne sieci neuronowe są narzędziem przydatnym, stosowanym w inżynierii * Instytut Inżynierii Środowiska, Politechnika Wrocławska, pl. Grunwaldzki 9, 50-377 Wrocław, malgorzata.kutylowska@pwr.wroc.pl.
312 M. KUTYŁOWSKA środowiska, jednak należy pamiętać, że każdy rozwiązywany problem jest inny i w związku z tym nie ma jednej wykładni mówiącej, jaką strukturę sieci i które metody uczenia należy wybrać w celu określenia wartości wag wszystkich warstw. W zależności od rodzaju danych wejściowych i celu optymalizacji należy każdorazowo, często metodą prób i błędów, dokonać wyboru m. in. liczby neuronów ukrytych [6]. 1.2. SIEĆ WODOCIĄGOWA W GŁOGOWIE Jednym z najważniejszych elementów systemu zaopatrzenia w wodę jest sieć wodociągowa, która powinna charakteryzować się dużą niezawodnością działania i niskimi kosztami eksploatacji. Prawidłowa eksploatacja sieci dystrybucji oraz przewidywanie przyczyn, rodzaju i liczby uszkodzeń przewodów pozwolą podjąć kroki zmierzające do zmniejszenia awaryjności, polepszenia stanu technicznego i hydraulicznego sieci oraz stworzenia programu naprawy i odnowy rurociągów. Sieć wodociągowa w Głogowie charakteryzuje się średnim poziomem awaryjności opisanym za pomocą wskaźnika intensywności uszkodzeń, porównywalnym z poziomem w innych miastach w Polsce i na świecie. Opis systemu wodociągowego w Głogowie oraz analizę awaryjności w latach 2007-2010 zamieszczono w pracy [4]. Głównymi obserwowanymi rodzajami uszkodzeń przewodów były pęknięcia i korozja materiału rur, a także niesprawności armatury. Intensywność uszkodzeń przyłączy wodociągowych, w porównaniu do magistrali i przewodów rozdzielczych była największa. W okresie jesienno-zimowym awaryjność przewodów była zwiększona, co związane jest z warunkami atmosferycznymi i niekiedy zbyt płytkim ułożeniem rurociągów. W tym opracowaniu głównym celem jest zaprezentowanie możliwości przewidywania rodzaju uszkodzeń przewodów wodociągowych za pomocą klasyfikujących sieci neuronowych. W przyszłości, bazując na tych pierwszych podstawowych badaniach, model będzie mógł być rozbudowany o dodatkowe zmienne eksploatacyjne w celu zwiększenia możliwości aplikacyjnych, np. w przedsiębiorstwach wodociągowych. Podobne analizy zostały przeprowadzone już kilka lat temu [1], co pozwoliło dokonać, w rozpatrywanej przez autorów sieci dystrybucji wody, wiele zmian nie tylko technicznych, ale również związanych z zarządzeniem systemem. 2. METODYKA BADAŃ Do analizy przydatności stosowania klasyfikujących SSN w celu modelowania rodzaju uszkodzeń wykorzystano zapisy z dzienników awarii sieci wodociągowej w Głogowie w latach 1995-2003 oraz 2007-2010 [5] dotyczące sieci magistralnej, rozdzielczej i przyłączy (bez awarii armatury), w podziale na liczbę i rodzaj uszko-
Przewidywanie rodzaju uszkodzeń przewodów wodociągowych za pomocą klasyfikujących 313 dzeń, co przedstawiono na rysunku 1. Dane z lat 1995-2003 (łącznie 526 przypadków z czego 50% stanowiły dane do uczenia sieci, 25% do testowania oraz 25% do walidacji modelu) posłużyły do stworzenia modeli sieci neuronowych i ich prawidłowego przetrenowania, natomiast informacje z lat 2007-2010 (łącznie 198 przypadków) wykorzystane zostały do wykonania prognozy rodzaju uszkodzeń na wybranych modelach sieci. Sieć neuronowa nie znała wcześniej danych o awariach z lat 2007-2010, co pozwoliło na uzyskanie miarodajnych wyników prognoz. Należy pamiętać, że liczba przypadków podana na wejście do sieci nie była równa liczbie zanotowanych uszkodzeń, gdyż na niektórych przewodach (o określonej średnicy i materiale) zaobserwowano w ciągu roku większą liczbę uszkodzeń niż 1. Natomiast do sieci neuronowej podano sumaryczną dla każdego roku, a nie całego okresu badań, liczbę awarii. Przykład danych (kilka przypadków dla 2001 roku) wprowadzanych do sieci zestawiono w tabeli 1. Tabela 1. Przykład kilku przypadków danych uczących Średnica Materiał Liczba uszkodzeń Rodzaj uszkodzenia 100 stal 3 korozja 65 stal 2 korozja 100 żeliwo 1 pęknięcie 100 stal 1 korozja 125 stal 1 korozja 150 stal 7 korozja 100 stal 1 korozja 100 żeliwo 1 pęknięcie 225 PCW 1 pęknięcie 150 stal 2 korozja 100 stal 3 korozja Analizując dane z dzienników awarii zaobserwowano, że rurociągi stalowe ulegały głównie korozji, natomiast uszkodzenia przewodów wykonanych z azbestocementu, tworzyw sztucznych i żeliwa szarego to w większości pęknięcia. Analiza danych na rys. 1 uwidacznia, że na przestrzeni kilku lat zmniejszyła się liczba występujących przypadków korozji na rzecz pęknięć. Uzasadnienie i wytłumaczenie tego faktu nie jest możliwe, gdyż nie dysponowano odpowiednimi informacjami z eksploatacji i inwentaryzacji rozważanego systemu dystrybucji wody. Pomimo tego, w celu modelowania SSN, zasadne okazało się wybranie wspomnianych wyżej przedziałów czasowych do uczenia i prognozy rodzaju uszkodzeń. Przetrenowanie sieci neuronowej na zbiorze danych charakteryzujących się większą liczbą przypadków korozji w stosunku do pęknięć nie spowodowało przeuczenia sieci. Zachowana została także zdol-
Liczba uszkodzeń Liczba uszkodzeń 314 M. KUTYŁOWSKA ność generalizacji podczas wykonywania prognozy dla danych z przeważającą liczbą pęknięć. a) pęknięcia korozja 80 70 60 50 40 30 20 10 0 76 68 68 66 61 49 42 45 32 29 25 26 27 20 21 20 16 9 1995 1996 1997 1998 1999 2000 2001 2002 2003 Lata b) pęknięcia korozja 40 35 30 25 20 15 10 5 0 37 34 34 26 27 27 24 20 2007 2008 2009 2010 Lata Rys. 1. Liczba i rodzaj uszkodzeń sieci wodociągowej w Głogowie w latach a) 1995-2003; b) 2007-2010 Na przewodach sieci wodociągowej w Głogowie, o średnicach 20 700 mm, występowało, w rozważanym okresie, od 1 do 8 uszkodzeń. Model sieci neuronowej typu wielowarstwowego perceptronu składał się z 8 neuronów wejściowych, z których średnica przewodu oraz liczba uszkodzeń dla poszczególnych średnic i ulic były parametrami ilościowymi reprezentowanymi po jednym neuronie, natomiast pozostałe 6
Przewidywanie rodzaju uszkodzeń przewodów wodociągowych za pomocą klasyfikujących 315 impulsów wejściowych mających charakter jakościowy stanowił materiał rur (azbestocement, PCW, PE, stal, stal ocynkowana i żeliwo szare). Wybór zmiennych podawanych na wejście do sieci neuronowej został dokonany na podstawie informacji zawartych w literaturze [2] oraz możliwości wykorzystania danych udostępnionych przez Przedsiębiorstwo Wodociągów i Kanalizacji w Głogowie [5]. W pracy [2], w której modelowano za pomocą SSN intensywność uszkodzeń przewodów wodociągowych, stwierdzono, że znaczący wpływ na efekt modelowania miały: liczba zarejestrowanych awarii, materiał i średnica przewodu. Liczba neuronów ukrytych w zastosowanej jednej warstwie wynosiła 1 16. Zbyt duża liczba neuronów ukrytych mogłaby prowadzić do przeuczenia i utraty zdolności generalizacji wyników prognozy. Wyjście z sieci neuronowej stanowiły dwa neurony mające charakter parametrów jakościowych, opisujące dwa rodzaje uszkodzeń (pęknięcie i korozja). Modelowanie wykonano przy użyciu programu Statistica. Podczas uczenia sieci metodą quasi-newtona z wykorzystaniem algorytmu zmiennej metryki (BFGS) zastosowano następujące funkcje aktywacji: liniową, logistyczną, tangens hiperboliczny i wykładniczą. Liczba epok uczenia wahała się, w zależności od rozpatrywanego modelu, w granicach 1 1000. W związku z tym, że modelowanie z wykorzystaniem SSN jest podejściem typu czarna skrzynka, wspomniane wyżej warunki brzegowe dla tworzonych modeli zostały założone a priori lub metodą prób i błędów. 3. WYNIKI I DYSKUSJA Podczas trenowania sieci neuronowej (dane z lat 1995-2003) wybrano 20 modeli charakteryzujących się najmniejszym procentem niepoprawnie zaklasyfikowanych uszkodzeń oraz najlepszymi wynikami jakości uczenia, testowania i walidacji, co przedstawiono w tabeli 2. Pięć wybranych modeli, zaznaczonych w tabeli 2 drukiem pogrubionym, posłużyło do wykonania prognozy rodzaju uszkodzeń przewodów wodociągowych dla lat 2007-2010. Wybrano modele o najlepszej jakości uczenia oraz o najmniejszym udziale niepoprawnie przyporządkowanych rodzajów awarii. W przypadkach, w których wspomniany procent był taki sam wybrano modele o najprostszej strukturze (najmniej neuronów ukrytych). Analiza wyników prognozy pokazała, że każdy z 5 modeli generuje takie same rezultaty klasyfikacji. W związku z tym za model najlepiej klasyfikujący uznano ten o najprostszej architekturze MLP 8-3-2, gdyż celem przewidywania za pomocą SSN jest nie tylko uzyskanie zadowalających wyników prognoz, ale również minimalizacja stopnia komplikacji struktury sieci. Im prostsza architektura, tym większe prawdopodobieństwo, że sieć nie zostanie przeuczona i spełnione będą wymogi generalizacji [6]. Prognoza rodzaju uszkodzeń, dla lat 2007-2010 na wybranym modelu MLP 8-3-2, dała bardzo dobre rezultaty, co zilustrowano na rys. 2.
Liczba przypadków 316 M. KUTYŁOWSKA Tabela 2. Wyniki poprawności klasyfikacji rodzaju uszkodzeń na zbiorze danych uczących Model Jakość uczenia Jakość testowania Jakość walidacji % niepoprawnie zaklasyfikowanych uszkodzeń Funkcja aktywacji-neurony ukryte Funkcja aktywacjineurony wyjściowe MLP 8-15-2 98,86 98,47 99,24 1,1407 Logistyczna Softmax MLP 8-9-2 98,86 97,71 99,24 1,3308 Liniowa Logistyczna MLP 8-5-2 98,86 98,47 99,24 1,1407 Tanh Softmax MLP 8-9-2 98,86 98,47 99,24 1,1407 Tanh Softmax MLP 8-3-2 98,86 98,47 99,24 1,1407 Logistyczna Softmax MLP 8-16-2 98,86 98,47 99,24 1,1407 Tanh Tanh MLP 8-15-2 98,86 98,47 99,24 1,1407 Wykładnicza Softmax MLP 8-7-2 98,86 98,47 99,24 1,1407 Liniowa Logistyczna MLP 8-16-2 60,61 67,94 74,81 34,0304 Logistyczna Logistyczna MLP 8-3-2 98,48 98,47 99,24 1,3308 Tanh Logistyczna MLP 8-3-2 95,83 96,95 96,18 3,8023 Wykładnicza Wykładnicza MLP 8-5-2 98,86 98,47 99,24 1,1407 Tanh Tanh MLP 8-7-2 98,86 98,47 99,24 1,1407 Wykładnicza Softmax MLP 8-14-2 98,86 98,47 99,24 1,1407 Wykładnicza Softmax MLP 8-10-2 98,86 98,47 99,24 1,1407 Wykładnicza Softmax MLP 8-1-2 92,80 92,37 95,42 6,6540 Logistyczna Wykładnicza MLP 8-10-2 98,86 98,47 99,24 1,1407 Liniowa Softmax MLP 8-11-2 98,11 98,47 99,24 1,5209 Liniowa Wykładnicza MLP 8-7-2 98,86 98,47 99,24 1,1407 Logistyczna Tanh MLP 8-8-2 98,86 98,47 99,24 1,1407 Liniowa Wykładnicza a) 200 180 160 140 120 100 80 60 40 20 0 83 ogółem poprawna niepoprawna 198 180 115 97 83 18 18 0 Korozja Pęknięcie Suma Rodzaj uszkodzenia
Klasyfikacja, % Przewidywanie rodzaju uszkodzeń przewodów wodociągowych za pomocą klasyfikujących 317 b) 100,00 90,00 80,00 70,00 60,00 50,00 40,00 30,00 20,00 10,00 0,00 poprawna niepoprawna 100,00 90,91 84,35 15,65 9,09 0,00 Korozja Pęknięcie Suma Rodzaj uszkodzenia Rys. 2. Wyniki prognozy rodzaju uszkodzeń sieci wodociągowej w Głogowie dla modelu MLP 8-3-2 a) klasyfikacja liczby przypadków podanych do sieci; b) klasyfikacja procentowa Prognoza (dla modelu MLP 8-3-2) klasyfikująca uszkodzenie typu korozja została dokonana ze stuprocentową dokładnością. Awaria typu pęknięcie została nieprawidłowo przyporządkowana w osiemnastu przypadkach, co stanowiło jedynie ok. 15% całkowitej liczby odnotowanych pęknięć. Ogółem identyfikacja obu rodzajów uszkodzeń przebiegła z dokładnością ok. 91%. Tak dobre rezultaty prognoz wynikają z jednorodności danych wejściowych, gdyż rodzaj uszkodzenia zależny był, po dokonaniu niezbędnych uproszczeń związanych z udostępnionymi danymi, właściwie tylko od rodzaju materiału, z jakiego wykonany był przewód wodociągowy. Uszczegółowienie wstępnej klasyfikacji rodzaju uszkodzeń na etapie analizy dzienników awarii (np. pęknięcie podłużne i poprzeczne, pojedynczy wżer korozyjny, korozja na znacznej długości przewodu, itp.) oraz dysponowanie informacjami o wieku przewodu, panującym w sieci wodociągowej ciśnieniu, warunkach gruntowo-wodnych i długości przewodu pozwoli w przyszłości na uzyskanie większej liczby zmiennych, co przełoży się na większą uniwersalność przedstawionego sposobu prognozy przy użyciu klasyfikujących SSN. 4. PODSUMOWANIE W pracy zaprezentowano możliwość wykorzystania klasyfikujących sztucznych sieci neuronowych do przewidywania rodzaju uszkodzeń przewodów wodociągowych w Głogowie na przykładzie danych z dzienników awarii w latach 1995-2003 oraz 2007-2010. Analiza wyników pokazała, że przedstawiony sposób matematycznego
318 M. KUTYŁOWSKA modelowania potwierdza prawidłowości i zależności znane z praktyki eksploatacyjnej rozważanego systemu dystrybucji wody. Pomimo jednoznacznie uzyskanego potwierdzenia zależności rodzaju uszkodzenia od materiału rury, badania takie są potrzebne z uwagi na rosnące zainteresowanie możliwością wykorzystania modeli sztucznej inteligencji do rozwiązywania zagadnień w inżynierii środowiska. Obecnie coraz częściej stosuje się sztuczną inteligencję do optymalizacji zagadnień inżynierskich, a zwłaszcza takich, które charakteryzują się losowością i dużą zmiennością w czasie. W związku z tym dalsze badania nad możliwością zastosowania podejścia typu czarna skrzynka do modelowania liczby i rodzaju awarii przewodów infrastruktury podziemnej, a także intensywności uszkodzeń są jak najbardziej zasadne i obiecujące. Aby to było możliwe konieczne jest gromadzenie przez zakłady wodociągowokanalizacyjne odpowiedniej bazy danych, co obecnie jest ułatwione z uwagi na wprowadzanie systemu GIS. PODZIĘKOWANIE Autorka składa podziękowanie Pracownikom Przedsiębiorstwa Wodociągów i Kanalizacji w Głogowie za udostępnienie danych i możliwość ich wykorzystania do badań naukowych. LITERATURA [1] IZQUIERDO J., LOPEZ P.A., MARTINEZ F.J., PEREZ R., Fault detection in water supply systems using hybrid (theory and data-driven) modelling, Mathematical and Computer Modelling, 2007, Vol. 46, No. 3-4, 341 350. [2] JAFAR R., SHAHROUR I., JURAN I., Application of Artificial Neural Networks (ANN) to model the failure of urban water mains, Mathematical and Computer Modelling, 2010, Vol. 51, No. 9-10, 1170 1180. [3] KABSCH-KORBUTOWICZ M., KUTYŁOWSKA M., Sztuczne sieci neuronowe jako narzędzie do modelowania zagadnień związanych z inżynierią środowiska- stan wiedzy, Gaz, Woda i Technika Sanitarna, 2012, No. 5, 228 232. [4] KUTYŁOWSKA M., HOTLOŚ H., Failure analysis of water supply system in the Polish city of Głogów, Engineering Failure Analysis, w recenzji. [5] Materiały udostępnione przez Przedsiębiorstwo Wodociągów i Kanalizacji w Głogowie, 2011. [6] OSOWSKI S., Sieci neuronowe do przetwarzania informacji, Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa 2000. PREDICTION OF WATER PIPES FAILURES USING CLASSIFYING NEURAL NETWORKS The aim of the work is the analysis of using artificial neural networks to predict kind of failures occurring on the water pipes. Information about the observed breakdowns of water network in Głogów in years 1995-2003 were used to learn the neural network. Verification of model validity (prognosis) was done using data sets from years 2007-2010. The prognosis results are promising. Corrosion was classified at the level of 100 percent accuracy. Cracks were classified incorrectly only in 18 per 198 times. Results obtained using chosen model of multilayer perceptrone (MLP 8-3-2) confirm, known from operation of analyzed water system, regularity and relationships between the material and kinds of failure.