Udostępnione na prawach rękopisu, 8.04.2014r. Publikacja: Knyziak P., "Sztuczne sieci neuronowe w oszacowaniu zużycia technicznego prefabrykowanych budynków mieszkalnych" (Artificial Neuronal Networks In Estimation Of The Technical Deterioration For Prefabricated Residential Buildings), Theoretical foundations of civil engineering. Polish-Ukrainian-Lithuanian transactions, vol. 16, Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa 2008, s. 435-442, ISBN 978-83-7207-763-9 (artykuł konferencyjny - XVII Polish-Russian-Slovak Seminar "Theoretical Foundation of Civil Engineering" Warsaw-Wroclaw, Poland, 02-08 June 2008) SZTUCZNE SIECI NEURONOWE W OSZACOWANIU ZUŻYCIA TECHNICZNEGO PREFABRYKOWANYCH BUDYNKÓW MIESZKALNYCH Piotr KNYZIAK Wydział Inżynierii Lądowej - Politechnika Warszawska 1. Wstęp Oceny zużycia technicznego budynku można dokonać jedną z kilku metod. Różnią się one szczegółowością podejścia, wymogami odnośnie nakładów pracy i czasu potrzebnego na ich wykonanie oraz wykorzystaniem ekspertyz. Istniejące metody oceny zużycia technicznego albo dają wyniki, pozwalające jedynie z grubsza oszacować zużycie budynków (metody czasowe) te nadają się właściwie wyłącznie do celów księgowania amortyzacji, albo pozwalają na bardzo szczegółową ocenę (metody wizualne) w celu precyzyjnego określenia stanu każdego elementu budynku (włącznie z prowadzeniem odkrywek i badań laboratoryjnych) i przygotowania harmonogramu remontów bieżących lub remontu generalnego. Brak jest metody zapewniającej możliwość szacowania zużycia technicznego, określania wartości odniesienia, wartości nominalnej. W związku z powyższym poszukiwane są nowe rozwiązania, które przy rozpatrywaniu zużycia technicznego wielu budynków pomogłyby w oszacowaniu ich bieżącej wartości i pozwoliłyby na prognozowanie zmian. Dodatkowym efektem wykorzystywania nowej metody powinno być również ułatwienie prowadzenia polityki remontowej w spółdzielniach mieszkaniowych. Jednym ze sposobów szacowania może być analiza danych za pomocą sztucznych sieci neuronowych (SSN). Zajmując się jakimś problemem zazwyczaj na początku staramy się zbudować algorytm, gdyż dążymy do rozwiązań precyzyjnych. Dopiero, jeśli ten sposób zawodzi szukamy innych rozwiązań. Sposób w jaki poznajemy zagadnienia zależny jest od ich złożoności, najprostsze są rozwiązywane algorytmiczne, przy dużej złożoności potrzebne jest wnioskowanie indukcyjne. W tej klasie mieszczą się sztuczne sieci neuronowe (zobacz rys. 1). Są one narzędziem, które pozwala na przetwarzanie dużej liczby danych i jest mało wrażliwe na błędy. Wśród tych danych mogą być te naprawdę istotne, ale i te które można pominąć. Szczegółowa ich analiza pozwala odpowiedzieć na pytanie, co należy badać dokładnie a co wystarczy jedynie oszacować na podstawie łatwo dostępnych informacji. Z natury SSN wynika uzyskiwanie przybliżonych wartości, lecz należy wziąć pod uwagę, że wszystkie metody cechują się określonym stopniem dokładności.
Rys. 1. Sieci neuronowe a wnioskowanie [1] W poniższej pracy przedstawiono metodę określania zużycia technicznego budynków prefabrykowanych za pomocą sztucznych sieci neuronowych. Prace polegały na analizie różnych zakresów danych za pomocą różnych typów SSN. Wybrany został optymalny typ sieci oraz topologia. Przeprowadzona została analiza wrażliwości sieci na dobór parametrów z bazy danych. Zostały porównanie wyniki otrzymane metodą tradycyjną z wynikami otrzymywanymi za pomocą sztucznych sieci neuronowych. Prace mające na celu wykorzystanie metod sztucznej inteligencji do określania zużycia technicznego budynków długo użytkowanych (wybudowanych do 1918r.) były już w pewnym zakresie prowadzane. Analizowano jednak budynki wykonane z elementów drobnowymiarowych, najczęściej o drewnianej konstrukcji stropów międzypiętrowych i drewnianej konstrukcji dachu. Budynki prefabrykowane są użytkowane od niecałych pięćdziesięciu lat, mają inne cechy i wymagają odrębnej analizy. Prawie w całości nadzorowane są przez spółdzielnie mieszkaniowe lub w ostatnich latach przez zrzeszenia mieszkańców, więc można przyjąć, że ciągle jest nad nimi sprawowany specjalistyczny nadzór. Niniejsza praca bazuje na wnikliwej analizie historii remontów budynków, ich stanu technicznego oraz analizie skuteczności zastosowania różnych typów i topologii sztucznych sieci neuronowych. 2. Dane i wstępne przetwarzane Dane zbierano od stycznia 2005 roku do marca 2006 roku w 15 osiedlach 11 spółdzielni mieszkaniowych w Warszawie. W bazie danych zawarto informacje o 95 budynkach, w tym 33 budynkach wielkoblokowych i 62 wielkopłytowych. W każdym osiedlu wybrano kilka reprezentatywnych budynków. Zbierano dane w trakcie przeglądów oraz informacje o przeglądach i remontach z istniejącej dokumentacji budynków. Wykonano dokumentację fotograficzną. Przeglądy przeprowadzono w większości w okresie zimowo-wiosennym, gdy uwidacznia się najwięcej usterek. W szczególny sposób położono nacisk na uzyskanie zarówno szczegółowych danych o obecnym stanie jednostkowych obiektów jak i całych osiedli budynków mieszkalnych. Stworzona na podstawie zebranych osobiście przez autora danych baza pozwoliła nie tylko na całościową ocenę budynków, ale również na analizę stanu elementów składowych (wykonano zestawienie danych oraz zdjęcia wad i uszkodzeń).
Analizowane budynki, w trakcie wykonanych oględzin, były w dobrym ogólnym stanie technicznym. Nie wykazywały widocznych oznak, które świadczyłyby o jakimkolwiek niebezpieczeństwie, które mogłoby grozić ich mieszkańcom. Rysunek 1 przedstawia wyniki oceny zużycia budynków z bazy danych wykonanej metodą wizualną [3][7]. Rys. 2. Zużycie budynków z bazy danych [1] W początkowej fazie prac wykonano wstępne przetwarzanie danych. W wyniku analizy danych wyodrębniono 3 grupy parametrów do przetwarzania za pomocą SSN. Grupę I stanowiły dane bezpośrednio związane z oceną stanu technicznego elementów budynku. Wykorzystując tą grupę jako dane wejściowe uzyskano najlepsze efekty uczenia sieci. W tej grupie znalazły się parametry: rok budowy, stan balkonów i loggii, stan tynków zewnętrznych, stan stolarki okiennej mieszkań, stan przewodów instalacji c.o., stan przewodów inst. wody zimnej i ciepłej, stan pokrycia dachu, stan izol. termicznej ścian osłonowych, stan izol. termicznej ścian szczytowych, stan izol. termicznej dachu. II grupę stanowił zbiór 10 parametrów zawierających informacje o uszkodzeniach i koniecznych remontach elementów budynku. III grupę stanowił zbiór 5 parametrów zawierających informacje związane z oddziaływaniem otoczenia na budynek. Wyodrębnione parametry w większości wykazywały, co najwyżej średnią korelację z danymi odnośnie zużycia wg metody wizualnej. Wartości korelacji mogły wynikać z ograniczonego zakresu ocen, jaki był stosowany do oceny stanu elementów. Skalowanie i normalizacja przeprowadzana była w zależności od przyjętej funkcji aktywacji neuronów. Wstępne przeskalowanie polegało na podzieleniu wartości przez różnicę pomiędzy wartością maksymalną i minimalną. Wartości powyższe mogły być pobrane z danych lub przyjęte przez autora. Np. dla danych typu rok budowy przyjęto, iż minimalna wartość czasu użytkowania to 10 lat, gdyż w 1995r. oddano w Warszawie ostatnie budynki
prefabrykowane a wartość maksymalna to 55, gdyż w 1957 roku oddano pierwsze budynki (zbieranie danych odbywało się od 7.01.2005r. do 23.03.2006r.) 3. Uczenie i testowanie różnych typów sztucznych sieci neuronowych W celu usystematyzowania prac przyjęto następującą metodykę analizy stanu technicznego budynków za pomocą sztucznych sieci neuronowych: przygotowanie bazy danych dla budynków wykonanych z elementów prefabrykowanych, wstępne przetworzenie danych z bazy, dobór sygnałów wejściowych, dobór typu i architektury sieci, analiza wrażliwości, ograniczenie liczby sygnałów wejściowych, wykorzystanie nauczonej sieci do określania stanu technicznego budynków nie należących do bazy danych. Podstawą metody jest uczenie sieci neuronowej na podstawie znanych wartości. Problemami do rozwiązania były: określenie jak najmniejszego zbioru parametrów (na podstawie którego dokładność wyników jest wystarczająca) - w ramach wcześniejszych prac wyznaczone zostały zawężone zbiory parametrów, dobór typu sieci, dobór topologii sieci, dobór metody i parametrów uczenia sieci. Sztuczne sieci neuronowe były uczone z wykorzystaniem danych o zużyciu budynków uzyskanych wg metody wizualnej (wartości przedstawia rys. 1). Zużycie może przyjmować różnorodne wartości dla poszczególnych lat użytkowania budynków. Zbiór danych do analizy przy wykorzystaniu I, II i III grupy parametrów posortowano ze względu na wartości kolumn: rok budowy i zużycie wg metody wizualnej. Następnie dokonano podziału zbioru danych na 7 części. Każda z części zawierała 13-14 rekordów. Sprawdzono czy dane do poszczególnych grup dobrane zostały z całego przedziału wartości i czy nie tworzą skupisk. Następnie przyjęto podział na podzbiory: zbiór uczący 5 części, zbiór weryfikujący 1 część, zbiór testujący 1 część. W procesie testowania i testowania różnych rodzajów sieci wykorzystano sieci typu: MLP - Multilayer Perceptron, RBF - Radial Basis Function, SVM - Support Vector Machine. Przyjęto klasyczny algorytm doboru typu i topologii sztucznej sieci neuronowej: 1. przygotowanie bazy danych zawierającej przykłady, 2. przetwarzanie danych - skalowanie, normalizacja, standaryzacja, zmniejszanie wymiarowości problemu, 3. dobór elementów z rekordów danych, 4. podział danych na grupy: danych uczących, danych weryfikujących, danych testujących, 5. wybór typu i topologii sztucznej sieci neuronowej, 6. wybór algorytmu uczenia i ustalenie jego parametrów, 7. uczenie sieci, 8. weryfikacja jakości otrzymywanych wyników,
9. powtarzanie kroków (5, 6, 7) w celu optymalizacji architektury sieci neuronowej, 10. analiza danych niewykorzystywanych w procesie uczenia z wykorzystaniem optymalnej sieci. W procesie modelowania sieci doświadczalnie dobierano topologie i parametry sieci starając się uzyskać najlepszy rezultat. Przyjmowano za wyznaczniki dobrej jakości sieci następujące przesłanki: współczynnik korelacji wyników - bliski 1, wartości błędów uczenia i weryfikacji - niskie i podobnej wartości. W procesie uczenia sieci wykorzystywano następujące kryteria zakończenia, tzw. kryteria stopu: osiągnięcie założonej maksymalnej liczby epok zawsze wykorzystywane ze względu na konieczność ograniczenia procesów nie spełniających innych warunków, błąd walidacji zaczyna się zwiększać (z możliwością zatrzymania po określonej dodatkowo liczbie epok). 4. Wybór najlepszego modelu sieci Zestawienie najlepszych wyników dla poszczególnych grup parametrów i typów sieci przedstawia Tabela. 1. Spośród wszystkich wyników najlepszy osiągnęła sieć typu MLP o architekturze 10-4-1 (1 warstwa ukryta z 4 neuronami, sigmoidalna funkcja aktywacji TanhAxon, gradientowa metoda uczenia z momentem o wartości 0.8) wykorzystująca jako sygnały wejściowe do sieci I grupę parametrów. Tabela. 1. Zestawienie wyników dla różnych grup parametrów i różnych typów SSN Grupa parametrów Typ i numer sieci Min. MSE - uczenie Min. MSE - weryfikacja MSE - testowanie NMSE - testowanie x 10-3 MAE - testowanie Min Abs Error - testowanie Max Abs Error - testowanie r- współczynnik korelacji I MLP-05 2,63 1,99 0,30 34,4 13,6 0,74 30,4 0,9873 RBF-14 9,43 4,74 0,51 58,7 19,8 1,59 35,6 0,9852 SVM-01 24,51 35,20 3,48 403,2 50,5 3,89 111,9 0,8946 II MLP-03 27,14 25,03 6,53 490,4 68,8 5,53 143,5 0,7755 RBF-02 30,17 24,57 5,50 413,2 60,5 3,62 180,5 0,7712 SVM-01 60,79 32,40 16,23 1220,1 99,3 2,24 323,0 0,4106 III MLP-03 45,97 55,02 6,53 491,0 70,0 2,71 159,9 0,7879 RBF-14 50,25 64,78 6,97 524,1 67,0 0,29 174,4 0,7773 SVM-01 105,99 109,12 11,52 865,9 93,9 18,66 179,7 0,4556 MSE - pierwiastek błędu średniokwadratowego, NMSE - MSE/wariancja), MAE - średni błąd absolutny, Min/Max Abs Error najmniejszy/największy błąd absolutny, wartość r -współczynnik korelacji. Analizując wyniki otrzymane przy użyciu I grupy parametrów można dojść do wniosku, iż pozwala ona stosunkowo dobrze oszacować wartość zużycia budynku. Szczególnie wyniki
otrzymane z wykorzystaniem sieci typu MLP cechują się niskimi wartościami wszystkich typów błędów. Parametry należące do II grupy pozwalają uzyskać wyniki o znacznym rozrzucie w stosunku do wartości porównawczych. Współczynnik korelacji dla sieci typu MLP i RBF pozostaje dla tych przykładów na stosunkowo wysokim poziomie (do 0,7755), dla sieci typu SVM przyjmuje już niskie wartości (do 0,4106). Parametry należące do III grupy w najmniejszym stopniu nadają się do szacowania wartości zużycia budynków. Otrzymywane wyniki przyjmują spłaszczone wartości, tzn. dla różnych wartości danych oryginalnych uzyskiwane są jednakowe lub podobne wartości wyjściowe z sieci. Mimo, iż współczynnik korelacji dla sieci typu MLP i RBF pozostaje wysoki to pozostałe typy błędów przyjmują znacząco większe wartości. Rys. 3. Porównanie wartości zużycia budynków z bazy danych i obliczonych przez najlepszą sieć Otrzymywane wyniki w poszczególnych próbach (po 15-100 symulacji w każdej), dla danych typów sieci i grup parametrów, co do wartości nie odbiegały od siebie w znaczącym stopniu. W wyniku poszukiwania optymalnych parametrów uczenia sieci uzyskiwano wyniki w niewielkim stopniu lepsze od wcześniejszych. Uzyskanie wyniku lepszego lub gorszego od innych w dużym stopniu uzależnione było od początkowego doboru wag i tego czy w procesie uczenia udało się osiągnąć minimum jak najbardziej zbliżone do minimum globalnego. 5. Analiza wrażliwości W kolejnym kroku prac dokonano analizy wrażliwości sieci na dobór parametrów z bazy danych. Do analizy wykorzystano I grupę parametrów i najlepszą topologię sieci uzyskaną w trakcie wcześniejszych prac. Przyjęto klasyczny algorytm analizy wrażliwości sieci na dobór parametrów z bazy danych: 1. przyjęcie dużej sieci wg wcześniej wytypowanego typu i architektury, uczenie, testowanie, określenie błędu wyników, 2. zmniejszanie sieci o 1 element, kolejno dla wszystkich i elementów, uczenie, testowanie, określenie błędu,
3. odrzucenie najmniej istotnych elementów poniżej pewnego progu, 4. odrzucanie kolejnych elementów (powtarzanie kroków 2 i 3) aż do uzyskania niewielkiego wektora wejść, 5. ustalenie parametrów dla których uzyskano zadowalające odpowiedzi sieci neuronowej. Przeprowadzone kolejne symulacje polegające na ograniczaniu liczby parametrów doprowadziły do uzyskania pięciu parametrów w najistotniejszy sposób wpływających na wynik oszacowania wartości zużycia technicznego budynku: stolarka okienna mieszkań, przewody inst. wody zimnej i ciepłej, pokrycie dachu, izolacja termiczna ścian osłonowych, izolacja termiczna ścian szczytowych Analizując wszystkie wyniki uznano, że sieć działająca na bazie pieciu parametrów może spełniać stawiane wymagania. Uzyskiwane wyniki w dużej mierze uzyskują dokładność 10% a nieliczne przekraczają 20%. Wyniki działania tej sieci w porównaniu do wyników otrzymanych metodą tradycyjną przedstawia rysunek 2. Rys. 4. Wyniki dla sieci bazującej na pięciu parametrach 6. Podsumowanie i wnioski Zaproponowana metoda szacowania wartości zużycia technicznego prefabrykowanych budynków mieszkalnych za pomocą sztucznych sieci neuronowych mogłaby być wykorzystywana efektywnie w zasadzie dla dużych zespołów budynków. Poważne awarie i uszkodzenia mogą być odkrywane jedynie bezpośrednio, w trakcie corocznych kontroli budynków i żadne metody teoretyczne ich nie zastąpią. Jednak dla uzyskania orientacyjnego poziomu odniesienia i przybliżonego oszacowania dla wielu zastosowań mogłaby to być metoda bardzo użyteczna. Należy w tym miejscu zauważyć, że obecnie wykonywane oszacowania zużycia budynków dla celów ubezpieczeniowych opierają się zazwyczaj na
metodach czasowych, które są znacznie mniej precyzyjne. Jedną z ważnych zalet metody jest obiektywizm, wyniki w małym stopniu zależą od subiektywnych ocen osób wykonujących przeglądy. Do komercyjnego wykorzystania metoda ta powinna zostać przystosowana głównie poprzez rozszerzenie typów budynków, rozszerzenie bazy danych, stworzenie komputerowych programów obsługi ułatwiających pracę. Analizując otrzymane wyniki można sformułować następujące wnioski: Sztuczne sieci neuronowe są efektywnym narzędziem szacowania zużycia technicznego prefabrykowanych budynków mieszkalnych. Najlepszy wynik oszacowania osiągnięto dla sieci typu Multilayer Perceptron o architekturze 10-4-1. Osiągnięty współczynnik korelacji równy 0.9873 należy uznać za wysoki a wartości błędów (np. MSE = 0.0003, MAE = 0.0136) za niskie. Przeprowadzone symulacje doboru różnych typów i topologii sieci dla trzech grup parametrów pozwoliły na wyłonienie grupy 10 parametrów na podstawie których możliwe jest szacowanie wartości zużycia budynków z dobrą dokładnością. Większość oszacowań zużycia wykonanych jest z dokładnością nieprzekraczającą 10%. Przeprowadzona analiza wrażliwości sieci na dobór parametrów z bazy danych pozwoliła dokonać wyboru grupy parametrów w najistotniejszy sposób wpływających na dokładność oszacowania. Zaproponowana metoda może znaleźć zastosowanie w praktyce inżynierskiej. 7. Literatura [1] Knyziak P.: Analiza stanu technicznego prefabrykowanych budynków mieszkalnych za pomocą sztucznych sieci neuronowych. Rozprawa doktorska. Wydział Inżynierii Lądowej, Politechnika Warszawska. 2007. [2] Knyziak P., Witkowski M.: Ocena stanu technicznego prefabrykowanych budynków mieszkalnych w Warszawie. Inżynieria i Budownictwo, 12/2007, s.639-641. [3] Lewicki B.: Metodyka oceny stanu technicznego konstrukcji budynków wielkopłytowych. Instytut Techniki Budowlanej, Warszawa 2002. [4] Runkiewicz L., Szymański J.: Uszkodzenia i zagrożenia występujące w budynkach mieszkalnych wielkopłytowych. V Konferencja Warsztat Pracy Rzeczoznawcy Budowlanego. Kielce 1999. [5] Thierry J.: Remonty budynków i wzmacnianie konstrukcji. Arkady. Warszawa 1982. [6] Waszczyszyn Z., Urbański P.: Neuronowa predykcja stopnia zużycia technicznego budynków mieszkalnych, XLVIII Konf. Naukowa KILiW PAN i KN PZITB, Opole- Krynica, 365-372, 2002. [7] Zużycie obiektów budowlanych. WACETOB, Warszawa 2000. ARTIFICIAL NEURONAL NETWORKS IN ESTIMATION OF THE TECHNICAL DETERIORATION FOR PREFABRICATED RESIDENTIAL BUILDINGS This paper presents the method of analysis of the technical deterioration of prefabricated buildings using artificial neural networks. The data ware analyzed using several different types and many topologies of the ANN. Optimal type and topology of the net ware chosen.
Analyze of sensitivity for data ware performed. Results received from traditional method and from ANN were compared.