SIECI NEURONOWE JAKO MODELE PROGNOZOWANIA U YCIA NARZ DZI W SYSTEMACH CAPP IZABELA ROJEK Uniwersytet Kazimierza Wielkiego w Bydgoszczy Streszczenie W referacie przedstawiono sieci neuronowe jako modele prognozowania u ycia narz dzi w systemach CAPP. Modele opracowano przy u yciu liniowej sieci neuronowej, sieci jednokierunkowej wielowarstwowej ze wsteczn propagacj bł du oraz sieci o radialnych funkcjach bazowych. Dokonano porównania tych modeli. Miar oceny modeli jest skuteczno przewidywania u ycia narz dzi w ró nych interwałach czasowych. Modele te s wykorzystane ju na etapie projektowania procesu technologicznego, w celu planowego wytworzenia wyrobów i aby nie doszło do przestoju z powodu braku narz dzi, szczególnie narz dzi specjalnych. Utworzone modele przetestowano na danych rzeczywistych z przedsi biorstwa produkcyjnego. Słowa kluczowe: sie neuronowa, model predykcji, narz dzie 1. Wst p Współcze nie systemy komputerowego wspomagania projektowania procesów technologicznych (systemy CAPP) coraz cz ciej zawieraj metody sztucznej inteligencji wspomagaj ce projektowanie procesu technologicznego. W trakcie projektowania procesu technologicznego bardzo wa nym etapem jest dobór narz dzi, ze wzgl du na du ró norodno mo liwo ci doboru w trakcie samego projektowania, jak i w sytuacjach zmiany narz dzi w trakcie procesu wytwarzania. Na tym etapie staje si niezb dne do wiadczenie technologa. W celu polepszenia doboru narz dzi do operacji technologicznej opracowano: baz danych, wykorzystywan do opracowania modeli i metod inteligentnego wspomagania, model doboru narz dzi do operacji technologicznych, model przewidywania u ycia narz dzi w ró nych interwałach czasowych, model preferencji technologa w doborze narz dzi. W celu zapewnienia zrealizowania planu produkcji niezb dne w systemach CAPP jest opracowanie modeli przewidywania u ycia narz dzi w ró nych interwałach czasowych. Te modele s wykorzystane ju na etapie projektowania procesu technologicznego, aby w odpowiednim czasie zostały wytworzone wyroby i nie doszło do przestoju z powodu braku narz dzi, szczególnie narz dzi specjalnych. Miar oceny modeli jest skuteczno przewidywania u ycia narz dzi w ró nych interwałach czasowych. Utworzone modele przetestowano na danych rzeczywistych z przedsi biorstwa produkcyjnego. Opracowane modele mog by szczególnie przydatne i wa ne dla przedsi biorstw charakteryzuj cych si produkcj jednostkow, o bardzo małej powtarzalno ci oraz bardzo du ej precyzji wykonania.
226 Sieci neuronowe jako modele przewidywania u ycia narz dzi w systemach CAPP 2. Sie neuronowa jako model prognostyczny Sieci neuronowe zwracaj na wyj ciu warto ci ci głe, dlatego znakomicie nadaj si do szacowania i przewidywania. Sieci takie mog analizowa jednocze nie wiele zmiennych. Mo liwe jest stworzenie modelu, nawet gdy rozwi zanie ma du zło ono. Wadami sieci neuronowych jest trudno w ustaleniu parametrów architektury, wpadanie w minima lokalne, długi czas uczenia si sieci i brak jasnej interpretacji [1,2]. Do budowy modelu prognostycznego zastosowano liniow sie neuronow (sie L), sie jednokierunkow wielowarstwow ze wsteczn propagacj bł du (sie MLP) oraz sie o radialnych funkcjach bazowych (sie RBF). Sie liniowa jest reprezentowana przez sie, która nie posiada warstw ukrytych, za znajduj ce si w warstwie wyj ciowej neurony s w pełni liniowe (tzn. s to neurony, w których ł czne pobudzenie wyznaczane jest jako liniowa kombinacja warto ci wej ciowych i które posiadaj liniow funkcj aktywacji). W sieci neuronowej jednokierunkowej wielowarstwowej ze wsteczn propagacj bł du dobór liczby neuronów w warstwie wej ciowej jest uwarunkowany wymiarem wektora danych x. Model neuronu składa si z elementu sumacyjnego, do którego dochodz sygnały wej ciowe x 1, x 2,..., x N, tworz ce wektor wej ciowy x = [x 1, x 2,..., x N ] T pomno one przez przyporz dkowane im wagi w i1, w i2,..., w in tworz ce wektor wag i-tego neuronu w i = [w i1, w i2,..., w in ] T oraz warto w i0 zwan progiem. Sygnał wyj ciowy sumatora oznaczono u i (1), przy czym sygnał u = w x + w (1) jest podawany na blok realizuj cy nieliniow funkcj aktywacji f(u i ). Najcz ciej funkcja ta przyjmuje posta sigmoidaln lub tangensa hiperbolicznego. Posta funkcji stanowi ci głe przybli- enie funkcji skokowej, przy której sygnał wyj ciowy neuronu y i przyjmuje dowolne warto ci z przedziału [0,1] dla funkcji unipolarnej. Funkcja sigmoidalna unipolarna (2) to: f u i ( u) ij 1 = 1 + exp j i0 ( β u). (2) Parametr β pozwala regulowa pochyło sigmoidy, co bywa bardzo u yteczne. Sie o radialnych funkcjach bazowych (ang. Radial Basis Function RBF) nale y do grupy sieci warstwowych jednokierunkowych. Podstawowa ró nica w stosunku do prezentowanego perceptronu wielowarstwowego le y w warstwie ukrytej, która jest w tym przypadku jedna, a neurony tej warstwy maj zaimplementowane jako funkcje aktywacji funkcje radialne. Najcz ciej jest to funkcja Gaussa. Sieci radialne składaj si z neuronów, których funkcje aktywacji realizuj odwzorowanie (3): n x ϕ( x c ), x R, (3) gdzie ( ) oznacza norm euklidesow. Funkcje ϕ ( x c ) nazywa si radialnymi funkcjami bazowymi. Ich warto ci zmieniaj si radialnie wokół centrum c.
POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 27, 2010 227 Sieci RBF posiadaj kilka zalet w porównaniu z sieciami typu MLP. Po pierwsze, jak ju wcze niej stwierdzono, mog one modelowa dowoln funkcj nieliniow za pomoc pojedynczej warstwy ukrytej, przez co eliminuje si konieczno podejmowania na etapie projektowania decyzji dotycz cej liczby warstw. Po drugie prosta transformacja liniowa dokonywana w warstwie wyj ciowej mo e by w cało ci zoptymalizowana przy u yciu tradycyjnych technik modelowania liniowego, które s szybkie i przy ich stosowaniu nie pojawiaj si takie problemy jak minima lokalne, które wyst puj w uczeniu sieci MLP. Z tego powodu sieci RBF mog by uczone w bardzo krótkim czasie (ró nica w szybko ci uczenia dotyczy rz dów wielko ci). 3. Modele przewidywania u ycia narz dzi w ró nych interwałach czasowych Współcze nie w przedsi biorstwach produkcyjnych u ycie narz dzi kontroluje si bardzo ogólnie. Co okre lony czas sprawdzane s stany narz dzi w narz dziowniach przedsi biorstwa. Natomiast opracowane modele pozwol przewidywa zapotrzebowanie na okre lone narz dzia w ró nych interwałach czasowych i szybciej reagowa na braki narz dzi w przedsi biorstwie, co zapobiegnie przestojom produkcji i przez to równie wzrostowi kosztów produkcji. Modele przewidywania u ycia narz dzi w ró nych interwałach czasowych zostały opracowane jako modele predykcji. Przygotowanie danych dla modeli predykcyjnych Eksperymenty zostały przeprowadzone dla wybranych narz dzi obróbczych: frezów, no y tokarskich i ciernic. Do opracowania modeli u yto sieci neuronowych (liniowej L, MLP, RBF). Modele predykcji zostały opracowane dla przewidywanego u ycia narz dzi w ró nych interwałach czasowych, takich jak: godziny, dni, tygodnie i miesi ce. Modele zostały nauczone poprawnego przewidywania na podstawie danych rzeczywistych w postaci przykładów u ycia narz dzi do obróbki. Ka dy model był testowany pod k tem prawidłowej predykcji. Wykonana została analiza i porównanie modeli. Modele predykcji pozwoliły na przewidywanie, jakie narz dzia, do jakich operacji technologicznych były wykorzystywane najcz ciej oraz w jakim czasie. Tego typu modele pozwalaj na bie ce sprawdzanie dost pno ci narz dzi w narz dziowni oraz na generowanie zamówie zakupu narz dzi brakuj cych. W celu utworzenia modeli predykcji w postaci sieci neuronowych przygotowano plik ucz cy i testuj cy. Plik ucz cy zawierał około 100 przykładów, a plik testowy około 12. Dane s pogrupowane według dnia, miesi ca, czasu u ycia narz dzia (tabela 1). Znaj c model obiektu, nale y okre li jego zachowanie dla ró nych wymusze pojawiaj cych si na wej ciu tego obiektu. Interesuj ce jest okre lenie przyszłego stanu obiektu dla czasu t + n, gdzie n stanowi horyzont prognozy, t zawiera histori zmian wej cia do chwili bie cej. Horyzont prognozy n = 1 oznacza 1 dzie. W celu zbudowania ci gów czasowych, które dalej s wykorzystywane w modelu predykcyjnym zostały dodane warto ci czasu u ycia narz dzia sprzed chwili t (t 1, t 2,, t 7) i po t (t + 1). Badania przeprowadzono równie dla warto ci sprzed t (t 30) i po t (t + 1) oznaczaj cych prognoz na miesi c, które potwierdziły poprawno modeli.
228 Sieci neuronowe jako modele przewidywania u ycia narz dzi w systemach CAPP Tabela 1. Fragment pliku ucz cego [3] Wej cie Wyj cie Czas pracy narz dzia w chwili Dzie Miesi c t 7 t 6 t 5 t 4 t 3 t 2 t 1 t t + 1 1 2 30 26 45 12 34 23 45 67 11 2 2 26 45 12 34 23 45 67 11 66 3 2 45 12 34 23 45 67 11 66 34 4 2 12 34 23 45 67 11 66 34 76 5 2 34 23 45 67 11 66 34 76 23 ródło: Badania własne. Ocena modeli predykcji Jako ciowej oceny neuronowych modeli predykcyjnych mo na dokona, porównuj c wykresy: rzeczywisty i prognozowany. Jest to cz sto spotykana w literaturze metoda prezentacji wyników bada. Jednak dopiero ilo ciowe metody oceny modeli neuronowych umo liwiaj formułowanie bardziej obiektywnych wniosków. Zasadniczo ocen modeli neuronowych przeprowadza si dwuetapowo. W pierwszej fazie, po skonstruowaniu nauczonych sieci, do ich oceny zalecane s tzw. statystyki regresyjne. Do statystyk regresyjnych, słu cych do oceny modeli, po nauczeniu sieci, nale m.in. nast puj ce metody oceny [4]: rednia (arytmetyczna) wyznaczona na podstawie rzeczywistych warto ci prognozowanej wielko ci, odchylenie standardowe, obliczone dla rzeczywistych danych, redni bł d przeci tna warto ró nic mi dzy warto ciami prognozowanymi i rzeczywistymi, standardowe odchylenie bł dów dla zmiennej prognozowanej, redni bł d bezwzgl dny ( rednia z warto ci bezwzgl dnych ró nic, warto ci przewidywanych przez model oraz warto ci rzeczywistych). iloraz odchyle standardowych iloraz standardowego odchylenia bł dów i odchylenia stan- dardowego rzeczywistych danych (obu parametrów okre lonych wy ej), korelacja (wła ciwie standardowy współczynnik korelacji Pearsona r) wyznaczony dla warto ci rzeczywistych i warto ci przewidywanych. Najwi ksze znaczenie dla oceny jako ci modeli neuronowych maj : iloraz odchy1e standardowych oraz korelacja warto ci rzeczywistych i prognozowanych [5]. Ten pierwszy parametr dla stworzonych modeli powinien przyjmowa warto ci rz du 0,1 0,2. Iloraz odchy1e o warto ci bliskiej zeru wiadczy o dobrej jako ci opracowanego modelu. Je eli jest on wi kszy od jedno ci (lub jej bliski), to zaprojektowany model mo na odrzuci. Trudno jednoznacznie okre li poprawno modelu, je li iloraz odchyle mie ci si w przedziale: 0,3 0,7. Ostatecznie jako modelu zale y od uzyskanych bł dów ex post, a ci lej mówi c, czy s one do zaakceptowana w danym przypadku. Korelacja warto ci rzeczywistych i prognozowanych przyjmuje warto ci z przedziału od 0 do 1. Najlepiej jest, gdy jest ona zbli ona do jedno ci (im bli ej, tym lepiej). W drugiej fazie, po nauczeniu sieci, przeprowadza si proces prognozowania. Uzyskuje si oprócz warto ci rzeczywistych, tak e predykcje zmiennej wyj ciowej modelu. Pozwala to na wy-
POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 27, 2010 229 znaczenie bł dów ex post. Do wyliczenia bł dów typu ex post nale y dysponowa parami warto- ci: rzeczywistych i wyznaczonych za pomoc danego modelu. Do najcz ciej stosowanych miar jako ci modeli neuronowych mo na zaliczy : sum kwadratów reszt, bł d redniokwadratowy oraz pierwiastek bł du redniokwadratowego [6]. Okre lone w ten sposób miary jako ci bł dów predykcyjnych modeli neuronowych zostały wykorzystane w fazie eksperymentów. Warto ci pierwiastka bł dów redniokwadratowych uczenia i testowania zostały przedstawione przy opracowanych modelach. Został wybrany model o najmniejszym bł dzie RMS oraz wska niku liczby wzorców poza tolerancj. Wyniki uzyskane z modeli predykcyjnych zostały porównane równie z rzeczywistymi warto ciami u ycia narz dzi w przewidywanych przedziałach czasu. Sieci neuronowe jako modele prognozowania Model sieci MLP do prognozowania Jako pierwszy zastosowano model sieci neuronowej jednokierunkowej, wielowarstwowej ze wsteczn propagacj bł du. Zbudowane zostały ró ne modele sieci neuronowej. Przetestowano struktury z dwoma wej- ciami i jednym wyj ciem oraz warstw ukryt zawieraj c 5, 10 lub 15 neuronów. Te struktury uczono z ró nymi warunkami ko cz cymi proces uczenia, tzn. koniec uczenia nast pił po osi gni ciu liczby epok 1000, 10 000 lub 100 000. Porównano dla wszystkich kombinacji bł d RMS. Najbardziej dokładnym modelem okazała si sie neuronowa o strukturze 8-15-1, przy zako czeniu uczenia przy warto ci 10 000 epok. Potwierdziły to otrzymane wyniki dla nowych warto ci wej ciowych. Po opracowaniu modelu sieci neuronowej dokonano jego oceny jako modelu prognostycznego. Ewaluacja ocena modelu neuronowego Model prognostyczny wykonany został etapami. Etapy procedury prognostycznej s nast puj ce: obserwacja procesu w postaci ci gu czasowego, utworzenie modelu obserwowanego ci gu, przekształcenie modelu ci gu czasowego do postaci umo liwiaj cej prognoz (budowa algorytmu predykcji). Do prognozy czasu pracy narz dzia wybrano tryb prognoz jednoseryjnych dla modeli ci gów czasowych. Pierwszy etap to przedstawienie ci gu czasowego zawieraj cego dane dotycz ce czasu pracy narz dzia. Nast pnie został u yty model sieci neuronowej do prognozowania u ycia narz dzia. Ocena dokładno ci prognozy mo liwa jest w trybie testowania. W trybie tym pewn cz wej ciowego ci gu czasowego wył czamy ze zbioru, przy pomocy którego identyfikowane s parametry modelu. Tryb testowania wykazał dobre dopasowanie modelu dla danych historycznych, na podstawie których wykonywana jest prognoza. Kolejny etap bada obejmuje modele predykcyjne do przewidywania u ycia narz dzi opracowane przy pomocy innych typów sieci neuronowych oraz analiza przydatno ci ró nych typów sieci do budowania modeli predykcyjnych. Model liniowej sieci neuronowej do prognozowania Podobne badania wykonano dla sieci liniowej. Najbardziej dokładnym modelem okazała si sie neuronowa o strukturze 8-1, przy zako czeniu uczenia przy warto ci 10 000 epok. Potwierdzi-
230 Sieci neuronowe jako modele przewidywania u ycia narz dzi w systemach CAPP ły to otrzymane wyniki dla nowych warto ci wej ciowych. Jednak jest to model du o gorszy od modelu opracowanego przy u yciu sieci MLP. Model sieci RBF do prognozowania W tabeli 2 pokazano parametry modeli predykcji z u yciem sieci o radialnych funkcjach bazowych (RBF). Typ sieci Jako uczenia Tabela 2. Parametry sieci RBF Jako testowania Bł d uczenia Bł d testowania Liczba wej Liczba neuronów w warstwie ukrytej RBF 8-7-1 0,9295 0,9089 0,2159 0,4218 8 7 RBF 8-9-1 0,9308 0,9115 0,2127 0,4140 8 9 RBF 8-15-1 0,9602 0,9421 0,1832 0,3585 8 15 RBF 8-20-1 0,9895 0,9687 0,1563 0,3213 8 20 ródło: Badania własne. Na rysunku 1 pokazano predykcj szeregu ródłowego i predykcj z sieci RBF. Porównanie prostych modeli prognostycznych W tabeli 3 przedstawiono porównanie modeli prognostycznych przy u yciu sieci neuronowych liniowych, sieci MLP oraz sieci RBF. Przetestowano te modele dla wybranych narz dzi obróbczych. Nie zauwa ono potrzeby ró nicowania modeli wzgl dem ró nych narz dzi. Najbardziej dokładnym modelem okazał si model oparty na sieci RBF. Predykcja szeregu ródłowego Predykcja z sieci RBF Czas pracy narz dzia [min] 250 200 150 100 50 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Dni Rysunek 1. Prognoza przy u yciu sieci neuronowej RBF ródło: Badania własne.
POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 27, 2010 231 Tabela 3. Porównanie modeli prognostycznych przy u yciu sieci neuronowych liniowych, MLP oraz RBF Typ sieci Jako uczenia Jako testowania Bł d uczenia Bł d testowania Liczba wej Liczba neuronów w warstwie ukrytej MLP 8-15-1 0,9312 0,9156 0,1599 0,3786 8 15 Liniowa 8-1 0,6489 0,6325 0,5581 0,5943 8 0 RBF 8-20-1 0,9895 0,9687 0,1563 0,3213 8 20 ródło: Badania własne. 4. Podsumowanie Zastosowanie sieci neuronowych we wspomaganiu projektowania procesów technologicznych, szczególnie w przewidywaniu u ycia narz dzi w okre lonych interwałach czasowych wprowadziło now jako do systemów CAPP oraz mo e sta si podstaw algorytmizacji nowych systemów zwanych inteligentnymi. Wykorzystanie metod sztucznej inteligencji umo liwia utworzenie systemu wspomagania, który w sposób automatyczny pozyskuje wiedz i ma wła ciwo adaptacji. Jest to szczególnie wa ne przy opracowywaniu systemu dla zło onych systemów rzeczywistych, w których nast puj ci głe zmiany i jedne podprocesy zale od innych oraz wiele czynników zale y jeden od drugiego i ka da zmiana powoduje zmiany kolejne. Korzy ci ze stosowania metod sztucznej inteligencji wielokrotnie przekraczaj pracochłonno ich tworzenia. W rzeczywisto ci najdłu szym etapem procesu ich tworzenia jest zgromadzenie i przygotowanie danych ródłowych, chocia poprzez automatyczne gromadzenie danych równie ten etap ulega skróceniu. Modele przewidywania u ycia narz dzi s wykorzystane ju na etapie projektowania procesu technologicznego, aby w odpowiednim czasie zostały wytworzone wyroby i nie doszło do przestoju z powodu braku narz dzi, szczególnie narz dzi specjalnych. Bibliografia [1] Grzeszczyk T. A., Sztuczna inteligencja we wspomaganiu procesu prognozowania w przedsi biorstwie, StatSoft Polska, s. 91 105, Kraków, 2005. [2] Krawiec K., Stefanowski J., Uczenie maszynowe i sieci neuronowe, wydawnictwo Politechniki Pozna skiej, Pozna, 2004. [3] Lula P., Ocena modeli neuronowych wykorzystywanych w zagadnieniach modelowania i prognozowania, w: Jajuga K., Walesiak M. (red.), Klasyfikacja i analiza danych teoria i zastosowania, Prace Naukowe Akademii Ekonomicznej, Nr 874, Taksonomia 7, s. 129 138, Wrocław, 2000. [4] Rojek I., Wspomaganie procesów podejmowania decyzji i sterowania w systemach o ró nej skali zło ono ci z udziałem metod sztucznej inteligencji, wydawnictwo UKW, Bydgoszcz, 2010. [5] Rutkowski L., Metody i techniki sztucznej inteligencji, Inteligencja obliczeniowa, Wydawnictwa Naukowe PWN, Warszawa, 2005.
232 Sieci neuronowe jako modele przewidywania u ycia narz dzi w systemach CAPP [6] Tadeusiewicz R., Lula P., Statistica Neural Networks 4.0 PL: Wprowadzenie do sieci neuronowych, StatSoft Polska, Kraków, 2001. NEURAL NETWORKS AS FORECASTING MODELS OF TOOL USE IN CAPP SYSTEMS Summary In the paper the neural networks were presented as the forecasting models of tool use in CAPP systems. The models were worked out by use linear neural networks, multi-layer networks with error back propagation and Radial Basis Function networks. The comparison of these models was executed. The effectiveness of forecasting of tool use in different time intervals is the measure of model evaluation. These models are used on the stage of design of manufacturing process in aim planned producing products and that it did not come to standstill with reason of lack of tools, particularly special tools. Created models were tested on real data from the enterprise. Keywords: neural network, forecasting model, tool Instytut Mechaniki rodowiska i Informatyki Stosowanej Uniwersytet Kazimierza Wielkiego ul. Chodkiewicza 30, 85-064 Bydgoszcz e-mail: izarojek@ukw.edu.pl