18/8 ARCHIWUM ODLEWNICTWA Rok 2003, Rocznik 3, Nr 8 Archives of Foundry Year 2003, Volume 3, Book 8 PAN - Katowice PL ISSN 1642-5308 SYSTEMY MONITORUJĄCE I STERUJĄCE PRODUKCJĄ W ODLEWNI WYKORZYSTUJĄCE SZTUCZNE SIECI NEU- RONOWE M. PERZYK 1, A. KOCHAŃSKI 2, J. KOZŁOWSKI 3 Instytut Technologii Materiałowych Politechniki Warszawskiej Narbutta 85, 02-524 Warszawa STRESZCZENIE Przedstawiono zastosowania sztucznych sieci neuronowych do modelowania jakości procesów produkcyjnych oraz wykrywania zakłóceń procesów ciągłych. Omówiono metody określania istotności sygnałów wejściowych. Podano przykłady zastos o- wań w przemyśle odlewniczym. Key words: artificial neural networks, production processes, foundry, quality models, fault detection, relative importance factors 1. WSTĘP Sztuczne sieci neuronowe (SSN) stanowią nowoczesną metodę matematycznego modelowania zjawisk i procesów, która w ostatnich kilkunastu latach zrobiła wielką karierę w różnych dziedzinach działalności ludzkiej. Powody stosowania SSN w nauce i technice są następujące. Z jednej strony modelowanie wszystkich procesów fizyc z- nych, chemicznych i innych składających się na dany proces, z wykorzystaniem równań odzwierciedlających ich naturę, jest często niemożliwe lub nierealne. Z drugiej zaś sieci neuronowe służą do modelowania procesów typu czarna skrzynka, tj. o nieokreślonej naturze fizycznej, pozwalając na znalezienie prawidłowości w warunkach dużej liczby zmiennych o różnym charakterze, w tym określonych nieprecyzyjnie. Prawidłowości takie są często niewykrywalne przez zmysły ludzkie i inne metody matematyczne. 1 prof. dr hab. inż., e-mail: M.Perzyk@wip.pw.edu.pl 2 dr inż., e-mail: akochans@wip.pw.edu.pl 3 mgr inż. e-mail: jkozlows@wp.pl 157
SSN stanowi związek między wieloma zmiennymi wejściowymi X 1, X 2,..., a jedną lub więcej wielkościami wynikowymi (wyjściowymi) Y 1, Y 2,..., który można zapisać w ogólnej postaci: Y 1 = f 1 (X 1, X 2, X 3,...) Y 2 = f 2 (X 1, X 2, X 3,...) (1)...... Funkcje f 1, f 2,... można zapisać za pomocą jedynie czterech działań podstawowych oraz, najczęściej, jednej elementarnej funkcji nieliniowej typu wykładniczego. Istota modelu typu SSN polega na tym, że struktura tych zależności naśladuje strukturę kory mózgowej ssaków, w tym ludzi i może być zilustrowana w postaci sieci, zawierającej węzły, zwane neuronami oraz ich połączenia, zwane synapsami. Synapsy nie tylko przekazują wartości sygnałów między neuronami, ale także zawierają in formacje o wagach tych sygnałów, czyli stałych współczynnikach równań (1). Węzły sieci neurony stanowią symbole odpowiadające powtarzającym się w tych równaniach działaniom; najczęściej jest to sumowanie iloczynów wartości wszystkich sygnałów przekazywanych do danego neuronu przez wagi odpowiednich synaps, a następnie nieliniowe przekształcenie tak otrzymanej sumy. Drugą cechą modelu typu SSN, nawiązującą do naśladowania procesów natura l- nych, jest sposób, w jaki znajdowane są wspomniane współczynniki równań (1), czyli zbiór wag sieci. Zazwyczaj startuje się od wartości ustalonych losowo, a następnie wielokrotnie koryguje się je w procesie zwanym uczeniem sieci. Najczęściej korekty te oblicza się na podstawie różnicy pomiędzy wartościami wyjściowymi Y 1, Y 2,..., obliczanymi przez sieć, a tymi, które są znane, np. zaobserwowane w doświadczeniu. Poprzez wielokrotne modyfikacje wag otrzymuje się sieć nauczoną, zdolną do przewidywania wartości wielkości wyjściowych dla innych wartości wejściowych innych niż te, na których siec się nauczyła. Istnieje wiele typów sieci, sposobów ich uczenia oraz rodzajów zadań, jakie mogą one realizować, opisanych w bogatej literaturze. W naszej dziedzinie techniki najczęs t- szym przypadkiem jest przybliżanie zależności między jedną lub kilkoma wielkościami wejściowymi oraz jedna lub kilkoma wielkościami wynikowymi, czyli szeroko rozumiana aproksymacja funkcji. W niniejszym artykule przedstawione zostaną niektóre możliwe i dotychczas zrealizowane zastosowania SSN w przemyśle odlewniczym oraz związane z nimi problemy. 158
ARCHIWUM ODLEWNICTWA 2. MODELOWANIE JAKOŚCI WYROBÓW WYNIKAJĄCEJ Z PARAMET- RÓW PROCESU TECHNOLOGICZNEGO W odlewni mają miejsce różnego typu procesy wytwórcze, co wyróżnia tę tec h- nologię spośród innych metod wytwarzania spotykanych w przemyśle, w których materiału wyrobu nie wytwarza się, lecz jedynie przetwarza, zaś do nadawania kształtu służą narzędzia wielokrotnego użytku. W odlewnictwie, oprócz wytwarzania zasadn iczych wyrobów odlewów niezbędne jest, równoległe do produkcji zasadniczej, wytwarzanie materiałów (procesy wytopu oraz przerób mas formierskich) oraz produkcja form i rdzeni jednorazowych, a więc także wyrobów kształtowych wykonywanych z zupełnie innego typu materiałów niż wyroby zasadnicze. We wszystkich tych procesach istotne jest znalezienie relacji między parametrami procesu oraz własnościami i ilościami użytych materiałów z jednej strony, a parametrami jakościowymi wyrobów z drugiej, czyli modele ich jakości (rys. 1). Dodatki odświeżające (ilość i jakość) Własności masy zwrotnej Parametry i zakłócenia procesu przerobu masy Przerób masy formierskiej Własności masy świeżej Parametry i zakłócenia procesu f ormowania Materiały wsadowe (ilość i jakość) Parametry i zakłócenia procesu wy topu Formowanie Wytop Jakość f ormy Parametry i zakłócenia procesu wy konania odlewu Czas Warunki otoczenia Jakość ciekłego metalu Wykonanie odlewu Parametry jakości odlewu Rys. 1. Modele jakości procesów wytwórczych w typowej odlewni Fig. 1. Quality models of manufacturing processes in a typical foundry 159
Z uwagi na złożoną i często niewyjaśnioną naturę fizyczną tych procesów modele te można budować z wykorzystaniem SSN, podobnie jak czyni się to w przypadku innych procesów technologicznych, np. obróbki skrawaniem [1]. Dotychczasowe, znane aut o- rom, przykłady zastosowań sieci do modelowania jakości procesów występujących w odlewni obejmują takie zagadnienia jak wytop żeliwa, przerób mas formierskich, powstawanie wady porowatości gazowej w odlewach staliwnych oraz odlewanie ciśnieniowe [2,3,4]. We wszystkich tych pracach osiągnięto dobre rezultaty. Stosując SSN jako model jakości wyrobu należy przeanalizować kilka istotnych elementów. Po pierwsze niezbędne jest ustalenie listy parametrów (sygnałów), które mogą mieć istotny związek z jakością wyrobu. Po drugie należy określić, w jaki sposób tworzony będzie zbiór uczący dla SSN, a więc w jaki sposób zostaną zidentyfikowane parametry procesu i materiały zastosowane w przypadku wyrobu o danych parametrach jakościowych. Tego typu powiązania nie zawsze są dostępne na podstawie istniejącej dokumentacji; typowym przykładem jest brak powiązania informacji o własnościach masy formierskiej z przypadkami występowania w odlewach wady typu zapiaszczenie. Ważną sprawą jest zdecydowanie, które wielkości traktowane będą jako sygnały wejściowe, a które jako wyjściowe (wynikowe). Naturalne wydaje się przyjęcie własn o- ści surowców i parametrów procesu jako wejść sieci neuronowej, zaś własności wyrobu jako wyjścia. Rys. 2. Okno optymalizacji wielkości wejściowych na podstawie nauczonej sieci neuronowej, modelującej zależność między składem chemicznym kąpieli, a własnościami mechanicznymi żeliwa sferoidalnego Fig. 2. Software window used for optimization of input values of trained neural network, modeling relationships between melt chemical composition and mechanical properties of SG cast iron 160
ARCHIWUM ODLEWNICTWA Tego typu podejście umożliwia symulację procesu (przewidywanie własności wyrobu) w konkretnej sytuacji, jednakże nie daje bezpośredniej wskazówki, jak dobrać parametry procesu czy ilości określonych surowców dla uzyskania wyrobu o żądanych parametrach. Z tego względu często stosuje się uczenie sieci w innym układzie, gdzie wielkościami wejściowymi (niezależnymi) będą własności wyrobu (traktowane przy zapytaniu sieci jako pożądane), zaś wynikowymi np. ilości potrzebnych surowców albo p arametry procesu, które należy zastosować. Tego typu podejście może być stosowane np. do określania ilości potrzebnych dodatków odświeżających do mas formierskich w sytuacji znanych własności oraz składu masy znajdującej się aktualnie w obiegu [4,5]. Należy jednak zwrócić uwagę, że nie zawsze takie odwrócenie zagadnienia jest uzasadnione, gdyż nie zawsze w pełnym zakresie możemy wpływać na wszystkie parametry procesu lub własności i ilości użytych surowców i dostosować je do wartości wskazanych przez sieć. Typowym przykładem wydają się być procesy wytopu, gdzie w danej sytuacji wpływ np. na skład chemiczny kąpieli jest na ogół ograniczony i to w różny sposób, w zależności od użytych materiałów wsadowych. W tego typu przypadkach bezpiec z- niejsze wydaje się stworzenie sieci w pierwszym wariancie, zaś dla uzyskania informacji o pożądanych dodatkach lub parametrach procesu przeprowadzić wielokrotną symulację (odpytywanie sieci). Niektóre programy komputerowe umożliwiają optymalizację wartości wybranych sygnałów wejściowych SSN w wybranych przez użytkownika zakresach dla uzyskania pożądanego wyniku. Przykładem może być oprogramowanie stworzone w Politechnice Warszawskiej [6], którego okno dialogowe pokazano na rys. 2. 3. DIAGNOS TYKA ZAKŁÓCEŃ PROCESÓW CIĄGŁYCH W odlewni wiele procesów można traktować jako ciągłe, czyli takie, których p a- rametry powinny być utrzymywane na ustalonym poziomie w dłuższym przedziale czasu. Przykładami mogą być zarówno procesy przerobu masy formierskiej, jak i każdy inny proces związany z produkcją w długich seriach, np. wytop jednego gatunku stopu, formowanie lub odlewanie dla jednego asortymentu odlewów itp. Wykrywanie i ident y- fikacja przyczyn zakłóceń takich procesów obejmuje dwa etapy działań. Pierwszy polega na wykryciu i ocenie stopnia rozregulowania się procesu, na podstawie wzrostu lub spadku jego niektórych parametrów (np. temperatury, własności wyrobu itp.). W tym zakresie typowym narzędziem matematycznym są metody statystycznego sterowania procesem (znane często pod angielskim skrótem SPC) jednakże możliwe i obiecujące jest wykorzystanie w tym celu także modelu sieci neuronowej. Drugim etapem działań jest identyfikacja przyczyn rozregulowania, która w tradycyjnym postępowaniu dokonywana jest przez analizę sytuacji, zazwyczaj wykonywana przez zespoły kadry tec h- nicznej zakładu. Poniżej zostanie przedstawiona metodyka stosowania SSN do diagnostyki zakłóceń procesów ciągłych w obu przedstawionych powyżej etapach wg [7]. Aby właściwie ocenić istotność ewentualnych zmian (tendencji w parametrach procesu należy ustalić dla tego procesu wielkość tzw. okna czasowego, czyli liczbę 161
ostatnich pomiarów uwzględnianych w analizie. Zbyt mała ich liczba może spowod o- wać przedwczesne alarmy, zaś zbyt wielka opóźnienie w reakcji na zakłócenia. Zasada wykorzystania sieci neuronowej jest następująca. Budowana jest sieć zawierająca L wejść, gdzie L równe jest przyjętej liczbie pomiarów w oknie czasowym oraz trzy wyjścia y 1 (odpowiadające za narastanie sygnału), y 2 (odpowiadające za jego stałość) i y 3 (odpowiadające za spadek). Sieć uczona jest na sztucznie stworzonych zestawach danych, w których występują wartości L sygnałów wejściowych jedynie o trzech różnych zestawach wzorcowych: rosnący liniowo od 1 do +1, stały (równy zeru) oraz malejący od +1 do 1. W przypadku pierwszym y 1 ustalane jest jako równe 1, zaś y 2 i y 3 równe 0 (sygnał maksymalnie narasta), w drugim y 2 = 1, y 1 i y 3 równe 0 (sygnał stały), zaś w trzecim y 3 = 1, y 1 i y 2 równe 0 (sygnał maksymalnie maleje). Tak nauczona sieć potrafi przypisać w każdym konkretnym przypadku danych rzeczywistych określonemu zbiorowi ostatnich L sygnałów trójkę liczb określającą stopień wzrostu, stałości lub spadku sygnału (np. wartości 0,72; -0,01; 0,12 oznaczać będą dość wyraźny wzrost). Zasada wykorzystania sieci w drugim etapie diagnostyki zakłóceń procesu, tj. w celu wykrycia przyczyny jego rozregulowania, jest podobna, jak w przypadku mod e- lowania opisanego w rozdziale 1. Sieć musi zostać nauczona na zbiorach danych zebranych w zakładzie, przy czym wielkościami wejściowymi będą przetworzone do postaci trójek liczb sygnały o zmianach parametrów w okienku czasowym, zaś wielkościami wyjściowymi informacje o stwierdzonych rzeczywistych przyczynach zakłócenia, jakie zidentyfikowano być może zbyt późno w przeszłości. 4. WYKORZYSTANIE NAUCZONEJ SIECI NEURONOWEJ DO POSZERZA- NIA WIEDZY O PROCESACH Nauczona sieć neuronowa może zawierać istotne informacje, wynikające z uogó l- nionych relacji między sygnałami, które mogą być przydatne dla wzbogacenia wiedzy o modelowanym procesie. Metody generowania takiej wiedzy, np. w postaci reguł typu ekspertowego, są aktualnym przedmiotem badań prowadzonych na świecie. W toku prac aplikacyjnych SSN, prowadzonych przez autorów niniejszego artykułu, pierwszoplanowe okazało się znajdowanie istotności poszczególnych sygnałów wejściowych, czyli określanie stopnia wpływu, jaki wywierają one na dany sygnał wyjściowy, z uwzględnieniem ewentualnego synergicznego (wspomagającego się) działania niektórych z nich. Określenie takich istotności może być użyteczne m.in. w przypadku użycia sieci do wykrywania przyczyn zakłóceń procesów ciągłych, omówionego w rozdz. 3. Konkretnym przykładem tego typu zagadnienia może być zastosowanie SSN do wykrywania przyczyn pojawiania się wad w wyrobach: spośród wielu czynników potencjalnie związanych z wadą, aktualną przyczyną powinien być ten parametr (lub ich zespół), którego istotność w sieci modelującej relacje między tymi parametrami a stopniem wystąpienia wady była największa [3]. Wydaje się, że trudności z uzyskiwaniem tego typu informacji z nauczonej sieci neuronowej wynikają m. in. z podstawowych cech SSN. Model sieci neuronowej nie 162
ARCHIWUM ODLEWNICTWA jest modelem jednoznacznym, gdyż dane zagadnienie może być opisane przez sieci o różnej konfiguracji, a ponadto uczone na różnych danych. Ponadto proces uczenia prowadzi na ogół do lokalnych minimów błędu sieci, czyli sieć uczy się za każdym razem inaczej. Autorzy niniejszej pracy podjęli badania nad metodami efektywnego określania istotności sygnałów wejściowych, w dalszej perspektywie z uwzględnieniem wsp o- mnianych efektów synergii. Przyjęta metodyka uwzględnia badania z wykorzystaniem zarówno rzeczywistych danych zebranych w przemyśle [3], jak i danych symulowanych, czyli specjalnie generowanych losowo wg wzorów o znanych zależnościach funkcyjnych typu (1), a następnie zakłócanych zgodnie z gęstością rozkładu normalnego. Współczynniki istotności względnej obliczano czterema różnymi metodami: A - na podstawie wzrostu błędu sieci dla danych uczących przy zablokowaniu danego wejścia na stałym poziomie; B - na podstawie przyrostu wartości wyjścia z sieci przy zmianie danego wejścia przy pozostałych wejściach ustalanych losowo (propozycja własna), C - na podstawie analizy wag sieci wg Garsona [8] (uwzględnienie tylko ich wartości bezwzględnych); D - na podstawie analizy wag sieci wg własnej propozycji (uwzględnienie znaku wag poprzez funkcję sigmoidalną). Przykład prostego przypadku modelowanego omówiono poniżej. Przyjęto zależność liniową bez efektów synergii w następującej p o- staci: Y=X1+2 X2+3 X3+4 X4+5 X5+6 X6+7 X7+8 X8+9 X9+10 X10. 163
a) 1 0,8 0,6 0,4 0,2 0 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Sygnały wejściowe sieci Istotność ty pu A Istotność ty pu B Istotność ty pu C Istotność ty pu D Istotność oczekiwana b) Istotność typu A dla X4 (pow. x10) Istotność typu C dla X4 (pow. x10) Istotność typu B dla X4 (pow. x10) Istotność typu D dla X4 (pow. x10) Waga X4 - neuron ukryty 3 Obciążenie Y 10 5 7 0 1 2 3 4 5 6 7 8 9 10-5 Kolejny numer uczenia sieci Rys. 3. Współczynniki istotności względnej sygnałów wejściowych sieci obliczane różnymi metodami dla testowych danych symulowanych; a porównanie wartości średnich ze wszystkich uczeń z wartościami oczekiwanymi; b wartości uzyskiwane w poszczególnych uczeniach wraz z dwiema przykładowymi wartościami wag sieci Fig. 3. Relative importance factors of network input signals, calculated by various methods for simulated test data; a comparison of average data from all training sessions to the expected values; b values obtained in consecutive training sessions together with exemplary network weights Przeprowadzono 10 uczeń sieci z jedną warstwą ukrytą składającą się z 5 neuronów. Na rys. 3a pokazano wartości współczynników istotności względnej obliczane powyższymi czterema metodami oraz ich wartości spodziewane. 164
ARCHIWUM ODLEWNICTWA Z wykresu na rys. 3a można wnioskować, że najbardziej zbliżone do oczekiwań wartości współczynników istotności względnej daje typ B i, nieco gorsze, typ A. Isto t- nie odbiegają od oczekiwań typy C i D. Interesujące są także wnioski z wykresu na rys. 3b. Sieć uczy się za każdym razem zupełnie inaczej (patrz zmiany wag sieci w poszczególnych uczeniach), a mimo to współczynniki istotności względnej typu A i B, obliczane na podstawie odpowiedzi sieci, zachowują praktycznie stałą wartość. Natomiast współczynniki typu C i D, obliczane tylko na podstawie wag sieci, wykazują dużą zmienność dla kolejnych uczeń. Badania tego typu są kontynuowane, m.in. z uwzględnieniem sygnałów o wartościach 0 i 1 (wskazujących np. na obecność lub brak jakiegoś zjawiska). Powinny one doprowadzić do opracowania prawidłowej met o- dyki zautomatyzowanego wnioskowania o przyczynach różnego typu zakłóceń proc e- sów produkcyjnych na podstawie nauczonych SSN. LITERATURA [1] T.S. Suneel, et al: A technical note on integrated product quality model using art i- ficial neural networks. J. Mater. Proc. Technol., 121 (2002) [2] M. Perzyk, A. Kochański: Modelling of foundry processes by artificial neural networks. Advances in Manufacturing Science and Technology. 25 (2001), No 4. [3] A. Kochański, M. Perzyk: Identyfikacja przyczyn wady porowatości w odlewach staliwnych z wykorzystaniem sztucznych sieci neuronowych. Archiwum Odlewnictwa, 2 (2002), nr 5. [4] M. Perzyk, P. Siwek: Application of artificial neural networks to green molding sands control. Acta Metallurgica Slovaca, 8, (2002), nr 2. [5] P.F. Bartelt, M.R. Grady, D. Dibble: Application of intelligent techniques for green sand control. Trans. American Foundrymen s Society, 104 (1996) [6] M. Perzyk, A. Kochański: w monografii Polska metalurgia w latach 1998 2002, red. K. Świątkowski. Tom 2. Wyd. Komitet Metalurgii PAN. Kraków 2002 [7] Y.M. Maki, K.A. Loparo: A Neural-Network Approach to Fault Detection and Diagnosis in Industral Processes. IEEE Trans. Cont. Sys. Techn., 5(6), 1997 [9] G.D. Garson: Implementing neural network connection weights. AI Expert, 6(4). 165
SUMMARY MONITORING AND CONTROLLING SYSTEMS FOR FOUNDRY PRODUCTION UTILIZING ARTIFICIAL NEURAL NETWORKS Applications of artificial neural networks to quality modeling of production processes and fault detection of continuous processes are presented. Methods for dete rmination of importance if input signals are discussed. Examples of foundry applications are given. Recenzował: prof. dr hab. inż. Franciszek Binczyk 166