33/14 Archives of Foundry, Year 2004, Volume 4, 14 Archiwum Odlewnictwa, Rok 2004, Rocznik 4, Nr 14 PAN Katowice PL ISSN 1642-5308 ZASTOSOWANIE SYSTEMÓW UCZĄCYCH SIĘ DO PRZEWIDYWANIA WŁASNOŚCI MATERIAŁÓW ODLEWANYCH J. KOZŁOWSKI 1, R. BIERNACKI 2, D. MYSZKA 3, M. PERZYK 4, A. KOCHAŃSKI 5 Instytut Technologii Materiałowych Politechniki Warszawskiej Narbutta 85, 02-524 Warszawa STRESZCZENIE Przedstawiono przykłady zastosowania systemów uczących się do przewidywania własności materiałów odlewanych. Omówiono rozszerzone możliwości zastosowania sieci neuronowych do sterowania procesami metalurgicznymi. Omówiono realizowany projekt badawczy dotyczący modelowania procesu wytwarzania żeliwa ADI. Key words: austempered ductile iron, mechanical properties, learning systems, artificial neural networks, naive Bayesian classifier 1. AKTUALNY STAN WIEDZY Procesy odlewnicze są najczęściej procesami niezalgorytmizowanymi, czyli takimi, z którymi nie jest związany żaden model matematyczny, który opisywałby wszystkie (istotne) zjawiska zachodzące w procesie. Z uwagi na złożoną i często, niewyjaśnioną naturę fizyczną tych procesów, modelowanie ich odbywa się najczęściej przy zastosowaniu różnorodnych systemów uczących się. Takie systemy mogą wykorzystywać metody probabilistyczne, np. oparte na twierdzeniu Bayesa (klasyfikatory Bayesa, sieci Bayesowskie), inne mogą wykorzystywać logikę rozmytą, ale najbardziej rozpowszechnione są sztuczne sieci neuronowe (SSN). 1 mgr inż., jkozlows@wp.pl 2 mgr inż., rbiernac@wip.pw.edu.pl 3 dr inż., dawidmyszka@poczta.onet.pl 4 prof. dr hab. inż., M.Perzyk@wip.pw.edu.pl 5 dr inż., akochans@wip.pw.edu.pl
250 Ogólnie można stwierdzić, że systemy uczące się znajdują zastosowanie do rozwiązywania zadań takich jak: Analiza danych, gdy zbiory o dużej liczebności umożliwiają ich analizę jedynie w sposób automatyczny (np. przemysłowe, ekonomiczne lub medyczne bazy danych). Praca w środowisku, w którym system musi się dopasować do szybko zmieniających się warunków. Do zadań złożonych i trudnych do opisania innymi modelami matematycznymi. Systemy takie były pomocne w rozwiązywaniu różnorodnych problemów zawiązanych także z zagadnieniami odlewniczymi, co zostało opisane w literatu rze krajowej i zagranicznej. Przykładem jest wykorzystanie logiki rozmytej do określenia zależności pomiędzy temperaturą, czasem i parametrami wytrzymałościowymi żeliwa ADI. W badaniach tych użyto czterech modeli rozmytych i neuro-rozmytych do budowy modeli prognozujących. Rezultaty tych badań wykazały pełną ich przydatność w tego typu procesach [1]. Innym przykładem wykorzystania narzędzi opartych na systemach uczących się, jest przewidywanie twardości Vickersa i określanie ilości austenitu szczątkowego, od którego, jak wiadomo zależy wiele właściwości żeliwa ADI, w funkcji składu chemicznego i parametrów obróbki cieplnej. W obydwu przypadkach wykorzystano model sieci neuronowej optymalizowany z wykorzystaniem podejścia bayesowskiego, a opracowane narzędzia z powodzeniem wykorzystywano do wytwarzania tego typu żeliwa [2,3]. Modele takie wykorzystano również do wyznaczenia oceny pękania zmęczeniowego w superstopach na bazie Niklu, w funkcji 51 zmiennych m.in. zakresu naprężeń, składu chemicznego, wielkości ziarna, obróbki cieplnej etc [4]. Metoda ta pozwalała określić wielkość błędu przewidywanej wielkości, jak i istotność poszczególnych wartości wejściowych, dla każdego badanego czynnika. W dodatku możliwe było oszacowanie szczególnych efektów tych zmiennych, które w praktyce zmieniały się niezależnie. Pozwoliło to w pewnym stopniu badać zjawiska i zdobywać informacje, które były niedostępne na drodze eksperymentu. W Zakładzie Odlewnictwa Politechniki Warszawskiej od kilku lat prowadzone są prace nad zastosowaniem SSN oraz innych algorytmów uczących się do modelowania procesów odlewniczych. Celem ich jest znalezienie zależności pomiędzy parametrami procesów produkcyjnych, właściwościami materiałów i jakością produktów, co umożliwiłoby ograniczenie poziomu braków jak i kosztów produkcji [5-8]. Jednym z pierwszych badanych problemów było przewidywanie własności żeliwa sferoidalnego. Na podstawie opublikowanych danych z odlewni fińskiej porównano przewidywania twardości przez wielomian zastosowany przez tych autorów [9] oraz sieć neuronową, stworzoną w Politechnice Warszawskiej, uczoną metodami symulowanego wyżarzania i wstecznej propagacji błędu. Wykazano, że w tego typu zastosowaniach, modele oparte na SSN istotnie lepiej przewidują wartości rzeczywiste, niż model wielomianowy (rys.1) [8].
Istotność względna Twardość HB 251 260 240 220 200 Wartość rzeczywista Przewidywania sieci neuronowej Przewidywanie przez wielomian 180 160 140 1 2 3 4 5 6 7 8 9 10 Numer wytopu Rys. 1. Porównanie wyników przewidywania twardości żeliwa sferoidalnego, na podstawie danych pochodzących z odlewni fińskiej, za pomocą modelu wielomianowego i sztucznej sieci neuronowej Fig. 1. Comparison of results of prediction of ductile iron hardness, based on data from a Finland foundry, by polynomial model and neural networks model Systemy uczące się umożliwiają niekiedy analizę istotności wielkości wejściowych. W przypadku danych przemysłowych dotyczących żeliwa sferoidalnego najistotniejszym pierwiastkiem dla SSN oraz tzw. naiwnego klasyfikatora Bayesa okazała się miedź, co potwierdza znany fakt dodawania miedzi w celu uzyskania struktury perlitycznej i podniesienia w ten sposób wytrzymałości żeliwa (rys. 2). 1 0,8 0,6 0,4 Sieć neuronowa Naiwny klasyfikator Bayesa 0,2 0 C Mn Si P S Cr Ni Cu Mg Rys. 2. Istotność względna pierwiastków stopowych w żeliwie sferoidalnym przewidywana przez systemy uczące się na podstawie wybranych danych przemysłowych Fig. 2. Relative importance of chemical elements in ductile cast iron predicted by learning systems based on selected industrial data
252 2. ANALIZA ROZSZERZONYCH MOŻLIWOŚCI SSN We wszystkich procesach wytwórczych istotne jest znalezienie relacji między parametrami procesu oraz własnościami i ilościami użytych materiałów z jednej strony, a parametrami jakościowymi wyrobów z drugiej, czyli modele ich jakości (rys. 3). W tym obszarze zagadnień SSN wykorzystywane są jako systemy zdolne do szybkiego obliczania wartości wyjściowych, dla zadanych wartości wejść. Jednakże w celu ułatwienia identyfikacji przyczyn rozpatrywanych problemów, bardziej użyteczna wydaje się być analiza względnej istotności sygnałów wejściowych, gdyż znajdowanie parametrów produkcji, które są najbardziej istotne dla uzyskania określonych fizycznych czy ekonomicznych efektów może pomóc w optymalizacji procesów produkcyjnych. Przykład wykresów istotności pojedynczych sygnałów wejściowych pokazano na rys. 2. Wszechstronną analizę metod wyznaczania współczynników istotności względnej przedstawiono w pracach [10,11]. Dodatki odświeżające (ilość i jakość) Własności masy zwrotnej Parametry i zakłócenia procesu przerobu masy Przerób masy formierskiej Własności masy świeżej Parametry i zakłócenia procesu formowania Materiały wsadowe (ilość i jakość) Parametry i zakłócenia procesu wytopu Formowanie Wytop Jakość formy Parametry i zakłócenia procesu wytwarzania odlewu Czas Warunki otoczenia Jakość ciekłego metalu Przerób masy formierskiej Parametry jakości odlewu Rys. 3. Modele jakości procesów wytwórczych w typowej odlewni Fig. 3. Quality models of manufacturing processes in a typical foundry Stosując SSN jako model jakości wyrobu należy przeanalizować kilka istotnych elementów. Po pierwsze niezbędne jest ustalenie listy parametrów (sygnałów), które mogą mieć istotny związek z jakością wyrobu. Po drugie należy określić, w jaki sposób tworzony będzie zbiór uczący dla SSN, a więc w jaki sposób zostaną zidentyfikowane parametry procesu i materiały zastosowane w przypadku wyrobu o danych parametrach jakościowych. Tego typu powiązania nie zawsze są dostępne na podstawie istniejącej dokumentacji.
253 Ważną sprawą jest zdecydowanie, które wielkości traktowane będą jako sygnały wejściowe, a które jako wyjściowe (wynikowe). Naturalne wydaje się przyjęcie własności surowców i parametrów procesu jako wejścia sieci neuronowej, zaś własności wyrobu jako wyjścia (rys. 4a). Tego typu podejście umożliwia symulację procesu (przewidywanie własności wyrobu) w konkretnej sytuacji, jednakże nie daje bezpośredniej wskazówki, jak dobrać parametry procesu czy ilości określonych surowców dla uzyskania wyrobu o określonych parametrach. Z tego względu często stosuje się uczenie sieci w innym układzie (rys 4b), gdzie wielkościami wejściowymi (niezależnymi) będą własności wyrobu (traktowane przy zapytaniu sieci jako pożądane), zaś wynikowymi np. ilości potrzebnych surowców albo parametry procesu, które należy zastosować. Tego typu podejście może być stosowane np. do określania ilości potrzebnych dodatków odświeżających do mas formierskich w sytuacji znanych własności oraz składu masy znajdującej się aktualnie w obiegu [12,13]. a) Ilość (skład) surowców Jakość surowców Parametry procesu Zakłócenia procesu MODEL SIECI NEURONOWEJ Jakość wyrobu b) Jakość wyrobu Jakość surowców Parametry procesu Zakłócenia procesu MODEL SIECI NEURONOWEJ Ilość (skład) surowców Rys. 4. Neuronowe modele jakości procesów wytwórczych: a) modelowanie wprost, b) modelowanie odwrotne Fig. 4. Neural models of quality of manufacturing processes: a) direct modeling, b) reverse modeling Należy jednak zwrócić uwagę, że nie zawsze takie odwrócenie zagadnienia jest uzasadnione, gdyż nie zawsze w pełnym zakresie możemy wpływać na wszystkie parametry procesu lub własności i ilości użytych surowców i dostosować je do wartości wskazanych przez sieć. Typowym przykładem wydają się być procesy wytopu, gdzie w danej sytuacji wpływ np. na skład chemiczny kąpieli jest na ogół ograniczony i to w różny sposób, w zależności od użytych materiałów wsadowych. W tego typu przypadkach bezpieczniejsze wydaje się stworzenie sieci w pierwszym wariancie (rys.4a), zaś dla uzyskania informacji o pożądanych dodatkach lub parametrach procesu należy przeprowadzić wielokrotną symulację (odpytywanie sieci). Programy komputerowe opracowane w Zakładzie Odlewnictwa Politechniki Warszawskiej umożliwiają optymalizację wartości wybranych sygnałów wejściowych SSN w wybranych przez użytkownika zakresach dla uzyskania pożądanego wyniku. Przykład okna dialogowego z takiego programu pokazano na rys. 5.
254 Rys. 5. Okno optymalizacji wielkości wejściowych na podstawie nauczonej sieci neuronowej, modelującej zależność między składem chemicznym kąpieli, a własnościami mechanicznymi żeliwa sferoidalnego Fig. 5. Software window used for optimization of input values of trained neural network, modeling relationships between melt chemical composition and mechanical properties of SG cast iron W wielu procesach występuje łączne, wspomagające się działanie wielu wielkości wejściowych. Skłoniło to autorów do opracowania algorytmów (narzędzi) umożliwiających analizę istotności grup sygnałów [11]. Zasadnicza trudność wynika z pracochłonności obliczeń: np. dla 15 wielkości wejściowych liczba możliwych kombinacji (grup) wynosi ponad 32000. Opracowana procedura wykorzystuje metodę znajdowania quasi globalnego optimum funkcji wielu zmiennych zwaną metodą symulowanego wyżarzania, wypróbowaną z dobrym skutkiem przy uczeniu wstępnym sieci neuronowych. Przykład kopii ekranu ilustrującego znaczenie wszystkich grup sygnałów pokazano na rys. 6. W celu umożliwienia wyselekcjonowania najbardziej istotnych grup sygnałów wejściowych dla danego wyjścia sieci opracowano procedurę filtracji wszystkich kombinacji. Nie chodzi tu przy tym o wytypowanie po prostu grup najbardziej znaczących, gdyż jest oczywiste, że grupy liczniejsze będą zawsze bardziej znaczące. Proste odniesienie znaczenia grupy do jej liczebności również nie wydaje się wystarczająco dobrym rozwiązaniem, gdyż wówczas największe wyznaczone w powyższy sposób znaczenie mogą uzyskać sygnały pojedyncze, choć kombinacja kilku innych może być faktycznie bardziej znacząca. Przykład kopii ekranu z wynikami takiej filtracji pokazano na rys 7. Opisane metody są obecnie w fazie testowania przy użyciu zarówno symulowanych jak i rzeczywistych danych uczących.
255 Rys. 6. Kopia ekranu oprogramowania służącego do przeglądania wyników obliczeń znaczenia grup (kombinacji) sygnałów wejściowych SSN Fig. 6. Exemplary screen copy of the software developed for analysis of the significance of groups (combinations) of ANN input signals
256 Rys. 7. Kopia ekranu oprogramowania służącego do ustalenia i analizy najbardziej znaczących grup sygnałów wejściowych SSN Fig. 7. Exemplary screen copy of the software developed for analysis of the most significant groups of ANN input signals 3. MODELOWANIE PROCESÓW OTRZYMYWANIA ŻELIWA ADI ZA POMOCĄ SSN Prowadzone w ośrodkach badawczych prace dotyczące żeliwa ADI obejmują przede wszystkim badania jego składu chemicznego oraz różnych sposobów wytwarzania. Inną grupą zagadnień, ważną z punktu widzenia producentów wykorzystujących to tworzywo, jest możliwość oceny własności mechanicznych oraz wiedza dotycząca możliwości kształtowania cech użytkowych wyrobów z tego żeliwa. Z uwagi na złożoność oddziaływań zachodzących w poszczególnych etapach procesu technologicznego żeliwa ADI, dostępna wiedza w postaci opracowań naukowych nie definiuje tych zagadnień w sposób obejmujący ich całokształt. Opisy literaturowe podają dane dotyczące parametrów obróbki cieplnej i niektórych własności mechanicznych, jednak w sposób wybiórczy, niejednokrotnie dane te są niekompletne, a w większości przypadków otrzymane na próbkach laboratoryjnych. Dla producenta odlewów są zatem w dużej mierze bezużyteczne. Istnieje więc potrzeba zebrania danych literaturowych oraz przemysłowych w jedną bazę, która odpowiednio wykorzystana
257 umożliwi przewidywanie własności oraz odpowiedni dobór parametrów procesu technologicznego w celu otrzymania żeliwa ADI. Działania takie zostały podjęte w ramach wspólnej pracy badawczej prowadzonej przez Instytut Odlewnictwa w Krakowie i Zakład Odlewnictwa Politechniki Warszawskiej. Gromadzone są obecnie dane literaturowe, dane doświadczalne wykonane w ramach prac własnych oraz przemysłowe, udostępnione w ramach współpracy z jedną z włoskich odlewni. Dla uzyskania rozwiązania modelującego relacje typu: parametry procesu technologicznego własności otrzymanych wyrobów, tworzony jest system uczący się oparty na SSN. Cechy dotyczące systemów uczących się a w szczególności SSN czynią je doskonałym narzędziem wspomagającym przewidywanie czterech podstawowych własności mechanicznych badanych na żeliwie ADI: wytrzymałości na rozciąganie, umownej granicy plastyczności, wydłużenia oraz twardości. Własności mechaniczne żeliwa ADI zależą m.in. od parametrów obróbki cieplnej żeliwa sferoidalnego, tj. temperatury i czasu austenityzacji oraz temperatury i czasu hartowania izotermicznego, od jego składu chemicznego, ilości i kształtu wydzieleń grafitu kulkowego, konstrukcji i sposobu wykonania odlewu [14]. Wymienione parametry stanowią wejścia sieci. Oczekuje się efektu w postaci praktycznego narzędzia ułatwiającego producentom podejmowanie decyzji dotyczących projektowania wyrobów z żeliwa ADI oraz narzędzia określającego precyzyjne wytyczne dotyczące parametrów austenityzacji i hartowania izotermicznego. Ważną zaletą proponowanego rozwiązania jest uwzględnienie w procesie uczenia SSN (poprzez odpowiednie skorelowanie z zadanymi wejściami) pewnych informacji uzupełniających np.: stopnia sferoidyzacji, typu struktury pierwotnej, warunków obróbki cieplnej, których wytwórca nie musi posiadać. Wymagane zestawy danych obejmują parametry, którymi w szybki sposób może dysponować każdy producent wyrobów z żeliwa ADI. LITERATURA [1] L. Arafeh, H. Singh, S. Putatunda: A Neuro Fuzzy Logic Approach to Material Processing. IEEE Transactions On Systems, Man, And Cybernetics Part C: Applications And Reviews, Vol. 29, No. 3, August 1999. [2] M. A. Yescas: Prediction of the Vickers hardness in austempered ductile irons using neural networks. Int. J. Cast Metals Res., 2003, 15, 513-521. [3] M. A. Yescas, H.K.D.H. Bhadeshia, D.J. MacKay: Estimation of the amount of retained austenite in austempered ductile irons using neural networks. Materials Science and Engineering A311 (2001) 162-173. [4] H. Fujii, D.J. Mackay, H.K.D.H. Bhadesia: Bayesian Neural Network Analysis of Fatigue Crack Growth Rate in Nickel Base Superalloys. ISIJ International, Vol. 36 (1996), No. 11, pp. 1373-1382. [5] A. Kochański, M. Perzyk: Identyfikacja przyczyn wady porowatości w odlewach staliwnych z wykorzystaniem sztucznych sieci neuronowych. Archiwum Odlewnictwa, 2 (2002), nr 5.
258 [6] M. Perzyk, A. Kochański: Methodology of detection of casting defects causes by neural networks. Materials Science, Vol. 8, No. 4, 2002 (ISSN 1392-1320). [7] M. Perzyk, A. Kochański: Detection of causes of casting defects assisted by artificial neural networks. Journal of Engineering Manufacture, Proceedings of the Institution of Mechanical Engineers, Part B. Vol. 217, (2003) str. 1279-1284. [8] M. Perzyk, A. Kochański: Prediction of ductile cast iron quality by artificial neural networks. Journal of Materials Processing Technology, Elsevier, 2001 Vol/issue:109/3, p. 305-307. [9] Luovo A., Alhainen J., Eklund P.: Criterion functions for estimating the microstructure and mechanical properties of SG iron castings. Proc. 58th World Foundry Congress, Krakow, 1992, Paper No. 20. [10] M. Perzyk, A. Kochański, J. Kozłowski: Istotność względna sygnałów wejściowych sieci neuronowej. Informatyka w Technologii Materiałów, Wydawnictwo Naukowe AKAPIT, Kraków, tom 3, rok 2003, str. 125-132. [11] M. Perzyk, A. Kochański, J. Kozłowski: Significance analysis of production parameters asisted by artificial neural networks. IIIth International Conference on Advances in Production Engineering, Oficyna Wydawnicza PW, Warszawa, tom 1, rok 2004, str. 43-53. [12] M. Perzyk, P. Siwek: Application of artificial neural networks to green molding sands control. Acta Metallurgica Slovaca, 8, (2002), nr 2. [13] P. F. Bartelt, M.R. Grady, D. Dibble: Application of intelligent techniques for green sand control. Trans. American Foundrymen s Society, 104 (1996) [14] D. Myszka, M. Kaczorowski, J. Tybulczuk, A. Kowalski: Parametry procesu otrzymywania żeliwa ADI, a jego własności mechaniczne. Archiwum Odlewnictwa, materiały VI Międzynarodowej Konferencji Naukowej, Szklarska Poręba 2004. APPLICATION OF LEARNING SYSTEMS TO PREDICTION OF CAST METALS PROPERTIES SUMMARY Applications of artificial neural networks and other learning systems to prediction of properties of cast materials are presented. Extended possibilities of applications of neural networks to control of metallurgical processes are shown. A currently developed project related to production of ADI is briefly discussed. Recenzował Prof. Mieczysław Kaczorowski