7/38 Solidification of Metals and Alloys, No. 38, 1998 Krzepnięcie Metali i Stopów, nr 38, 1998 PAN Katowice PL ISSN 0208-9386 MOŻLIWOŚCI ZASTOSOWANIA SZTUCZNYCH SIECI NEURONOWYCH DO MODELOWANIA PROCESÓW ODLEWNICZYCH PERZYK Marcin, KOCHAŃSKI Andrzej Instytut Technologii Materiałowych, Politechnika Warszawska 02-524 Warszawa, ul. Narbutta 85, POLAND ABSTRACT The application of the artificial neural networks to solving various problems in foundry industry, is reviewed The fundamentals of the ductile iron metallurgy and its influence on the material's properties are presented. The general usefulness of the neural networks for modeling melting processes is shown. Several versions of the multi-layer networks with back propagation, including additional modification of the input signals, have been constructed. Records of the melt control parameters as well as the testing results of the ductile iron have been collected in one of the Polish foundries. The results of the network training have shown that neural network modeling is a promising tool for the prediction of the ductile iron melting results. 1. WSTĘP Sztuczne sieci neuronowe stanowią intensywnie rozwijającą się dziedzinę wiedzy stosowaną w wielu obszarach nauki i techniki. Mają one właściwości pożądane w wielu zastosowaniach praktycznych [1]: stanowią uniwersalny układ aproksymujący, odwzorowujący wielowymiarowe zbiory danych, mają zdolność uczenia się i adaptacji do zmieniających się warunków, zdolność uogólniania nabytej wiedzy. W stosunku do typowych systemów obliczeniowych mają dwie zasadnicze zalety [2]. Po pierwsze, obliczenia w sieciach wykonywane są w sposób kolektywny (masowo współbieżny), co sprawia, że szybkość wykonywanych obliczeń jest olbrzymia. Oznacza to, że korzystając z sieci neuronowych można będzie rozwiązywać problemy, które obecnie z powodów ich złożoności były całkowicie pomijane lub w których godziliśmy się na rozwiązania bardzo przybliżone. Po drugie, sieci neuronowych nie trzeba programować. Metody uczenia sieci pozwalają uzyskać ich skuteczne działanie nawet w sytuacji, gdy sam twórca sieci nie zna algorytmu, według którego można rozwiązać postawione zadanie.
50 Możliwości sztucznych sieci neuronowych, a zwłaszcza modelowanie procesów typu "czarna skrzynka" skłaniają do zastosowania ich właśnie do rozwiązywania różnorodnych problemów związanych z technologią odlewnictwa. Mimo to, w literaturze znaleźć możemy opisy zaledwie kilku zastosowań sieci neuronowych do rozwiązywania zadań związanych ze sterowaniem i kontrolą procesów odlewniczych: sterowanie pracą pieców topialnych [3], sterowanie przerobem mas formierskich [4], kontrola i sterowanie procesem ciągłego odlewania stali [5,6], wspomaganie projektowania rdzennic w zakresie optymalizacji ich odpowietrzania [7]. W ostatnim okresie w Polsce podjęto prace dotyczące zastosowania sieci neuronowych do przewidywania własności żeliwa sferoidalnego, otrzymywanych w procesie wytopu [8,9], których postępy zostaną przedstawione poniżej. 2. ZAGADNIENIE PRZEWIDYWANIA WŁASNOŚCI ŻELIWA SFEROIDALNEGO Osiągnięcie stabilnych własności wytrzymałościowych oraz związanej z nimi struktury stanowi w wielu odlewniach problem, wynikający z dużej ilości czynników decydujących o wytopie i dużego rozrzutu parametrów wytopu. Własności żeliwa w stanie po odlaniu bezpośrednio wynikają z fizykochemicznego stanu ciekłego żeliwa oraz szybkości chłodzenia odlewu. Fizykochemiczny stan ciekłego żeliwa ma podstawowe znaczenie. Na ten stan wpływ mają takie zmienne jak skład chemiczny, temperatura i czas wytrzymywania ciekłego metalu, obróbka metalurgiczna ciekłego metalu, rodzaj materiałów wsadowych i warunki prowadzenia wytopu. W literaturze omawiającej wpływ poszczególnych pierwiastków na strukturę i własności materiału w odlewie najczęściej spotykamy się z dwoma podejściami: traktowanie każdego z pierwiastków oddzielnie, lub łączenie pierwiastków w grupy. Prace te wykazują często niekonsekwencję, na przemian grupując pierwiastki, w ramach jednej klasyfikacji, według różnych kryteriów. W tych klasyfikacjach jedynie węgiel i krzem oraz siarka i mangan stanowią pary, w których zauważany jest współudział w określaniu struktury przyszłego odlewu. Mechanizm powstawania struktury jest bardziej skomplikowany i wynika z interakcji między wszystkimi pierwiastkami znajdującymi się w wytopie. Nieliczne są prace starające się uwzględnić współoddziaływanie między większą ilością pierwiastków [9], zaś modelowanie procesów wytopu z uwzględnieniem modeli zjawisk fizycznych i chemicznych w nim zachodzących wydaje się zadaniem nierealnym. Celem pracy było sprawdzenie możliwości przewidywania własności żeliwa sferoidalnego za pomocą modelowania procesu wytopu sieciami neuronowymi, w warunkach konkretnej odlewni. 3. WIELKOŚCI WEJŚCIOWE I WYNIKOWE Przy określaniu klasy żeliwa sferoidalnego uwzględnia się na ogół wytrzymałość na rozciąganie R m i wydłużenie A 5 ; ASTM dodatkowo zawiera informację dotyczącą umownej granicy plastyczności. Wymagania mogą być poszerzone o zwiększoną udarność w niskich temperaturach. W wielu przypadkach odbiorca wyrobu stawia równocześnie wymagania dotyczące twardości odlewu. W niniejszej pracy za najważniejsze sygnały wyjściowe uznano trzy parametry: wytrzymałość na rozciąganie R m, wydłużenie A 5 i twardość Brinella. Wielkości te są bezpośrednim rezultatem następujących czynników: składu chemicznego (najważniejszy parametr), temperatury i czasu wytrzymania metalu, pozapiecowej obróbki ciekłego metalu,
51 rodzaju materiałów wsadowych i warunków prowadzenia wytopu oraz szybkości chłodzenia odlewu. W warunkach konkretnej odlewni i wybranego odlewu za stałe można przyjąć użyte w procesie: sferoidyzator, modyfikator, materiały wsadowe oraz warunki prowadzenia wytopu (rodzaj pieca, czas i temperatura wytopu), sposób prowadzenia zabiegów (rodzaj kadzi, wielkość próbki, etc.) oraz szybkość chłodzenia odlewu. W żeliwie można odnaleźć większość występujących na Ziemi pierwiastków. W literaturze naukowej analizowanych jest do 20 pierwiastków. W analizach chemicznych wykonywanych w odlewniach na ogół bada się zawartość 9 najistotniejszych, które zostały przyjęte w obecnie prezentowanym, pierwszym etapie pracy, jako sygnały wejściowe. Badania wykonano w warszawskiej odlewni PZL-WOLA. Szczegóły dotyczące wytopu żeliwa podano w pracy [8]. Zgromadzone i opracowane dane zostały zestawione w arkuszu kalkulacyjnym MSExcel. Do uczenia sieci został przygotowany zbiór zawierający 664 eksperymenty. Równolegle przygotowano zbiór służący do odpytywania, nie wykorzystywany w procesie uczenia, zawierający 179 eksperymentów. Eksperymenty przydzielono do poszczególnych zbiorów na zasadzie wyboru losowego. Każdy z eksperymentów zawierał analizę chemiczną i własności uzyskanego materiału. Skład chemiczny był określony przez dziewięć pierwiastków: węgiel, krzem, mangan, fosfor, siarka, chrom, nikiel, miedź, magnez, a własności przez trzy wielkości: wytrzymałość, wydłużenie i twardość. Po przeprowadzeniu normalizacji wielkości procentowych udziałów pierwiastków zostały użyte jako sygnały wejściowe, a trzy własności jako sygnały wyjściowe. 4. OPIS ZASTOSOWANYCH SIECI NEURONOWYCH Zbudowano trzy różne sieci neuronowe jednokierunkowe z nieliniowymi charakterystykami neuronów, ze wsteczną propagacją błędu, o różnych ilościach warstw ukrytych, tj typu: (9,5,3), (9,7,5,3) oraz (9,9,7,5,3). W sieciach stosowano połączenia międzywarstwowe łączące każdy neuron z każdym. Do budowania sieci neuronowych wykorzystano shareware'ową platformę progamistyczną Neural Planner ver. 4.50. Zaprojektowane sieci zostały poddane procesowi uczenia. We wszystkich trzech przypadkach wykonano ponad 100000 cykli. Po nauczeniu sieci przeprowadzono ich odpytywanie. Przeprowadzono analizę statystyczną dla każdego rodzaju sieci, a wyniki przedstawiono w postaci graficznej. 5. WYNIKI Na rys. 1 pokazano typowy rozkład błędów prognozowania własności żeliwa. Widoczna jest znaczna koncentracja wyników wokół zerowej wartości błędu, szczególnie w przypadkach wytrzymałości i twardości, gdzie błąd wartości prognozowanej był mniejszy niż 20 % w zbiorze uczącym dla ponad 96%, a w zbiorze odpytującym dla ponad 85% eksperymentów, dla wszystkich konfiguracji sieci. Gorsze rezultaty prognozowania wydłużenia wiązać należy z charakterem danych doświadczalnych, których znaczna liczba obarczona była prawdopodobnie błędami systematycznymi, wynikającymi z przyjętej techniki pomiaru długości próbek.
52 Najlepsze rezultaty uzyskano dla sieci z dwiema warstwami ukrytymi. Wszystkie wyniki pokazane na następnych wykresach będą dotyczyły tej właśnie konfiguracji. 0.6 0.4 0.2 0 ± 5 Błąd prognozowania, % Twardość Wytrzymałość Wydłużenie Rys. 1. Typowy rozkład błędów prognozowania (dla sieci z dwiema warstwami ukrytymi) Na rys. 2 przedstawiono przykładowe porównanie rozkładu błędów prognozowania dla zbioru: uczącego i odpytującego. Stosunkowo zbliżone wartości błędów otrzymywane dla obu rodzajów zbiorów (dla wszystkich trzech własności) mogłyby wskazywać na to, że błędy należy przypisać w znacznej mierze naturalnemu rozrzutowi wyników doświadczalnych, zaś w mniejszym stopniu jakości samej sieci. Sugestię powyższą potwierdzają rezultaty, jaki otrzymano w wyniku selekcji wyników doświadczalnych. Po analizie wartości prognozowanych przez sieć dla zbioru uczącego wyodrębniono grupę liczącą kilkanaście przypadków eksperymentów szczególnie nietrafnie przewidzianych, tzn. takich, w których wartość prognozowana w stosunku do zmierzonej różniła się o ponad 30 procent. W każdym z tych przypadków przeprowadzono analizę poprawności wyników mierzonych i porównano z kilkunastoma przypadkami o takim samym lub podobnym składzie wyjściowym. Na podstawie tej analizy odrzucono 16 eksperymentów, tzn. 2,4% wszystkich danych, które uznano za wadliwie przeprowadzone. Na rys. 4 pokazano porównanie rozkładów błędów przed i po korektach danych dla najgorszego przypadku, tj. wydłużenia. Widoczne jest znaczące polepszenie jakości prognozowania tej wielkości.
53 Udział wyników 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Dane uczące Dane odpytujące 0 ± 5 Błąd prognozowania, % Rys. 2. Porównanie rozkładów błędów prognozowania wytrzymałości dla zbioru uczącego i odpytującego 0.4 Udzia wyników 0.3 0.2 0.1 Dane oryginalne Dane skorygowane 0 ± 5 Błąd prognozowania, % Rys. 3. Porównanie rozkładów błędów prognozowania przed i po korektach danych dla wydłużenia
54 6. WNIOSKI Ze wstępnych badań przedstawionych w pracy wyraźnie widać, że istnieje możliwość prognozowania własności żeliwa z wykorzystaniem sztucznych sieci neuronowych. W przypadku prognozowania twardości i wytrzymałości otrzymano dobre wyniki, natomiast w przypadku wydłużenia istnieje konieczność poprawienia jakości prognozowania. Na niską dokładność prognozowania wielkości wydłużenia wpływ mogą mieć dwa czynniki: zbyt mała ilość sygnałów wejściowych oraz zbyt powierzchowna analiza wyników eksperymentów. W pierwszych badaniach we wszystkich trzech sieciach uwzględniono jedynie dziewięć, z trzynastu rejestrowanych, pierwiastków. Nie uwzględniono żadnego z parametrów procesu, tzn. temperatur sferoidyzacji i zalewania oraz czasu sferoidyzacji. Wszystkie te sygnały w eksperymentach były rejestrowane i w późniejszych sieciach będą wykorzystane. Wyniki uzyskane z uczenia sieci zbiorem poprawionym, tzn. po eliminacji wadliwych wyników, sugerują potrzebę stosowania tego typu korekt. Usunięcie nawet niewielkiej ich liczby spowodowało wyraźną poprawę prognozowania. Procedurę eliminacji wadliwych danych należałoby rozszerzyć, opierając się na pogłębionej analizie danych eksperymentalnych. Dotychczasowa konfiguracja sieci powodowała, że błędy pomiaru wytrzymałości, twardości i wydłużenia wpływały na siebie nawzajem. Celowe wydaje się dokonanie zmiany konfiguracji sieci zwłaszcza, że w nowych sieciach pojawią się rejestrowane w eksperymentach dodatkowe własności żeliwa (granica plastyczności, przewężenie i udarność). LITERATURA [1] Osowski S.: Sieci neuronowe w ujęciu algorytmicznym. WNT Warszawa 1996. [2] Tadeusiewicz R.: Wprowadzenie do sieci neuronowych. NeuroMet'97, Kraków, AGH, 1997. [3] Bliss, NG; Gilbertson, GJ; Sweat, JE: Advanced neural network control of the high impedance high voltage arc furnace. Near-Net-Shape Casting in the Minimills, Vancouver, British Columbia, Canada, August 1995, s. 99-105. [4] Bartelt, PFBAJD; Moberly, JBANA: Applying artificial intelligence to the modern foundry. Modern Casting, Vol. 86, No. 2, s. 52-55, Feb. 1996 [5] Bulsari, AB; Sillanpaa, M.: An Expert System for Continuous Steel Casting Using Neural Networks. Conference Expert Systems in Mineral and Metal Processing, Espoo, Finland, August 1991, Pergamon Press Ltd. (United Kingdom), s. 155-159. [6] Otsuka, Y; Konishi, M.: Neural Network Models and Their Application to Iron and Steelmaking Processes. (MITS BISI 28557). Journal of the Iron and Steel Institute of Japan, Vol. 77, No. 10, Oct. 1991, s. 1539-1543. [7] Terashima K., Maesa Y., Namura H.: Learning-control of mould hardness in blow molding. 60 th World Foundry Cingress, The Hague, Netherlands, 1993. [8] A. Kochański, M. Perzyk: Prediction of Ductile Cast Iron Quality by Artificial Neural Networks. International Conference Advances in Production Engineering, Warsaw 1988 [9] Kowalski A.: Wpływ krzemu, niklu i miedzi... Prace Instytutu Odlewnictwa, tom 47, 1997, zeszyt. 3, s. 241-265.