POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk
Dlaczego eksploracja danych? W większości zakładów produkcyjnych są zbierane liczne dane związane z przebiegiem i parametrami procesu produkcyjnego Wykorzystanie tych danych dla poprawy jakości wyrobów i obniżenia kosztów produkcji wymaga wydobycia z nich informacji, w postaci konkretnych wniosków, reguł i metod postępowania Umożliwia to nowa, interdyscyplinarna dziedzina wiedzy, zwana eksploracją danych (data mining DM), intensywnie rozwijająca się na świecie w ostatnich latach Dotychczasowe obszary zastosowań DM obejmowały głównie sfery biznesu, zarządzania i nauk społecznych oraz medycyny - aplikacje w zakresie analizy procesów technologicznych są obecnie intensywnie rozwijane DM wykorzystuje głównie metody sztucznej inteligencji, zwłaszcza tzw. systemy uczące się, a także metody statystyczne i wizualizacyjne
Przykład danych Nr zapisu Kontrola procesu Robotnik Maszyna Ilość braków 1 częsta Popiołkiewicz A mała 2 częsta Perzyk B duża 3 pełna Popiołkiewicz B mała 4 rzadka Popiołkiewicz A duża 5 rzadka Popiołkiewicz B duża 6 częsta Popiołkiewicz B mała 7 rzadka Perzyk B duża 8 częsta Perzyk A duża
Drzewa decyzyjne Przykład generowania reguł dla zmiennej Ilość braków Kontrola procesu Rzadka Pełna Częsta Duża Mała Robotnik Perzyk Duża Popiołkiewicz Mała
Co możemy uzyskać z eksploracji danych? Przykłady istotnych zadań w przemyśle wytwórczym, w tym spożywczym, jakie można rozwiązywać z wykorzystaniem metod eksploracji danych: Tworzenie praktycznej wiedzy inżynierskiej przez uogólnienie doświadczeń zdobytych w produkcji, w postaci zaleceń i zależności projektowych i technologicznych Wykrywanie przyczyn zakłóceń procesów technologicznych skutkujących pogarszaniem się jakości Określenie przyczyn oraz przewidywanie prawdopodobieństwa wystąpienia awarii maszyn i urządzeń Wskazanie najważniejszych parametrów umożliwiających efektywne sterowanie procesami produkcyjnymi Przewidywanie parametrów procesu lub cech wyrobów (np. odchyłek wymiarowych) na podstawie bieżących i przeszłych wartości, zapisanych w postaci danych sekwencyjnych (szeregu czasowego)
Najczęściej stosowane zaawansowane narzędzia eksploracji danych Drzewa decyzyjne Sztuczne sieci neuronowe (inspiracja procesami zachodzącymi w korze mózgowej) Optymalizacja z wykorzystaniem algorytmów ewolucyjnych (inspiracja procesami zachodzącymi w naturze) Teorie zbiorów rozmytych i zbiorów przybliżonych (przetwarzanie danych niepewnych i niejednoznacznych) Analiza szeregów czasowych Wiele innych
Przykład wykrywania przyczyn braków Wykresy uzyskane z odpowiedzi nauczonej sieci neuronowej stanowiące podstawę identyfikacji przyczyn powstawania wad w wyrobach Pogoda ciepła i sucha Pogoda chłodna i wilgotna 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 Przepuszczalność masy Wilgotność masy Przepuszczalność masy Wilgotność masy
Określanie istotności parametrów procesu Informacje o tym, które zmienne odgrywają najważniejszą rolę w procesie mogą być pomocne w rozwiązywaniu zadań związanych z wytwarzaniem takich jak: wykrywanie źródłowych przyczyn pogarszania się jakości wyrobów, 1 przewidywanie skutków zmian w procesie wytwarzania, a zwłaszcza wskazywanie na optymalne lub krytyczne parametry procesu i ich kombinację Istotność względna Znalezienie najmniej znaczących parametrów procesu może być Sieć także neuronowa istotne: zmienność takich parametrów można bowiem niekiedy Drzewo dopuścić regresyjne bez ujemnych konsekwencji dla jakości wyrobu, co może prowadzić do oszczędności kosztów kontroli produkcji 0 A B C D E F G H I C Mn Si P S Cr Ni Cu Mg Pierwiastek stopowy Parametry procesu
Zastosowania szeregów czasowych Analiza szeregów czasowych dotyczy ciągu wartości rejestrowanych chronologicznie, najczęściej w stałych odstępach czasu lub w innego typu sekwencjach Wykrywanie okresowości własności wyrobów może ułatwić identyfikację przyczyn zakłóceń procesów Przewidywanie parametrów procesu lub własności wyrobów w niedalekiej przyszłości może ułatwiać zapobieganie niepożądanym tendencjom lub sugerować pożądane zmiany w sterowaniu tymi procesami 0,12 Wartość parametru 0,08 0,04 0 Kolejne pomiary
Przykłady zastosowań eksploracji danych w przemyśle spożywczym Optymalizacja procesu produkcji cukierków (jakość i wydajność) z wykorzystaniem sztucznych sieci neuronowych Określenie dopuszczalnego okresu magazynowania serów z wykorzystaniem sztucznych sieci neuronowych Przewidywanie szybkości procesu fermentacji w produkcji piwa z wykorzystaniem sztucznych sieci neuronowych Zastosowanie drzew decyzyjnych i sztucznych sieci neuronowych do podniesienia jakości produkowanych win Systemowe ujęcie szerokich możliwości zastosowań technik eksploracji danych w przemyśle mięsnym dla wydajności produkcji oraz kontroli zdrowia bydła i zdrowia publicznego Następne w Polsce?
POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Dziękuję za uwagę Zapraszam do współpracy