Zastosowania metod odkrywania wiedzy do diagnostyki maszyn i procesów Wojciech Moczulski Politechnika Śląska Katedra Podstaw Konstrukcji Maszyn Sztuczna inteligencja w automatyce i robotyce Zielona Góra, 22 kwietnia 2005
Plan referatu Wprowadzenie Problem Przykłady odkrywania wiedzy z zakresu: diagnostyki maszyn diagnostyki procesu Podsumowanie 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 2
Wprowadzenie Maszyny, urządzenia i procesy są nadzorowane z wykorzystaniem systemów bazujących na wiedzy Wiedzę można odkrywać w bazach danych Dane mogą pochodzić: z pomiarów z odpowiednio zaplanowanych symulacji 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 3
Odkrywanie wiedzy w bazach danych (1) Nietrywialny proces identyfikowania ważnych, nowych, potencjalnie użytecznych i ostatecznie zrozumiałych wzorców/regularności regularności występujących w danych Ang.. Knowledge Discovery in Databases, KDD 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 4
Odkrywanie wiedzy w bazach danych (2) Regularność - wyrażenie w języku reprezentacji danych, zachodzące w jakimś podzbiorze tych danychd Ważność danej regularności określa się np. za pomocą stopnia pewności Odkryte regularności powinny być nowe (nieznane)) co najmniej dla systemu odkryć 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 5
Rodzaje regularności (1) Jakościowe: Tablice kontyngencji Reguły Drzewa decyzyjne Równoważności logiczne.... Ilościowe: Równania Zależności funkcyjne.... 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 6
Rodzaje regularności (2) Statyczne (przedstawione uprzednio): Regularności nie uwzględniające czasu Dynamiczne: Modele jakościowe Równania różniczkowe Równania różnicowe Sekwencje zdarzeń.... 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 7
Problem Opracować środki reprezentacji wiedzy przydatnej w diagnostyce technicznej: Maszyn i urządzeń (wiedza statyczna) Maszyn, urządzeń i procesów (wiedza dynamiczna) Opracować metody odkrywania wiedzy reprezentowanej za pomocą tych środków 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 8
Odkrywanie wiedzy z zakresu diagnostyki maszyn Opracowane na podstawie: P. Kostka: Metody klasyfikacji postaci kinetostatycznych linii wałów maszyn wirnikowych,, Pol. Śląska, Gliwice 2001
Omawiane zagadnienia Problem diagnostyczny Zastosowana metoda Uzyskane wyniki Wnioski 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 10
Problem diagnostyczny (1) Niewspółosiowość powoduje do 50% niesprawności maszyn wirnikowych Nadmierne drgania - symptomem niewyosiowania [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 11
Problem diagnostyczny (2) Czy można określić relacje pomiędzy cechami sygnału i stanem niewyosiowania? Czy metodykę KDD można zastosować do odkrywania relacji diagnostycznych (odwrotnych)? 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 12
Modelowany turbogenerator [Cholewa, Kiciński, 1997] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 13
Eksperyment jako źródło danych Eksper perymenty y bierne Eksper perymenty czynne Współcześnie: eksperymenty numeryczne (wyniki zależne od jakości modelu) 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 14
Zarys metody 1. DZIAŁANIE Planowanie eksperymentu diagnostycznego 2. Przeprowadzenie eksperymentu 3. Obliczenie wartości cech sygnałów 4. Wstępna selekcja cech 5. Grupowanie rekordów wartości cech 6. Wybór cech istotnych 7. Indukcja klasyfikatorów 8. Selekcja klasyfikatorów WYNIK Lista konfiguracji linii łożysk Zbiór realizacji sygnałów diagnostycznych Baza zbiorów uczących umożliwiająca indukcję klasyfikatorów metodami uczenia maszynowego Klasyfikatory kinetostatycznej linii wału Klasyfikatory optymalne ze względu na przyjęty układ kryteriów [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 15
Plan eksperymentu diagnost. (1) Płaszczyzna promieniowa łożyska i Przemieszczenie R i θ i Położenie nominalne Zakres przemieszczeń [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 16
Plan eksperymentu diagnost. (2) Płaszczyzna promieniowa i-tego łożyska [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 17
Warianty danych dot. linii wałów Przemieszczenia pojedynczego łożyska Przypadki : 7 625 Przemieszczenia wszystkich łożysk Przykłady pozytywne 2 2000 Kontrprzykłady 1333 [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 18
Definiowanie granic klas (1) Płaszczyzna promieniowa i-tego łożyska [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 19
Definiowanie granic klas (2) Płaszczyzna promieniowa i-tego łożyska [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 20
Definiowanie granic klas (3) Płaszczyzna promieniowa i-tego łożyska [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 21
Selekcja atrybutów V5 T(a1,d) V5 T(a2,d) C3 V4 V4 C4 C1 C2 V3 V2 V3 V2 C5 V1 V1 V0 C1 C2 C3 C4 C5 V0 C1 C2 C3 C4 C5 V ( a ) > V ( ) C = 1 C = a 2 [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 22
Przykładowe wyniki klasyfikacji [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 23
Koncepcja rozmytych granic klas Przykładowe błędy: ε fw = 1 card{ E wa( θ ) wr( R Liczba przykładów: 614 Błąd całkowity: 6.19% Liczba błędów: 38 Rozmyty błąd całkowity (10%): 3.15% t } η k= 1, K, n k err k k ) [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 24
Weryfikacja metody Ocena jakości klasyfikatorów 2.4 6.2 4.1 2.0 2.3 5.7 3.9 3.6 2.2 2.1 6.1 5.3 3.2 2.5 2.8 6.5 Błąd względny, % 10 11 7 12 9 10 12 12 14 15 15 21 10 13 15 8 Ilu atrybutów użyto? [P. Kostka, 2001] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 25
Podsumowanie i wnioski Metoda umożliwia budowę klasyfikatorów do diagnozowania złożonych obiektów Nowe wyniki dotyczą: Planowania eksperymentu diagnostycznego Budowy zbiorów przykładów uczących Indukcji klasyfikatorów Oceny klasyfikatorów za pomocą błędu bazującego na rozmytych granicach klas 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 26
Podziękowania Prof. Jan Kiciński,, IMP I PAN - za udostępnienie systemu symulacyjnego MESWIR-NLDW oraz za wiele dyskusji Badania przeprowadzone przez P. Kostkę i autora w ramach grantów nr 7T07B 046 16 i 7T07B 002 17 finansowanych przez KBN 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 27
Odkrywanie wiedzy z zakresu diagnostyki procesów Opracowane na podstawie: R. Szulim: Metoda pozyskiwania wiedzy do wspomagania prowadzenia złożonego procesu technologicznego, Uniwersytet Zielonogórski, 2004
Przykład procesu przemysłowego 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 29
22.04.2005 W. Moczulski, Pol. Śląska, KPKM 30
Wprowadzenie (1) Złożony proces przemysłowy charakter cykliczny czas trwania cyklu uzależniony od osiągnięcia określonego stanu sterowanie przez operatora w pętli otwartej znaczna liczba parametrów procesowych do kontroli 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 31
Wprowadzenie (2) Znaczny indeterminizm sterowania: różna wiedza posiadana przez obsługę wiele czynników musi być ocenianych Błędne decyzje dotyczące sterowania mogą powodować: nieosiągnięcie celu sterowania (w zadanym czasie) uszkodzenia sterowanego obiektu 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 32
Wprowadzenie (3) Wiele źródeł danych systemy SCADA pracownicy wprowadzający dane manualnie Systemy te gromadzą dane historyczne 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 33
Przykłady realizacji procesu 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 34
16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 Przykłady realizacji procesu 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 35 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Opis potrzeby Brak komputerowych środków wspomagania operatorów procesu Należy wspomagać takie działania, jak: ocena stanu procesu podejmowanie decyzji dotyczących sterowania przebiegiem procesu 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 36
Sformułowanie problemu (1) Proces ma charakter dynamiczny Przebieg poprzednich cykli wpływa na kolejny cykl Modele procesu uzyskane poprzez identyfikację są mało przydatne 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 37
Sformułowanie problemu (2) Dostępne liczne realizacje procesu (niesklasyfikowane),, obejmujące wejścia, wyjścia i stany dla wielu realizacji rozpatrywanego procesu: szeregi czasowe wartości zmiennych procesowych wartości dyskretne (odczyty, spostrzeżenia) Przedmiotem identyfikacji są miękkie modele procesów 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 38
Rozumowanie oparte na przykładach (CBR) Stosowane w razie trudności zbudowania modeli matematycznych, neuronowych i innych Wymaga zbudowania reprezentatywnej bazy przykładów Należy opracować sposób reprezentacji przykładów i miarę ich podobieństwa Wyszukuje rozwiązanie na podstawie analogii do historycznych przykładów 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 39
Cykl CBR 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 40
Bazy przykładów dla cykli i dla faz 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 41
Sposób reprezentacji wiedzy o procesie dynamicznym (1) Dynamiczne stwierdzenie rozmyte (DSR) <Typ, Poziom, Czas, Symetria> Typ = nagły_spadek, powolny_spadek, stabilizacja, powolny_wzrost, nagły_wzrost Poziom = mały, średni, duży Czas = krótki, średni, długi Symetria = niesymetria,, mała_niesymetria niesymetria, symetria Do opisu przebiegów ciągłych - lista DSR 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 42
Opis procesu dynamicznego 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 43
22.04.2005 W. Moczulski, Pol. Śląska, KPKM 44
Sposób reprezentacji wiedzy o procesie dynamicznym (2) Realizacja procesu opisana przez: Stan początkowy Przebieg sterowania Stan końcowy 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 45
Aproksymacja i reprezentacja przykładów Zdarzenie: Typ Czas Wartość początkowa (wp) 1 Mało Średnio Dużo Wp(x)=<µ mało (x), µ średnio (x), µ dużo (x)> 0 Wartość Funkcje przynależności zbiorów rozmytych 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 46
Miara podobieństwa przebiegów (1) Podobieństwa cząstkowe poszczególnych atrybutów określa się na podstawie: wektora funkcji przynależności specjalnych macierzy wag Podobieństwo pojedynczych zdarzeń jest iloczynem podobieństw cząstkowych, ważonych przez czas trwania zdarzenia Podobieństwo dwóch realizacji określa się dla różnej liczby zdarzeń w porównywanych cyklach 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 47
Miara podobieństwa przebiegów (2) Podobieństwo pary zdarzeń Podobieństwo cząstkowe (5) (6) gdzie gdzie np. określa podobieństwo wartości (7) (8) 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 48
Miara podobieństwa przebiegów (3) Podobieństwo dwóch realizacji: (9) gdzie waga (10) określa wpływ czasu trwania zdarzenia na jego wagę (11) (12) 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 49
Miara podobieństwa przebiegów (4) Porównuje przykłady w sposób przybliżony Porównuje różne długości przebiegów Nie wymaga skalowania wartości Wymaga zdefiniowania wielu parametrów: Funkcji przynależności zbiorów rozmytych Macierzy podobieństwa zbiorów rozmytych 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 50
Weryfikacja metody: HIPOTEZA JEŚLI dla realizacji procesu ich stany początkowe leżą w DOSTATECZNIE BLISKIM SĄSIEDZTWIE, TO zastosowanie DOSTATECZNIE PODOBNYCH STEROWAŃ PROWADZI DO PODOBNYCH WYJŚĆ 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 51
Strojenie parametrów systemu System CBR zawiera 87 parametrów: Parametry funkcji przynależności Macierze podobieństwa Macierze wag Intuicyjny dobór wartości parametrów nie prowadził do dobrych wyników Zastosowano algorytm ewolucyjny 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 52
Określenie funkcji dopasowania Wyrażenie na wartość funkcji dopasowania gdzie: (13) Ile cykli podobnych ze względu na wejście i sterowanie jest także podobnych ze względu na wyjście Ile prób wyszukania przeprowadzono 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 53
Reprezentacja danych Definicje zbiorów rozmytych Wejście Atrybut 1 Atrybut 2 Definicje macierzy podobieństwa Sterowanie Atrybut 3 Atrybut 1 A B C D Definicja zbiorów rozmytych A B C 1 0.7 0.2 Chromosom Atrybut 2 D E F 0.7 1 0.7 Atrybut 3 G H J 0.2 0.7 1 Definicja macierzy podobieństwa Wyjście Atrybut 1 Atrybut 2 Atrybut 3 [R. Szulim, 2004] 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 54
Operatory genetyczne Mutacja (14) (15) Krzyżowanie (16) 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 55
Naprawa parametrów Naprawa polega na przywróceniu zależności pomiędzy wartościami opisującymi granice zbiorów i macierze podobieństwa, np.: A < B < C < D (dla zbiorów) A > B > C (dla macierzy) E > F 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 56
Przykładowe wyniki Przed strojeniem podobieństwo =0,56 Po strojeniu podobieństwo =1 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 57
Podsumowanie i wnioski Dane archiwalne można użyć do budowy bazy wiedzy w postaci bazy przykładów Wymagane jest zbudowanie odpowiednich sposobów reprezentacji przykładów i ich miar podobieństwa Parametry systemu reprezentacji danych i obliczania podobieństw mogą być strojone za pomocą algorytmu ewolucyjnego 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 58
Podsumowanie
Inne rozwijane metody KDD dla zależności dynamicznych Odkrywanie zależności jakościowych reprezentowanych za pomocą sekwencji zdarzeń Odkrywanie zależności funkcyjnych za pomocą: Gramatyk bezkontekstowych Iteracyjnej transformacji atrybutów w bazie danych 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 60
Podsumowanie (1) Współcześnie dostępnych jest coraz więcej baz danych diagnostycznych Metodyka odkrywania wiedzy w bazach danych umożliwia uzyskanie modeli statycznych i dynamicznych Modele funkcyjne (równania) umożliwiają dokładną predykcję 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 61
Podsumowanie (2) Proces odkrywania wiedzy w bazach danych może przebiegać autonomicznie Celowe jest prowadzenie dalszych badań nad rozwojem metodologii odkrywania wiedzy diagnostycznej Odkryte modele jakościowe i ilościowe mogą być stosowane do generowania residuów wykorzystywanych do detekcji i lokalizacji uszkodzeń 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 62
Dziękuję za uwagę 22.04.2005 W. Moczulski, Pol. Śląska, KPKM 63