Rozdział 6 Data Mining w doborze parametrów układu testującego urządzenia EAZ 1 Streszczenie. W rozdziale został zaproponowany sposób doboru parametrów układu testującego urządzenia elektroenergetycznej automatyki zabezpieczeniowej (EAZ) metodami Data Mining. Opisano zastosowane metody badawcze oraz wykorzystanie metod Data Mining za pomocą programów DeTreex oraz Microsoft SQL Server with Analysis Services. 1 Wstęp Coraz większy rozwój metod sztucznej inteligencji [2], a w konsekwencji metod Data Mining powoduje, że znajdują one zastosowanie w różnych dziedzinach nauki. Znane są przypadki zastosowania ich w medycynie, diagnostyce, ekonomii [1], [5], [6]. W rozdziale opisano sposoby umożliwiające zastosowanie Data Mining jako metody doboru parametrów układu testującego urządzenia elektroenergetycznej automatyki zabezpieczeniowej (EAZ) [3]. Jako narzędzia realizacji tego zadania wybrano program DeTreex firmy Aitech, który wchodzi w skład pakietu SPHIN oraz program Microsoft SQL Server with Analysis Services. 2 Zdefiniowanie problemu Obiektem badań jest układ do testowania urządzeń elektroenergetycznej automatyki zabezpieczeniowej (EAZ). Głównymi wymaganiami dla systemu testującego urządzenia EAZ są: prosta obsługa, skrócenie czasu testowania (szczególnie w procesach powtarzalnych) i mo- 1 Pracę wykonano w ramach projektu badawczego finansowanego ze środków Zintegrowanego Programu Operacyjnego Rozwoju Regionalnego (Działanie 2.6: Regionalne strategie innowacyjne i transfer wiedzy) z udziałem Europejskiego Funduszu Społecznego. Izabela Skorupska, Marek Kopeć Uniwersytet Zielonogórski, Studium Doktoranckie na Wydziale Elektrotechniki, Informatyki i Telekomunikacji, ul. Podgórna 50, 65-246 Zielona Góra, Polska email: {I.Skorupska, M.Kopec}@weit.uz.zgora.pl Jan Jagielski Uniwersytet Zielonogórski, Instytut Metrologii Elektrycznej, ul. Podgórna 50, 65-246 Zielona Góra, Polska email: J.Jagielski@ime.uz.zgora.pl
I. Skorupska, J. Jagielski, M. Kopeć żliwie duża dokładność. Do tego celu doskonale nadaje się uproszczona struktura systemu testującego, przedstawiona na rys.1. Zadajnik (kalibrator) przedstawiono jako człon inercyjny drugiego rzędu, badany obiekt oraz przetwornik jako człony opóźniające. Funkcję regulatora całkującego pełni komputer. Operator systemu zadaje rodzaj i wartość wymuszenia. W zależności od wymuszenia kalibrator podaje daną wartość na obiekt. Odpowiedź obiektu po przetworzeniu na sygnał cyfrowy porównuje się z sygnałem zadanym i w zależności od wyniku zmienia się wartość wymuszenia. Układ ten został dokładniej opisany w [3], [4]. 1 + - 1 T s 3 5 2 1 (T 1s + 1) (T 2s + 1) kalibrator τ e -s 1 testowane urządzenie EAZ 3 Y komputer ϕ - + - U,I,f, - wartość zadana Y - wartość wyjściowa 4 e -s τ2 przetwornik a/c Rys. 1. Schemat uproszczony układu do testowania urządzeń EAZ Zadaniem jest taki dobór parametrów układu, aby otrzymać możliwie prostą strukturę spełniającą założenia optymalnego testowania nowoczesnych urządzeń EAZ (najkrótszy czas odpowiedzi układu oraz możliwie najmniejsze przeregulowanie). Jako kryterium oceny przyjęto czas regulacji i przeregulowanie (maksymalna amplituda odpowiedzi układu do jej wartości ustalonej wyrażona w jednostkach względnych). W początkowym etapie prac [4] badana była możliwość zastosowania algorytmów genetycznych do ustalania parametrów układu testującego urządzenia EAZ. Uzyskane wyniki spowodowały, iż rozpoczęto prace nad zastosowaniem innych metod ustalania parametrów układu EAZ. Postanowiono sprawdzić, czy możliwe będzie zastosowanie metod Data Mining do automatycznej generacji reguł wyboru parametrów badanego układu. 3 Przebieg badań Badania sprowadzają się do takiego doboru parametrów układu: stałych kalibratora T1 i T2, stałej komputera Tc oraz stałej obiektu Tob, aby układ cechował się małym przeregulowaniem oraz krótkim czasem odpowiedzi. W programie MATLAB zasymulowano układ dla ustalonej stałej urządzenia oraz dla zmieniających się stałych kalibratora i komputera (zakres zmian każdej zmiennej <0.01, 10> z krokiem 0.1). Wyniki wielogodzinnych symulacji zostały zapisane do pliku. Powstała baza danych zawierająca milion rekordów. Baza ta została poddana wstępnej analizie za pomocą programów dokonujących analiz w oparciu o algorytmy sztucznej inteligencji. Pierwszym wykorzystanym programem był program DeTreex, który pozwala z bazy danych tworzyć drzewa decyzyjne i przekształcać je w reguły. Aby można było użyć zgromadzonych danych symulacyjnych jako danych uczących, należało je sformatować zgodnie z 68
Data Mining w doborze parametrów układu testującego urządzenia EAZ wymaganiami programu DeTreex. Najprostszym sposobem było użycie programu MS- Excel. Za jego pomocą odpowiednio je sformatowano a następnie użyto w programie De- Treex. Na tym etapie pojawiły się pierwsze ograniczenia związane z maksymalną ilością wierszy, które można było wczytać do arkusza Excela. W związku z tym, że nie wszystkie dane można było od razu zaimportować, zdecydowano się na zawężenie obszaru badań i zmniejszenie zakresu danych poddanych analizie (wybrano przedział zmienności <0.01, 1> ponieważ w tym przedziale zaobserwowano najkorzystniejsze wyniki). Reguły, uzyskane we wstępnym etapie, za pomocą programu DeTreex pozwoliły na odkrycie pewnych zależności oraz na stwierdzenie, że zbyt duża dokładność przy zbieraniu danych pomiarowych nie była konieczna, wręcz przeciwnie, nadmiarowość danych powodowała tylko komplikacje. Pozwoliło to na przeprowadzenie kolejnych symulacji ograniczając zakres zmiany zmiennych oraz wprowadzając dodatkową zmienną dotyczącą stałej obiektu. Na podstawie wstępnych badań opracowano harmonogram kolejnych prac: 3.1 Symulacja dla 10 różnych stałych obiektu Stałe obiektu zmieniały się w zakresie <0.1, 1> z krokiem 0.1, T1, T2, T0 w zakresie <0.1, 4.6> z krokiem 0.5. Odczytywany był czas ustalania t ust oraz przeregulowanie. W wyniku symulacji uzyskano 22000 rekordów danych. Zostały one zaimportowane do programu Excel. Wierszom, które spełniały zależność: t ust <10 i przeregulowanie <110 przypisano wartość PRAWDA, pozostałym FAŁSZ. Przykładowe dane zgromadzone w pliku zostały przedstawione w tabeli 1. Tabela 1. Przykładowe dane uzyskane w wyniku symulacji T1 T2 Tc Tob decyzja 0,1 0,1 0,1 0,1 FAŁSZ 0,1 0,1 0,6 0,1 FAŁSZ 0,1 0,1 1,1 0,1 FAŁSZ 0,1 0,1 1,6 0,1 FAŁSZ 0,1 0,1 2,1 0,1 FAŁSZ 0,1 0,1 2,6 0,1 PRAWDA 0,1 0,1 3,1 0,1 PRAWDA 0,1 0,1 3,6 0,1 PRAWDA 0,1 0,1 4,1 0,1 PRAWDA 0,1 0,1 4,6 0,1 FAŁSZ 0,1 0,6 0,1 0,1 PRAWDA 0,1 0,6 0,6 0,1 FAŁSZ 0,1 0,6 1,1 0,1 FAŁSZ 0,1 0,6 1,6 0,1 FAŁSZ 0,1 0,6 2,1 0,1 FAŁSZ 0,1 0,6 2,6 0,1 FAŁSZ 69
I. Skorupska, J. Jagielski, M. Kopeć 3.2 Generowanie drzewa decyzyjnego przez program DeTreex Uzyskane dane wykorzystano do wygenerowania drzewa decyzyjnego (rys. 2). Rys. 2. Drzewo decyzyjne wygenerowane przez program DeTreex 3.3 Odczytanie reguł (stworzonych przez program DeTreex), które miały wartość PRAWDA Na podstawie drzewa decyzyjnego program DeTreex stworzył 55 reguł. Odczytane zostały te, które miały wartość PRAWDA i były prawdziwe, dla co najmniej 5 przypadków. Na podstawie wygenerowanych reguł można było ustalić zakres zmian parametrów układu. Zostały one przedstawione w tabeli 2. Tabela 2. Zależności wygenerowane przez program DeTreex dla decyzji PRAWDA T1 T2 Tc Tob Prawdziwe dla (1.1, 3.1> 0.1 0.6 0.5 48 0.1 (1.1, 3.1> 0.6 0.4 40 (1.1, 3.6> (0.1, 0.6> 0.6 0.3 20 (0.1, 0.6> (1.1, 3.6> 0.1 0.3 20 0.1 (2.1, 3.6> 0.1 >0.4 18 (2.1, 3.6> 0.1 0.1 >0.5 15 0.1 0.1 (2.1, 4.1> 0.1 8 0.1 (3.1, 3.6> (0.1, 0.6> 0.4 5 70
Data Mining w doborze parametrów układu testującego urządzenia EAZ 3.4 Analiza danych za pomocą programu Microsoft SQL Server with Analysis Services Dane uzyskane w wyniku symulacji zostały zaimportowane do bazy danych MSSQL. Następnie zastały poddane analizie za pomocą opcji Analysis Services. Utworzone zostało drzewo decyzyjne przedstawione na rys. 3. Rys. 3. Drzewo decyzyjne wygenerowane przez program Microsoft SQL Server with Analysis Services 3.5 Odczytanie reguł (stworzonych przez program Microsoft SQL Server with Analysis Services), które miały wartość PRAWDA Analogicznie jak w punkcie 3.3 odczytano reguły, dla których wartość PRAWDA wystąpiła nie mniej niż 5 razy. Wyniki zostały przedstawione w tabeli 3. 71
I. Skorupska, J. Jagielski, M. Kopeć Tabela 3. Zależności wygenerowane przez program DeTreex dla decyzji PRAWDA T1 T2 Tc Tob Prawdziwe dla (0.73, 0.73 0.23 0.33 40 3.72> (0.73, 0.23 0.23 >0.33 27 3.72> T1 0.73 or 0.73 0.23 ---------- 9 T1>3.73 0.73 (0.73, 3.72> <0.23 0.33 40 0.23 (0.73, 3.72> 0.23 >0.33 27 0.73 (3.72, 4.72> 0.23 ---------- 5 >0.98 0.23 (0.23, 0.73> 0.53 30 0.23 (0.23, 4.72> (0.23, 0.73> 0.53 30 0.23 0.23 >0.73 0.23 10 Analizując dane zgromadzone w tabelach 2 i 3 można zauważyć, że niektóre zależności są porównywalne, szczególnie, jeśli weźmie się pod uwagę fakt, że w przypadku badanego obiektu wartość zmiennej T1 można zamienić z wartością zmiennej T2 (w kalibratorze na rys. 1). W dalszych badaniach wyniki uzyskane za pomocą metod Data Mining zostaną zweryfikowane w układzie fizycznym. Uzyskane dane pozwalają stwierdzić, że wygenerowane reguły mogą mieć praktyczne zastosowanie w dobieraniu parametrów układu testującego urządzenia EAZ. Z analiz wynika, że stała obiektu (Tob) nie powinna występować jako zmienna i nie należałoby brać jej pod uwagę w dalszych badaniach. Należałoby również przeprowadzić kolejne analizy dla obiektów o różnych parametrach, ale nie analizować ich odnosząc do zmian stałej obiektu. 4 Wnioski Wykorzystano dwa programy Data Mining, które na podstawie zgromadzonych danych umożliwiły odkrycie zależności występujących między parametrami układu testującego urządzenia EAZ. Każdy z omawianych programów wygenerował nieco inne drzewo oraz stworzył inne, porównywalne reguły. Wartości, na których bazują reguły w przypadku programu DeTreex nie wykraczają poza przyjęty zakres zmian badanych zmiennych (często są ich podzbiorami). W przypadku programu SQL wskazane przedziały zawsze posiadają wartości niebędące bezpośrednimi podzakresami zmiennych, co pozwala stwierdzić, że w przypadku zmiany dokładności pomiarów, wygenerowane reguły będą bardziej użyteczne. Literatura 1. Buchalski Z.: Wspomaganie diagnostyki i leczenia chorób nerek przy wykorzystaniu systemu ekspertowego. Pomiary Automatyka Kontrola, 2005, nr 9, wyd. spec., s. 346 347. 2. Cichosz P.: Systemy uczące się. Wydawnictwa Naukowo Techniczne, Warszawa, 2000. 72
Data Mining w doborze parametrów układu testującego urządzenia EAZ 3. Kopeć M.: Testowanie nowoczesnych urządzeń elektroenergetycznej automatyki zabezpieczeniowej, Informatyka sztuka czy rzemiosło KNWS '04: materiały konferencji naukowej. Zielona Góra, Polska, 2004. Oficyna Wydaw. Uniwersytetu Zielonogórskiego, Zielona Góra, 2004, s. 201 206. 4. Jagielski J., Skorupska I.: Zastosowanie algorytmów genetycznych do ustalania parametrów układu testującego urządzenia elektroenergetycznej automatyki zabezpieczeniowej. Pomiary Automatyka Kontrola, 2005, nr 9, wyd. spec., s. 131 133. 5. Jagielski J., Skorupska I.: Wiedza uświadomiona i nieuświadomiona w kształtowaniu procedury diagnostycznej, Pomiary Automatyka Kontrola, 2005, nr 9, wyd. spec., s. 151 153. 6. Jagielski J., Kopeć M., Skorupska I.: Zapobieganie awariom na podstawie wiedzy uzyskanej z bazy danych, Automatyzacja i eksploatacja systemów sterowania i łączności / red. nauk. Z.Kitowski, J.Lisowski, Akademia Marynarki Wojennej, Gdynia, 2005, s. 167 172. 7. Michalik K.: DeTreex 4.0 indukcyjny system pozyskiwania wiedzy podręcznik użytkownika, Katowice 2003. 8. Pomoc programu DeTreex. 9. Pomoc programu PC-Shell. 10. Pomoc programu Microsoft SQL Server with Analysis Services. 73