Instytut Badań Systemowych Polskiej Akademii Nauk

Transkrypt

1 Instytut Badań Systemowych Polskej Akadem Nauk ul. Newelska Warszawa Przemysław Cholajda Zastosowane genetycznego generowana reguł rozmytych do wspomagana dagnostyk transformatorów Rozprawa doktorska Promotor: prof. Potr Szczepanak

2 Sps treśc. WSTĘP ELEMENTY TEORII ZBIORÓW ROZMYTYCH POJĘCIA PODSTAWOWE LASY FUNCJI PRZYNALEśNOŚCI LASYCZNE OPERACJE NA ZBIORACH ROZMYTYCH LASYCZNY ALGORYTM GENETYCZNY POJĘCIA BIOLOGICZNE PODSTAWOWE POJĘCIA I PARAMETRY TWIERDZENIE O SCHEMATACH TRADYCYJNE METODY OPTYMALIZACJI DIAGNOSTYA MASZYN ROZPOZNAWANIE WZORCÓW PODZIAŁ LASYCZNY I ROZMYTY GRUPOWANIE ROZMYTE GENEROWANIE REGUŁ W OPARCIU O ROZMYTĄ ANALIZĘ DANYCH GENEROWANIE I GENETYCZNA REDUCJA ROZMYTYCH REGUŁ LASYFIUJĄCYCH GENEROWANIE REGUŁ ROZMYTYCH REDUCJA LICZBY REGUŁ POPRZEZ ZMNIEJSZANIE LICZBY PODZIAŁÓW ZMNIEJSZANIE LICZBY REGUŁ ZA POMOCĄ ALGORYTMU GENETYCZNEGO Postawene problemu odowane chromosomu Funkcja przystosowana Wybór populacj startowej warunku zakończena algorytmu Operator selekcj, stratega eltarna Operator krzyŝowana, operator nwersj Operatory mutacj klasyczny kodujące wedzę o zadanu Interpretacja wynków DIAGNOSTYA TRANSFORMATORÓW PROBLEMY I METODY DIAGNOSTYA NA PODSTAWIE REZULTATÓW CHROMATOGRAFII GAZOWEJ (DGA) Chemczne podstawy chromatograf gazowej Metoda kodu IEC Metoda polska Metoda polska pogłębona Metoda nemecka Metoda francuska Metoda kanadyjska Zalecena eksperta Analza porównawcza metod klasycznych METODY NIESTANDARDOWE Zmodyfkowana metoda a-najblŝszych sąsadów Metoda rozmytego kodu IEC Dyskretyzacja Drzewo decyzyjne Budowane reguł za pomocą algorytmu genetycznego Sec Pedrycza

3 7. GENETYCZNY WYBÓR REGUŁ ROZMYTYCH NA PRZYŁADZIE WSPOMAGANIA DIAGNOSTYI TRANSFORMATORA POSTAWIENIE PROBLEMU PRZYGOTOWANIE ZBIORU DANYCH UCZĄCYCH GENEROWANIE REGUŁ ONWERSJA DANYCH UCZĄCYCH REGULACJA ROZMIARU PRZESTRZENI DANYCH PARAMETRYZACJA ALGORYTMU GENETYCZNEGO PORÓWNANIE TECHNI GENEROWANIA REGUŁ MODUŁ SYSTEMU ESPERTOWEGO: TRAFO PODSTAWY SYSTEMÓW ESPERTOWYCH MODUŁ TRAFO Baza danych pomarowych Baza faktów Baza wedzy stałej Baza reguł Interfejs uŝytkownka Trafo Interfejs uŝytkownka Trafo2000_ext Interfejs uŝytkownka ga_new Fuzzy3D PODSUMOWANIE DODATE A. OPIS OPROGRAMOWANIA ZAŁĄCZONEGO DO PRACY DODATE B. WYAZ SRÓTÓW I SYMBOLI LITERATURA PODSTAWOWA LITERATURA UZUPEŁNIAJĄCA ADRESY INTERNETOWE Wszelke nazwy frm ch produktów oraz znak towarowe występujące w pracy są znakam zastrzeŝonym odpowednch właśccel. Zostały one uŝyte jedyne w celu dentyfkacj, co ne pownno być traktowane jako naruszene praw autorskch.

4 4. Wstęp W pracy badana jest metoda rozmytej klasyfkacj prowadząca do automatycznego generowana reguł decyzyjnych, których lczba ulega stotnej redukcj (przy jednoczesnym zapewnenu dobrej jakośc klasyfkacj) w wynku zastosowana algorytmu genetycznego. Metodę zastosowano do praktycznego zadana klasyfkacj wynków pomarów stęŝeń gazów w oleju transformatorowym. Tym samym stworzono nową technkę wspomagana dagnostyk transformatorów w oparcu o rzeczywste dane pomarowe zebrane w przeszłośc dla danej klasy transformatorów technkę odzwercedlającą w pewen sposób uczene (sę) oparte na dośwadczenu [57]. Zaproponowana metoda nadaje sę takŝe do zastosowana dla nnych zadań praktycznych oraz teoretycznych. Operając sę na badanach teoretycznych przeprowadzonych eksperymentach, tj. oblczenach dla trudnego zadana dagnostycznego o duŝym znaczenu praktycznym, sformułowana została następująca teza: Dzęk wykorzystanu nowych, dopasowanych do zadana mechanzmów genetycznych uogólnenu metody generowana rozmytych reguł klasyfkacj na przypadek welowymarowy, moŝlwe jest przeprowadzene skutecznej klasyfkacj za pomocą stotne zredukowanej lczby reguł rozmytych, otrzymanych w oparcu o trudnoseparowalne dane cech loścowych badanych obektów. W celu potwerdzena tak postawonej tezy przeanalzowano rozwązano wele problemów szczegółowych oraz uzyskano orygnalne wynk naukowe, które moŝna podsumować wymenając poszczególne dokonana, a są to: a) Nelnowe przekształcene n-wymarowej przestrzen danych celem ch rozrzedzena w obszarach trudnych dagnostyczne, co doprowadza do modyfkacj funkcj przynaleŝnośc zborów rozmytych. b) Adaptacja metody generowana reguł wnoskowana z uŝycem grupowana genetycznego do przypadku przestrzen n-wymarowej. c) Rozszerzene na przypadek n-wymarowy automatycznego generowana reguł rozmytych.

5 d) Herarchzacja jakośc klasyfkacj w przypadku uzyskana klku konkurencyjnych sztucznych ekspertów, czyl róŝnych zestawów reguł o podobnej efektywnośc, ale dokonujących neco nnej klasyfkacj w obszarach wątplwych. e) Zastosowane metod z punktów a) d) do dagnostyk transformatorów w oparcu o analzę chromatografczną gazów rozpuszczonych w oleju. Poza wcześnejszym publkacjam autora nnejszej pracy neznane są autorow nne podobne prace. f) Dokonywane ocen pewnośc dagnozy stawanej w oparcu o mędzynarodowy standard IEC [4]. g) Wykonane modułu systemu ekspertowego [6] wykorzystującego opsywaną w punkce e) metodę oraz klasyczne metody dagnostyk transformatorów w oparcu o analzę chromatografczną gazów rozpuszczonych w oleju. Dodatkowo dokonano analzy porównawczej klasycznych, opartych o analzę gazów, metod dagnostyk transformatorów. Ocenono takŝe klka metod nestandardowych dla tego zadana. 5 Na szczegółowo opsaną rozwjaną metodę składają sę dwa główne etapy: Rozmyte określane (w forme reguł) przynaleŝnośc badanych obektów do podobszarów przestrzen decyzyjnej, które powstają poprzez coraz drobnejszy podzał tej przestrzen. Na kaŝdej os układu współrzędnych zdefnowane są zachodzące na sebe wykresy funkcj rozmytej przynaleŝnośc obektów do sąsadujących podobszarów (rysunek 5-). Dzęk temu przynaleŝność do kaŝdego podobszaru ne jest ostra jednocześne zaleŝy od tego, czy wększość obektów w badanym podobszarze jest tej samej klasy, co badany obekt. Redukcja lczby reguł metodą ewolucyjną. Wskaźnk jakośc, zwany tutaj funkcją przystosowana, ocena lczbę reguł (dąŝącą do mnmum) lczbę poprawne sklasyfkowanych obektów (dąŝącą do maksmum). Dzęk temu algorytm pozostawa przydatną część reguł wyŝszego rzędu (tj. ze zgrubnych podzałów), a w trudnejszych decyzyjne obszarach dołącza reguły obowązujące w małych fragmentach przestrzen decyzyjnej (wyjątk od reguł wyŝszego rzędu).

6 6 Zaproponowaną metodę klasyfkacj zweryfkowano praktyczne na klku zadanach oblczenowych. Jednak szczególne znaczene ze względu na przydatność praktyczną mają eksperymenty przeprowadzone dla danych pochodzących z pomarów na rzeczywstych obektach transformatorach energetycznych. Rozmeszczene tych danych (rys. 7-2) w kartezjańskm układze współrzędnych czyn z nch szczególne trudny zbór do skutecznego wyznaczana granc obszarów przynaleŝnośc. Wprawdze część z nch jest rozłoŝona w obszarach dających sę dość dobrze zolować, jednak bardzo wele danych jest zgrupowanych częścowo wymeszanych w poblŝu środka układu współrzędnych jednej z jego os. Dodatkowo część przestrzen decyzyjnej zawera newelką lczbę danych (w praktyce pewne przypadk występują sporadyczne dlatego newele z nch jest rejestrowanych). Trudność sprawają teŝ dysproporcje w lczbe danych poszczególnych kategor (tabela 6-4), co jest cechą charakterystyczną tego problemu techncznego (w praktyce do dagnozowana oddawane są transformatory znaczne juŝ uszkodzone). Tym bardzej wyzywające wymagające jest to zadane testowe. UŜytą metodę zaprezentowano na tle nnych (rozdzał 4) posadających walor rozmytośc. Jak sę okazuje wele znanych metod ne nadaje sę w praktyce do analzy danych wykazujących tak duŝą neregularność. Usłując ocenć (zmaksymalzować) funkcję odzwercedlającą jakość wykonywanej klasyfkacj (maksmum) lczbę uŝytych w tym celu reguł (mnmum), czyl sprowadzając zadane klasyfkacj do zagadnena optymalzacj (rozdzał 3.4), ne moŝna wprost uŝyć metod optymalzacj dla zadań cągłych. Dla zadań dyskretnych metody dokładne, take jak algorytm pełnego przeglądu, są zbyt czasochłonne oblczenowo, a metody przyblŝone oraz losowe ne dają gwarancj znalezena odpowednego kompromsu pomędzy lczbą reguł, a jakoścą klasyfkacj. TakŜe metody nedetermnstyczne, take jak Monte Carlo, czy symulowanego wyŝarzana, ne dają takej gwarancj. lasyfkację moŝna teŝ wykonać bez posługwana sę regułam, poprzez porównane badanego obektu z juŝ znanym (do tych metod zalczamy m.n. metodę k najblŝszych sąsadów nazywaną teŝ a-najblŝszych sąsadów), jednak metody te ne dają uŝytkownkow wedzy w postac reguł decyzyjnych (rozdzał 3.4). Posługując sę z kole algorytmam analzy skupeń moŝemy otrzymać zbyt duŝą lczbę reguł, co utrudn człowekow ch nterpretację. Samoorganzujące sę sec neuronowe potrafłyby wprawdze po wyczerpującym trenngu wypracować klasyfkację, jednak ze względu na występujące rozdrobnene

7 rozrzucene obektów tych samych klas, nadmerne wzrastałaby lczba neuronów (przy załoŝenu, Ŝe tak mechanzm dodawana neuronów zostałby wbudowany). Ponadto brakuje mechanzmu redukcyjnego, uogólnającego, który pozwalałby uŝytkownkow ne tylko klasyfkować, ale takŝe nterpretować. Z doneseń lteraturowych [35] wadomo teŝ, Ŝe ne zaleca sę uŝywać sec tego typu do zadań klasyfkacj z powodu małej warygodnośc wynku. Slne stale rozwjające sę narzędze jakm są popularne obecne nelnowe klasyfkatory maksymalnoodległoścowe (support vector machnes) ne posadają jeszcze satysfakcjonującego sposobu wbudowana rozmytośc, co jest nezmerne stotne dla danych o takm rozkładze, jak te słuŝące dagnostyce stanu techncznego transformatorów. Dla tego narzędza ne spotyka sę mechanzmów redukcj lczby obszarów decyzyjnych. Z uwag tych wynka jasne przesłane, Ŝe wele cekawych zadań w ramach róŝnych metod pozostaje jeszcze do rozwązana w przyszłośc, leŝą one jednak poza zakresem jednej rozprawy. Nnejsza praca składa sę z 9 rozdzałów. W rozdzale perwszym (Wstęp) sformułowano tezę, uzasadnono celowość podjętych badań, przedstawono wykonane badana szczegółowe oraz krótko opsano układ zawartość pracy. W rozdzale drugm, trzecm czwartym opsano (odpowedno) podstawowe elementy teor zborów rozmytych, algorytmu genetycznego oraz grupowana rozmytego na potrzeby klasyfkacj. Rozdzały te są ne tylko wprowadzenem odpowednch pojęć, ale takŝe stanową odpowedne odnesene do badanej w pracy metody. Rozdzał pąty jest opsem teoretycznym rozwjanej w pracy metody. Przytoczone teŝ zostały w nm wynk uzyskane dla teoretycznych danych porównawczych. Rozdzał szósty przedstawa problemy napotykane podczas dagnozowana stanu techncznego transformatora przedstawa sposoby nterpretacj wynków analzy chromatografcznej gazów rozpuszczonych w oleju transformatora jednej z popularnejszych metod dagnostyk tych urządzeń elektrycznych. W rozdzale tym zawarte są takŝe rezultaty klasyfkacj wynków chromatograf gazowej wybranym metodam grupowana: metodą najblŝszych sąsadów oraz drzewa decyzyjnego. Zaprezentowane są teŝ wynk posłuŝena sę algorytmem genetycznym celem redukcj praw budujących drzewo decyzyjne oraz przedstawona jest metoda ocenana pewnośc dagnozy stawanej na podstawe metody zwanej kodem IEC [4]. 7

8 Rozdzał sódmy opsuje sposób rozwązana praktycznego zadana dagnostyk stanu techncznego transformatora za pomocą metody opsanej teoretyczne w rozdzale pątym. Rozdzał ósmy zawera ops oprogramowana Trafo2000 będącego mplementacją metod opsanych w rozdzałach od pątego do sódmego. Rozdzał dzewąty jest podsumowanem pracy. Na końcu pracy umeszczono wykaz uŝytych skrótów oraz symbol, wykaz cytowanej lteratury naukowej, wykaz nformatycznej lteratury uzupełnającej wymaganej do skonstruowana oprogramowana Trafo2000 oraz wykaz adresów nternetowych odsyłających do opracowań elektroncznych. 8

9 9 2. Elementy teor zborów rozmytych Zbory rozmyte umoŝlwają opsane zjawsk o charakterze neprecyzyjnym, których wyraŝene za pomocą języka wymaga uŝyca zwrotów oddających ów neprecyzyjny charakter, takch jak duŝo, średno, mało, trochę, wysoko, nsko tp. Termn zbory rozmyte wprowadzony został przez Zadeha [88] doczekał sę welu opracowań naukowych zarówno teoretycznych ([5], [3], [50], [92]), jak o praktycznych zastosowanach zborów rozmytych ([8], [74], [72], [6], [47], [23], [53]). Na potrzeby tej pracy wystarczającym jest posługwane sę jedyne podstawowym pojęcam z dzedzny zborów rozmytych. 2.. Pojęca podstawowe Nech dana będze nepusta przestrzeń X nazywana przestrzeną danych uczących (nekedy zborem danych uczących) lub obszarem analzy (czy teŝ obszarem rozwaŝań z ang. the unverse of dscourse) lub unwersum [59]. Zborem rozmytym A w pewnej nepustej przestrzen X, nazywamy zbór * par takch, Ŝe: A = { (x, µ A (x)); x X } (2-) gdze µ A : X 0, R ** jest funkcją przynaleŝnośc zboru rozmytego. Funkcja przynaleŝnośc dla kaŝdego x X określa stopeń przynaleŝnośc x do zboru rozmytego A, przy czym rozróŝnć moŝna trzy przypadk: a) µ A (x) = oznacza pełną przynaleŝność x do zboru A b) µ A (x) = 0 oznacza brak przynaleŝnośc x do zboru A c) 0 < µ A (x) < oznacza częścową przynaleŝność x do zboru A. Przypadek b) oznaczamy jako x A, a pozostałe przypadk - jako x A. W celu lepszego określena przypadków a) c) wprowadza sę pojęce nośnka supp (z ang. support) zboru rozmytego A (wzór 2-2). supp(a) = { x X; µ A (x)>0 } (2-2) ker(a) = nucleus(a) = { x X; µ A (x)= } (2-3) * Zbór jest pojęcem perwotnym teor mnogośc. ** R jest zborem lczb rzeczywstych wykaz uŝytych skrótów symbol znajduje sę w dodatku B do pracy.

10 WyróŜna sę ponadto pojęce jądro (z ang. kernel), czy teŝ nukleus [59] (z ang. nucleus) zboru rozmytego A (wzór 2-3). JeŜel A jest zborem skończonym, to funkcję przynaleŝnośc µ A : X 0, do zboru A moŝna podać w postac stablcowanej * dla x supp(a) lub za pomocą wzoru. Przykład 2- Nech X = C będze zborem lczb całkowtych określających w o C temperaturę powetrza. Neprecyzyjne określene cepło względem temperatury powetrza moŝna sformalzować w postac rozmytego zboru A określając tylko jego nośnk w sposób następujący: A = { (2, 0,2), (22, 0,4), (23, 0,6), (24, 0,8), (25, ), (26, 0,8), (27, 0,6), (28, 0,4), (29, 0,2) } lub za pomocą wzoru: A = { (x, µ A (x)); x ℵ} gdze µ A (x) = max{0, 25 x } 5 W badanach nad zboram rozmytym ch zastosowanam uŝywa sę klku standardowych postac (klas) funkcj przynaleŝnośc lasy funkcj przynaleŝnośc lasy funkcj przynaleŝnośc nazwano od kształtów wykresów tych funkcj. RozróŜnamy pęć [72] głównych klas funkcj przynaleŝnośc µ: R 0,. ) funkcja przynaleŝnośc klasy s zdefnowana jest wzorem (2-4). 0 dla x a 2 x a 2 dla a < x b µ s (x)= c a 2 a b c a, b, c R x c 2 < dla b x c c a dla x > c (2-4) Rysunek 2-. Wykres funkcj przynaleŝnośc klasy s * Funkcja stablcowana - termn nformatyczny wynkający ze sposobu zapamętana funkcj w pamęc komputera: dla funkcj określonej tylko w skończonej lczbe punktów dzedzny, wartośc funkcj w tych punktach zapamętane są w specjalne zaprogramowanej tablcy. Sposób takego zapsu uŝyty jest takŝe przy określanu macerzy U (rozdzał 4.2) - wartośc przynaleŝnośc obektów uczących (wzorców) do podzborów zboru uczącego.

11 2) funkcja przynaleŝnośc klasy π zdefnowana jest wzorem (2-5). µ π (x)= R + > + < < < c b b b c x dla b c x b c dla b b c x b c x b c dla b c x b c x b c dla b b c x b c x dla, 0 2 / ) ( 2 2 / 2 / 2 2 / ) ( (2-5) Rysunek 2-2. Wykres funkcj przynaleŝnośc klasy π 3) funkcja przynaleŝnośc klasy γ (w lteraturze [59] podaje sę teŝ nazwę klasa Γ) zdefnowana jest wzorem (2-6). µ γ (x)= R > < b a b a b x dla b x a dla a b a x a x dla, 0 (2-6) Rysunek 2-3. Wykres funkcj przynaleŝnośc klasy γ

12 2 4) funkcja przynaleŝnośc klasy t (w lteraturze [59] podaje sę teŝ nazwę klasa Λ) zdefnowana jest wzorem (2-7). µ t (x)= R > < < c b a c b a c x dla c x b dla b c x c b x a dla a b a x a x dla,, 0 0 (2-7) Rysunek 2-4. Wykres funkcj przynaleŝnośc klasy t 5) funkcja przynaleŝnośc klasy L zdefnowana jest wzorem (2-8). µ L (x)= R > < b a b a b x dla b x a dla a b x b a x dla, 0 (2-8) Rysunek 2-5. Wykres funkcj przynaleŝnośc klasy L Nektórzy badacze [59] postulują stosowane dodatkowych klas funkcj przynaleŝnośc (wzory od 2-9 do 2-3), gdyŝ zaproponowane do tej pory zbudowane są w oparcu o funkcje lnowe czy kwadratowe. 6) funkcja przynaleŝnośc klasy Π zdefnowana jest wzorem (2-9). µ Π (x)= R > < < < d c b a d c b a d x dla d x c dla c d x d c x b dla b x a dla a b a x a x dla,,, 0 0 (2-9)

13 7) funkcja przynaleŝnośc klasy V zdefnowana jest wzorem (2-0). µ V (x) = - µ t (x) a b c a, b, c R (2-0) 3 8) funkcja przynaleŝnośc klasy U zdefnowana jest wzorem (2-). µ U (x) = - µ Π (x) a b c d a, b, c, d R (2-) 9) funkcja przynaleŝnośc klasy z zdefnowana jest wzorem (2-2). µ z (x) = - µ s (x) a b a, b R (2-2) 0) funkcja przynaleŝnośc klasy u zdefnowana jest wzorem (2-3). µ u (x) = - µ π (x) 0 b b, c R (2-3) Oprócz wymenonych tu klas funkcj jako funkcje przynaleŝnośc proponuje sę [59] wprowadzene klas określanych przez welomany wyŝszych stopn, funkcje wymerne, funkcje wykładncze, funkcje dzwonowe, czy krzywą Gaussa. Jednak w nnejszej pracy zbory rozmyte stosowane są tylko na potrzeby algorytmu budującego rozmyte reguły klasyfkujące jeŝel-to, który zalczany jest do algorytmów sterowana rozmytego, a te z kole najczęścej ([59], [22], [87]) uŝywają funkcj przynaleŝnośc klasy t, s, Π. Z tych klas funkcj, numeryczne najłatwejsza (a przez to najmnej czasochłonna) do wyznaczena jest wartość funkcj klasy t z tego względu w pracy zostaną uŝyte funkcje przynaleŝnośc klasy t. Funkcje klasy t nazywane są teŝ funkcjam przynaleŝnośc klasy Λ lub trójkątnym funkcjam przynaleŝnośc [22] lasyczne operacje na zborach rozmytych W swojej pracy [88] Zadeh zaproponował trzy operacje na zborach rozmytych, które nazywane są obecne operacjam klasycznym (lub mnogoścowym) [59]: loczyn (przecęce), sumę (agregację) dopełnene (negację). ) Dopełnenem zboru rozmytego A na unwersum X jest zbór rozmyty A tak, Ŝe: A = { (x, µ A (x)); x X; µ A (x) = - µ A (x) } (2-4) 2) Sumą zborów rozmytych A B na tym samym unwersum X jest zbór rozmyty A B tak, Ŝe: A B = { (x, µ A B (x)); x X; µ A B (x) = µ A (x) µ B (x) = max{µ A (x), µ B (x)} } (2-5)

14 Sumą n zborów rozmytych A, A 2,...A n na tym samym unwersum X nazywamy zbór rozmyty A, A 2,...A n tak, Ŝe: A A 2... A n = { (x, µ (x)); x X; µ A A2... A n (x) = max{ A A A2... An µ (x), µ A (x),..., µ 2 A (x)} } n ℵ n 4 (2-6) 3) Iloczynem zborów rozmytych A B na tym samym unwersum X jest zbór rozmyty A B tak, Ŝe: A B = { (x, µ A B (x)); x X; µ A B (x) = µ A (x) µ B (x) = mn{µ A (x), µ B (x)} } (2-7) Iloczynem n zborów rozmytych A, A 2,...A n na tym samym unwersum X nazywamy zbór rozmyty A, A 2,...A n tak, Ŝe: A A 2... A n = { (x, µ (x)); x X; µ A A2... A n (x) = mn{ A A A2... An µ (x), µ A (x),..., µ 2 A (x)} } n ℵ n (2-8) Rysunek 2-6. Przykładowe dzałane operacj sumy zborów rozmytych A B Lsta operacj na zborach rozmytych jest znaczne dłuŝsza [47], jednak w praktycznej częśc nnejszej pracy uŝyty zostane jedyne klasyczny operator sumy zborów rozmytych A B (rysunek 2-6).

15 5 3. lasyczny algorytm genetyczny Algorytmy genetyczne [4], podobne jak sec neuronowe ([80], [79], [5]), są próbą naśladowana zjawsk zachodzących w Ŝywych organzmach odpowedno ewolucj przesyłana sygnałów w systeme nerwowym na potrzeby wyszukwana lepszych rozwązań w welu dzedznach nauk technk. Pojęce algorytmy genetyczne wprowadzł Holland [36], który zaproponował symulację ewolucj do rozwązywana trudnych zadań ne na podstawe wedzy o charakterze problemu, ale tylko na podstawe oceny kaŝdego osobnka symulowanego w algorytme. Wele pojęć stosowanych w algorytmach genetycznych ma swoje odnesene do zjawsk bologcznych [69]. Na potrzeby tej pracy wydaje sę węc celowym krótke przedstawene zasad pracy algorytmu w oparcu o naukę o organzmach Ŝywych - bologę. 3.. Pojęca bologczne Dzęk bolog wadomym jest [82], Ŝe kaŝdy Ŝywy organzm składa sę z mnejszych elementów zwanych komórkam, których stnene wykazal: Schleden, Schwann, Dutrochet Lamarck. Wększość komórek posada wyodrębnony obszar - jądro komórkowe (zwane w skróce jądrem), którego stnene udowodnł w 83 roku Robert Brown. We wnętrzu jądra w strukturach zwanych chromosomam zawarty jest kwas DNA (dezoksyrybonuklenowy). Na podstawe fragmentów chromosomów zwanych genam w komórce zachodz synteza bałek, czyl zwązków chemcznych słuŝących do budowy komórk (bałka budulcowe) do regulacj procesów chemcznych zachodzących w komórce (bałka enzymatyczne zwane enzymam). PonewaŜ organzm składa sę z komórek, to jego czynnośc Ŝycowe są sumą czynnośc Ŝycowych poszczególnych komórek [82]. Z kole czynnośc Ŝycowe kaŝdej komórk są determnowane przez enzymy wytwarzane według budowy kwasu DNA. Tym sposobem DNA reguluje zachowane całego organzmu. W jądrze komórk znajdują sę dwe odpowadające sobe sekwencje genów zazwyczaj kaŝda z nch defnuje zupełne odmenny organzm (np.: człowek pownen według jednej sekwencj meć włosy czarne, a według drugej - rude). W jądrze zdrowej komórk stneją węc pary odpowadających sobe genów - po jednym z kaŝdej sekwencj. Jednak bałka produkowane w oparcu o jeden gen z pary mogą wywerać wększy wpływ na komórkę nŝ bałka produkowane w oparcu o drug gen z tej samej

16 pary. Take geny nazywane są odpowedno domnującym recesywnym ( oznaczane są przez welke małe ltery). Przykład 3- Oznaczmy (w uproszczenu) gen ludzk odpowadający za rudy kolor włosów poprzez w (gen recesywny), a za kolor czarny poprzez W (gen domnujący). Człowek posadający parę genów WW, Ww lub ww będze meć czarne włosy, a parę ww - rude. 6 Wększość organzmów rozmnaŝa sę płcowo za pośrednctwem specjalnych komórek zwanych gametam. aŝda z gamet zawera tylko jedną z sekwencj genów zwykłej komórk. Dopero po połączenu sę dwóch gamet pochodzących od osobnków odmennej płc, powstaje komórka, która rozwne sę w nowy organzm która posada normalną dla swojego gatunku lczbę genów w chromosomach. W ten sposób (poprzez DNA) organzmy potomne otrzymują pewne cechy organzmów rodzcelskch. Jednak zazwyczaj na danym terene przychodz na śwat węcej osobnków nŝ moŝe sę wyŝywć. Stąd do weku dojrzałego doŝyją tylko te, które będą mały pewne predyspozycje do przetrwana (np.: pewen zestaw cech, który ułatwa zdobywane pokarmu). Mówmy, Ŝe osobnk te są lepej przystosowane od nnych do środowska, w którym Ŝyją. Te ułatwające przeŝyce cechy zakodowane są w DNA zostaną przekazane potomkom poprzez gamety. Zwrócć tu naleŝy uwagę na to, Ŝe osobnk dobrze przystosowane będą mały wększą szansę na przekazane swoch cech potomstwu, nŝ osobnk gorzej przystosowane, które raczej wygną ne wydając na śwat potomstwa mówmy o zjawsku doboru naturalnego (selekcj). Proces tworzena sę gamet nazywa sę mejozą (lub naczej podzałem mejotycznym komórk) ne polega on tylko na przekazanu gametom po jednej sekwencj genów ze zwykłej komórk. Podczas podzału mejotycznego komórk (rysunek 3-) chromosomy zawerające odpowadające sobe geny z dwóch sekwencj (nazywane chromosomam homologcznym) łączą sę w pary (proces ten nazwany jest synapss), a następne podwajają sę. MoŜe teraz nastąpć wymana pewnych fragmentów pomędzy chromosomam homologcznym krzyŝowane (z ang.: crossng-over). Dzęk temu otrzymujemy wększe zróŝncowane tworzonych gamet nŝ w wynku tylko powelana chromosomów. olejnym etapem jest rozejśce sę najperw chromosomów homologcznych podzał komórk, a następne rozejśce sę nowopowstałych chromosomów z chromosomam, które juŝ wcześnej stnały ponowny podzał stnejących komórek. W ten sposób powstają cztery grupy chromosomów zawartych w czterech gametach.

17 7 Rysunek 3-. Przykładowy schemat krzyŝowana podczas podzału mejotycznego jądra komórk (zaznaczono elpsą), w której wyróŝnmy dwe pary genów: Tt oraz Aa (występującą w chromosomach zaznaczonych prostokątam) Jeszcze jednym czynnkem zmenającym materał genetyczny jest mutacja. Występuje ona pod wpływem pewnych zwązków chemcznych (np.: perytu, kwasu azotowego nnych) lub fal elektromagnetycznych (promene X, gamma, promenowane kosmczne, ultrafolet) polega na braku pewnego odcnka chromosomu lub jego podwojenu, czy obrócenu, a takŝe na zmane lub usunęcu jednego nukleotydu. Mutacja odgrywa drugorzędną rolę (po opsanym tu krzyŝowanu doborze naturalnym) w procese tworzena nowego materału genetycznego (np.: względem rodzców człowek posada w swom DNA jedną mutację na około 6 mlardów par nukleotydów). was DNA zbudowany jest z zasady azotowej (Adenny, Guanny, Cytozyny, Tymny), cukru pęcowęglowego (dezoksyrybozy) kwasu fosforowego. Zwązek zasady azotowej, dezoksyrybozy kwasu fosforowego nos nazwę nukleotydu.

18 PonewaŜ w jego skład moŝe wejść jedna z czterech zasad azotowych, rozróŝnamy cztery typy nukleotydów oznaczanych przez A, G, C lub T (od perwszej ltery nazwy zasady azotowej wchodzącej w skład nukleotydu). 8 Rysunek 3-2. Budowa kwasu dezoksyrybonuklenowego Trzy kolejne nukleotydy kodują kaŝdy ze znanych dwudzestu amnokwasów, które są podstawowym składnkem bałek - ten system kodowana amnokwasów udowodnł w 96 roku Crck. Trójkę nukleotydów kodujących amnokwas nazywa sę kodonem Podstawowe pojęca parametry Algorytm genetyczny jest swostą symulacją procesów bologcznych w celu rozwązana problemów techncznych czy naukowych. Model śwata organzmów Ŝywych przyjęty w algorytme genetycznym opera sę główne na zjawskach doboru naturalnego (selekcj), krzyŝowana mutacj, gdyŝ główne te zjawska umoŝlwają organzmom Ŝywym (rozmnaŝającym sę płcowo) przystosowane sę do warunków Ŝyca na Zem. Aby zakodować chromosom, osobnka generację osobnków w pamęc maszyny cyfrowej, celem zaprogramowana klasycznego algorytmu genetycznego, przyjmuje sę uproszczena w stosunku do zjawsk zachodzących w przyrodze:

19 ) Za jedną cechę organzmu odpowada dokładne jeden gen (a ne dwa domnujący recesywny). 2) aŝdy osobnk posada tylko jeden chromosom o odpowednej długośc (a ne klka par chromosomów homologcznych). 3) aŝda generacja ma taką samą lczbę osobnków. 4) aŝdy z osobnków ma szansę na wydane potomstwa w zaleŝnośc od jego przystosowana sę do otoczena. 5) aŝdy nowy osobnk otrzymuje chromosom od ojca lub matk, chyba Ŝe nastąp mędzy tym chromosomam krzyŝowane. Wtedy otrzyma część chromosomu ojca część matk. 6) aŝdy osobnk moŝe być zarówno ojcem jak matką - ne wyróŝna sę płc. 7) aŝda para rodzcelska wydaje na śwat dwa nowe organzmy (stąd lczba osobnków w generacj mus być parzysta). 8) aŝdy kodon moŝna zakodować w odpowednej lośc btów, w kodze dwójkowym. 9) Podczas tworzena sę nowego chromosomu kaŝdy kodon moŝe ulec mutacj polegającej na zmane jego zawartośc, przy czym prawdopodobeństwo takej mutacj jest z góry określone. 0) Za gen przyjmuje sę pojedynczy kodon (a ne jak w przyrodze całe cąg kodonów). 9 Od strony nformatycznej zakodowane klasycznego algorytmu genetycznego polega węc na: ) Określenu w pamęc komputera łańcucha btowego chromosomu, gdze kaŝdy z btów nterpretowany jest jako gen, a jego pozycja w chromosome to locus. 2) Przypsanu do kaŝdego chromosomu wartośc funkcj przystosowana mary przystosowana danego chromosomu do warunków zadana; chromosom mara jago przystosowana stworzą strukturę zwaną osobnkem. 3) Określenu w pamęc grupy osobnków generacj startowej (początkowej). 4) Zaprogramowana dzałana operatorów selekcj (symulacj doboru naturalnego), krzyŝowana mutacj dzałających na poszczególnych osobnkach w celu uzyskana kolejnej generacj osobnków (ponewaŝ wraz z utworzenem nowej generacj stara obumera, to termny populacja generacja w klasycznym algorytme genetycznym

20 moŝna traktować zamenne) dzałających zgodne ze schematem blokowym prezentowanym na rysunku Rysunek 3-3. Schemat blokowy klasycznego algorytmu genetycznego [72] Selekcja (zwana teŝ selekcją ruletkową) chromosomów w klasycznym algorytme genetycznym odbywa sę na zasadze symulacj obrotowej tarczy (ruletk), gdze kaŝdemu z chromosomów ch danej generacj odpowada sektor o rozmarze (lnowo) proporcjonalnym do jego przystosowana Φ(ch). Całe koło ruletk odpowada sume wartośc funkcj przystosowana wszystkch chromosomów w generacj. W wynku symulacj zakręcena kołem ruletk wylosowany zostaje jeden z chromosomów do zostana rodzcem. Prawdopodobeństwo p wylosowana -tego chromosomu ch do pul rodzców wyraŝone jest wzorem 3-. Φ( ch ) p( ch ) = gdze n pop - parzysta lczba osobnków w generacj (3-) n pop j= Φ( ch ) j Losowane osobnków do pul rodzców odbywa sę aŝ do uzyskana n pop rodzców (gdze n pop jest parzystą lczbą osobnków w generacj). Osobnk w pul rodzcelskej łączone są kolejno w pary (tj. perwszy z drugm, trzec z czwartym td.).

21 Pomędzy parą rodzców moŝe zajść krzyŝowane (nazywane teŝ krzyŝowanem prostym lub jednopunktowym) z zadanym z góry prawdopodobeństwem p cross. rzyŝowane polega na wylosowanu punktu przecęca c chromosomów rodzców począwszy od tego punktu wymenenu mędzy rodzcam fragmentów ch chromosomów. Uzyskane chromosomy traktowane są jako chromosomy potomków. ZauwaŜmy teŝ, Ŝe w wynku uproszczeń algorytmu genetycznego względem śwata organzmów Ŝywych, krzyŝowane ne jest juŝ odpowednkem bologcznego zjawska crossng-over, gdyŝ zachodz pomędzy róŝnym osobnkam, a ne w obrębe jednej komórk. Przykład 3-2 Nech symbol g symbolzuje pojedynczy gen, a symbol g gen na -tej pozycj (locus) w chromosome o długośc d. Wykonane krzyŝowana dla kaŝdej pary rodzców g g 2...g c- g c g c+...g d- g d g g 2...g c- g c g c+...g d- g d polega na wylosowanu punktu przecęca c {2,3...,d-,d} (przy czym prawdopodobeństwo zdarzena polegającego na przyjęcu przez c dowolnej z moŝlwych wartośc {2,3...,d-,d} jest jednakowe wynos /(d-) ), a następne na wymane genów pomędzy chromosomam rodzców począwszy od punktu przecęca: g g 2...g c- g c g c+...g d- g d g g 2...g c- g c g c+...g d- g d Uzyskane chromosomy to potomkowe rodzców. 2 Dla cągu bnarnego mutacja polega na zamane wartośc genu z wartośc na 0 lub odwrotne z zadanym prawdopodobeństwem p mut. Mutacja (podobne jak w śwece organzmów Ŝywych) spełna rolę drugorzędną w algorytme genetycznym najstotnejsze są operatory selekcj krzyŝowana. Z tego powodu wartość mutacj podaje sę zazwyczaj [72] bardzo nską (np.: mnej nŝ %). Dla zbudowana chromosomów generacj startowej (nazywanej teŝ początkową [72]) naleŝy określć jeszcze jeden parametr klasycznego algorytmu genetycznego prawdopodobeństwo wylosowana jedynk p sel uŝytej do budowy chromosomów. Dodatkowym parametram klasycznego algorytmu genetycznego mogą być parametry określające warunek zatrzymana (rysunek 3-3) np.: maksymalna lczba moŝlwych do wykonana generacj t max. Algorytm genetyczny najczęścej słuŝy do rozwązana zadana optymalzacj [6], przy czym rozwaŝać moŝna tylko zadane maksymalzacj. JeŜel zadana optymalzacj polega na mnmalzacj funkcj g, to jest ono równowaŝne zadanu maksymalzacj funkcj f takej, Ŝe f = -g. Ponadto przyjmuje sę, Ŝe maksymalzowana funkcja f jest dodatna w swojej dzedzne. JeŜel tak ne jest, a funkcja jest funkcją ogranczoną z dołu, to moŝna do wartośc funkcj dodawać wartość tego ogranczena. Maksymalzowana funkcja f ne mus odpowadać funkcj przystosowana Φ (często

22 proponuje sę [72] zastosowane w funkcj przystosowana funkcj kary). Ma być jedyne zachowany warunek, Ŝe maksymalzacja funkcj przystosowana Φ będze pocągać za sobą maksymalzację funkcj f (wzór 3-2). j {,2,..., n pop} max Φ( ch j ) = max f ( ch j ) 22 (3-2) Stąd pojęce najlepszy chromosom (rysunek 3-3) oznacza chromosom o najwększej wartośc funkcj przystosowana. Tak węc wystarczy sprowadzć rozwązywany problem do zadana optymalzacj, aby mogło być ono rozwązywane za pomocą algorytmu genetycznego. Określene parametrów pracy (rysunek 3-3) klasycznego algorytmu genetycznego polega na zdefnowanu następujących wartośc: - n pop parzysta lczba osobnków w generacj, - p cross prawdopodobeństwo zajśca krzyŝowana jednopunktowego, - p mut prawdopodobeństwo zajśca mutacj, - p sel prawdopodobeństwo wylosowana jedynk w generacj startowej oraz na określenu warunków zatrzymana algorytmu, a takŝe na zdefnowanu funkcj przystosowana Φ. Holland [36] zaproponował jeszcze jeden operator pozwalający na otrzymywane potomków róŝnych od organzmów rodzcelskch: operator nwersj zachodzącej z prawdopodobeństwem p nv. Operator ten dzała na jednym chromosome pomędzy dwoma losowo wybranym pozycjam chromosomu wykonuje zamanę kolejnośc genów. Podczas realzacj algorytmu genetycznego są uŝywane lczby losowe ([9], [55], [84]). Wykorzystuje sę je do wyboru osobnków mających zostać rodzcam, do wylosowana punktu krzyŝowana oraz do realzacj mutacj. PonewaŜ oprogramowane komputera ne jest w stane samodzelne wygenerować lczb losowych, to uŝywa sę pewnych algorytmów skończonych, które pozwalają na generowane lczb spełnających z góry załoŝone testy (załączony do pracy program glp.exe). Generowane lczby ne są lczbam losowym, gdyŝ wartość kaŝdej kolejnej moŝna przewdzeć. Take algorytmy nazywane są generatoram lczb pseudolosowych. Opsane metody składające sę na klasyczny algorytm genetyczny zostały rozbudowane m.n. o nowe metody kodowana chromosomu, selekcj, zapsu zadana optymalzacj,

23 tworząc grupę metod zalczanych ne tyle do algorytmów genetycznych le do ch rozszerzena metod programowana ewolucyjnego [6] Twerdzene o schematach Mmo tego, Ŝe w przyrodze obserwujemy cały czas postępujący proces przystosowana sę organzmów Ŝywych do otoczena - ewolucję mmo tego, Ŝe sam jej ulegamy, to ne stanow jeszcze wystarczającego dowodu, Ŝe bazujący na zjawskach zachodzących w przyrodze algorytm genetyczny jest odpowedn do rozwązywana problemów naukowych czy techncznych. Rozwązane tych problemów sprowadza sę w welu przypadkach do przeszukwana przestrzen moŝlwych rozwązań celem znalezena rozwązana lepszego nŝ znane dotychczas. Tak węc algorytm genetyczny realzuje zadane optymalzacj, chocaŝ ne w ścsłym tego słowa znaczenu (z łac. optmus najlepszy), gdyŝ optymalzacja dotyczy poszukwana najlepszego rozwązana. Celem wyjaśnena dlaczego algorytm genetyczny usłuje znaleźć lepsze rozwązane, naleŝy przeanalzować zasady jego pracy ujęte w tzw. twerdzenu o schematach. Dla wyjaśnena pojęca schematu rozszerza sę alfabet opsujący bnarny chromosom o symbol *, który oznacza 0 lub. Schematem nazywamy [6] reprezentację łańcuchów bnarnych, które są z nm zgodne na wszystkch pozycjach nnych nŝ symbol *. Mówmy teŝ, Ŝe chromosom naleŝy do danego schematu (jest reprezentantem schematu), jeŝel [72] dla kaŝdej pozycj (locus) j {,2,...,l chrom }, gdze l chrom jest długoścą chromosomu, symbol występujący na j-tej pozycj (locus) chromosomu odpowada symbolow na j-tej pozycj schematu, przy czym 0 w chromosome odpowada symbolow * w schemace. Przykład 3-3 RozwaŜmy następujące zadane [30]: Wyznaczyć maksymalną wartość funkcj f : 0,3 ℵ {0} R danej wzorem f(x)=x 2. W celu rozwązana tego zadana za pomocą algorytmu genetycznego naleŝy zakodować jako osobnka wartość x w kodze dwójkowym (np.: wartość 2 kodujemy jako chromosom 0000 o wartośc przystosowana 2 2 = 4). Stwórzmy przykładową populację startową złoŝoną z czterech osobnków [42]: L.p. Chromosom Przystosowane

24 Przyglądając sę budowe chromosomów moŝna dostrzec pewen zwązek pomędzy budową przystosowanem. OtóŜ chromosomy zawerające jedynkę na swom początku mają wyŝsze przystosowane nŝ pozostałe (chromosomy 2 4). Oznacza to, Ŝ jedynka na tej pozycj to jakaś dobra cecha osobnka, która ułatwa mu przeŝyce. Taką dobrą cechę moŝemy wyróŝnć za pomocą schematu: ****. Schematy posadają swoje właścwośc - rząd rozpętość. Rzędem schematu H nazywamy lczbę ustalonych pozycj w schemace oznaczamy o(h) np.: o(0***)=2. Rozpętoścą schematu H nazywamy odległość mędzy skrajnym pozycjam ustalonym oznaczamy δ(h) np.: δ(**0*)=3, δ(****)=0. ZauwaŜmy, Ŝe podczas reprodukcj lczba reprezentantów dobrych schematów (tj. kodujących dobre cechy osobnka, które to ułatwają mu przeŝyce przykład 3-3) wzrasta oraz, Ŝe podczas krzyŝowana schematy o duŝej rozpętośc ulegają znszczenu. ZałóŜmy, Ŝe w t generacj znajduje sę m=m(h,t) reprezentantów schematu H. Ow reprezentanc podczas procesu rozmnaŝana ulegają powelenu na swoch potomków (jeszcze bez uwzględnena krzyŝowana) z prawdopodobeństwem określonym wzorem 3- (dotyczy klasycznego algorytmu genetycznego). W zwązku z tym w następnej t+ generacj moŝemy oczekwać * następującej lczby reprezentantów schematu H (wzór 3-3): Φ( H ) m( H, t + ) = m( H, t) n (3-3) pop n pop j= Φ( ch ) gdze Φ(H) jest średnm przystosowanem reprezentantów schematu H w generacj t. JeŜel oznaczymy średne przystosowane osobnka w generacj przez (3-4), to moŝemy zapsać wzór (3-3) jako (3-5). Φ = n pop j= Φ( ch ) n pop j j 24 (3-4) Φ( H ) m ( H, t + ) = m( H, t) (3-5) Φ Gdyby załoŝyć, Ŝe średne przystosowane reprezentantów schematu H przewyŝsza średne przystosowane generacj o welkość otrzymujemy wzór (3-6), a z nego zaleŝność (3-7): c Φ c jest welkoścą stałą, to Φ + cφ m ( H, t + ) = m( H, t) = m( H, t) ( + c) (3-6) Φ * Lewa strona równana (3-3) pownna być opsana jako: [ m( H, t +) ] E gdze E jest wartoścą oczekwaną. Jednak ze względu na to, Ŝe algorytmy genetyczne operują zazwyczaj na duŝych populacjach moŝlwe jest pomnęce we wzorze wartośc oczekwanej.

25 25 m ( H, t) + ) t = m( H,0) ( c (3-7) Otrzymany wzór (3-7) wykazuje, Ŝe w procese reprodukcj (który dzała jak dobór naturalny) schematy lepsze od przecętnej są wyberane w lczbe rosnącej wykładnczo. We wzorze (3-5) naleŝy jeszcze uwzględnć moŝlwość znszczena danego schematu w wynku rozerwana chromosomu, co zachodz podczas krzyŝowana. Punkt podzału chromosomu moŝe zostać wylosowany na dowolnej pozycj spośród moŝlwych (tj. od pozycj 2 do końca chromosomu - pozycja l chrom ), stąd prawdopodobeństwo rozerwana danego schematu wynos: p δ ( H ) ( l ). roz = chrom JeŜel uwzględnmy jeszcze prawdopodobeństwo zajśca krzyŝowana p cross, to prawdopodobeństwo p s zachowana schematu (bez jego rozerwana) podczas krzyŝowana moŝna wyrazć wzorem (3-8). p s p cross δ l ( H ) chrom (3-8) PonewaŜ reprodukcja krzyŝowane zachodzą nezaleŝne od sebe, stąd wzór (3-5) zapszemy jako (3-9). (, t + ) m( H, t) m H ( H ) δ ( H ) Φ Φ p cross lchrom (3-9) Ze wzoru (3-9) wynka, Ŝe lczba reprezentantów schematów lepej przystosowanych od średnego przystosowana w generacj o małej rozpętośc będze rosnąć w następnych pokolenach wykładnczo. Aby schemat H ne uległ znszczenu podczas mutacj, muszą sę zachować wszystke jego pozycje ustalone (tu: pozycje, gdze występuje 0 lub ). PonewaŜ mutacja na kaŝdej pozycj ustalonej jest nezaleŝna od nnych mutacj stąd schemat H o( H ) przetrwa mutację z prawdopodobeństwem ( p mut ), gdze pmut jest prawdopodobeństwem mutacj. Dla p mut << to prawdopodobeństwo przetrwana aproksymuje sę wyraŝenem: -p mut o(h). Stąd ze wzoru (3-9) otrzymujemy ostateczną postać twerdzena o schematach (3-0): ( H ) Φ( H ) δ m ( H, t ) m( H, t) pcross o( H ) p Φ lchrom + mut (3-0) Na podstawe wzoru 3-0 moŝna ostateczne stwerdzć, Ŝe lczba reprezentantów schematów lepej przystosowanych nŝ średne przystosowane, małej rozpętośc nskego rzędu będze rosnąć wykładnczo w kolejnych pokolenach.

26 26 Przykład 3-4 Zasadę pracy algorytmu genetycznego opsanego wzorem (3-0) przedstawa program xx.exe (mojego autorstwa), który znajduje maksymalną wartość funkcj f: 0,2 30 ℵ {0} R danej wzorem f(x)=x 2. Oczywśce jest to zadane trywalne ne wymagające stosowana tak wyrafnowanych metod jak algorytm genetyczny, jednak zostało tu ono przytoczone celem prostej lustracj przystosowana schematów. Średne przystosowane osobnka w generacj Przystosowane 0,8 0,6 0,4 0, Generacja Perwszy przebeg programu Drug przebeg programu Rysunek 3-4. Powelane dobrych schematów algorytmu genetycznego Przystosowane wynoszące na wykrese z rysunków osobnk osągne wtedy, gdy wartość jego przystosowana osągne wartość najwększą z moŝlwych (2 30 ) 2, Jak wdać z rysunku 3-4 średne przystosowane generacj początkowo wzrasta, co jest wynkem zwększana sę lczby reprezentantów dobrych schematów w kolejnych populacjach. Przystosowane 0,95 0,9 0,85 0,8 0,75 0,7 0,65 0, Średne przystosowane osobnka w generacj Perwszy przebeg programu Generacja Drug przebeg programu Rysunek 3-5. Dalsze etapy pracy algorytmu genetycznego Jednak gdy wszystke osobnk danej generacj są dość dobrze przystosowane, to stają sę one podobne do sebe. NaleŜy wtedy oczekwać jakejś generacj o słabej przystosowanych osobnkach, gdyŝ slnej sę wtedy zaznacza dzałane mutacj (rysunek 3-5). Program xx.exe znalazł podczas perwszego przebegu (perwszego uruchomena) w 780 generacj osobnka o przystosowanu na wykrese % (rysunek 3-5), czyl o wartośc przystosowana Chromosom tego osobnka wyglądał następująco: , co przedstawa sobą wartość (najlepszy moŝlwy osobnk do osągnęca to ten, którego chromosom składa sę z samych jedynek, co naleŝy rozumeć jako wartość ). Wynk tak (wobec dzedzny składającej sę punktów) naleŝy uznać za zadowalający. NaleŜy zauwaŝyć, Ŝe najlepszy chromosom jest reprezentantem schematów, które kodują jedynk w początkowej jego częśc są to schematy kodujące osobnk bardzo dobrze przystosowane.

27 Tradycyjne metody optymalzacj PonewaŜ zagadneń optymalzacj uŝywa sę w welu dzedznach, to zastosowana algorytmu genetycznego są dość szeroke. Wykorzystuje sę je przy tworzenu muzyk ([.2], [.3]), przy symulacj zachowań Ŝywych organzmów ([.7]), przy procese uczena sec neuronowych ([.4]). Prostota duŝe moŝlwośc algorytmu sprawają, Ŝe gotowe programy uŝywające algorytmu genetycznego do znajdowana maksmum funkcj dostępne są w sec Internet ([.5], [.6]) oraz Ŝe powstają ośrodk kluby zajmujące sę badanam algorytmów genetycznych ([9]). Jednak oprócz algorytmu genetycznego do rozwązywana problemu optymalzacj stosuje sę równeŝ nne metody [] determnstyczne: - dla zadań cągłych: dla lnowej funkcj celu ogranczeń: metody lnowego sympleksu dla zadań z wypukłą funkcją celu: metody bezgradentowe: poszukwań prostych - kerunek poszukwań jest zawsze równoległy do os układu współrzędnych; kerunków sprzęŝonych - kerunek jest wyznaczany na podstawe hstor poszukwań metody gradentowe: metoda najwększego spadku - kerunkem poszukwań jest mnus gradent funkcj w punkce; metoda gradentów sprzęŝonych metody newtonowske pseudonewtonowske: metoda Newtona - kerunkem poszukwań jest loczyn macerzy pochodnych cząstkowych gradentu funkcj; metoda pesudonewtonowska - kerunkem poszukwań jest loczyn aproksymowanej macerzy pochodnych cząstkowych gradentu funkcj - dla zadana optymalzacj globalnej (gdy funkcja celu ma w obszarze dopuszczalnym węcej nŝ jedno maksmum/mnmum lokalne): metody welostartowe (welokrotne uruchomene algorytmu optymalzacj lokalnej począwszy od róŝnych punktów startowych) metody populacyjne (dla grupy punktów startowych po wykonanu - dla zadań dyskretnych: optymalzacj lokalnej usuwa sę punkty zblŝające sę do sebe zostawając jeden) metody dokładne: algorytm pełnego przeglądu metody przyblŝone: metoda k-opt - gwarantuje, Ŝe w otoczenu rozwązana o promenu k ne moŝna znaleźć nnego maksmum/mnmum lokalnego

28 metody losowe: metoda losowa - polega na losowym próbkowanu przestrzen rozwązań oraz metody nedetermnstyczne, które polegają na wykorzystywanu losowośc w procese poszukwań nowych rozwązań ( które nadają sę do zastosowań cągłych jak dyskretnych): - metoda Monte Carlo - polega na losowanu z rozkładem jednostajnym punktów w przestrzen rozwązań z zapamętanem najlepszego - metoda błądzena przypadkowego - polega na wyznaczanu punktów będących wartoścą oczekwaną rozkładu prawdopodobeństwa uŝywanego do generowana kolejnego punktu; podobne jak w metodze Monte Carlo zapamętuje sę najlepszy wynk - metoda tabu - metoda błądzena przypadkowego bez moŝlwośc powrotu do rozwązań poprzedno uzyskanych - metoda symulowanego wyŝarzana - metoda błądzena przypadkowego, w którym nowo wygenerowany punkt staje sę kolejnym punktem roboczym, gdy poprawa wartość funkcj celu, a w przecwnym wypadku z prawdopodobeństwem p akcept wynoszącym p akcept = exp(- f /T), gdze f jest modułem róŝncy funkcj celu w starym nowym punkce, a T>0 jest regulowanym (stopnowo obnŝanym) parametrem zwanym temperaturą. Algorytm genetyczny jest swostym połączenem szybkośc metod determnstycznych ogólnośc metod nedetermnstycznych dzęk poszukwanu optymalnych rozwązań w obszarach, w których mogą one wystąpć. 28

29 29 4. Dagnostyka maszyn Wzrost złoŝonośc maszyn procesów technologcznych spowodował pojawene sę [8] nowej gałęz nauk dagnostyk techncznej, w której wyróŝnamy dwa główne kerunk: dagnostykę maszyn dagnostykę procesów przemysłowych. Dagnostyka maszyn zajmuje sę oceną stanu urządzeń poprzez badane ch właścwośc badane procesów towarzyszących ch funkcjonowanu (np.: zjawska termczne, czy wbroakustyczne). Na maszyny dzałają czynnk zewnętrzne wewnętrzne, które najczęścej powodują stopnowe pogorszene właścwośc eksploatacyjnych. Zmany ten najczęścej zaleŝą od warunków eksploatacj, a są one zakłócane poprzez przeglądy, czy remonty. Dagnostyka procesów przemysłowych zajmuje sę rozpoznawanem zman stanów procesów przemysłowych, gdze pod pojęcem proces przemysłowy rozume sę [8] cąg dzałań realzowanych w ustalonym czase przez określoną grupę maszyn przy określonych zasobach. NaleŜy teŝ zaznaczyć, Ŝe rozpoznane stanu maszyny lub procesu (obektu badań) na podstawe aktualne dostępnych nformacj rozpatruje sę jako: - dagnozowane celem określena aktualnego stanu - genezowane celem określena wcześnejszych stanów - prognozowane celem określena przyszłych stanów. Dagnozowane moŝna traktować jako dwuetapowy proces rozpoznawana wzorców [8], w którym realzuje sę: - fazę ekstrakcj sygnałów dagnostycznych - fazę klasyfkacj stanu techncznego dagnozowanego obektu na podstawe uzyskanych sygnałów dagnostycznych. 4.. Rozpoznawane wzorców Celem rozpoznawana wzorców jest przypsane obektu, na podstawe zaobserwowanych danych (sygnałów dagnostycznych) do odpowednej klasy. W warunkach rzeczywstych, wobec braku nformacj nt. reguł przynaleŝnośc obektów do poszczególnych klas, system rozpoznający opera sę na cągu uczącym zborze obektów, dla których znana jest ch prawdłowa klasyfkacja. MoŜlwe jest węc rozpoznawane automatyczne, które polega na uczenu sę na podstawe przykładów, tak

30 aby uzyskać zdolność uogólnana proces klasyfkacj [8], a następne na orzekanu o wszystkch obektach podczas pracy systemu proces wnoskowana. Pod pojęcem obekt [46] rozume sę dowolny przedmot badań wyodrębnony myślowo z otoczena, tj. przedmot, osobę, stotę, pojęce, czy zdarzene. Grupy (skupena) są zboram obektów bardzej podobnych do sebe (wewnątrz grupy) nŝ do pozostałych [9]. ategore obektów (klasy) moŝna wyodrębnć na podstawe dośwadczena ntucj badacza (lub człoweka eksperta) albo na podstawe metod matematycznych takch jak analza skupeń przyporządkowane grupom obektów odpowednch klas (etyket). Przed rozpoczęcem klasyfkacj waŝnym zagadnenem jest określene stotnych cech (atrybutów) obektów - które dobrze opsują zmenność obektów które moŝna zmerzyć, czy teŝ określć ch wartość cech dagnostycznych. Istneją trzy rodzaje cech: loścowe (rzeczywste), wylczenowe (porządkowe) logczne. W zaleŝnośc od rodzaju cech określa sę sposób porównana obektów poprzez róŝncę d lub podobeństwo p. Dla cech loścowych do najczęścej uŝywanych [46] sposobów wyznaczana róŝncy d zalcza sę geometryczne sposoby wyznaczana odległośc pomędzy dwoma obektam x=(x, x 2,..., x n ) y=(y, y 2,..., y n ) (o n cechach, gdze n ℵ ℵ jest zborem lczb naturalnych): a) odległość mejska 30 b) odległość eukldesowa n d( x, y) = x y (4-) = c) kwadrat odległośc eukldesowej n ( x y ) d( x, y) = (4-2) = n ( x y ) = 2 2 d( x, y) = (4-3) d) odległość Czebyszewa - najwększa odległość pomędzy znormalzowanym cecham (normalzację przeprowadza sę, aby moŝna było porównywać cechy). d ( x, y) = max x y (4-4)

31 MoŜlwe są takŝe nne sposoby wyznaczana odległośc d (nawet dla pozostałych rodzajów cech), o le spełnają one warunk dane wzoram 4-5(a-d). 3 a) d(x,y) 0 n x, y R b) d(x,y) = 0 dla x = y n x, y R c) d(x,y) = d(y,x) n x, y R (4-5) d) d(x,z) d(x,y) + d(y,z) n x, y, z R Przy wartośc d = 0 badane obekty uznaje sę za dentyczne, a dla coraz wększych wartośc odległośc uznaje sę obekty za coraz mnej podobne do sebe. Wśród sposobów wyznaczana podobeństwa najczęścej stosuje sę: a) współczynnk korelacj lnowej Pearsona b) odległość kątową p = n x)( y = ( x, y) = (4-6) n n 2 2 p ( x ( x x) = y) ( y n n 2 ( x ) ( y ) = n x y = y) = ( x, y) = (4-7) 2 MoŜlwe są nne sposoby wyznaczana wartośc podobeństwa p, o le spełnają warunk opsane wzoram 4-8(a-d). a) p(x,y) 0 n x, y R b) p(x,y) < gdy x y n x, y R c) p(x,y) = gdy x = y n x, y R d) p(x,y) = p(y, x) n x, y R (4-8) Im wększa wartość podobeństwa p, tym obekty są bardzej podobne do sebe. Gdy p=, to obekty są dentyczne [28].

32 Celem wyznaczena podobeństwa p lub róŝncy d wykonuje sę nekedy normalzację cech, gdy róŝna jest przestrzeń zmennośc tychŝe cech, celem wyrównana zakresu zmennośc. W zborze D obektów do najczęścej [46] zalczanych sposobów normalzacj -tej cechy (gdze {,2,...,n}) zalcza sę: a) zamanę zakresu zmennośc do przedzału 0, 32 max{ x x, x 2 mn{ x,..., x D, x 2,..., x } mn{ x D, x } 2,..., x D } (4-9) b) standaryzację x x VX gdze VX odchylene standardowe zmennej losowej X, DX - warancja (4-0) D 2 VX = DX = x = x D D D ( x x ) j j= l= l Metody rozwązana zadań klasyfkacj polegają na realzacj [57] dwóch etapów: - analza danych celem syntezy reguł wnoskowana (uczene sę), - podejmowana decyzj na podstawe uzyskanych reguł (wnoskowane). JeŜel w zadanu znane są klasy reguły je opsujące, to etap perwszy ne zachodz. Jest to tzw. zadane klasyfkacj prostej [46]. Do perwszego z etapów rozwązana zadana klasyfkacj moŝna zastosować jedną z dwóch strateg uczena: - z nauczycelem (gdy ne dysponujemy opsem klas, a jedyne poprawne sklasyfkowaną serą danych przykładowych), - bez nauczycela (gdy ne są znane przykłady poprawnej klasyfkacj). W przypadku braku jasno określonych klas porównuje sę (wyznaczając róŝncę d lub podobeństwo p) badany obekt do obektów z ser danych przykładowych. Istneją dwe popularne metody porównana: - metoda najblŝszego sąsada (zwana takŝe metodą NN z angelskego nearest neghbour najblŝszy sąsad) - metoda k- najblŝszych sąsadów (zwana teŝ a- najblŝszych sąsadów, czy a-nn). Perwsza z metod polega na przypsanu badanego obektu do klasy, do której naleŝy najbardzej podobny do nego obekt z ser danych przykładowych. Druga z metod

33 polega na przeprowadzenu porównana badanego obektu z najbardzej podobnym a obektam z ser danych przykładowych przypsanu obektu do klasy reprezentowanej najlcznej w grupe porównywanych obektów (przy czym a ne moŝe być wększy nŝ najmnejsza lczność obektów klasy w ser porównawczej). Dzęk temu druga z metod jest mnej wraŝlwa na błędne sklasyfkowane obektu z danych przykładowych. 33 W przypadku analzy skupeń celem jest tak podzał ser obektów na pewną lczbę grup, Ŝeby obekty naleŝące do jednej grupy były podobne do sebe, a naleŝące do róŝnych grup róŝnły sę od sebe. Zadane systemu klasyfkującego polega takŝe na powązanu uzyskanych grup z kategoram. Wśród algorytmów analzy skupeń wyodrębnć moŝemy co najmnej trzy metody: - grafczne (np.: dagramy Czekanowskego); - herarchczne (gdze wynk moŝna przedstawć w postac dendrogramu); - k-optymalzacyjne (gdze sera obektów dzelona jest na k zborów). Dla metod herarchcznych rozróŝnć moŝna jeszcze dwa sposoby realzacj algorytmów: - aglomeracyjne (polegające na łączenu najblŝszych grup, gdze początkowo grupą jest jeden obekt) - podzałowe (polegające na dzelenu grup, aŝ kaŝdy obekt stane sę jedną grupą, gdze początkowo wszystke obekty są jedną grupą). Metody k-optymalzacyjne, do których zalcza sę metoda k-średnch (nazywana teŝ metodą k-środków [2] z angelskego c-means), polegają na ustalenu lczby k grup przez badającego przydzelanu obektów do najblŝszych m grup, a następne na przemeszczanu obektów mędzy grupam, tak aby zmnmalzować odległość obektów od środków grup. Problem grupowana jest dość łatwy do rozwązana, gdy grupy obektów są od sebe oddzelone. Jednak dane rzeczywste często składają sę z grup rozmeszczonych bardzo blsko sebe, czy wręcz na sebe zachodzących. W takch wypadkach jednoznaczne przypsane obektów do poszczególnych grup moŝe utrudnać właścwą nterpretację wynku grupowana. Wady tej pozbawone są w pewnym stopnu algorytmy grupowana bazujące na zborach rozmytych, gdyŝ dostarczają nformacj o stopnu przynaleŝnośc obektu do grupy, co umoŝlwa m.n. zlokalzowane obektów leŝących na pogranczu grup.

34 Podzał klasyczny rozmyty Nech dany będze zbór danych uczących D={x, x 2,..., x D } R n, gdze x = [ x, x,..., x ] R 2 n n ( dla {,2,..., D } ) jest obektem uczącym (wzorcem) o n cechach. Zbór D moŝemy zapsać w postac macerzy danych uczących Z (wzór 4-): x 2 = x Z... n x x x x n x D 2 x D... n x D (4-) Grupowane jest podzałem zboru danych uczących D={x, x 2,..., x D } na k grup, gdze wartość k jest z góry określona. Grupa jest węc pewnym podzborem skończonego zboru danych uczących w zaleŝnośc od zastosowanych zborów, klasycznych czy rozmytych, rozróŝnamy odpowedne rodzaje podzałów. Podzał klasyczny (zwany teŝ twardym z angelskego hard partton) zboru danych uczących D, to rodzna podzborów A (gdze {,2,...,k} k ℵ \ { }) zawarta w zborze potęgowym Pow(D), co zapsujemy (wzór 4-2): { {,2,..., k}; k ℵ \ { } Pow( D) A : (4-2) gdze zbory A spełnają warunk [9] określone wzoram 4-3(a-c). a) U k A = D = b) A A = gdze j k j (4-3) c) A D gdze k Wzory 4-3 moŝna teŝ zapsać stosując funkcję przynaleŝnośc dla zborów µ : klasycznych : D { 0,} a) ( x) = x D {,2,..., k} µ A b) ( x) ( x) = 0 x D j k µ µ A A j (4-4) c) µ ( x) = oraz µ ( x) = 0 {,2,..., k} x D A {,2,..., k} x D A

35 Podzał moŝna dość łatwo zapsać w postac macerzy U [ µ ( )] A x j 35 = o wymarach k D, na którą składają sę wartośc funkcj przynaleŝnośc elementu uczącego x j (gdze j {,2,..., D }) do grupy A (gdze {,2,...,k}). a) µ ( x ) { 0,} {,2,..., k} j {,2,... D } k b) µ A ( x j ) j {,2,... D } = A = D c) 0 < µ A ( x j ) {,2,... k} j = j < D (4-5) Macerz U prezentuje podzał klasyczny, gdy spełnone są warunk 4-5(a-c), które określają, Ŝe kaŝdy element uczący x naleŝy do jednego zboru A, z których kaŝdy jest zborem nepustym zawartym w D. ZauwaŜmy teŝ, Ŝe aby te warunk były spełnone, to k D (oczywśce dla k = D zadane jest trywalne). Przykład 4- Nech będze określony zbór danych uczących D tak, Ŝe: D={x, x 2, x 3, x 4, x 5, x 6, x 7, x 8 }. Przyjmujemy, Ŝe wykonano podzał zboru D na 3 podzbory A ={x 6 }, A 2 ={x 7, x 8 } oraz A 3 ={x, x 2, x 3, x 4, x 5 }. Zgodne z przyjętą notacją macerz U zapszemy jako: U = olejne, -te wersze macerzy odpowadają wartoścom funkcj przystosowana dla kolejnych zborów A. Zbór wszystkch moŝlwych do uzyskana macerzy U tworzy przestrzeń podzału klasycznego zboru danych uczących D. Defncja 4- Nech będze określony skończony zbór danych uczących D={x, x 2,..., x D } lczba całkowta k taka, Ŝe 2 k D. Przestrzeną podzału klasycznego (twardego) zboru D nazywamy tak zbór Ph k macerzy U, Ŝe: Ph k = U R k D {,2,... k} : µ A j {,2,...,k} {,2,... D } j {,2,... D } 0 < D j= k = µ A ( x ) { 0,} j ( x ) ( x ) ; µ = ; (4-6) A j j < D

36 36 Stosując podzał zboru danych uczących D na podzbory rozmyte A o funkcj przynaleŝnośc µ : D 0, moŝna powyŝszą defncję uogólnć. Defncja 4-2 Nech będze określony skończony zbór danych uczących D={x, x 2,..., x D } lczba całkowta k taka, Ŝe 2 k D. Przestrzeną podzału rozmytego z ogranczenam zboru D nazywamy tak zbór Pf k macerzy U, Ŝe: Pf k = U R k D : {,2,... k} {,2,..., k} j {,2,... D } j {,2,... D } 0 < D j= µ k A = µ A ( x ) µ A ( x ) j j ( x ) j 0, ; = ; < D (4-7) Przykład 4-2 Nech będze określony zbór danych uczących D tak, Ŝe: D={x, x 2, x 3, x 4, x 5, x 6, x 7, x 8 }. Przyjmujemy, Ŝe wykonano podzał zboru D na 3 podzbory rozmyte A ={(x 5, 0,2), (x 6, 0,9), (x 7, 0,2)}, A 2 ={(x 5, 0,2), (x 6, 0,), (x 7, 0,8), (x 8, )} oraz A 3 ={(x, ), (x 2, ), (x 3, ), (x 4, ), (x 5, 0,6)}. Zgodne z przyjętą notacją macerz U zapszemy jako: ,2 0,9 0,2 0 U = ,2 0, 0,8 0, olejne, -te wersze macerzy odpowadają wartoścom funkcj przystosowana dla kolejnych zborów A. k Warunek A ( x j ) j {,2,... D } = µ = narzuca slne ogranczene na wartośc funkcj przystosowana charakterystyczne dla poszczególnych zborów A. Do praktycznych zastosowań wystarcza, Ŝe kaŝdy z elementów uczących naleŝy częścowo do przynajmnej jednego zboru rozmytego A. Defncja 4-3 Nech będze określony skończony zbór danych uczących D={x, x 2,..., x D } lczba całkowta k taka, Ŝe 2 k D. Przestrzeną podzału rozmytego bez ogranczeń zboru D nazywamy tak zbór Pp k macerzy U, Ŝe:

37 37 Pp k = U R k D : j {,2,... D } {,2,... k} {,2,..., k} j {,2,... D } {,2,..., k} 0 < D j= µ µ A A ( x ) µ A ( x ) j j ( x ) 0, ; j > 0; < D (4-8) Przykład 4-3 Nech będze określony zbór danych uczących D tak, Ŝe: D={x, x 2, x 3, x 4, x 5, x 6, x 7, x 8 }. Przyjmujemy, Ŝe wykonano podzał zboru D na 3 podzbory rozmyte A ={(x 5, 0,2), (x 6, 0,9), (x 7, 0,2)}, A 2 ={(x 5, 0,2), (x 6, 0,), (x 7, 0,8), (x 8, )} oraz A 3 ={(x, ), (x 2, ), (x 3, ), (x 4, ), (x 5, 0,2)}. Zgodne z przyjętą notacją macerz U zapszemy jako: ,2 0,9 0,2 0 U = ,2 0, 0,8 0, olejne, -te wersze macerzy odpowadają wartoścom funkcj przystosowana dla kolejnych zborów A. ZauwaŜyć moŝna, Ŝe element uczący x 5 w newelkm stopnu naleŝy do wyodrębnonych zborów rozmytych opsuje on sytuację netypową lub jest on wynkem błędów pomarowych. W zastnałej sytuacj naleŝy zastanowć sę nad wprowadzenem dla tego elementu nowego zboru rozmytego lub nad usunęcem elementu ze zboru uczącego. k Elementy x j zboru uczącego D, dla których A ( x j ) = µ < moŝna traktować jako elementy w mnejszym stopnu naleŝące do zborów A. Te elementy, dla których k = ( ) µ > moŝna traktować jako elementy w wększym stopnu naleŝące do A x j zborów A. Podzał rozmyty bez ogranczeń nazywany jest teŝ [52] podzałem probablstycznym, a podzał rozmyty z ogranczenam podzałem rozmytym Grupowane rozmyte Wększość [73] algorytmów grupowana rozmytego ([24], [45]) opera sę na mnmalzacj funkcj celu F(D;U,V) R, gdze D={x,x 2,...,x D } R n jest zborem danych uczących, U = [ A ( x j )] Pf k µ (dla {,2,...,k}, j {,2,..., D }, k D k {2,3,..., D } - to lczba wyodrębnonych zborów rozmytych A ) oraz V=[v,v 2,...,v k ] (dla v R n ) jest wektorem środków grup A. Funkcja F opsana jest wzorem 4-9.

38 k D ( A ( x j ) m F( D; U, V ) = µ x v dla m, ) (4-9) = j= Waga m słuŝy do określana stotnośc rozmyca w funkcj celu F. Wartość j v 2 B j x (wzór 4-9) jest kwadratem odległośc pomędzy obektem uczącym x j środkem grupy v dla macerzy B określającej normę, którą stosujemy do wyznaczana odległośc (np.: gdy B I 0 = = B n n 38 n to wymar przestrzen, w której znajdują sę obekty uczące x j, to mamy do czynena z odległoścą eukldesową). d 2 jb = x j v 2 B = T ( x v ) B ( x v ) j j (4-20) Celem mnmalzacj funkcj celu F stosuje sę róŝne metody take jak: symulowanego wyŝarzana [7], algorytmy genetyczne [4], [73], czy mnmalzacja lczby współrzędnych [0], [34], czy metody klasyczne przytoczone w rozdzale 3.4. Jednak najpopularnejszą ([9], [5], [83]) metodą jest algorytm rozmytych k-średnch (z angelskego FCM fuzzy c-means). Algorytm ten wywodz sę ze sposobu znalezena ekstremum funkcj F w oparcu o warunek 4-5(b) za pomocą metody mnoŝnków * Lagrange a, z której otrzymujemy, Ŝe funkcja F posada mnmum dla warunków danych wzorem 4-2(a-b). k 2 / a) ( ) ( ) ( m ) {,2,..., k} j {,2,..., D } µ A x j = djb / d ljb d jb >0 m> l= (4-2) b) j = v = {,2,..., k} D ( µ A ( x j ) D ( µ A ( x j ) j = m x m j Wartość v dana wzorem 4-2(b), to środek grupy A stąd pochodz nazwa algorytmu. * Do funkcj F dodajemy sumę loczynów współczynnka neoznaczonego λ warunku 4-5(b). Pochodne cząstkowe tak uzyskanej funkcj wynoszą zero [9]. Rozwązana układu równań przedstawają wzory 4-2.

39 39 Algorytm FCM [9]: rok : Ustal zbór danych uczących D; określ lczbę k grup A taką, Ŝe k {2,3,..., D -} (aby otrzymać zadane ne będące trywalnym); ustal wartość wag m, ); ustal warunek zakończena algorytmu ε > 0 ; ustal macerz B określającą normy do wyznaczana odległośc (np.: B=I); ustaw na zero lcznk realzacj pętl lcznk=0; ustal losowo wartośc w macerzy U (lcznk=0) Pf k. rok 2: Zwększ wartość lcznk o jeden rok 3: Wyznacz wartośc średnch: v ( lcznk ) j= = D ( lcznk ) ( µ A ( x j ) D ( lcznk ) ( µ A ( x j ) j= m x m j gdze {,2,...,k} rok 4: Wyznacz kwadraty odległośc: d 2 jb = T ( x v ) B ( x v ) j j gdze {,2,...,k}, j {,2,..., D } rok 5: Wyznacz macerz U (lcznk) o wartoścach: µ A ( x ) j k = l= 0 rok 6: k Warunek A ( x j ) j {,2,... D } 2 / ( ) ( m d / d ) jb ljb dla dla gdze {,2,...,k}, j {,2,..., D } = wartość przystosowana ( ) d d jb jb > 0 = 0 µ = moŝe ne być spełnony, gdy wyznaczana µ musała w sposób sztuczny przyjąć wartość x A j 0. Wtedy dla obektu uczącego x j wartośc przystosowana wyznaczone k sztuczne ustaw tak, Ŝeby był spełnony warunek: A ( x j ) = µ =. rok 7: JeŜel U (lcznk) - U (lcznk-) ε (najczęścej przyjmuje sę, Ŝ norma określająca błąd U (lcznk) - U (lcznk-) wynos max k (µ (lcznk) k -µ (lcznk-) k ) ), to przejdź do kroku 2, a w przecwnym wypadku zakończ algorytm.

40 40 Macerz B o wymarach n n (gdze n to wymar przestrzen, w której znajdują sę obekty uczące x j ) określająca normę, którą stosujemy do wyznaczana odległośc często [9] określana jest teŝ w postac normy dagonalnej (wzór 4-22). B dag / DX 0 = / DX / DX gdze DX jest warancją zmennej losowej X (o rozkładze dyskretnym, która jest opsana na -tym wymarze przestrzen R n ) daną wzorem D 2 ( VX ) = ( x j x ) j= n n n, (4-22) D 2 DX = gdze x = x (4-23) l D D l= Istneje teŝ jeszcze nny sposób dopasowana odległośc do właścwośc zboru D odległość wyznaczona poprzez normę Mahalanobsa. Macerz odległośc B mah w tym sposobe jest odwrotną macerzą do macerzy kowarancj B cov określanej poprzez zaleŝność owarancja cech x, x j (opsanych na -tym oraz j-tym wymarze przestrzen R n ) zboru D={x,x 2,...,x D } R n dana jest wzorem D D j j j Cx x = gdze x = xl, x = x (4-24) l D D D D j j ( x x )( x x ) l l l= l= l= I [ j ] B = = = cov Bmah δ gdze n n n n (4-25), j {,2,..., n} gdy = j δ j = 0 gdy j B cov Cx x 2 = Cx x... n Cx x Zastosowane macerzy odległośc wpływa na jakość rozmytej klasteryzacj dzęk zmenającym sę marom odmennośc elementów uczących. Norma eukldesowa tworzy klastry rozmyte o kształce hpersferycznym, tzn. obszar o stałej wartośc przystosowana jest hpersferą. Norma dagonalna Mahalobsa tworzą klastry rozmyte o kształce hperelpsodalnym, ale dla normy dagonalnej ose hperelpsod są zawsze równoległe do os układu współrzędnych. Dzęk tym właścwoścom norma Mahalobsa najlepej oddaje właścwośc grupy elementów uczących. Cx Cx Cx 2... n x x x Cx Cx Cx 2... n x x x n n n

41 Przykład 4-4 Rozpatrzmy prosty przykład określana odległośc dla zboru danych uczących D={d,d 2,d 3,d 4,} R 2 o współrzędnych d =(,0), d 2 =(2,3), d 3 =(5,4), d 4 =(4,). Zgodne ze wzorem 4-23 środek punktów określających w przestrzen R 2 dane uczące określony jest jako: d = ( x, y) = (( ) / 4,( ) / 4) = ( 3,2) Wartośc kowarancj zgodne ze wzorem 4-23 wynoszą: C xx =DX=((-2) 2 +(-) )/4=0/4 C yy =DY=((-2) (-) 2 )/4=0/4 C xy =C yx =((-2) (-2)+(-) (-))/4=6/4. Stąd mamy: / DX 0 0,4 0 B dag = =, 0 / DY 0 0,4 C = = 0 / 6 / xx Cxy / 8 3/ 8 B cov, B = C yx C. mah yy 6 / 4 0 / 4 3/ 8 5 / 8 RóŜnce pomędzy odległoścam dobrze przedstawają ponŝsze rysunk, na których zaznaczono okręg o promenu 2 o środku w punkce d dla odległośc nalczanej kolejno (od lewej) według macerzy I, B dag, B mah. 4 Rozwnęcem algorytmu FCM jest algorytm Gustafsona-essela [32] (który dla kaŝdego z wyodrębnonych zborów rozmytych tworzy odrębną macerz odległośc), czy teŝ algorytm wyznaczana rozmytego maksymalnego prawdopodobeństwa (z ang. fuzzy maxmum lkelhood estmaton algorthm) [27]. Podobnym algorytmem do FCM jest PCM, czy HCM [73]. Odrębną grupę algorytmów stanową te zaproponowane w pracach m.n. Bezdeka: k-wyborów [9], k-elpsod [8], czy rozmyty model regresj [33]. Na podstawe przytoczonego algorytmu FCM moŝna zaobserwować, Ŝe metody grupowana rozmytego mają zazwyczaj charakter teracyjny, a ch celem jest doprowadzene do wyznaczena stopna przynaleŝnośc kaŝdego badanego obektu do kaŝdej z grup, których lczba jest narzucona z góry (znana lub załoŝona). Są to metody czasochłonne oblczenowo wymagające wyznaczana welu współczynnków. Dla potrzeb rozwązywanego w nnejszej pracy zadana efektywność oblczenowa ma duŝe znaczene, gdyŝ celem jest zbudowane takego algorytmu, który będze generował reguły logczne uzyskując z nch jednocześne maksymalne skondensowaną praktyczne uŝyteczną wedzę na podstawe przeprowadzanej analzy

42 danych. Ponadto ze względu na charakter zadana grupowane pownno meć charakter częścowo nadzorowany (z nauczycelem), ponewaŝ pommo znanego przydzału obektów do klas (cąg uczący) dopuszcza sę pewne błędy w grupowanu, jeŝel dają one znaczące zmnejszene lczby reguł klasyfkacyjnych. Wszystke te wymagana spełna opsana w rozdzale pątym metoda, która charakteryzuje sę następującym cecham: - wykorzystuje rozmytość w określanu przynaleŝnośc obektów do grup; - ma charakter częścowo nadzorowany, poprzez kontrolowane uwzględnane globalnej lczby prawdłowo klasyfkowanych obektów do grup; - maksymalzując lczbę poprawnych przypsań obektów przeprowadza ekstrakcję wedzy w postac mnmalzowanej lczby reguł; - zagęszcza lczbę reguł w obszarach trudnych dagnostyczne, a rozrzedza o obszarach, gdze dagnoza jest bardzej jednoznaczna Generowane reguł w oparcu o rozmytą analzę danych Przydatną technką podczas analzy danych jest uzyskane reguł jeŝel-to w postac drzewa herarchcznego lub w postac struktury sec neuronowej Pedrycza [78]. RówneŜ moŝlwość ekstrakcj pewnych obszarów klasyfkacj danych z sec ohonena ([80], [79], [5], [73]) wydaje sę być przydatną technką analzy danych. Jednak metody te pozbawone są cech pozwalających na uzyskane satysfakcjonujących wynków (np. w postac newelkej lczby reguł jeŝel-to) w przypadkach praktycznych zagadneń zborów danych trudnoseparowalnych (tj. gdy dane róŝnych klas sąsadują ze sobą ne jest prostym wyodrębnene ch grup). Z tego powodu proponuje sę [73] systemy neuronowo-rozmyte ([60], [77]), w tym do rozwązywana zadań klasyfkacj. Do jednych z łatwejszych do ekstrakcj wedzy w postac rozmytych reguł jeŝel-to ze struktury sec naleŝy trójwarstwowa seć Pedrycza z warstwą rozmytych neuronów na wejścu, warstwą neuronów ukrytych typu logcznego AND z jednym wyjścem w postac neuronu logcznego OR. Sztuczny neuron [5] w ogólnośc naleŝy rozpatrywać jako przetwornk m sygnałów x (gdze {,2,.., m} ℵ), które to podawane na wejśce przemnaŝane są przez odpowedne współczynnk wag w (gdze w 0, R, {,2,.., m} ℵ), a wynk mnoŝena są sumowane tworząc tzw. potencjał neuronu. Ów potencjał jest

43 najczęścej [5] argumentem funkcj f lnowej, progowej lub sgmodalnej, której wartość jest sygnałem wyjścowym neuronu y (4-26). m 43 y = f ( x w ) (4-26) = Neuron logczny OR czy AND generuje sygnał wyjścowy uŝywając przekształceń opsanych wzoram odpowedno m = ( x AND w ) y = OR (4-27) m = ( x OR w ) y = AND (4-28) Neurony jednego typu układa sę w warstwy tak, Ŝe wyjśca neuronów jednej warstwy są wejścam neuronów kolejnej. W zaleŝnośc od uŝytych neuronów rozróŝna sę dwe podstawowe archtektury sec Perdycza: SOM (z ang. sum of mnterms) oraz POM (z ang. product of maxterms). W perwszej z tych archtektur zbudowana reguła jeŝel-to jest alternatywą konunkcj, a w drugm przypadku - konunkcją alternatyw. Zgodne z twerdzenem Shannona kaŝdą regułę logczną moŝna przedstawć jako SOM lub POM. Do zaprezentowana reguły jeŝel-to w postac alternatywy konunkcj w warstwe ukrytej umeszcza sę neurony logczne AND, a w warstwe wyjścowej OR. Warstwa wejścowa x x 2 Warstwa ukryta h neuronów AND x m x x 2 AND h Warstwa wyjścowa x m Rysunek 4-. Schemat sec neuronowej Pedrycza o archtekturze SOM Dodatkowo w sec Pedrycza w warstwe wejścowej umeszcza sę wejśca zanegowane x, Ŝeby uzyskane reguły mogły operować na alternatywe, konunkcj negacj (rysunek 4-). Rozmytą modyfkacją tejŝe sec jest wprowadzene na jej wejśce ne wartośc boolowskch, ale rozmytych tworząc sec Mamdanego, czy systemy neuronoworozmyte typu logcznego [73]. Uczene sec Pedrycza jest zmodyfkowanym algorytmem wstecznej propagacj. Algorytm ten w ogólnośc nakazuje wykonane zmany wag neuronu OR w w oparcu o

44 44 wzór 4-29, gdze α 0, R jest tzw. współczynnkem nauczana, a E jest funkcją błędu. Najczęścej do ustalena błędu uŝywana jest wartość błędu średnokwadratowego opsanego wzorem 4-30 dla wyjśca sec o l neuronach generalzowana do wzoru 4-3 w przypadku sec neuronowej o pojedynczym wyjścu, gdze y to wartość uzyskanego sygnału wyjścowego z sec, a d to oczekwana tam wartość dla sec o jednym wyjścu (odpowedno y k oraz d k ze wzoru 4-30, to wartość uzyskana oczekwana na k-tym wyjścu z sec). E w = α (4-29) w l 2 2 E = ( ) (4-30) k = 2 y k d k 2 E = ( y d ) (4-3) Oznaczmy przez: I lczbę sygnałów wejścowych x wektor wejść (o 2I współrzędnych: od do I oznaczają wejśca proste, a od I+ do 2I wejśca negowane) H lczbę neuronów w warstwe ukrytej w macerz wag ukrytych (gdze w h oznacza -tą wagę h-tego neuronu ukrytego) z wektor wyjść warstwy ukrytej v wektor wag neuronu wyjścowego y wyjśce sec Wobec powyŝszych oznaczeń wzoru 4-3 moŝemy zapsać wzory E E y y = = ( y d ) v y v v h h h (4-32) E w h E y = y w h = ( y d ) y w h (4-33) dla h {, 2,..., H} ℵ, {, 2,..., 2I} ℵ. Defncja: t norma oznacza funkcję t : 0, 0, 0,, taką Ŝe:. dla dowolnej wartośc argumentu jest ona nemalejąca, tzn. dla x y w z zachodz x t w y t z, 2. jest przemenna, tzn. x y y x t = t, x t y t z = x t y t z, 3. łączna, tzn. ( ) ( ) 4. spełna warunk: x t 0 = 0, x t = x, gdze: x, y, z, w 0,. Funkcja ta reprezentuje konunkcję rozmytą swoch argumentów. Dla wartośc {0,} jest to klasyczna konunkcja.

45 45 Defncja: s norma oznacza funkcję 0, 0, 0, : s, taką Ŝe:. dla dowolnej wartośc argumentu jest ona nemalejąca, tzn. dla y x z w zachodz z y w x s s, 2. jest przemenna, tzn. x y y x s s =, 3. łączna, tzn. ( ) ( ) z y x z y x s s s s =, 4. spełna warunk: x x = 0 s, s = x, gdze: 0,,,, w z y x. Funkcja ta reprezentuje alternatywę rozmytą swoch argumentów. Dla wartośc {0,} jest to klasyczna alternatywa. W neuronach typu OR moŝe być uŝyta [67] jako s-norma funkcja maxmum, a operator AND zrealzowany moŝe zostać [67] poprzez funkcję mnmum (jako t- norma), co prowadz do wzorów ( ) ( ) ( ) ( ) h h H h h h z v z v s s z v s z v y t S t... t t 2 2 = = = (4-34) ( ) ( ) ( ) ( ) h I I I h h h h x w x w t t x w t x w z s T s... s s = = = dla h {, 2,..., H} ℵ. (4-35) PonewaŜ funkcje necągłe ne są róŝnczkowalne w punktach necągłośc, to zakłada sę [67] ch róŝnczkowalność w sposób opsany wzoram > = = b a b a b b a b b a dla dla 0 ), max( ), s( (4-36) < = = b a b a b b a b b a dla 0 dla ), mn( ), ( t (4-37) Ze wzoru 4-34 uzyskujemy wzór na pochodną sygnały wyjścowego po h-tej wadze neuronu wyjścowego (wzór 4-38). ( ) ( ) ( ) = = = = h h k k H h k k h k k H k h h z v z v v z v v v y t s t S t S (4-38) Oznaczmy: ( ) k k H h k k z v A t S = = ( ) ( ) h h h h h v z z v v B t t ) ( = = Wobec tych oznaczeń wzoru na pochodną funkcj złoŝonej moŝna zapsać wzór 4-38 w postac: ( ) h h h h h h h v v B v v B A v B A v v y = = ) ( )) (, s( ) ( s Wobec wzorów zapsujemy:

46 46 h h h h h h v v z v v B A v y = ), mn( )) (, max(, czyl: < > = h h h h h h h v z v z v B A v B A v y dla 0 dla ) ( dla ) ( dla 0 co zapsać moŝna: = = = = = ), mn( dla 0 ), mn( dla )) (, max( ) ( dla )) (, max( dla 0 h h h h h h h h h h v z z v z v v B A v B v B A A v y ZauwaŜ my, Ŝe wobec przyjętych oznaczeń wzoru 4-38 zachodz: y v B A v B A h h = = ) ( s )) (, max( oraz ( ) ( ) ), mn( t t ) ( h h h h h h h v z v z z v v B = = =. MoŜemy węc zapsać, Ŝe: = = = w przecwnym przypadku v z v v B A v B v y h h h h h h 0 ), mn( )) (, max( ) ( dla czyl: = = h h h v y v y v y dla 0 dla Wzór 4-38 wobec wzorów zapsać moŝemy w postac wzoru = = h h h v y v y v y dla 0 dla (4-39) Ze wzoru uzyskujemy wzór = = h h h v y v y d y v E dla 0 dla dla h {, 2,..., H} ℵ. (4-40) Wzór 4-40 jest wzorem na modyfkację wag w neurone wyjścowym. PonewaŜ seć Pedrycza dąŝy do uzyskwana na wyjścach wartośc logcznych 0 lub, to uzyskane wartośc wag v h 0, R wskazuje na koneczność jej modyfkacj. UŜyte jako normy funkcje mnmum maxmum ne generują nowych wartośc, a jedyne przyjmują te z uzyskanych argumentów, którym są wartośc wag wartośc wejść. Z tego powodu ( na podstawe wzoru 4-40) podczas uczena sę sec wag neuronu wyjścowego dąŝą do przyjęca wartośc logcznych 0 lub. W analogczny sposób jak ze wzoru 4-32 uzyskano wzór 4-40, wykonujemy wyznaczene (wzór 4-33) wzoru na modyfkację wag w neurone warstwy ukrytej zaczynając od wyznaczena pochodnej sygnały wyjścowego po wadze neuronu warstwy ukrytej (wzór 4-4). = = H k h k k h w z z y w y dla h {, 2,..., H} ℵ, {, 2,..., 2I} ℵ. (4-4)

47 PonewaŜ jedyne wyjśce h-tego neuronu ukrytego z h zaleŝy od wartośc wag w h co daje nezerową pochodną, to wzór 4-4 moŝemy zapsać w postac y w h y = z h z w h h dla h {, 2,..., H} ℵ, {, 2,..., 2I} ℵ. (4-42) Analogczne do przekształcena wzoru 4-38 w 4-39 moŝemy zapsać wzór jako rozwnęce wzoru y z h 47 dla y = zh = (4-43) 0 dla y zh z w h h = w h 2I T j= 2I ( w s x ) = T ( w s x ) t( w s x ) hj j w h j= j hj j h (4-44) Oznaczmy: A = I T 2 j= j h ( w s x ) hj j ( w s x ) ( x s w ) B ( w ) = = h h Wobec tych oznaczeń wzoru na pochodną funkcj złoŝonej moŝna zapsać wzór 4-44 w postac: zh t( A, B( wh )) B( wh ) = ( AtB( wh )) = w w w w h h Wobec wzorów zapsujemy: zh mn( A, B( wh )) max( x, wh ) = wh wh wh czyl: z w h h = 0 dla A B( w h dla A < B( w h ) 0 ) co zapsać moŝna: z dla B( wh ) = mn( A, B( w h = wh 0 dla A = mn( A, B( wh )) ZauwaŜmy, Ŝe: mn( A, B( w )) = At B( w ) = z oraz h h h h dla x > w dla x w h )) 0 ( w s x ) = ( x s w ) max( x, w ) B ( wh ) = h h = h MoŜemy węc zapsać: h h h dla x dla w h = max( x, wh ) = max( x, wh ) z h w h dla B( wh ) = z h wh = B( w = 0 w przecwnym przypadku h ) = 0 dla z dla z h h = w w h h Wzór 4-44 zapszmy w postac wzoru z w h h = 0 dla z h dla z h = w h w h dla h {, 2,..., H} ℵ, {, 2,..., 2I} ℵ. (4-45)

48 48 Wobec wzoru , wzór 4-42 moŝemy zapsać w postac y w h = 0 dla y = z h dla y z h 0 dla z h dla z h = w h w h = 0 dla h {, 2,..., H} ℵ, {, 2,..., 2I} ℵ. dla y = w h dla y w h (4-46) Wobec wzoru 4-46 wzór 4-33 będący wzorem określającym sposób modyfkacj wag w ukrytej warstwe neuronów uzyskujemy wzór E w h y d = 0 dla y = w dla y w h h dla h {, 2,..., H} ℵ, {, 2,..., 2I} ℵ. (4-47) Z wyprowadzonych wzorów , opsujących sposób modyfkacj wag neuronów w warstwe wyjścowej oraz warstwe ukrytej, moŝna wnoskować, Ŝe wag te dąŝyć będą podczas uczena sec do wartośc logcznych 0 lub. UmoŜlw to prześledzene w strukturze wag sec przebegu sygnału wejścowego, aŝ do uzyskana sygnału wyjścowego zapsane reguły jeŝel-to ( jeŝel wejśce, to wyjśce ). Tym sposobem archtektura sec neuronowej Pedrycza koduje reguły jeŝel-to, które mogą posłuŝyć do np. klasyfkacj. Pewnym problemem zwązanym z uzyskwanem reguł jeŝel-to przedstawoną metodą jest fakt, Ŝe opsana seć neuronowa traktuje dane wejścowe jako dane typu wylczenowego, przez co trac zdolność do generalzacj. Generalzacja ta małaby polegać na łączenu sąsednch wejść ze sobą (tj. takch wejść, które opsują sąsedne obszary przestrzen lczb rzeczywstych). Dopero dzęk temu moŝna uzyskwać newele ogólnych reguł (tj. opsujących duŝe obszary analzowanej przestrzen), a wobec braku tego mechanzmu uzyskuje sę duŝo reguł szczegółowych. Wedza zawarta w regułach jest najcennejsza dla człoweka, jeŝel reguł tych jest newele, przez co są łatwe do przeanalzowana. W przypadku reguł lcznych program realzujący ch uŝyce będze dzałać poprawne, ale zrozumene zasad jego dzałana przez człoweka będze trudne. Tak węc, czy to uŝywając sec Pedrycza, czy jej rozmytej mplementacj (z rozmytym neuronam na wejścu gdze rozmytość uzyskuje sę poprzez kwantowane wartośc funkcj przynaleŝnośc z zadaną dokładnoścą) naleŝy uzyskać uprzedno odpowedno zgeneralzowany zestaw danych uczących (czy to dzęk ntucj badacza, czy metodam algorytmcznym np.: połowena przedzałów). W przypadku trudnoseparowalnych danych uczących moŝna uzyskać bardzo lczny zbór danych wejścowych, co będze skutkowało znaczącym brakem generalzacj uzyskanych reguł jeŝel-to.

49 49 5. Generowane genetyczna redukcja rozmytych reguł klasyfkujących Zaproponowany algorytm generowana reguł klasyfkujących (bazujący na [42]) polega na podzale całej przestrzen danych uczących na mnejsze obszary (klastry) na przyporządkowanu kaŝdemu z nch rozmytej reguły jeŝel-to. Jednak stosując taką metodę moŝna otrzymać welką lczbę reguł, co często czyn metodę neefektywną, natomast zawsze unemoŝlwa (lub znaczne utrudna) nterpretację wynków przez człoweka pozyskwane przez nego wedzy. Próba zastosowana welkej lczby reguł klasyfkujących w systeme ekspertowym [63] spowoduje powolne jego dzałane brak moŝlwośc przejrzystego uzasadnena wykonanej klasyfkacj. W celu zmnejszena lczby reguł nezbędnych do wykonana klasyfkacj zastosowany został algorytm genetyczny. 5.. Generowane reguł rozmytych Nech dany będze nepusty zbór danych uczących D zawarty w n-wymarowej przestrzen lczb rzeczywstych D R n ( n ℵ) o mocy D. PonewaŜ w symulacjach komputerowych ne moŝna wyrazć zborów neskończonych, to moc zboru D jest teŝ jego lcznoścą. Z tego samego powodu kaŝdy z rzeczywstych wymarów X m (gdze m {,2,...,n}), na którym rozpęty został zbór D, jest odcnkem (5-). m 2 n 2 2 n n D X X... X = xmn, xmax xmn, xmax... xmn, x max (5-) m m m m xmn = mn{ x ; {,2,..., D }} xmax = max{ x ; {,2,..., D }} {,2,..., n} n ℵ Przyjmjmy ponadto, Ŝe dla kaŝdego z wymarów X m ne zachodz przypadek, Ŝ m odcnek jest zborem jednoelementowym { x 0 } (gdy x m m 0 xmn = = x ), ponewaŝ wymar tak ne nese ze sobą stotnych nformacj umoŝlwających klasyfkację (5-2). m 2 n 2 2 n n D X X... X = xmn, xmax xmn, xmax... xmn, x max (5-2) m m m m xmn = mn{ x ; {,2,..., D }} < xmax = max{ x ; {,2,..., D }} {,2,..., n} n ℵ Stosowany w oblczenach komputerowych system zapsu lczb zmennoprzecnkowych powoduje, Ŝe najwększa precyzja oblczeń jest w okolcy zera [7]. Z tego powodu przekonwertujmy zbór D na zbór D tak, aby zawerał sę on w przestrzen 0, n m max

50 50 odwzorowane konwertujące k : D D' nech będze odwzorowanem wzajemne o. w. j. jednoznacznym. Przykładowo taka konwersja moŝlwa jest za pomocą wzoru (5-3). {[ x', x' 2,... x' n m {,2,..., n} n ℵ ],...,[ x' D, x' o {,2,..., D } 2 D,... x' n D x' m o = x x m o m max x x n m mn m mn ]} = D' 0, 0,... 0, = Przyjmjmy ponadto, Ŝe cała przestrzeń 0, n jest obszarem dopuszczalnym. razy 0, n (5-3) Przestrzeń 0, n dzelona jest na n podobszarów rozmytych A A... A m... A, gdze kaŝdy z n zborów rozmytych 2 n A m ( m {,2,...,n}) wyznaczonych dla podzału określony jest przez trójkątną funkcję przynaleŝnośc µ : 0, 0, danej wzorem (5-4). m m {,2,..., n} {2,..., max} n ℵ {,2,..., } m gdze a m m x a m m µ ( x ) = max,0 (5-4) m b m = b = Rysunek 5-. Podzał odcnka jednostkowego 0, przez =5 trójkątnych funkcj przynaleŝnośc µ : 0, 0, (opsanych wzorem 5-4) na podobszary rozmyte A,2,... rozmytego na przykładze =,2,..., =. Zaznaczono zasadę tworzena podobszaru A. = 5 = 4 Do kaŝdego podobszaru A A... A m... A przypsana jest reguła rozmyta 2 n jeŝel-to R 2... m... słuŝąca do klasyfkacj danych, która brzm: n

51 5 "JeŜel n-wymarowy obekt x=(x,x 2,...,x m,...,x n ) naleŝy do podobszaru A A... A m... A (gdze ndeksy 2 n, 2,.., m,..., n {,2,...,} jest lczbą podzałów), to jest on klasy C 2... m... z pewnoścą n 2 m n ( ) µ ( x )... µ ( x ) µ ( x ) CF µ ". x m n 2 m n lasa C 2... m... przypsana do reguły n R 2... m... jest klasą ze zboru wszystkch klas CT, n co zapsujemy C 2... m... CT (dla T {, 2,...,M} ℵ M jest lczbą klas) n CF 2... m... R + {0}. n W celu wyznaczena reguły R 2... m... reguły wyznaczyć wartość zaufana naleŝy określć klasę n CF 2... m... (algorytm 5-). n C 2... m... przypsaną do tej n Algorytm 5-: Tworzene reguły rok : R 2... m... n Dla kaŝdej klasy CT 0 (gdze T 0 {,..., M} M jest lczbą klas) naleŝy wyznaczyć β CT0 jako sumę zgodnośc wszystkch elementów uczących 2 m x u =( x, x,..., x,..., x u u u n u ) u {,2,..., D } ze zboru D 0, n będących klasy CT 0 względem funkcj przynaleŝnośc wyznaczających regułę T0 {,2,..., M } β CT0 = R 2... m... D' µ u= 2 m n x = [ x, x,... x,... x ] D' u u u u lasa( xu ) = CT0 n (wzór 5-5). u 2 µ µ,..., µ m,..., µ, 2 2 m n ( x ) µ ( x )... µ ( x )... µ ( x ) rok 2: NaleŜy znaleźć klasę CT o maksymalnej wartośc β CT (5-6). rok 3: u u m u n u n (5-5) β CT = max {β C,..., β CM } (5-6) JeŜel β CT =0 lub występują dwe lub węcej klas, dla których wyznaczone wartośc β CT0 przyjmują maksymalną wartość, to wtedy klasa R 2... m... C przypsana do reguły ne jest defnowana zaufane n 2... m n do takej reguły wynos 0. Reguła taka nazywana jest regułą nestotną. W pozostałych przypadkach klasą C 2... m... jest klasa CT n. JeŜel zaufane CF m... ne zostało określone jako 0 w kroku 2, to 2... n wyznacza sę je wzorem (5-7). CF 2... m... n β CT β, gdze β = β = M T = CT M β CT T = T T M m CF... n (5-7)

52 52 Realzację algorytmu 5- naleŝy rozpocząć od podzału =2. Po wygenerowanu zboru S reguł rozmytych jeŝel-to dla zadanego, naleŝy zwększyć wartość o jeden powtórzyć cały algorytm. Powtarzane algorytmu naleŝy zakończyć, jeŝel dla beŝącego (nazywanego teraz max ) wszystke reguły R 2... m... n poprawne sklasyfkować wszystke elementy ze zboru uczącego D. ze zboru S potrafą NaleŜy zauwaŝyć, Ŝe wzór (5-7) określający zaufane spełna dwa wymog zgodne z ntucją: CF 2... m... n do klasyfkacj a) JeŜel β CT >0 dla kaŝdej wartośc T 0 T β CT0 =0, to oznacza Ŝe wszystke elementy ze zboru uczącego D mogące dać wynk ze wzoru (5-5) wększy od zera naleŝą do jednej klasy CT. Wtedy zaufane CF m... =, czyl 2... n klasyfkacja jest pewna. b) JeŜel dla kaŝdego T 0 wartośc β CT0 newele sę od sebe róŝną, to CF 2... m... n 0, czyl klasyfkacja ne jest pewna. Algorytm 5-2 umoŝlwa [42] klasyfkację dowolnego obektu x=(x,x 2,...,x m,...,x n ) na podstawe zboru reguł S wygenerowanych dla zadanego. Algorytm 5-2: lasyfkacja n-wymarowego obektu x=(x,x 2,...,x m,...,x n ) za pomocą reguł ze zboru S rok : rok 2: NaleŜy wyznaczyć α CT0 dla kaŝdej klasy CT 0 (gdze T 0 {,2,...,M} M jest loścą klas) wg zaleŝnośc (5-8). { ( ) ( 2 ) ( m ) ( n ) α CT = max µ x µ x... µ x... µ m x CF 0 2 n... m... n } (5-8) T {,2,..., M } 2 0 C CT 2... m... = n 0, 2,..., m,... n {,2,..., } R m... n S 2... NaleŜy wyznaczyć klasę CT taką, Ŝe: α CT = max { C,..., CM } (5-9) Wynkem tego algorytmu jest klasa CT. JeŜel dwe lub węcej klas przyjmuje maksymalne wartośc α CT0 we wzorze (5-9) lub wszystke wartośc klasyfkowany. α CT0 są zerem, to element x=(x,x 2,...,x m,...,x n ) ne jest

53 53 Rysunek 5-2. Utrata wpływu na klasyfkację reguły rzecz reguły = 2 = = 2 R o zaufanu CF 0, 5 na = 2 = 2 = 2 R o zaufanu CF. = = = 2 = NaleŜy tu zwrócć uwagę, Ŝe we wzorze (5-8) uŝyto do wyznaczana welkośc α CT0 zaufana do klasyfkacj CF 2... m... n z reguły R 2... m... n. PonewaŜ wartość owego zaufana naleŝy do przedzału 0,, to loczyn zaufana CF 2... m... n wartośc 2 µ ( x ) µ ( x )... m µ ( x )... n µ ( x ) moŝe ulec zmnejszenu w stosunku do m 2 n 2 wartośc µ ( x ) µ ( x )... m µ ( x )... n µ ( x ). Dzęk temu wpływ reguły m 2 n R 2... m... n z obszaru A A... A m... A moŝe ulec zmnejszenu na korzyść reguł 2 n przypsanych do obszarów sąsadujących z A A... A m... A (czyl obszarów 2 n A A... A m... A j j j j gdze kaŝdy z ndeksów j 2 n m ( m {,2,...,n} n lczba wymarów) moŝe przyjmować wartośc ze zboru { m -, m, m +}) rysunek 5-2. Przykład 5- Nech będze określony [42] zbór danych uczących D=D zawarty w przestrzen 0, 0,. Nech składa sę on z danych dwóch klas: C C2. C 0.3, , , , , , , , , , 0.07 C2 0.50, , , , , , , , , , 0.09 Tabela 5-. Zbór D Rysunek 5-3. Zbór D w przestrzen 0, 0,

54 54 Wykonajmy algorytm 5- dla =2. Dla przestrzen dwuwymarowej realzację algorytmu 5- wykonuje program kulk.exe (mojego autorstwa). Rysunek 5-4. Zbór reguł S 2 ch wpływ na klasyfkację - objaśnena w tekśce Na rysunku 5-4 w okne Prawa kolorem jasnozelonym zaznaczone są reguły z przypsaną klasą C, a kolorem błęktnym z przypsaną klasą C2. Jak pokazuje jednak okno Lna podzału [26] z rysunku 5-4 wpływ poszczególnych reguł na klasyfkację rozmytą jest neco nny nŝ obszary rozmyte uzyskane w algorytme 5-. W okne Lna podzału z rysunku 5-4 kolorem nebeskm zaznaczono obszar, w którym obekty zostałyby zaklasyfkowane do C przez reguły z S 2, a kolorem czerwonym do C2. Przyczyną róŝnc są róŝne wartośc zaufana przypsane do poszczególnych reguł, a mające wpływ na pewność wykonywanej klasyfkacj (wzór 5-8), co przedstawa rysunek 5-5. Rysunek 5-5. Wpływ zaufana na pewność wykonywanej klasyfkacj α CT zboru reguł S 2 (, j odpowadają osom x, y z rysunku 5-3). (wzór 5-8) dla Rysunek 5-6. Zbory S 3, S 4, S 5, S 6 (znaczene kolorów jak na rysunku 5-4, kolor czarny oznacza regułę nestotną)

55 55 Rysunek 5-7. lasyfkacja przez reguły ze zboru S =6 (znaczene kolorów jak na rysunku 5-4, kolor czarny oznacza brak klasyfkacj) Rysunek 5-8. lasyfkacja przez wszystke reguły (wzór 5-8 rozwnęty do zboru reguł S 2 S 3 S 4 S 5 S 6 ) Realzując algorytm 5- otrzymujemy kolejne zbory reguł S 3, S 4, S 5, S 6 aŝ do uzyskana ostatecznego podzału max =6. Porównując rysunk przedstawające klasyfkację regułam ze zboru S 6 S 2 S 3 S 4 S 5 S 6 warto zauwaŝyć, Ŝe wzęce pod uwagę przy klasyfkacj reguł z perwszych podzałów (wzór 5-4) zmnejsza szansę na pojawene sę obszarów, w których klasyfkacja ne moŝe być wykonana (czarne obszary na rysunku 5-7) Redukcja lczby reguł poprzez zmnejszane lczby podzałów Podczas realzacj algorytmu 5- w ostatnm wykonanym podzale max uzyskujemy zbór max S rozmytych reguł jeŝel-to zdolnych poprawne klasyfkować (algorytm 5-2) wszystke dane uczące ze zboru D. S = { 2,..., max} Jednak lczność uzyskanego zboru ( ) n (5-0) max S (wzór 5-0) moŝe przewyŝszać lczność zboru D = D (z powodu zastosowana podzału na podobszary rozmyte), co czyn metodę neefektywną. MoŜemy zredukować lczbę uzyskanych reguł, jeŝel zastąpmy je regułam uzyskanym z poprzednch podzałów. W celu sformalzowana tej redukcj wprowadźmy jeszcze pojęca zborów S A (wzory 5-, 5-2, 5-3). S 2 3 max = S S... S... S = S (5-) U {2,..., max} S ( ) n +... ( ) n 2 n + 3 n = (5-2) max A S M A S (5-3) Zbór S jest zborem wszystkch wygenerowanych reguł rozmytych, a zbór A jest zborem reguł wybranych do klasyfkacj. lasyfkacja nowego obektu x=(x,x 2,...,x m,...,x n ) wg reguł naleŝących do zboru A odbywa sę analogczne do algorytmu 5-2 tylko wzór (5-8) dotyczy reguł ze zboru A (wzór 5-4).

56 2 m n α { µ ( ) µ ( x )... µ ( x )... µ ( x ) CF } CT = max x T M m n... m... {,2,..., } n 0 C CT 2,,..., m n m,... n {,2,..., } = 0 2 R m... n A S S 2... = U 56 (5-4) W celu zmnejszena lcznośc uzyskanego zboru S naleŝy zakończyć wcześnej algorytm generowana reguł 5-. W tym celu proponuje sę [2] dokonywane kolejnych podzałów tylko w obszarach decyzyjne trudnych tj. w obszarach, gdze wygenerowana reguła ne realzuje poprawnej w 00% klasyfkacj. Inne prace proponują stosowane metody spadku gradentu ([56], [39], [64]), zastosowane samogenerujących sę reguł sterowanych secą neuronową ([37], [38], [90]) lub algorytmem genetycznym ([65]). Przykład 5-2 Nech w obszarze X= 0, obszarem trudnym decyzyjne będą okolce punktu 0, a obszarem łatwym decyzyjne okolce punktu. W celu zmnejszena lczby realzacj algorytmu 5- moŝna zastosować przykładowo funkcję daną wzorem 5-5. N g ( x) = x +, gdze N, ) R (5-5) Rysunek 5-9. Wykres funkcj g (wzór 5-5) - ndeks dla funkcj g parametru N wprowadzono w celu zaznaczena, Ŝe funkcja jest opsana w X aŝda z tych metod jest dość wydajna umoŝlwa uzyskane newelkej lośc reguł. Jednak są to metody skomplkowane oblczenowo, a przez to trudne do objaśnena podczas wdroŝeń systemów nformatycznych [] praktyczne ch uŝywających. Prostą metodą neskomplkowaną oblczenowo jest transformacja przestrzen danych uczących 0, n w przestrzeń 0, n tak, aby obszary decyzyjne trudne zostały powększone, a obszary decyzyjne łatwe zostały pomnejszone. W tym celu naleŝy ustalć odpowedną funkcję transformującą n h : 0, 0, (będącą o. w. j. n odwzorowanem wzajemne jednoznacznym) dobraną do warunków konkretnego

57 zadana. W celu uproszczena (przykład 5-2) doboru funkcj transformującej zastosujmy n razy (na kaŝdym z n-wymarów przestrzen 0, n ) funkcję g : 0, 0,. o. w. j. Po konwersj punktów uczących za pomocą wybranej funkcj g uzyskujemy zbór danych uczących D. W zborze tym wykonujemy generowane reguł uczących zgodne z algorytmem 5- przy czym trójkątne funkcje przynaleŝnośc (5-4) ze wzoru 5-5 określone są juŝ na wartoścach funkcj g w punkce, co daje efekt zastosowana specjalne zmodyfkowanych funkcj trójkątnych w zborze D (wzór 5-6). m {,2,..., n} {2,..., max} n ℵ {,2,..., } Przykład 5-3 m gdze a m = m ( x ) 57 g a m m m µ " ( x ) = max,0 (5-6) m b m = b Do wykonana konwersj zboru D w D zastosujmy funkcję g daną wzorem 5-5 dla wartośc parametru N=3. Wykonane podzału zboru D funkcjam trójkątnym zgodne z algorytmem 5- sprowadza sę do wykonana takego samego podzału na zborze D ale za pomocą funkcj danej wzorem 5-6. Rysunek 5-0. Wykresy funkcj przynaleŝnośc danych wzorem 5-6 dla funkcj g danej wzorem 5-5 wartośc parametru N=3 (dla porównana z rysunkem 5- zaznaczono funkcję wyznaczającą = 5 obszar A ) dla podzałów =2, =3, =4 =5. = 4

58 58 onwersja zboru D w D umoŝlwa cofnęce konwersj zboru D w D zastosowane nnej nŝ zaproponowana we wzorze 5-3 konwersj np.: za pomocą funkcj arcus tangens lub tangens hperbolczny. MoŜlwe jest teŝ dostrojene kształtu funkcj przynaleŝnośc (5-6) poprzez zastosowane sec neuronowych [43], jednak celem dobrana funkcj g jest zmnejszene lczby podzałów wykonywanych podczas realzacj algorytmu 5-, a ne mnmalzacja tej lczby. Oprócz konwersj zboru D w D prostym sposobem na zmnejszene lczby podzałów max nezbędnych do wykonana w algorytme 5-, aby otrzymać zbór reguł S max poprawne klasyfkujących wszystke dane uczące w zborze D, jest sztuczne powększene analzowanego zboru D. Zaproponowany sposób konwersj zboru D w D (wzorem 5-3) posada pewną wadę: nektóre dane uczące leŝą na grancy zboru D, a są to dane o współrzędnych w m-tym wymarze: m x max, m x mn (wzór 5-3). Take dane klasyfkowane są w m-tym wymarze przez jedną rozmytą regułę jeŝel-to (reguła o odpowedno ndekse lub dla kaŝdego podzału ), a nemal wszystke pozostałe dane przez dwe reguły (rysunek 5- lub 5-0). MoŜe to być przyczyną słabszej neco klasyfkacj na brzegach zboru D dlatego proponuję zmanę wzorów konwertujących zbór D na D na odpowedno m {,2,..., n} n ℵ x' D X m mn X = mn{ x m 2... X n = x', x' ; {,2,..., D } x m {,2,..., n} n ℵ mn x max m mn m mn, x x' < m max 2 mn x' R, x' m max + 2 max = max{ x { 0}... m x' n mn, x' n max ; {,2,..., D } + x m max (5-7) {[ x', x' 2,... x' n m {,2,..., n} n ℵ ],...,[ x' D, x' o {,2,..., D } 2 D,... x' n D x' m o x = x' m o m max x' x n m mn m ' mn ]} = D' 0, 0,... 0, = razy 0, n (5-8) Obe zaproponowane metody - konwersja zboru D w D - sztuczne powększene analzowanego zboru D mogą (co zostało potwerdzone oblczenowo w rozdzale 7.4) zmnejszyć lczbę max realzacj algorytmu 5-, ale ne słuŝą one do mnmalzacj tej wartośc. Właścwe

59 zmnejszene lczby reguł nezbędnych do wykonana poprawnej klasyfkacj zrealzuje algorytm genetyczny Zmnejszane lczby reguł za pomocą algorytmu genetycznego Jak zostało przedstawone w rozdzale 3 algorytm genetyczny usłuje rozwązać zadne optymalzacj poprzez ukerunkowane losowo przeszukwane przestrzen moŝlwych rozwązań. Algorytm genetyczny ne gwarantuje wyszukana najlepszego (optymalnego) rozwązana, ale zwraca najlepszy znalezony wynk - co często w zastosowanach praktycznych jest zadowalające. JeŜel zadane zmnejszana lczby reguł (generowanych algorytmem 5-) przy wykonywanu przez ne moŝlwe dobrej klasyfkacj zostane sprowadzone do zadana optymalzacj, to moŝe zostać ono rozwązane za pomocą algorytmu genetycznego w zadowalający sposób Postawene problemu Nech zbór A (wzór 5-3) będze zborem wybranych reguł rozmytych jeŝel-to (wykonanych algorytmem 5-) zawartych w zborze wszystkch reguł S (wzór 5-) uzyskanych ze wszystkch max kroków algorytmu 5-. Nech k(a) 0, D ℵ {0} będze lczbą prawdłowo klasyfkowanych danych uczących przez rozmyte reguły jeŝel-to ze zboru A. Do rozwązana jest zadane optymalzacj dwukryteralnej [7]: zmnmalzować lczbę reguł uŝywanych do klasyfkacj przy jednoczesnym zmaksymalzowanu lczby poprawne klasyfkowanych danych uczących. W śwetle wykonanych oznaczeń zadane to moŝna zapsać jako: zmnmalzować lczność zboru A zmaksymalzować wartość k(a). Te dwa cele naleŝy sprowadzć do maksymalzacj funkcj f:(a) R danej przykładowym [42] wzorem (5-9). f ( A) = a k( A) b A gdze a,b R + (5-9) NaleŜy teŝ zaznaczyć, Ŝe w wększośc zadań stotnejsze jest zachowane poprawnej klasyfkacj nŝ zmnejszene lczby reguł. Stąd pomędzy lczbam a b we wzorze 5-9 zachodz zaleŝność < b a (5-20)

60 Po określenu zadana optymalzacj jako maksymalzacj funkcj f:(a) R danej wzorem (5-9) moŝna rozwązywać to zadane za pomocą algorytmu genetycznego odowane chromosomu Algorytm genetyczny rozwązuje zadane optymalzacj, ale najperw mus ono zostać zakodowane w chromosomach na potrzeby przetworzena przez algorytm genetyczny. Zbory A oraz S zakodujmy w chromosome w następujący sposób: a) nech długość chromosomu będze taka jak lczność zboru S (wzory: ) b) nech kaŝdej regule r R 2... m... pozycj r w chromosome (wzór 5-2) ze zboru S odpowada dokładne jeden gen na n n 2 n m n n ( ) + ( 2 ) ( m ) ( n ) + n n 2 n m n n ( ) + ( ) ( ) ( ) n dla = 2 n h + 2 m n + dla > 2 h= 2 = gdze: n ℵ - lczba wymarów m {,2,...,n} - numer ndeksu określonego na m-tym wymarze max - lczba uruchomeń algorytmu 5- {,2,..., max } - -te uruchomene algorytmu 5- m {,2,..., } - ndeks określony na m-tym wymarze c) nech wartość genu, który poprzez swoją lokalzację określa regułę, wynos: 0 - gdy reguła jest nestotna - gdy reguła naleŝy do zboru A 2 - gdy reguła ne naleŝy do zboru A. (5-2) Dla tak przyjętej formy kodowana chromosomu zauwaŝmy, Ŝe mało sens zmnejszane lczby wykonanych przebegów algorytmu 5-, gdyŝ uzyskujemy w ten sposób krótsze chromosomy w algorytme genetycznym. ZauwaŜmy teŝ, Ŝe przyjęty sposób kodowana zawera w sobe rozwązane przynajmnej jednego z kryterów optymalzacj: maksymalzacj lczby poprawne klasyfkowanych elementów. Wszystke elementy uczące są klasyfkowane przez reguły uzyskane z ostatnego podzału max wykonanego przez algorytm 5-. Wystarczy węc uzyskać chromosom kodujący zestawem jedynek tylko wyłączne wszystke reguły ze zboru max S. Mnmalzacja lczby uŝytych reguł do klasyfkacj polegać będze na zastępowanu tych jedynek jedynkam uzyskanym z wcześnejszych przebegów algorytmu 5-. ZauwaŜmy teŝ, Ŝe wraz ze wzrostem wartośc określającej numer podzału w algorytme 5- maleją obszary, do których przypsane są reguły R 2... m.... W zwązku z n

61 tym lepszym wydają sę reguły uzyskane z perwszych przebegów algorytmu 5-, gdyŝ umoŝlwają wykonane klasyfkacj na wększym obszarze. 6 = { R 2... m... ch = { : n R 2... m... R 2... m... n : n R 2... m... S =2 }... { S = }= S= S =2 max... n max R m... : R n m... n 2... = chs =2 max... chs = = U max chs = S = } = (5-22) ZauwaŜmy teŝ, Ŝe wzór 5-2 umeszcza reguły ze zborów S (uzyskwanych z kolejnych podzałów podczas realzacj algorytmu 5-) po sobe, powodując tym samym, Ŝe moŝna w chromosome ch wyróŝnć kolejno odcnk chs kodujące sobą grupy reguł naleŝących do zborów S (rysunek 5- wzór 5-22). Rysunek 5-. Przykładowy chromosom zaznaczono kolorem nebeskm umowny podzał na grupy reguł chs (o zaznaczonej długośc) Jak wdać z rysunku 5- zaproponowana forma kodowana problemu optymalzacj powoduje powstawane chromosomów, których długość zaleŝy od lczby max realzacj algorytmu 5- od lczby wymarów n. PonewaŜ ne mamy wpływu w danym zadanu na lczbę wymarów n, to szczególnego znaczena naberają proponowane metody zmnejszena lczby max realzacj algorytmu 5-. Skrócene długośc chromosomu znacząco wpłyne na czas wykonywana sę algorytmu genetycznego. Ów czas realzacj algorytmu genetycznego moŝe być powodem, ogranczena praktycznego zastosowana proponowanej metody do rozwązywana zadań klasyfkacj określonych na newelkej lczbe wymarów. ZauwaŜmy teŝ, Ŝe prostota proponowanej metody kodowana pocąga za sobą zapsane w chromosome welu reguł nestotnych, które ngdy ne będą naleŝały do zboru A. Celem skrócena długośc chromosomu moŝlwe jest ch usunęce z chromosomu (poprzez zastosowane specjalnej tablcy przypsującej lokacj r genu daną regułę R 2... m... ), ale zmen to znacząco pracę operatora krzyŝowana, gdyŝ trudnej n byłoby wyzolować schematy kodujące pojedyncze reguły (twerdzene o schematach wzór 3-0). Z tej przyczyny naleŝałoby posługwać sę często zachodzącym krzyŝowanem welopunktowym (przykład 5-4).

62 Przykład 5-4 Nech dane będą dwa chromosomy a) b) kodujące w swoch genach reguły nestotne dwa, które tego ne robą c) d). Nech zaznaczone w nch geny poprzez jedynk oznaczają stotne reguły, które realzują poprawną klasyfkację. Nech chromosom o wększej lczbe jedynek realzuje lepej klasyfkację (lepszy chromosom) nŝ chromosom o małej ch lczbe (gorszy chromosom). a) b) c) d) Aby z chromosomów a)-d) uzyskać jeszcze lepsze e) f) na drodze krzyŝowana, naleŝy krzyŝowane wykonać pomędzy zaznaczonym jedynkam w genach. e) f) Prawdopodobeństwo uzyskana chromosomu e) z chromosomów a) b) wynos /9, a uzyskana chromosomu f) z c) d) wynos /9. Z tego powodu dla drugego systemu kodowana naleŝałoby uŝywać często wykonywanego krzyŝowana welopunktowego Funkcja przystosowana Po określenu sposobu kodowana zadana w algorytme genetycznym (sprowadzonego do zakodowana w chromosome zboru A), naleŝy jeszcze określć funkcję przystosowana Φ:(ch) R (wzór 3-2), tak aby jej maksymalzacja rozwązywała równeŝ zadane maksymalzacj funkcj f (wzór 5-9). Najprostszym rozwązanem tego problemu jest przyjęce za funkcję przystosowana funkcj f:(a) R danej wzorem Φ ( ch) = f ( A) = a k( A) b A gdze a,b R + a b>0. (5-23) Jednak take rozwązane moŝe zadzałać tylko dla krótkch chromosomów, gdy przeszukwana przestrzeń moŝlwych rozwązań jest mała. Przy duŝych przestrzenach pomocne moŝe okazać sę zastosowane funkcj kary, która promowałaby reguły z perwszych podzałów (wykonywanych podczas realzacj algorytmu 5-), a karała reguły z ostatnch. Powodem zastosowana takej funkcj są newelke róŝnce w welkośc obszaru, do którego przypsana jest reguła R 2... m..., uzyskana dla duŝej n wartośc w kolejnym podzale +. Z tego powodu moŝe sę okazać, Ŝe dla duŝych wartośc reguły uzyskane pod konec realzacj algorytmu klasyfkują poprawne tylko jeden obekt uczący, czyl reguły z podzału, czy + ne zmenają wartośc funkcj przystosowana danej wzorem 5-23.

63 Jedną z prostszych do wyznaczena funkcj kary jest funkcja wag reguł naleŝącego do zboru A. Nech reguły ze zboru A uzyskane dla podzału (z przebegu algorytmu 5-), czyl naleŝące do zboru S, będą waŝone przez wartość (5-24). w ( A) S A (5-24) = max = 2 Mając do dyspozycj funkcję kary w:(a) R zdefnowaną wzorem 5-24, która promuje reguły uzyskane dla perwszych podzałów (podczas realzacj algorytmu 5- ) moŝemy wymenć funkcję przystosowana wzór 5-23 na bardzej odpowedną opsaną wzorem Φ ( ch) = a k( A) b A c w( A) gdze a,b,c R + a b>>c>0. (5-25) ZaleŜność b>>c we wzorze 5-25 wynka z faktu, Ŝe bardzej jednak zaleŝy nam na mnmalzacj lczby reguł uŝytych do klasyfkacj nŝ na ch rozmeszczenu w chromosome w zborach (odcnkach chromosomu) chs. Określona wzorem 5-25 funkcja przystosowana ne spełna jeszcze jednego wymogu, aby zastosować ją w algorytme genetycznym: pownna przyjmować wartośc neujemne. Z tego powodu wykonajmy prostą modyfkację tej funkcj: ogranczamy ją z dołu (wzór 5-26). { 0; a k( A) b A c w( )} Φ ( ch) = max A gdze a,b,c R + a b>>c>0. (5-26) Funkcja przystosowana dana wzorem 5-26 moŝe juŝ zostać uŝyta. Jednak wartośc przez ną generowane mogą sprawać trudność podczas ch nterpretacj, gdyŝ trudno będze ocenć w jakm stopnu uzyskana wartość rozwązuje problem maksymalzacj. ZauwaŜmy jednak, Ŝe wartośc funkcj danej wzorem 5-26 są ogranczone z góry: - maksymalną wartoścą k(a), czyl lczby poprawne klasyfkowanych obektów uczących, jest lczba wszystkch obektów uczących, czyl D = D = D - mnmalną wartoścą A, czyl lczby reguł uŝytych do klasyfkacj, jest lczba klas M - mnmalną wartoścą w(a), czyl wag połoŝena w chromosome reguł ze zboru A, jest wartość wynkająca z umeszczena tych reguł w początkowych odcnkach chromosomu; ponewaŝ wyznaczane wartośc mnmalnej moŝe być czasochłonne oblczenowo (naleŝy uwzględnać stnene reguł nestotnych), moŝna taką wartość traktować jako ogranczoną z dołu przez wartość 2M (czyl mnmalna lczba reguł M umeszczona w perwszym odcnku chromosomu chs 2 ). 63

64 Zamast funkcj przystosowana Φ:(ch) R danej wzorem 5-26 wygodnej będze (pod kątem analzy rozwązywana zadana maksymalzacj przez algorytm genetyczny) ją znormalzować stosować funkcję Φ:(ch) 0, R daną wzorem a k( A) b A c w( A) Φ( ch) = max 0; gdze a,b,c R + a b>>c>0. (5-27) a D b M c 2M PonewaŜ we wzorze 5-27 zachodz zaleŝność b>>c>0, to wartość c2m ze wzoru ne ma wększego wpływu na wartość funkcj przystosowana moŝe być pomnęta, przez co otrzymujemy numeryczne łatwą do wyznaczana funkcję przystosowana Φ:(ch) 0,) R daną wzorem a k( A) b A c w( A) Φ( ch) = max 0; gdze a,b,c R + a b>>c>0. (5-28) a D b M Gdy wartość funkcj przystosowana zblŝa sę do wartośc jeden, to zblŝa sę teŝ do rozwązana problemu optymalzacj. 64 Posługując sę symbolką uŝytą we wzorze 5-27 moŝna zaproponować jeszcze nny wzór 5-29 określający funkcję przystosowana, gdze wększą rolę odgrywają współczynnk a, b c. Φ( ch) = max 0; k( A) b D a A A M max M c w( A) 2M a w( A) max 2M (5-29) gdze: a,b,c R +, a b>>c>0, A max najwększa wartość A, w(a) max najwększa wartość w(a). Funkcje przystosowana poddaje sę nekedy skalowanu [72], co ma zapobegać przedwczesnej zbeŝnośc algorytmu (na początku realzacj algorytmu genetycznego, gdy najlepszy osobnk zbytno wyróŝna sę na tle pozostałych wartoścą funkcj przystosowana) oraz uzyskwanu podobnej lczby potomków przez osobnków o średnm przystosowanu najlepszym (w końcowej faze algorytmu genetycznego, gdy wartość średnego przystosowana generacj zblŝona jest do wartośc maksymalnej). RozróŜna sę trzy główne metody skalowana [72]: a) Skalowane lnowe funkcj przystosowana Φ polega na przekształcenu jej do funkcj Φ poprzez przekształcene lnowe (5-30). Φ (ch) =max{0; a Φ(ch) + b } gdze a,b R - R + (5-30)

65 b) Obcnane typu sgma funkcj przystosowana Φ polega na przekształcenu jej do funkcj Φ poprzez przekształcene dane wzorem 5-3. Φ (ch) =max{0; Φ(ch) + Φ śr (ch) c σ gdze c ℵ, Φ śr (ch) - średne przystosowane w generacj, σ - odchylene standardowe wartośc funkcj przystosowana w generacj. c) Skalowane potęgą funkcj przystosowana Φ polega na przekształcenu jej do 65 (5-3) funkcj Φ poprzez przekształcene dane wzorem Parametr m w tym wzorze ne odbega znacząco o wartośc jeden [72] np.: m=,005. Φ (ch) = Φ(ch) m gdze m R - R + (5-32) Bazując na wzorze 5-32 wykonajmy jeszcze dodatkową parametryzację funkcj przystosowana danych wzoram , otrzymując funkcję przystosowana skalowaną potęgą (wzór 5-33) o podobnym wpływe potęgowana (5-34). a k( A) b A c w( A) Φ( ch) = max 0; gdze a,b,c R + a b>>c>0. (5-33) a D b M m Φ( ch) = max 0; k( A) D m b a m A M A M max c w( A) 2M a w( A) max 2M m (5-34) gdze: a,b,c R +, a b>>c>0, A max najwększa wartość A, w(a) max najwększa wartość w(a). Ze względu na oblczenową łatwość wyznaczana funkcj przystosowana danej wzorem 5-33 nŝ funkcj danej wzorem 5-34 ta perwsza będze mała znaczące zastosowane, a druga została zaproponowana jedyne w celach porównawczych. Przeprowadzona próby oblczenowe wykazały, Ŝe posługując sę perwszą z funkcj moŝna uzyskać lepsze wynk (przyczyną mogła być utrata parca genetycznego w wynku wpływu wartośc takch jak A max czy w(a) max ) badana nad doborem parametrów do drugej funkcj zostały zanechane. PonewaŜ w funkcj przystosowana 5-33 obok parametru m występują jeszcze a, b c, to naleŝy jeszcze znaleźć zaleŝnośc pomędzy nm. Parametr c opsujący wpływ funkcj kary, która ne ma wpływu na wykonywaną przez algorytm optymalzację. Ma ona jedyne wytworzyć pewne parce genetyczne w celu uzyskana reguł klasyfkujących uzyskanych z perwszych realzacj algorytmu 5-. Z tego powodu jego

66 znaczene ne moŝe być kluczowe proponowane jest c=0, (chocaŝ konkretna wartość zaleŝy od zadana). Parametry a b określają na le zaleŝy nam na poprawnej klasyfkacj, a le na zmnejszenu lczby reguł wykonujących klasyfkację. ZaleŜność taką moŝna wyrazć parametrem a, jeŝel b ustalmy np.: b=. Przyjęce zbyt duŝej wartośc parametru a spowoduje słabą realzację mnmalzacj lczby reguł słuŝących do klasyfkacj. Przyjęce zbyt małej wartośc parametru a spowoduje wprawdze mnmalzację lczby reguł, ale z newelkm uwzględnenem wykonywanej przez ne poprawnej klasyfkacj. Wartość parametru a najlepej dobrać eksperymentalne dla danego zadana, ale proponuję tutaj pewne umowne jej oszacowane. W celu poprawnego sklasyfkowana D obektów uczących naleŝało zdefnować S moŝlwych do wyboru reguł (do zboru A). Tak węc w celu klasyfkacj jednego obektu uczącego potrzeba zdefnować S / D reguł moŝlwych do wyboru (do zboru A). Nech węc parametr a będze wartoścą neco wększą od S / D, tak aby klasyfkacja o jeden obekt uczący węcej przewyŝszała korzyśc płynące ze zmnejszena lczby reguł o S / D. Ponadto naleŝy zauwaŝyć, Ŝe lczba moŝlwych do wyboru do zboru A reguł ne wynos dokładne S, gdyŝ podczas realzacj algorytmu genetycznego moŝna otrzymać równeŝ reguły nestotne. Tak węc przyjęce poprzednego oszacowana moŝe doprowadzć do przyjęca wartośc zbyt duŝej, co spowoduje spadek stotnośc redukcj lczby reguł naleŝących do zboru A. Właścwszym oszacowanem jest S S szt a gdze S szt - lczność zboru S szt reguł nestotnych (5-35) D Dla duŝego zboru S wartość parametru a moŝna jeszcze podneść, gdyŝ zaczne sę zaznaczać wpływ funkcj kary sterowany parametrem c. MoŜna teŝ w takm przypadku obnŝyć wartość parametru c Wybór populacj startowej warunku zakończena algorytmu Dysponując sposobem kodowana określena przystosowana danego osobnka moŝna wykonać juŝ populację startową. W tym celu naleŝy określć p sel prawdopodobeństwo wylosowana na danej pozycj (locus) r (wzór 5-2) w chromosome, a następne dokonać losowana na wszystkch pozycjach chromosomu wartośc lub 2 z prawdopodobeństwem wylosowana jedynk wynoszącym p sel z prawdopodobeństwem wylosowana dwójk wynoszącym -p sel. Na otrzymany cąg jedynek dwójek o długośc S naleŝy nałoŝyć stały układ zer, które to zera swoją

67 pozycją r kodują reguły nestotne w zborze S. W ten sposób wykonany chromosom naleŝy ocenć posługując sę funkcją przystosowana (wzór 5-33), aby otrzymać strukturę zwaną teraz osobnkem. W celu zbudowana populacj startowej naleŝy określć (parzystą!) lczbę n pop osobnków w populacj zbudować n pop struktur zwanych osobnkam. ZauwaŜmy, Ŝe wartość p sel prawdopodobeństwa wylosowana jedynk ma znaczny wpływ na przebeg algorytmu genetycznego. PonewaŜ postawone przed algorytmem genetycznym zadane optymalzacj dwukryteralnej wymusza rozwązane w postac małej lczby reguł klasyfkujących duŝą lczbę elementów uczących, to do takego stanu algorytm genetyczny moŝe dojść dwoma drogam: a) moŝna zredukować duŝą lczbę początkowo wylosowanych reguł tak, aby podczas redukcj zachować, a nawet neco poprawć wynk w postac lczby poprawne klasyfkowanych elementów (obektów) uczących; b) moŝna zwększać małą lczbę początkowo wylosowanych reguł tak, aby podczas tego zwększana odnajdywać reguły stotne dla poprawnośc klasyfkacj kolejnych elementów zboru uczącego. Pomędzy tym dwoma technkam umowną wartoścą granczną wydaje sę być lczba reguł odpowadająca (w przyblŝenu) lczbe elementów uczących. JeŜel w wynku losowana jedynek w chromosomach generacj startowej otrzymamy reguł mnej nŝ obektów uczących, to zachodz przypadek b), a w przecwnym wypadku przypadek a). Z obu analzowanych przypadków oblczenowo bardzej czasochłonnym jest przypadek a), ponewaŝ wymaga przeanalzowana duŝego zboru A celem wyznaczena wartośc funkcj przystosowana (a dokładne wartośc k(a) lczby poprawne klasyfkowanych elementów regułam ze zboru A). Tak wyskalowany algorytm potraf doprowadzć do bardzo dobrego wynku, ale po bardzo długm czase oblczeń, który dla długch chromosomów moŝe być ne do zaakceptowana. Szybcej realzowane oblczena w przypadku b) ne dają z kole gwarancj dobrana takego układu reguł (ze względu na duŝą długość chromosomu, a co za tym dze na ogromny rozmar przestrzen moŝlwych rozwązań zwanej teŝ przestrzeną poszukwań), aby wykonywać w 00% (lub prawe w 00%) poprawną klasyfkację. Metodą łączącą wady zalety obu analzowanych przypadków a) b) jest take wylosowane lczby reguł w generacj startowej, aby otrzymać lczbę wylosowanych reguł ze zboru A (lczbę jedynek w chromosome) równą w przyblŝenu lczbe klasyfkowanych obektów uczących D. 67

68 Daje to prawdopodobeństwo wylosowana jedynk w generacj startowej p sel określone wzorem p sel D gdze S szt - lczność zboru S szt reguł nestotnych (5-36) S S szt W przypadku wartośc p sel wyznaczonej wzorem 5-36 dopuszczalne są znaczne odstępstwa o nawet ±50% tej umownej wartośc, jednak ne zalecam bardzej znaczących odchyleń, aby ne powodować nepotrzebnego wydłuŝena czasu pracy algorytmu genetycznego. Zanm rozpoczne sę tworzene kolejnych generacj algorytmu genetycznego naleŝy jeszcze określć warunek jego zakończena. MoŜe to być przyjęce odpowedno wysokej wartośc funkcj przystosowana np.: 0,95. Jednak uruchamając algorytm ne mamy gwarancj, Ŝe uzyskamy chromosom o odpowedno wysokej wartośc funkcj przystosowana. Z tego powodu lepsze jest ustalene maksymalnej lczby moŝlwych do wykonana generacj t max zakończene algorytmu po osągnęcu generacj t max. Lczba n pop osobnków w generacj wpływa na lczbę konecznych do wykonana generacj, aby osągnąć dobry wynk algorytmu genetycznego. Istneją dwa sposoby regulowana wartośc n pop t max. MoŜemy stworzyć duŝą populację (o duŝej lczbe osobnków) oczekwać dobrego wynku w cągu newelkej lczby pokoleń, albo moŝemy stworzyć małą generację pozwolć jej odpowedno długo ewoluować w celu uzyskana dobrego wynku. Za zastosowanem perwszej z tych metod przemawa twerdzene o schematach (rozdzał 3.3) operujące wartoścą oczekwaną, a węc przyblŝaną przez bardzo lczne generacje. Za zastosowanem tej drugej metody przemawają względy praktyczne do zbudowana długch chromosomów potrzeba znacznej lośc pamęc operacyjnej komputera z tego powodu zbudowane lcznej generacj moŝe okazać sę nemoŝlwe (z braku pamęc lub w wynku uŝywana bardzo powolnej pamęc wrtualnej). PonewaŜ ten problem technczny moŝe w rozwązywanym w dalszej częśc pracy zadanu wystąpć, to zalecana jest raczej druga metoda. W zwązku z przyjęcem raczej duŝych wartośc t max (rzędu klku tysęcy) jednoczesnym przyjęcu newelkej lczby osobnków w generacj n pop (sprawdzano dla tego zadana wartośc 50, z czego 00 wydaje sę wartoścą najlepszą) naleŝy spodzewać sę długch czasów oblczeń algorytmu genetycznego. Z tego powodu naleŝy wyposaŝyć go w mechanzm zapsu swojego stanu na wypadek awar komputera (zank napęca, przegrzane) lub przynajmnej zapsu najlepszego 68

69 uzyskanego osobnka, tak aby po usunęcu awar moŝna było wznowć pracę algorytmu genetycznego. Wele zadań (np.: z dzedzny medycyny [3]) nemalŝe wymaga stnena mechanzmu dodana wzorca uczącego do generacj startowej poszukwana lepszych rozwązań pod kątem wzorca (gdyŝ wywera on slny wpływ na nowe generacje). Dlatego zalecane jest dodane systemu zapsu co pewną lczbę pokoleń najlepszego osobnka (mającego najwększą wartość funkcj przystosowana) oraz systemu wczytana takego osobnka do generacj startowej w celu dalszego doskonalena struktury reguł ze zboru A zawartej w jego chromosome Operator selekcj, stratega eltarna 69 Omawana w podrozdzale 3.2 selekcja ruletkowa, uŝywana w klasycznym algorytme genetycznym, wyznacza prawdopodobeństwo p wylosowana -tego chromosomu ch do pul rodzców wzorem 3-. Jednak stosując tak wzór oraz zaproponowane funkcje przystosowana bardzo szybko doprowadzć moŝna do generacj o newelkm zróŝncowanu wartośc przystosowana poszczególnych osobnków pommo róŝnc w budowe ch chromosomów. W tej sytuacj kaŝdy z osobnków będze mał nemal dentyczne szanse na zostane rodzcem utracona zostane zdolność do dalszego poprawana uzyskanego najlepszego chromosomu przez algorytm genetyczny mówmy o małej sle parca genetycznego. Jednak prosta modyfkacja wzoru 3- moŝe zapewnć całkem efektywną pracę zmodyfkowanego operatora selekcj. Nech prawdopodobeństwo zostana rodzcem danego chromosomu będze wyznaczane na podstawe róŝncy wartośc jego przystosowana przystosowana najgorszego (tu o najmnejszej wartośc funkcj przystosowana) osobnka w generacj (wzór 5-37). Φ( ch ) Φ( ch) mn p( ch ) = gdze Φ( ch) mn n pop ( Φ( ch j ) Φ( ch) mn ) j= = mn { Φ( ch ) : l {,2,..., n }} n pop jest parzystą lczbą osobnków w generacj Wyberając osobnk do zostana rodzcam (od pul rodzcelskej) posługując sę wzorem 5-37 zapewnamy skuteczne dzałane operatora selekcj ne tylko w początkowym etape pracy algorytmu genetycznego, ale równeŝ w końcowym okrese, gdy przystosowane średne osobnków w generacj zblŝy sę do wartośc przystosowana maksymalnego osobnka w generacj. l pop (5-37)

70 W wynku usprawnena pracy operatora selekcj maleje znaczene skalowana funkcj przystosowana. Innym sposobem uzyskana efektywne dzałającego operatora selekcj jest zastosowane selekcj turnejowej [6] o rozmarze turneju t sze, gdze t sze ℵ t sze > (najczęścej [72] przyjmuje sę t sze =2 lub t sze =3). Selekcja turnejowa polega na wyborze grupy t sze osobnków, z której to grupy wybera sę osobnka najlepej przystosowanego do zostana rodzcem (z prawdopodobeństwem równym jeden dla wyboru determnstycznego lub mnejszym od jeden dla wyboru losowego). W celu porównana pracy operatora selekcj ruletkowej (zmodyfkowanej) turnejowej zaproponuję tu wybór determnstyczny w selekcj turnejowej. Jeszcze jedną z często stosowanych metod [72] selekcj jest selekcja rankngowa, która polega na posortowanu malejąco wg wartośc przystosowana osobnków w generacj, czyl nadanu kaŝdemu z nch odpowednej rang. aŝdej randze przypsuje sę prawdopodobeństwo do zostana rodzcem osobnka o tej randze (np.: za pomocą funkcj lnowej [72]). 70 Jeszcze jedną waŝną modyfkacją stosowaną podczas budowy generacj potomnej jest zastosowane strateg eltarnej [72], która polega na kopowanu do generacj potomnej najlepej przystosowanego osobnka z generacj rodzcelskej. śadna z opsanych wcześnej metod selekcj ne gwarantuje zachowana najlepej przystosowanego osobnka (moŝe on zostać znszczony w wynku krzyŝowana lub mutacj). opowane najlepszego osobnka z generacj rodzcelskej następuje po zadzałanu operatorów krzyŝowana mutacj. Dodatkowo proponuję kopowane take, aby ne znszczyć osobnka potomnego, który ma wyŝsze przystosowane nŝ zastępujący go osobnk z poprzednej generacj. MoŜna to zrealzować poprzez losowy wybór (z prawdopodobeństwem wynoszącym /n pop ) osobnka do zastąpena osobnkem najlepszym z poprzednej generacj, a jeŝel wybrany osobnk posada wyŝsze przystosowane nŝ osobnk z poprzednej generacj, to losowane powtarza sę. Metoda ta ne daje jednak 00% gwarancj wykonana takego zastąpena (wtedy, gdy cała nowa generacja ma przystosowane lepsze nŝ najlepszy osobnk z generacj poprzednej). Prostszym rozwązanem jest zastępowane perwszego osobnka nowej generacj. JeŜel perwszy z osobnków ma przystosowane wyŝsze nŝ mający go zastąpć osobnk z generacj poprzednej, to zastąpony zostane drug osobnk (nawet jeŝel był jeszcze lepszy).

71 Dalszym rozwnęcem tej metody jest algorytm z ustalonym stanem [72], gdze część generacj jest kopowana do nowej bez jakchkolwek zman (bez krzyŝowana mutacj). Jednak dla tak określonego sposobu kodowana w dalszym okrese pracy algorytmu genetycznego byłaby to grupa osobnków bardzo do sebe podobnych wystarczającym jest kopowane tylko jednego jak ma to mejsce w strateg eltarnej. Zastosowane strateg eltarnej oraz usprawnonej metody selekcj ruletkowej (wzór 5-37) daje moŝlwość poprawana najlepszego osobnka w kolejnych generacjach przez algorytm genetyczny. Selekcja ruletkowa utrzymuje duŝy wpływ najlepszego osobnka w generacj, co powoduje Ŝe pozostałe osobnk w kolejny generacjach stają sę do sebe podobne. W welu sytuacjach doprowadzć to moŝe przedwczesnej zbeŝnośc algorytmu, ale przy zaproponowanym sposobe kodowana zadana umoŝlwa poprawę najlepszego osobnka nawet, gdy jego przystosowane osągnęło juŝ nemalŝe wartość maksymalną. JeŜel w trakce pracy algorytmu genetycznego wyszukany zostane lepszy osobnk odmenny genetyczne od pozostałych, to selekcja ruletkowa spowoduje stopnowe upodabnane sę osobnków w kolejnych generacjach do wyszukanego najlepszego umoŝlwa to poszukwane lepszych rozwązań w otoczenu najlepszego osobnka. Zastosowane selekcj turnejowej strateg eltarnej moŝe doprowadzć do sytuacj, w której cała generacja prowadz poszukwana lepszych rozwązań jest do sebe genetyczne podobna, a jeden wyróŝnony najlepszy osobnk jest zupełne odmenny genetyczne algorytm ne prowadz poszukwań lepszego rozwązana uŝywając welu potomków osobnka najlepszego. Z tego powodu w pracy zastosowano usprawnoną metodę selekcj ruletkowej razem ze strategą eltarną Operator krzyŝowana, operator nwersj Operator krzyŝowana (krzyŝowane jednopunktowe) zaproponowany w rozdzale trzecm zazwyczaj ne jest wystarczający w algorytme genetycznym o długch chromosomach, gdyŝ ne wprowadza odpowednego zróŝncowana genetycznego. Schematy o przystosowanu lepszym nŝ przecętne ne są powelane w dostatecznych loścach, aby zauwaŝyć ch wpływ na nowe generacje. Dzeje sę tak dlatego, Ŝe krzyŝowane ne nszczy długch schematów. Aby temu zapobec stosuje sę krzyŝowane welopunktowe [72], które jest uogólnenem krzyŝowana jednopunktowego polega na welokrotnym wykonanu krzyŝowana jednopunktowego. Sposób realzacj tego krzyŝowana moŝna zdefnować dwoma parametram: c cross

72 lczbą wykonanych krzyŝowań jednopunktowych p cross prawdopodobeństwem wykonana krzyŝowana jednopunktowego. MoŜna teŝ rozszerzyć (wzór 5-38) znaczene parametru p cross przyjąć, Ŝe moŝe on przyjmować dowolne wartośc rzeczywste neujemne. Część całkowta nt(p cross ) odpowada za lczbę wykonanych krzyŝowań jednopunktowych z prawdopodobeństwem, a część ułamkowa odpowada za wykonane jeszcze jednego krzyŝowana jednopunktowego z prawdopodobeństwem p cross -nt(p cross ). 72 { 0} p R + gdze: cross nt(p cross ) ℵ {0} (część całkowta p cross ) lczba punktów krzyŝowana welopunktowego, gdze krzyŝowane odbędze sę z prawdopodobeństwem p cross - nt(p cross ) 0, R + {0} (część ułamkowa p cross ) prawdopodobeństwo wykonana nt(p cross )+ krzyŝowana jednopunktowego (5-38) W celu utrzymana znaczena krzyŝowana jako operatora wpływającego na długość przetwarzanych przez algorytm genetyczny schematów moŝna zastosować krzyŝowane proporcjonalne, ale ne do długośc chromosomu, tylko uzaleŝnone od odcnków chromosomu chs (wzór 5-22). W proponowanym krzyŝowanu welopunktowym punkt krzyŝowana losowany jest z jednakowym /( S -) prawdopodobeństwem. MoŜna przeanalzować proces uczena sę algorytmu genetycznego dobrych rozwązań zadana optymalzacj zaproponować nne prawdopodobeństwo wybrana punktu krzyŝowana. Proces uczena powoduje, Ŝe stotne dla rozwązana schematy pojawają sę w początkowych częścach (wzór 5-22) chromosomu chs. MoŜna wybór punktu krzyŝowana przeprowadzć dwuetapowo: ) wylosować s-ty odcnek chromosomu chs =s z jednakowym prawdopodobeństwem /( max -) 2) wylosować punkt c krzyŝowana naleŝący do wylosowanego s-tego odcnka z jednakowym prawdopodobeństwem /( chs =s -). Ta forma wyboru punktów do przeprowadzana krzyŝowana spowoduje, Ŝe w początkowych częścach chromosomu przetrwają tylko schematy krótke, gdyŝ częścej krzyŝowane będze zachodzć właśne w początkowych fragmentach chromosomu chs. Jednak ta forma modyfkacj krzyŝowana moŝe meć zastosowane tylko do wybranych zadań, w których moŝlwe jest usunęce ze zboru A reguł naleŝących do ostatnch fragmentów chromosomu chs. JeŜel ne jest to moŝlwe, to osągnemy

73 pogorszene pracy algorytmu genetycznego, gdyŝ reguły z ostatnch fragmentów chromosomu będą nezbędne do zachowana poprawnej klasyfkacj. JeŜel zadane polega na zachowanu w 00% (lub nemalŝe w 00%) poprawnej klasyfkacj, to algorytm genetyczny będze uogólnał wedzę zawartą w regułach zboru A (będze wyberać do zboru A reguły opsujące sobą coraz wększe fragmenty przestrzen danych uczących, czyl zakodowane w początkowych fragmentach chromosomu) przy jednoczesnym zachowanu reguł przypsanych do newelkch obszarów przestrzen danych uczących (czyl znajdujących sę w końcowych fragmentach chromosomu), które potrafą klasyfkować newelką lczbę danych uczących jednej klasy, które znajdują sę w otoczenu danych uczących nnej klasy wyjątk (rysunek 5-2). 73 Rysunek 5-2. Przykładowa prezentacja wpływu na klasyfkuję (algorytm 5-2) reguły R opsanej na obszarze A (kolor nebesk) reguły R opsanej na obszarze A 7 (kolor brązowy). Odpowedno perwsza reguła klasyfkuje poprawne wszystke obekty klasy C2 (określone na odcnku jednostkowym), a druga klasy C. Druga reguła opsuje sytuację wyjątkową, dotyczącą newelkego obszaru. 0 7 JeŜel zadane wymaga wysokego pozomu poprawnej klasyfkacj, to pomocne moŝe być zwększene lczby punktów wykonywanego krzyŝowana welopunktowego bez uzaleŝnena go od poszczególnych fragmentów chromosomu chs. Dla zdefnowanego systemu kodowana reguł rozmytych w chromosome uŝyce operatora nwersj spowoduje znszczene nformacj o zapsanych w chromosome regułach. Z tego powodu ten operator ne moŝe być zastosowany.

74 Operatory mutacj klasyczny kodujące wedzę o zadanu Dla określonego sposobu kodowana algorytmu genetycznego (wzór 5-2) oraz dla zdefnowanych operatorów selekcj (wzory ) krzyŝowana welopunktowego (wzór 5-38) klasyczny operator mutacj odpowada za poszukwane lepszych rozwązań. Jednak w wynku przyjęca newyszukanego sposobu kodowana zboru A klasyczny operator mutacj, którego dzałane polega na losowej wymane wartośc na 2 lub 2 na, moŝe ne pomagać w poprawe juŝ uzyskanego najlepszego wynku. Przyczyną takego zachowana operatora mutacj moŝe być stotne nna lczba jedynek nŝ dwójek w chromosome. Rozwązywane zadane polega na mnmalzacj lczby reguł zawartych w zborze A przy zachowanu takego ch układu, Ŝe moŝna nm poprawne klasyfkować dane uczące. Tak węc w długm chromosome (o długośc S ) naleŝy zakodować mały zbór A (o małej wartośc A ). JeŜel lczba reguł nestotnych (lczba zer) w chromosome jest duŝa (co wymusza newelką lczbę zakodowanych dwójek w chromosome), to operator mutacj umoŝlwa poprawene najlepszego uzyskanego wynku, gdyŝ zachodz z podobnym prawdopodobeństwem zarówno na wartośc jeden jak dwa danego genu, go którego przypsana jest reguła klasyfkująca. JeŜel dla długego chromosomu lczba reguł nestotnych jest mała, a najlepszy wynk koduje sobą newelką lczbę jedynek, to otrzymujemy chromosom z przewaŝającą lczbą dwójek. Powoduje to, Ŝe operator mutacj zamena najczęścej dwójkę na jedynkę, czyl pogarsza uzyskany rezultat zwększając wartość A. Częścowym rozwązanem tego problemu jest zmnejszene prawdopodobeństwa mutacj tak, aby zachodzła najwyŝej raz podczas tworzena nowego chromosomu. PonewaŜ operator ten prowadz poszukwana lepszych rozwązań, to jego dzałana ne moŝna zanechać poprzez określene prawdopodobeństwa mutacj jednego genu w chromosome p mut = 0. Celem umoŝlwena poprawana najlepszego wynku przez algorytm genetyczny zalecane jest wprowadzene nowych operatorów mutacj, kodujących sobą wedzę o zadanu: operator usunęca jedynk operator przesunęca jedynk operator ntelgentnego przesunęca jedynk operator neproporcjonalnego wstawena jedynk.

75 Operator usunęca jedynk ma na celu zrównowaŝene nekorzystnego wpływu klasycznego operatora mutacj na poprawę juŝ uzyskanego wynku. JeŜel w określonym zadanu po jego zakodowanu w chromosomach dobre wynk posadają newelką lczbę jedynek względem dwójek, to klasyczny operator mutacj dzała w znacznej merze na dwójkach. Powoduje to dokładane jedynek do zboru A, czyl obnŝane wartośc funkcj przystosowana zaleŝnej od wartośc A. W celu wymuszena poprawy najlepszego uzyskanego wynku naleŝy wprowadzć operator usunęca jedynk, którego dzałane polega losowej wymane jedynk na dwójkę. Usunęce reguły mającej wpływ na poprawność klasyfkacj spowoduje znaczące pogorszene przystosowana chromosomu, ale usunęce reguły bez wpływu na poprawność klasyfkacj popraw przystosowane chromosomu. Dzałane tego operatora ne pownno być zbyt częste, tak jak klasycznego operatora mutacj. Ustalene zbyt duŝej wartośc prawdopodobeństwa usunęca jedynk (wymany na dwójkę) p del moŝe powodować zbyt slne nszczene materału genetycznego w rezultace tylko newelką poprawę dobrego rezultatu. Prawdopodobeństwo wymany jedynk na dwójkę p del ne pownno przekraczać jednej wymany podczas tworzena nowego chromosomu (pownno meć podobną wartość do p mut ). Newelka wartość p del spowoduje, ze po klkudzesęcu, klkuset pokolenach otrzymamy bardzo mały zbór reguł A, które potrafą poprawne klasyfkować wększość danych uczących. Technczna realzacja operatora usunęca jedynk polega na wylosowanu z jednakowym prawdopodobeństwem z przedzału, A wartośc q del, a następne na odszukanu w chromosome q del -tej jedynk począwszy od początku chromosomu na wymane jej na dwójkę. Reasumując: operator usunęca jedynk zaznacza swoje dzałane główne poprzez wpływ na wartość A ( pośredno na wartość w(a)) we wzorze określającym wartość przystosowana 5-33 (ew. 5-34). Poprawę dobrego wynku moŝemy osągnąć przesuwając jedynk w początkowe fragmenty chromosomu chs (dla coraz to mnejszych wartośc ), gdze zaznaczą one nowe reguły klasyfkujące dane uczące w wększych obszarach A A... A m... A (uzyskanych w początkowych podzałach przestrzen 2 n danych uczących). MoŜemy sę spodzewać, Ŝe tą drogą pojawą sę reguły potrafące sklasyfkować dane z duŝych obszarów. Efekt ten jest poŝądany, gdyŝ tą drogą moŝemy lczyć na osągnęce zboru reguł A zdolnych klasyfkować dane z całej przestrzen danych uczących lub przynajmnej ze znacznej częśc tej przestrzen. JeŜel tak efekt 75

76 ne będze zachodzł, to moŝemy otrzymać zbór reguł pokrywających newelk obszar przestrzen danych uczących klasyfkacja nowego obektu w tej przestrzen moŝe zachodzć dość rzadko wększość przestrzen danych uczących jest dla takego zboru reguł A neznana. Przesuwane jedynek do początkowych fragmentów chromosomu spowoduje poprawę wartośc w(a) we wzorze 5-33 (ew. 5-34) określającym wartość przystosowana. JeŜel węc podczas przesunęca ne nastąp pogorszene jakośc wykonywanej klasyfkacj, to przesunęce spowoduje poprawę wartośc przystosowana. Przesuwane jedynek moŝe teŝ pośredno wpłynąć na wartość A ze wzoru 5-33 (ew. 5-34) wykonywane klasyfkacj na duŝych obszarach przez nowopowstałe reguły moŝe spowodować, Ŝe reguły opsane na małych obszarach staną sę zbędne będą mogły zostać usunęte operatorem usuwana jedynk. Do realzacj losowego przestawana jedynk z danego fragmentu chromosomu chs do rejonu genów naleŝących do poprzednego fragmentu chs - (oczywśce ne zachodz to dla reguł uzyskanych dla podzału =2) słuŝy operator przesunęca jedynk. Technczna realzacja tego operatora polega na wylosowanu z jednakowym prawdopodobeństwem z przedzału, A wartośc q mov, a następne na odszukanu w chromosome q mov -tej jedynk począwszy od początku chromosomu, która znajduje sę na lokalzacj r mov (wzór 5-2). JeŜel jedynka ta naleŝy do fragmentu chromosomu chs =2, to algorytm jest przerywany. JeŜel jednak naleŝy do fragmentu chromosomu chs >2, to jest ona usuwana, a we fragmence chromosomu chs - losowana jest (z jednakowym prawdopodobeństwem) pozycja r mov, na której zostane wstawona jedynka. JeŜel we fragmence chs - wszystke reguły są nestotne to algorytm jest przerywany. Operator ten moŝe ne być skuteczny dla końcowych fragmentów długch chromosomów. Dzeje sę tak ponewaŝ wstawona jedynka na lokalzacj r mov moŝe opsywać regułę zupełne ne zwązaną z usunętą regułą opsaną genem z lokalzacj r mov nowa reguła moŝe wykonywać klasyfkację na zupełne nnym obszarze przestrzen danych uczących nŝ obszar, na którym realzowała klasyfkację usunęta reguła. Najczęścej zamast poprawy rezultatu pracy algorytmu genetycznego poprzez zmnejszene wartośc w(a) uzyskamy spadek jakośc klasyfkacj k(a) tym samym pogorszene wartośc przystosowana. Z tym problemem poradz sobe modyfkacja tego operatora: ntelgentne przesunęce jedynk. 76

77 Operator ntelgentnego przesunęca jedynk jest modyfkacją poprzedno opsywanego operatora przesunęca jedynk, wykonaną celem zmnejszena efektu pozyskana reguły opsanej na obszarze, który ne jest zwązany z obszarem, na którym opsano regułę usunętą. Po losowym wybranu jedynk do przesunęca z fragmentu chromosomu chs >2 określa sę jak obszar A A... A m... A 77 opsuje 2 n zwązaną z daną pozycją r mov regułę. Po wylosowanu wartośc u mov 0, wykonuje sę przeszukane po regułach zakodowanych we fragmence chromosomu chs -. Podczas przeszukana analzuje sę obszary A A 2... A m... A wyznaczając dla kaŝdego z nch procentowy stopeń pokryca z obszarem A A... A m... A. Następne poczynając od perwszego genu we fragmence 2 n chromosomu chs - wykonuje sę sumę po wyznaczonych wartoścach procentowego pokryca obszarów A A... A m... A 2 n A A... A m... A. Gdy 2 n wartość tej sumy przekroczy lub zrówna sę z u mov, to uzyskujemy pozycję r mov, na której zostane wstawona jedynka. JeŜel na pozycj r mov opsana jest reguła nestotna, to algorytm jest przerywany. Opsywany, zmodyfkowany sposób uzyskwana pozycj wstawena jedynk r mov umoŝlwa uzyskane reguły, która moŝe wykonywać lepszą klasyfkację nŝ usunęta reguła z pozycj r mov. Dzeje sę tak dlatego, Ŝe obszar A A... A m... A jest zazwyczaj (za wyjątkem obszarów brzegowych) wększy nŝ 2 A A... A m... A n, a wec moŝe klasyfkować wększą lczbę 2 n obektów. JeŜel usuwana reguła mała znaczący wpływ na wykonywaną klasyfkację, to moŝna lczyć sę z poprawą klasyfkacj poprzez zakodowane nowej reguły, ponewaŝ obszary kodowane przez obe reguły przynajmnej częścowo pokrywają sę. Funkcja przystosowana dana wzorem 5-33 (ew. 5-34) koduje sobą zadane optymalzacj dwukryteralnej. W tej sytuacj trudnym moŝe okazać sę uzyskane takej grupy reguł A, które potrafą sklasyfkować poprawne 00% (lub prawe 00%) danych uczących. Algorytm genetyczny moŝe podąŝyć w stronę mnmalzacj lcznośc zboru A, ne wykazując przy tym znaczących postępów przy maksymalzacj lczby poprawne klasyfkowanych elementów uczących. śeby wymusć na algorytme genetycznym wykonane poprawnej klasyfkacj wszystkch (lub prawe wszystkch) danych uczących proponuję wprowadzene operatora neproporcjonalnego wstawena jedynk. Jego dzałane polegać będze na losowym dodawanu jedynek we fragmence chromosomu n

78 78 chs = max. Fragment ten koduje reguły uzyskane z ostatnego podzału max wykonanego podczas realzacj algorytmu 5-. Wszystke reguły z tego obszaru razem potrafą wykonać poprawną klasyfkację wszystkch danych uczących, co jest warunkem zatrzymana algorytmu 5-. Algorytm 5- tworzy reguły opsane na coraz mnejszych obszarach A A... A m... A przestrzen danych uczących dla 2 n kaŝdego kolejnego jego przebegu. Tym samym reguły ze zboru S = max opsane są na najmnejszych obszarach, a przez to klasyfkują newelke lośc danych uczących. NaleŜy sę węc spodzewać, Ŝe przewaŝne reguły ze zboru S = max klasyfkują dane uczące tylko jednej klasy, a co za tym dze wartość zaufana do klasyfkacj CF = max 2... m... n z reguły R = max 2... m... n wynos 00%. Z tego powodu dołączane właśne tych reguł do zboru A wpłyne w moŝlwe małym stopnu na wartość A, a tym samym na pogorszene wartośc przystosowana chromosomu kodującego zbór A. Oczekwać naleŝy, Ŝe losowe dołączene do zboru A reguły R = max 2... m... n ne zmen poprawnośc wykonywanej klasyfkacj lub neco ją popraw np.: o kolejny poprawne klasyfkowany obekt uczący. W wypadku poszukwana rozwązana zadana optymalzacj dwukryteralnej algorytm genetyczny bez zastosowana operatora neproporcjonalnego wstawena jedynk potraf wyszukać dobre dość dobre rozwązane. Jednak ne gwarantuje ono w 00% poprawnej klasyfkacj. Do osągnętego zboru reguł A naleŝy dodać reguły realzujące poprawną klasyfkację elementów uczących, które to elementy ne są poprawne klasyfkowane przez reguły ze zboru A. Tylko nelczne z reguł ze zboru S = max realzują ten warunek wększość z nch klasyfkuje poprawne elementy uczące juŝ sklasyfkowane poprawne przez zbór wybranych reguł A. Z tego powodu zalecam zastosowane parametru p ns określającego jak często ma być uruchamany operator neproporcjonalnego wstawena jedynk o podobnym znaczenu jak we wzorze Nech wartość parametru p ns naleŝy do lczb rzeczywstych neujemnych, a część całkowta nt(p ns ) określa lczbę wstaweń jedynk we fragment chromosomu chs = max, a część ułamkowa p ns -nt(p ns ) prawdopodobeństwo zajśca zdarzena polegającego na jeszcze jednym wstawenu jedynk we fragment chromosomu chs = max. R + ns { 0} p gdze: nt(p ns ) ℵ {0} (część całkowta p ns ) lczba wstaweń jedynk we fragment max chromosomu chs = (5-39)

79 79 p ns - nt(p ns ) 0, R + {0} (część ułamkowa p ns ) prawdopodobeństwo zdarzena polegającego na wstawenu jeszcze jednej jedynk we fragment max chromosomu chs = Dzałane operatora neproporcjonalnego wstawena jedynk ma na celu jedyne zmaksymalzowane wartośc k(a), ale odbywa sę to kosztem wartośc A. NaleŜy spodzewać sę, Ŝe wartość p ns wymagana do odszukana reguły, która podnese wartość k(a) o przynajmnej jeden, spowoduje najwyŝej przyrost wartośc A o nt(p ns )+ (jeŝel część ułamkowa p ns jest róŝna od zera) lub o p ns (jeŝel część ułamkowa wartośc p ns wynos zero). Przyjmjmy, Ŝe wartość p ns przyjmuje wartośc tylko całkowte. śeby dzałane operatora neproporcjonalnego wstawena jedynk umoŝlwało dalsze przetwarzane osobnka uzyskanego po wstawenu p ns jedynek, wartość przystosowana (wzór 5-33) tego osobnka mus sę polepszyć to nawet dla przypadku, gdy uzyskamy poprawę klasyfkacj o tylko jeden punkt pomarowy kosztem przyłączena do zboru A jeszcze p ns jedynek (wzór 5-40). PonewaŜ jedynk te dołączane są do ostatnego z wyróŝnonych fragmentów chromosomu dodatkowo funkcja kary w(a) wzrośne o wartość max p ns. chs = max, to max 0; max 0; a a k( A) b A c w( A) a D b M [ k( A) + ] b [ A + p ] c [ w( A + p ] m a ns ) D b M m < (5-40) max ns a,b,c,m R + a b>>c>0 [ k( A) + ] b [ A + pns ] c [ w( A) + max p ] a k( A) b A c w( A) < a ns 0 < a b pns c max pns ( b c ) a p ns + max < (5-4) Po zakończenu algorytmu 5- wartość max jest juŝ ustalona. Po określenu wartośc p ns ustalenu wartośc b c ze wzoru 5-33 opsującego funkcję przystosowana, wartość a z tego wzoru pownna spełnać nerówność 5-4. JeŜel najlepszy chromosom w generacj będze potrafł wykonać poprawną klasyfkację wszystkch danych uczących, to dzałane operatora neproporcjonalnego wstawene jedynk naleŝy zakończyć, gdyŝ będze on przeszkadzał pozostałym operatorom algorytmu genetycznego w dalszej poprawe juŝ uzyskanego wynku.

80 80 stan początkowy po neproporcjonalnym wstawenu jedynk po ntelgentnym przesunęcu jedynk po dwukrotnym usunęcu jedynk Rysunek 5-3. Przykład dzałana operatorów kodujących wedzę o zadanu na rysunkach przedstawono reguły kodowane przez chromosom (kolorem czerwonym zaznaczono nowe reguły) słuŝące do klasyfkacj obektów klasy C C2 w przestrzen jednowymarowej. Wartość p ns moŝna przyjąć jako małą np.: ponŝej jedynk wtedy po dłuŝszym czase realzacj algorytmu genetycznego moŝna spodzewać sę poprawy klasyfkacj o przynajmnej jeden punkt uczący. Stane sę to moŝlwe neduŝym kosztem polegającym na dodanu do zboru A newelkej lczby reguł p ns (gdy wartość p ns to tylko kosztem dodana jednej reguły). Sytuacja taka jest bardzo efektywnym przykładem dzałana opsywanego operatora, ale odbywa sę to kosztem welu pokoleń co ne zawsze jest dopuszczalne (ze względu m.n. na czas realzacj algorytmu genetycznego). MoŜemy ustalć nawet dość duŝą wartość p ns, ale pod warunkem wyregulowana parametrów ze wzoru 5-33 opsującego funkcję przystosowana tak, aby spełnały nerówność 5-4. W wypadku uzyskana poprawy klasyfkacj o jeden punkt uczący naleŝy lczyć sę z powększenem lczby reguł o p ns. To zdarzene moŝe sę welokrotne powtórzyć zanm osągnemy poprawną klasyfkację wszystkch danych uczących. otrzymujemy chromosom, który realzuje poprawne w 00% klasyfkacje,

81 ale który zawera duŝo reguł klasyfkujących. Reguły te podczas uczena sę algorytmu genetycznego będą redukowane dzęk pozostałym operatorom genetycznym Interpretacja wynków 8 Algorytm genetyczny ne rozwązuje zadana optymalzacj w dosłownym tego słowa znaczenu (z łac. optmus najlepszy) poprzez dostarczene najlepszego rozwązana, ale dostarcza rozwązane najlepsze z grupy sprawdzonych podczas pracy algorytmu. Rozpatrywane zadane maksymalzacj moŝe dawać po kaŝdym przebegu algorytmu genetycznego zupełne róŝny wynk maksmum lokalne, które osągnął algorytm. W zwązku z tym naleŝy ustalć kryterum uznające wynk uzyskany z przebegu algorytmu genetycznego za dobry. Nech wstępnym takm kryterum będze poprawna klasyfkacja wszystkch danych uczących lub bez najwyŝej jednego punktu pomarowego przy lczbe reguł ponŝej lczby elementów uczących (5-42). k(a) D - A < D (5-42) Nech chromosom ch kodujący sobą zbór A, który spełna warunek 5-42 nazywany będze sztucznym ekspertem. ZałóŜmy, Ŝe po welu realzacjach algorytmu genetycznego będzemy dysponować grupą sztucznych ekspertów I (przykład 5-5). Po uzyskanu lcznej grupy sztucznych ekspertów I moŝna zaostrzyć kryterum dane wzorem 5-42 chocaŝby poprzez zmnejszene wartośc, ponŝej której lczba reguł ze zboru A będze traktowana jako ekspert np.: A < D / 2. aŝdy ze sztucznych ekspertów potraf wykonać klasyfkację obektu x=(x,x 2,...,x m,...,x n ) w przestrzen n-wymarowej do klasy CT 0 (gdze T 0 {,2,...,M} M jest loścą klas) z zaufanem α CT0 zgodne ze wzorem 5-4. NaleŜy określć sposób wyboru z grupy wykonanych klasyfkacj (przez poszczególnych sztucznych ekspertów) z róŝnym wartoścam zaufana klasyfkację najbardzej trafną. Jednym z najprostszych rozwązań jest posłuŝene sę wartoścą zaufana do wykonanej klasyfkacj chromosom wykonujący klasyfkację z przypsaną najwększą wartoścą zaufana będze uznany za chromosom udzelający najbardzej trafnej klasyfkacj obektu x=(x,x 2,...,x m,...,x n ). Nekoneczne to rozwązane jest najlepsze, gdyŝ wraz ze zmnejszanem sę wartośc A maleje zaufane do udzelanej odpowedz uzyskane reguły przyporządkowane są do duŝych obszarów przestrzen danych uczących, w obrębe których znajdować sę mogą dane róŝnych klas, co wpływa na obnŝane zaufane do danej reguły (rysunek 5-3 przed po usunęcu jedynek). Z tego powodu

82 zaufane do udzelanej klasyfkacj ma neduŝą wartość dla sztucznego eksperta o newelkej lczbe reguł, a dla eksperta o duŝej lczbe reguł naleŝy spodzewać sę klasyfkacj o duŝych wartoścach zaufana. Przykład 5-5 Grupa sztucznych ekspertów I uzyskana dla danych uczących z przykładu 5-, czyl obektów klas C C2. olorem czerwonym zaznaczono obszary, w których nowy obekt zostane sklasyfkowany jako C2, nebeskm jako C. aŝdy z ekspertów wykonuje klasyfkację za pomocą pęcu reguł kaŝdy z nch koduje sobą nną grupę reguł. 82 Rysunek 5-4. Grupa sztucznych ekspertów I (objaśnena w tekśce) - - rezultat pracy programu kulk.exe Trzeba lczyć sę z tym, Ŝe sztuczny ekspert o wysokej wartośc przystosowana (małej wartośc A ) zostane zakrzyczany przez gorzej przystosowanego eksperta. Aby ne dopuścć do tej sytuacj proponuję za najbardzej trafną klasyfkację wykonaną przez grupę ekspertów uznać I klasyfkację eksperta, dla którego wartość loczynu przystosowana Φ (ch) oraz zaufana α CT0 osąga wartość najwększą (5-43). max{ Φ ( ch) α CT } (5-43) 0

83 83 6. Dagnostyka transformatorów 6.. Problemy metody Transformator ([.0], [.], [.2]) jako urządzene elektryczne [2] słuŝy do zmany welkośc napęca prądu przemennego, które to zmany wymuszone są konecznoścą mnmalzacj strat energ podczas przesyłu secą elektroenergetyczną. W celu zapewnena poprawnej pracy transformatora przeprowadza sę rozmate pomary [48] próby eksploatacyjne take jak: pomar rezystancj zolacj, pomar współczynnka stratnośc, pomar rezystancj uzwojeń, badana pod obcąŝenem przełącznka zaczepów, badane wyładowań nezupełnych, analza wbroakustyczna, badana oleju w zakrese: klarownośc, lepkośc, gęstośc, zawartośc obcych cał stałych, lczby kwasowej, temperatury zapłonu, napęca przebca, rezystywnośc, współczynnka stratnośc, zawartośc wody oraz analza chromatografczna gazów (z ang. DGA Dssolved Gas Analyss) rozpuszczonych w oleju transformatora ([49], [40]). Ów olej stosowany jest jako chłodzwo zolator. Opływa on wększość elementów transformatora. JeŜel zaczynają sę one psuć, to doprowadzają do degradacj oleju, co objawa sę m.n. wydzelanem sę w nm rozmatych gazów. Ich skład chemczny oraz loścowy zaleŝy od rodzaju uszkodzena. Analza chromatografczna umoŝlwa wykonane analzy jakoścowej loścowej meszanny gazów wyekstrahowanych z pobranej próbk oleju transformatorowego. Na podstawe wynków DGA moŝna postawć dagnozę dotyczącą stanu techncznego transformatora olejowego. Metoda DGA jest dość tana zyskuje coraz wększą popularność m.n. dlatego, Ŝe ne wymaga wyłączena transformatora z sec elektroenergetycznej celem przeprowadzena dagnozy.

84 Dagnostyka na podstawe rezultatów chromatograf gazowej (DGA) Chemczne podstawy chromatograf gazowej Chromatografa ([.8], [.9]) jest znana od początku XX weku [86], ale dopero w drugej jego połowe rozpoczął sę jej szybk rozwój (po wynalezenu chromatografu gazowego), aŝ do dna dzsejszego, gdze stanow jedną z najbardzej rozpowszechnonych metod w chem analtycznej [3]. Wysoką pozycję w chem analtycznej chromatografa zawdzęcza moŝlwośc wykrywana substancj analzowanej oznaczana jej lośc w próbce na bardzo nskm pozome wobec nnych substancj (np.: za pomocą chromatograf gazowej w jednym ltrze wody moŝna wykryć pkogram analzowanej substancj porównywalne jak za pomocą spektrometr masowej). Istotą rozdzelana chromatografcznego [85] jest dzałane dwóch sł: powodującej ruch cząsteczek w określonym kerunku hamującej ten ruch. Warunkem rozdzelena meszanny jest zróŝncowane sły hamującej w odnesenu do poszczególnych komponentów meszanny. Najczęścej słą powodującą ruch jest przepływ gazu, ceczy lub płynu w stane nadkrytycznym przez złoŝe mające zdolność adsorbowana lub absorbowana (rozpuszczana) substancj. Słą hamującą jest oddzaływane tego złoŝa z komponentam meszanny. ZłoŜem moŝe zostać cało stałe w postac drobnych zaren o rozwnętej powerzchn (adsorbent) lub cecz nanesona cenką warstwą na powerzchnę cała stałego. Adsorbent lub cecz absorbująca (rozpuszczająca) nazywane są fazą stacjonarną, a czynnk przepływający przez złoŝe fazą ruchomą. W zaleŝnośc od zastosowanej fazy ruchomej: gazu, ceczy lub płynu w stane nadkrytycznym chromatografę dzelmy odpowedno na gazową, ceczową nadkrytyczną. ZałóŜmy, Ŝe mamy do czynena z dwoma składnkam A B meszanny, przy czym składnk A słabo rozpuszcza sę lub adsorbuje w faze neruchomej. Spowoduje to, Ŝe składnk A będze przemeszczał sę szybcej przez układ chromatografczny urządzene zwane chromatografem. Wykonując chromatografę naleŝy tak dobrać jej warunk (rodzaj fazy stacjonarnej, rodzaj fazy ruchomej, prędkość przepływu fazy ruchomej oraz temperaturę), aby rozdzelć składnk meszanny A B na wyjścu chromatografu, gdze umeszczony jest rejestrator (rysunek 6-), który rejestruje

85 opuszczające chromatograf składnk meszanny w forme tzw. pków chromatografcznych (rysunek 6-2). 85 Rysunek 6-. Schemat chromatografu gazowego ( zbornk lub wytwornca gazu nośnego, 2- regulator przepływu gazu nośnego, 3 odtlenacz osuszacz gazu nośnego, 4 przepływomerz gazu nośnego, 5 dozownk, 6 kolumna chromatografczna, 7 detektor, 8 termostat kolumny, 9 regulator temperatury dozownka, kolumny detektora, 0 urządzene dozujące meszannę, wzmacnacz sygnału detektora, 2 rejestrator pków chromatografcznych lub komputer). olorem nebeskm zaznaczono kerunek przepływu gazu (na podstawe [86]). Rysunek 6-2. Chromatogramy z pkam chromatografcznym (przedruk z [86]) uzyskane na stach cząsteczkowych 5A po 8 godznach aktywacj w temperaturze 50 0 C (bez rozdzelena CO CH 4 ) C (z wdocznym rozdzelenem CO CH 4 ). Przy chromatograf gazowej najczęścej stosowane są detektory róŝnczkowe, które generują przyrost sygnału proporcjonalny do przyrostu stęŝena (lub masy) substancj w gaze nośnym. Ta zmana sygnału rejestrowana jest w forme pku. Na podstawe połoŝena pku na chromatograme moŝna zdentyfkować poszczególne składnk badanej meszanny. MoŜlwe jest teŝ połączene chromatografu ze

86 spektrometrem masowym dentyfkacja składnków meszanny na podstawe jego wskazań. Ilość substancj w meszanne zaleŝy od welkośc odpowadającego jej pku, gdyŝ wysokość powerzchna pku są proporcjonalne do lośc oznaczanego składnka. JeŜel pk jest symetryczny wąsk, to do analzy loścowej uŝywa sę wysokośc pku chocaŝ jest ona wraŝlwa na czas dozowana próbk oraz nawet newelke zmany prędkośc gazu nośnego. W celu otrzymana dokładnych wynków korzystnejsze jest merzene powerzchn pku porównane jej z pkem wyznaczonym ze znanej lośc substancj wzorcowej. Powerzchnę pku S pku wyznacza sę na podstawe wzoru (6-), 86 S pku h w0,50 = w0,5 + w h 2 0,85 (6-) - gdy pk jest symetryczny - gdy pk jest nesymetryczny gdze h jest wysokoścą pku, w 0,50, w0,5, w0, 85 - szerokoścą odpowedno w połowe jego wysokośc oraz na 5% 85% jego wysokośc. Dokładność uzyskanego wynku moŝe określć dośwadczony chemk. ZaleŜy bowem ona od welu czynnków chemcznych. Jak wynka z wywadu wynk moŝe być wyznaczony z dokładnoścą ±5% na technczne najgorszych chromatografach. Istneją jednak sposoby łączena róŝnych metod analtycznych celem wyznaczena bardzo dokładnego wynku np.: chromatograf gazowy połączony ze spektrometrem masowym Metoda kodu IEC Metoda kodu IEC zaproponowana przez Internatonal Electrotechncal Commsson [.] jest jedną z popularnejszych ([62], [25], [66]) metod dagnostyk stanu techncznego transformatora olejowego [76] w oparcu o dane z chromatograf gazowej DGA.. Do zastosowana kodu IEC naleŝy uzyskać z chromatografu dane dotyczące występowana gazów: H 2 - wodór, CH 4 - metan, C 2 H 2 - acetylen, C 2 H 4 - etylen, C 2 H 6 - etan. Dane te dotyczą stęŝena są podawane w jednostkach ppm (z ang. parts per mlon), czyl objętoścowo w częśc na mlon. Na ch podstawe wyznacza sę lorazy * opsane wzorem (6-2). * We wszystkch występujących w tym rozdzale rysunkach 3-wymarowych na os OX będze prezentowana wartość lorazu x, na OY - y, a na OZ - wartość lorazu z.

87 87 x = C H C H , y = CH H 2 4, z = C H C H (6-2) W zaleŝnośc od wartośc lorazów opsanych wzorem (6-2) przypsuje sę m odpowedne kody zebrane w tabel 6-. loraz C2 H2 CH4 C H wartość lorazu C2 H4 H2 C H 0, 0.) , ) 0 0, 3 2 wększa nŝ Tabela 6-. od IEC Dysponując kodam IEC dokonuje sę klasyfkacj uszkodzena transformatora. Zasady klasyfkacj zebrane są w tabel 6-2. Na tej podstawe moŝna uzyskać reguł jeŝel-to określających stan technczny transformatora (tabela 6-3). od C2 H2 C H 2 4 od CH 4 H 2 od C2 H4 C H 2 6 od IEC lasyfkacja uszkodzena Bez uszkodzeń Wyładowana nezupełne o małej energ 0 0 Wyładowana nezupełne o duŝej energ lub 2 0 lub 2 * 0 Wyładowana zupełne o małej energ Wyładowana zupełne o duŝej energ Przegrzane o temperaturę mnejszą nŝ 50 0 C Przegrzane o temperaturę (50 0 C, C Przegrzane o temperaturę (300 0 C, C Przegrzane o temperaturę wększą nŝ C od wykraczający poza Nezdentyfkowane uszkodzene powyŝsze symbole Tabela 6-2. lasyfkacja stanu techncznego transformatora według kodu IEC Reguła JeŜel kod IEC = 000, to transformator ne jest uszkodzony. Reguła 2 JeŜel kod IEC = 00, to w transformatorze występują wyładowana nezupełne o małej energ. Reguła 3 JeŜel kod IEC = 0, to w transformatorze występują wyładowana nezupełne o duŝej energ. Reguła 4 JeŜel kod IEC = 0, to w transformatorze występują wyładowana * od 02 jest w praktyce nterpretowany jako Wyładowana zupełne o duŝej energ

88 zupełne o małej energ. Reguła 5 JeŜel kod IEC = 20, to w transformatorze występują wyładowana zupełne o małej energ. Reguła 6 JeŜel kod IEC = 202, to w transformatorze występują wyładowana zupełne o małej energ. Reguła 7 JeŜel kod IEC = 02, to w transformatorze występują wyładowana zupełne o duŝej energ. Reguła 8 JeŜel kod IEC = 00, to w transformatorze występują przegrzana o temperaturze mnejszej nŝ 50 0 C. Reguła 9 JeŜel kod IEC = 020, to w transformatorze występują przegrzana o temperaturze od 50 0 C do C. Reguła 0 JeŜel kod IEC = 02, to w transformatorze występują przegrzana o temperaturze od C do C. Reguła JeŜel kod IEC = 022, to w transformatorze występują przegrzana o temperaturze powyŝej C. Tabela 6-3 Reguły jeŝel-to dotyczące klasyfkacj wg kodu IEC 88 Rysunek 6-3. Grafczna lustracja reguł według kodu IEC. Obszar przezroczysty to Nezdentyfkowane uszkodzene (współrzędne X, Y, Z - wg uwag do wzoru 6-2) Reguły z tabel 6-3 moŝna przedstawć grafczne w sposób ukazany na rysunku 6-3, z którego wdać, Ŝe wększa część trójwymarowej przestrzen XYZ odpowada stanow techncznemu Nezdentyfkowane uszkodzene. Ne naleŝy sę jednak sugerować rozmaram poszczególnych obszarów klasyfkujących zaprezentowanych na rysunku 6-3 celem określena częstośc zastnena danego stanu techncznego. Praktyka

89 pokazuje, Ŝe uzyskane wynk pomarów ne są w zaprezentowanej na rysunku 6-3 przestrzen XYZ rozłoŝone równomerne. 89 lasa stanu techncznego Lczba pomarów Bez uszkodzeń 33 Wyładowana nezupełne o małej energ Wyładowana nezupełne o duŝej energ 2 Wyładowana zupełne o małej energ 0 Wyładowana zupełne o duŝej energ 20 Przegrzane o temperaturę mnejszą nŝ 50 0 C 29 Przegrzane o temperaturę (50 0 C, C 24 Przegrzane o temperaturę (300 0 C, C 79 Przegrzane o temperaturę wększą nŝ C 94 Nezdentyfkowane uszkodzene 64 Ne moŝna zastosować metody kodu IEC 78 Razem: 444 Tabela 6-4. Lczba pomarów naleŝących do danej klasy stanu techncznego dla metody kodu IEC dla 444 uzyskanych rzeczywstych pomarów [89] Jak moŝna sę wstępne zorentować z zestawena prezentowanego w tabel 6-4, w wększośc przypadków praktycznych występują przegrzana o temperaturze przekraczającej C C. Dość duŝa jest teŝ lczba przypadków, gdze dagnoza ne moŝe być postawona. Neczęsto występują wyładowana nezupełne, a lczba transformatorów bez uszkodzeń równeŝ ne jest duŝa. Tłumaczyć to moŝna faktem, Ŝe dagnozy wykonuje sę częścej dla jednostek uszkodzonych, aby w porę zapobec powaŝnym uszkodzenom (a nawet znszczenu) transformatora Metoda polska Metoda polska jest rozwnęcem metody kodu IEC m.n. o wartośc stosunków węglowodorów nenasyconych do nasyconych, co umoŝlwa weryfkację lokalnych przegrzań. Metoda ta uwzględna następujące gazy: H 2 - wodór, CH 4 - metan, C 2 H 2 - acetylen, C 2 H 4 - etylen, C 2 H 6 - etan, C 3 H 8 propan, C 3 H 6 propylen, CO tlenek węgla, CO 2 dwutlenek węgla, których lość podana jest w jednostkach ppm (parts per mlon). Względem kodu IEC metoda polska umoŝlwa do pewnego stopna weryfkację dagnozy, ponewaŝ opera sę na klku zestawenach stęŝeń gazów uzyskanych z DGA: - dopuszczalne stęŝena gazów - kod IEC

90 90 - stosunk stęŝeń węglowodorów nenasyconych do nasyconych - stosunek stęŝena dwutlenku węgla do tlenku węgla. Dopuszczalne wartośc stęŝeń gazów prezentuje tabela 6-5. Wartośc te zostały opracowane w oparcu o oględzny wewnętrzne transformatora zaleŝą one tylko od typu transformatora (blokowy lub secowy), a ne od okresu eksploatacj ([20], [66]). Gaz Transformator blokowy secowy H CH C 2 H C 2 H C 2 H C 3 H C 3 H CO CO Tabela 6-5. Dopuszczalne wartośc stęŝeń gazów (w ppm) Stosunk stęŝeń węglowodorów nenasyconych do nasyconych prezentowane w tabel 6-6, słuŝą do weryfkacj przegrzań do określena ch temperatury. Temperatura C2H C H C C 3 3 H H 6 8 C2H C H od50 0 C do C (0, ) (0, 2) (0, 3) od C do C, 3 2, 6 3, 5 powyŝej C węcej nŝ 3 węcej nŝ 6 węcej nŝ 5 Tabela 6-6. Stosunk gazów w zaleŝnośc od temperatury przegrzana Podczas normalnej pracy transformatora wartość lorazu CO 2 CO naleŝy do przedzału (3, 7). W metodze polskej przyjęto występowane uszkodzena zolacj celulozowej, gdy CO lub CO 2 przekracza wartość dopuszczalną podaną w tabel 2-6 CO oraz gdy 2 > 0, 3. CO

91 Metoda polska kończy sę postawenem dagnozy wg kodu IEC z ewentualnym uzupełnenem o uszkodzenach w zolacj celulozowej. Ponadto jeŝel Ŝaden z gazów ne przekroczył wartośc dopuszczalnej, to dagnoza wg kodu IEC o uszkodzenu traktowana jest tylko jako symptom zdagnozowanego uszkodzena. Wszelke przegrzana mogą być dodatkowo zweryfkowane wg tabel lasa stanu techncznego Lczba pomarów Lczba uszkodzeń zolacj Lczba potwerdzeń przegrzana (poprawnych błędnych) Lczba symptomów uszkodzena Bez uszkodzeń Wyładowana nezupełne o małej energ 0-3 Wyładowana nezupełne o duŝej energ Wyładowana zupełne o małej energ Wyładowana zupełne o duŝej energ Przegrzane o temperaturę mnejszą nŝ 50 0 C / 6 Przegrzane o temperaturę (50 0 C, C / 0 9 Przegrzane o temperaturę (300 0 C, C / 0 20 Przegrzane o temperaturę wększą nŝ C / 0 7 Nezdentyfkowane uszkodzene Ne moŝna zastosować metody polskej Razem: 444 Tabela 6-7. Lczba pomarów naleŝących do danej klasy stanu techncznego dla metody polskej (znak - oznacza ne dotyczy ) wraz z uzupełnenem dagnozy stanem zolacj, potwerdzenem przegrzana kontrolą przekroczena wartośc dopuszczalnych stęŝeń Analzując zestawene uzyskanych dagnoz dla metody polskej (tabela 6-7) moŝna zauwaŝyć, Ŝe wszystke przegrzana o temperaturze powyŝej 50 0 C były dość często potwerdzane to poprawne. Jedyne dla przegrzań o temperaturze nŝszej nŝ 50 0 C uzyskane potwerdzena wskazywały na przegrzana o temperaturze powyŝej C. JeŜel dodatkowo uwzględnmy, Ŝe w ponad połowe przypadków ne przekroczono dopuszczalnych stęŝeń gazów (zaobserwowano tylko symptomy uszkodzena), to moŝna stwerdzć, ze dagnoza Przegrzane o temperaturę mnejszą nŝ 50 0 C ne naleŝy do pewnych. Przecweństwem tego stanu jest dagnoza Wyładowana zupełne o duŝej energ, gdze zaledwe 2 przypadk okazały sę być symptomam tego uszkodzena. NaleŜy teŝ zaznaczyć, Ŝe gdyby uwzględnć uszkodzene zolacj celulozowej w przypadkach, gdy metoda polska ne daje dagnozy, to moŝna w ten sposób zdagnozować jeszcze 4 przypadków pomarów.

92 Dzęk uzupełnenu nformacj o stane techncznym transformatora dodatkowym zestawenam metoda ta wydaje sę duŝo bardzej pewnejsza nŝ kodu IEC Metoda polska pogłębona Pogłębona metoda polska jest modyfkacją metody polskej, polegającej na zmane weryfkacj przegrzań, która dla metody polskej polegała na sprawdzenu wartośc trzech lorazów prezentowanych w tabel 6-6. W metodze pogłębonej przyjęto, Ŝe dla przegrzań o temperaturze powyŝej C odpowedne wartośc przyjmować muszą dwa, a ne trzy lorazy (tabela 6-6). lasa stanu techncznego Lczba pomarów Lczba uszkodzeń zolacj Lczba potwerdzeń przegrzana (poprawnych błędnych) Lczba symptomów uszkodzena Bez uszkodzeń Wyładowana nezupełne o małej energ 0-3 Wyładowana nezupełne o duŝej energ Wyładowana zupełne o małej energ Wyładowana zupełne o duŝej energ Przegrzane o temperaturę mnejszą nŝ 50 0 C / 6 6 Przegrzane o temperaturę (50 0 C, C / 3 9 Przegrzane o temperaturę (300 0 C, C / 5 20 Przegrzane o temperaturę wększą nŝ C / 7 Nezdentyfkowane uszkodzene Ne moŝna zastosować metody polskej Razem: 444 Tabela 6-8. Lczba pomarów naleŝących do danej klasy stanu techncznego dla metody polskej pogłębonej (znak - oznacza ne dotyczy ) wraz z uzupełnenem dagnozy stanem zolacj, potwerdzenem przegrzana kontrolą przekroczena wartośc dopuszczalnych stęŝeń Dla metody tej znacząco wzrasta lczba poprawnych potwerdzeń przegrzań jest ona godna uwag pommo, Ŝe wzrosła teŝ lczba potwerdzeń przegrzań błędnych, czyl o nnym zakrese temperatur nŝ właścwa dagnoza Metoda nemecka Metoda ta uwzględna te same gazy co metoda polska, a ocenę stanu techncznego transformatora przeprowadza sę w oparcu o:

93 - wartośc dopuszczalnych stęŝeń gazów rozpuszczonych w oleju (ta sama tabela wartośc dopuszczalnych co dla metody polskej) - pęcoznakowego kodu uszkodzena, który umoŝlwa postawene jednej z ośmu dagnoz (tabele ). 93 wartość stosunku stęŝeń stosunek stęŝeń C2H C H H 2 CH 4 C2H C H C2H C H CO 2 * CO 0; 0,3) ,3;,0) 0 0,0; 3,0) 2 3,0; 0, węcej nŝ 0, Tabela 6-9. Pęcoznakowy kod metody nemeckej Dagnoza Pęcoznakowy kod Normalny rozkład zolacj 0000(0) Wyładowana o duŝej energ 23() Wyładowana o małej energ 223() Wyładowana nezupełne o duŝej gęstośc energ 30+(0) Wyładowana nezupełne o małej gęstośc energ 030+(0) Przegrzana lokalne do C 000(2) Przegrzana lokalne od C do C 002(2) Przegrzana lokalne powyŝej C 03(2) Uszkodzene nezdentyfkowane pozostałe wartośc kodu Tabela 6-0. Dagnozy metody nemeckej w zaleŝnośc od pęcoznakowego kodu (znak + naleŝy rozumeć jako ne ma cech wskaźnka ) Dagnoza metodą nemecką kończy sę komunkatem o uszkodzenu uzyskanym według tabel 6-0. Jak wykazuje tabela 6- (oraz nne prace np.: [62]) metoda nemecka daje dagnozę rzadko, ale jest ona dosyć pewna (co potwerdza porównane jej wynków z metodą kodu IEC). Brak przegrzań lokalnych do C potwerdza metodę polską o newelkm zaufanu do tak postawonej dagnozy (duŝa lczba symptomów uszkodzena w metodze polskej). * Uwzględnać tylko w przypadku duŝego udzału celulozy w uszkodzenu - tu przyjęto, Ŝe ma to mejsce wówczas, gdy CO lub CO 2 przekroczy wartość dopuszczoną dwukrotne powększoną.

94 Według metody nemeckej (tabela 6-) dla analzowanej grupy 444 danych pomarowych ne występują uszkodzena zolacj celulozowej, co spowodowane jest przyjętym kryteram na przekroczene dopuszczalnych stęŝeń CO lub CO 2 (wg uwag - przypsu dolnego - do tabel 6-9). Mnejszą lczbę dagnoz względem kodu IEC, czy brak dagnoz o normalnym rozkładze zolacj naleŝy tłumaczyć surowym kryteram metody nemeckej. 94 lasa stanu techncznego Lczba pomarów Lczba uszkodzeń zolacj celulozowej Lczba potwerdzeń dagnozy przez kod IEC Normalny rozkład zolacj Wyładowana o duŝej energ Wyładowana o małej energ 2 0 Wyładowana nezupełne o duŝej gęstośc energ Wyładowana nezupełne o małej gęstośc energ 3 0 Przegrzana lokalne do C Przegrzana lokalne od C do C Przegrzana lokalne powyŝej C Uszkodzene nezdentyfkowane Ne moŝna zastosować metody nemeckej Razem: 444 Tabela 6-. Lczba pomarów naleŝących do danej klasy stanu techncznego dla metody nemeckej wraz z uzupełnenem dagnozy stanem zolacj celulozowej wg metody nemeckej oraz lczba przypadków, które wg kodu IEC potwerdza dagnozę metodą nemecką Metoda francuska Metoda ta uwzględna te same gazy co metoda polska oraz O 2 tlen N 2 - azot, a ocenę stanu techncznego transformatora przeprowadza sę w oparcu o: - wartośc dopuszczalnych stęŝeń gazów rozpuszczonych w oleju (ta sama tabela wartośc dopuszczalnych co dla metody polskej uzupełnona o wartośc dopuszczalne dla tlenu dla azotu dla transformatorów blokowych secowych) - tablcę sprawdzanów zawartą w tabel 6-2.

95 PonewaŜ zbudowany system ne obejmuje pomarów stęŝena tlenu azotu, to przyjęto, Ŝe obe te wartośc wynoszą zawsze zero ne przekraczają wartośc grancznych. Z tego powodu przyjęto posługwane sę tą samą tabelą wartośc dopuszczalnych co dla metody polskej. 95 Nazwa grupy uszkodzena Warunek przynaleŝnośc uszkodzena do grupy Dagnoza Warunek dla postawena dagnozy Uszkodzene elektryczne C2H C H < Grupa acetylenowa C2H2 przekracza wartość dopuszczalną Uszkodzene elektryczne C2H 4 > 50 oraz C 2 H 4 termczne C2H 2 przekracza wartość dopuszczalną Wyładowana nezupełne o neduŝej ntensywnośc nałoŝone na występujące od czasu do czasu slne wyładowana C 2 H 2 < 50 C C 3 3 H H 8 6 >,5 C C 2 2 H H 6 4 >,5 Uszkodzene elektryczne C2H C H < C C 3 3 H H 6 8 < Grupa etylenowa Grupa dwutlenku węgla C2H2 ne przekracza wartośc dopuszczalnej C2H2 C2H4 ne przekraczają wartośc dopuszczalnych Uszkodzene termczne C2H C H > C C 3 3 H H 6 8 > Uszkodzene elektryczne C2H 4 C3H 6 < > lub termczne C2H 6 C3H 8 C2H 4 C3H 6 > <, a takŝe C2H 6 C3H 8 C 2 H 4, C 2 H 6, C 3 H 6, C 3 H 8 wyraźne (tu przyjęto o,5 raza) przekraczają wartośc dopuszczalne Normalne starzene termczne CO 0, CO 2

96 96 Nazwa grupy uszkodzena Warunek przynaleŝnośc uszkodzena do grupy Dagnoza Warunek dla postawena dagnozy Grupa dwutlenku węgla C2H2 C2H4 ne przekraczają wartośc dopuszczalnych Uszkodzene elektryczne; moŝna oczekwać wyładowań nezupełnych nszczących zolację stałą CO > 0, CO 2 Stale występujące wyładowana - Grupa wodoru Tylko H2 CH4 przekraczają wartośc dopuszczalne nezupełne w oleju lub slne wyładowana nezupełne w obszarze gazowym Tabela 6-2. Tablca sprawdzanów (na baze [70]) lasa stanu techncznego Lczba pomarów Lczba potwerdzeń dagnozy przez kod IEC Normalne starzene termczne 8 Uszkodzene elektryczne 6 6 Uszkodzene elektryczne; moŝna oczekwać 22 9 wyładowań nezupełnych nszczących zolację stałą Uszkodzene elektryczne termczne Uszkodzene termczne 9 82 Stale występujące wyładowana nezupełne w oleju 2 0 lub slne wyładowana nezupełne w obszarze gazowym Wyładowana nezupełne o neduŝej ntensywnośc 0 - nałoŝone na występujące od czasu do czasu slne wyładowana Uszkodzene nezdentyfkowane 2 Ne moŝna zastosować metody francuskej 0 - Razem: 444 Tabela 6-3. Lczba pomarów naleŝących do danej klasy stanu techncznego dla metody francuskej

97 97 Do zakwalfkowana wynku do grupy uszkodzena koneczna jest znajomość stęŝeń H 2, CH 4, C 2 H 2, C 2 H 4. JeŜel brak chocaŝ jednej z wymenonych wartośc, to ne moŝna zastosować metody francuskej. Przyjęto, Ŝe znajomość stęŝeń pozostałych gazów ne jest wymagana przynaleŝność do grupy wodoru sprawdzana jest tylko dla znanych stęŝeń. W przypadku, gdy w obrębe grupy ne moŝna wystawć dagnozy ze względu na brak danych o wartoścach odpowednch stęŝeń, to równeŝ ne moŝna zastosować metody francuskej. We wszystkch nnych przypadkach zamplementowana metoda zwróc dagnozę Uszkodzene nezdentyfkowane. Jak wdać z tabel 6-3 metoda francuska potwerdza metodę kodu IEC w wypadku uszkodzeń elektrycznych oraz uszkodzeń termcznych. W pozostałych przypadkach daje ona optymstyczne dagnozy o normalnym starzenu termcznym lub o uszkodzenu elektrycznym z wyładowanam nezupełnym. Jednak dzęk tym prognozom rzadke są przypadk braku dagnozy Metoda kanadyjska Metoda kanadyjska uwzględna następujące gazy: H 2 - wodór, CH 4 - metan, C 2 H 2 - acetylen, C 2 H 4 - etylen, C 2 H 6 - etan, CO tlenek węgla, CO 2 dwutlenek węgla. Rysunek 6-4. Trójkąt Duvala (oznaczena w tekśce). Odpowedne wartośc współrzędnych zaznaczono na osach U, V, W.

98 Ocenę stanu techncznego transformatora wykonuje sę w oparcu o tzw. trójkąt Duvala (rysunek 6-4), który przedstawa powązane proporcj względnych zawartośc gazów z typam uszkodzeń. Metoda ta jest teŝ wsperana przez kontrolę dopuszczalnych stęŝeń gazów rozpuszczonych w oleju, dla której to przyjęto te same wartośc jak w metodze polskej, ale z pomnęcem gazów: C 3 H 8 (propan) C 3 H 6 (propylen). JeŜel Ŝaden z gazów ne przekroczył wartośc dopuszczalnej, to dagnoza wg metody kanadyjskej traktowana jest tylko jako symptom zdagnozowanego uszkodzena. JeŜel wartośc stęŝena gazów: CH 4, C 2 H 2, C 2 H 4 ne są wszystke znane lub wszystke przyjmują wartość zero, to ne moŝna zastosować metody kanadyjskej. Postawene dagnozy wg trójkąta Duvala polega na wyznaczenu wartośc U, V, W danej wzoram (6-3) skorelowanu typu uszkodzena (tabela 6-4) z uzyskanym współrzędnym U, V, W. 00 x 00 y 00 z U = [%] V = [%] W = [%] (6-3) x + y + z x + y + z x + y + z gdze x, y, z to stęŝena odpowedno gazów C 2 H 2, C 2 H 4, CH 4 w ppm. Obszar w trójkące Duvala a b c d e f Dagnoza Wysokoenergetyczny łuk elektryczny Łuk nskoenergetyczny, wyładowane ślzgowe Wyładowane nezupełne w powetrzu (ulot) Punkt gorący o temperaturze ponŝej C Punkt gorący o temperaturze od C do C Punkt gorący o temperaturze powyŝej C Tabela 6-4. Dagnoza dla trójkąta Duvala Metoda dentyfkacj obszarów w trójkące Duvala została zamplementowana (w pseudokodze) w sposób prezentowany w tabel 6-5. JeŜel U > 5 to obszar a lub b lub f JeŜel V > 25 to obszar a lub f JeŜel V > 40 to obszar a lub f JeŜel U > 25 to obszar a w przecwnym wypadku to obszar f w przecwnym wypadku to obszar a w przecwnym wypadku to obszar b w przecwnym wypadku obszar c lub d lub e JeŜel W > 95 to obszar c w przecwnym wypadku to obszar d lub e JeŜel V > 47 to obszar e w przecwnym wypadku to obszar d. Tabela 6-5. Implementacja metody kanadyjskej dla trójkąta Duvala 98

99 99 lasa stanu techncznego Lczba pomarów Lczba potwerdzeń dagnozy przez kod IEC Lczba symptomów uszkodzena Wysokoenergetyczny łuk elektryczny Łuk nskoenergetyczny, wyładowane ślzgowe Wyładowane nezupełne w powetrzu (ulot) Punkt gorący o temperaturze ponŝej C Punkt gorący o temperaturze od C do C 50 3 Punkt gorący o temperaturze powyŝej C Ne moŝna zastosować metody kanadyjskej Razem: 444 Tabela 6-6. Lczba pomarów naleŝących do danej klasy stanu techncznego dla metody kanadyjskej Jak wdać z zestawena z tabel 6-6 metoda kanadyjska daje odmenne dagnozy nŝ metoda kodu IEC za wyjątkem dagnozy Wysokoenergetyczny łuk elektryczny (która teŝ jest dość pewna na podstawe małej lczby symptomów tej dagnozy). Metoda kanadyjska ma tę zaletę, Ŝe zawsze stawa dagnozę (o le moŝna ją zastosować tzn. wyznaczono wartośc stęŝeń CH 4, C 2 H 2, C 2 H 4 są one wększe nŝ zero), czego ne moŝna sę spodzewać po nnych metodach Zalecena eksperta Ta metoda wywodz sę z metody polskej ma za zadane zaproponowane człowekow ekspertow konkretnych dzałań w stosunku do transformatora. UŜyty tu algorytm jest modyfkacją juŝ stnejącego algorytmu [70] dającego sę zastosować dla metody polskej (stęŝena gazów są zawsze określone). Modyfkacja polega na dostosowanu algorytmu do kaŝdego zestawu danych poprzez dodane warunków do nstrukcj skoku warunkowego. Warunk te to: ne wadomo oraz ne moŝna określć kodu IEC. Z opsywanych wcześnej metod tylko ta posługuje sę w pewnych przypadkach przyrostem gazów palnych (dla gazów analzowanych dla metody polskej).

100 00 Rysunek 6-5. Zalecena eksperta Ne ma ścsłego zwązku pomędzy przyrostem gazów palnych, a stanem techncznym transformatora [70]. W tej metodze równeŝ przyrost posłuŝył jedyne jako wskazówka co do dalszych poczynań, a ne jako podstawa do dagnozy. Norma mesęcznego przyrostu gazów dla transformatorów blokowych wynos 30 ppm, a dla secowych 40 ppm.

101 Jeszcze jednym problemem przy posługwanu sę przyrostem gazów w okrese czasu jest fakt wykonywana okresowych remontów polegających na przykład na odgazowanu oleju w celu poprawena jego właścwośc zolacyjnych. 0 Rysunek 6-6. Zmany lośc gazów palnych w okresach czasu (spadek oznacza wykonane odgazowana oleju) RówneŜ stan technczny transformatora ne zaleŝy od czasu eksploatacj [70] tylko od warunków eksploatacj np.: od nesymetrycznych obcąŝeń jednofazowych, przecąŝeń, warunków atmosferycznych, czy występowane wyŝszych harmoncznych w sec elektroenergetycznej [44] Analza porównawcza metod klasycznych Prezentowane w rozdzale 6 zestawena dagnoz uzyskanych róŝnym metodam zestawone razem prezentuje tabela 6-7. Pomnęto tu metodę polską polską pogłęboną jako rozwnęca kodu IEC oraz zalecena eksperta, który to algorytm ne ma na celu postawena dagnozy. Metoda kodu IEC nemecka francuska kanadyjska kodu IEC - (48)64/256/76 (2)26/36/0 (0)79/32/44 nemecka (48)64/256/76 - (6)46/392/0 (0)38/362/44 francuska (2)26/36/0 (6)46/392/0 - (0)39/305/0 kanadyjska (0)79/32/44 (0)38/362/44 (0)39/305/0 - Tabela 6-7. Porównane zgodnośc dagnoz uzyskwanych róŝnym metodam (dla 444 danych); perwsza lczba (w nawase) oznacza metody dają zgodny wynk, ale jako nezdentyfkowane uszkodzene ; druga lczba (wytłuszczona) oznacza obe metody dają zgodny wynk ; trzeca lczba metody dają nezgodny wynk ; czwarta lczba obu metod ne moŝna zastosować dla uzyskanego pomaru

102 02 Metoda kodu IEC nemecka francuska kanadyjska kodu IEC - 4% 28% 8% nemecka 4% - 0% 9% francuska 28% 0% - 3% kanadyjska 8% 9% 3% - Tabela 6-8. Procentowe porównane zgodnośc dagnoz uzyskwanych róŝnym metodam (na podstawe tabel 6-7) Na podstawe tabel moŝna wnoskować, Ŝe nawet stosując jedyne dwe róŝne metody dagnostyczne uzyskuje sę dość rozbeŝne wynk. Jednak wobec dość lcznych przypadków braku dagnozy lub dagnozy oznaczającej uszkodzene nezdentyfkowane pownno sę stosować ( stosuje sę) róŝne metody dagnostyczne, celem uzyskana moŝlwe warygodnego wynku (dagnozy). NaleŜy przy tym pamętać o cechach szczególnych poszczególnych metod podczas stawana ostatecznej dagnozy: metoda nemecka jest bardzo rygorystyczna z tego powodu mało zgodna z pozostałym często ne dająca wynku, a metoda francuska daje ogólne wynk (np.: przegrzana), co jest m.n. przyczyną wększej jej zgodnośc z pozostałym metodam jednak kosztem dokładnośc dagnozy. Gdyby zastosować wszystke 4 metody (opsane w tabelach ), to zgodność uzyskanych dagnoz wynos 30 (z czego 20 to przegrzana, 2 to wyładowana o małej energ 8 to wyładowane zupełne o duŝej energ) na 444 przypadk (czyl necałe 7%). Jest to spora nedogodność w pracy dlatego system ekspertowy [] uŝywający tychŝe metod pownen zostać uzupełnony o metody sztucznej ntelgencj, które ne operają swojego dzałana jedyne na sztywnych regułach jeŝel-to, ale na zborze pomarowych danych uczących Metody nestandardowe Zmodyfkowana metoda a-najblŝszych sąsadów Metoda ta ne opera sę na sztywnych wzorach matematycznych zawartych w regułach jeŝel-to klasycznych metod dagnostycznych, ale na stnejących juŝ danych pomarowych. Polega ona na badanu podobeństwa nowego pomaru do najblŝszych 0 procent pomarów juŝ stnejących w baze danych. Wartość 0% przyjęta została na podstawe lcznych przykładów ksąŝkowych ([u.24], [u.26], [u.29], [u.33], [u.34])

103 wyboru danych z bazy opartej na MS Access. Ne postawono tu formalne problemu optymalzacj wyboru grupy najblŝszych pomarów (tj. wartośc a, co realzowane jest sprawdzanem krzyŝowym [.9]), ponewaŝ metoda ta jest jedyne uzupełnenem do juŝ stosowanych metod. Celem określena podobeństwa nowego pomaru do juŝ stnejących wprowadza sę marę odległośc nowego pomaru od juŝ stnejących. 03 Ops algorytmu: ) Dla nowego pomaru (x p, y p, z p ) w przestrzen trójwymarowej dla kodu IEC wyznaczamy odległośc eukldesowe od stnejących ( o określonej klasyfkacj) N punktów pomarowych (tworzących zbór S N ) o współrzędnych (x, y, z ), gdze =, 2,..., N N>0. =,2,..., N Odl = ( x y, z ); ( x, y, z ) = ( x x ) + ( y y ) + ( z z ) p, p p p p p (6-4) 2) Ze zboru S N punktów pomarowych wyberamy 0% połoŝonych najblŝej względem nowego pomaru tworząc zbór S 0%. Lczność (marę) zboru S 0% oznaczmy jako M przy warunku, Ŝe M > 0. Uwaga: JeŜel jako nowy pomar potraktujemy wynk juŝ stnejący (w ramach testu), to taka odległość ne jest uwzględnana. 3) W zborze S 0% wyznaczamy odległość maksymalną: Odl = max{ j =,2,..., M : max Odl j 4) Dla kaŝdego elementu zboru S 0% określamy marę odległośc jako: Mara = Odl Odl } (6-5) j max j j=,2,..., M (6-6) 5) aŝdy element zboru S 0% naleŝy do pewnej klasy stanów techncznych określonych jako C t, gdze t=,2,...,t T jest lczbą klas. Dla kaŝdej z klas wyznaczamy sumę zgodnośc wszystkch punktów pomarowych naleŝących do danej klasy do nowego punktu pomarowego względem mary odległośc: t=,2,..., T M β = Mara (6-7) Ct j= ( x j, y j, z j ) C t j 6) Wynkem tej metody jest klasyfkacja nowego pomaru (x p, y p, z p ) do takej klasy C t0, Ŝe: β = max{ t =,2,... T : β } Ct 0 Ct (6-8)

104 (jeŝel dwe lub węcej klas posada taką samą maksymalną sumę zgodnośc, to mplementacja metody zwraca klasę perwszą wg alfabetycznej nazwy). 7) Marą jakośc udzelanej odpowedz jest wartość zaufana wyznaczana dla kaŝdej z klas wg wzoru: Z Ct 0 = T β t= Ct 0 β Ct 04 (6-9) ZauwaŜmy, Ŝe wartość M wyznaczana w punkce 2 powyŝszego algorytmu jest wększa lub równa wartośc a w metodze najblŝszych sąsadów. Przykład 6- Nech dany będze N=400 elementowy zbór danych uczących S N. Metoda 40-najblŜszych sąsadów zawsze uwzględna dokładne 40 najbardzej podobnych wynków do nowego wynku pomaru, a zaproponowana metoda 0% najblŝszych sąsadów uwzględna przynajmnej 40 najblŝszych wynków (w przypadku, gdy w tej samej odległośc maksymalnej Odl max jest wele wynków, to uwzględna je wszystke). Dopero zaproponowana w punkce 4 powyŝszego algorytmu Mara j (wzór 6-6) zrówna w dzałanu obe metody poprzez zgnorowane w algorytme wynków znajdujących sę w odległośc maksymalnej Odl max. Jednak metody te będą róŝne, gdy zastosuje sę wzór: Mara e j = M = odl j e odl (6-0) jako wyznaczane mary odległośc, który to jest równeŝ uŝywany [.9] w metodze a najblŝszych sąsadów. Metoda ta w wykonanym oprogramowanu załączonym do pracy zastosowana jest równeŝ w 0-wymarowej przestrzen pomarów stęŝeń gazów polega na wyznaczenu stopna podobeństwa nowego pomaru do juŝ stnejących ( sklasyfkowanych) wg odległośc eukldesowej w tej przestrzen. W przypadku braku wyznaczena wartośc stęŝena danego gazu wymar przestrzen pomarów jest redukowany róŝnca stęŝeń (celem wyznaczena odległośc eukldesowej) dla danego gazu wynos 0 (moŝlwe jest teŝ wyznaczene średnej wartośc pomarów uzyskanych w danym wymarze). Z powodu slnego powązana metody najblŝszych sąsadów z właścwoścam zboru danych charakter dagnozy w przestrzen 0-wymarowej ma jedyne charakter pomocnczy. Celem zgrubnego ustalena jakośc zaproponowanej metody przeprowadzono zestawene polegające na potraktowanu kaŝdego pomaru jako neznanego próba jego klasyfkacj powyŝszym algorytmem dla przestrzen trójwymarowej. Dzęk porównanu rzeczywstej dagnozy (choć wzorowanej na kodze IEC) z dagnozą z zaproponowanego algorytmu uzyskano zestawene w tabel 6-9.

105 Rzeczywsta dagnoza Średne zaufane do dagnozy poprawnej/błędnej Lczba dagnoz 05 poprawnych/błędnych Bez uszkodzeń 44% / 57% 30 / 7 Wyładowana nezupełne o duŝej energ - / 67% 0 / 6 Wyładowana nezupełne o małej energ - / 7% 0 / Wyładowana zupełne o duŝej energ 58% / 53% 4 / 7 Wyładowana zupełne o małej energ - / 69% 0 / 3 Przegrzane o temperaturę < 50 C - / 46% 0 / 2 Przegrzane o temperaturę 50 C C - / 44% 0 / 3 Przegrzane o temperaturę 300 C C 66% / 47% 60 / 2 Przegrzane o temperaturę > 700 C 80% / 52% 84 / 8 Nezdentyfkowane uszkodzene 66% / 58% 75 / 34 Ne moŝna zastosować metody kodu IEC. 78 Tabela 6-9 Zestawene dagnoz zmodyfkowaną metodą a-najblŝszych sąsadów Stosując metodę 0% najblŝszych sąsadów na zborze 366 danych uczących, dla mary odległośc opsanej w punkce 4 algorytmu (wzorem 6-6) moŝna przyjąć, Ŝe zastosowano metodę 36 najblŝszych sąsadów. Z tabel 6-9 moŝna wywnoskować, Ŝe pommo dość wysokej wartośc 36 dla porównań najblŝszych sąsadów dane uczące klasyfkowane jako Przegrzane o temperaturze ponad 700 o C dość dobrze są klasyfkowane z dość duŝą wartoścą zaufana do klasyfkacj, czyl zajmują odrębny obszar w przestrzen danych uczących są w newelkm stopnu wymeszane z danym klasyfkowanym do nnych klas. Znaczne róŝnce w lczbe pomarów danej klasy (2 pomary sklasyfkowane jako Przegrzane o temperaturę < 50 o C 09 pomarów sklasyfkowanych jako Nezdentyfkowane uszkodzene ) równeŝ stotne utrudnają znalezene optymalnej lczby najblŝszych sąsadów Metoda rozmytego kodu IEC Metoda kodu IEC opera sę na określanu przynaleŝnośc nowego pomaru do określonego podobszaru przestrzen 3-wymarowej. Z tego powodu udzelana odpowedź o klasyfkacj ne daje nformacj o tym, jak blsko krawędz danego podobszaru znajduje sę pomar czyl ne mamy nformacj o pewnośc udzelanej dagnozy. W zwązku z tym, Ŝe podobszary w metodze kodu IEC są z góry określone, to ne zostane wprowadzona Ŝadna umowna funkcja ocenająca przynaleŝność wynku do podobszaru. Zamast rozmywana zboru opsującego klasyfkację kodem IEC nech rozmyty zostane wynk pomaru. Przyjęto, Ŝe rezultaty DGA obarczone są błędem

106 pomarowym ±. Iloraz dwóch wynków obarczonych błędem pomaru teŝ jest wyznaczany z pewną dokładnoścą określoną za pomocą metody róŝnczk zupełnej, która polega na wyznaczenu pochodnych cząstkowych (wzór 6-). a + a a f f a a ( a, b) ± f ( a, b) = = ± a + b = ± a + b (6-) b + b b a b b b b f 2 JeŜel dla kaŝdego z trzech wymarów X, Y, Z w przestrzen kodu IEC wyznaczymy dokładność pomaru, to rzeczywsty wynk znajdować sę będze wewnątrz sześcanu o środku w punkce XYZ długoścach ścan odpowedno 2 X, 2 Y, 2 Z (które są wyznaczone za pomocą róŝnczk zupełnej). Stopeń pokryca sę tego sześcanu z obszarem określającym dagnozę metodą kodu IEC daje wyznacznk dotyczący pewnośc udzelanej odpowedz. Na podstawe danych stnejących w baze moŝna wyznaczyć średną wartość pewnośc udzelanej odpowedz dla danej klasy uszkodzena: 06 Rezultat IEC Średne zaufane do dagnozy Lczba dagnoz Bez uszkodzeń 40,68% 33 Wyładowana nezupełne o duŝej energ 9,99% 2 Wyładowana nezupełne o małej energ 4,88% Wyładowana zupełne o duŝej energ 97,50% 20 Wyładowana zupełne o małej energ 70,49% 0 Przegrzane o temperaturę < 50 C 45,8% 29 Przegrzane o temperaturę 50 C C 75,84% 24 Przegrzane o temperaturę 300 C C 82,97% 79 Przegrzane o temperaturę > 700 C 97,0% 94 Nezdentyfkowane uszkodzene 84,89% 64 Błąd. Ne moŝna zastosować metody kodu IEC. 78 Tabela 6-20 Średna wartość zaufana do stawanej dagnozy wg metody kodu IEC Na podstawe analzy tabel 6-8 wdać wyraźne, Ŝe dagnozy Bez uszkodzeń, Przegrzane o temperaturze < 50 C oraz Wyładowana nezupełne o małej energ są dagnozam raczej nepewnym. Dagnozy dotyczące przegrzań o temperaturze > 50 C są pewne, tak jak pewne są dagnozy o wyładowanach zupełnych (wyładowana nezupełne o duŝej energ ze względu na małą lczbę przypadków ne naleŝy traktować w sposób reprezentatywny).

107 Dyskretyzacja Nektóre algorytmy uczena sę reguł (np.: algorytmy konstruowana drzewa decyzyjnego) ne mogą być wykorzystane (lub ch adaptacja wąŝe sę ze znacznym wzrostem nakładów oblczenowych [2]) do klasyfkacj w przypadku, gdy badane obekty opsane są za pomocą loścowych (rzeczywstych) cech (atrybutów) dagnostycznych. MoŜlwe jest jednak wykonane dyskretyzacj, która polega [.20] na zastąpenu wszystkch atrybutów loścowych atrybutam wylczenowym (porządkowym), przy czym kaŝda nowa wartość dyskretna odpowada przedzałow wartośc cągłych zastępowanego atrybutu zachowane jest uporządkowane tychŝe przedzałów. W wynku tego procesu uzyskujemy cechy wylczenowe o skończonej zazwyczaj newelkej (dobranej do zadana) lczbe wartośc, a dzęk temu: - zmnejsza sę złoŝoność oblczeń - algorytmy uczena sę reguł konstruują proste łatwe do nterpretacj reguły, w wynku ch ogólnośc. Sposób wykonana dyskretyzacj moŝna odgórne narzucć lub dopasować do zboru uczącego. Wśród tych drugch wprowadzony jest podzał [.20] na metody: - lokalne globalne - baz nadzoru z nadzorem - zstępujące wstępujące. W metodach globalnych cała dzedzna atrybutu rzeczywstego dzelona jest na równe przedzały odpowadające wartoścom tworzonego atrybutu wylczenowego, czyl nowy atrybut wylczenowy zaleŝy jedyne od zastępowanego atrybutu cągłego. W metodach lokalnych podczas wykonywana przedzałów dyskretyzacj uwzględna sę równeŝ nne atrybuty (a nawet wszystke) nŝ zastępowany atrybut rzeczywsty, w wynku czego uzyskane przedzały są róŝne w róŝnych obszarach dzedzny zastępowanego atrybutu. Szczególne zaznacza sę to w przypadku dagnostyk, gdy dysponujemy zborem uczącym z wykonaną dagnozą to właśne wartość owej dagnozy jest uwzględnana podczas wykonywana dyskretyzacj lokalnej. Metody dyskretyzacj z nadzorem operają sę na znajomośc kategor, do której naleŝą elementy zboru uczącego (np.: dagnozy), a metody bez nadzoru ne uwzględnają owej kategor. Metody zstępujące polegają na zastosowanu podzału dzedzny atrybutu rzeczywstego na coraz to mnejsze przedzały. Metody wstępujące najperw dzelą dzedznę na

108 drobne przedzały zawerające jedną wartość opsującą elementy zboru uczącego występującą w usuwanym atrybuce rzeczywstym, a następne na łączenu przedzałów w wększe. Celem prostego wygenerowana reguł dagnostycznych w oparcu o proces dyskretyzacj określmy pojęce pochodzące z grupowana danych uczących - klastra. Za klaster uwaŝa sę [.20] grupę danych uczących podobnych do sebe ze względu na pewną marę podobeństwa. W analzowanym w pracy zagadnenu uznajmy dyskretną marę tego podobeństwa: klaster tworzy grupa danych naleŝących do pewnego skończonego obszaru, która to grupa jest jednej kategor. W przypadku, gdy przynajmnej jeden element z danych uczących naleŝący do wybranego obszaru jest nnej kategor nŝ pozostałe uznajemy, Ŝe elementy ne są do sebe podobne ne tworzą klastra. JeŜel w analzowanym obszarze brak elementów zboru uczącego, to klaster nazwjmy pustym. Dzęk takemu określenu pojęca klastra wykonane dyskretyzacj spowoduje wygenerowane reguł jeŝel-to, które brzmą: JeŜel nowy, klasyfkowany obekt naleŝy do wybranego obszaru, to jest on tej klasy co wszystke, znane uprzedno elementy uczące naleŝące do tego obszaru (a jeŝel ne ma ch wcale, to ne jest on klasyfkowany). 08 Ops zastosowanego algorytmu: ) Określamy skończoną n-wymarową (dla n ℵ) przestrzeń taką, Ŝe: P n n n = xmn, xmax... xmn, xmax R (6-2) w której zawarte są wszystke n+ wymarowe dane uczące x naleŝące do k kategor (klas), take Ŝe: n n x xmn, xmax... xmn, xmax { klasa,..., klasak} (6-3) Nech O będze zborem rozłącznych obszarów C takch, Ŝe: C C j =, j =,2,..., O (6-4) o U = C = (6-5) P 2) Nech P będze perwszym obszarem do określena, czy znajdujące sę w nm dane tworzą klaster. 3) Czy wszystke obszary ze zboru O wyodrębnają grupy danych uczących naleŝących do jednej klasy (czy dane uczące zawarte w kaŝdym z obszarów tworzą klaster)? JeŜel tak, to ONIEC.

109 4) aŝdy z obszarów C, który ne jest klastrem, nech zostane podzelony na mnejsze obszary tak, Ŝe kaŝdy przedzał wyznaczający ów obszar, dzelony jest na pół (na przedzały lewostronne domknęte; w przypadku podzału przedzału obustronne domknętego, na przedzał lewostronne domknęty przedzał obustronne domknęty). Podzelone obszary, które ne są klastram nech zostaną usunęte ze zboru O, a ch mejsce nech zajmą uzyskane obszary z ch podzałów. Wykonać punkt 3 algorytmu ponowne. Algorytm moŝna rozszerzyć na dane uczące zawerające równeŝ atrybuty wylczenowe. 09 Jako sprawdzene dzałana tego algorytmu uŝyto trójwymarowej przestrzen P wyznaczonej (omówono w rozdzale 7) dla kodu IEC takej, Ŝe: P= 0; 3, , ; 2, , ; 2,769 (6-6) Zastosowano teŝ 240 przykładowych (omówono w rozdzale 7) danych uczących. W wynku wykonana algorytmu dyskretyzacj opsanego w tym rozdzale uzyskano 82 reguły jeŝel-to, które potrafły skuteczne dagnozować wszystke dane uczące. X Y Z Dagnoza Lczba pomarów <0; 0,025) <9,4684; 2,6> <7,23; 8,0266) Przegrzane powyŝej 700 C 5 <0; 0,025) <0,0736; 0,75) <0,6677; 0,8665) Wyładowana nezupełne o 5 małej energ <0; 0,025) <,6394; 2,0309) <2,4577; 2,8555) Przegrzane powyŝej 300 C 4 ponŝej 700 C <0; 0,025) <0,2693; 0,465) <0,6677; 0,8665) Bez uszkodzeń 4 <0; 0,025) <5,5539; 6,3368) <9,678; 2,8> Przegrzane powyŝej 700 C 4 <0; 0,025) <,0523;,248) <6,0378; 6,4355) Przegrzane powyŝej 700 C 4 Tabela 6-2 Dyskretyzacja przestrzen kodu IEC 6 obszarów, do których naleŝy najwęcej danych uczących DuŜa lczba uzyskanych reguł śwadczy o złoŝonośc zboru uczącego. Jest równeŝ kłopotlwa w nterpretacj przez człoweka. Dodatkowo uzasadnene wykonanej dagnozy nowego pomaru jest słabe z powodu newelkej lczby danych uczących naleŝących do wyodrębnonych podobszarów (tabela 6-2). Jedyne co moŝna wywnoskować na podstawe tak wykonanego podzału jest względna łatwość klasyfkacj danych do klasy Przegrzane powyŝej 700 C.

110 Drzewo decyzyjne Drzewo decyzyjne jest zestawem węzłów (warunków podejmowana decyzj) gałęz (moŝlwych warantów decyzj), które w swojej konstrukcj zawera reguły jeŝelto. Węzły drzewa zawerają testy na wartoścach atrybutów wylczenowych, gałęze drzewa zawerają wartośc tychŝe atrybutów, a lśce drzewa część decyzyjną (realzującą klasyfkację, tu zawerające dagnozę). Algorytm konstrukcj drzewa decyzyjnego polega ma na celu wykonane takej konstrukcj drzewa (dzęk wyznaczanu entrop) Ŝeby wykonać moŝlwe mało węzłów, lśc oraz Ŝeby odległośc (merzone w lczbe węzłów) mędzy korzenem drzewa (perwszym z węzłów), a lśćm były moŝlwe małe. Ops zastosowanego algorytmu: ) Nech będze dany zbór danych uczących P określonych przez n atrybutów wylczenowych jeden przyjmujący wartośc klasy n n n P = { x, x2,..., xm } { x, x2,..., xm2}...{ x, x2,..., xmn} { klasa, klasa2,..., klasak}, (6-7) gdze k jest lczbą klas, ml lczbą wartośc dyskretnych dla l-tego atrybutu l =,2,..., n. Nech P = będze lcznoścą zboru takch danych uczących, które dla l-tego l l x q wymaru przyjmują wartość l l l l x, taką Ŝe x x, x,..., x }. l q q { 2 ml Nech P = będze lcznoścą zboru takch danych uczących, które dla l- klasar l l xq tego wymaru przyjmują wartość l l l l x, taką Ŝe x x, x,..., x } oraz przyjmują wartość l q q { 2 ml klasa klasa, klasa,..., klasa }, gdze r=,2,,k k jest lczbą klas. r { k 2) Dla kaŝdego atrybutu l z n atrybutów wylczenowych wyznaczmy wartość entrop zgodne ze wzorem 6-8. E ( P) = l ml P k l l = xq P q= r = P P klasa l l = x q l q l = x r P klasa l l = x 3) Wyberamy atrybut l 0, dla którego wyznaczona wartość entrop ( P) log 2 P q l q l = x r El o (6-8) najmnejsza. Dla zboru P będze ona tworzyć korzeń drzewa, a wychodzące z nego gałęze drzewa tworzyć będą wartośc z atrybutu l 0. jest

111 0 4) Dla kaŝdej wartośc x l q (gdze q=,2,,ml 0 ) atrybutu l 0 wyberamy zbór 0 danych uczących P = l, które dla atrybutu l 0 0 przyjmują wartość x. JeŜel wszystke l 0 x q elementy tego zboru są jednej klasy, to tworzymy lść drzewa kończąc algorytm. JeŜel tak ne jest, to uznajemy za zbór uczący P zbór P = l wykonujemy punkt 2. 0 W wynku przeprowadzena algorytmu konstrukcj drzewa decyzyjnego uzyskujemy uproszczoną reprezentację zboru reguł uzyskanych w wynku dyskretyzacj. Ta uproszczona forma prezentacj umoŝlwa takŝe redukcję lczby reguł, jeŝel okaŝe sę, Ŝe na ty samym pozome drzewa na sąsednch gałęzach lśce są tej samej klasy. Przykład 6-2 l 0 x q l q { } Nech będze dany 4-elementowy zbór uczący P={ 0,) ;czarny,,2);nebesk, { 2,3);nebesk}, { 3,4,czarny}}, którego elementy opsują podzał (po dyskretyzacj) przedzału, 4 naleŝą do zboru klas {czarny, nebesk}. W wynku konstrukcj drzewa decyzyjnego otrzymujemy: { } JeŜel badana wartość x naleŝąca do przedzału, 4 naleŝy do obszaru - 0,) to jest klasy czarny. -,2) to jest klasy nebesk. - 2,3) to jest klasy nebesk. - 3, 4 to jest klasy czarny. PonewaŜ wartośc dyskretne uzyskane w wynku dyskretyzacj na tym samym pozome gałęz opsują kolejne przedzały są tej samej klasy lśce na nch, to moŝna połączyć gałęze uzyskując redukcję lczby reguł. Dla przykładu: JeŜel badana wartość x naleŝąca do przedzału, 4 naleŝy do obszaru - 0,) to jest klasy czarny. -,3) to jest klasy nebesk. - 3, 4 to jest klasy czarny. Jako sprawdzene dzałana tego algorytmu uŝyto trójwymarowej przestrzen P wyznaczonej (omówono w rozdzale 7) dla kodu IEC opsanej wzorem 6-6 podzelonej na 82 podobszary w wynku dyskretyzacj dla 240 przykładowych (omówono w rozdzale 7) danych uczących. W wynku wykonana algorytmu budowy drzewa decyzyjnego oraz redukcj zawartych w konstrukcj drzewa reguł uzyskano ostateczne 2 reguł jeŝel-to, które potrafły skuteczne dagnozować wszystke dane uczące. Pommo znacznej redukcj lczby praw względem dyskretyzacj, nadal uzyskujemy wele reguł, co wynka ze złoŝonośc zboru uczącego.

112 Budowane reguł za pomocą algorytmu genetycznego Algorytm dyskretyzacj budowane w oparcu o nego drzewo decyzyjne moŝe ne prowadzć do znacznej redukcj lczby reguł jeŝel-to uŝywanych do klasyfkacj w przypadku zboru trudnoseparowalnych danych. Wobec tego warto sprawdzć, czy algorytm redukcj lczby reguł oparty na algorytme genetycznym [58] potraf dokonać tego skuteczne. W odróŝnenu od drzewa decyzyjnego ne przeprowadz on wyboru jednego z argumentów opsujących dane uczące na korzeń drzewa, co powoduje pewne uporządkowane reguł jeŝel-to za względu na ów argument. Algorytm genetyczny w sposób losowy, choć ukerunkowany przeszuka zbór moŝlwych wartośc argumentów opsujących dane uczące postara sę wybrać moŝlwe najbardzej charakterystyczne ne dla całego zboru uczącego, ale dla całej klasy. Zbór uczący zostane podzelony na rozłączne podzbory zawerające dane pomarowe jednej klasy dla kaŝdego z nch algorytm genetyczny postara sę odnaleźć moŝlwe reprezentatywny zestaw atrybutów. Po zakończenu pracy algorytmu dane uczące posadające owe, wyselekcjonowane cechy zostaną odrzucone ze zboru reprezentantów danej klasy, a na pozostałych algorytm zadzała ponowne. Procedura powtórzy sę, aŝ do wyselekcjonowana zestawu wartośc cech charakterystycznych dla danej klasy. Ops zastosowanego algorytmu: ) Nech będze dany zbór danych uczących P określonych przez n atrybutów wylczenowych jeden przyjmujący wartośc klasy n n n P = { x, x2,..., xm } { x, x2,..., xm2}...{ x, x2,..., xmn} { klasa, klasa2,..., klasak}, (6-9) gdze k jest lczbą klas, ml lczbą wartośc dyskretnych dla l-tego atrybutu l =,2,..., n. Zbór danych uczących P podzelmy na k rozłącznych podzborów ze względu na wartośc atrybutu opsującego klasę. klasa U k P = Pklasa Pklasa... Pklasa = P, gdze 2 k klasar r= n n n { x, x2,..., xm } { x, x2,..., xm2}...{ x, x2,..., xmn} { klasar P r = } (6-20) Przyjmujemy, Ŝe wartość r= (gdze r=,2,,k k jest lczbą klas). 2) Dla ustalonej wartośc r dzelmy zbór P na dwa zbory: zbór elementów POS klasyfkowanych jako klasa r zbór pozostałych elementów (NEG). POS = P klasar NEG = P / (6-2) 3) Wszystke wartośc wylczenowe z przestrzen n-wymarowej, które przyjmują dane uczące, kodujemy jako geny (przyjmujące wartość 0 lub ) na kolejnej pozycj w P klasar

113 chromosome - począwszy od wartośc z perwszego wymaru, a skończywszy na wartoścach z n-tego wymaru (wzór 6-22) n n n chrom= x, x2,..., xm, x, x2,..., xm2,... x, x2,..., x (6-22) mn Zapsane wartośc w gene na danej pozycj chromosomu, do której przypsana jest wartość z atrybutu postac: 3 t xs oznacza zakodowane reguły jeŝel-to (zwanej kompleksem) JeŜel badany obekt przyjmuje dla t-tego atrybutu wartość t x s, to jest on klasy r. MoŜlwe jest teŝ zakodowane w chromosome węcej nŝ jednej wartośc genu. JeŜel geny te występuję w jednym atrybuce, to pomędzy nm w regule jeŝel-to (nadal nazywanej kompleksem) wstawany jest operator logczny OR, a jeŝel geny występują w róŝnych atrybutach AND. Przykład 6-3 Nech będze zakodowanych w chromosome 6 genów: x 0,), x,2), x 2, 3, y 0,20), y 20,25), 25, 30 0,3 0,30. y będących wynkem dyskretyzacj przestrzen: Chromosom o zapse genów 000 oznacza regułę jeŝel-to: JeŜel nowy, badany obekt opsany przez (x,y) spełna warunk take, Ŝe x 0,) x 2,3 y 20,25, to badany obekt jest badanej klasy r (gdyŝ naleŝy do ( ) ) zboru POS). POS NEG WPOS Cl( Pos ) + W NEG NEG Cl( Neg j ) = f chrom = ( ) =, gdze W POS + W NEG + W POS R, POS NEG + W NEG R - wag określające stotność poprawnej klasyfkacj chrom bnarna reprezentacja chromosomu POS ℵ, NEG ℵ - lczność zborów POS NEG Cl(Pos )= - gdy -ty element zboru POS jest klasyfkowany { 0 - gdy -ty element zboru POS ne jest klasyfkowany POS ( ) Cl Pos - lczba klasyfkowanych elementów zboru POS = Cl(Neg j ) - gdy j-ty element zboru NEG jest klasyfkowany { = 0 - gdy j-ty element zboru NEG ne jest klasyfkowany NEG j = Cl ( ) Neg j - lczba klasyfkowanych elementów zboru NEG (6-23) Algorytm genetyczny ma na celu take dobrane zestawu wartośc, Ŝeby opsywały one moŝlwe duŝo elementów zboru POS moŝlwe mało za zboru NEG. Najlepszym

114 rozwązanem jest znalezene przez algorytm genetyczny takego prawa, które klasyfkuje jako klasę r wszystke dane uczące ze zboru POS Ŝadnych danych ze zboru NEG. Zadane to zakodowane jest jako próba maksymalzacj (na tyle na le moŝe zrealzować zadane optymalzacj algorytm genetyczny, co było opsane w rozdzale 3) funkcj przystosowana danej wzorem Określamy parametry pracy algorytmu genetycznego: a) prawdopodobeństwo mutacj: na tworzony chromosom b) prawdopodobeństwo krzyŝowana jednopunktowego: 00% c) maksymalna lczba generacj: 200 d) lczba osobnków w generacj: 30 e) selekcja ruletkowa f) prawdopodobeństwo zostana rodzcem (wg wzoru 3-). Wykonane oprogramowane dopuszcza uŝyce jeszcze jednej funkcj przystosowana, która moŝe jednak przyjąć wartość zero w takm przypadku chromosom uznany jest za martwy odbywa sę jego kolejne generowane jak w populacj startowej. W raze takego losowana przystosowane moŝe nadal wynosć zero, węc ustala sę jako dodatkowy parametr pracy algorytmu genetycznego lczbę takch prób oŝywena chromosomu. Dzałane algorytmu z taką funkcją okazało sę gorsze nŝ z podaną wzorem 6-23 dlatego ne będze szerzej omawane w pracy. Ustalamy wartośc uzyskana generacj startowej algorytmu: a) prawdopodobeństwo wylosowana jedynk w gene: 50% b) le do generacj startowej wprowadzć danych uczących tzw. hpotez ze zboru POS (loścowo lub procentowo): 0 - co oznacza brak hpotez Uruchamamy algorytm genetyczny z zadanym parametram uzyskujemy z nego najlepej przystosowanego osobnka, który koduje w swoch genach prawo jeŝel-to. Wszelke elementy ze zboru POS, które są klasyfkowane uzyskanym prawem (kompleksem), usuwane są ze zboru POS algorytm genetyczny uruchamany jest ponowne. Tworząc kolejny kompleks, który jest zborem wartośc atrybutów wylczenowych połączonych ze sobą operatorem logcznym AND, dodajemy go do poprzednego z uŝycem operatora logcznego OR tworząc tzw. sympleks. Powtarzane

115 algorytmu genetycznego trwa tak długo, aŝ zbór POS będze pusty uzyskamy sympleks, który potraf poprawne klasyfkować wszystke dane uczące klasy r. 4) JeŜel r=k, to ONIEC uzyskano k sympleksów klasyfkujących dane uczące. JeŜel r<k, to r=r+ wykonaj punkt 2. 5 Dla przykładowego zboru 240 danych uczących (umeszczonych w 3-wymarowej przestrzen zgodne z kodem IEC) uzyskano 9 praw (sympleksów) po jednym prawe dla kaŝdej z dzewęcu klas. W obrębe tychŝe praw wyróŝnono przykładowo (gdyŝ kaŝde uruchomene algorytmu genetycznego moŝe generować nny wynk) łączne 29 kompleksów (tabela 6-22). JeŜel to { Χ <0; 0,050) Χ <0,403; 0,609) } { Υ <0,2693; 2,2266) Υ <2,4223; 3,2052) Υ <3,5967; 7,97) Υ <7,9026; 2,6) } { Ζ <3,65; 2,8> } { Χ <0; 0,003) } { Υ <,4437; 2,2266) Υ <2,4223; 2,838) Υ <3,4009; 3,988) } { Ζ <3,2533; 6,0378) Ζ <6,4355; 7,23) } { Χ <0; 0,050) } { Υ <,6394; 3,988) } { Ζ <4,0488; 4,8444) Ζ <6,0378; 2,8> } { Χ <0; 0,050) } { Υ <,248;,4437) Υ <5,5539; 7,9026) } { Ζ <2,8555; 3,452) Ζ <6,4355; 2,8> } { Χ <0,050;,605) } { Υ <0,0736;,0523) } { Ζ <0,4688; 0,8665) Ζ <4,8444; 6,0378) } Przegrzane powyŝej 700 C. Tabela 6-22 Przykładowa reguła jeŝel-to uzyskana jako zaps pęcu kompleksów, składających sę z 22 praw elementarnych jeŝel-to ze względu na zastosowane operatora logcznego OR Marą jakośc pracy algorytmu genetycznego nech będze fakt wyszukana jako zaps 29 kompleksów w sume 94 stotnych reguł elementarnych jeŝel-to, które potrafły poprawne klasyfkować wszystke 240 danych uczących, a które to prawa brzmą: JeŜel X naleŝy do przedzału X Y naleŝy do przedzału Y Z naleŝy do przedzału Z, to element jest klasy k. Dzęk łączenu reguł elementarnych w wększe kompleksy dzęk uŝycu operatora logcznego OR człowek moŝe łatwej spróbować dokonać nterpretacj uzyskanej wedzy poprzez uproszczene zapsu kompleksów w wynku połączena w wększe przedzały przedzałów sąsednch połączonych operatorem OR. Jak wdać z wynków przeprowadzonych oblczeń algorytm genetyczny ma zdolność do przedstawena znaczne uproszczonego zapsu reguł jeŝel-to. NaleŜy teŝ zwrócć uwagę, Ŝe ze względu na uŝyty wzór 6-23 algorytm genetyczny ne daje gwarancj uzyskana praw klasyfkujących poprawne wszystke dane uczące w jednym przebegu stąd koneczność jego ponawana dla coraz to mnej lcznego zboru POS.

116 NaleŜy teŝ meć śwadomość, Ŝe dla kaŝdej klasy wyodrębnane są zbory POS NEG na nch pracuje algorytm genetyczny. Tak węc moŝe dojść do sytuacj, Ŝe skonstruowane przez algorytm genetyczny reguły opsane są na przedzałach nachodzących na sebe, a ne rozłącznych jak w przypadku przetwarzanych przez drzewo decyzyjne. Drzewo decyzyjne dzęk rozgałęzenom poszczególnych gałęz drzewa tworzy rozłączne obszary przyporządkowanych m reguł jeŝel-to dla całego zboru uczącego, poprzez wyberane do węzłów drzewa atrybutów nosących najwęcej nformacj. Tymczasem zaproponowany algorytm genetyczny dla jednej z klas moŝe uznać stotność jednego z atrybutów, a dla nnej nnego. Zwłaszcza w obszarach, gdze brak jest danych uczących w których człowek moŝe uogólnać uzyskane reguły, moŝe dojść do sytuacj nakładana sę na sebe obszarów z przypsanym m regułam wykonującym klasyfkację do róŝnych klas. W takej sytuacj, Ŝeby wyznaczyć klasę, do której naleŝy badany obekt naleŝy posłuŝyć sę pojęcem gęstośc: m mnejszy obszar, którego dotyczy reguła m węcej w nm przykładowych danych uczących tym klasyfkacja jest pewnejsza (wzór 6-24). POS = x ρ ( ) POS Cl kompleks = ( kompleks) = 2 xkompleks xkompleks ( Pos )... x n kompleks Cl Pos - lczba klasyfkowanych przez kompleks danych ze kompleks zboru POS 2 n x... x - n-wymarowa objętość kompleksu jako kompleks kompleks kompleks loczyn długośc przedzałów budujących dyskretne wartośc x n 6 (6-24) Sec Pedrycza Podobne jak opsany w poprzednm podrozdzale algorytm genetyczny, tak seć neuronowa Pedrycza (opsana w podrozdzale 4.4) opera swój proces uczena sę (a przez to wbudowywana reguł jeŝel-to w swoją strukturę) o rozłączne zbory POS NEG (wzór 6-2) wyodrębnone dla danej klasy r (wzór 6-20). Proces uczena z nadzorem takej sec oparty jest na zmodyfkowanym algorytme wstecznej propagacj (wzór 4-29). Proces uczena r sec jednowyjścowych jest mnej złoŝony oblczenowo nŝ próba uczena jednej sec r-wyjścowej (m.n. ze względu na modyfkowane wag neuronów po jednorazowej prezentacj danych uczących lub po prezentacj epok, czyl

117 wszystkch danych uczących) z tego powodu zbór danych uczących r-krotne zostane podzelony na zbory POS NEG. Dla analzowanego zboru 240 danych uczących przyjęto [75] nną metodę dyskretyzacj. aŝda z danych X,Y,Z opsujących stęŝane gazów w metodze IEC (wzór 6-2), podzelona została na 4 rozłączne przedzały o wartoścach (tabela 6-) jak podczas klasyfkacj metodą kodu IEC, tj. 0, 0.), 0., ),, 3, wększa nŝ 3. odowane współrzędnych XYZ dla danej pomarowej po dyskretyzacj wykonywane jest na 2-u wartoścach bnarnych. Tak węc lczba neuronów wejścowych sec Pedrycza wynos 24. Wartośc wag nech będą bnarne, wartość współczynnka nauczana (4-29) nech wynos 0,9. Czas nauczana nech wynos od 00 do 50 epok, obcęce zbędnych połączeń (poprzez wyzerowane wag) co 0 epok. Wynk [75] uzyskane tą metodą prezentuje tabela lasa stanu techncznego Bez uszkodzeń Wyładowana nezupełne o małej energ Wyładowana nezupełne o duŝej energ Wyładowana zupełne o małej energ Wyładowana zupełne o duŝej energ Przegrzane o temperaturę mnejszą nŝ 50 0 C Przegrzane o temperaturę (50 0 C, C Przegrzane o temperaturę (300 0 C, C Przegrzane o temperaturę wększą nŝ C Zaps prawa xxxxxxxxxx xx0x0xx0xxx 0xxxxxxxxx xxxxxxxxx x00x0xxxxxx xxxxxxxxxx x0xxxx0xxxx x0xxxxxxxx xx0xxxxxxx x0xxxxxxxx xxxxxxxxxx xxxxxxxxxx xxxxxxx0x0 00xxxxx0xxx xxxxxxxxxx 0xxxxxxxxx xxxxxx00x0 x00xxxxxxx xxxxxxxxxx xxxxxxxxxx0 xxxxxxxxxx xxx0xxxxxx xxxxxxxxx xxxxxxxxxx xxxxx0xxx0x xxxxxxxxx Nezdentyfkowane uszkodzene xxxxxxxxxxx xxxxxxxx0xx xxxxxx0xxxx xxxxxxxxxx xxxxxxxxxx xxxxxxx0xxx xxxxxxxxxxx xxxxxx00xxx0 Tabela Wynk uczena sec jednowyjścowych Pedrycza, gdze oznacza, Ŝe wejśce mus meć wartość, 0 Ŝe wejśce mus meć wartość 0, x dowolna wartość, Ŝeby zaszła dana klasyfkacja; pomędzy podanym symbolam zachodz logczna zaleŝność AND. 7 JeŜel Χ <0; 0,) Υ > 0. Ζ > 3 Χ <0.; ) Υ <; 3> Ζ > 3 Υ <0.; ) Ζ <0; 0.) Χ <; 3> Υ <; 3> Ζ <; 3> Χ <0.; ) Υ <0.; ) Ζ <0.; > to Przegrzane powyŝej 700 C. Tabela 6-24 Przykładowa reguła jeŝel-to uzyskana odkodowanego zapsu z tabel 6-23

118 8 Uzyskana w postac zbudowanych reguł jeŝel-to wedza odkodowana ze struktury sec Pedrycza umoŝlwa dokonane klasyfkacj przykładowych 240-u danych pomarowych. Rzeczywsta dagnoza Lczba dagnoz poprawnych/błędnych/ nejednoznacznych Bez uszkodzeń 3/0/32 Wyładowana nezupełne o duŝej energ /0/5 Wyładowana nezupełne o małej energ 0/0/ Wyładowana zupełne o duŝej energ 6/0/5 Wyładowana zupełne o małej energ 0/0/3 Przegrzane o temperaturę < 50 C 0/0/2 Przegrzane o temperaturę 50 C C 2/0/ Przegrzane o temperaturę 300 C C 4/3/3 Przegrzane o temperaturę > 700 C 9/0/74 Tabela 6-25 Zestawene dagnoz stanu techncznego wg struktur sec Perdycza (pomnęto klasyfkację do klasy nezdentyfkowane uszkodzene, gdyŝ występowała ona w nemalŝe 00% przypadków, co ne wnos znaczącej wedzy do rozwązywanego zadana) Wadą zastosowanej dagnostyk jest fakt stosunkowo często uzyskwanej nejednoznacznej klasyfkacj danych pomarowych, gdy jeden komplet danych pomarowych był klasyfkowany do klku klas stanu techncznego (tabela 6-25). Fakt ten wynka z zastosowanego algorytmu uczena klku sec o jednym sygnale wyjścowym, a ne jednej sec generującej klka sygnałów na wyjścach. Pommo, Ŝe w 34 strukturach sec (tabela 6-23) zapsano nformacje o 48 rozłącznych obszarach przestrzen danych, w których moŝlwa jest ch klasyfkacja, to nejednoznaczność udzelanej odpowedz wydaje sę być znaczącym utrudnenem w praktycznym zastosowanu tej metody.

119 9 7. Genetyczny wybór reguł rozmytych na przykładze wspomagana dagnostyk transformatora 7.. Postawene problemu Zaproponowane w rozdzale 5 algorytmy dotyczące generowana reguł jeŝel-to wykonywana nm klasyfkacj w przestrzenach n-wymarowych dopasowane zostaną do 3-wymarowej przestrzen danych XYZ. W przestrzen tej zostaną umeszczone poprawne (tj. bez wątplwośc lub potwerdzone oględznam transformatora) sklasyfkowane przez człoweka-eksperta wynk pomarów stęŝeń gazów palnych rozpuszczonych w oleju transformatorowym uzyskane metodą chromatograf gazowej DGA (opsanej w rozdzale 6.2). Jako wartośc klasy uŝyte zostaną wartośc charakterystyczne dla podstawowej metody dagnostycznej metody kodu IEC (tabela 6-2 rysunek 6-3). Do konwersj wynków DGA w 3-wymarową przestrzeń XYZ zostaną uŝyte wzory charakterystyczne dla metody kodu IEC (opsane wzorem 6-2). Stosując algorytmy opsane w rozdzale 5, ale dostosowane do przestrzen 3- wymarowej utworzone zostaną reguły klasyfkujące uwzględnające wedzę człoweka-eksperta (poprzez dagnozy wykonane przez nego). Następne lczba tychŝe reguł zostane zredukowana algorytmem genetycznym opsanym w rozdzale 5.3 dostosowanym do dzałana w przestrzen 3-wymarowej. Dopero stotna redukcja lczby reguł moŝe ułatwć, a nawet umoŝlwć człowekow fzyczną nterpretację ch znaczena. Praktyczne zastosowane algorytmów opsanych w rozdzale 5 dla wykonana dagnostyk stanu techncznego transformatora ne tylko umoŝlw rozwązane praktycznego problemu, ale równeŝ umoŝlw stworzene prototypu praktycznego narzędza do wykonywana dagnoz w oparcu o wynk DGA systemu Trafo2000 (opsanego w rozdzale 8).

120 Przygotowane zboru danych uczących Na potrzeby tej pracy uzyskano wynk 444 pomarów DGA dla 27-u transformatorów secowych 250MVA. Pomary te obejmują 0 atrybutów - stęŝeń gazów takch jak: H 2 - wodór, CH 4 - metan, C 2 H 2 - acetylen, C 2 H 4 - etylen, C 2 H 6 - etan, CO, CO2, C3H8, C3H6, n-c4h0 oraz dodatkowo datę wykonana pomaru dagnozę postawoną przez człoweka-eksperta (rysunek 7-). Rysunek 7-. Uzyskwane zboru danych pomarowych Przyjęto stnene dzewęcu klas (wg kodu IEC), do których moŝe być sklasyfkowany dany pomar: Bez uszkodzeń, Wyładowana nezupełne o małej energ, Wyładowana nezupełne o duŝej energ, Wyładowana zupełne o małej energ, Wyładowana zupełne o duŝej energ, Przegrzane ponŝej 50 0 C, Przegrzane powyŝej 50 0 C ponŝej C, Przegrzane powyŝej C ponŝej C, Przegrzane powyŝej C. Do dzewęcu klas opsujących stan technczny wg kodu IEC została dodana jeszcze jedna o nazwe Neznany. Wartość taka oznacza, Ŝe dla danego pomaru: - człowek-ekspert podejrzewa początk rozwjającego sę uszkodzena, ale ne moŝe dokładne stwerdzć jakego, gdyŝ stęŝena gazów są jeszcze zbyt małym wartoścam; - transformator jest po operacj odgazowana oleju stosunk stęŝeń mogą być mylące; - człowek-ekspert uznaje, Ŝe na wynk DGA ma wpływ klka rodzajów uszkodzeń.

121 Do przekształcena wynków posadanych pomarów w 3-wymarową przestrzeń danych, na której dzała metoda kodu IEC naleŝy uwzględnć jedyne 5 gazów (wzór 7- uprzedno 6-2). 2 x = C H C H , y = CH H 2 4, z = C H C H (7-) Ne wszystke dane posadają kompletne wynk pomarów - ze względów fzyko-chemcznych ne zawsze udaje sę otrzymać poŝądany wynk stęŝena gazu w badanej w chromatografe meszance. Nektóre pomary ne dadzą sę konwertować w przestrzeń XYZ zgodne ze wzorem 7-, gdy przynajmnej jedno ze stęŝeń C 2 H 4, H 2, C 2 H 6 przyjmuje wartość 0. Ze zboru 444 danych pomarowych, 32 danych jest sklasyfkowanych w sposób pewny (dane ne naleŝą do klasy "Neznany"), a w tym zborze stneje 257 danych pomarowych, które moŝna umejscowć w przestrzen XYZ. Zbór poprawne sklasyfkowanych przekonwertowanych danych znajduje sę w przestrzen: 0; 3, , ; 04,667 0, ; 2,769 prezentowany jest na rysunku 7-2. Rysunek 7-2. Zbór danych pomarowych w przestrzen 3-wymarowej. Na rysunku 7-2 moŝna zauwaŝyć, Ŝe dane o duŝych wartoścach y są nelczne. Z tego powodu zbór danych został podzelony na dwa podzbory: - dane, dla których wartość y <= 2,76; - dane, dla których wartość y > 2,76. - Perwszy ze zborów umeszczony jest w przestrzen:

122 22-0; 3, , ; 2, , ; 2,769 - a drug w przestrzen: - 0; 0, ,6667; 04,667,423246; 8,325. Drug z tych zborów zawera newelką lczbą danych pomarowych: 7, a perwszy z nch: 240. Drug ze zborów zawera główne wynk pomarów dotyczących jednego transformatora wynk te zostaną odrzucone jako szczególny przypadek w zborze danych. Rysunek 7-3. Zbór 240-u danych uczących w przestrzen 3-wymarowej Po tych modyfkacjach uzyskano zbór 240 pomarów (rysunek 7-3), który od tej chwl jest traktowany jako zbór przykładów uczących D umeszczony w baze faktów systemu Trafo2000 (rozdzał 8). Zbór ten jest dobrze określony jeŝel dwa, róŝne pomary mają te same wartośc x, y, x, to są tej samej klasy Generowane reguł Na podstawe nformacj zawartych w zborze uczącym D określć naleŝy rozmyte reguły jeŝel-to, które potrafą poprawne sklasyfkować wszystke dane uczące. Celem zastosowana algorytmów je generujących (zaprezentowanych w rozdzale 5) współrzędne (x, y, z) opsujące dany transformator przekształca sę, aby naleŝały do przestrzen będącej sześcanem jednostkowym (adaptacja wzoru 5-3). W celu konwersj danych do przestrzen 0, 0, 0, stosuje sę wzory (7-2), (7-3) (7-4).

123 23 nowy x x =, N max nowy y y =, N max nowy z z =, N max mn{ x} { x } mn{ x } mn{ y} { y } mn{ y } mn{ z} { z } mn{ z } (7-2) (7-3) (7-4) gdze N jest lczbą obektów uczących, mn{x } = mn{x : =,2,...,N}, mn{y }=mn{y : =,2,...,N}, mn{z }=mn{z : =,2,...,N}, max{x }=max{x : =,2,...,N}, max{y }=max{y : =,2,...,N}, max{z }=max{z : =,2,...,N} Uzyskany z powyŝszej konwersj sześcan jednostkowy (zbór danych uczących D zaadaptowany do przestrzen 3-wymarowej wg perwotnego wzoru 5-3) jest dzelony na podobszary rozmyte A A A X wyznaczone (adaptacja wzoru 5-4) przez jy trójkątne funkcje przynaleŝnośc (rysunek 5-7-4) dane wzoram 7-5, 7-6, 7-7. µ X(x) * = max { - x - a / b, 0 } gdze =,..., (7-5) µ jy(y) = max { - y - a j / b, 0 } gdze j =,..., (7-6) µ kz(z) = max { - z - a k / b, 0 } gdze k =,..., (7-7) kz gdze a = ( - ) / ( - ), a j = (j - ) / ( - ), a k = (k - ) / ( - ), b = / ( - ) dla, j, k = (, 2,..., ) jest numerem podzału. * Funkcje przynaleŝnośc określone są tym samym wzorem tylko kaŝda z nch na nnym wymarze. W celu lepszego ch opsana są one ndeksowane poprzez X, Y Z dla zaznaczena wymaru, na którym wykonują odwzorowane.

124 Rysunek 7-4. Podobszar rozmyty A 6 X A5 Y A w przestrzen trójwymarowej 4Z wyznaczony przez trójkątne funkcje przynaleŝnośc 7 7 µ 6 X : 0, R, µ 5Y : 0, R, µ : 0, R (wykresy tych funkcj są narysowane w prezentowanej przestrzen w 7 4Z sposób umowny, z powodu braku moŝlwośc zaznaczena na rysunku kolejnych wymarów). Do kaŝdego podobszaru A A A X przypsana jest reguła rozmyta jeŝel-to R jk jy kz słuŝąca do klasyfkacj danych, która brzm: "JeŜel nowy obekt Q=(x, y, z) naleŝy do danego podobszaru A A A X jy kz (gdze,j,k,2,..., - lczba podzałów ), to jest on klasy C jk z pewnoścą µ X(x) µ jy(y) µ kz(z) CF jk ". gdze klasa C jk jest klasą ze zboru wszystkch klas CT, co zapsujemy C jk CT (dla T=, 2,...,M M - lczba klas) CF jk R + {0}. Aby określć regułę R jk (gdze, j, k =,..., jest numerem podzału) naleŝy zastosować algorytm 7- (adaptacja algorytmu 5-):

125 25 Algorytm 7-: Tworzene reguły R jk rok : Dla kaŝdej klasy CT 0 (gdze T 0 =,..., M M jest lczbą klas) naleŝy wyznaczyć β CT0 jako sumę zgodnośc wszystkch elementów uczących X p = (x, y, z) (gdze p =,2,...N N - lczba elementów uczących) naleŝących do klasy CT 0 do funkcj przynaleŝnośc µ X, µ jy, µ kz wyznaczających regułę R jk: β CT0 = N p= X = ( x, y, z) CT p µ ( x) µ ( y) µ ( z) (7-8) X 0 jy kz rok 2: NaleŜy znaleźć taką klasę CT, Ŝe: β CT = max {β C,..., β CM } (7-9) JeŜel β CT = 0 lub występują dwe lub węcej klas, dla których wyznaczone wartośc β CT0 przyjmują maksymalna wartość, to wtedy klasa C jk = CT ne jest defnowana zaufane CF jk do takej reguły wynos 0. Reguła, w którym klasa C jk ne jest defnowana w którym zaufane CF jk = 0, nazywana jest regułą nestotną. W pozostałych przypadkach klasą C jk z reguły R jk jest klasa CT. rok 3: JeŜel zaufane CF jk ne zostało określone jako 0 w kroku 2, to wyznacza sę je wzorem 7-0: CF jk βct β, gdze β = β = M T = CT M β CT T = T T M (7-0) NaleŜy zauwaŝyć, Ŝe wzór 7-0 będący adaptacją wzoru 5-7 do przestrzen 3- wymarowej, a określający zaufane CF jk do klasyfkacj spełna dwa wymog zgodne z ntucją: a) JeŜel β CT > 0 dla kaŝdej wartośc T 0 T β CT0 = 0, to oznacza Ŝe wszystke elementy (x, y, z) ze zboru uczącego mogące dać wynk ze wzoru 7-8 wększy od zera naleŝą do jednej klasy CT. Wtedy zaufane CF jk =, czyl klasyfkacja jest pewna. b) JeŜel dla kaŝdego T 0 wartośc β CT0 newele sę od sebe róŝną, to CF jk 0, czyl klasyfkacja ne jest pewna. Realzację przedstawonej procedury naleŝy rozpocząć od podzału =2. Po wygenerowanu zboru S reguł rozmytych jeŝel-to dla zadanego podzału, naleŝy zwększyć wartość o jeden powtórzyć algorytm. Powtarzane algorytmu naleŝy

126 zakończyć, jeŝel dla beŝącego wszystke reguły R jk potrafą poprawne sklasyfkować wszystke elementy (x, y, z) ze zboru uczącego. Ostatn wykonany podzał ma oznaczene max. 26 PonŜszy algorytm 7-2 umoŝlwa [42] klasyfkację dowolnego elementu (x 0, y 0, z 0 ) na podstawe zboru reguł S wygenerowanych dla zadanego. Algorytm 7-2: lasyfkacja 3-wymarowego obektu (x 0, y 0, z 0 ) za pomocą reguł ze zboru S wygenerowanych dla zadanego podzału. rok : rok 2: NaleŜy wyznaczyć α CT0 dla kaŝdej klasy CT 0 (gdze T 0 =,..., M M jest lczbą klas) wg zaleŝnośc: α CT0 = max {µ X(x 0 ) µ jy(y 0 ) µ kz(z 0 ) CF jk} (7-) dla kaŝdego R jk S. NaleŜy wyznaczyć klasę CT taką, Ŝe: α CT = max { C,..., CM } (7-2) Wynkem tej procedury jest klasa CT. JeŜel dwe lub węcej klas przyjmuje maksymalne wartośc α CT0 we wzorze 7- lub wszystke wartośc α CT0 są zerem, to element (x 0, y 0, z 0 ) ne jest klasyfkowany. NaleŜy tu zwrócć uwagę (rysunek 5-2), Ŝe we wzorze 7- uŝyto do wyznaczana welkośc α CT0 zaufana do klasyfkacj CF jk z reguły R jk. PonewaŜ wartość owego zaufana naleŝy do przedzału 0,, to loczyn zaufana CF jk wartośc µ X(x) µ jy (y) µ jz(z) moŝe ulec zmnejszenu w stosunku do wartośc µ X(x) µ jy(y) µ jz (z). Dzęk temu wpływ reguły R jk z obszaru A A j A k moŝe ulec zmnejszenu na korzyść reguł dotyczących obszarów sąsadujących z A A j A k (tj.: A ' X Aj' Y A k ' Z dla ' = -,, +; j' = j-, j, j+; k = k-, k, k+). Reguły ze zboru S max moŝemy zastąpć regułam ze zborów wygenerowanych poprzedno (tj. S 2, S 3,..., S max- ). Dzęk temu moŝlwa jest redukcja lczby reguł nezbędnych do poprawnej klasyfkacj obektów uczących. W tym celu wprowadza sę oznaczene S = S 2 S 3... S max zboru wszystkch wygenerowanych reguł rozmytych, a zbór reguł wybranych do klasyfkacj poprzez A. Lczność zboru S A spełna warunek 5-3. lasyfkacja nowego elementu odbywa sę zgodne z

127 algorytmem opsanym przy wzorze 7- przy czym dotyczy wszystkch reguł naleŝących do S, czyl R jk S. 27 Rysunek 7-5. Zaznaczene sześcanów wyznaczonych przez funkcje przynaleŝnośc przypsanych do reguł klasyfkujących jeŝel-to (znaczene kolorów jak na rysunku 7-). Przy próbe uŝyca do wykonana modułu systemu ekspertowego (w postac aplkacj Fuzzy3D.exe opsanej w rozdzale 8) 240 obektów ze zboru danych ne moŝna uzyskać poprawnej klasyfkacj ch wszystkch nawet dla podzału = 50 (rysunek 7-5). Dla tak wysokej lczby podzałów naleŝy wykonać dodatkowe analzy zboru danych w celu ogranczena mocy zboru S wszystkch wygenerowanych reguł onwersja danych uczących NemoŜność wygenerowana reguł (rysunek 7-5) poprawne klasyfkujących 240 obektów uczących przedstawonych na rysunku 7-3 wynka z ch znacznego zagęszczena przy punkce (0, 0, 0), co potwerdza hstogram 3-wymarowy prezentowany na rysunku 7-2, a takŝe ze znacznego zagęszczena w okolcach płaszczyzny 0YZ, co potwerdza hstogram wykonany dla zmennej X z rysunku 7-. Oba wymenone obszary są decyzyjne trudne dlatego podczas generowana reguł naleŝy pośwęcć m szczególną uwagę co moŝna zrealzować na dwa sposoby. Perwszy z nch polega na zmane zasady generowana obszarów A A j A k

128 wyznaczanych przez funkcje µ X, µ jy, µ jz(z), tak aby obszary te były drobnejsze w obszarach decyzyjne trudnych. Drug sposób polega na konwersj przestrzen będącej sześcanem jednostkowym w nną przestrzeń, celem powększena obszarów decyzyjne trudnych (kosztem zmnejszena obszarów, na których klasyfkacja generowanym regułam jest łatwa) tym samym zmnejszenu zagęszczena danych uczących. 28 Perwszą z tych metod nech będze modyfkacją wzorów , która polegać będze na dwukrotnym zagęszczenu reguł o ndekse od do - dla podzału. Zasęg reguły ostatnej przedostatnej zostane odpowedno poszerzony, co dla wymaru x moŝna przedstawć wzorem 7-3. Metoda ta jednak w pewen sztuczny sposób traktuje dane uczące dzeląc kaŝdy z wymarów przestrzen na odcnk: 0; (-2)/(2-2)) (-2)/(2-2);, z których perwszy wyznacza obszar o zwększonym zagęszczenu reguł, a w obszarze drugm klasyfkacja odbywa sę tylko za pomocą dwóch reguł (co moŝemy zaobserwować na rysunku 7-7). µ' 2 2 X(x) = max { - x - a / b, 0 } gdze =,..., - (7-3) µ' X(x) = 2 2 max { - x - a / b, 0 } 2( ) 2( ) x + dla 2( ) 2 µ' X(x) = x + gdze = dla x 2 x < gdze = 2( ) 2 gdze = 2( ) gdze a 2- = ( - ) / (2-2),, b 2- = / (2-2) dla, j, k = (, 2,..., ), - numer podzału.

129 29 Rysunek 7-6. Podzał przestrzen jednowymarowej (w tym przypadku odcnka jednostkowego) przez =5 trójkątnych funkcj przynaleŝnośc µ R na podobszary rozmyte A =,2,.... ' =,2,..., : 0, Proponowana modyfkacja ma stotną wadę: wraz ze wzrostem wartośc maleje umejętność klasyfkowana punktów na odcnku (-2)/(2-2); (dla przestrzen jednowymarowej). Dzeje sę tak dlatego, Ŝe wraz ze wzrostem wartośc rośne długość tego odcnka. MoŜe węc dojść do sytuacj, Ŝe algorytm wyznaczana reguł rozmytych na podstawe podzału przestrzen danych uczących na podobszary ne będze skończony. Z tego powodu zastosowana została druga metod polegająca na konwersj sześcanu jednostkowego w sześcan jednostkowy, za pomocą funkcj g: 0, 0,, którą uŝywa sę do konwersj na kaŝdym z wymarów: X, Y Z. Zaproponowano sprawdzene 6-cu funkcj g: 0, 0, opsanych wzoram g (x) = - x- N +, gdze N, ) R (7-4) g 2 (x) = x N, gdze N ( 0, R (7-5) g 3 (x) = N sn π x, gdze N ( 0, R (7-6) 2 g 4 (x) = log N (x (N-) + ), gdze N, ) R (7-7) x g 5 (x) = ( e e ) ( e ) N ( x x ), gdze N, ) R (7-8) 2 x max mn + xmn g 6 (x) = arctg, gdze N 0, ) R (7-9), π N gdze x mn, x max to wymary przestrzen danych uczących określone wzoram

130 30 PonewaŜ funkcja g: 0, 0, zostane uŝyta dla kaŝdego z wymarów X, Y Z, to dodatkowo zostane ona oznaczona ndeksem X, Y lub Z odpowednm dla danego wymaru. Z tego teŝ powodu parametr N oznaczony zostane takm samym ndeksem. Wykresy funkcj g X : 0, 0, w zaleŝnośc od wartośc N X przedstawa rysunek 7-8. (a) (b) (c) (d)

131 3 (e) (f) Rysunek 7-7. Wykresy funkcj g x : 0, 0,. W przypadku funkcj g opsanej wzorem 7-4 odbywa sę konwersja kaŝdego wymaru punktu pomarowego (obekt uczący w przestrzen trójwymarowej jest prezentowany jako punkt o trzech współrzędnych) za pomocą wzorów g ( x) = x (7-20) N X X + g ( y) = y (7-2) N Y Y + N Z g ( z) = z (7-22) Z + Rysunek 7-8. Obekty uczące w sześcane jednostkowym po konwersj funkcjam opsanym wzoram dla N X = 3, N Y = 3 N Z = 4,5. Po konwersj punktów uczących za pomocą wybranej funkcj g następuje generowane reguł uczących zgodne na podstawe funkcj µ określonych wzoram 7-5,

132 7-6, 7-7, przy czym wartośc x, y, z są przekonwertowane, co moŝemy zapsać w postac wzorów µ" X(x) = µ X(g X (x)) = max { - g X (x) - a / b, 0 } gdze =,..., (7-23) µ" jy(y) = µ jy(g Y (y)) = max { - g Y (y) - a j / b, 0 } gdze j =,..., (7-24) µ" kz(z) = µ kz(g Z (z)) = max { - g Z (z) - a k / b, 0 } gdze k =,..., (7-25) gdze a = ( - ) / ( - ), a j = (j - ) / ( - ), a k = (k - ) / ( - ), b = / ( - ) dla, j, k = (, 2,..., ) jest numerem podzału. 32 ZauwaŜyć moŝna, Ŝe proponowany sposób konwersj punktów uczących generowana na nch reguł uczących na podstawe funkcj µ określonych wzoram sprowadza sę (jeŝel g jest odwzorowanem wzajemne jednoznacznym) do generowana reguł uczących w przestrzen przed konwersją na podstawe funkcj µ" określonych wzoram (rysunek 7-0) przy czym jest tańszy oblczenowo. Rysunek 7-9. Wykresy funkcj µ" X(x) dla funkcj transformującej N X g ( x) = x dla N X = 3 = 5. X + Dzęk moŝlwośc zastosowana klku funkcj transformujących oraz ch parametryzacj konwersję moŝna wykonać tak, aby moŝlwe zredukować lczbę wykonywanych podzałów max, dla której wygenerowane reguły potrafą poprawne klasyfkować wszystke dane uczące. PonewaŜ generowane reguł odbywa sę po transformacj dobrze byłoby znaleźć cechę zboru uczącego, której zmana w wynku transformacj małaby wpływ wartość max.

133 33 Jednym z waŝnejszych cech zboru uczącego są odległośc mnmalne: - odl - mnmalna odległość pomędzy punktam o róŝnych współrzędnych - odl - mnmalna odległość pomędzy punktam róŝnych klas. Tabela 7- zawera zestawena wartośc odl oraz odl w zaleŝnośc od zastosowanej funkcj konwertującej g oraz parametrów N x, N y, N z. Przyjęto, Ŝe oblczena zostają zakończone, jeŝel osągnemy podzał =50 ne będze moŝna poprawne klasyfkować wszystkch obektów uczących za pomocą zboru reguł S 50. W tym wypadku oznaczymy w tabel 7-, Ŝe max > 50. Wartośc odl oraz odl przedstawone są z dokładnoścą sześcu mejsc po przecnku. N X N Y N Z max odl' odl >50 0,0006 0, , , , , , , , , , , , , , , , , , , , , >50 0, , Tabela 7-. ZaleŜność wartośc max od funkcj konwertującej g oraz parametrów N x, N y, N z - wstępne oblczena. Po wykonanu wstępnych oblczeń dla funkcj konwertującej g oraz parametrów N x =N y =N z otrzymano dla N x =N y =N z =4 najmnejszą wartość max =6. Analzując dane z tabel 7- moŝna dojść do wnosku, Ŝe wartość max ne zaleŝy od wartośc odl lub odl' wprost. Wraz ze wzrostem wartośc N x, N y, N z następował początkowo (do N x =N y =N z =4) wzrost wartośc odl odl', a takŝe spadek wartośc max. Jednak dla wartośc N x =N y =N z =5, gdze wartośc odl odl' były najwększe wartość max wcale ne była najnŝsza (zaburzene proporcjonalnośc wprost pomędzy max, a odl odl' zaobserwować moŝna teŝ dla N x =N y =N z =9, a N x =N y =N z =0). Z tabel tej wdać, Ŝe moŝlwe jest posłuŝene sę wartoścam odl odl' do znalezena dość dobrych wartośc N x, N y, N z, jednak trzeba jeszcze poszukać lepszej transformacj w otoczenu tak wyznaczonych wartośc. ZauwaŜmy teŝ, Ŝe posłuŝene sę wartoścą odl w celu

134 wyznaczena moŝlwe małej wartośc max jest neco lepsze nŝ posługwane sę wartoścą odl', co moŝemy zaobserwować porównując wartośc odl odl' dla N x =N y =N z =4, N x =N y =N z =5, N x =N y =N z =6. Właścwośc zboru danych uczących zostaną węc uzupełnone o wartośc oczekwane [29] warancje (oznaczone odpowedno E(X) V(X) [54]) dla kaŝdej zmennej x, y, z opsującej dane uczące (rysunek 7- tabela 7-2). 34 N X N Y N Z E(X); V(X) E(Y); V(Y) E(Z); V(Z) odl max 0,060; 0,030 0,23; 0,050 0,33; 0,070 0, > ,6; 0,070 0,476; 0,096 0,606; 0,09 0, ,6; 0,070 0,476; 0,096 0,65; 0,07 0, ,6; 0,070 0,476; 0,096 0,546; 0,09 0, ,6; 0,070 0,44; 0,089 0,606; 0,09 0, ,6; 0,070 0,526; 0,00 0,606; 0,09 0, ,03; 0,06 0,476; 0,096 0,606; 0,09 0, ,26; 0,077 0,476; 0,096 0,606; 0,09 0, ,37; 0,083 0,476; 0,096 0,606; 0,09 0, Tabela 7-2. ZaleŜność wartośc max dla funkcj konwertującej g oraz parametrów N x, N y, N z od wartośc oczekwanej warancj oraz odl - kontynuacja oblczeń. Tabela 7-2 pokazuje, Ŝe ne ma teŝ zaleŝnośc pomędzy tym wartoścam, a wartoścą max. RówneŜ analza hstogramów ne przynosła efektu w postac wyznaczena jakejś zaleŝnośc pomędzy parametram wykonywanej konwersj, a wartoścą max. PonewaŜ hstogramy przypomnały hstogramy dla rozkładu wykładnczego lub normalnego, to na podstawe tej właścwośc zostały zaproponowane funkcje transformujące g 4 oraz g 5. Próba nterpolacj welomanem Lagrange'a wartośc dwóch wymarów (przyjęto, Ŝe będą zanalzowane zaleŝnośc y od x, z od y x od z) punktów pomarowych równeŝ ne przynosła odpowedz na to pytane uzyskwane welomany około dwusetnego stopna ne nadają sę do dalszej analzy. Zaobserwowano równeŝ duŝe odchylena punktów pomarowych od prostej aproksymowanej średnokwadratowo. Z tego powodu zamast aproksymacj nterpolacj moŝna analzować wartośc średne na przedzale (rysunek 7-).

135 35 Rysunek 7-0. Analza właścwośc zboru uczącego - wartośc średne hstogramy Rysunek 7-. Analza właścwośc zboru uczącego - hstogramy dla klas, hstogramy trójwymarowe, wartośc oczekwane odchylana standardowe dla klas

136 36 W tabel 7-2 moŝna zauwaŝyć, Ŝe wartość max ne zaleŝy w sposób stotny od wartośc N X, co moŝna tłumaczyć zagęszczenem punktów uczących w okolcy (dla małych wartośc x) płaszczyzny 0YZ. Aby potwerdzć, Ŝe tak jest w stoce wykonano dodatkowe rysunk (rysunek 7-2) przedstawające hstogramy trójwymarowe. PonewaŜ sam hstogram trójwymarowy ne przedstawa nformacj o tym le punktów danej klasy naleŝy do danego podobszaru prezentowanego w hstograme, to wykonano jeszcze analzę hstogramów dla zmennych x, y, z dla poszczególnych klas. Uzupełnenem tej nformacj jest grafczne przedstawene w przestrzen trójwymarowej wartośc oczekwanej odchylena standardowego dla poszczególnych klas - w forme krawędz prostopadłoścanu o środku w punkce (E(X), E(Y), E(Z)) długośc boków odpowedno: 2 V ( Z),2 V ( Y ),2 V ( Z). (rysunek 7-2). N X N Y N Z max Tabela 7-3. ZaleŜność wartośc max dla funkcj konwertującej g od parametrów N x, N y, N z - kontynuacja poszukwań mnmalnej wartośc max. Dla N X =3, N Y =3 N Z =4,5 znalezono (tabela 7-3) najmnejszą wartość max = 5. Oczywśce wartość max zaleŝy równeŝ od samej funkcj transformującej g dlatego poszukwana wartośc mnmalnej max przeprowadzono w przypadku Rysunek ten uzyskano poprzez podzał kaŝdego z wymarów sześcanu jednostkowego na 0 odcnków o tej samej długośc. Następne wyznaczono le obektów uczących naleŝy do kaŝdego z uzyskanych w ten sposób 000 małych sześcanów. Obszar zajmowany przez sześcan był następne wypełnany w całośc dla sześcanu, do którego naleŝało najwęcej punktów uczących. W pozostałych przypadkach był on wypełnany odpowedno mnej w zaleŝnośc od lośc punktów uczących naleŝących do obszaru zajmowanego przez sześcan.

137 pozostałych funkcj transformujących g opsanych wzoram , ale ne uzyskano równe dobrych rezultatów (tabela 7-4). Funkcja N X N Y N Z max g 2 (x) 0,5 0,5 0,5 27 g 2 (x) 0,6 0,6 0,6 30 g 2 (x) 0,4 0,4 0,4 27 g 3 (x) 34 g 3 (x) 0,5 0,5 0,5 24 g 3 (x) 0,4 0,4 0,4 34 g 4 (x) g 4 (x) g 4 (x) g 5 (x) g 5 (x) g 5 (x) g 6 (x) 36 g 6 (x) g 6 (x) g 6 (x) 0,8 0,8 0,8 44 Tabela 7-4. ZaleŜność wartośc max od funkcj konwertującej g od parametrów N x, N y, N z - wybrane rezultaty poszukwań mnmalnej wartośc max. 37 Udało sę tu wykazać, Ŝe konwersja 240 danych uczących za pomocą wybranych odwzorowań mających na celu powększene obszarów danych trudnoseparowalnych, kosztem obszarów, w których podjece decyzj o stane techncznym transformatora jest łatwe, moŝe stotne obnŝyć lczbę konecznych do wykonana podzałów proponowanych w algorytme 7-. Redukcja tej wartośc znacząco obnŝa czasochłonność dalszych oblczeń. Wobec proponowanego algorytmu 7- ne udało sę jednoznaczne wyznaczyć parametru opsującego zbór danych uczących, którego regulacja mogłaby z góry ustalć, czy nastąp wzrost, czy spadek lczby konecznych do wykonana podzałów Regulacja rozmaru przestrzen danych Do przeprowadzena procesu tworzena systemu ekspertowego ne zostane uŝyte 240 danych (obektów) uczących, ponewaŝ część z nch potraktujemy jako dane testowe. Z tego powodu zbór 240 obektów został podzelony na trzy rozłączne podzbory w sposób losowy. Po dwa z tych podzborów połączono otrzymując trzy pary

138 rozłącznych podzborów zboru 240 obektów o lcznośc odpowedno obektów uczących. PonewaŜ te lośc obektów uczących są małe jak na próbkę losową, to dla kaŝdej z trzech par przesunęto obekty uczące (w sposób losowy) tak, aby wększy zbór zawerał 70% obektów zboru wyjścowego (68 obektów), a mnejszy odpowedno 30% (72 obekty) to tak, aby proporcję 7:3 zachować dla lośc obektów poszczególnych klas zawartych w zborach (tabela 7-5). 38 Lp. Nazwa klasy Lczba obektów klasy (00%) 70% całośc 30% całośc Bez uszkodzeń Wyładowana nezupełne o małej energ Wyładowana nezupełne o duŝej energ Wyładowana zupełne o małej energ Wyładowana zupełne o duŝej energ Przegrzane 50 0 C Przegrzane powyŝej 50 0 C ponŝej C Przegrzane powyŝej C ponŝej C Przegrzane powyŝej C Razem Tabela 7-5. Proporcjonalny (z uwzględnenem lcznośc poszczególnych klas) podzał 240 obektów uczących na 70% obektów uŝytych do tworzena systemu ekspertowego oraz 30% - do testowana Zbór 240 obektów nazwjmy "240 danych uczących", a trzy pary utworzonych w opsany powyŝej sposób zborów odpowedno "Zbór uczący " "Zbór testowy ", "Zbór uczący 2" "Zbór testowy 2" oraz "Zbór uczący 3" "Zbór testowy 3". Obekty uczące ze zboru "240 danych uczących" naleŝą do przestrzen P: 0; 3, , ; 2, , ; 2,769 która została opsana w rozdzale 7-2. JeŜel na tej samej przestrzen opsane zostaną zbory uczące oraz testowe oraz do procesu wyznaczana reguł uczących na zborach uczących zastosujemy funkcję g ze współczynnkam N x = 3, N Y = 3 N Z = 4,5 ustalonym w poprzednm rozdzale, to otrzymamy dla poszczególnych zborów danych następujące wartośc max - lczby podzałów nezbędnych do wykonana, aby wszystke punkty zboru uczącego były poprawne klasyfkowane przez reguły ze zboru (tabela 7-6): max S

139 39 Nazwa zboru max "240 danych uczących" 5 "Zbór uczący " 2 "Zbór uczący 2" 3 "Zbór uczący 3" 6 Tabela 7-6. Wartość max dla poszczególnych zborów uczących w przestrzen P W tabel 7-6 wdać, Ŝe dla dwóch perwszych zborów uczących wartość max jest mnejsza nŝ dla zboru źródłowego, ale dla zboru trzecego jest na odwrót pommo tego, Ŝe jest to zbór loścowo mnejszy nŝ źródłowy. Powodem takej sytuacj jest fakt zastosowana podzału rozmytego. Ten nepoŝądany efekt moŝemy próbować znwelować, jeŝel blŝej przyjrzymy sę defncjom funkcj µ" wyznaczających przedzały rozmyte. Okazuje sę, Ŝe obekt uczący leŝący na jednym z krańców przestrzen jest klasyfkowany w sposób trudnejszy nŝ pozostałe obekty (w danym wymarze jego klasyfkację wyznacza zawsze tylko jedna funkcja µ"). Powększając w newelkm stopnu przestrzeń danych uczących moŝemy zmenć tę sytuację. Dla drobnej zmany przestrzen P w przestrzeń P' polegającej na określenu dolnej grancy przestrzen dla wymaru Y jako wartośc 0,06 otrzymujemy juŝ znaczące zmany wartośc max (tabela 7-7). Nazwa zboru max "240 danych uczących" 5 "Zbór uczący " 5 "Zbór uczący 2" 6 "Zbór uczący 3" 4 Tabela 7-7. Wartość max dla poszczególnych zborów uczących w przestrzen P' Jak wdać z tabel 7-7 nastąpło znaczne zmnejszene wartośc max w przestrzen P': 0; 3, ,06; 2, , ; 2,769 ale tylko dla trzecego zboru uczącego - w przypadku dwóch pozostałych nastąpł efekt odwrotny. Jednak po drobnej regulacj (zaokrąglena) pozostałych granc przestrzen otrzymano przestrzeń P" wyznaczoną następująco: -0,0; 3,22 0,06; 2,76 0,06; 2,77 dla której otrzymano wartośc max dla poszczególnych zborów uczących zebrane w tabel 7-8.

140 40 Nazwa zboru max "240 danych uczących" 5 "Zbór uczący " 2 "Zbór uczący 2" 3 "Zbór uczący 3" 5 Tabela 7-8. Wartość max dla poszczególnych zborów uczących w przestrzen P' NaleŜy zauwaŝyć, Ŝe tylko drobne regulacje granc przestrzen ne wymagają ponownego wyznaczana wartośc N X, N Y, N Z. JeŜel decydujemy sę na znaczne zmany rozmarów przestrzen, to pownnśmy ponowne wyznaczyć parametry transformacj: funkcję g oraz wartośc N X, N Y, N Z. Reasumując pownnśmy podczas wyznaczana przestrzen uczącej kerować sę neco zmodyfkowanym wzoram , a manowce: nowy x x =, N max nowy y y =, N max nowy z z =, N max mn{ x} { x } mn{ x } mn{ y} { y } mn{ y } mn{ z} { z } mn{ z } (7-26) (7-27) (7-28) gdze N jest lczbą obektów uczących oraz mn {x }=mn{x : =,2,...,N} - dx mn, mn{y }=mn{y : =,2,...,N} - dy mn, mn {z }=mn{z : =,2,...,N} - dz mn, max {x }=max{x : =,2,...,N} + dx max, max {y }=max{y : =,2,...,N} + dy max, max {z }=max{z : =,2,...,N} + dz max dx mn, dy mn, dz mn, dx max, dy max, dz max, R + {0}.

141 Parametryzacja algorytmu genetycznego Narzędzem redukcj lczby reguł zapsanych w zborze reguł S (wzory ) uzyskanych dla zboru danych uczących o nazwe Zbór uczący jest algorytm genetyczny, który dąŝy do mnmalzacj lczby reguł rozmytych uŝywanych do klasyfkacj przy jednoczesnym zachowanu poprawnośc wykonywanej klasyfkacj. Aby osągnąć ten cel, algorytm genetyczny usłuje wyznaczyć maksmum funkcj f (A) R danej wzorem 5-9 za pomocą jednej z trzech opsanych uprzedno funkcj przystosowana poprzez wzory 5-26, 5-33, PonewaŜ jednak wartość funkcj przystosowana 5-26 newele mów o jakośc procesu uczena, a ne zaobserwowano zmany jakośc uzyskwanych wynków podczas stosowana funkcj opsanej wzorem 5-34, to do dalszych praktycznych oblczeń uŝywana była funkcja opsana wzorem Parametry a, b, c m opsujące tę funkcję (wzór 5-33) ne mały stotnego wpływu na jakość uzyskwanych przez algorytm genetyczny wynków. Zupełne bez znaczena dla podanego przykładu oblczenowego okazały sę parametry: ocenający stotność funkcj kary c, czy skalującą potęgą funkcję przystosowana m. Parametry a b mały o tyle merzalny wpływ, Ŝe określały odpowedno: na le zaleŝy nam na uzyskanu poprawnej klasyfkacj, a le na redukcj lczby praw. Zmnejszene proporcj pomędzy nm ponŝej 20: skutkowało nekedy stotnejszą redukcją lczby praw, ale kosztem wykonywanej klasyfkacj, co dla systemu nformatycznego ne pownno być dopuszczalne. Ostateczne po klkudzesęcu przebegach próbnych algorytmu genetycznego ustalono, Ŝe dla wszelkch dalszych testów: a = 20, b =, c = 0., m =. W kaŝdym z uzyskanych w algorytme genetycznym chromosomów reguła R jk uzyskana z algorytmu 7- zapsana jest na r-tej pozycj chromosomu (locus) zgodne ze wzorem 7-30 (adaptacja wzoru 5-2). 2 = r 3 h + h= 2 ( ) + ( j ) + ( k ) + 2 ( ) + ( j ) + ( k ) + Wartość genu na r-tej pozycj moŝe przyjąć 3 wartośc: dla dla = 2 > gdy reguła R jk jest nestotna - gdy reguła R jk naleŝy do zboru B jest uŝywana do klasyfkacj 2 - gdy reguła R jk ne naleŝy do zboru B. (7-29)

142 42 Łączna długość chromosomu uzyskanego dla max = 2 (wg tabel 7-8) wynos (wzór 5-2 rysunek 8-46): = 6083 z czego (rysunek 8-46) 2842 uzyskanych reguł jest nestotnych. Wyraźne z powyŝszych oblczeń wynka stotność rozwaŝań przeprowadzonych w poprzednch rozdzałach (rozdzał 5-2, ) o redukcj lczby podzałów max nezbędnych do uzyskana reguł poprawne klasyfkujących dane uczące, gdyŝ juŝ dla max = 5 (wzór 5-2) długość chromosomu wynosłaby Początkowo algorytm genetyczny wyznaczający maksmum funkcj f danej wzorem 5-9 uruchamany był dla krzyŝowana jednopunktowego, selekcj ruletkowej, prawdopodobeństwa wylosowana jedynk w zerowej generacj wynoszącym 0,5 dla zachowywana najlepszego osobnka w następnej generacj. Dla prawdopodobeństwa wykonana mutacj wynoszącego 0,00 prawdopodobeństwa krzyŝowana wynoszącego, dla lcznośc populacj wynoszącej 00, otrzymywano po 2000 generacj poprawną klasyfkację wszystkch 68 obektów uczących, ale za pomocą około 900 reguł. Regulacja warunku zakończena algorytmu tj. uzyskana satysfakcjonującej lczby pokoleń ne wpływała na poprawę wykonana algorytmu. Po sprawdzenu wartośc od 00 do 4000 ustalono tę wartość na Po jej przekroczenu ne obserwowano juŝ stotnej poprawy uzyskwanego wynku (najwyŝej drobne korekty). Neco lepsze wynk zaczęto uzyskwać po zmane wartośc prawdopodobeństwa wylosowana jedynk w generacj zerowej (startowej). Algorytm genetyczny realzował sę szybcej dla mnejszej wartośc tego parametru wynoszącej od 0. do 0.2 po 2000 pokoleń uzyskwano około 500 reguł klasyfkujących wszystke dane uczące. Poprawono węc przebeg algorytmu, ale ne jego proces rozwązywana zadana. Dlatego ostateczne ustalono wartość tę na pozome 0. ne wpływa ona stotne na jakość uzyskanego rozwązana. Badana (tj. wykonane próbne przebeg algorytmu) nad lcznoścą populacj algorytmu genetycznego wykazały, Ŝe ta wartość ne wpływa znacząco na jakość uzyskwanego rozwązana. Dla lcznośc 50, 00, 200 rezultaty były podobne ostateczne ustalono, Ŝe najwłaścwszą wartoścą będze 50, co przynajmnej zmnejszy czasochłonność oblczeń.

143 Oczywśce pracujący algorytm genetyczny celem zaproponowana najlepszego wynku po jego zakończenu pownen ów wynk kopować z pokolena na pokolene dlatego to właśne ustawene parametru jego pracy będze uŝywane. Regulacja parametru, który w sposób losowy mał zaburzać skłonność do ujednolcana sę populacj z powodu upodabnana sę jej do najlepszego osobnka mutacja, równeŝ ne wpływała w sposób znaczący na poprawę uzyskwanych wynków. Ustalono węc, Ŝe zachodzć będze w sposób sporadyczny to jest jeden raz podczas budowy nowego chromosomu (czyl prawdopodobeństwo mutacj jednego genu wynos jeden dzelone przez długość chromosomu tu / rysunek 8-46). Dopero stotną poprawę jakośc uzyskwanych wynków uzyskano po wprowadzenu krzyŝowana welopunktowego. Dla krzyŝowana 4-punktowego (przy prawdopodobeństwe zajśca samego krzyŝowana wynoszącego 00%) po 2000 generacj uzyskano 65 reguł jeŝel-to zdolnych klasyfkować poprawne 67 ze 68 danych uczących. Dośwadczalne ustalono, Ŝe wykonywane będze krzyŝowane 50- punktowe (m.n. ze względu na to, Ŝe długość chromosomu przekracza 6000). Celem poprawy tego rezultatu wykonano testowe przebeg algorytmu dla krzyŝowana proporcjonalnego. Wykonywano wtedy krzyŝowane 2-punktowe (z powodu pracy na chromosome zapsującym prawa uzyskane z 2 podzałów) przy czym na kaŝdym z odcnków chromosomu chs (rysunek 5- wzór 5-22) prawdopodobeństwo wykonana krzyŝowana wynosło 00%. Jednak ta modyfkacja ne poprawła juŝ uzyskwanych wynków po wprowadzenu krzyŝowana welopunktowego. Innym sposobem poprawy uzyskwanego wynku było zastosowane selekcj turnejową dla rozmaru turneju 2. Dla 40-punktowego krzyŝowana, prawdopodobeństwa mutacj 0,0005 dla lośc osobnków w generacj 200 dla prawdopodobeństwa wylosowana jedynk w generacj startowej 0,2 otrzymano: - po 2000 pokolenach 94 reguły zdolne poprawne klasyfkować 66 elementów uczących (dla selekcj ruletkowej) - po 400 pokolenach 45 reguł zdolnych poprawne klasyfkować wszystke 68 danych uczących (dla selekcj turnejowej). Pommo zastosowana selekcj turnejowej ne udało sę znacząco zredukować lośc reguł nezbędnych do dokonana poprawnej klasyfkacj. 43

144 Po wyczerpanu moŝlwośc regulacj parametrów pracy algorytmu genetycznego uzyskwanu mało satysfakcjonujących wynków, gdyŝ zbyt welka lczba reguł słuŝyła do klasyfkacj wszystkch danych uczących, zdecydowano na wprowadzene nowych operatorów genetycznych do algorytmu (rozdzał 5.3.7). 44 Operator mutacj usunęce jedynk ma za zadane usunąć z chromosomu zapsaną wartość wymenć ją na 2, co odpowada operacj usunęca zapsanej w danym gene reguły jeŝel-to ze zboru reguł A uwzględnanych przy klasyfkacj. Ma on zrównowaŝyć dzałane klasycznego operatora mutacj, który losowo zamena napotkane wartośc na 2 2 na, ale ponewaŝ w dobrze dostosowanych chromosomach lczba jedynek jest znaczne mnejsza nŝ dwójek, to operator ten dla pokoleń o wyŝszych numerach raczej przeszkadza w uzyskanu lepszego rezultatu. Po ustalenu prawdopodobeństwa zajśca mutacj usuwającej jedynkę na pozome 0 zman w całym chromosome podczas jego konstrukcj juŝ po 75 generacjach uzyskano 48 reguł potrafących poprawne klasyfkować 6 na 68 danych uczących. Nestety aŝ do generacj 2000 ne udało sę poprawć uzyskanego rezultatu, co sugeruje, Ŝe przyjęte prawdopodobeństwo zadzałana tego operatora jest zbyt duŝe. Dla dwukrotne obnŝonego prawdopodobeństwa (zastnene takej mutacj na pozome 5 zman w chromosome podczas jego tworzena) uzyskano lepszy wynk, gdy zawarte w chromosome reguły w lczbe 35 potrafły poprawne sklasyfkować węcej danych uczących nŝ uprzedno tj. 65 na 68 danych uczących. Zaproponowany operator mał węc odczuwalny wpływ na generowane rezultaty. Najlepszym uzyskanym wynkem z uŝycem jedyne tego operatora (bez dalszych tu wprowadzonych) był przebeg, gdze dla 40-punktowego krzyŝowana, prawdopodobeństwa klasycznej mutacj , 200 osobnków w generacj, prawdopodobeństwa wylosowana w startowej generacj 0.2, dla selekcj turnejowej dla rozmaru turneju 2, dla zachowana najlepszego osobnka, po 2000 pokoleń otrzymano 83 reguły klasyfkujące poprawne 67 obektów uczących. Nadal jednak ne jest to wynk satysfakcjonujący, gdyŝ rezultat ten uzyskano juŝ w 650 pokolenu ne uległ on jakejkolwek poprawe, aŝ do 2000 pokolena. Operator mutacj ntelgentne przesunęce jedynk ma na celu przenesene prawa zapsanego w danej lokalzacj uŝywanego do klasyfkacj (stąd mówmy o przesunęcu jedynk, która to właśne symbolzuje prawo uŝywane do klasyfkacj) do obszaru praw w chromosome uzyskanych z poprzednego podzału (a węc ne dzała ten operator na prawach z podzału perwszego, gdy = 2) tak, aby obszar kodowany

145 przez nowe prawo uŝyte do klasyfkacj mał część wspólną z obszarem, który był przypsany do prawa z pozycj chromosomu, z której właśne została usunęta jedynka. Dopero zastosowane tego operatora z prawdopodobeństwem wymuszającym jedną taką zmanę w chromosome podczas jego tworzena pozwolła na zredukowane lczby reguł uŝywanych do klasyfkacj do 50 stotnych reguł, ale ne moŝna było wymóc wykonana nm poprawnej klasyfkacj wszystkch danych uczących. Z tego powodu uŝyto operatora mutacj neproporcjonalnego wstawena jedynk. Operator ów ma za zadane wstawć wartość w gen znajdujący sę we fragmence chromosomu, którego pozycje kodują reguły jeŝel-to uzyskane z ostatnego podzału max. Operator ten ma dzałać w newelkm stopnu dlatego ustalono, Ŝe będze wykonywany ne częścej nŝ raz na całym chromosome podczas jego tworzena. Po zastosowanu nowych operatorów mutacj bardzo często uzyskwany w 2000 pokolenu wynk przebegu algorytmu genetycznego kodował sobą mnej nŝ 50 praw zdolnych do poprawnej klasyfkacj wszystkch 68 danych uczących. Za wynk najlepsze (tj. grupę ekspertów I opsaną w rozdzale 5.3.8) uznano te rezultaty, które kodują sobą mnej nŝ 40 reguły jeŝel-to potrafące poprawne zdentyfkować 67 lub 68 przykładowych danych uczących (rysunk 8-50, ). Wynk te tworzą grupę I współpracujących ze sobą ekspertów (zgodne ze wzorem 5-43), a prawa w nch zawarte słuŝą człowekow do wycągana własnych wnosków (rysunk ) m.n. o tym jak często grupa ma zapsane w sobe to samo prawo. 45 Rysunek 7-2. Analza jakośc uzyskanego eksperta: obszary decyzyjne

146 Prawo R( = 3, = 2, j =, l = 3): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.25,0.75> x <0.00,0.25> x <0.75,.00> zostane zakwalfkowany jako Wyładowana zupełne o duŝej energ z maksymalną pewnoścą procent". Prawo R( = 3, = 2, j = 2, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.25,0.75> x <0.25,0.75> x <0.25,0.75> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą 49.9 procent". Prawo R( = 4, = 2, j =, l = ): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.7,0.50> x <0.00,0.7> x <0.00,0.7> zostane zakwalfkowany jako Wyładowana nezupełne o duŝej energ z maksymalną pewnoścą procent". Prawo R( = 4, = 2, j =, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.7,0.50> x <0.00,0.7> x <0.7,0.50> zostane zakwalfkowany jako Wyładowana nezupełne o małej energ z maksymalną pewnoścą 29.7 procent". Prawo R( = 4, = 2, j = 3, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.7,0.50> x <0.50,0.83> x <0.7,0.50> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą 83. procent". Prawo R( = 5, =, j = 2, l = 5): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.3> x <0.3,0.38> x <0.88,.00> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą 95.3 procent". Prawo R( = 5, =, j = 5, l = 3): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.3> x <0.88,.00> x <0.38,0.63> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą procent". Prawo R( = 5, = 4, j =, l = 3): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.63,0.88> x <0.00,0.3> x <0.38,0.63> zostane zakwalfkowany jako Wyładowana zupełne o duŝej energ z maksymalną pewnoścą procent". Prawo R( = 6, = 2, j = 2, l = 3): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.0,0.30> x <0.0,0.30> x <0.30,0.50> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą procent". Prawo R( = 6, = 2, j = 3, l = 6): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.0,0.30> x <0.30,0.50> x <0.90,.00> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą 45.2 procent". Prawo R( = 7, =, j = 4, l = 4): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.08> x <0.42,0.58> x <0.42,0.58> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą 93.0 procent". Prawo R( = 7, =, j = 7, l = 7): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.08> x <0.92,.00> x <0.92,.00> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 7, = 2, j = 4, l = 5): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.08,0.25> x <0.42,0.58> x <0.58,0.75> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 8, =, j = 2, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.07,0.2> x <0.07,0.2> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą 75.0 procent". Prawo R( = 8, =, j = 3, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.2,0.36> x <0.07,0.2> zostane zakwalfkowany jako Przegrzane powyŝej 50 C ponŝej 300 C z maksymalną pewnoścą procent". Prawo R( = 8, =, j = 3, l = 6): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.2,0.36> x <0.64,0.79> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą 66. procent". Prawo R( = 8, =, j = 6, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.64,0.79> x <0.07,0.2> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 8, =, j = 6, l = 7): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.64,0.79> x <0.79,0.93> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 8, =, j = 7, l = 4): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.79,0.93> x <0.36,0.50> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 8, =, j = 7, l = 5): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.07> x <0.79,0.93> x <0.50,0.64> zostane zakwalfkowany jako Przegrzane powyŝej 300 C ponŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 8, = 2, j =, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.07,0.2> x <0.00,0.07> x <0.07,0.2> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 8, = 2, j = 2, l = 3): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.07,0.2> x <0.07,0.2> x <0.2,0.36> zostane zakwalfkowany jako Wyładowana zupełne o małej energ z maksymalną pewnoścą procent". Prawo R( = 8, = 2, j = 2, l = 4): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.07,0.2> x <0.07,0.2> x <0.36,0.50> zostane zakwalfkowany jako Wyładowana zupełne o małej energ z maksymalną pewnoścą procent". Prawo R( = 8, = 2, j = 2, l = 5): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.07,0.2> x <0.07,0.2> x <0.50,0.64> zostane zakwalfkowany jako Przegrzane ponŝej 50 C z maksymalną pewnoścą procent". Prawo R( = 9, =, j =, l = ): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.06> x <0.00,0.06> x <0.00,0.06> zostane zakwalfkowany jako Wyładowana nezupełne o duŝej energ z maksymalną pewnoścą procent". 46

147 47 Prawo R( = 9, =, j =, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.06> x <0.00,0.06> x <0.06,0.9> zostane zakwalfkowany jako Wyładowana nezupełne o małej energ z maksymalną pewnoścą procent". Prawo R( = 9, =, j =, l = 4): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.06> x <0.00,0.06> x <0.3,0.44> zostane zakwalfkowany jako Wyładowana nezupełne o małej energ z maksymalną pewnoścą procent". Prawo R( = 9, =, j = 4, l = 3): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.06> x <0.3,0.44> x <0.9,0.3> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą procent". Prawo R( = 9, =, j = 4, l = 8): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.06> x <0.3,0.44> x <0.8,0.94> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 9, =, j = 5, l = 9): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.06> x <0.44,0.56> x <0.94,.00> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą procent". Prawo R( = 9, = 7, j = 3, l = 8): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.69,0.8> x <0.9,0.3> x <0.8,0.94> zostane zakwalfkowany jako Przegrzane powyŝej 700 C z maksymalną pewnoścą 58.5 procent". Prawo R( =, =, j = 7, l = 4): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.05> x <0.55,0.65> x <0.25,0.35> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą procent". Prawo R( =, =, j = 9, l = 2): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.05> x <0.75,0.85> x <0.05,0.5> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą 46.7 procent". Prawo R( = 2, =, j = 3, l = 8): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.05> x <0.4,0.23> x <0.59,0.68> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą procent". Prawo R( = 2, =, j = 6, l = ): "aŝdy element (x,y,z) naleŝący do podprzestrzen <0.00,0.05> x <0.4,0.50> x <0.86,0.95> zostane zakwalfkowany jako Bez uszkodzeń z maksymalną pewnoścą procent". Tabela 7-9. Zaps 35 praw klasyfkujących wszystke 68 danych uczących 7.7. Porównane technk generowana reguł W pracy przedstawono wele róŝnorodnych technk generowana reguł klasyfkujących oraz algorytmów redukcj ch lczby. Rozwązane problemu uzyskana moŝlwe małej lczby reguł, z których to zapsu mógłby czerpać wedzę człowek, przy jednoczesnym zachowanu wysokej jakośc wykonywanej klasyfkacj dagnozowanych pomarów stanów stęŝeń gazów rozpuszczalnych w oleju transformatorowym metoda chromatograf gazowej DGA, zawsze nastręczało trudność oszacowana, które z kryterów jest stotnejsze. W zwązku z tym ponŝsza tabela 7-6 stanow zestawene jakośc omówonych tu metod. PonewaŜ jednak metody te stosują róŝne technk zapsu reguł, to bezpośredne porównane lczby reguł ne jest marodajne. Dlatego porównano w nej ne lczbę reguł, a lczbę zawartych w nch obszarów decyzyjnych, w które jeŝel umeszczony zostane punkt pomarowy, to podejmowana jest na nm dagnoza. Dla kodu IEC wg tabel oraz rysunku 6-3 moŝemy wyodrębnć obszarów decyzyjnych (tabela 6- nformuje, Ŝe kaŝda wartość kodu IEC oznacza

148 oddzelny odcnek na danym wymarze, a tabela 6-3 mów, Ŝe z tych odcnków złoŝono reguł; całość wzualzuje rysunek 6-3). Dane wg tabel 6-4, ale ogranczone do wykonanych uprzedno zborów uczących ( 240 danych uczących oraz zbór uczący ), posłuŝą do wyznaczena lczby poprawnych dagnoz (dagnoza postawona przez człoweka-eksperta uzyskana z metody kodu IEC jest taka sama). 48 Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą kodu IEC 240 danych uczących 68 danych uczących Bez uszkodzeń 7 Przegrzane ponŝej 50 o C 2 2 Przegrzane powyŝej 50 o C ponŝej 300 o C 3 2 Przegrzane powyŝej 300 o C ponŝej 700 o C 46 3 Przegrzane powyŝej 700 o C 7 49 Wyładowana nezupełne o duŝej energ Wyładowana nezupełne o małej energ 7 6 Wyładowana zupełne o duŝej energ 9 4 Wyładowana zupełne o małej energ 3 2 Razem: 63 4 Tabela 7-0. Porównane dla wyselekcjonowanych zborów uczących zgodnośc dagnozy postawonej przez człoweka-eksperta z dagnozą uzyskaną metodą kodu IEC Wysoka zgodność dagnozy stawanej przez człoweka-eskperta z dagnozą uzyskaną metodą kodu IEC (rzędu 68%) śwadczy tym, Ŝe tworząc kod IEC uwzględnono dośwadczene wedzę ekspercką. Metoda polska pogłębona będąc rozwnęcem metody kodu IEC o dodatkowe sprawdzena dagnozy w dotyczące przegrzań uzyska w wynku tychŝe dodatkowych sprawdzeń nŝszą nŝ sama metoda kodu IEC zgodność z dagnozą stawaną przez człoweka-eksperta (tabela 7-). Lczba samych obszarów decyzyjnych ne ulega zmane względem kodu IEC. Dla dagnoz ne dotyczących przegrzań dla tej metody ne uwzględnano przypadków, gdy dagnoza traktowana była jedyne jako symptom uszkodzena, gdyŝ stęŝene Ŝadnego z analzowanych gazów ne przekroczyło wartośc dopuszczalnych przedstawonych w tabel 6-5.

149 49 Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą polską pogłęboną 240 danych uczących 68 danych uczących Bez uszkodzeń 7 Przegrzane ponŝej 50 o C 0 0 Przegrzane powyŝej 50 o C ponŝej 300 o C 2 Przegrzane powyŝej 300 o C ponŝej 700 o C 26 9 Przegrzane powyŝej 700 o C 50 3 Wyładowana nezupełne o duŝej energ Wyładowana nezupełne o małej energ 7 6 Wyładowana zupełne o duŝej energ 9 4 Wyładowana zupełne o małej energ 3 2 Razem: 9 8 Tabela 7-. Porównane dla wyselekcjonowanych zborów uczących zgodnośc dagnozy postawonej przez człoweka-eksperta z dagnozą uzyskaną metodą polską pogłęboną Zestawene danych w tabel 7- jest o tyle stotne, Ŝe metoda ta potwerdza dodatkowo (względem metody kodu IEC) przypadk przegrzań, czym utwerdza człoweka w słusznośc postawonej dagnozy. Metoda nemecka swoje decyzje dagnostyczne podobne jak metoda kodu IEC podejmuje w oparcu o kod (metody nemeckej) opsujący sobą rozłączne obszary decyzyjne (tabela 6-9). Stąd z tabel 6-0 wnoskujemy o stnenu 8 obszarów decyzyjnych. Jest to mnej nŝ klas uŝywanych podczas wykonywana dagnozy przez człoweka-eksperta, ponewaŝ człowek wykonujący dagnozy wzorował sę na metodze polskej kodu IEC, a metoda nemecka ne uwzględna klasy uszkodzena Przegrzane ponŝej 50 o C, które jest uŝywane w metodze polskej kodu IEC. Uzyskana nska zgodność (rzędu 20%) dagnoz metody nemeckej z dagnozam wykonanym przez człoweka-eksperta, a uzyskanym z metody nemeckej (tabela 7-2) wynka z surowych kryterów dagnostycznych stosowanych w metodze nemeckej.

150 50 Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą nemecką 240 danych uczących 68 danych uczących Bez uszkodzeń 0 0 Przegrzane ponŝej 50 o C - - Przegrzane powyŝej 50 o C ponŝej 300 o C 0 0 Przegrzane powyŝej 300 o C ponŝej 700 o C 25 7 Przegrzane powyŝej 700 o C 4 3 Wyładowana nezupełne o duŝej energ 0 0 Wyładowana nezupełne o małej energ 7 6 Wyładowana zupełne o duŝej energ 8 Wyładowana zupełne o małej energ 0 0 Razem: Tabela 7-2. Porównane dla wyselekcjonowanych zborów uczących zgodnośc dagnozy postawonej przez człoweka-eksperta z dagnozą uzyskaną metodą nemecką Metoda francuska wyznacza obszary decyzyjne w tablcy sprawdzanów (tabela 6-2) uŝywa ch 0. Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą francuską 240 danych uczących 68 danych uczących Bez uszkodzeń 2 7 Przegrzane ponŝej 50 o C Przegrzane powyŝej 50 o C ponŝej 300 o C 0 0 Przegrzane powyŝej 300 o C ponŝej 700 o C 35 2 Przegrzane powyŝej 700 o C Wyładowana nezupełne o duŝej energ 0 0 Wyładowana nezupełne o małej energ 9 6 Wyładowana zupełne o duŝej energ 20 4 Wyładowana zupełne o małej energ Razem: 3 73 Tabela 7-3. Porównane dla wyselekcjonowanych zborów uczących zgodnośc dagnozy postawonej przez człoweka-eksperta z dagnozą uzyskaną metodą francuską Obszary decyzyjne dla metody kanadyjskej w lczbe 7 zawarte są w trójkące Duvala (rysunek 6-4) zapsane w postac algorytmu zastosowana w tabel 6-5. NaleŜy zaznaczyć, Ŝe metoda ta (o le sę daje zastosować) zawsze stawa dagnozę

151 ngdy ne jest to stan Bez uszkodzeń. Nska zgodność (około 8%) tej metody metody kodu IEC wynka z zupełne odmennych kryterów stawana dagnozy. Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą kanadyjską 240 danych uczących 68 danych uczących Bez uszkodzeń - - Przegrzane ponŝej 50 o C 2 2 Przegrzane powyŝej 50 o C ponŝej 300 o C 0 0 Przegrzane powyŝej 300 o C ponŝej 700 o C 0 0 Przegrzane powyŝej 700 o C 0 0 Wyładowana nezupełne o duŝej energ 6 4 Wyładowana nezupełne o małej energ Wyładowana zupełne o duŝej energ 0 7 Wyładowana zupełne o małej energ 0 0 Razem: 9 4 Tabela 7-4. Porównane dla wyselekcjonowanych zborów uczących zgodnośc dagnozy postawonej przez człoweka-eksperta z dagnozą uzyskaną metodą kanadyjską 5 Omówona w rozdzale 6.3. zmodyfkowana metoda a-najblŝszych sąsadów ne tworzy obszarów decyzyjnych, gdyŝ opera sę na podobeństwe badanego obektu do z góry określonej pul najbardzej do nego zblŝonych parametram. Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą a-najblŝszych sąsadów 240 danych uczących 68 danych uczących Bez uszkodzeń 23 5 Przegrzane ponŝej 50 o C 0 0 Przegrzane powyŝej 50 o C ponŝej 300 o C 0 0 Przegrzane powyŝej 300 o C ponŝej 700 o C 6 43 Przegrzane powyŝej 700 o C Wyładowana nezupełne o duŝej energ 2 2 Wyładowana nezupełne o małej energ 8 8 Wyładowana zupełne o duŝej energ 5 0 Wyładowana zupełne o małej energ 0 0 Razem: Tabela 7-5. Porównane dla wyselekcjonowanych zborów uczących zgodnośc dagnozy postawonej przez człoweka-eksperta z dagnozą uzyskaną metodą a- najblŝszych sąsadów opartą na 68 danych uczących.

152 Wynk zestawone w tabel 7-5 operają sę na tej metodze zrealzowanej w 3- wymarowej przestrzen defnowanej wzoram metody kodu IEC w oparcu o zbór 68 danych uczących. Jako pewna forma sprawdzena jakośc tejŝe metody dla 68 danych uczących (uŝytych do wyznaczana dagnozy) zostane podjęta próba klasyfkacj danych pochodzących ze zboru 240 danych uczących. NaleŜy tu jednak zwrócć uwagę, Ŝe metoda ta zachowuje sę poprawne jedyne dla lcznych reprezentantów danej klasy stanu techncznego transformatora. Dla dagnoz o stane techncznym stawanych sporadyczne, praktyczne unemoŝlwa ch wykonane (np.: przegrzana nskotemperaturowe, czy wyładowana zupełne małej energ). 52 Opsane w rozdzałach 6.3.3, 6.3.4, wynk algorytmu dyskretyzacj, wykonana drzewa decyzyjnego, czy budowana reguł za pomocą algorytmu genetycznego (co zamplementowano w programe ga_new.exe opsanego w rozdzale 8) na zborze 240 danych uczących zostały wpsane do tabel 7-6. Metody te potrafą ze 00% poprawnoścą wykonać klasyfkację, ale dla analzowanego zboru uczącego odbywa sę to kosztem duŝej lczby obszarów decyzyjnych. MoŜna zaobserwować w tabel 7-6, Ŝe na zborze 240 danych uczących algorytm genetyczny (oznaczony ga_new 240 ) potrafł zredukować lczbę obszarów decyzyjnych uzyskanych w wynku dyskretyzacj danych rzeczywstych lepej nŝ algorytm drzewa decyzyjnego. Jednak uzyskana wartość 94 obszary decyzyjne pommo, Ŝe warta odnotowana jako lepszy (bo mnej lczny zbór) rezultat ne wprowadza jakośc takej, Ŝeby z zapsu obszarów decyzyjnych mógł wedzę czerpać człowek. W zwązku z tym porównano w tabel 7-6 wynk uzyskane na zborze 68 danych uczących z algorytmów dyskretyzacj, drzewa decyzyjnego generacj/redukcj reguł opsanych na obszarach rozmytych (algorytmy 7-7-2) zamplementowanych w aplkacj Fuzzy3D.exe, którą opsano w rozdzale 8. Lczby poprawnych dagnoz z danej klase stanu techncznego skontrolowane na zborze 240 danych uczących (wobec budowy obszarów uczących w oparcu o 68 danych uczących) przedstawa tabela odpowedno dla dyskretyzacj dla metody Fuzzy3D (algorytmy 7-7-2).

153 Nazwa metody 240 danych uczących 68 danych uczących Lczba obszarów decyzyjnych Lczba % poprawnych dagnoz Lczba obszarów decyzyjnych Lczba % poprawnych dagnoz optymalna % % kodu IEC 63 68% 4 68% polska pogłębona 9 50% 8 48% nemecka % % francuska % % kanadyjska 7 9 8% 7 4 8% sec Pedrycza % dyskretyzacj % drzewo decyzyjne % ga_new % zmodyfkowana metoda % % a-najblŝszych sąsadów 68 dyskretyzacj % % drzewo decyzyjne % % Fuzzy3D % % Tabela 7-6. Porównane metod generowana reguł dagnostycznych uŝywanych metod w dagnostyce transformatorów Dagnoza człoweka-eksperta 53 Lczba zgodnych dagnoz uzyskanych metodą dyskretyzacj zboru 68-danych uczących dla danych ze zboru 240 danych uczących Bez uszkodzeń 3 Przegrzane ponŝej 50 o C 2 Przegrzane powyŝej 50 o C ponŝej 300 o C 3 Przegrzane powyŝej 300 o C ponŝej 700 o C 53 Przegrzane powyŝej 700 o C 66 Wyładowana nezupełne o duŝej energ 6 Wyładowana nezupełne o małej energ 9 Wyładowana zupełne o duŝej energ 9 Wyładowana zupełne o małej energ 3 Razem: 92 Tabela 7-7. Porównane dagnozy postawonej przez człoweka-eksperta z dagnozą wykonywaną na zborze 240 danych uczących wg obszarów decyzyjnych uzyskanych metodą dyskretyzacj na zborze 68 danych uczących.

154 54 Dagnoza człoweka-eksperta Lczba zgodnych dagnoz uzyskanych metodą Fuzzy3D wg zboru 68-danych uczących dla danych ze zboru 240 danych uczących Bez uszkodzeń 37 Przegrzane ponŝej 50 o C 2 Przegrzane powyŝej 50 o C ponŝej 300 o C 3 Przegrzane powyŝej 300 o C ponŝej 700 o C 6 Przegrzane powyŝej 700 o C 78 Wyładowana nezupełne o duŝej energ 6 Wyładowana nezupełne o małej energ Wyładowana zupełne o duŝej energ 2 Wyładowana zupełne o małej energ 3 Razem: 222 Tabela 7-8. Porównane dagnozy postawonej przez człoweka-eksperta z dagnozą wykonywaną na zborze 240 danych uczących wg obszarów decyzyjnych uzyskanych metodą Fuzzy3D na zborze 68 danych uczących. Dodatkowo wpsany jest do tabel 7-6 rezultat najlepszy z moŝlwych (jako metoda optymalna ): za pomocą 9 obszarów decyzyjnych (po jednym na kaŝdą klasę opsującą sta technczny transformatora) moŝna dagnozować poprawne wszystke dane uczące. Uzupełnenem tabel 7-6 jest metoda sec neuronowych Pedrycza, ale z powodu przeprowadzena ch uczena w neco nnej przestrzen, ne wnos ona stotnego rozwązana. Tabela 7-6 wyraźne pokazuje stotną jakość wykonywanej klasyfkacj przez metodę Fuzzy3D ne tylko metoda ta uŝywa stosunkowo newelu reguł rozmytych opsanych na obszarach decyzyjnych, ale teŝ wykonuje klasyfkację w znacznym stopnu poprawną. Łączy węc zalety metod dotychczas stosowanych (narodowych mędzynarodowych), które operając sę na newelkej lczbe obszarów decyzyjnych wykonywały jednak klasyfkację mernej poprawnośc, z metodam numerycznym, które uŝywając welu obszarów decyzyjnych realzowały usłuŝne narzędze dla dagnozującego, które to uŝywając moŝlwośc komputerów (baz danych) oferuje poprawną klasyfkację. Ops tego narzędza znajduje sę w rozdzale 8.

155 55 8. Moduł systemu ekspertowego: Trafo Podstawy systemów ekspertowych System ekspertowy [63] jest oprogramowanem komputerowym, które na podstawe szczegółowej wedzy moŝe wycągać wnosk podejmować decyzje, dzałając w sposób zblŝony do procesu rozumowana człoweka. Jednak proces rozumowana człoweka jest złoŝony - człowek potraf uwzględnć róŝnego rodzaju dane pomarowe, dokonać ch ponownej nterpretacj, skojarzyć z nnym, czy ntucyjne uzupełnć dane nekompletne. ZblŜane sę do tej jakośc procesu rozumowana osągane jest jedyne poprzez budowę nowych algorytmów programów komputerowych zwększane mocy oblczenowych. Systemy ekspertowe dzelmy na: - systemy podejmujące decyzje (bez udzału człoweka) - systemy krytykujące decyzje - systemy doradcze (prezentujące człowekow rozwązane do dalszej oceny). Proces stawana dagnozy stanu techncznego transformatora jest złoŝony uwzględna ne tylko wynk badań DGA, ale równeŝ wynk badań nnych metod (takch jak termczna, czy wbroakustyczna). Budując system ekspertowy o dzałanu zblŝonym do dzałana człoweka, naleŝałoby uwzględnć nne nŝ tylko DGA technk pomarowe. DuŜą rolę w tej dagnostyce pełn dośwadczene człoweka stąd system ekspertowy mógłby pełnć rolę jedyne systemu doradczego. Mając na względze te uwarunkowana wykonany system nformatyczny pełn raczej funkcję pojedynczego, ukerunkowanego na DGA modułu systemu ekspertowego Moduł Trafo2000 Zbudowany tu system nformatyczny o nazwe Trafo2000 zalcza sę do kategor systemów doradczych. Struktura wykonanego oprogramowana odbega neco od typowej organzacj głównych elementów systemu ekspertowego [63], co spowodowane jest jego hybrydową budową - w skład systemu Trafo2000 wchodz oprogramowane uczące wykonane w języku Vsual C++ ([u.] [u.9], [.3] [.5]) z uŝycem klas

156 MFC, a pozostałe elementy wykonane są w języku VBA ([u.20] [u.52]) z wykorzystanem dodatkowych moŝlwośc jake daje relacyjna baza danych ([u.53] [u.80], [.6] [.8]) MS Access 2000, a szczególne język SQL. Trafo2000 składa sę z następujących elementów: a) Trafo2000_data.mdb baza danych przechowująca wynk pomarów DGA b) Trafo2000_rules.mdb baza wedzy przechowująca reguły klasyfkujące pomary DGA do danej klasy stanu techncznego c) Trafo2000_ext.mdb nterfejs uŝytkownka do zarządzana bazą wedzy d) Trafo2000.mdb nterfejs uŝytkownka do zarządzana bazą danych e) Fuzzy3d.exe aplkacja budująca reguły klasyfkujące zgodne z algorytmam genetycznym opsanym w rozdzale 5 f) ga_new.exe aplkacja budująca reguły klasyfkujące zgodne z algorytmem opsanym w podrozdzale Trafo2000 moŝe być uŝywany w trzech konfguracjach: - podstawowej, która słuŝy do stawana dagnoz przetwarzana nformacj o wykonanych pomarach - rozszerzonej, która oprócz zastosowań konfguracj podstawowej słuŝy do uczena rozpoznawana kolejnych grup wzorców (zborów uczących) - mnmalnej, która słuŝy tylko do przeprowadzena uczena rozpoznawana grupy wzorców odpowedno dla dagnostyka, admnstratora-programsty, naukowca. Głównym elementam logcznym systemu są baza danych przechowująca wynk pomarów DGA oraz baza wedzy stałej zmennej przechowująca reguły klasyfkujące pomary DGA do danej klasy stanu techncznego. Oba te elementy technczne zrealzowane są w postac plków baz danych Trafo2000_data.mdb oraz Trafo2000_rules.mdb. Do nch wykonane są odpowedno dwa rozdzelne nterfejsy uŝytkownka - zebrane w plkach Trafo2000.mdb oraz Trafo2000_ext.mdb słuŝące do zarządzana posadanym danym oraz bazą wedzy. Baza wedzy stałej zbudowana jest w postac reguł jeŝel-to umoŝlwających wykonane, które to reguły reprezentują metody dagnozowana stanu techncznego transformatora olejowego w oparcu o wynk DGA uŝywane w chwl obecnej na śwece (czyl metody: kodu IEC, polska, nemecka, rosyjska, japońska, kanadyjska, amerykańska). Baza wedzy zmennej, to

157 naczej baza reguł, które potrafą być generowane (zmenane) na podstawe opsanych w pracy algorytmów grupowana klasyfkacj. Bazę faktów tworzą podzbory (zbory danych uczących * ) zboru danych pomarowych zawartych w baze danych, w oparcu o które wykonano bazę reguł. Zawarte w baze faktów dane mogą posłuŝyć jako uzasadnene (objaśnene) wykonanej dagnozy (rys. 8-). 57 Rysunek 8-. Główne elementy systemu ekspertowego w konfguracj podstawowej nterfejs uŝytkownka wykonany w plku Trafo2000.mdb Rysunek 8-2. Główne elementy systemu ekspertowego w konfguracj mnmalnej nterfejs uŝytkownka tworzą aplkacje Fuzzy3d.exe ga_new.exe * Są to tzw. odbtk (mgawk, z ang. snapshots) zapsy wybranej częśc danych w pewnej chwl czasu (zobacz [u.70], [u.79], [u.80]).

158 58 Rysunek 8-3. Główne elementy systemu ekspertowego w konfguracj rozszerzonej kolejny nterfejs uŝytkownka wykonany w plku Trafo2000_rules.mdb Dzęk zastosowanu popularnych rozwązań techncznych system ten pozostaje otwarty na dodatkowe moŝlwośc rozbudowy poszerzene jego funkcjonalnośc Baza danych pomarowych Baza danych zrealzowana w plku Trafo2000_data.mdb zawera w swojej strukturze nformacje o transformatorze oraz wynk pomarów stęŝeń gazów rozpuszczonych w oleju transformatorowym uzyskane metodą chromatograf gazowej wraz z dagnozą stanu techncznego wykonaną przez człoweka-eksperta. Baza ta zorganzowana jest w postac relacyjnej bazy danych zarządzanej przez system zarządzana relacyjną bazą danych Mcrosoft Access 2000 PL. Rysunek 8-4. Fragment nformacj o transformatorach

159 59 Rysunek 8-5. Fragment wynków pomarów DGA dagnoza człoweka-eksperta Wynk pomarów jak zaznaczono w rozdzale ne zawerają nformacj o dokładnośc pomaru Baza faktów Baza faktów zawera przekonwertowane dane z bazy danych pomarowych do przestrzen kodu IEC zgodne ze wzorem 6-2. Dokładność uzyskanych wynków ustalona jest wzorem 6-. W baze faktów moŝe stneć wele przekonwertowanych danych pogrupowanych w zbory słuŝące za dane uczące w nestandardowych metodach dagnostycznych (rozdzał 6.3) dające moŝlwość uzasadnena postawonej dagnozy. Rysunek 8-6. Fragment wynków pomarów DGA przekonwertowany do przestrzen kodu IEC umeszczony w zborze o nazwe 240 danych uczących wg tabel DANE_UCZACE Baza wedzy stałej Jak juŝ było wspomnane w poprzednm podrozdzale baza wedzy [68] stałej zawera reguły jeŝel-to, które odzwercedlają metody dagnostyk stosowane w śwece (opsane w rozdzale 6.2). Uzyskany z tej bazy zespół dagnoz daje człowekowekspertow pełnejszą nformację o stane techncznym transformatora nŝ pojedyncza dagnoza wykonana w oparcu o jedną metodę. Ponadto zaproponowane zespołu

160 dagnoz zmnejszy częstość występowana (a nawet wyelmnuje) przypadku, gdy dagnoza ne zostane postawona (tabela 8-). metoda: dagnoza: kodu IEC polska nemecka francuska kanadyjska Wszystke metody razem jest brak Tabela 8-. Lczność stawana dagnozy dla 444 danych pomarowych (metoda polska uwzględna stan zolacj celulozowej; metoda francuska zakłada stęŝene O 2 = 0 ppm N 2 = 0 ppm) 60 Jednak newątplwym problemem zastosowanego rozwązana jest newelka zgodność dagnoz uzyskwanych róŝnym metodam wynosząca około 7% (rozdzał tabele: ) Baza reguł Baza reguł przechowuje w sobe wynk prac opsywanych tu algorytmów celem wykonywana na nch klasyfkacj. olejne uruchomena algorytmów powększają lczbę przechowywanych tam wynków. Stąd baza ta ulega zmanom w przecweństwe do bazy wedzy stałej. Interfejs zarządzający tym zboram wynkowym umoŝlwa równeŝ ch usunęce lub drobne modyfkacje take jak zmana opsu. Rysunek 8-7. Fragment sztucznego eksperta uzyskany z aplkacj Fuzzy3D.exe wg tabel DANE_UCZACE Rysunek 8-8. Fragment danych zboru uczącego po wykonanu dyskretyzacj (rozdzał 6.3.3) wg tabel DANE_UCZACE_INT

161 6 Rysunek 8-9. Fragment danych opsujących drzewo decyzyjne (rozdzał 6.3.4) wg tabel DRZEWO_DECYZYJNE Rysunek 8-0. Fragment danych opsujących kompleksy w symplekse uzyskane z aplkacj ga_new.exe (rozdzał 6.3.5) wg tabel GA_NEW Interfejs uŝytkownka Trafo2000 Interfejs Trafo2000 ma za zadane umoŝlwć uŝytkownkow manpulacją danym zawartym w baze danych pomarów (poprzez ch dodane, edycję, usunęce). Ma umoŝlwć uŝytkownkow wykonane dagnozy w oparcu o dostępne wynk oblczeń numerycznych zawarte w baze wedzy stałej w baze reguł. Interfejs wymaga zalogowana sę uŝytkownka (np.: logn cholajda hasło 234 ), a następne wyśwetla okno wyszukwana transformatora (rysunek 8-). W okne tym moŝna ne tylko wyszukać potrzebne dane o transformatorze, ale równeŝ usunąć wszelke o nm zapsk, dodać nowy transformator najwaŝnejsze: przeanalzować dane pomarowe (przycsk Otwórz na rysunku 8-) dotychczas zebrane. Rysunek 8-. Okno szukana transformatora

162 62 W okne danych pomarowych transformatora (rysunek 8-2) moŝna wydrukować nformacje o samym transformatorze, wynk pomarowe moŝna zapsać do arkusza Excela lub je wydrukować jako wartośc, moŝna dodać nowe wynk pomarów stęŝeń gazów rozpuszczonych w oleju transformatorowym, moŝna teŝ je wydrukować na wykrese celem przeanalzowana ch przyrostów (rysunek 8-3). NajwaŜnejsze w tym okne jest polecene wykonana dagnozy na wynkach danego pomaru w oparcu o dostępne metody dagnostyczne (rysunek 8-4). Rysunek 8-2. Okno danych pomarowych transformatora Rysunek 8-3. Wydruk danych pomarowych transformatora wraz z wykresem przedstawającym zmany wartośc pomarowych w czase

163 63 Rysunek 8-4. Okno dagnoz danych pomarowych transformatora Okno dagnoz danych pomarowych transformatora (rysunek 8-4) otwera sę wykonując domyślne dagnozy danych pomarowych w oparcu o bazę wedzy stałej, czyl w oparcu o metody opsane w rozdzałach ,. Lsta dostępnych metod dagnostycznych zakończona jest polecenem Drukuj, którym moŝna poprosć o wydrukowane wynku pomaru wraz z jego szczegółowym uzasadnenem (np. rysunk ), co jest nejako podsumowanem wedzy o danej metodze dagnostycznej cennym narzędzem dla człoweka wykonującego dagnostykę. Rysunek 8-5. Wydruk dagnozy dla danych pomarowych transformatora wg metody nemeckej

164 Rysunek 8-6. Wydruk dagnozy danych pomarowych transformatora wg metody polskej pogłębonej 64

165 65 Rysunek 8-7. Wydruk dagnozy danych pomarowych transformatora wg metody kanadyjskej Rysunek 8-8. Wydruk dagnozy dla danych pomarowych transformatora wg metody francuskej

166 W okne dagnoz danych pomarowych transformatora (rysunek 8-4) moŝna równeŝ poprosć o wykonane dagnoz dostępnych w oparcu o nne, opsane w pracy metody take jak opsana w rozdzale metoda Zalecena eksperta (rysunek 6-5), czy opsana w rozdzale 6.3. zmodyfkowana metoda a-najblŝszych sąsadów (radobutton porównane odległośc z rysunku 8-4) dla 3-wymarowej przestrzenu kodu IEC (wzór 6-2) lub dla 0-wymarowej przestrzen wyznaczonej przez wynk pomarów DGA (rysunk ). 66 Rysunek 8-9. Wydruk dagnozy dla danych pomarowych transformatora wg zmodyfkowanej metody a-najblŝszych sąsadów w przestrzen IEC w systeme Trafo2000 nazywanej metodą TOP 0%

167 67 Rysunek Wydruk dagnozy dla danych pomarowych (0-wymarowych) transformatora wg zmodyfkowanej metody a-najblŝszych sąsadów w przestrzen DGA w systeme Trafo2000 nazywanej metodą TOP 0% RówneŜ opsana w rozdzale metoda rozmytego kodu IEC jest zamplementowana w oprogramowanu, a wynk zaproponowanego algorytmu dostępne są w forme wydruku (rysunek 8-2). Rysunek 8-2. Wydruk dagnozy dla danych pomarowych transformatora wg metody rozmytego kodu IEC

168 68 RówneŜ dagnoza danych pomarowych dostępna jest do wykonana wydrukowana (rysunek 8-22) poprzez klastry uzyskane w wynku podzału połówkowego przestrzen danych pomarowych (rozdzał 6.3.3). Rysunek Wydruk dagnozy dla danych pomarowych transformatora wg klastrów lastry zebrane w drzewo decyzyjne (rozdzał 6.3.4) równeŝ udostępnają moŝlwość wykonana dagnozy na ch podstawe (rysunek 8-23). MoŜna równeŝ zaŝądać prezentacj (w forme wydruku) samego drzewa decyzyjnego lub praw w nm zawartych (odpowedno rysunek 8-24 oraz 8-25). Rysunek Wydruk dagnozy dla danych pomarowych transformatora wg drzewa decyzyjnego

169 69 Rysunek Wydruk konstrukcj drzewa decyzyjnego Rysunek Wydruk prawa słuŝącego do dagnozy, a zawartego w drzewe decyzyjnym Opsany w rozdzale algorytm genetyczny równeŝ generuje prawa jeŝel-to umoŝlwające klasyfkację danego pomaru (rysunek 8-26) oraz prezentację samych praw (rysunek 8-27).

170 70 Rysunek Wydruk dagnozy dla danych pomarowych transformatora wg prawa zapsanego w symplekse Rysunek Wydruk prawa słuŝącego do dagnozy, a uzyskanego z algorytmu genetycznego Wreszce moŝlwa jest takŝe klasyfkacja wynku pomaru wg sztucznego eksperta, którego uzyskane opsano w rozdzale 7. MoŜlwe jest teŝ wykonane wydruku samej dagnozy (rysunek 8-28) oraz samego eksperta (rysunek 8-29).

171 7 Rysunek Wydruk dagnozy dla danych pomarowych transformatora wg sztucznego eksperta Rysunek Wydruk prawa słuŝącego do dagnozy, a uzyskanego ze sztucznego eksperta Reasumując: nterfejs uŝytkownka Trafo2000 umoŝlwa manpulację danym pomarowym wynków DGA oraz wykonywane dagnoz wększoścą metod opsanych w rozdzale 6 7 (dagnostyka regułam uzyskanym z sec Pedrycza ne jest dostępna poprzez ten nterfejs).

172 Interfejs uŝytkownka Trafo2000_ext Interfejs zarządzający bazą wedzy Trafo2000_ext ma na celu umoŝlwene uŝytkownkow przejrzene elementów zborów uczących właścwośc samych zborów, tworzene nowych zborów uczących, usuwane zbędnych, czy modyfkację ch wybranych właścwośc takch jak rozmar przestrzen, w której ów zbór sę znajduje. Czynnośc te dostępne są dla grupy poleceń Zarządzane bazą faktów z okna Zbory uczące (rysunek 8-30), które pojawa sę po zalogowanu. Rysunek Okno zarządzana bazą wedzy ( nektórych elementów bazy faktów) Ponadto zaprezentowane okno umoŝlwa spreparowane konfguracyjnych plków dla aplkacj ga_new.exe realzującej algorytm genetyczny opsany w rozdzale oraz wczytane wynków jej pracy. RówneŜ z tego okna moŝna wykonać podzał przestrzen zbory uczącego na podobszary dyskretne, moŝna zapsać wynk tego podzału w forme klastrów, moŝna wykonać drzewo decyzyjne. Oddzelne moŝna takŝe skontrolować przebeg drugego z algorytmów genetycznych opsanego w rozdzale 7 zamplementowanego w aplkacj Fuzzy3D.exe (rysunek 8-3).

173 73 Rysunek 8-3. Okno zarządzana nformacjam o przebegach algorytmu genetycznego - ops zboru uczącego Rysunek Okno zarządzana nformacjam o przebegach algorytmu genetycznego parametry algorytmu W okne tym moŝna skontrolować z jakm parametram został uruchomony algorytm genetyczny (rysunek 8-32), czy przejrzeć jak w kolejnych generacjach zmenały sę uzyskwane najlepsze wynk (rysunek 8-33).

174 74 Rysunek Okno zarządzana nformacjam o przebegach algorytmu genetycznego zapsy o najlepszym chromosome (eksperce) w danej generacj oraz okno szczegółowych wadomośc o wybranym eksperce W spse wynków (rysunek 8-33) po zaznaczenu konkretnego chromosomu moŝna zobaczyć szczegółowe o nm nformacje take jak: z jakch praw sę składa, le ch jest, do jakego podzału przestrzen naleŝą, w której z kole generacj uzyskano ten najlepszy chromosom, le praw zawera łączne, le danych potraf nm sklasyfkować poprawne tp. MoŜna teŝ wykonać test, czy dane o eksperce zapsane są poprawne przez aplkację Fuzzy3D.exe. MoŜna teŝ usunąć dane szczegółowe pozostawając tylko dane nagłówkowe (ogólne) o eksperce celem wykonywana jedyne analzy przebegu algorytmu genetycznego zwolnena mejsca w baze wedzy. W kolejnej zakładce okna zarządzana przebegem algorytmu genetycznego moŝna przeanalzować wykres prezentujący jak zmenało sę przystosowane maksymalne, średne mnmalne w kolejnych generacjach (rysunek 8-34). Zaprezentowany tu rysunek 8-34 wyraźne pokazuje efekt dzałana nowych operatorów genetycznych w postac przebjana szklanego suftu przez najlepszy z chromosomów co wdoczne jest w poprawe wartośc przystosowana maksymalnego dąŝena przez tę wartość do wartośc maksymalnej wynoszącej. Pozostałe analzy dostępne w tym okne mają charakter pomocnczy.

175 75 Rysunek Okno nformacj przebegu algorytmu genetycznego poprawa przystosowana najlepszego chromosomu dla około 4000 generacj. Reasumując: poprzez wykonany nterfejs zarządzana bazą wedzy uŝytkownk dostaje do ręk wygodne narzędze do zarządzana oraz do analzy wynków Interfejs uŝytkownka ga_new Fuzzy3D Wykonane (rysunek 8-30) plk z dyskretnym danym uczącym do metody opsanej w rozdzale mogą być łatwo zamenone na dane zboru POS NEG. Do tego celu wykonano pomocnczy nterfejs MALEDIN-Trafo2000 (rysunek 8-35). Za pomocą tego oprogramowana uŝytkownk moŝe wczytać cały zbór danych uczących wygenerować z nego zbory POS NEG, na których pracuje aplkacja ga_new.exe realzująca algorytm opsany w rozdzale Inferfejs MALEDIN-Trafo2000 składa sę z dwóch zasadnczych elementów zarządzana zboram danych uczena maszynowego (rysunek 8-35). W ramach zarządzana danym moŝna m.n. wczytać dane uczące (rysunek 8-36), ustalć co wyróŝna wczytane dane jak zbór wartośc oznacza klasę (rysunek 8-37). Po podzelenu całego zboru uczącego na rozłączne podzbory ze względu na ustaloną klasę, moŝna wybrać (rysunek 8-38) jeden z nch

176 jako zbór POS - pozostałe tworzą zbór NEG, a nawet spróbować samodzelne wykonać pomocnczy zbór danych dagnostycznych DDD. 76 Rysunek Okno nterfejsu MELEDIN-Trafo2000. Rysunek Okno przetwarzana danych uczących dla aplkacj ga_new.exe wczytane danych. Rysunek Okno przetwarzana danych uczących dla aplkacj ga_new.exe budowa plków z danym POS NEG.

177 77 Rysunek Okno przetwarzana danych uczących dla aplkacj ga_new.exe włączene uczena maszynowego dla zadanego zboru POS (pozostałe tworzą NEG). Rysunek Okno przetwarzana danych uczących dla aplkacj ga_new.exe Uruchomona aplkacja ga_new.exe potraf w pełn automatyczne przetworzyć wczytane zbory algorytmem opsanym w rozdzale (rysunek 8-40) w tym celu naleŝy ustawć parametry jej pracy (menu Settngs ) oraz w menu Processng ustawć przełącznk Fully automatc wydać polecene GO! z paska narzędz.

178 Wynk pracy tej aplkacj zapsane w plku tekstowym LASA.FFF moŝna zamportować celem dalszej analzy poprzez nterfejs Trafo2000_ext (rysunek 8-30). 78 Rysunek Wynk przetwarzana danych uczących w aplkacj ga_new.exe fragment reguły klasyfkującej Innym nterfejsem uŝytkownka jest aplkacja Fuzzy3D.exe, która ne potrzebuje pomocnczego programu ną zarządzającego samodzelne łączy sę (poprzez ODBC) z bazą faktów samodzelne zapsuje w nej wynk swojego przebegu (realzacj) celem dalszych analz (rysunk 8-32, 8-33, 8-34). Rysunek 8-4. Fuzzy3D.exe prezentacja wczytanych danych uczących

179 Posługwane sę nterfejsem Fuzzy3D.exe wymaga jedyne wydawana polecena Dalej. Po wczytanu danych uczących naleŝy zdecydować sę na sposób ch konwersj jednym z zaproponowanych (rozdzał 7.4) odwzorowań (rysunek 8-42) celem redukcj czasochłonnośc rozwązywana zadana dzęk próbe rozrzedzena obszarów, w których występuje wele danych naleŝących do róŝnych klas (dane trudnoseparowalne). Po wykonanu konwersj aplkacja zaczyna wykonywać kolejne podzały (rozdzał 7.3) celem generowana reguł klasyfkujących (rysunek ). 79 Rysunek Fuzzy3D.exe prezentacja wczytanych danych uczących po transformacj Rysunek Fuzzy3D.exe podzał przestrzen danych uczących na podobszary (tu kaŝdy z boków sześcanu jednostkowego podzelono na =2 częśc)

180 80 Rysunek Fuzzy3D.exe końcowy podzał przestrzen danych uczących na podobszary (tu kaŝdy z boków sześcanu jednostkowego podzelono na =2 częśc) Po zakończenu wykonywana podzałów aplkacja prezentuje obszary decyzyjne uzyskane z próby wykonana klasyfkacj wszystkm uzyskanym prawam (rysunek 8-45), a następne wymaga określena parametrów uruchomenowych algorytmu genetycznego (rysunek 8-46). Rysunek Fuzzy3D.exe klasyfkacja przykładowych danych z uwzględnenem praw wygenerowanych podczas ostatnego podzału (tu =2)

181 8 Rysunek Fuzzy3D.exe parametryzacja algorytmu genetycznego Rysunek Fuzzy3D.exe generacja startowa algorytmu genetycznego Rysunek Fuzzy3D.exe generacja końcowa algorytmu genetycznego (tu ustawono na potrzeby prezentacj tylko 5 generacj do wykonana)

182 Wykonany przebeg algorytmu genetycznego zapsywany jest co 0 generacj do bazy faktów kończy sę wraz z osągnęcem z góry ustalonej lczby generacj (rysunek ). Najlepszy z uzyskanych chromosomów zapsany jest w baze faktów jako ekspert (rysunek 8-49). Po jego uzyskanu moŝna wczytać z bazy faktów nnych ekspertów (rysunek 8-50) wykonywać klasyfkację nowych danych pomarowych w oparcu o ch całą grupę (rysunek ). 82 Rysunek Fuzzy3D.exe rozmyte obszary decyzyjne wg praw zawartych w najlepszym chromosome (znaczene kolorów jak na rysunku 8-45) Rysunek Fuzzy3D.exe wczytane najlepszych wynków: ekspertów (uzyskanych z nnych przebegów aplkacj Fuzzy3D.exe) Rysunek 8-5. Fuzzy3D.exe klasyfkacja nowego pomaru przez grupę wczytanych ekspertów

183 83 Rysunek Fuzzy3D.exe wynk współpracy grupy ekspertów: klasyfkacja nowego pomaru Dysponując grupą ekspertów w aplkacj Fuzzy3D.exe moŝna wykonać zestawene praw w nch zawartych zapsać je w forme plku tekstowego (rysunk ) celem uzyskana wedzy przez człoweka. Rysunek Fuzzy3D.exe wedza dla człoweka: analza reguł jeŝel-to z ekspertów Rysunek Fuzzy3D.exe wedza dla człoweka: analza reguł jeŝel-to z ekspertów, a zapsanych w plku tekstowym

184 84 Rysunek Fuzzy3D.exe analza jakośc uzyskanego eksperta: obszary decyzyjne (znaczene kolorów jak na rysunku 8-45) hstogram pewnośc udzelanej odpowedz podczas klasyfkacj (charakterystyczny jest newelk udzał odpowedz bardzo pewnych ze względu na posadane newelkej lczby praw juŝ uogólnonych, zamast welkej lczby praw szczegółowych) MoŜlwe jest równeŝ w aplkacj Fuzzy3D.exe przeanalzowane jakośc uzyskanego eksperta poprzez zestawene lczby danych klasyfkowanych przez prawa w nm zawarte w sposób poprawny nepoprawny, wykonane prezentacj przestrzen decyzyjnych oraz prezentacj charakteru eksperta w forme hstogramu, uzyskanego dla próby dagnozowana mln przykładowych danych pomarowych zestawenu pewnośc udzelanej dagnozy. Ekspert dobrze wyuczony (rysunek 8-55) ze względu na newelką lczbę praw w nm zawartych, będze często udzelać odpowedz nepewnych, co wynka z faktu uŝywana praw wygenerowanych dla duŝych obszarów. Ekspert słabo wyuczony będze często udzelać odpowedz pewnych, gdyŝ posługuje sę on weloma prawam przyporządkowanym do newelkch obszarów, a tym samym o duŝych wartoścach zaufana. Opsane tu oprogramowane ma wele cech systemu ekspertowego, jednak ze względu na to, Ŝe ne berze pod uwagę nnych metod dagnostycznych poza DGA, naleŝy je traktować jako moduł systemu, który będze wspomagać proces podejmowana decyzj przez człoweka nt. stanu techncznego transformatora.

Pokazać jeszcze