Autoreferat Imę Nazwsko: Wocech Froelch Instytut Informatyk, Unwersytet Śląsk, ul. Będznska 39, 41-200 Sosnowec Emal: wocech.froelch@us.edu.pl www: https://stes.google.com/ste/wfroelchhomepage/home 2. Posadane dyplomy Tytuł magstra nżynera nformatyk, specalność: budowa oprogramowane maszyn matematycznych; dyplom ukończena wyższych studów magsterskch: Poltechnka Śląska, Wydzał Informatyk, Elektronk Automatyk, Glwce, kerunek Informatyka, rok 1987; praca magsterska pt. Symulator mkroprocesorów Motorola 6800 napsana pod kerunkem dr nż. Krzysztofa Nałęckego. Stopeń doktora nauk techncznych w zakrese nformatyk; Akadema Górnczo-Hutncza w Krakowe; rok 2004; rozprawa doktorska pt. Agentowo-ewolucyny model pozyskwana wedzy napsana pod kerunkem Prof. dr hab. nż. Edwarda Nawareckego. 3. Informace o dotychczasowym zatrudnenu w ednostkach naukowych 1987 1989 Instytut Informatyk Czasu Rzeczywstego, Poltechnka Śląska w Glwcach (w tym roczna służba woskowa). 1994 do teraz, Instytut Informatyk, Wydzał Informatyk Nauk o Materałach, Unwersytet Śląsk, Sosnowec. 4. Wskazane osągnęca (zgodne z art. 16 ust. 2 ustawy z dna 14 marca 2003 r. o stopnach naukowych tytule naukowym oraz o stopnach tytule w zakrese sztuk (Dz. U. nr 65, poz. 595 ze zm.): Jako podstawowe osągnece naukowe przedstawam cykl dwunastu publkac monotematycznych. Wszystke wskazane artykuły zostały zrealzowane po uzyskanu przeze mne tytułu doktora. a) tytuł osągnęca naukowego Rozmyte sec kogntywne rozwó teor zastosowań. 1
b) (autor/autorzy, tytuł/tytuły publkac, rok wydana, nazwa wydawnctwa) Publkace w czasopsmach posadaących współczynnk Impact Factor: [P1] E. I. Papageorgou, W. Froelch, Applcaton of Evolutonary Fuzzy Cogntve Maps for Predcton of Pulmonary Infectons. IEEE Transactons on Informaton Technology n Bomedcne 16(1), pp. 143-149, 2012 [P2] E. I. Papageorgou, W. Froelch, Mult-step predcton of pulmonary nfecton wth the use of evolutonary fuzzy cogntve maps. Neurocomputng, 92, pp.28-35, 2012 [P3] W. Froelch, E. I. Papageorgou, M. Samarnas, K. Skrapas, Applcaton of evolutonary fuzzy cogntve maps to the long-term predcton of prostate cancer, Appled Soft Computng, 12(12), pp. 3810 3817, 2012 [P4] W. Froelch, J.L. Salmeron, Evolutonary Learnng of Fuzzy Grey Cogntve Maps for the Forecastng of Multvarate, Interval-Valued Tme Seres, Internatonal Journal of Approxmate Reasonng 55 (6), pp. 1319-1335, 2014 [P5] J.L. Salmeron, W. Froelch, Dynamc Optmzaton of Fuzzy Cogntve Maps for Tme Seres Forecastng, Knowledge-based systems 105, pp. 29-37, 2016 [P6] W.Froelch, W.Pedrycz, Fuzzy Cogntve Maps n the Modelng of Granular Tme Seres, Knowledgebased systems, Volume 115, pp. 110-122, 2017 [P7] W.Froelch, Towards Improvng the Efcency of the Fuzzy Cogntve Map Classfer, Neurocomputng, 2016, DOI: 10.1016/.neucom.2016.11.059 [P8] P. Juszczuk, W. Froelch, Learnng Fuzzy Cogntve Map Usng a Dfferental Evoluton Algorthm, Polsh Journal of Envronmental Studes, Vol. 18, No. 3B, pp. 108-112, 2009 Publkace pozostałe: [P9] W. Froelch, P. Juszczuk, Predctve Capabltes of Adaptve and Evolutonary Fuzzy Cogntve Maps - A Comparatve Study, w ksążce: Intellgent Systems for Knowledge Management, seres: Studes n Computatonal Intellgence, Vol. 252, pp. 153-174, 2009 [P10] W. Froelch, E.I. Papageorgou, Extended Evolutonary Learnng of Fuzzy Cogntve Maps for the Predcton of Multvarate Tme-Seres, w ksążce: Fuzzy Cogntve Maps for Appled Scences and Engneerng, seres: Intellgent Systems Reference Lbrary, pp. 121-131, 2014 [P11] W. Froelch, A. Wakulcz-Dea, Applcaton of Fuzzy Cogntve Maps for Stock Market Modelng and Forecastng, Lecture Notes n Artfcal Intellgence, Vol. 5027, 2008, pp. 72 81 [P12] W. Froelch, A. Wakulcz-Dea, Mnng Temporal Medcal Data Usng Adaptve Fuzzy Cogntve Maps, Proceedngs of the HSI 09, 2nd Internatonal Conference on Human System Interacton, Catana, Italy, 21-23 May, 2009, pp. 16-23 2
c) omówene celu naukowego wymenonych prac osągnętych wynków wraz z omówenem ch ewentualnego wykorzystana. 4.1 Cel naukowy Celem naukowym wymenonych prac był rozwó teor zastosowań modelu rozmytych sec kogntywnych (ang. Fuzzy Cogntve Maps - FCMs). Prowadzone pracy podemowały problemy modelowana predykc szeregów czasowych oraz klasyfkac. Ponże przedstawam schemat prowadzonych prac. Rozmyte sec kogntywne Modelowane predykca szeregów czasowych Klasyfkaca Poprawa akośc predykc edno welo- wymarowych szeregów czasowych Modelowane predykca aproksymowanych szeregów czasowych Poprawa akośc klasyfkac Szczegółowe cele naukowe wymenam ponże: poprawa efektywnośc sec FCM podczas ednokrokowe predykc szeregów czasowych (wynk badań w tym zakrese opsano w rozdzale 4.3.1 oraz w artykułach [P1,P5,P9,P10]), poprawa efektywnośc sec FCM podczas welokrokowe predykc szeregów czasowych (wynk badań w tym zakrese opsano w rozdzale 4.3.2 oraz w artykułach [P2,P3]), adaptaca rozmytych szarych sec kogntywnych FGCM w celu umożlwena predykc przedzałowych, welowymarowych szeregów czasowych (wynk badań w tym zakrese opsano w rozdzale 4.3.3 oraz w artykule [P4]), konstrukca granularnego modelu szeregu czasowego oraz ego predykca za pomocą sec FCM (wynk badań w tym zakrese opsano w rozdzale 4.3.4 oraz w artykule [P6]), poprawa efektywnośc dzałana klasyfkatora opartego na sec FCM (wynk badań w tym zakrese opsano w rozdzale 4.3.5 oraz w artykule [P7], Nezależne od powyże przedstawonych celów teoretycznych, w wększośc prac postawono rozwązano konkretne problemy praktyczne. Prowadzono też prace, których celem były wyłączne nowe zastosowana (opsane w artykułach [P8,P11,P12]). Wynk badań w zakrese zastosowań opsano w rozdzale 4.3.6. Ponże przedstawam wprowadzene teoretyczne dotyczące rozmytych sec kogntywnych oraz prezentue poszczególne etapy przeprowadzonych badań. Na każdym etape badań opsuę podęty problem wraz z ego motywacam, przedstawam proponowane rozwązane (nowość teoretyczną) oraz wybrane efekty praktyczne wprowadzonych nowośc. 3
W nneszym autoreferace stosuę uednolcony sposób oznaczeń (neznaczne zmodyfkowany w stosunku do tego używanego we wskazanych artykułach). 4.2 Wprowadzene Oznaczmy przez t 0,1,...,t dyskretną skalę czasu, gdze k est parametrem ogranczaącym e zakres. k Nech v1 ( t), v2( t),..., vn ( t), n oznaczaą zmenne obserwowane w czase. Wartośc tych zmennych tworzą wektor V(t). Sekwenca takch wektorów rozumana est ako n-wymarowy szereg czasowy { V ( t)}. Nech C będze rodzną zborów rozmytych. Dla każde obserwac v (t) oblczany est stopeń e przynależnośc do odpowadaącego zboru rozmytego c C. W chwl czasu t mamy: c ( t) = ( v ( t)). Wartość c (t) nazywana est stopnem aktywac lub stanem poęca c, w chwl t. W przypadku ogólnym, kształt funkc przynależnośc może być defnowany przez eksperta lub uczony na podstawe danych. W zastosowanach praktycznych funkca przynależnośc przymowana est często ako normalzaca typu mn-max [12], tzn.: c t) = ( v ( t) mn( v )) /(max( v ) mn( v )), gdze: max ( v ), max ( v ) to mnmum ( maksmum osągane przez zmenną v. W zależnośc od zastosowana, wartośc max ( v ), max ( v ) podawane są przez eksperta lub oblczane są na podstawe danych. W efekce otrzymuemy wektor stanu sec FCM, tzn. C(t). Seć FCM zdefnowana est ako para < C, W >, gdze C to rodzna zborów rozmytych (poęć wchodzących w skład FCM); W to kwadratowa macerz wag przypsanych poszczególnym parom poęć [2]. Stan FCM w chwl t opsany est przez wektor C(t). Elementy macerzy W to wag w [1,1] przypsane parom poęć. Waga w = 1 reprezentue w pełn pozytywny wpływ, a waga w = 1 w pełn negatywny wpływ -tego poęca na poęce -te. Wartośc wększe nż -1 mnesze nż 1 reprezentuą pośredne wartośc oddzaływań. Rozmyta seć kogntywna nterpretowana est ako graf ważony [1, 2]. Węzły grafu (poęca) to zbory rozmyte opsuące modelowany problem, krawędze grafu opsane wagam reprezentuą zależnośc określane często ako przyczynowo skutkowe. Podczas wnoskowana opartego na modelu FCM wpływ poęć przyczynowych na poęca skutkowe est kumulowany przekształcany przy zastosowanu nelnowe funkc transformac f. Z tego powodu FCM est modelem nelnowym. Wnoskowane w sec FCM realzowane est ako predykca stanów poęć ( t 1), w tym celu naczęśce stosowany est wzór (1): n c c ( t 1) = f ( w c ( t)), (1) przy czym c (t) oznacza aktualny stan -tego poęca, w - est wagą przypsaną do skerowane krawędz łączące -te poęce z -tym, n = card( C) oznacza lczność zboru poęć C, f (x) est funkcą transformac. Funkca transformac wprowadza nelnowość do modelu FCM oraz ograncza ważoną sumę stanów poęć do zakresu [0,1]. Różnego typu funkce transformac używane są w konkretnych zastosowanach, np. dwuwartoścowa, trówartoścowa lub naczęśce stosowana logstyczna: =1, 4
1 f ( x) =, przy czym g > 0 est parametrem określaącym wzmocnene uzyskwane podczas gx 1 e transformac. Formuła (1) nazywana est często równanem wnoskowana sec FCM. W przypadku konecznośc przeprowadzena predykc welokrokowe (długotermnowe), równane wnoskowana (1) wywoływane est teracyne dla kolenych kroków czasu. Po oblczenu za pomocą równana (1) przewdywanych stanów poęć, przeprowadzane est wyostrzane (defuzyfkaca) lub denormalzaca stanów poęć. Tradycyne, znane z lteratury metody uczena sec FCM optymalzuą wag sec przechowywyane w macerzy W w celu uzyskana nalepsze możlwe dokładnośc predykc stanu poęć. Zbór poęć C est wtedy zdefnowany przez eksperta, edyne macerz W podlega uczenu na podstawe danych hstorycznych. Znane są dwe podstawowe metody uczena FCM, adaptacyne populacyne. Algorytmy adaptacyne operaą sę na pomyśle uczena Hebba zaadaptowanego z teor sztucznych sec neuronowych. Adaptacyne metody uczena FCM obemuą algorytmy: dynamczny algorytm Hebba - DHL [13], zbalansowany dynamczny algorytm adaptacyny (ang. balanced dynamc algorthm BDA) [14], aktywny algorytm uczena Hebba (actve Hebban learnng AHL) [15] oraz nelnowy algorytm uczena Hebba (ang. nonlnear hebban learnng - NHL [16]. Naważnesze populacyne algorytmy uczena to: algorytm genetyczny (ang. real-coded genetc algorthm RCGA) [17], algorytm mrowskowy (ang. partcle swarm optmzaton - PSO) [18], algorytm oparty na symulowanym wyżarzanu (ang. smmulated annealng SA) [19], algorytm oparty na ewoluc różncowe (ang. dfferental evoluton DE) [10]. Stosuąc algorytm genetyczny RCGA kolene wersze macerzy W odwzorowane są eden po drugm w chromosome (wektorze lczb rzeczywstych) [17]. Elementy na główne przekątne macerzy W są zerowe poneważ ne borą udzału podczas predykc realzowane za pomocą równana (1). Przykładowe odwzorowane mędzy secą FCM wektorem chromosomu lustrue rysunek 1. Rysunek 1. Konstrukca chromosomu na podstawe rozmyte sec kogntywne Kolene populace chromosomów ocenane są przez algorytm genetyczny wykorzystuąc funkcę przystosowana. Przykładowo, funkca ta może być sformułowana ako: ftness( FCM ) =1/(1 e), gdze e oznacza zakumulowany średn błąd predykc wszystkch poęć dla określonego okresu czasu. Pommo stnena różnych ugruntowanych metod oblczana błędów predykc szeregów czasowych, w przypadku FCM naczęśce dotychczas stosowaną w tym celu formułą est (2)[27]: k 1 n e 1 = ( ts 1), ( k 1) n (2) s=1 =1 5
przy czym: t < 0,1,2,..., tk >, n = card( C) est lcznoścą zboru poęć. Symbol oznacza ednostkowy błąd predykc oblczany za pomocą formuły (3): ( t 1) = c ( t 1) c ( t 1), (3) gdze c ( t 1) est przewdywanym przez FCM stanem -tego poęca w czase t 1, c ( t 1) oznacza znany, zapsany w danych hstorycznych stan -tego poęca w czase t 1. Efektem uczena est chromosom, nalepe ocenony przez funkcę przystosowana w ostatne populac. Chromosom ten est dekodowany do postac sec FCM, która z kole est testowana w wyznaczonym okrese czasu. Podczas testowana, błędy predykc ocenane są za pomocą wzoru (2), przy czym k oznacza wtedy lczbę kroków czasu w okrese testowym. Rozmyte sec kogntywne były do te pory używane w różnych dzedznach zastosowań, w szczególnośc w systemach wspomagana decyz[3, 4], predykc szeregów czasowych[5, 6, 7, 8], sterowanu [9], uczenu maszynowym[10] oraz nnych. Przegląd badań dotyczących FCM został przedstawony w pracy [11]. Można zauważyć, że sec FCM są metodą reprezentac wedzy podobną do sztucznych sec neuronowych (ang. Artfcal Neural Network ANN). W przecweństwe do ANN, sec FCM ne wymagaą wyróżnana węzłów(poęć) weścowych oraz wyścowych. Wszystke węzły FCM mogą pełnć obe role, a ch stany powązane są bezpośredno z danym źródłowym. Poneważ sec FCM ne zaweraą węzłów ukrytych, elmnowana est ucążlwa procedura doboru lczby ukrytych warstw węzłów. 4.3 Podęte problemy naukowe, zaproponowane rozwązana oraz uzyskane wynk. Perwsza grupa problemów, które podąłem w moch badanach dotyczy poprawy akośc predykc szeregów czasowych uzyskwanych za pomocą standardowych sec FCM. W perwsze kolenośc zrealzowałem porównane dotyczące efektywnośc dotychczas znanych, adaptacynych populacynych algorytmów uczena FCM. W pracy [P9] przedstawono wynk tych porównań. Równeż w artykule [P9] przedstawono wynk analz oraz rezultaty eksperymentów dowodzące przewagę algorytmów populacynych RCGA DE nad algorytmam adaptacynym DHL oraz BDA. Z tego powodu, w wększośc moch kolenych prac koncentrowałem sę na probleme poprawy efektywnośc uczena FCM z wykorzystanem metod populacynych. 4.3.1 Poprawa efektywnośc ednokrokowe predykc szeregów czasowych uzyskwane za pomocą modelu FCM [P1,P5,P8] Problem W celu wyaśnena perwszego podemowanego problemu przeanalzumy ednokerunkowy wpływ poęca c 1 na c 2 [P1]. Rozważamy w tym przypadku trywalną seć FCM złożoną tylko z tych dwóch poęć. Załóżmy stnene tylko edne krawędz mędzy poęcam, nech przypsana e waga wynos w 12 1. Zamast stosowana wzoru (1), stosuemy przeskalowane równane (4) zaproponowane w pracy [14], stosowane także w artykule [P1]: 6
n c ( t 1) f ( (2c ( t) 1) w ) (4) 1, Stosuąc wzór (4) dla predykc stanu poęca c 2, otrzymuemy: c 2( t 1) f (2c1 ( t) 1). Rysunek 2 lustrue wykres te funkc, przy założenu logstyczne funkc transformac o wzmocnenu g = 5. Jak można zauważyć na Rysunku 2, wykres funkc może zostać podzelny pod względem charakterystyk kształtu na trzy obszary. Perwszy z tych obszarów est zblżony do funkc lnowe został zaznaczony ako A. Ten fragment kształtu funkc znadue sę w sąsedztwe punktu < 0.5, 0.5 >. W marę ak odległość od tego punktu rośne, wykres funkc stae sę coraz bardze nelnowy. Nelnowe częśc wykresu oznaczono ako obszary B. Przy dalszym oddalanu sę od punktu < 0.5, 0.5 > wykres funkc stae sę znowu zblżony do lnowego w obszarach oznaczonych ako C. W konsekwenc, wpływ poęca przyczynowego c 1 na poęce skutkowe c 2 uzależnony est od obszaru funkc transformac, który aktualne est wykorzystywany podczas wnoskowana. W obszarach C, tam gdze pochodna funkc est blska zeru f '( x) 0, nezależne od stanu poęca c 1, po transformac uzyskuemy f ( x) 0 lub f ( x) 1. Oznacza to, że w obszarach C zależność mędzy poęcam est nezależna lub w znkomy sposób zależna od wag w 12. Rysunek 2. Wykres przeskalowane funkc transformac dla parametru g = 5 Wadą logstyczne funkc transformac est koneczność ustalana przez eksperta wartośc parametru wzmocnena g, często nezależne od rozpatrywanych danych. W ten sposób powstae możlwość zbyt małego lub zbyt dużego wzmocnena realzowanego przez seć. W szczególnośc est to stotne w obszarze A, w którym pochodna f '( x) est prawe stała, uzależnona od wartośc g. Z druge strony, wartośc wag w [1,1 ] są także ogranczone w zdefnowanym zakrese. W efekce, skumulowany wpływ poęć przyczynowych na skutkowe est ogranczony dla wybranych danych może okazać sę zbyt mały w celu realzac predykc stanu poęca docelowego. Ograncza to efektywność dzałana całe sec FCM. Przeanalzumy eszcze wpływ parametru g na kształt funkc f(x). Na Rysunku 3 przedstawono klka przykładowych wykresów funkc transformac dla różnych wartośc parametru g. Można zauważyć, że zwększaąc g, dla g > 5, obszar lnowośc A zmnesza sę przy równoczesnym wzrośce w tym obszarze wartośc pochodne f (x). 7
Rysunek 3. Porównane funkc transformac dla różnych warośc wzmocnena g Obszary B prawe zankaą, przy czym obszary C powększaą sę. Z druge strony, dla g = 0 funkca transformac stae sę stała, tzn. f(x) = 0.5, co prowadz do całkowte utraty nformac przenoszone mędzy poęcam. Powyższa analza pokazue w ak stotny sposób kształt funkc transformac uzależnony est od wartośc parametru g oraz ak bardzo wływa to na właścwośc sec FCM. Rozwązane 1 [P1] W celu zwększena efektywnośc predykc uzyskwane za pomocą modelu FCM zaproponowano optymalzacę parametru g dostosowane go do charakterystyk danych. Ze względu na wzaemną zależność, parametr g optymalzowany est razem z macerzą W sec FCM. W pracy [P1] proponowane est uwzględnene parametru g ako elementu wektora chromosomu (genu) w procese optymalzac realzowane za pomocą algorytmu genetycznego. Problem W celu wyaśnena kolenego problemu dotyczącego dzałana sec FCM, przeanalzumy wpływ procesu normalzac typu mn-max na wartośc stanów poszczególnych poęć FCM. W przypadku gdy v max( v ), po przeprowadzenu normalzac otrzymuemy wartość poęca c 1. Dla v mn( v ) otrzymuemy c 0. Rozważmy przypadek wystąpena wartośc odstaące w analzowanym szeregu czasowym. Po przeprowadzenu normalzac wszystkch obserwac v (t) wększość stanów odpowadaącego poęca c zostae przesunęta w kerunku wartośc 0 lub 1 (w zależnośc od typu wartośc odstaące występuące w szeregu czasowym). Jak pokazano na przykładze zawartym w pracy [P1] funkca transformac wykorzystywana est wtedy główne w zakrese obszarów C, w których ak opsano wcześne, następue utrata częśc nformac przekazywane mędzy poęcam. Rozwązane 2 [P1] W celu rozwązana zastnałego problemu zaproponowano w pracy [P1] kontrolowane przesunęce wartośc poęć FCM w kerunku centralnego obszaru A funkc transformac. Proponue sę zastosowane normalzac uzależnone od średne oraz odchylena standardowego oblczonego dla danych hstorycznych analzowanego szeregu czasowego. Proponowana funkca (5) sparametryzowana est za pomocą λ, gdze est ndeksem poęca. 8
v ( t) l( v ) c ( t), (5) u( v ) l( v ) gdze: l v ) mean( v ) stddev( v ), u v ) mean( v ) stddev( v ). ( ( Po podstawenu za l v ) u v ) przedstawonych powyże wzorów, funkca (5) przymue postać (6): ( ( v ( t) mean( v) stddev( v ) c ( t). (6) 2 stddev( v ) Parametr determnue długość przedzału [ l ( v ), u( v )]. Zwykle l( v ) mn( v ) and u( v ) max( v ), z tego powodu dla v l v ) lub x u x ) uzyskana wartość c (t) może wypaść z przedzału [ 0,1]. ( ( W takm przypadku, eżel c (t) > 1, podstawamy c ( t) 1 oraz eżel c (t) < 0, podstawamy c ( t) 0. Denormalzaca przeprowadzana est za pomocą formuły (7): v t) c ( t) 2 stddev( v ) mean( v ) stddev( v ). (7) Rezultaty zastosowana rozwązań 1 2 [P1] ( W celu przeprowadzena oceny proponowanych rozwązań 1 2 wykorzystano rzeczywste dane medyczne. Były to welowymarowe szereg czasowe zebrane dla dwudzestu pacentów choruących na zapalene płuc. Dane zebrano w sposób anonmowy w greckm szptalu (General Hosptal of Lama). Specyfczny wybór danych był zdetermnowany wymaganam proektu europeskego DEBUGIT (sódmy program ramowy Un Europeske). Waldaca proponowanego rozwązana była przeprowadzana w warunkach rzeczywstych z udzałem lekarzy. W celu oceny efektywnośc rozwązań 1 2, przeprowadzono szereg eksperymentów. W celach porównawczych, stosuąc wzór (2) oblczono błędy predykc generowane przez następuące sec FCM: FCM-I standardowa normalzaca mn-max oraz stałe (dobrane przez eksperta) g 5, FCM-II proponowana normalzaca (6), ustalony parametr, oraz stała wartość g 5, FCM-III standardowa normalzaca oraz optymalzaca g za pomocą algorytmu genetycznego, FCM-IV proponowana normalzaca (6), ustalony przez eksperta parametr oraz optymalzaca g. Waldacę przeprowadzono ze względu na poszczególne szereg czasowe przypsane pacentom. Zastosowano procedurę waldac krzyżowe typu LOOCV (ang. leave-one-out crossvaldaton), która zwykle stosowana est w przypadku dysponowana małą lczbą danych [27]. Szereg opsuący hstorę choroby ednego pacenta pełnł rolę testową, 19 pozostałych szeregów było używanych w celu uczena modelu FCM. Uczene testowane było powtarzane 20 razy wyberaąc sekwence kolenych pacentów w celu testowana. Po oblczenu błędu predykc dla każdego szeregu, oblczono średną błędów dla wszystkch dwudzestu pacentów. Statystyka uzyskanych błędów przedstawona est w Tabel 1. Symbolem StdDev oznaczono odchylene standardowe. 9
Tabela 1: Błędy predykc FCM Średna StdDev Mn Max FCM-I 0.1763 0.0181 0.1532 0.1934 FCM-II 0.1702 0.0174 0.1513 0.1942 FCM-III 0.1218 0.0083 0.1114 0.1377 FCM-IV 0.1047 0.0065 0.0917 0.1143 Średn błąd uzyskany dla seć FCM-IV był namneszy, co oznacza, że obydwe wprowadzone nowośc teoretyczne: Rozwązane 1 Rozwązane 2 okazały sę korzystne ze względu na poprawę efektywnośc predykc uzyskwane przez model FCM. Rozwązane 3 [P10] W pracy [P10] zaproponowano usprawnene powyże opsane metody. Parametr g określaący wzmocnene funkc transformac optymalzowany był ndywdualne dla każdego poęca. Oznacza to, że dla każdego poęca c chromosom zawerał odpowadaący parametr g. Podobne parametr λ steruący normalzacą został obęty ndywdualną dla każdego poęca optymalzacą za pomocą algorytmu genetycznego. Ze względu na to, że dla każdego -tego poęca uzyskano nną, zoptymalzowaną wartość λ ocena błędów tradycyne realzowana dla FCM przed realzacą procesu denormalzac, musała zostać zmodyfkowana. Zastosowano w tym celu wzór (8): k 1 n 1 v ( t) v ( t) e =, (8) ( k 1) n max( v ) mn( v ) t= 1 =1 gdze: k to długość szeregu, n to lczba poęć FCM, max v ), mn( v ) były podane przez ekspertów (lekarzy), (t) ( v ( t) = 1 v oznacza wartość znaną ze zboru danych, ( c( t)) est zdemoralzowaną wartoścą predykc wygenerowaną przez FCM, c (t) to przewdywany stan poęca FCM. Rezultaty zastosowana rozwązana 3 [P10] Równeż w przypadku oceny efektów rozwązana 3 wykorzystano poprzedno opsane dane medyczne. W celach porównawczych trzy różne sec FCM były uczone testowane: FCM-A seć referencyna, taka sama ak poprzedno opsana FCM-I FCM-B seć taka sama ak FCM-IV z pracy [P1], ustalony parametr oraz optymalzaca g wspólnego dla wszystkch [P1], FCM-C ndywdualna optymalzaca oraz g dla każdego poęca (zaproponowana w [P10]). Table 2: Statystyka błędów predykc Średna StdDev FCM-A 0.1672 0.0224 FCM-B 0.1182 0.0105 FCM-C 0.1061 0.0107 10
Wszystke sec FCM były uczone testowane stosuąc wzór (8) w celu oblczana błędów predykc. Z tego względu wynk lczbowe pokazane w Tabel 2 ne są porównywalne z tym pokazanym poprzedno w Tabel 1. Jak można zauważyć w Tabel 2, błędy predykc uzyskwane przez seć FCM-C są znaczne mnesze nż dla referencyne FCM-A oraz trochę mnesze nż dla sec FCM-B proponowane poprzedno w pracy [P1]. Dowodz to, że dla wybranego, medycznego zboru danych, nowośc proponowane w pracy [P10] przyczynły sę do dalszego wzrostu efektywnośc modelu FCM. Problemy 1) Na podstawe wynków lcznych eksperymentów postawono hpotezę, że uczene modelu FCM wykorzystuące wszystke dostępne dane uczące może ne być nalepszym rozwązanem. Teoretyczne, m dłuższy szereg czasowy, na podstawe którego model est uczony, tym bardze ogólny pownen być uzyskany model. Tak model mógłby reprezentować długotermnowe cechy charakterystyczne szeregu, np. sezonowość powtarzaącą sę przez dłuższy okres czasu lub długotermnowy trend. W praktyce okazue sę często, że zarówno sezonowość ak trendy występuą w szeregach czasowych lokalne zmenaą sę w czase. Uwzględnaąc zbyt dużo danych podczas uczena FCM otrzymuemy model zbyt ogólny, ne uwzględnaący lokalne zmennośc określonych cech charakterystycznych szeregu. Z druge strony, uwzględnaąc podczas uczena zbyt mało danych stnee nebezpeczeństwo otrzymana modelu zbyt szczególnego, tak model ne est w stane reprezentować długotermnowych regularnośc występuących w szeregu. Z powyższych powodów problemem stae sę odpowedne ustalene okresu uczącego w celu umożlwena ak nabardze efektywne predykc w okrese testowym. Zgodne z wedzą lteraturową, wszystke dotychczasowe metody uczena FCM realzowane były w następuący sposób. Nezależne od charakterystyk danych w okrese uczącym oraz długośc tego okresu, uczona seć FCM zawerała zawsze wybraną przez eksperta stałą lczbę poęć oraz ustaloną funkcę transformac. Wag take sec były uczone wykorzystuąc wszystke dostępne dane uczące. Wszystke znane populacyne algorytmy uczena FCM usłowały dostosować wag sec do charakterystyk całego szeregu uczącego. Oznacza to, że wpływ perwsze wartośc w szeregu uczącym ak te ostatne na wartośc wag, był dentyczny. Co węce, take rozwązane było stosowane nezależne od długośc szeregu. 2) We wszystkch dotychczasowych zastosowanach FCM, struktura sec (zbór poęć oraz krawędz) była określany przez eksperta. W takm przypadku, po zakończenu uczena, uzyskana seć zawerała wszystke poęca zdefnowane przed e uczenem oraz wszystke krawędze, nawet te, dla których nauczone wag były blske zeru. W ten sposób, uzyskana seć stawała sę trudna w nterpretac. W celu rozwązana tego problemu przeprowadzano selekcę krawędz po zakończenu uczena wag sec. Kasowano krawędze, którym podczas uczena przypsano wag o wartośc bezwzględne ponże pewnego progu. W konsekwenc poprawa czytelnośc sec prowadzła to do mneszego lub wększego wzrostu błędów predykc. 3) Jak wykazano w pracach [P1] [P10] funkca transformac posada decyduący wpływ na akość predykc uzyskwane przez seć FCM. Pommo tego, we wszystkch dotychczasowych pracach funkca transformac, nawet eżel e ostateczny kształt był kontrolowany poprzez parametry, była ustalana w sposób arbtralny np. ako funkca logstyczna [P1,P10]. Ngdy poprzedno wybór te funkc ne był realzowany automatyczne, ne był on też zmenany w trakce uczena sec dostosowywany do określonego okresu uczącego. 11
Rozwązane 4 [P5] W artykule [P5] zaproponowano następuące nowośc pozwalaące na rozwązane postawonych powyże problemów: uczene sec FCM w sposób dynamczny, adaptuąc seć do lokalne charakterystyk danych uczących, dynamczny wybór poęć sec FCM. W ten sposób optymalzowany był rząd modelu predykcynego, selekca funkc transformac oraz optymalzaca parametrów wybrane funkc algorytmem populacynym. W celu uczena modelu FCM z uwzględnenem wszystkch powyższych elementów ocenano efektywność różnych algorytmów populacynych. Rezultaty rozwązana 4 [P5] Jak wadomo na podstawe lteratury, żaden z stneących model predykcynych ne est na tyle unwersalnym, żeby można go efektywne stosować dla każdego typu danych. W artykule [P5], po wprowadzenu rozwązana 4, przeprowadzono eksperymenty porównawcze FCM oraz wybranych nnych, nabardze znanych model predykcynych. Testy przeprowadzano na znaczne lczbe, ogólne dostępnych, ednowymarowych szeregów czasowych. Po przeprowadzenu lcznych testów statystycznych eksperymentów zdentyfkowano kryterum wyboru szeregów czasowych, dla których rekomendowane est zastosowane proponowanego rozwązana. Zastosowane FCM rekomendowane est dla szeregów lnowych staconarnych. Wynk eksperymentów podano w pracy [P5]. Naważnesze z nch podaemy w Tabel 3. Rezultaty uzyskano dla ośmu, publczne dostępnych szeregów czasowych: 1. Annual barley yelds per acre n England - Wales (1884-1939) 2. Annual precptaton n nches, entre Great Lakes (1900-1986) 3. Annual precptaton (nches), Lake Huron (1900-1986) 4. Annual precptaton (nches), Lake Superor (1900-1986) 5. Wnter negatve temperature sum ( C ) (1781-1988) 6. Annual ranfall (nches) Nottngham castle (1867-1939) 7. Mean annual temperature ( C ) (1781-1988) 8. Mean summer temperature ( C ) (1781-1988) W przypadku realzac eksperymentów zrezygnowano z oceny błędów za pomocą tradycyne stosowanego dla FCM wzoru (3). Zarówno podczas oblczena funkc przystosowana w czase uczena, ak podczas testów sec, zastosowany został średn bezwzględny procentowy błąd predykc (ang. Mean Absolute Percentage Error (MAPE)) (9). n 1 ( t) MAPE = 100%, dla v( t) 0, (9) n t=1 v( t) gdze ε, podobne ak w poprzednch artykułach oznacza ednostkowy błąd predykc ( t) = v'( t) v( t). Wymagało to przeprowadzana denormalzac stanów poęć realzowane w funkc przystosowana, co zwększało czas wymagany do uczena sec. Z druge strony, tego typu dzałane ułatwło późnesze porównane uzyskanych wynków predykc, z tym generowanym przez nne modele. 12
Tabela 3: Porównane różnych model predykcynych (błąd MAPE) Nave ARIMA ES HW ANFIS DFCM Algorytm uczena sec DFCM 1 6.5211 6.4735 6.4839 6.4857 8.7278 6.2479 (ABC) 2 10.3409 8.4279 7.1678 7.5775 12.4073 6.8986 (PSO) 3 11.4775 9.5460 8.5139 8.6698 12.4627 8.1838 (PSO) 4 12.4225 10.4834 9.4372 9.9394 15.2779 9.1267 (PSO) 5 63.8697 54.3929 53.2736 53.4834 53.7581 50.1879 (RCGA) 6 18.6184 12.3115 12.2330 12.9659 34.0544 11.5202 (ABC) 7 9.9364 7.8881 7.7373 7.9082 12.6097 7.7338 (PSO) 8 5.2553 4.2521 4.0434 4.110208 7.6996 4.1423 (RCGA) Uzyskano bardzo dobre rezultaty eksperymentalne. Jak pokazano w Tabel 3, w wynku proponowanych nnowac uzyskano bardzo konkurencyny model predykcyny nazwany DFCM (ang Dynamc Fuzzy Cogntve Map), który w przypadku szeregów lnowych staconarnych okazał sę nalepszy dla sedmu z ośmu wybranych szeregów czasowych. 4.3.2 Poprawa efektywnośc modelu FCM w zakrese welokrokowe predykc szeregów czasowych [P2,P3] W tym rozdzale opsuę moe dalsze badana dotyczące poprawy efektywnośc modelu FCM w zakrese welokrokowe predykc, welowymarowych szeregów czasowych. Problem W celu przeanalzowana propagac błędów w kolenych krokach predykc welowymarowego szeregu czasowego oznaczmy przez D(t) znany na podstawe danych hstorycznych wektor szeregu. Przez C(t) oznaczmy wektor przewdywany przez seć FCM. W ten sposób sekwenca: D(t 1 ), D(t 2 ),, D(t k ), oznacza welowymarowy szereg, przy czym k est lczbą uwzględnonych chwl czasu. Podobne ak poprzedno, problem analzuemy dla trywalne sec FCM złożone tylko z dwóch poęć. Załóżmy stosowane trywalne funkc transformac f ( x) = x. Przy takch założenach, równane wnoskowana sec FCM przymue postać: c t ) = w c ( t ), gdze. Oblczmy krok po kroku ( s 1 s pozomy aktywac obydwu poęć oraz błędy predykc stosuąc standardowy wzór (3). Przykładowo, w czaset 2, pozom aktywac c2 wynos: c 2( t2) = w12( t1) d1( t1), błąd predykc to: 2( t2) = d2( t2) c2( t2). W celu realzac kolenego kroku predykc dla chwl t 3, wzór wnoskowana sec mus zostać zastosowany koleny raz. Przewdywany stan perwszego poęca c 1( t3) = w21( t2) c2( t2) uzależnony est od poprzedno przewdywanego stanu c 2 ( t 2 ), a tym samym od poprzedno wygenerowanego błędu 2 ( t 2 ). Zauważmy, że dla te same chwl czasu t, błąd predykc oblczony za pomocą wzoru (3) wynos 3 1( t3) = d1( t3) c1 ( t3) ne zależy od poprzedno wynkłego błędu 2 ( t 2 ). Podobna sytuaca występue dla kolene chwl czasu t 4, gdze c 2 ( t 4 ) oraz 2 ( t 4 ) zależą od poprzedno przewdywanego stanu c ) 1 ( t 3 13
oraz błędu 1 ( t 3 ). Oznacza to, że za pomocą dotychczas stosowanego wzoru (2) oblczony zostae błąd t ) = d ( t ) c ( ) nezależny od ). 2( 4 2 4 2 t4 1 ( t 3 Jak powyże wyaśnono, wzór (2) w konsekwenc wzór (3) ne są odpowedne do oblczana welokrokowych błędów predykc dla danych welowymarowych. Wzór (2) ne berze pod uwagę propagac błędów mędzy poęcam FCM. W konsekwenc, algorytmy stosuące wzór (3) podczas uczena, np. algorytm genetyczny, optymalzuą wag sec FCM osobno dla każdego poęca. Podczas optymalzac macerzy wag W, każdy e wersz optymalzowany est bez uwzględnena ego zależnośc od pozostałych werszy. Problem ten kumulue sę przy wzrośce lczby poęć oraz wydłużenu horyzontu predykc. W efekce następue utrata efektywnośc dzałana nauczone sec FCM. Rozwązane 5 [P2,P3] W perwsze kolenośc, w celu prawy efektywnośc oblczana błędów predykc tym samym zwększena efektywnośc uczena FCM dla welokrokowe predykc welowymarowych szeregów czasowych, zamast używana wzoru (2) zaproponowano stosowane dwóch wzorów. Perwszy z nch (10) zaproponowany w pracy [P2] est prostą modyfkacą wzoru (3). 1 e = ( k h) n k h n s=1 =1 ( t ) (10) Za pomocą wzoru (10) oblczamy tylko błędy uzyskane w h-tym kroku predykc pomaąc oblczane błędów dla kroków poprzednch, tzn. dla chwl t s+1, t s+2,, t s+h 1. Tylko take błędy są uśrednane dla całe sekwenc uczące. Parametr h określa wymagany horyzont predykc. Mmo, że proponowana zmana est newelka, zaletą używana wzoru (10) zamast wzoru (3) podczas uczena FCM est uzyskane sec dedykowane dla określonego horyzontu czasowego (uwzględnaące propagace błędów predykc mędzy poęcam) zamast sec zoptymalzowane dla horyzontu h = 1 e wykorzystane, gdy predykca est wymagana dla h > 1. W dalsze kolenośc, w pracy [P3] zaproponowano alternatywny wzór (11) oblczana błędów dla welokrokowe predykc szeregów welowymarowych z zastosowanem FCM. sh 1 e = ( m h) h n mh s h n s=1 k = s1 =1 ( t k ). (11) Za pomocą wzoru (11) oblczane są uśrednane błędy predykc wygenerowane przez FCM w rozpatrywanym horyzonce predykc, czyl w okrese [t s+1, t s+h ]. W zależnośc od wymagań aplkac, wzory (10) lub (11) pownny być stosowane przy oblczanu funkc przystosowana podczas ewolucynego uczena sec FCM. W przypadku zastnena potrzeby uzyskana ak namneszego błędu dokładne w h-tym kroku predykc, stosuemy wzór (10). W przypadku gdy stotna est mnmalzaca błędów osąganych w całym okrese predykc proponuemy stosowane wzoru (11). 14
Rezultaty rozwązana 5 W pracy [P2] przeprowadzono ewaluacę proponowanego wzoru (10) stosuąc welowymarowe, rzeczywste dane pacentów hosptalzowanych w General Hosptal of Lama (Greca) chorych na zapalene płuc (proekt DEBUGIT). Poneważ praca [P2] była realzowana wcześne nż [P1], do dyspozyc były dane 19 pacentów (ne 20 tak ak we późne realzowane pracy [P1]). Równeż z tego względu w pracy [P2] ne była stosowana optymalzaca procesu normalzac oraz współczynnka wzmocnena funkc transformac. Referencyna seć FCM-A była uczona z zastosowanem funkc przystosowana przy oblczanu błędów za pomocą wzoru (10). Każda z sedmu sec, dedykowanych dla określonego horyzontu predykc h [1,7] ) była uczona stosuąc wzór (10) w funkc przystosowana. Sec te oznaczano ako FCM-B(1), FCM-B(2),..., FCM-B(7). W celu wyboru danych uczących testowych zastosowano metodę LOOCV ze względu na poszczególnych pacentów. Rezultaty eksperymentów pokazane w Tabel 4 wykazuą zmneszene błędów predykc welokrokowe, po zastosowanu wprowadzone nnowac. Tabela 4: Błędy predykc welokrokowe, metoda LOOCV (zapalene płuc [P2]) h FCM-A FCM-B(h) (Mean) (StdDev) (Mean) (StdDev) 1 0.1691 0.1022 0.1691 0.1022 2 0.2568 0.1181 0.1762 0.1163 3 0.3225 0.1141 0.1742 0.1162 4 0.3643 0.1273 0.1883 0.1121 5 0.4117 0.1261 0.2112 0.1242 6 0.4202 0.1235 0.2232 0.1212 7 0.4386 0.1282 0.2673 0.1220 Alternatywne równane (11) było ocenane z wykorzystanem danych zebranych dla 40 pacentów hosptalzowanych ze względu na nowotwór prostaty [P3]. Uzyskane wynk były w tym wypadku nterpretowane pod względem medycznym przez dwóch lekarzy, pomocnczych współautorów pracy [P3]. W celach porównawczych nauczono dwe sec FCM. FCM-I nauczono wykorzystuąc znany wzór (3), FCM-II wykorzystuąc wzór (11) uwzględnony w funkc przystosowana algorytmu genetycznego. Uzyskane wynk pokazano w Tabel 5. Proponowana Seć FCM-II okazała sę lepsza nż referencyna FCM- I dla wszystkch h > 2. Table 5: Błędy predykc welokrokowe, metoda LOOCV (nowotwór prostaty [P3]) h FCM-I FCM-II (Mean) (StdDev) (Mean) (StdDev) 1 0.0985 0.0505 0.1012 0.0728 2 0.1091 0.0511 0.1026 0.0690 3 0.1245 0.0613 0.1020 0.0678 4 0.1380 0.0688 0.1022 0.0703 5 0.1518 0.0829 0.1006 0.0722 6 0.1670 0.0937 0.1003 0.0732 7 0.1855 0.1079 0.1011 0.0727 15
4.3.3 Adaptaca rozmytych szarych sec kogntywnych w celu predykc przedzałowych, welowymarowych szeregów czasowych. [P4] Problem Przedzałowe szereg czasowe (ang. nterval-valued tme seres ITS ) mogą być stosowane wtedy, gdy dane obserwowane są w sposób cągły dokładny, ednakże z punktu wdzena zastosowana stnee edyne potrzeba montorowana predykc zakresu ch zman w poszczególnych przedzałach czasowych. Przykładowe dane tego typu mogą dotyczyć mnmalnych maksymalnych temperatur dzennych lub mnmalnych maksymalnych cen akc osągnętych np. w cągu dna, tygodna lub mesąca na gełdze paperów wartoścowych. W pracy [P4] podemowany est problem predykc szeregów przedzałowych ITS. W lteraturze zaproponowano model Rozmytych Szarych Sec Kogntywnych (ang. Fuzzy Grey Cogntve Maps - FGCMs) [25]. FGCMs reprezentuą przyblżoną wedzę dotyczącą problemu operaą sę na lczbach szarych (przedzałowych). Lczba szara oznaczona est ako g g, g z arytmetyką przedzałową [P4]. FGCM zdefnowano ako czwórkę[25]: gdze:, gdze g g [28]. Arytmetyka lczb szarych est dentyczna FGCM =< C, W, f ( ), >, (11) C est zborem szarych poęć, W est macerzą szarych lczb, f () to funkca transformac, oznacza zakres (dzedznę) poęć szarych, w pracy [P4] założono, że est przedzałem [0,1]. W każdym kroku czasu stan -tego poęca szarego est szarą lczbą (przedzałem) oznaczoną ako c (t). W est macerzą kwadratową zaweraącą szare wag w w, w, przy czym ( w w ) oraz w, [ 1, 1]. Wnoskowane realzowane est za pomocą wzoru (12). w c ( t 1) = [ f = [ c Podobne ak dla FCM zakłada sę, że przekątna macerzy transformac = = f przymue postać (13). f f ( w =1, c ( t 1), c ( t 1) ) c ( t 1), f c ( t 1) n ( t 1), c c ( t 1)] W ( t) ] ne est używana. Logstyczna funkca (12) 16
c ( t 1) = (1 e n w c ( t) =1 ) 1,(1 e n w c ( t) =1 ) 1, (13) gdze: w c ( t) = mn( w c ( t), w c ( t), w c ( t), w c ( t)), (14) w c ( t) = max( w c ( t), w c ( t), w c ( t), w c ( t)). (15) Rozwązane 6 [P4] W lteraturze dotyczące szeregów ITS można wyróżnć trzy podeśca do ch predykc[p4]. Perwsze z nch zakłada nezależną predykcę górnych dolnych zakresów przedzałów. Należy zwrócć uwagę, że przy takm podeścu, zanedbywana est nformac dotycząca szerokośc przedzałów. Inne podeśce polega na powązanu ze sobą zakresów przedzałów zastosowanu tradycynych metod predykc zwykłych szeregów czasowych. Tego typu podeśce realzue predykcę zależnośc mędzy zakresam przedzałów bez wykorzystana arytmetyk przedzałowe. Trzecm podeścem est zastosowane metod opartych na arytmetyce przedzałowe. Perwszą nowoścą proponowaną w pracy [P4] est podęce po raz perwszy problemu predykc welowymarowych szeregów przedzałowych. Tabela 6 umescawa podemowany problem badawczy w relac do dotychczas rozpatrywanych problemów. Tabela 6: Metody predykc szeregów przedzałowych ITS Typ szeregu Zakresy przewdywane są nezależne od sebe Model Predykca zależnośc mędzy zakresam Arytmetyka przedzałowa ednowymarowy [20, 21] [20, 21, 22, 24] [21, 23] welowymarowy - - Nowość[P4] Drugą nowoścą proponowaną w pracy [P4] est adaptaca modelu sec FGCM do predykc welowymarowych przedzałowych szeregów czasowych. W pracy [P4] zaproponowano równeż adaptacę algorytmu genetycznego opartego na arytmetyce przedzałowe, algorytm ten wykorzystywany est do uczena sec FGCM. Zgodne z notacą stosowaną wcześne dla tradycynych sec FCM, oznaczmy przez V zbór zmennych ednowartoścowych, obserwowanych w czase. Załóżmy, że zmenne te obserwowane są w sposób cągły. Wektor obserwac V ( ) est reestrowany w czase, [0, e], gdze e est ustalonym parametrem. Sekwenca takch wektorów to tradycyny (ednowartoścowy) welowymarowy szereg 17
czasowy oznaczony ako { V ( )}. Przedzał [0, e ] dzelony est na te, e t przedzał ndeksowane e przez t. W ten sposób otrzymuemy sekwencę przedzałów [0,1],(1,2],...,( te 1, te]. Indeksy przedzałów tworzą nową dyskretną skalę czasu t [1, t e ] gdze t e est parametrem. Załóżmy, że obserwace v ( ) każde zmenne v V zmenaą sę znaczne w marę upływu czasu lecz rozważamy edyne mnmum v maksmum mn v w każdym z przedzałów max ( t 1, t]. Skala czasu zdefnowana przez zmenną t, est znaczne mne szczegółowa nż tzn. w każdym z przedzałów określonych przez t obserwuemy znaczną lczbę wektorów V(t). Nech dla wybrane zmenne v mn( v( )), ( t 1, t] będze dolnym zakresem przedzału lczby szare g(t) obserwowane w czaset, tzn. g ( t) = mn( v( )). Podobne, nech g( t) = max( v( )), ( t 1, t]. Oznaczmy ako G zbór wszystkch rozważanych zmennych szarych, odpowednk zboru V rozważanego poprzedno podczas analzy tradycynych sec FCM. Wartoścą zmenne G w czase t est: g ( t) = [ g ( t), g ( t)]. Przez ednowymarowy przedzałowy szereg czasowy będzemy rozumel { g ( t)}, czyl sekwencę lczb szarych g ( t), [1, card( G)] obserwowanych w chwlach czasu t = {1,2,, te}. Uwzględnaąc wszystke szare zmenne ze zboru G, otrzymuemy wektor G(t) obserwowany w chwl t. Welowymarowy szereg przedzałowy przymue formę sekwenc: { G( t)} = { G(1), G(2),, G( n)}. W celu zastosowana sec FGCM do predykc ITS = { G( t)}, szereg ten mus ulec normalzac: c ( t) = ( g ( t)). Realzowane est to osobno dla dolnego, c ( t) = ( g ( t)), górnego, c ( t) = ( g ( t)) zakresu poęca. Dla obydwu zakresów normalzace przeprowadzamy w przedzale g, g ] otrzymuąc c g( t) g mn ( t) =, g max g mn c g( t) g mn ( t) =, przy czym = mn( g( t)) g max g mn g [ mn max g, mn = max( g( t)) dla t [1, t e ]. Stałe g, g są parametram podawanym przez eksperta lub oblczanym na podstawe mn max danych. W efekce otrzymuemy wektor lczb szarych C( t) = ( G( t)) oraz dla kolenych kroków czasu sekwencę stanów szarych poęć C( t)} = { C(1), C(2),, C( t )}. { e Celem uczena sec est optymalzaca macerzy W oraz parametrów wzmocnena logstyczne funkc transformac, dla każdego poęca osobno. W celu unknęca konflktu nazw z oznaczenam genów, parametry transformac, ndywdualne dla każdego poęca oznaczono ako λ. W pracy [P4] zaproponowano adaptacę algorytmu genetycznego uwzględnaącą przeprowadzene wybranych operac z zastosowanem arytmetyk przedzałowe. Każdy chromosom rozpatrywane populac składa sę z dwóch częśc: 1) Część szara, czyl przedzałowa to wektor lczb szarych utworzony na podstawe macerzy W. Kolene wersze W umeszczane są eden za drugm w wektorze chromosomu, z pomnęcem elementów na przekątne W ne borących udzału we. Długość te częśc chromosomu wynos n 2 n, gdze n = card( C). 2) Część tradycyna (ednowartoścowa) to wektor współczynnków funkc transformac λ, wspólnych dla górnego dolnego zakresu lczb szarych. Długość te częśc chromosomu wynos n = card( C). g max 18
Oblczene funkc przystosowana ftness( FCM ) =1/(1 e) zostało odpowedno dostosowane. Błąd predykc oblczany est za pomocą wzoru (17). n 1 e = ERR( c ( t), c ( t)), (16) n =1 gdze: n = card( C), c (t) est stanem poęca szarego znanym z danych hstorycznych, c (t) est stanem poęca szarego przewdywanym przez FGCM, symbol ERR oznacza eden ze wzorów defnuącą odległość mędzy lczbam przedzałowym (Ichno-Yaguch, Hausdorff lub Kernel-based) [P4]. Pozostałe szczegóły zaproponowanego algorytmu opsano w pracy [P4]. Rezultaty rozwązana 6 [P4] W celu oceny proponowanego rozwązana wykorzystano rzeczywste dane meteorologczne [26]. Poęca sec FGCM odpowadały wybranym obserwacom meteorologcznym: c 1 temperatura typu dry bulb [Celsus], c 2 - temperatura typu dew pont [Celsus]., c 3 - względna wlgotność, c 4 - szybkość watru, c 5 - cśnene. W celach porównawczych przeprowadzono predykcę dolnego górnego przedzału szeregu ITS za pomocą metod standardowych: metody nawne zakładaąc. c ( t 1) = c ( t), ARIMA (ang. autoregressve ntegrated movng average), VAR (ang. vector auto regresson), oraz ES (ang. exponental smoothng). W Tabel 7 zaprezentowano rezultaty testów dla długośc okresu uczącego (okna przesuwnego) length ( WL) = 30 oraz dwukrokowe predykc, length ( WT ) = 2. Błędy oblczono stosuąc uśrednane typu MDE (ang. Mean Dstance Error) oraz wzór (16) dla różnych odległośc Ichno-Yaguch ( MDE ), IY Hausdorff ( MDE ) oraz ądrowe (ang. kernel-based dstance - H MDE ). Jak można zauważyć w Tabel 7, K seć FGCM okazała sę nalepsza, nezależne od zastosowanego sposobu oblczana błędów. Table 7: Błędy predykc dla length ( WL) = 30 oraz length W ) = 2 Model MDE IY MDE H ( T MDE K nave 0.1606 0.2290 0.1798 ARIMA 0.1582 0.2156 0.1705 VAR 0.1423 0.2023 0.1603 ES 0.1407 0.1965 0.1573 FGCM 0.1373 0.1922 0.1528 W porównanu z nnym modelam predykcynym typu czarna skrzynka (ang. black box) sec FCM FGCM mogą być nterpretowane przez eksperta. Rysunek 4 przedstawa przykładową seć FGCM wygenerowaną na podstawe danych meteorologcznych. Przedstawono tylko te krawędze, dla których wybelone (patrz [P4]) wartośc wag w 0.4. 19
Rysunek 4: Przykładowa rozmyta szara seć kogntywna W pracy [P4] potwerdzono znaczną zgodność uzyskane sec FGCM z stneącą wedzą meteorologczną. 4.3. 4 Konstrukca granularnego modelu szeregu czasowego oraz ego predykca za pomocą rozmytych sec kogntywnych [P6] Problem Zauważmy, że w welu zastosowanach praktycznych nformaca dotycząca dokładnych, numerycznych wartośc szeregu czasowego est mne stotna. W takch przypadkach szereg może być aproksymowany, rozważa sę problem znalezena kompromsu mędzy ogólnoścą szczegółowoścą nformac zawarte w szeregu. Z edne strony mamy do czynena z dokładnym wartoścam numerycznym szeregu orygnalnego, z druge strony przyblżamy ten szereg za pomocą sekwenc pewnych ednostek nformac, np. granul. Poprzez take przyblżene uzyskuemy mne dokładną reprezentacę szeregu, w zaman oczekuemy zwększena dokładnośc predykc, która w takm przypadku może odbywać sę na wyższym pozome abstrakc, tzn. na pozome granularnym. Podczas tworzena granularne reprezentac szeregu czasowego następue odfltrowane (do pewnego stopna) komponentu losowego zawartego w szeregu. Podczas granularyzac możemy stosować określone kryterum pozwalaące na znalezene kompromsu mędzy szczegółowoścą ogólnoścą uzyskwane aproksymac. W konsekwenc uzyskuemy zoptymalzowaną sekwencę granul określaną ako granularny szereg czasowy (ang Granular Tme Seres GTS). Efektywność predykc take sekwenc merzona est poprzez oblczene zgodnośc (ang. overlappng) mędzy przewdywanym rzeczywstym granulam. Wększa zgodność oznacza lepszą akość predykc. W moch badanach podąłem następuące dwa problemy: 1. problem aproksymac tradycynego szeregu czasowego w forme szeregu granularnego GTS, 2. problem konstrukc modelu predykcynego GTS opartego na rozmytych secach kogntywnych, model pownen zapewnać zadowalaącą akość predykc merzoną na pozome granularnym. 20
Rozwązane 7 [P6] Rozwązane proponowane w pracy [P6] zostało zlustrowane na rysunku 5. W perwsze kolenośc, w celu aproksymac szeregu czasowego, wyznaczamy stałe długośc przedzały czasu, w których będą konstruowane granule. W szczególnym przypadku granule te rozumane są ako trókątne lczby rozmyte, których funkce przynależnośc są optymalzowane stosuąc zasadę uzasadnone granularyzac (ang. Prncple of Justfable Granularty - PJG) [P6]. Proces tworzena granul określony est ako perwsza faza granularyzac (ang. frst-phase granulaton). Uzyskana sekwenca granul nazywana est granularnym szeregem czasowym. W celu konstrukc modelu predykcynego szeregu granularnego GTS, wszystke granule szeregu podlegaą grupowanu. Grupowane metodą Fuzzy C-Means przeprowadzone est w trówymarowe przestrzen, zgodne z reprezentacą trókątnych lczb rozmytych w forme ch zakresów (a,b) oraz wartośc modalnych (m). Proces grupowana granul nazywamy w naszym przypadku drugą fazą granulac szeregu czasowego (ang. second-phase granulaton). Reprezentanc klastrów będący także granulam przymowan są ako poęca rozmyte sec kogntywne. Poęca FCM są granulam drugego pozomu (ang. second-phase granules). W celu nterpretac szeregu GTS, poęca FCM porządkowane są ze względu na ch wartośc modalne. W dalsze kolenośc przypsuemy m adekwatne oznaczena symbolczne, np.: 'LOW', 'MEDIUM', 'HIGH' (ak pokazano na rysunku 5). Rysunek 5: Proponowana dea granulac predykc szeregu czasowego W celu konstrukc modelu realzac predykc GTS odkrywamy wykorzystuemy zależnośc czasowe mędzy poęcam FCM. Poneważ poęca FCM są uporządkowane ze względu na ch wartośc modalne odpowadaące wartośc symbolczne, krawędze grafu FCM odpowadaą zależnoścom temporalnym mędzy wartoścam lngwstycznym obserwowanym w szeregu granularnym. Wag przypsane krawędzom reprezentuą słę zależnośc. W celu odkryca tych zależnośc stosowany est algorytm genetyczny. 21
Relaca każde granul szeregu GTS do wszystkch poęć FCM opsana est za pomocą wektora numerycznego. W celu oblczena wartośc elementów tego wektora, proponowana est wyspecalzowana funkca ocenaąca względny stopeń pokrywana sę granul w stosunku do ch łączne welkośc (sumaryczne lczby elementów). Predykca realzowana est za pomocą sec FCM. Efektem predykc na pozome poęcowym, est poęce FCM o nawększym przewdywanym stopnu aktywac. Na pozome numerycznym, efektem predykc est granula szeregu GTS przewdywana w kolenym przedzale czasowym, opsana w forme parametrów lczby rozmyte. Wartośc tych parametrów uzyskwane są w wynku zaproponowane w artykule [P6] metody degranulac. W artykule [P6] zaproponowano: nową, dwu-fazową metodę granulac szeregu czasowego, nową funkcę ocenaącą pokrywane sę granul nformac, nowy sposób degranulac, umożlwaący oblczene parametrów predykowane granul na podstawe przewdywanego stanu wszystkch poęć sec FCM. Rezultaty rozwązana 7 [P6]. Wynk przeprowadzonych eksperymentów przedstawono w pracy [P6]. Dowodzą one, że zaproponowana metoda modelowana może zostać skuteczne zastosowana w celu aproksymac predykc szeregów czasowych. Zbadano pęć szeregów czasowych o różne charakterystyce. Predykca szeregu czasowego zaweraącego stablny cykl (sezonowość) okazała sę nabardze efektywna. Zgodne z oczekwanam, proponowana metoda stae sę mne efektywna dla szeregów zaweraących slneszy komponent losowy. Rezultaty eksperymentów wykazały ponadto, że lczba poęć sec FCM pownna być doberana ndywdualne dla każdego szeregu czasowego. W ten sposób użytkownk posada możlwość ustalena wymaganego pozomu aproksymac szeregu w konsekwenc uzyskwanego błędu predykc. 4.3.5 Poprawa efektywnośc dzałana klasyfkatora opartego na sec FCM [P7]) Problem Seć FCM stosowana est zwykle ako narzędze wspomagana decyz lub ako model predykc szeregów czasowych. Mne znane est zastosowane FCM w forme klasyfkatora. W moch dalszych badanach podąłem problem poprawy efektywnośc klasyfkac uzyskwane za pomocą FCM. W artykule [P7] problem klasyfkac został sformalzowany w następuący sposób. Nech X est zborem, którego elementy x r X opsane są za pomocą atrybutów ze zboru A. Zakłada sę, że atrybuty warunkowe a 1, a 2,..., a n 1 A są typu numerycznego (całkowtego lub rzeczywstego) lub że są nomnalne. Atrybut decyzyny a n A est zawsze nomnalny, dzedzną a n est zbór etyket przyporządkowany poszczególnym klasom, tzn.,: doman(a n ) = {class 1, class 2,..., class m }. 22
Przez M oznaczamy klasyfkator. Dla każdego elementu x r, klasyfkator przypsue wartość atrybutu decyzynego na podstawe atrybutów warunkowych, argumentów klasyfkatora, tzn.: a n (x r ) = M(a 1 (x r ), a 2 (x r ),..., a n 1 (x r )). Podczas testowana klasyfkatora, dla danego elementu x r, predykowana klasa a n (x r ) porównywana est z wartoścą znaną na podstawe danych a n (x r ). Klasyfkaca est poprawna gdy: a n (x r ) = a n (x r ). W moch pracach rozważałem klasyfkator zbudowany w oparcu o rozmytą seć kogntywną. Celem było uzyskane klasyfkatora o ak nalepsze efektywnośc klasyfkac merzone za pomocą wskaźnków określonych w artykule [P7]. W perwsze kolenośc potwerdzono wynk uzyskane w lteraturze. Zastosowano algorytm genetyczny w celu uczena wag sec FCM. Przeprowadzone eksperymenty wykazały, że nalepsze wynk klasyfkac uzyskwane są dla proste struktury FCM przedstawone na rysunku 6. W tym szczególnym przypadku, w sec FCM wydzelono poęca weścowe odpowadaące atrybutom warunkowym oraz edno poęce wyścowe odpowadaące atrybutow decyzynemu. Rysunek 6: Klasyfkator FCM Wartośc a (x r ), = 1,2,..., n 1 atrybutów warunkowych dla elementu x r X podlegaą normalzac stanową stany poęć c, = 1,2,..., n 1 sec FCM. Wartośc nomnalne atrybutu decyzynego a n przekształcane są do odpowadaących wartośc numerycznych α k [0,1]. Odwzorowane to przeprowadzone est zgodne z formułą (17), zapewnaącą zgodność ndeksów wartośc symbolcznych numerycznych. {class 1, class 2,..., class m } {α 1, α 2,..., α m }. (17) W celu oblczena α k, dzelmy przedzał [0,1] na m 1 równych podprzedzałów, gdze m 2 est lczbą klas w dzedzne doman(a n ). Zakresy tych przedzałów to wartośc α k, k = 1,..., m oblczone zgodne ze wzorem (18): α k = k 1 m 1. (18) 23