MODELOWANIE INśYNIERSKIE ISSN 1896-771X 34, s. 17-22, Gliwice 2007 ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE WSPOMAGANIA DECYZJI OPARTYM NA MODELU DYNAMIKI CHODU MARCIN DERLATKA, JOLANTA PAUK 1 Katedra Automatyki i Robotyki, Politechnika Białostocka e-mail:mder@pb.bialystok.pl, jpauk@pb.bialystok.pl Streszczenie. W pracy zastosowano: rozmyty model Dempstera-Shafera, sztuczne sieci neuronowe i drzewa decyzyjne do przeprowadzenia klasyfikacji danych otrzymanych w wyniku identyfikacji modelu dynamiki chodu człowieka metodą regresji. Uzyskane wyniki są bardzo dobre. Na szczególną uwagę zasługują drzewa decyzyjne, które podejmowały decyzje na podstawie czterech parametrów. 1. WPROWADZENIE Chód człowieka jest zjawiskiem bardzo złoŝonym. Pełny ilościowy opis tego zjawiska obejmuje wielkości: kinematyczne, dynamiczne, antropomorficzne, elektromiograficzne, inne. Pomiar tych danych jest niezbędny do przeprowadzenia oceny analizy chodu człowieka. Analiza chodu jest bardzo waŝna m. in. w: określeniu rodzaju i stopnia patologii, wyborze właściwej metody usprawniania aparatu ruchu pacjenta (operacja, rehabilitacja itd.). Pewne cechy zjawiska (takie jak: korelacje pomiędzy niektórymi wielkościami, nieliniowość) sprawiają, Ŝe dokłada analiza chodu człowieka jest zadaniem czasochłonnym, złoŝonym i wymagającym zaangaŝowania eksperta posiadającego wiedzę zarówno inŝynierską, jak i medyczną. Ten ostatni wymóg moŝna wyeliminować, stosując odpowiedni system do wspomagania podejmowania decyzji w biomechanice chodu człowieka. Głównymi cechami systemu do wspomagania decyzji powinny być: wysoka jakość - dokładność w podejmowaniu decyzji porównywana do decyzji podejmowanych przez eksperta ; 1 Laureat konkursu "Stypendia krajowe dla młodych uczonych" z Fundacji na Rzecz Nauki Polskiej w 2007 r.
18 M. DERLATKA, J. PAUK łatwa moŝliwość rozbudowy sytemu. Jakość działania omawianego systemu zaleŝy głównie od dwóch czynników: wyboru właściwych parametrów opisujących chód człowieka i przyjętej metody przetwarzania parametrów diagnostycznych w rodzaj patologii lub w wybraną metodę usprawniania chodu (klasyfikacja). Celem niniejszej pracy jest analiza jakości podejmowanych decyzji przez system wspomagania decyzji oparty na współczynnikach modelu dynamiki chodu człowieka w zaleŝności od przyjętej metody klasyfikacji. 2. MATERIAŁ I METODA Parametry diagnostyczne zostały uzyskane w wyniku zastosowania identyfikacji modelu dynamiki chodu człowieka metodą regresji [4]. Do identyfikacji modelu wykorzystano przebiegi chwilowe mocy rozwijane przez zespoły mięśniowe wokół głównych stawów kończyny dolnej podczas chodu. Współczynniki modelu chodu człowieka określono dla dwóch głównych faz cyklu chodu: fazy podporowej i wymachu. Moce zostały znormalizowane do cięŝaru ciała człowieka. Wykorzystanie przebiegów chwilowy mocy jest podyktowane tym, Ŝe ta wielkość jest kombinacją danych kinematycznych i dynamicznych. Y n = U n a, (1) dla n = 1, 2,, N U n = Y Y... Y ], (2) [ n 1 n 2 n k a ] T = [ a1 a2... a k (3) gdzie: N - liczba pomiarów; Yn - moce rozwijane przez zespoły mięśniowe obsługujące staw biodrowy, kolanowy i skokowo-goleniowy w n-tej chwili czasowej; a - macierz kolumnowa poszukiwanych współczynników; Un macierz wierszowa wielkości wejściowych (moce rozwijane przez poszczególne zespoły mięśniowe obsługujące staw biodrowy, kolanowy i skokowo goleniowy w k-poprzednich chwilach czasowych). a=? ε Y a=? YΛ a) b) Rys. 1. Identyfikacja modelu: a) proces rzeczywisty; b) model Badania laboratoryjne zostały przeprowadzone przy uŝyciu systemów optoelektronicznych Ellite 3D i Morion Analysis System odpowiednio w Centrum BioinŜynierii w Mediolanie we Włoszech i Glenrose Rehabilitation Hospital w Edmonton w Kanadzie. Dane przedstawiają chód normalny i wybranych patologii w płaszczyźnie strzałkowej po względnie płaskiej
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE 19 i utwardzonej powierzchni, w warunkach laboratoryjnych. Wśród wybranych patologii narządu ruchu były: poraŝenie mózgowe (CP) kurczowe poraŝenie obustronne; rozszczep kręgosłupa (SB) przepuklina oponowo-rdzeniowa. W sumie w badaniach wzięło udział około 40 osób. W obu ośrodkach w badaniach przyjęto protokół S.A.F.L.O. Tabela 1. Materiał badawczy Grupa Liczba osób Norma 10 PoraŜenie mózgowe 15 Rozszczep kręgosłupa 15 W wyniku identyfikacji modelu chodu człowieka metodą regresji otrzymano 18 parametrów diagnostycznych. Parametry te były wielkościami wejściowymi do zbudowanych klasyfikatorów. Klasyfikację przeprowadzono przy uŝyciu: rozmytego klasyfikatora Dempstera-Shafera, sztucznych sieci neuronowych, drzew klasyfikacji. Dane zostały podzielone na tzw. ciąg uczący i ciąg testujący. Jakość działania oceniano przyjmując decyzje podjęte przez personel Centrum BioinŜynierii w Mediolanie i Glenrose Rehabilitation Hospital jako wzorcowe. 3. WYNIKI Do klasyfikacji za pomocą sztucznych sieci neuronowych wybrano sieć jednokierunkową o architekturze 21-6-3. PoniewaŜ wszystkie wartości wejściowe były liczbami niewielkimi tego samego rzędu, nie wykonywano wstępnego przetwarzania danych. Klasy zakodowano na podstawie kodu 1 z n w następujący sposób: 1 0 0 - norma; 0 1 0 - rozszczep kręgosłupa; 0 0 1 - poraŝenie mózgowe. Uczenie przeprowadzono za pomocą algorytmu RPROP [3, 5]. Uzyskaną sieć wynikową przedstawiono na rys. 2. W trakcie treningu sieć wykazywała pewną tendencję do przeuczania się, co przy tak duŝym rozmiarze wektora wag w porówaniu do liczności zbioru uczącego jest dość oczywiste. NaleŜy podkreślić, iŝ zastosowanie jakiejkolwiek metody redukcji przestrzeni wejściowej moŝe przynieść tylko poprawę zdolności uogólniania rozwaŝanej sieci neuronowej. Zastosowanie rozmytego modelu Dempstera-Shafera do klasyfikacji jest znaną metodą ułatwiającą wnioskowania diagnostycznego w dziedzinie inŝynierii biomedycznej. W niniejszej pracy do wygenerowania reguł rozmytych uŝyto kwadratowej funkcji przynaleŝności w następującej postaci [1] gdzie: y - funkcja przeliczająca, X - zmienna decyzyjna, x i - i-te ognisko, 2 ( X xi) ( x x ), y= 1 (4) i i+ 1
x i+1 - ognisko i+1. oraz operatora dopasowania - iloczynu w postaci 20 M. DERLATKA, J. PAUK Max ( 0, x y), (5) gdzie: x - nowa reguła, y reguła, na której działa operator dopasowania. Rys. 2. Sieć neuronowa jednokierunkowa z wartościami wag uzyskanymi po uczeniu Maksimum operatora dopasowania zostało określone w następujący sposób: a) Testowano wartość operatora dopasowania, w granicach <0;1>, w ognisku dodawanej reguły. JeŜeli została przekroczona wartość progowa (na podstawie analizy wartość progowa równa jest 0,75) dla danego atrybutu, wówczas zwiększano liczbę trafnie dobranych reguł (dodanie reguły do relacji wymagało 50%+1 atrybutów przekraczających zadaną wartość progową). W przeciwnym razie wykonywano punkt b). b) Metodą złotego podziału szukano maksimum wartości operatora dopasowania działającego na testowanych regułach. Metoda ta umoŝliwiła szybkie uzyskanie poŝądanej zbieŝności. Okazała się najbardziej adekwatna w procesie budowy systemu. Występujące reguły w tabeli 2 naleŝy rozumieć w ten sposób, Ŝe dla konkretnego typu chodu wartość współczynnika musi mieścić się w podanym obszarze. Liczba otrzymanych, za pomocą rozmytego modelu Demstera-Shafera, reguł jest zbyt wielka, aby pokusić się o jakąkolwiek próbę analizy. Zasadniczą cechą drzew decyzyjnych jest podział w sposób rekurencyjny przestrzeni cech, tak aby w kaŝdym kroku zmaksymalizować funkcję jakości podziału klas na dwie grupy. Funkcja ta obliczana jest oczywiście na podstawie danych pochodzących ze zbioru uczącego. W niniejszej pracy zastosowano algorytm CART [2]. Uzyskane w procesie uczenia drzewo pokazano na rys. 3 (JeŜeli warunek występujący w węźle drzewa jest spełniony, to poruszamy się lewą gałęzią, w innym przypadku prawą). PoniewaŜ otrzymane drzewo ma tylko 3 poziomy, nie zastosowano Ŝadnej z metod przycinania.
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE 21 Tabela 2. Zestawy reguł umoŝliwiających klasyfikację osób do róŝnych przypadków Staw Przedział identyfikacji Współczyn nik norma Zakres wartości współczynnika PoraŜenie mózgowe Rozszczep kręgosłupa biodrowy kolanowy skokowogoleniowy faza podporowa faza wymachu faza podporowa faza wymachu faza podporowa faza wymachu a 1 1,395 2,534 1,497 2,513 1,699 2,470 a 2-2,319-0,185-1,345-0,605-2,177-0,825 a 3 0,017 0,389 0,168 0,588 0,074 0,698 a 1 1,071 2,053 1,464 2,440 1,509 1,977 a 2-0,313 1,495-1,193-0,505-1,322-0,987 a 3 0,090 0,270 0,178 0,524 0,195 0,376 a 1 1,489 2,578 1,275 2,455 1,473 2,129 a 2-2,299-0,703-1,218-0,584-1,671-0,558 a 3 0,241 0,687 0,106 0,444 0,114 0,586 a 1 1,387 2,281 1,140 2,436 1,566 2,252 a 2-1,761-0,613-1,284-0,434-1,954-0,784 a 3 0,087 0,493 0,200 0,616 0,174 0,671 a 1 1,229 2,289 1,663 2,331 1,384 2,312 a 2-1,808-0,528-2,429 0,424-2,043-0,508 a 3 0,182 0,470 0,158 0,584 0,101 0,497 a 1 0,639 1,364 0,736 1,945 0,839 1,451 a 2-0,372 0,052-0,949-0,173-0,721-0,149 a 3-0,054 0,177 0,021 0,067-0,166 0,255 Rys. Drzewo decyzyjne wraz z uzyskanymi po uczeniu regułami decyzyjnymi
22 M. DERLATKA, J. PAUK Wynikowe drzewo klasyfikacyjne zaskakuje małą liczba reguł potrzebnych do przeprowadzenia klasyfikacji. Okazuje się, Ŝe wystarczy wziąć pod uwagę tylko 4 z 18 parametrów. MoŜna zaobserwować, Ŝe wymagane są dane dotyczące wszystkich trzech głównych stawów kończyny dolnej oraz Ŝe faza wymachu w ocenie lokomocji jest równie istotna jak faza podporowa. Biorąc pod uwagę dodatkowo wyniki klasyfikacji (tabela 3), naleŝy stwierdzić, Ŝe w podanym zadaniu najlepiej sprawdzały się właśnie drzewa decyzyjne. Tabela 3. Procent poprawnych klasyfikacji w zaleŝności od zastosowanej metody (zbiór testujący) Dempster-Shafer Sieci Drzewo decyzyjne neuronowe Norma 100 80 90 PoraŜenie mózgowe 93 93 100 Rozszczep kręgosłupa 90 100 100 3. PODSUMOWANIE Dla wszystkich klasyfikatorów osiągnięto bardzo duŝy stopień poprawnych klasyfikacji. Świadczy to o właściwym wyborze danych wejściowych, które faktycznie niosą istotną informację diagnostyczną. Nie wszystkie parametry wejściowe są potrzebne do właściwej klasyfikacji. Istnieje przypuszczenie, Ŝe po poszerzeniu zbioru danych o kolejne przypadki patologiczne będą wymagane takŝe inne parametry, pochodzące z identyfikacji modelu dynamiki chodu. LITERATURA 1. Bianaghi E., Madella P.: Inductive and deductive reasonic techniques for fuzzy Dempster Shafer classifiers. 7th IFSA World Congress, Prague, 1997, s. 197-302. 2. Hand D. et al.: Eksploracja danych. Warszawa : WNT, 2005. 3. Jaworek K., Derlatka M.: Ocena chodu człowieka za pomocą sztucznych sieci neuronowych. W: Biocybernetyka i InŜynieria Biomedyczna 2000. Tom 5: Biomechanika i InŜynieria Rehabilitacyjna. (red. R. Będziński i in.). Warszawa : Akad. Oficyna Wyd. EXIT, 2005, s. 371-388; 4. Pauk J.: Identyfikacja dynamiki lokomocji dwunoŝnej człowieka. Rozprawa doktorska. IBiB PAN. Warszawa 2005. 5. śurada J., Barski M., Jędruch W.: Sztuczne sieci neuronowe. Warszawa : Wyd. Nauk PWN, 1996. APPLYING CLASSIFICATORS FOR SUPPORT DECISION MAKING SYSTEM BASED ON DYNAMIC MODEL OF HUMAN GAIT Summary. The Dempster-Shafer s fuzzy model, artificial neural networks and decision trees for classification data obtained from identification model of human gait by means of regression has been used. The results are very good. The decision
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE 23 tree should be analyzed with special attention because they made correct decision based on only four parameters.