RoughICE Narzędzie informatyczne do konstruowania klasyfikatorów dla złożonych pojęć przy wykorzystaniu zbiorów danych i wiedzy dziedzinowej. Jan G. Bazan Katedra Informatyki Uniwersytetu Rzeszowskiego 1
Plan 1. Przedstawienie i geneza środowiska RoughICE 2. Klasyfikatory i ich aproksymacja 3. Pojęcia złożone oraz problemy z ich aproksymacją 4. Wiedza dziedzinowa i jej reprezentacja za pomocą ontologii pojęć oraz skryptów 5. Główne funkcjonalności i struktura środowiska RoughICE 6. Przykład zastosowania środowiska RoughICE do identyfikacji wzorców zachowania 7. Przykład zastosowania środowiska RoughICE do automatycznego planowania leczenia 8. Przykład zastosowania środowiska RoughICE do aproksymacji przestrzennego pojęcia: bezpieczna jazda pojazdu 9. Witryna internetowa środowiska RoughICE 2
Rough ICE Rough Set Interactive Classification Engine http://logic.mimuw.edu.pl/~bazan/roughice/ Czym jest RoughICE?» Środowisko komputerowe do przeprowadzania interaktywnych eksperymentów, dotyczących aproksymacji złożonych pojęć czasowoprzestrzennych w oparciu o zbiory danych oraz wiedzę dziedzinową Aproksymacja odbywa się za pomocą klasyfikatorów Zbiory danych reprezentowane są w formie tablic decyzyjnych Wiedza dziedzinowa reprezentowana jest za pomocą ontologii pojęć oraz skryptów Środowisko z interfejsem graficznym a nie system z określonymi funkcjami System operacyjny: Windows XP, Vista, Windows 7 Języki programowania: Java i C++ Biblioteki dodatkowe:» Swing (GUI)» JGraph (edytor graficzny ontologii)» RS-lib (jądro obliczeniowe systemu RSES) Dokumentacja: poradnik jest dostępny w witrynie środowiska 3
Podstawy teoretyczne RoughICE Podstawy teoretyczne środowiska RoughICE zostały opisane w pracy habilitacyjnej, która została wydana jako rozdział: Bazan,. J., G.: Hierarchical Classifiers for Complex Spatio-temporal Concepts, Lecture Notes in Computer Science 5390, Transactions on Rough Sets IX, 474-750, Berlin, Heidelberg: Springer-Verlag (2008). http://www.springerlink.com RoughICE należy traktować jako efekt długoletniej współpracy autora pracy z prof. dr. hab. Andrzejem Skowronem oraz z innymi osobami z grupy badawczej na UW 4
RoughICE, RSES i RS-lib RoughICE jest jedną z kontynuacji systemu RSES w zakresie aproksymowania złożonych pojęć» RSES rozwijany przez członków grupy badawczej prof. dr hab. Andrzeja Skowrona w latach 1993-2006 Skład zespołu pracujacego nad RSES i RS-lib: Jan Bazan, Rafał Latkowski, Nguyen Hung Son, Nguyen Sinh Hoa, Andrzej Skowron, Dominik Ślęzak, Piotr Synak, Marcin Szczuka, Jakub Wróblewski, Michał Mikołajczyk, Arkadiusz Wojna, Michał Wojnarski» Innymi kontynuacjami RSES-a są: Debellor (http://www.mimuw.edu.pl/~mwojnars/debellor/ - Marcin Wojnarski) Rseslib (http://rseslib.mimuw.edu.pl/ - Arkadiusz Wojna) RoughICE wykorzystuje szereg struktur danych i algorytmów, dostępnych w bibliotece RS-lib, stanowiącej jądro obliczeniowe systemu RSES» Chodzi tutaj o elementarne struktury danych i algorytmy, związane z konstruowaniem klasyfikatorów w oparciu o metody teorii zbiorów przybliżonych. Np. struktury danych reprezentujących systemy informacyjne, redukty i reguły decyzyjne oraz algorytmy realizujące dyskretyzację tablic danych, obliczanie reduktów i reguł decyzyjnych 5
Klasyfikatory - jako narzędzia do aproksymacji pojęć na podstawie zbiorów danych Obiekt testowy Generowanie decyzji dla obiektu testowego Klasyfikator Motywacja: - Potrzeba aproksymowania pojęć przy niepełnej informacji o obiektach i pojęciach - Niski koszt obliczeniowy i wysoka efektywność wnioskowań aproksymacyjnych prowadzonych w oparciu o aproksymacje pojęć Informacja o przynależności testowanego obiektu do pojęcia Konstrukcja klasyfikatora Dana tablica decyzyjna (przykłady obiektów) Przykładowe podejścia do tworzenia klasyfikatorów: - metody statystyczne - drzewa decyzyjne - reguły decyzyjne - sieci neuronowe... Metody rozwijane w: Wnioskowania statystyczne Uczenie maszynowe (ang. machine learning) Eksploracja danych (ang. data mining) Rozpoznawanie wzorców (ang. pattern recognition) Odkrywanie wiedzy (ang. knowledge discovery) Sterowanie niekonwencjonalne (ang. soft control) 6
Ilustracja problemu konstruowania klasyfikatora U Ból Ból Temperatura Grypa głowy mięśni u1 Tak Tak Normalna Nie u2 Tak Tak Wysoka Tak u3 Tak Tak Bardzo wys. Tak u4 Nie Tak Normalna Nie u5 Nie Nie Wysoka Nie u6 Nie Tak Bardzo wys. Tak Reguły decyzyjne (propozycja rozwiązania) (temp=normalna)=>(grypa=nie) 2 (temp=bardzo_wys)=>(grypa=tak) 2 (bol_glowy=tak)&(temp=wysoka)=>(grypa=tak) 1 (bol_miesni=tak)&(temp=wysoka)=>(grypa=tak) 1 (bol_miesni=nie)=>(grypa=nie) 1 (bol_glowy=nie)&(temp=wysoka)=>(grypa=nie) 1 System informacyjny jako para (U, A)» U - niepusty zbiór obiektów (wierszy)» A - niepusty zbiór atrybutów (kolumn) takich, że a: U V a dla każdego atrybutu a» V a jest nazywany zbiorem wartości atrybutu a. W systemie informacyjnym (U, A {d}) atrybut decyzyjny d (decyzja eksperta) jest wyróżniony; elementy A są nazywane atrybutami warunkowymi. Wartości decyzji d definiują tzw. klasy decyzyjne. W przykładzie, dla atrybutu decyzyjnego Grypa są dwie klasy decyzyjne: Grypa(Nie)={u1,u4, u5} oraz Grypa(Tak)={u2, u3, u6} Problem: Jak skonstruować algorytm (klasyfikator) pozwalający na predykcję wartości atrybutu decyzyjnego na podstawie wartości atrybutów warunkowych? 7
System RSES jako narzędzie do tworzenia klasyfikatorów (http://logic.mimuw.edu.pl/~rses/) Importowanie danych (RSES1, RSES2, Weka, ROSETTA). Przeglądanie i wstępna obróbka danych (wypełnianie pustych miejsc, dyskretyzacja, ekstrakcja nowych cech). Konstruowanie i testowanie różnych klasyfikatorów (różne typy reguł decyzyjnych, drzewa decyzyjne dekompozycji, metody typu k-nn - RIONA, sieć neuronowa LTF-C, klasyfikator MTD-C działający bez uwzględniania pustych miejsc w danych) Wizualizacja danych i klasyfikatorów 8
Pojęcia złożone oraz problemy z ich aproksymacją Są to pojęcia wyrażone w języku naturalnym na dużo wyższym poziomie niż dane sensoryczne» Np: bezpieczna jazda samochodem, bezpieczne wyprzedzanie, zachowanie się pacjenta związane z zagrożeniem życia itd. Opis takich pojęć jest często niemożliwy przy wykorzystaniu analitycznych metod, gdyż opieramy się na wiedzy niepełnej i niedokładnej Pojawiają się także trudności w stosowaniu poprzednich (klasycznych) metod do aproksymacji pojęć złożonych» Dystans pomiędzy pojęciami złożonymi a danymi sensorycznymi» Występuje szczególnie mocno dla danych związanych z szeregami czasowymi Propozycja: Zastosowanie wiedzy dziedzinowej w celu zmniejszenia tego dystansu 9
Wiedza dziedzinowa Wiedza dziedzinowa dotyczy pojęć pojawiających się w danej dziedzinie oraz różnorakich związków pomiędzy tymi pojęciami» Pomocna dla sukcesu każdego projektu związanego z inteligentną analizą danych Wiedza dziedzinowa znacznie przekracza wiedzę zebraną w zbiorach danych» Użyteczny środek do polepszania jakości klasyfikatorów Wiedza dziedzinowa może być reprezentowana w postaci tzw. ontologii 10
Ontologia i ontologie Ontologia jako nauka» Dział filozofii zajmującym się badaniem i wyjaśnianiem natury jak i kluczowych właściwości oraz relacji rządzących wszelakimi bytami, bądź badaniem głównych zasad i przyczyn bytu (słownik Webstera) Ontologia w informatyce - wybrany model pewnego fragmentu rzeczywistości» Sposób opisywania i modelowania świata rzeczywistego w celu późniejszego wykorzystania w praktyce powstałych modeli do rozwiązywania różnorakich problemów Systemy komputerowe do tworzenia ontologii» np: Protege-2000, Ontolingua, WebOnto, OntoEdit itd. 11
Przykład ontologii drogowej Ontologia pojęć z symulatora drogowego 12
Przykład ontologii medycznej Ontologia zależności w grupie chorób 13
Jak wykorzystać ontologie pojęć do budowy klasyfikatorów? Trzy ogólne propozycje w RoughICE: 1. Aproksymowanie pojęć z wyższego poziomu ontologii za pomocą pojęć występujących na niższym poziomie ontologii (ontologia hierarchiczna). 2. Aproksymowanie pojęć z ontologii a następnie śledzenie zachowania obiektu złożonego w czasie poprzez rejestracje zmian przynależności tego obiektu do pojęć z ontologii (ontologia nie hierarchiczna). Przyspieszanie na prawym pasie Stabilna prędkość na prawym pasie Przyspieszanie i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z lewego na prawy Przyspieszanie na lewym pasie Stabilna prędkość na lewym pasie 3. Aproksymowanie pojęć z ontologii a następnie planowanie zachowania obiektu poprzez ustalenie ciągu pojęć czasowych do których obiekt kolejno ma należeć oraz akcji, które mają być wykonywane pomiędzy ww. pojęciami (dwa rodzaje pojęć w ontologii: stany i akcje). Zwalnianie na prawym pasie Zwalnianie i zmiana pasa z lewego na prawy Zwalnianie na lewym pasie 14
Główne funkcjonalności środowiska RoughICE Interfejs graficzny znany z systemu RSES Importowanie zbiorów danych z plików tekstowych, Wprowadzanie wiedzy dziedzinowej wyrażonej w postaci ontologii pojęć» Wbudowany w środowisko edytor graficzny Wprowadzanie wiedzy dziedzinowej wyrażonej w języku skryptów» Wbudowany w środowisko modułu edycji i kompilacji skryptów Konstruowanie i testowanie klasyfikatorów aproksymujących złożone pojęcia przestrzenne odległe semantycznie od danych sensorowych Konstruowanie i testowanie klasyfikatorów aproksymujących złożone pojęcia czasowo-przestrzenne odległe semantycznie od danych sensorowych Konstruowanie i testowanie klasyfikatorów identyfikujących wzorce zachowania lub wysokiego ryzyka Automatyczne planowanie zachowania obiektów złożonych o jednolitej strukturze oraz obiektów strukturalnych» Możliwość testowania zgodności wygenerowanych automatycznie planów z planami proponowanymi przez ekspertów z danej dziedziny 15
Jak odbywa się typowe użytkowanie środowiska RoughICE? W głównym oknie środowiska budowany jest projekt składający się z obiektów reprezentowanych za pomocą ikon Wszelkie obliczenia wykonywane są za pomocą menu kontekstowego tych obiektów (wypisywanie postępu obliczeń) Obiekty łączone są ze sobą zależnościami Zawartość obiektów można obejrzeć Wszelkie operacje odnotowywane są w logu (tzw. Historii) Gdy potrzebna jest wiedza dziedzinowa używa się edytora graficznego (ontologie pojęć) lub edytora skryptów np. opisujących wzorce czasowe lub pojęcia czasowe 16
Realizacja techniczna wykorzystywania wiedzy dziedzinowej w postaci eksperckich skryptów Java 6.0 Mustang (Sun JDK 1.6)» Dostęp do kompilatora (pakiet javax.tools) Kompilacja źródeł Javy z poziomu wykonującego się programu oraz kontrolowane wczytywania klas języka Java w czasie działania programu Możliwość wywoływania metod z klas nieistniejących w trakcie kompilacji programu» UWAGA: Sun JRE 1.6 jest niewystarczający!» Instalator wyszukuje lokalizację Sun JDK 1.6 i odpowiednio konfiguruje RoughICE-a Jest wbudowany edytor skryptów wraz z możliwością ich kompilowania Skrypt definiujący wzorzec czasowy opisujący sytuację, że w danym oknie czasowym pojazd cały czas jedzie na lewym pasie JRE Java Runtime Environment JDK - Java Development Kit 17
Zalecenie: Technika Busalous (build-save-load-use) Wykonywanie eksperymentów za pomocą interfejsu graficznego znanego z systemu RSES Problem dużej złożoności projektów Ułatwienie: technika Busalous» Problem: Konieczność zmiany myślenia przy projektowaniu eksperymentów 18
Źródła danych na potrzeby eksperymentów z klasyfikatorami aproksymującymi złożone pojęcia czasowo-przestrzenne Wysokie wymagania do danych» Reprezentatywność danych» Dostępna wiedza dziedzinowa» Powiązane danych z wiedzą dziedzinową» Kompletne i poprawne odzwierciedlenie zjawisk czasowo-przestrzennych opisywanych przez dane Trudności z pozyskaniem danych» Dwa źródła danych: symulator ruchu drogowego oraz dane medyczne związane z leczeniem niewydolności oddechowej» Trzecie źródło: leczenie żółtaczki (dane dotyczące ekspresji genów - bioinformatyka) 19
Przykład 1: Zastosowanie RoughICE do identyfikacji wzorców zachowania typowa jazda pojazdu oraz wyprzedzanie Wzorce zachowania to złożone pojęcia dotyczące dynamicznych własności obiektów, wyrażane w języku naturalnym, zależne od czasu i przestrzeni» Np: typowa jazda pojazdu, wyprzedzanie, jazda w korku, zachowanie się pacjenta związane z zagrożeniem życia itd. Trudniejsze do aproksymacji od pojęć przestrzennych Wymagają obserwacji obiektu złożonego przez dłuższy czas Mogą być definiowane dla pojedynczych obiektów o jednolitej strukturze lub dla obiektów strukturalnych 20
Narzędzie do generowania danych do pierwszego przykładu: Symulator ruchu drogowego (http://logic.mimuw.edu.pl/~bazan/simulator/) Plansza symulacji Pojazdy jako autonomiczni agenci Operacje i manewry Symulacja sensorów Pojęcia Zapisywanie danych 21
Punkty, okna, wzorce i pojęcia czasowe punkt czasowy okna czasowe Wzorzec czasowy to funkcja o wartościach binarnych określona na danym oknie czasowym Opisuje stan lub elementarne zmiany stanu obiektu w punktach czasowych np. akcja A występuje w oknie czasowym, A występuje przed B, cały czas w oknie jest niska prędkość Pojęcia czasowe - wyższy poziom abstrakcji niż wzorce czasowe t Kolumny wyliczane na podstawie wzorców czasowych Każdy wiersz odpowiada jednemu oknu czasowemu dla jednego obiektu Tablica aproksymacji pojęcia czasowego Kolumna definiowana przez eksperta w 1... w k C NIE... TAK TAK NIE... TAK NIE TAK... NIE NIE NIE... NIE TAK TAK... TAK TAK Dla tablicy generujemy klasyfikator aproksymujący pojęcie C Definiowane przez eksperta w języku naturalnym i formułowane za pomocą pytań o aktualny status obiektów złożonych, np: Czy badany pojazd przyspiesza na prawym pasie? 22
Grafy zachowania się obiektów Pojęcia czasowe jako węzły grafu zachowania się obiektu Połączenia (łuki skierowane) w tym grafie to zależności czasowe pomiędzy pojęciami czasowymi definiowanymi przez eksperta Oznaczają następstwo spełniania po sobie dwóch pojęć czasowych C 4 C 3 C 1 Obiekt u spełnia C1 (w zadawalającym stopniu) Przejście do następnego okna czasowego C 5 C 2 Obiekt u spełnia C2 (w zadawalającym stopniu) C1 C2 23t
Przykład grafu zachowania z danych drogowych (prosty model zachowania się pojazdu podczas jazdy na drodze) Przyspieszanie na prawym pasie Przyspieszanie i zmiana pasa z prawego na lewy Przyspieszanie na lewym pasie Stabilna prędkość na prawym pasie Stabilna prędkość i zmiana pasa z prawego na lewy Stabilna prędkość na lewym pasie 10 wierzchołków 14 połączeń Stabilna prędkość i zmiana pasa z lewego na prawy Zwalnianie na prawym pasie Zwalnianie i zmiana pasa z lewego na prawy Zwalnianie na lewym pasie Trzy możliwości przejścia z wierzchołka: Przyspieszanie na prawym pasie 24
Widok projektu RoughICE dla eksperymentu dotyczącego identyfikacji wzorca zachowania: typowa jazda (projekt z pliku: BP_ident_single_vehicle) 25
Widok projektu RoughICE dla eksperymentu dotyczącego identyfikacji wzorca zachowania: typowa jazda Kolekcja okien czasowych Tablica wzorców czasowych Tablica aproksymacji pojęć czasowych Treningowa tablica danych Klasyfikator dla kolekcji pojęć czasowych Graf zachowania pojedynczego pojazdu Wygenerowana przez klasyfikator tablica ścieżek pojęć czasowych dla sekwencji okien czasowych Kolekcja skryptów opisujących wzorce czasowe Wyniki porównania obydwu tablic ścieżek Testowa tablica danych Kolekcja sekwencji okien czasowych Tablica wzorców czasowych dla sekwencji okien czasowych Wygenerowana na podstawy wiedzy eksperckiej tablica ścieżek pojęć czasowych dla sekwencji okien czasowych 26
Pojęcia czasowe dla grup obiektów Potrzeba śledzenia zachowania grup obiektów zamiast pojedynczych obiektów» np. śledząc wyprzedzanie trzeba śledzić co najmniej dwa pojazdy (wyprzedzający i wyprzedzany) Pojęcia czasowe definiowane dla grup i wyrażone przez eksperta w języku naturalnym» np. pojazd A jedzie za pojazdem B na prawym pasie Aproksymacja pojęć czasowych dla grup za pomocą wzorców czasowych definiowanych dla ścieżek z grafów zachowania pojedynczych obiektów 27
Przyspieszanie na prawym pasie Stabilna prędkość na prawym pasie Zwalnianie na prawym pasie Przyspieszanie i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z lewego na prawy Zwalnianie i zmiana pasa z lewego na prawy Przyspieszanie na lewym pasie Stabilna prędkość na lewym pasie Zwalnianie na lewym pasie Aproksymowanie pojęć czasowych dla grup obiektów (grupa dwóch pojazdów, z których jeden wyprzedza drugi) Kolumny wyliczane na podstawie wzorców czasowych opisujących zachowanie pierwszego pojazdu Kolumny wyliczane na podstawie wzorców czasowych opisujących zachowanie się pojazdów względem siebie Kolumny wyliczane na podstawie wzorców czasowych opisujących zachowanie drugiego pojazdu w 1... w k r 1... r l v 1... v s C Przyspieszanie na prawym pasie Stabilna prędkość na prawym pasie Zwalnianie na prawym pasie Przyspieszanie i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z lewego na prawy Zwalnianie i zmiana pasa z lewego na prawy Obiekty są składane na podstawie więzów (składamy pary pojazdów, które mogą wyprzedzać) Przyspieszanie na lewym pasie Stabilna prędkość na lewym pasie Zwalnianie na lewym pasie Przyspieszanie na prawym pasie Stabilna prędkość na prawym pasie Zwalnianie na prawym pasie Przyspieszanie i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z prawego na lewy Stabilna prędkość i zmiana pasa z lewego na prawy Zwalnianie i zmiana pasa z lewego na prawy Przyspieszanie na lewym pasie Stabilna prędkość na lewym pasie Zwalnianie na lewym pasie Kolumna definiowana przez eksperta Wszystkie wzorce czasowe obliczane są na podstawie obserwacji ścieżek w grafach zachowania Graf zachowania się pojazdu wyprzedzającego Graf zachowania się pojazdów względem siebie Graf zachowania się pojazdu wyprzedzanego 28
Wzorzec zachowania wyprzedzanie (graf typowego zachowania się pary pojazdów podczas wyprzedzania) 1. Pojazd A jedzie za pojazdem B na prawym pasie 6. Pojazd A jedzie przed B na prawym pasie 3. Pojazd A cofa się na prawy pas, B jedzie na prawym pasie 2. Pojazd A zmienia pas z prawego na lewy, B jedzie na prawym pasie 5. Pojazd A zmienia pas z lewego na prawy, B jedzie na prawym pasie 4. Pojazd A jedzie na lewym pasie i mija B, B jedzie na prawym pasie Ścieżka: 1, 2, 3, 1, 2, 4 pasuje do grafu zachowania manewru wyprzedzania Ścieżka: 6, 5, 4 nie pasuje do grafu zachowania (może pasować do grafu zachowania innego manewru) 29
Widok projektu RoughICE dla eksperymentu dotyczącego identyfikacji wzorca zachowania: wyprzedzanie Cześć 3 (projekt z pliku: BP_ident_structured3) Dokładny opis jest w poradniku użytkownika 30
Przykład 2: Zastosowanie RoughICE do automatycznego planowania leczenia niemowląt cierpiących na niewydolność oddechową Automatyczne planowanie jest działem sztucznej inteligencji, który dotyczy konstruowania strategii lub ciągów akcji nazywanych planami, wykonywanymi dla osiągnięcia jakiegoś celu» Plany przeznaczone są do wykonania przez inteligentnych agentów, autonomiczne roboty, bezzałogowe pojazdy itp.» Przykłady: zaplanowanie przeprowadzenia manewru wyprzedzania, zaplanowanie leczenia noworodka na najbliższą dobę itd. Problem planowania: znaleźć ciąg stanów i akcji (tzw. plan) od stanu początkowego do docelowego 31
Graf planowania (ontologia pochodząca z wiedzy dziedzinowej) Stan początkowy Ścieżka od stanu początkowego do docelowego jako rozwiązanie problemu planowania Plan: s 1 a 2 s 2 a 3 s 4 Stan docelowy 32
Aproksymacja stanów w grafie planowania Stan jako złożone pojęcie» Specyfikowane przez ekspertów w języku naturalnym Aproksymacja stanów za pomocą klasyfikatorów złożonych» Na podstawie zbiorów danych i wiedzy dziedzinowej» Aproksymacja stanu jako pojęcia czasowego Wynik: Możliwość identyfikacji stanu początkowego planowania Stan początkowy planowania Klasyfikator złożony 33
Narzędzie utrzymywania zgodności wygenerowanego planu z planem eksperckim Aktualny stan i jego historia Atrybuty warunkowe są definiowane przez ekspertów na podstawie stanu aktualnego oraz poprzednich (historycznych) stanów i akcji Wartości atrybutu decyzyjnego są złożeniem akcji oraz stanu będącego efektem wykonania tej akcji a 1... a k Akcja stan Aktualny stan 0.2...... TAK akcja 1 stan 1 0.4...... NIE akcja 2 stan 1 Obiekt reprezentuje historię obiektu złożonego aktualnie będącego w stanie s 4 0.2...... NIE akcja 3 stan 2 0.8...... TAK akcja 1 stan 2 Dla wszystkich stanów, t.j. dla wszystkich odpowiadających im tablic rozstrzygania konfliktów, tworzone są klasyfikatory zwane klasyfikatorami rozstrzygania konfliktów Klasyfikatory te zwracają listę par (akcja+stan) w porządku malejących wag (sugerowanych przez te klasyfikatory) Możliwość określenia nie tylko akcji, ale także efektu zastosowania akcji 34
Skąd pochodzą dane z drugiego przykładu? Skąd dane zostały pozyskane?» Polsko-Amerykański Instytut Pediatrii Collegium Medicum Uniwersytetu Jagiellońskiego Kto udostępnił i współpracował?» prof. dr hab. n. med. Jacek Pietrzyk (dyrektor Instytutu),» dr n. med. Piotr Kruczek (lekarz na oddziale) oraz dr n. med. Stanisława Bazan-Socha Gdzie i jak były gromadzone?» Oddział Patologii i Intensywnej Terapii Noworodków Uniwersyteckiego Szpitala Dziecięcego w Krakowie (Neonatologia)» Kilkanaście lat zbierania danych Jakie zawierają informacje?» Szczegółowy zapis leczenia ponad 300 noworodków przebywających na Oddziale (wyniki badań, diagnozy, zabiegi, lekarstwa itd.) 35
Choroba, której dotyczą dane: niewydolność oddechowa Niewydolność oddechową określa się jako niedostateczne wysycenie tlenem krwi tętniczej lub obniżone wydalanie dwutlenku węgla.» Rozpoznawana jest w oparciu badanie gazometryczne krwi tętniczej oraz inne badania wspomagające, zależnie od przyczyny wystąpienia choroby. Leczenie i zarazem ratowanie życia głównie przy zastosowaniu różnego rodzaju tlenoterapii i inwazyjnego wspomagania wentylacji (np. respiratory) 36
Patologie mające wpływ na niewydolność oddechową u niemowląt SEPSA - ogólnoustrojowa reakcja organizmu na zakażenie (zakażenie + jego skutki np. niewydolność narządów)» Stanowi jedną z głównych przyczyn umieralności i chorobowości w oddziałach intensywnej terapii na całym świecie Ureoplazma nabyta w trakcie porodu infekcja (powoduje np. zapalenie płuc) PDA (przetrwały przewód tętniczy)» Przewód tętniczy w życiu płodowym łączy pień tętniczy z aortą. Po urodzeniu przewód tętniczy zarasta i tworzy więzadło. Jeżeli przewód tętniczy pozostanie drożny powoduje to nieprawidłowy przepływ krwi i nieprawidłowe utlenowienie organizmu. RDS (niedorozwój płuc wcześniaki) NAJWAŻNIEJSZY! 37
Uproszczony graf planowania leczenia RDS Mechanical ventilation MAP3 mode RDS with very severe hypoxemia Mechanical ventilation CPAP mode RDS with mild hypoxemia Mechanical ventilation MAP1 mode (possibility of additional Surfactant administration ) RDS with moderate hypoxemia Mechanical ventilation MAP2 mode (possibility of additional Surfactant administration ) Respiration unsupported RDS with severe hypoxemia RDS excluded 38
Problem porównywania planów Plan 1: (np, zaproponowany przez ekspertów) Plan 2: (np. wygenerowany automatycznie przez system komputerowy) s 1 a 1 s 2 a 2 s 3 a 3 s 4 t 1 b 1 t 2 b 2 t 3 b 3 t 4 Problem: Jak porównać Plan 1 i Plan 2? Istniejące modele relacji podobieństwa bazują na agregacji lokalnych podobieństw» Relacja podobieństwa definiowana jest jako formuła (funkcja) obliczająca wartość numeryczną podobieństwa» Podejście bardzo abstrakcyjne i arbitralne, ponieważ nie bierze pod uwagę wiedzy dziedzinowej na temat podobieństwa Propozycja: Aproksymacja relacji podobieństwa w oparciu o ontologię 39
Idea aproksymacji relacji podobieństwa planów w oparciu o ontologię w przypadku eksperymentu z automatycznym planowaniem leczenia noworodków cierpiących na niewydolność oddechową Ontologia medyczna podobieństwa pomiędzy planami Każde pojęcie reprezentuje jeden aspekt podobieństwa Atrybuty warunkowe reprezentują wszystkie pojęcia z ontologii poza pojęciem opisującym ogólne podobieństwo Pary planów Atrybut decyzyjny reprezentuje ogólne podobieństwo pomiędzy planami C 1... C k GS (pa1, pe1) 0.2 Wartości: 0.3 0.1 (pa2, pe2) 0.4 oznaczenia warstw pojęć 0.5 0.5 (pa3, pe3) 0.2 0.8 0.8 (pa4, pe4) 0.8...... 0.1 0.2 (pa5, pe5) 0.3...... 0.2 0.6 Wiersz odpowiada parze planów: wygenerowany automatycznie + zaproponowany przez eksperta Klasyfikator dla powyższej tablicy pozwala na określanie podobieństwa pomiędzy planami W powyższym opisie zastosowano pewne uproszczenie» W rzeczywistości struktura klasyfikatora jest hierarchiczna (tak jak ontologii) 40
Widok projektu RoughICE dla eksperymentu dotyczącego automatycznego planowania leczenia RDS (projekt z pliku: PlanningUnstructuredForRDS) 41
Widok projektu RoughICE dla eksperymentu dotyczącego automatycznego planowania leczenia RDS Kolekcja okien czasowych Tablica wzorców czasowych Tablica aproksymacji pojęć czasowych Graf planowania leczenia RDS Klasyfikator dla kolekcji pojęć czasowych Treningowa tablica danych Klasyfikator planujący Wzorce czasowe dla planów Kolekcja skryptów opisujących wzorce czasowe dla okien czasowych Klasyfikator podobieństwa pomiędzy planami Treningowa testowa Tablica podobieństwa pomiędzy parami planów Kolekcja dłuższych okien czasowych Kolekcja planów dla danych testowych Kolekcja planów z fragmentami wygenerowanymi automatycznie Wynik porównania par planów Ontologia podobieństwa pomiędzy planami 42
Automatyczne planowanie dla obiektów o złożonej strukturze (dla obiektów składających się z części lub grup obiektów) Meta akcja Stan docelowy Graf planowania leczenia dla niewydolności oddechowej (konsekwencja RDS, sepsy, Ureoplazmy i PDA) Stan początkowy 43
Planowanie meta akcji jako główny element planowania dla obiektów o złożonej strukturze (obiektów składających się z części lub grup obiektów) Graf planowania dla RDS Graf planowania dla sepsy Automatyczne planowanie dla RDS Automatyczne planowanie dla sepsy Kolekcja planów dla RDS Kolekcja planów dla sepsy Kolekcja planów dla meta akcji Proste połączenie planów Eliminacja nieakceptowalnych planów przez reguły eliminacji i klasyfikator meta akcji Graf planowania dla Ureoplazmy Automatyczne planowanie dla Ureoplazmy Kolekcja planów dla Ureoplazmy Kolekcja akceptowalnych planów dla meta akcji Graf planowania dla PDA Automatyczne planowanie dla PDA Kolekcja planów dla PDA Wybór jednego planu Plan dla meta akcji 44
Atrybuty opisujące własności planów dla elementów grupy (cechy wyspecyfikowane przez ekspertów) Eliminacja nie akceptowalnych planów Krok 1: Reguły eliminacji s 1... s k u 1... u l rds 1... rds l pda 1... pda s Tablica eliminacji Każdy obiekt reprezentuje informacje o składanych planach dla konkretnej grupy obiektów złożonych Dla każdego atrybutu generujemy zbiór reguł decyzyjnych z minimalną liczbą deskryptorów, traktując ten atrybut jako decyzję Reguły eliminacji (Zależności w tablicy eliminacji wyrażone za pomocą reguł decyzyjnych z minimalną liczbą deskryptorów) Eliminacja kombinacji planów, które wartościami swoich cech pasują do poprzednika jakiejś reguły eliminacji i nie pasują do następnika tej reguły 45
Eliminacja nie akceptowalnych planów Krok 2: Klasyfikator meta akcji Atrybuty opisujące własności planów dla elementów grupy (cechy wyspecyfikowane przez ekspertów) Wartości atrybutu decyzyjnego reprezentują nazwę meta akcji jaka jest wykonana w wyniku realizacji planów z danego wiersza s 1... s k u 1... u l rds 1... rds l pda 1... pda s Meta akcja Tablica meta akcji Akcja1 Akcja2 Akcja1 Każdy obiekt reprezentuje informacje o składanych planach dla konkretnej grupy obiektów złożonych Klasyfikator skonstruowany dla tablicy meta akcji pozwala na predykcję meta akcji, jaka zostanie wykonana w wyniku realizacji danej kombinacji planów dla poszczególnych elementów grupy 46
Widok projektu RoughICE dla eksperymentu dotyczącego automatycznego planowania leczenia niewydolności oddechowej (projekt nr 5 z pliku: PlanningForStructured5) Dokładny opis jest w poradniku użytkownika 47
Przykład 3: Zastosowanie RoughICE do aproksymacji przestrzennego pojęcia: bezpieczna jazda pojazdu Do aproksymacji pojęć przestrzennych można używać ARschematów Są to hierarchiczne klasyfikatory zbudowane w oparciu o zbiory danych i wiedzę dziedzinową wyrażoną głównie w postaci ontologii pojęć Jedną z metod konstrukcji AR-schematów zaimplementowano w RoughICE Do zrozumienia czym są AR-schematy, jak się je konstruuje i stosuje do klasyfikacji obiektów trzeba zrozumieć następujące pojęcia: wzorzec, warstwy pojęcia, klasyfikator warstwujący, reguła składania wzorców, produkcja oraz AR-schemat 48
Wzorce najprostsze narzędzie do aproksymowania pojęć Wzorce dla pojęć to opisy obiektów należących do opisywanego pojęcia wyrażone w języku dostępnych cech obiektów i umożliwiające sprawdzenie czy dany obiekt należy (pasuje) do wzorca.» Np. wzorzec pacjentów chorych na anginę to: (gorączka= wysoka ) i (ból gardła= TAK ) Wzorce mogą być:» ostre opisują tylko obiekty należące do pojęcia» nieostre opisują obiekty, których pewna część należy do pojęcia (parametr: stopień zawierania wzorca w pojęciu warstwy pojęcia) 49
Klasyfikator warstwujący jako narzędzie opisywania warstw pojęcia Klasyfikator podający przynależność obiektu testowego do konkretnej warstwy pojęcia Dwa podejścia do konstruowania klasyfikatorów warstwujących» Podejście ekspertowe 1. Ekspert definiuje dodatkowy atrybut w danych, który opisuje przynależność obiektów do poszczególnych warstw 2. Tworzony jest klasyfikator rozróżniający warstwy jako klasy decyzyjne» Podejścia automatyczne Obiekt testowy Klasyfikator warstwujący Na podstawie pewnych przesłanek i obserwacji eksperymentalnych, projektowane są algorytmy, które pozwalają na klasyfikowanie obiektów do warstw pojęcia Np. warstwy pojęcia mogą być opisywane opisywane są przez zbiory reguł skróconych do różnych współczynników dokładności 50
Reguła składania wzorców Pojęcia są aproksymowane przez 6 uporządkowanych liniowo wartości: certainly YES > rather YES > possibly YES > possibly NO > rather NO > certainly NO C1 C C2 Kolumny aproksymowane przez klasyfikatory warstwujące C1 C2 C certainly YES certainly YES certainly YES certainly NO certainly NO certainly NO rather YES certainly YES rather YES possibly YES possibly NO possibly YES possibly YES possibly NO rather NO possibly YES rather YES rather YES possibly YES certainly NO possibly NO certainly YES rather YES certainly YES certainly NO possibly NO certainly NO Reguła składania wzorców jako klasyfikator Kolumna definiowana przez eksperta lub generowana automatycznie C1 possibly YES C1 certainly YES C1 possibly YES C Wzorzec wyjściowy rather YES C2 Wzorce wejściowe C2 rather YES C2 certainly NO rather YES C C rather YES rather YES - Praktyczna realizacja wcześniejszych idei prof. Skowrona - Związek z DRSA (Dominance-based Rough Sets Approach) - Greco, Matarazzo, Słowiński 1996 51
Produkcja Produkcja jako kolekcja reguł składania wzorców.» W tym przypadku są to trzy reguły opisujące zależność między pojęciami C1, C2 i C C certainly YES C possibly YES C rather YES C1 certainly YES C2 rather YES C1 possibly YES C2 possibly NO C1 possibly YES C2 rather YES 52
Schemat wnioskowania aproksymacyjnego (AR-schemat) C1...C5 - pojęcia aproksymowane przez trzy uporządkowane liniowo wartości: small, medium i large. AR-schemat Produkcja dla C 5 AR-schemat jako nowa reguła składania wzorców Produkcja dla C 3 53
Dwa podejścia do konstruowania AR-schematów Podejście bazujące na pamięci z AR-schematami» Po wyznaczeniu produkcji budujemy wiele AR-schematów, które później przechowujemy i używamy do klasyfikacji obiektów testowych Podejście bazujące na dynamicznym budowaniu AR-schematów» Podczas klasyfikowania obiektu testowego, mając dane różne produkcje, budujemy z nich stosowny AR-schemat do sklasyfikowania tego obiektu 54
Ontologia drogowa dla pojęcia jazda bezpieczna 55
Widok projektu RoughICE dla eksperymentu dotyczącego aproksymacji pojęcia jazda bezpieczna (projekt z pliku: ARS_build_and_test) Ontologia drogowa Magazyn komponentów do budowy AR-schematów (kolekcja produkcji) Treningowa tablica danych Testowa tablica danych Wyniki klasyfikacji 56
Witryna środowiska RoughICE Adres:» http://logic.mimuw.edu.pl/~bazan/roughice/ Pobierany jest program instalacyjny 57