SYSTEM ROZMYTY DO STRATYFIKACJI RYZYKA SERCOWO NACZYNIOWEGO Tadeusz NAWARYCZ 1,2, Krzysztof PYTEL 1, Lidia OSTROWSKA NAWARYCZ 2 1 Department of Networking and Operating Systems, Academy of Humanities and Economics in Łódź, Poland 2 Department of Human Physiology and Biophysics, Medical University in Łódź, Poland Streszczenie Przedstawiono prosty system rozmyty, przeznaczony do wstępnej oceny globalnego ryzyka rozwoju chorób sercowo naczyniowych u dzieci i młodzieży w wieku szkolnym. Podstawowym zadaniem systemu jest stratyfikacja ryzyka globalnego oraz selekcja dzieci wymagających przeprowadzenia konsultacji i dodatkowych badań specjalistycznych. System analizuje występowanie trzech atrybutów ryzyka: otyłości ogólnej, otyłości brzusznej oraz podwyższonego ciśnienia tętniczego krwi. Zaproponowano bazy reguł rozmytych, kształt funkcji przynależności poszczególnych zmiennych lingwistycznych jak również koncepcje wyostrzania wyników klasyfikacji. Słowa kluczowe: czynniki ryzyka sercowo naczyniowego, dzieci, stratyfikacja ryzyka, system rozmty 1 Wstęp Dane epidemiologiczne prowadzone w wielu krajach wskazują, że czynniki ryzyka takie jak: nadmierna masa ciała, nadciśnienie tętnicze, zaburzenia gospodarki lipidowej, upośledzona tolerancja glukozy, mała aktywność ruchowa i inne mogą występować już we wczesnym okresie życia [1], [2], [3].
U osób dorosłych ocena ryzyka wystąpienia incydentu sercowo naczyniowego bądź też zgonu pacjenta w perspektywie najbliższego okresu czasu np. 10 lat określana jest na podstawie statystycznych metod analizy czasu przeżycia określanych na podstawie wieloletnich badań i obserwacji [4]. Ocena oraz identyfikacja markerów ryzyka rozwoju chorób o podłożu miażdżycowym w wieku rozwojowym jest procesem bardziej złożonym a jednocześnie niezwykle istotnym z punktu widzenia wczesnej pierwotnej profilaktyki kardiologicznej. W interpretacji atrybutów ryzyka u dzieci należy uwzględniać płeć, wiek oraz osobniczy rozwój biologiczny oceniany na podstawie charakterystycznych dla danego regionu norm. Ocenę występowania danego czynnika jak i jego nasilenie w wieku rozwojowym dokonuje się w oparciu o jego centylowe rozkłady w postaci tzw. krzywych centylowych. Ustalane przez Światowe Towarzystwa Pediatryczne Normy i kryteria patologii bazują na wartościach cenylowych danego atrybutu ryzyka. Z klinicznego punktu widzenia najistotniejsza jest ocena globalnego ryzyka (GR), która powinna stanowić podstawę decyzji i zaleceń nt. badań dodatkowych oraz profilaktyki. Jest to szczególnie istotne przy decyzjach dotyczących wprowadzania u dzieci i młodzieży terapii farmakologicznej. Wiedza na temat czynników ryzyka w wieku rozwojowym cechuje się znacznym stopniem niepewności oraz niejednoznaczności. Istnieją liczne kontrowersje związane z arbitralnie przyjmowanymi punktowymi kryteriami oceny granicznych wartości czynników ryzyka [2], [3]. Należy ponadto mieć na uwadze fakt, że badania oraz obserwacje czynników ryzyka w wieku rozwojowym obejmujące również ich późniejsze skutki nie są tak dobrze udokumentowane jak u osób dorosłych. Nieliczne prace w tym względzie podkreślają jednak zjawisko trakingu głównych czynników ryzyka stwierdzanych w wieku rozwojowym. Wymienione problemy sprawiają, że w prognozowaniu i ocenie globalnego ryzyka coraz częściej stosuje się metody przetwarzania wiedzy niepewnej takie jak metody probabilistyczne, teorie Dempstera Schaffera czy też teorię logiki rozmytej [4], [5], [6], [7]. Celem pracy jest zaprezentowanie rozmytego systemu do wstępnej selekcji dzieci i młodzieży o podwyższonym bądź wysokim GR chorób sercowo naczyniowych.
2 Opis systemu Funkcjonowanie rozmytego systemu stratyfikacji ryzyka opiera się o bazę wiedzy ekspertów oraz reguły wnioskowania rozmytego dotyczące trzech niezależnych czynników (atrybutów) ryzyka: - Podwyższone ciśnienie tętnicze krwi BP (Blood Pressure) w tym ciśnienie skurczowe SBP (Systolic Blood Pressure) i/lub rozkurczowe DBP (Diastolic Blood Pressure). - Otyłość ogólna oceniana pośrednio za pomocą wskaźnika masy ciała BMI (Body Mass Index) - Otyłość brzuszna oceniana pośrednio za pomocą obwodu pasa WC (Waist Circumference) Wymienione trzy atrybuty ryzyka stanowią przedmiot rutynowych, okresowych badań dzieci i młodzieży szkolnej w ramach tzw. bilansów zdrowia. Wielkości SBP, DBP, BMI oraz WC stanowią dane wejściowe klasyfikatora. 2.1 Funkcje przynależności zmiennych lingwistycznych Bezwzględne wartości analizowanych cech (BP, BMI, WC) uzyskane z badań dziecka, w pierwszym etapie należy przetransformować na adekwatną postać centylową cechy. W tym celu zastosowano opracowane dla dzieci i młodzieży łódzkiej, modele LMS rozkładów centylowych zarówno ciśnienia tętniczego jak również podstawowych wskaźników stanu odżywienia [3]. Kierując się zaleceniami oraz sugestiami czołowych Towarzystw Pediatrycznych jak również własnym doświadczeniem zaproponowano liniowe funkcje przynależności dla poszczególnych analizowanych atrybutów ryzyka przyjmując przy tym jednakowe dla wszystkich analizowanych cech charakterystyczne poziomy definiujące nasilenie danego atrybutu ryzyka: 75-ty centyl, 90-ty centyl oraz 95 ty centyl (Rysunek.1). W przestrzeni lingwistycznej wartość wejściową każdego atrybutu oceniano jako: Norma, Podwyższona, Wysoka (Rys.1, [5]). 1 0,8 μ(x) 0,6 0,4 0,2 0 50 60 70 80 90 100 Norma Powdyższona Wysoka Rysunek 1. Funkcja przynależności dla dowolnego atrybutu ryzyka X
2.2 Baza reguł klasyfikatora Klasyfikator podejmuje decyzje dotyczące zakwalifikowania dziecka do odpowiedniej grupy ryzyka korzystając z bazy reguł rozmytych. Baza ta stworzona została przez ekspertów i odzwierciedla aktualny stan wiedzy. W proponowanym systemie zastosowano bazę reguł, której istota zawarta jest w tabeli 1. Tabela 1. Schemat zastosowanej w klasyfikatorze bazy reguł. Wartość atrybutu Globalne Ryzyko Kombinacje trzech atrybutów ryzyka O O O O O O O O O O Brak Średnie Wysokie B. wysokie Ryzyka GR GR GR O - atrybut ryzyka na poziomie Norma - Podwyższona wartość atrybutu ryzyka - Wysoka wartość atrybutu ryzyka Dla zaproponowanej gradacji GR baza reguł składa się ostatecznie z 27 reguł: Brak GR 1 reguła; Średnie GR 7 reguł; Wysokie GR 12 reguł i Bardzo Wysokie GR 7 reguł. Przykład reguł dotyczących wyjściowej cechy Średnie GR : : a/ if BP = Norma and BMI = Norma and WC = Podwyż. b/ if BP = Norma and BMI = Podwyż. and WC = Norma c/ if BP = Podwyż. and BMI = Norma and WC = Norma d/ if BP = Norma and and BMI = Podwyż. and WC = Podwyż. e/ if BP = Podwyż. and BMI = Podwyż. and WC = Norma f/ if BP = Podwyż.and BMI = Norma. and WC = Podwyż. g/ if BP = Podwyż.and BMI = Podwyż. and WC = Podwyż. 2.3 Stratyfikacja ryzyka - wyostrzanie wyników klasyfikacji W proponowanym systemie przyjęto, że na wyjściu systemu prezentowana będzie wartość liczbowa wyrażająca stopień ryzyka
wystąpienia chorób układu krążenia. W systemie przyjęto, że wartość ta będzie z zakresu od 0 do 100. Należy jednak zaznaczyć, iż wartość ta nie jest wyrażana w procentach. Jeżeli na przykład na wyjściu z systemu uzyskamy wynik równy 100, nie oznacza to, że choroba wystąpi na pewno. Podobnie, jeżeli ryzyko wyrażone zostanie wartością 0 nie oznacza, że choroba nie wystąpi. W systemie zaproponowano blok wyostrzania, który zamienia wartość lingwistyczną opisującą GR na wartość wyrażoną za pomocą liczby. Zmienna lingwistyczna wyrażająca ryzyko, opisana jest za pomocą 4 zmiennych rozmytych. Każda z reguł, w zależności od stanu sygnałów wejściowych może aktywować poszczególne zmienne ryzyka w różnym stopniu. Zbiory rozmyte wartości ryzyka zastępowane są singletonami o wysokości odpowiadającej stopniowi aktywowania poszczególnych zbiorów. Przyjęto, że stopień aktywowania poszczególnych wartości jest sumą stopnia aktywowania dla wszystkich reguł, które aktywują dany zbiór m μ * = μ (1) B j = 1 Bj gdzie: μ B * - stopień aktywowania zbioru B { N, ŚR, WS, BM} μ Bj - stopień aktywowania zbioru B przez regułę j m - liczba reguł w bazie Dla zmiennych oznaczających ryzyko Średnie oraz Wysokie singletony umieszczane są w wartości modalnej dla danego zbioru. Dla zmiennej Niskie singleton umieszczony jest w punkcie 0, natomiast dla zmiennej Bardzo wysokie w punkcie 100. Na Rysunku 2 przedstawiono sposób umiejscowienia poszczególnych singletonów. Rysunek 2. Konstrukcja funkcji przynależności dla oceny ryzyka globalnego GR
Rozmieszczenie takie nie powoduje zawężenia zakresu defuzyfikacji. Ponadto w przypadku aktywowania tylko zmiennej Niskie system wskazuje ryzyko o wartości 0, a w przypadku aktywowania tylko zmiennej Bardzo wysokie system wskazuje ryzyko o wartości 100. Wynik defuzyfikacji oblicza się według wzoru GR* n i= 1 = n GR i * μb * i= 1 μ * gdzie: n liczba zmiennych rozmytych ryzyka B (2) 3 Podsumowanie Ryzyko wystąpienia chorób układu krążenia jest problemem niezwykle istotnym z punktu widzenia społecznego. Z medycznego punktu widzenia diagnoza jest trudna, wymagająca wielu badań specjalistycznych i niejednokrotnie obarczona błędem spowodowanym indywidualnymi cechami danego osobnika. Możliwość oszacowania ryzyka oraz podjęcia odpowiednich działań zapobiegawczych we wczesnym okresie może przyczynić się do poprawy ogólnego stanu zdrowia społeczeństwa i jednocześnie obniżyć koszty leczenia pacjentów. Zaproponowany w pracy klasyfikator rozmyty ma za zadanie wstępną kwalifikację dzieci w wieku szkolnym do poszczególnych grup ryzyka wystąpienia chorób układu krążenia. Klasyfikator podejmuje decyzje na podstawie analizy trzech spośród wielu czynników ryzyka. Z tego powodu jego ocena może być traktowana jedynie jako wskazanie grupy dzieci, które powinny zostać poddane szczególnej opiece lub skierowaniu na konsultacje do specjalisty. W celu zwiększenia dokładności klasyfikacji możliwe jest zwiększenie liczby czynników ryzyka, uwzględnianych podczas klasyfikacji oraz kształtu i położenia funkcji przynależność wartości zmiennych lingwistycznych. W warunkach szkolnych system może być wykorzystany przez personel posiadający jedynie umiejętności przeprowadzenia rutynowych badań i nie posiadający specjalistycznej wiedzy na temat chorób układu krążenia.
Literatura [1] Goodman E., Dolan L., Morrison J., Daniels S.: Factor analysis of clustered cardiovascular risks in adolescence: obesity is the predominant correlate of risk among youth. Circulation, 2005, 19: 1970-77. [2] Steinberger J.: Diagnosis of the metabolic syndrome in children. Curr Opin Lipidol., 2003, 14: 555 9. [3] Ostrowska Nawarycz L., Nawarycz T.: Ciśnienie tętnicze u dzieci i młodzieży łódzkiej w wieku 7-19 lat. Wyd. Uniw. Med. Łódź 2006. [4] Grossi E.: How artificial intelligence tools can be used to assess individual patient risk in cardiovascular disease: problems with the current methods. BMC Cardiovascular Disorders, 2006, Vol.6, No.20, pp. 1471-2261. [5] Nawarycz T., Ostrowska Nawarycz L.: Evaluation of the cardiovascular risk factors in children and youth using fuzzy logic. Proceedings of the 2nd Polish and International PD- Forum Conference on Computer Science. Smardzewice Łódź, Poland, 2006 [6] Zadeh L.A., 2000, Outline of a computational theory of perceptions based on computing with words, In: Sinha N.K., Gupta M.M. (Eds.), Soft Computing and Intelligent Systems: Theory and Applications, Academic Press, San Diego, New York, Tokio, pp. 3-22. [7] Rutkowska D., Starczewski A., Nowicki R.,2002, Sieci neuronowe i logika rozmyta w systemach medycznych. Tom 7, Biocybernetyka i inżynieria biomedyczna 2000, : Systemy komputerowe i teleinformatyczne w służbie zdrowia., pp. 287-310. Akademicka Oficyna Wyd. EXIT, Warszawa. [8] Cole TJ, Green PJ, Smoothing reference centile curves: The LMS method and penalized likelihood. Statistics in medicine. 1992,11,1305-1319.
CARDIOVASCULAR RISK STRATIFICATION USING THE FUZZY SYSTEM Tadeusz NAWARYCZ 1,2, Krzysztof PYTEL 1, Lidia OSTROWSKA NAWARYCZ 2 1 Department of Networking and Operating Systems, Academy of Humanities and Economics in Łódź, Poland 2 Department of Human Physiology and Biophysics, Medical University in Łódź, Poland Abstract The simple fuzzy system for initial evaluation of total risk of cardiovascular diseases In children and youth At school age were presented. The main role of the system is total risk stratification and initial selection of children for more specialist examination and additional consultation. The system analysed three noninvasive risk factors: total obesity, abdominal obesity and high of blond pressure. The bases of fuzzy rules, membership functions for the analysed attributes as well as methods of results deffuzification were proposed. Keywords: cardiovascular risk factors, children, risk stratification, fuzzy system