POLSKA GRUPA NARODOWA MIĘDZYNARODOWEGO TOWARZYSTWA BIOSTATYSTYKI KLINICZNEJ Gradacyjna eksploracja danych klinicznych Grade Eksploration of Clinical Data dr Anna Wolińska Welcz (Lublin) Kraków, 4.XII.2009 1
CZYM JEST EKSPLORACJA DANYCH? Nauka zajmująca się wydobywaniem informacji z dużych zbiorów danych lub baz danych (D. Hand, H. Mannila, P. Smyt: Principles of Data Mining, Cambridge, 2001) data mining, zgłębianie danych, drążenie danych, wydobywanie cennej wiedzy z danych analiza danych pochodzących z obserwacji w celu znalezienia nieoczekiwanych związków i oryginalne podsumowanie danych w sposób przydatny dla ich właściciela (globalne modele, lokalne wzorce) Anna Wolińska-Welcz 2
Eksploracja danych a stereotypy w tradycyjnym wnioskowaniu statystycznym dane traktuje się jako próbę otrzymaną z domniemywanej populacji, na podstawie której to próby wnioskuje się o owej populacji (pomimo trudności ze spełnieniem warunków nakładanych na sposób losowania próby oraz ze sprecyzowaniem o jaką populację chodzi) stereotyp traktujący dane jako takie lub inne próby modele i metody eksploracji danych nie są ukierunkowane na poszukiwanie informacji o populacji, a na poszukiwanie ukrytej struktury danych Anna Wolińska-Welcz 3
Gradacyjna analiza danych nowa gałąź szybko rozwijającego się obecnie data-mining istotny krok na drodze do integracji teorii pomiaru, analizy danych, statystyki i taksonomii metoda ukierunkowana na bardzo dobrą wizualizację danych, w celu lepszego zrozumienia ich ogólnej struktury wykorzystywana przy poszukiwaniu: ukrytych struktur danych, trendów, bardziej jednorodnych podpopulacji, elementów odstających (outlierów) oraz uporządkowanych skupień. 4
Cel użycia metod gradacyjnych - zrozumieć dane, odkryć prawdziwe, ukryte struktury w danych rozkłady wielowymiarowe są reprezentowane przez dwuwymiarowe macierze danych, które przy pewnych założeniach można potraktować jako tablice prawdopodobieństw gradacyjna eksploracja pozwala wyłonić zmienne objawowe wywierające silny wpływ na pozostałe chociaż w praktyce trudno jest idealnie spełnić wymagane założenia metody gradacyjne okazują się zwykle odporne, by wykryć strukturę (model) danych 5
Dane kliniczne wielowymiarowe ze skal i kwestionariuszy psychologicznych głównym celem ich eksploracji jest znalezienie zależności między analizowanymi zmiennymi (cechami, skalowanymi wartościami) a obserwowanymi obiektami (pacjentami, przypadkami) ważna jest też ich klarowna wizualizacja rzadko można traktować je jako próbę losową (a nie próbę możliwą, dostępną, dogodną) pochodzącą z dobrze określonej populacji (a nie populacji domniemywanej) Anna Wolińska-Welcz 6
Tablica analizowanych danych klinicznych cechy pierwszoplanowe cechy drugoplanowe nr KWESTIONARIUSZ OBJAWOWY "O" ALEKSANDROWICZA KWEST KWEST suma względna rozpozn. stan wykształ pacjenta zab. neura zab. derealizacja czne objawowa lęk depresja niepokój histeria natręt. społ. hipoch. psych. somaty poprawa płeć wiek cywilny cenie Bizonia Rottera "O" lekarskie snu stenia sex 1 9 22 32 5 20 24 0 0 0 12 4 21 58 14 2 207 0,34 zab_nerw m 33 1 śz 2 4 8 15 4 15 0 0 16 4 11 8 5 32-30 2 122-0,41 lęk_depr m 20 0 zz 3 35 36 32 16 30 46 7 13 17 26 17 33 129 15 3 437 0,50 adapt k 31 0 nw 4 61 37 28 27 24 53 11 12 56 28 18 36 106 42 4 496 0,12 inne m 36 0 śz 5 38 49 33 28 30 46 0 24 7 24 5 33 48 12 5 365 0,81 zab_nerw k 26 0 śz 6 66 36 55 30 34 56 20 27 41 26 38 34 167 34 6 629 0,20 adapt m 54 0 w 7 29 34 22 17 23 21 5 5 25 19 9 25 77 22 7 311 0,36 inne m 27 0 śo 8 18 12 22 20 18 34 5 14 4 0 14 13 167-2 7 340 0,30 adapt m 21 0 zz 9 8 25 29 0 8 28 0 4 8 12 16 29 32-7 7 198-0,30 lęk_depr m 26 0 śz 10 25 39 20 0 27 26 11 24 23 22 28 38 39 7 7 323-0,15 adapt m 20 0 śo 11 8 10 16 21 17 20 8 0 4 21 21 12 119 8 8 277 0,33 zab_nerw k 29 0 p 12 63 13 38 21 23 12 8 8 17 4 32 21 132 16 8 390 0,43 inne m 30 1 śo 13 18 13 26 14 0 33 12 4 8 13 0 8 23 19 8 170 0,07 zab_nerw m 30 0 w 14 19 5 18 4 15 14 0 14 19 7 15 8 93-22 8 194 0,04 neurast m 34 1 zz 15 75 35 41 13 31 48 0 12 22 14 42 26 122 39 9 481 0,26 lęk_depr m 35 1 śo 16 72 15 10 28 12 41 0 5 0 0 25 18 171 46 9 396 0,43 adapt k 54 1 śz 17 79 28 27 19 28 38 0 0 4 22 42 23 161 20 9 472 0,27 adapt k 42 0 śz 18 68 23 32 0 12 40 0 29 12 14 7 7 55 20 9 298 0,60 lęk_depr k 38 1 śo 19 39 31 35 19 31 38 8 0 22 0 20 26 55 30 9 323 0,28 adapt k 26 0 nw 20 24 31 23 4 9 32 5 5 4 20 4 16 77 2 9 253-0,38 adapt k 24 0 zz 21 34 23 30 9 29 37 4 46 19 20 0 16 84 30 9 351 0,31 lęk_depr k 36 1 w 22 24 8 21 0 14 0 0 8 8 23 0 0 61-16 9 167 0,38 zab_nerw k 21 0 śo 23 22 42 23 17 8 30 23 0 7 18 14 17 13 20 9 234-0,06 lęk_depr m 21 0 śz 24 25 22 23 19 25 50 14 8 21 16 28 21 116 33 10 388-0,24 lęk_depr m 34 0 śo 25 28 17 30 25 23 33 8 12 21 17 4 9 93 20 10 320 0,43 zab_nerw m 36 1 śo 26 25 13 18 18 20 13 0 0 21 8 4 21 64 23 10 226-0,19 zab_nerw m 30 1 zz 27 16 13 28 13 29 50 16 7 14 18 28 31 119 23 10 381 0,25 zab_nerw k 37 1 śo 28 58 32 33 22 27 41 12 16 16 5 14 22 142 16 10 439 0,56 lęk_depr k 34 1 w 29 15 22 29 28 23 37 12 8 13 16 32 17 116 23 10 367 0,32 zab_nerw m 29 1 śo 30 47 42 35 4 21 29 16 17 26 20 24 16 74 22 10 371 0,45 lęk_depr m 25 0 śz
Macierz danych tablica pacjenci / zmienne Kody pacjentów Zmienne pierwszoplanowe (ze skal i kwestionariuszy) Zmienne drugoplanowe (demograficzne, kategoryzujące, podsumowywujące) X 1 X 2... X k X k+1... X n P1 P2... Pm Anna Wolińska-Welcz 8
Zmienne kwestionariuszowe pierwszoplanowe Skala I-E Rottera służy do pomiaru położenia na kontinuum od zgeneralizowanego poczucia kontroli zewnętrznej (External Locus of Control) do zgeneralizowanego poczucia kontroli wewnętrznej (Internal Locus of Control). Przyjmuje wartości od 0 do 23 (małe wartości skali wskazują na wewnętrznątrzsterowność, wysokie wyniki - na zewnątrzsterowność); Skala Bizonia metoda pomiaru poziomu neurotyczności wysoki pomiar skali oznacza nerwowość lub neurotyzm (wyniki tej skali muszą zostać przetransformowane do wymaganych wartości dodatnich) Anna Wolińska-Welcz 9
Koncepcja Rottera W naukach społecznych znana jest koncepcja podziału ludzi na wewnątrzsterownych którzy kierują się w znacznie większym stopniu własnym systemem wartości i celami zaszczepionymi we wczesnych okresach życia (przez rodziców), zewnątrzsterownych - bardziej wrażliwych na wpływy ze strony innych osób (środki masowego przekazu, otoczenie, system szkolny, obowiązujące nakazy i zakazy, instrukcje, kary i nagrody). Osoby wewnątrzsterowne określane też jako o osoby o wewnętrznej lokalizacji ośrodka kontroli są bardziej odporne na wpływy społeczne i bardziej niezależne niż osoby zewnątrzsterowne z zewnętrzną lokalizacją ośrodka poczucia kontroli. Anna Wolińska-Welcz 10
Zmienne kwestionariuszowe pierwszoplanowe c.d. Podskale Kwestionariusza Objawowego Aleksandrowicza : zaburzenia lękowe i fobia depresja (zaburzenia dystymiczne) niepokój, napięcie zaburzenie hipochondryczne zaburzenia somatyczne zaburzenia histeryczne (konwersyjne) zaburzenia neurasteniczne psychastenia zaburzenia derealizacyjne natręctwa (zaburzenia obsesyjno-kompulsyjne) zaburzenia seksualne zaburzenia snu zakłócenia w relacjach społecznych 11
Zmienne kwestionariuszowe drugoplanowe o Suma O suma podskal kwestionariusza Aleksandrowicza o Improvement obserwowana względna poprawa objawowa o Zmienne demograficzne (płeć, wiek, stan cywilny, wykształcenie) o Wstępne rozpoznania lekarskie (w klasyfikacji ICD-10) a wśród nich najczęstsze: F 41 - zaburzenia depresyjne i lękowe F 43.2 - zaburzenia adaptacyjne F 48.0 - zaburzenia neurasteniczne F 48.9 - zaburzenia nerwicowe F 60.8 - zaburzenia osobowości 12
Eksploracja gradacyjna danych klinicznych Metody gradacyjne polegają na: równoczesnym przestawieniu w tablicy danych jej wierszy i kolumn w taki sposób, żeby w wynikowej tablicy cecha porządkująca wiersze była jak najsilniej dodatnio zależna od cechy porządkującej kolumny wyznaczeniu skupień wierszy i kolumn tak, żeby do tego samego należały zmienne i obiekty sąsiadujące ze sobą w uporządkowaniu gradacyjnym przedstawieniu otrzymanych danych w formie obrazu mapy nadreprezentacji, będącej wykresem gęstości gradacyjnej (określającej rozkład gradacyjny na kwadracie jednostkowym, jego dystrybuanta bywa zwana kopułą). 13
Na czym polegają w praktyce metody gradacyjne? Metody gradacyjne polegają na: równoczesnym przestawieniu w tablicy danych jej wierszy i kolumn w taki sposób, żeby w wynikowej tablicy cecha porządkująca wiersze była jak najsilniej dodatnio zależna od cechy porządkującej kolumny wyznaczeniu skupień wierszy i kolumn tak, żeby do tego samego należały zmienne i obiekty sąsiadujące ze sobą w uporządkowaniu gradacyjnym przedstawieniu otrzymanych danych w formie obrazu mapy nadreprezentacji, będącej wykresem gęstości gradacyjnej (określającej rozkład gradacyjny na kwadracie jednostkowym, jego dystrybuanta bywa zwana kopułą) Copula Based Models 14
Mapa dla 80 leczonych pacjentów hipochondria derealizacja somatyczne natręctwa lęk zab_snu zab_sex histeria neurastenia niepokój społeczne psychastenia depresja neurotyzm B Rotter P78 P31 P57 P67 P64 P4 P54 P3 P18 P42 P5 P16 P38 P36 P17 P76 P15 P7 P70 P72 P2 P63 P26 P19 P53 P13 P55 P29 P39 P33 P47 P11 P75 P24 P44 P48 P32 P71 P1 P27 P68 P58 P74 P52 P6 P73 P80 P22 P43 P14 P59 P23 P28 P56 P41 P69 P21 P51 P60 P79 P20 P46 P9 P62 P50 P40 P66 P25 P8 P30 P45 P10 P37 P12 P49 P34 P77 P61 P65 P35 15 derealization hypochondria compulsions somatic symptoms fear sleep disorders sexual disorders hysteria neurasthenia anxiety social difficulties psychasthenia depression Bizoń scale I-E Rotter scale P78 P31 P74 P57 P67 P22 P73 P4 P14 P59 P5 P36 P16 P76 P69 P17 P51 P7 P2 P72 P70 P9 P46 P50 P66 P53 P55 P25 P39 P33 P47 P37 P12 P49 P44 P48 P77 P65 P1 P27 P58 P68 P54 P52 P64 P6 P80 P3 P43 P42 P18 P23 P28 P38 P56 P41 P79 P60 P21 P15 P63 P20 P26 P19 P40 P62 P13 P29 P8 P30 P45 P10 P11 P75 P24 P34 P32 P61 P71 P35 0.6 0.63 0.65 0.68 0.71 0.74 0.77 0.8 0.84 0.87 0.91 0.95 0.98 1.03 1.07 1.11 1.16 1.21 1.26 1.31 1.37 1.42 1.48 1.55 1.61 ρ*= 0,165 τ max = 0,110 regularność 0,44
Korelacja gradacyjna (grade correlation) Metody gradacyjne wiążą się z przekształcaniem jednej zmiennej przez odpowiednio wybraną dystrybuantę innej zmiennej Wskaźnik ρ* Spearmana zwanym korelacją gradacyjną mierzy siłę zależności monotonicznej pary zmiennych losowych (X, Y) w przypadku ciągłych zmiennych X i Y równy jest współczynnikowi korelacji corr ( F X (X), F Y (Y ) ) dla zmiennych X i Y przekształconych przez swoje dystrybuanty innym (pokrewnym) gradacyjnym wskaźnikiem monotonicznej zależności jest τ Kendalla 16
derealizacja hipochondria natręctwa somatyczne lęk zab.snu zab.sex histeria neurastenia niepokój społeczne psychastenia depresja neurotyzm B I-E Rotter 80 rekordów pacjentów, 15 zmiennych ρ* max = 0,165 τ = 0,110 regularność 0,44 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 17
derealization hypochondria somatic symptoms compulsions fear sexual disord sleep disord neurasthenia anxiety hysteria social difficulties psychasthenia derealizacja natręctwa somatyczne depression zab.sex lęk Bizoń scale zab.snu niepokój histeria neurastenia społeczne depresja psychastenia I-E Rotter neurotyzm B I-E Rotter Mapa FIT 55 15 z podziałem na skupienia ρ*= 0,18 τ max = 0,12 regularność= 0,54 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 18
derealization depression psychasthenia social difficulties compulsions sexual disorders anxiety hysteria neurasthenia sleep disorders Bizoń scale hypochondria fear I-E Rotter somatic symptoms Mapa OUT 25 15 z podziałem na skupienia ρ*=0,21 τ max = 0,14 regularność = 0,45 Anna Wolińska-Welcz 19
derealization Skupienia pacjentów w zbiorze FIT hypochondria somatic symptoms compulsions fear sexual disord sleep disord neurasthenia FIT55-tau10kolor_Aggreg - 2008-11-10 anxiety hysteria social difficlties psychasthenia depression Bizoń scale I-E Rotter sum of "O" % improvement % married % women age education %F41 %F43.2 %F48.0 %F48.9 %F60.8 numbers of patients cluster1 cluster2 cluster3 cluster4 FIT 19 28 171 23 62 12 21 39 39 30 20 28 31 77 10 520 27 47 47 35 3.5 20 47 20 0 33 15 13 23 122 19 38 16 22 43 34 27 19 27 28 76 12.2431 10 55 64 34 3.9 36 0 18 27 45 11 12 13 106 20 36 9 18 35 35 23 19 27 32 74 12.3385 11 64 50 30 3.6 14 21 7 50 36 14 3 10 67 8 29 6 12 25 24 21 15 23 23 70 14.5267 16 67 80 33 3.5 27 7 2 40 13 15 12 18 116 17 42 10 18 35 33 25 18 26 28 74 12.2399 16 58 60 33 3.6 24 20 16 29 31 55 Skupienie1: pacjenci z najwyższą średnią sumą objawów nerwicowych, najwyższą derealizacją, hipochondrią, natręctwami, objawami somatycznymi, lękiem, raczej wewnątrzsterowni, najstarsi, dobrze rokujący w psychoterapii; Skupienie2: pacjenci z najwyższą średnią wartością zaburzeń seksualnych i neurastenii, ze zdiagnozowanymi zaburzeniami osobowości i zaburzeniami lękowo-depresyjnymi, najlepiej wykształceni; Skupienie3: pacjenci ze zdiagnozowanymi zaburzeniami nerwicowymi i osobowości, z najwyższymi średnimi objawami depresyjnymi; Skupienie4: zewnątrzsterowne kobiety, raczej zamężne, o niskim średnim poziomie objawów nerwicowych, ze zdiagnozowanymi najczęściej zaburzeniami nerwicowymi (a także lękowymi i depresyjnymi?) 20
derealization Skupienia pacjentów w zbiorze OUT średnie dla wszystkich zmiennych pierwszo- i drugoplanowych w zagregowanych 3 skupieniach pacjentów odstających od trendu depression psychasthenia social compulsions sexual disorders anxiety hysteria neurasthenia sleep disorders Bizoń scale hypochondria fear I-E Rotter somatic symptoms sum of "O" %improvement % women % married age education %F41 %F43.2 %F48.0 %F48.9 %F60.8 number of patients cluster1 cluster2 cluster3 OUT 11 32 26 18 15 6 26 19 30 12 58 13 24 5 47 278 5 14 14 26 3 43 14 0 29 29 7 22 33 22 19 19 14 34 26 38 15 69 9 39 11 80 369 39 67 22 31 4.2 33 22 0 44 11 9 5 17 17 14 10 7 20 21 27 14 66 17 46 12 119 331 19 89 44 35 3.3 33 11 11 33 44 9 13 27 21 17 15 9 26 22 32 13.5 65 13 37 9.7 85 330 22 60 28 31 3.6 36 16 4 36 28 25 Skupienie1: młodzi, nieżonaci mężczyźni, silnie wewnątrzsterowni, z zaburzenia depresyjnymi i psychastenią, najgorzej rokujący w psychoterapii; Skupienie2: pacjenci stanu wolnego, neurotyczni, ze zdiagnozowanymi zaburzeniami nerwicowymi, ze średnio najwyższą derealizacją, depresją i zaburzeniami seksualnymi, wykształceni, z najwyższą średnią poprawą; Skupienie3: kobiety z zaburzeniami osobowości, wysokim lękiem oraz objawami somatycznymi. Anna Wolińska-Welcz 21
Gradacyjna analiza skupień i poszukiwanie głównego trendu w danych uzyskanych z diagnostycznych kwestionariuszy i skal stosowanych w praktyce klinicznej pozwala wyłonić ważne zmienne ukryte, wywierające silny wpływ na pozostałe. W przypadku pacjentów leczonych na oddziale nerwic psychoterapią kompleksową okazały się to: derealizacja, depresja, objawy somatyczne wartości skali I-E Rottera. W zbiorze FIT (zgodnym z zauważonym trendem), wartości skali Rottera są dodatnio zależne z depresją, a ujemnie z derealizacją i zaburzeniami somatycznymi. W zbiorze OUT wartości skali Rottera i nasilenia objawów somatycznych łączy zależność dodatnia, zaś Rottera z objawami derealizacyjnymi i depresyjnymi ujemna. Anna Wolińska-Welcz 22
Wyniki przeprowadzonej eksploracji gradacyjnej zebranych danych wskazują na tendencję do: zewnątrzsterowności u kobiet mężatek z zaburzeniami nerwicowymi wewnątrzsterowności u osób samotnych z objawami depresyjnymi. Na przedstawionych mapach położenie zaburzeń lękowych i zaburzeń depresyjnych jest wzajemnie odległe, a kierunek zmian przeciwstawny, co wskazuje na ich niepodobieństwo pomimo ich łączenia w kategoriach ICD-10: F.41.2 zaburzenie depresyjne i lękowe - mieszane Anna Wolińska-Welcz 23
Wnioski płynące z analizy jednorodnych i regularnie uporządkowanych skupień pacjentów mogą być użyteczne: w porównywaniu obrazu klinicznego pacjentów, uściślaniu rozpoznania kwalifikacji na określony rodzaj terapii, prognozowaniu jej skuteczności. Analiza ta rzuca też nowe światło na powiązanie zaburzeń nerwicowych z zewnątrzsterownością i wewnątrzsterownością Anna Wolińska-Welcz 24
zmienne drugoplanowe zmienne pierwszoplanowe Korelacje rangowe skali Rottera i objawów nerwicowych objawy nerwicowe korelacje rangowe ze skalą Rottera Total 80 Fit 55 Out 25 objawy somatyczne 0,19-0,15 0,59 lek i fobia 0,24 0,03 0,58 zaburzenia seksualne 0,28 0,15 0,51 histeria 0,28 0,04 0,46 neurastenia 0,13 0,00 0,35 niepokój 0,23 0,09 0,33 neurotyzm Bizonia 0,26 0,19 0,32 natręctwa 0,12-0,05 0,31 depresja 0,18 0,11 0,28 zaburzenia snu 0,08-0,14 0,25 % kobiet 0,30 0,19 0,58 wykształcenie 0,05 0,01 0,26 względna poprawa objawowa 0,03-0,04 0,31 sum of O subscales 0,27-0,02 0.61 Anna Wolińska-Welcz 25
somatic symptoms hypochondria fear sleep disorders sexual disorders derealization compulsions hysteria anxiety neurasthenia Bizoń scale social psychasthenia depression I-E Rotter Mapa zaburzeń nerwicowych i LOC w uporządkowaniu po GCA dla 32 mężczyzn przed terapią (tylko 4 zewnątrzsterownych) ρ*= 0,18 τ max = 0,12 regularność = 0,50 68 57 67 73 80 3 5 56 70 63 79 2 66 12 75 71 78 58 64 54 74 59 62 9 69 55 72 60 76 61 77 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 65 0.6 Anna Wolińska-Welcz 26
derealization compulsions sexual disorders depression hysteria neurasthenia social psychasthenia anxiety sleep disorders somatic symptoms fear Bizoń scale hypochondria I-E Rotter Mapa zaburzeń nerwicowych i LOC w uporządkowaniu po GCA dla 48 kobiet przed terapią ρ*= 0,15 τ max = 0,10 regularność = 0,41 17 7 40 52 22 38 46 50 29 51 14 30 13 41 6 18 47 48 10 39 37 35 32 24 31 36 26 42 28 43 23 16 45 15 19 33 25 20 44 53 8 4 21 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 49 34 27 11 1 0.6 Anna Wolińska-Welcz 27
Rozkład binormalny - regularny 28
Typowy schemat gradacyjnej analizy danych (realizowany w programie GradeStat) 1. Macierz danych 2. GCA 3. Regularność 4.GCCA wartości nieujemne brakujące dane usunięte lub uzupełnione wybór zmiennych pierwszoplanowych przekształcenie na rozkład gradacyjny Gradacyjna Analiza Odpowiedniości - uporządkowanie maksymalizujące kontrast między skrajnymi rekordami pacjentów oraz skrajnymi zmiennymi pierwszoplanowym ocena regularności danych (pod kątem zależności monotonicznej) rekordy zgodne z trendem: podpopulacja FIT rekordy odstające: podpopulacja OUT Gradacyjna Analiza Skupień- elementy FIT po GCA rozdzielane do zadanej liczby skupień elementy OUT ponownie porządkowane przez GCA i analizowane 29
Metody gradacyjne wykorzystywane są do: zlokalizowania i bezpośredniego poprawienia błędnych danych oraz uzupełnienia brakujących danych; dekompozycji zbioru danych na bardziej jednorodne podzbiory wyznaczenia głównych trendów i cech ukrytych struktury danych ; wyszukania elementów odstających (outlierów); dokonania uporządkowanej analizy skupień.
http://gradestat.ipipan.waw.pl
Kowalczyk, T., Pleszczyńska, E., Ruland, F. (red.). (2004). Grade Models and Methods for Data Analysis. With Applications for the Analysis of Data Populations. Seria: Studies in Fuzziness and Soft Computing, Vol. 151. Springer Verlag: Berlin Heidelberg New York. Książyk J., Matyja O., Pleszczyńska E., Wiech M. (2005). Analiza danych medycznych i demograficznych przy użyciu programu GradeStat. Instytut Podstaw Informatyki PAN, Instytut Pomnik Centrum Zdrowia Dziecka, Warszawa.
W przygotowaniu monografia: Recent Developments Concerning Models And Methods of Grade Data Analysis Elżbieta Pleszczyńska, Teresa Kowalczyk, Wiesław Szczesny, Marek Wiech, Aldona Sokołowska-Dunicz, Anna Wolińska-Welcz Zapraszamy na stronę programu: http://gradestat.ipipan.waw.pl o o GradeStat do pobrania Samouczek programu 33
Anna Wolińska-Welcz, Henryk Welcz: Grade Approach to the Analysis of Questionnaires and Clinical Scales Data, "Biocybernetics and Biomedical Engineering", Vol.29, No.2, 2009 Anna Wolińska-Welcz, Henryk Welcz: Grade approach to the analysis of questionnaires and clinical scales data, VII International Seminar on Statistics and Clinical Practice International Centre of Biocybernetics Warsaw 2008. Anna Wolińska-Welcz: Zastosowanie gradacyjnej analizy skupień do danych uzyskanych z kwestionariuszy i skal klinicznych, Prace IPI PAN 1007, 2008 H.Welcz, Wewnątrzsterowność i zewnątrzsterowność a objawy nerwicowe, nieopublikowana rozprawa doktorska, Lublin 2002 34
Dziękuję za uwagę 35