BADANIA NAUKOWE ACADEMIC RESEARCH Vol. 26, No. 3, 2010 ISSN

Podobne dokumenty
Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Metodyka oceny jakości rozwiązań projektowych w procesie produkcyjnym.

WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Analiza autokorelacji

Komputerowe systemy wspomagania decyzji Computerized systems for the decision making aiding. Poziom przedmiotu: II stopnia

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Weryfikacja hipotez statystycznych testy t Studenta

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

WNIOSKOWANIE STATYSTYCZNE

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Wydział Matematyki. Testy zgodności. Wykład 03

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

W1. Wprowadzenie. Statystyka opisowa

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Rozkłady statystyk z próby

KARTA PRZEDMIOTU / SYLABUS

STATYSTYKA MATEMATYCZNA

KARTA PRZEDMIOTU / SYLABUS

Analiza regresji - weryfikacja założeń

Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni

Wprowadzenie do analizy korelacji i regresji

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

Statystyka i Analiza Danych

Spis treści 3 SPIS TREŚCI

1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE

STATYSTYKA MATEMATYCZNA

Wykład ze statystyki. Maciej Wolny

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

KARTA PRZEDMIOTU / SYLABUS

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

MATEMATYCZNY MODEL PĘTLI HISTEREZY MAGNETYCZNEJ

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

KARTA PRZEDMIOTU / SYLABUS. Zakład Statystyki i Informatyki Medycznej. tel./fax (85) dr Robert Milewski

Wykład 9 Wnioskowanie o średnich

Weryfikacja hipotez statystycznych

KARTA PRZEDMIOTU / SYLABUS Wydział Nauk o Zdrowiu Zdrowie Publiczne ogólnoakademicki praktyczny inny jaki. Zakład Statystyki i Informatyki Medycznej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

POLITECHNIKA OPOLSKA

KARTA PRZEDMIOTU / SYLABUS

Statystyka matematyczna

PDF created with FinePrint pdffactory Pro trial version

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Dr Stanisław Szela. Dr Stanisław Szela

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Uczelnia Łazarskiego Wydział Medyczny Kierunek Lekarski

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

W4 Eksperyment niezawodnościowy

Metoda analizy hierarchii Saaty ego Ważnym problemem podejmowania decyzji optymalizowanej jest często występująca hierarchiczność zagadnień.

WIELOATRYBUTOWE PODEJMOWANIE DECYZJI: ANALYTIC HIERARCHY PROCESS

STATYSTYKA MATEMATYCZNA

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Kolokwium ze statystyki matematycznej

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Prawdopodobieństwo i rozkład normalny cd.

Pochodna i różniczka funkcji oraz jej zastosowanie do obliczania niepewności pomiarowych

4. EKSPLOATACJA UKŁADU NAPĘD ZWROTNICOWY ROZJAZD. DEFINICJA SIŁ W UKŁADZIE Siła nastawcza Siła trzymania

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Kilka uwag o testowaniu istotności współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Testy nieparametryczne

ZASTOSOWANIE METODY ANALIZY STATYSTYCZNEJ RYNKU W SZACOWANIU WARTOŚCI TECHNICZNYCH ŚRODKÓW PRODUKCJI NA PRZYKŁADZIE CIĄGNIKA ROLNICZEGO

Testowanie hipotez statystycznych. Wprowadzenie

Transkrypt:

www.wsu.kielce.pl BADANIA NAUKOWE ACADEMIC RESEARCH Vol. 26, No. 3, 2010 ISSN 1641 6560 Wyższa Szkoła Umiejętności im. Stanisława Staszica w Kielcach Stanislaw Staszic University of Arts and Sciences Prawa autorskie zastrzeżone All rights reserved Drukowano w Polsce Printed In Poland METODA OBRÓBKI I ANALIZY DANYCH EPIDEMIOLOGICZNYCH THE METHOD FOR DATA PROCESSING AND ANALYSIS OF EPIDEMIOLOGIC EVIDENCE Ludmiła DYMOWA Politechnika Częstochowska Krzysztof SKUZA Wyższa Szkoła Umiejętności w Kielcach STRESZCZENIE W artykule została zaproponowana metoda obróbki i analizy danych badań epidemiologicznych na podstawie syntezy wybranych metod statystycznych, metod Teorii Zbiorów Rozmytych oraz Metody Analizy Hierarchii T. Saaty ego. Metoda zilustrowana została na przykładzie badań ultrasonograficznych tarczycy. Uzyskane wyniki badań mogą posłużyć do obliczenia średniej oceny stanu tarczycy w całej populacji, umożliwiają porównywanie różnych populacji między sobą, a także analizę wpływu czynników i warunków zewnętrznych na powstawanie i szerzenie się chorób tarczycy w populacji.

124 Ludmiła Dymowa, Krzysztof Skuza ABSTRACT The method for data processing and analysis of epidemiologic evidence based on the synthesis of some statistical methods, the tools of fuzzy set theory and Saaty s Analytic Hierarchy Process is proposed. The method is illustrated using the results of ultrasonography studies of thyroid gland. The obtained results can be used for estimation of averaged condition of thyroid gland of the whole population, for the comparison of different populations, for estimation of influence of external factors on the appearance and dynamics of spread of thyroid gland diseases in the population. 1. WPROWADZENIE Nowoczesne badania epidemiologiczne zaczynają się od gromadzenia jak największej liczby wyników badań w bazach danych. Dane te muszą dać możliwość badania wpływu czynników i warunków zewnętrznych na powstawanie i szerzenie się chorób oraz zaburzeń zdrowia w populacji. Badania epidemiologiczne opisowe mają na celu również śledzenie dynamiki rozprzestrzeniania się zmian i stanów chorobowych w określonej populacji. Bazy danych, zawierające wyniki badań epidemiologicznych, mogą zawierać setki tysięcy rekordów i setki atrybutów. W ostatnich latach w celu przeprowadzenia jak najdokładniejszej obróbki i analizy olbrzymiej liczby danych stosowane są coraz to nowsze formuły matematyczne 1. Zaproponowana przez nas metoda analizy danych uzyskiwanych w badaniach epidemiologicznych stanowi syntezę wybranych metod statystycznych 2, metod Teorii Zbiorów Rozmytych 3 oraz Metody Analizy 1 Wątroba J., 2004, Planowanie i analiza eksperymentów a techniki Data Mining w badaniach empirycznych. Przykłady analiz w STATISTICA, Statystyka i Data Mining w badaniach naukowych, Statsoft, Warszawa Kraków, s. 59 72. 2 Stanisz A., 2006 2007, Przystępny kurs statystyki z zastosowaniem STATISTICA PL na przykładach z medycyny, Tom 1 3, Statsoft, Kraków.

Metoda obróbki i analizy danych epidemiologicznych 125 Hierarchii Tomasa Saaty ego 4. Metodę tę wykorzystano w analizie rezultatów epidemiologicznych badań ultrasonograficznych tarczycy. W ostatnich latach, szczególnie po awarii elektrowni atomowej w Czarnobylu, w wielu krajach europejskich przeprowadzane były na szeroką skalę badania ultrasonograficzne tarczycy, szczególnie w populacji dzieci i młodzieży. Jednym z takich projektów było badanie ultrasonograficzne populacji dzieci w wieku 3 17 lat, przeprowadzone przez Instytut Badań Naukowych Medycyny Jądrowej na Białorusi, w wyniku którego opisano następujące parametry 5 : płeć, wiek, waga, wzrost; objętości prawego i lewego płata tarczycy oraz objętość tarczycy w całości; stan miąższu tarczycy w normie, tzn. normoechogeniczny, bądź też nieprawidłowy, tzn. hypoechogeniczny lub hyperechogeniczny. Jeżeli jest nieprawidłowy czy dotyczy to całej tarczycy czy tylko części to mówimy wtedy, że miąższ jest niejednorodny; waskularyzacja; limfadenopatia; istnienie w tarczycy obszarów zmian (ognisk) wyraźnie wyróżniających się od otaczającego miąższu tarczycy, tzn. guzków; istnienie cyst, torbieli tarczycy; istnienie zwapnień. Główne trudności w obróbce danych uzyskanych w wyniku badań ultrasonograficznych populacji dzieci i młodzieży, w celu określenia ogólnego stanu tarczycy, wynikają z następujących faktów: 1/ Norma objętości tarczycy u dzieci w znaczny sposób zależna jest od wieku, wagi, wzrostu i płci dziecka; 3 Zadeh L., 1965, Fuzzy sets Information and Control, Vol. 8, No 3, s. 338 353. 4 Saaty T., 1997, Scaling Method for Priorities in Hierarchical Structures, J. of Mathematical Psychology, Vol. 15, No 3, p. 234 281. 5 Sewastjanow P., Dymowa L., Karpelew G., Ostapenko B., Czegerowa T., 1996, Metoda określenia objętości tarczycy u dzieci i młodzieży Ochrona zdrowia, Białoruś, No 6, s. 43 44.

126 Ludmiła Dymowa, Krzysztof Skuza 2/ Istnienie zarówno parametrów ilościowych (na przykład objętość płata tarczycy mierzona jest w sm 3 ), jak i jakościowych (na przykład echogeniczność, która może być kwalifikowana przez lekarza jako poważnie zmniejszona, umiarkowanie zmniejszona, normalna lub zwiększona); 3/ Nierównoważność mierzonych parametrów stanu tarczycy na przykład istnienie guza jest z medycznego punktu widzenia bardziej poważne niż zwiększona objętość tarczycy. Zastosowanie specjalnych narzędzi matematycznych 6 umożliwi uwzględnienie powyższych problemów i przeprowadzenie analizy w oparciu o wszystkie badane parametry. 2. OBLICZENIE NORM OBJĘTOŚCI TARCZYCY Do obliczenia norm objętości tarczycy dla wyników uzyskanych w badaniach Instytut Badań Naukowych Medycyny Jądrowej na Białorusi 7 zostały wykorzystane metody analizy regresyjnej wielorakiej liniowej oraz nieliniowej. W pierwszej fazie przeprowadzono obróbkę danych objętości tarczycy (V, sm 3 ) dla grupy absolutnie zdrowych dzieci (przebadano ponad 1600 osób) za pomocą pakietu STATISTICA. Hipoteza statystyczna o normalnym rozkładzie zmiennej losowej V weryfikowana była za pomocą testu zgodności Kolmogorowa-Smirnowa. Na poziomie istotności alfa = 0,05 nie ma podstaw dla odrzucenia hipotezy H 0 o normalnym rozkładzie zmiennej losowej V. Oznacza to, że można wyliczyć 6 Dymowa L., 2003, Metoda optymalizacji dystrybucji funduszy ekologicznych według kryterium stanu zdrowia ludności, Ochrona Powietrza i Problemy Odpadów, Vol. 37, No 4, lipiec sierpień 2003, s. 124 127; Dymowa L., Figat P., Zenkowa A., 2001, Metoda i oprogramowanie do oceny wielokryterialnej i wielopoziomowej decyzji w warunkach niepewności rozmytej, III Krajowa Konferencja Metody i systemy komputerowe w badaniach naukowych i projektowaniu inżynierskim, Kraków, 19 21 listopada, s. 575 576. 7 Sewastjanow P., Dymowa L., Karpelew G., Czegerowa T., 1995, Metoda określenia normalnej objętości tarczycy u dzieci i młodzieży z wykorzystaniem teorii zbiorów rozmytych, IV Międzynarodowa Konferencja Katastrofa w Czarnobylu, Białoruś Mińsk, s. 151 152.

Metoda obróbki i analizy danych epidemiologicznych 127 przedziały, w których z odpowiednim prawdopodobieństwem znajdują się objętości tarczycy u zdrowych osób. Za pomocą pakietu STATISTICA i wykorzystania modułów Regresja wieloraka oraz Regresja nieliniowa otrzymano następujące nieliniowe zależności średniej objętości tarczycy w normie (V norma, sm 3 ) od płci, wieku (WIEK, lat) oraz wagi (WAGA, kg) dziecka: dla chłopców: V norma = 1,915 0,135 * WIEK + 0,013 * WIEK * WAGA + 0,042 * * WAGA 0,0015 * WAGA 2 (1) dla dziewczynek: V norma = 1,343 + 0,008 * WIEK + 0,011 * WIEK * WAGA + 0,040 * * WAGA 0,0015 * WAGA 2 (2) Aby podjąć decyzję, czy objętość tarczycy badanej osoby jest w normie, oprócz średniej objętości tarczycy w normie (V norma, sm 3 ) dla określonego wieku i określonej wagi, niezbędne jest obliczenie odchyleń standardowych w badanej populacji dzieci zdrowych, również w zależności od wieku i wagi. W wyniku dalszych badań statystycznych okazało się, że odchylenia standardowe objętości tarczycy w normie (σ Vnorma ) związane są z objętością tarczycy w normie V norma zależnością liniową: dla chłopców: σ Vnorma = 0,062 + 0,196 * V norma (3) dla dziewczynek: σ Vnorma = 0,090 + 0,191* V norma (4)

128 Ludmiła Dymowa, Krzysztof Skuza 3. PROBLEM RÓŻNEJ WIELKOŚCI PARAMETRÓW ORAZ ICH JAKOŚCIOWEGO LUB ILOŚCIOWEGO CHARAKTERU Dla rozwiązania problemu drugiego, a mianowicie problemu różnej wielkości parametrów oraz ich jakościowego lub ilościowego charakteru wprowadzony został aparat funkcji przynależności. Funkcji przynależności używamy w celu formalizacji określonych parametrów. Funkcje te przybierają wartości od 0 w zakresie niedopuszczalnych wartości (z punktu widzenia parametru) do maksymalnej wartości, która jest równa 1 w zakresie najlepszych wartości parametru. Na Rys. 1 zilustrowano opis dopuszczalnych przedziałów dla parametru objętości tarczycy V za pomocą funkcji przynależności objętości tarczycy μ(v). Ponieważ zostało udowodnione, że rozkład zmiennej losowej V jest normalny, to w przedziale [V norma 1,5σ, V norma + 1,5σ] znajduje się 86,8% wartości V u dzieci zdrowych, a w przedziale [V norma 2σ, V norma + 2σ] znajduje się 95,4% wartości V u dzieci zdrowych. W wyniku dyskusji z ekspertami lekarzami, za pomocą znanej metody delfickiej 8, uzyskano następującą interpretację wyników: jeśli zmierzona wartość V znajduje się w przedziale [V norma 1,5σ, V norma + 1,5σ], to oznacza, że objętość tarczycy badanej osoby znajduje się w przedziale gwarantowanej normy; jeśli zmierzona wartość V znajduje się w obszarze V > (V norma + 2σ) lub V < (V norma 2σ), to stwierdzamy, że objętość tarczycy badanej osoby znajduje się w obszarze gwarantowanej patologii; jeśli zmierzona wartość V znajduje się w przedziale [V norma 2σ, V norma 1,5σ] lub w przedziale [V norma + 1,5σ, V norma + 2σ], to stwierdzamy, 8 Cieślak M., 2001, Prognozowanie gospodarcze: metody i zastosowanie, Wyd. Naukowe PWN, Warszawa.

Metoda obróbki i analizy danych epidemiologicznych 129 że objętość tarczycy badanej osoby znajduje się w obszarze przejścia od gwarantowanej normy do gwarantowanej patologii. A zatem wartość μ(v) ukazuje w sposób istotny stopień przynależności badanej osoby do osób zdrowych z punktu widzenia objętości tarczycy. Rys. 1. Funkcja przynależności objętości tarczycy. μ(v) 1 1,5σ 1,5σ 0,5 2σ 2σ 0 V norma V Źródło: Opracowanie własne. Na Rys. 2 została przedstawiona funkcja przynależności μ(echo) echogeniczności tarczycy. Jest to parametr jakościowy i może on przyjmować następujące wartości: poważna hipoechogeniczność (ECHO1), umiarkowana hipoechogeniczność (ECHO2), normalna echogeniczność (ECHO3) lub hyperechogeniczność (ECHO4). Jak widać na Rys. 2, w sytuacji, gdy na przykład stwierdzona zostaje umiarkowana hipoechogeniczność (ECHO2), wartość funkcji przynależności μ(echo) echogeniczności tarczycy wynosi 0,6.

130 Ludmiła Dymowa, Krzysztof Skuza Rys. 2. Funkcja przynależności echogeniczności tarczycy. μ(echo) 1 0,5 0 ECHO1 ECHO2 ECHO3 ECHO4 ECHO Źródło: Opracowanie własne. Na Rys. 3 przedstawiona jest funkcja przynależności μ(wask) waskularyzacji tarczycy. Jest to parametr jakościowy, który może przyjmować następujące wartości: mała, średnia lub silna. Rys. 3. Funkcja przynależności waskularyzacji tarczycy. μ(wask) 1 0,5 0 Mała Średnia Silna WASK Źródło: Opracowanie własne.

Metoda obróbki i analizy danych epidemiologicznych 131 Na Rysunku 4 została przedstawiona funkcja przynależności μ(lim) limfadenopatii tarczycy. Jest to parametr jakościowy, może on przyjmować następujące wartości: nie ma, sporadycznie lub mnóstwo. Rys. 4. Funkcja przynależności limfadenopatii tarczycy. μ(lim) 1 0,5 0 Nie ma Sporadycznie Mnóstwo LIM Źródło: Opracowanie własne. W ten oto czytelny sposób można określić funkcje przynależności dla parametrów określających istnienie w tarczycy guzków μ(guz), cyst μ(cys), torbieli μ(torb), zwapnień μ(wapn). Przy wystąpieniu tych nieprawidłowości odpowiednie funkcje przynależności przyjmują wartość 0 (na przykład μ(guz) = 0), w przeciwnym wypadku wartość 1 (na przykład μ(torb) = 1). W ten sposób można określić wartości funkcji przynależności dla wszystkich parametrów ultrasonograficznych dla wszystkich badanych osób. Wartości te będą zawsze znajdować się w przedziale [0, 1]. Dzięki temu możliwe staje się połączenie wszystkich charakterystyk parametrów w kryterium określające globalny stan tarczycy.

132 Ludmiła Dymowa, Krzysztof Skuza 4. PROBLEM NIERÓWNOWAŻNOŚCI MIERZONYCH PARAMETRÓW Dla rozwiązania problemu nierównoważności mierzonych parametrów tarczycy można zastosować metodę obliczenia współczynników względnej ważności (α) na bazie macierzy parzystych porównań 9. Stosując tę metodę do badanych parametrów stanu tarczycy, na podstawie wypełnionej przez eksperta lekarza macierzy parzystych porównań i wykorzystania metody obliczenia T. Saaty ego 10, otrzymaliśmy następujące wartości współczynników względnej ważności: α(v) = 0,2; α(echo) = 0,4; α(wask) = 0,2; α(lim) = 0,2; α(guz) = 2,3; α(cys) = 1,6; α(torb) = 1,8; α(wapn) = 1,3. 5. BUDOWA KRYTERIUM GLOBALNEGO. AGREGOWANIE NIERÓWNOWAŻNYCH KRYTERIÓW LOKALNYCH Po obliczeniu funkcji przynależności i współczynników względnej ważności wszystkich parametrów można przystąpić do budowy kryterium globalnego stanu tarczycy. W tym celu zastosowanie znajdą poniższe metody agregowania parametrów z uwzględnieniem współczynników względnej ważności α i, nazywanych w literaturze naukowej kryteriami globalnymi maksymalnego pesymizmu (5), addytywnym (6) i multiplikatywnym (7): 11 1 2 n D min{ ( x ), ( x ),..., ( ) } (5) 1 1 2 x N 9 Saaty T., Thomas L., 1992, Multicriteria Decision Making. The Analytic Hierarchy Process, RWS Publications, Pittsburgh. 10 Saaty T., 1997, Scaling Method for Priorities in Hierarchical Structures, J. of Mathematical Psychology, Vol. 15, No 3, p. 234 281. 11 Dymowa L., Sewastjanow P., 2003, Metodologia rozwiązywania problemów modelowania, identyfikacji i wielokryterialnej optymalizacji w zarządzaniu jakością procesów metalurgicznych, Informatyka w Technologii Materiałów, Wydawnictwo Naukowe AKAPIT, Vol. 1, No 3, s. 21 32.

Metoda obróbki i analizy danych epidemiologicznych 133 D 2 n i 1 ( x ) i n i (6) D n i 3 ( x i ) i 1 (7) gdzie X = (x 1,...,x n ) wektor parametrów, n liczba parametrów. Zgodnie ze sposobem budowania kryteriów (5) (7), zawsze spełniony jest warunek: D, D, D 1. To znacznie ułatwia procedurę oceny otrzymanej 0 1 2 3 wartości kryterium globalnego. Kryteria (5) (7) są podstawą dla prawie wszystkich pozostałych sposobów tworzenia kryteriów globalnych 12. 6. PRZYKŁAD OBLICZENIA GLOBALNEGO KRYTERIUM STANU TARCZYCY Założymy, że po badaniu pewnej osoby wprowadzone zostały do bazy danych następujące dane i wyniki: płeć: M; wiek: 11 lat; waga: 35 kg; wzrost: 140 cm; objętość tarczycy w całości: V = 6,9 sm 3 ; miąższ tarczycy: umiarkowana hipoechogeniczność; waskularyzacja: średnia; limfadenopatia: mnóstwo; 12 Choi D.-Y., Oh K.-W., ASA and its application to multi-criteria decision making, Fuzzy Sets and Systems, 2000, Vol. 114., p. 89 102; Shih H.-S., Lee E.S., Compensatory fuzzy multiple level decision making. Fuzzy Sets and Systems, 2000, Vol. 114., p. 71 87; Sevastianow P., Dimova L., Zhestkova E., Methodology of the multicriteria quality estimation and software for its realizing. Proceedings of the Fourth International Conference on New Information Technologies NITs, Mińsk, 2000, Vol. 3., p. 50 54.

134 Ludmiła Dymowa, Krzysztof Skuza istnienie w tarczycy obszarów, zmian (ognisk) wyraźnie wyróżniających się od otaczającego miąższu tarczycy, tzn. guzków: nie ma; istnienie cyst, torbieli tarczycy: nie ma; istnienie zwapnień: nie ma. Dla obliczenia kryterium globalnego stanu tarczycy konieczne jest wykonanie następujących kroków. W pierwszym kroku, wykorzystując równanie (1), obliczamy wartość średniej objętości tarczycy w normie (V norma, sm 3 ) dla badanego dziecka: V norma = 1,915 0,135 * 11 + 0,013 * 11 * 35 + 0,042 * 35 0,0015 * 35 2 = 5,067 sm 3 Obliczamy odchylenie standardowe objętości tarczycy w normie (σ Vnorma ), związane z objętością tarczycy w normie V norma na podstawie zależności (3): σ Vnorma = 0,062 + 0,196 * 5,067 = 1,055 sm 3 Ponieważ zmierzona wartość objętości tarczycy w całości V = 6,9 sm 3 znajduje się w przedziale: [V norma + 1,5 σ Vnorma, V norma + 2 σ Vnorma ] = [5,067 + 1,5 * 1,055, 5,067 + 2 * 1,055] = [6,650, 7,177] to stwierdzamy, że objętość tarczycy badanej osoby znajduje się w obszarze przejścia od gwarantowanej normy do gwarantowanej patologii. Z wykresu na Rys. 1 można odczytać, że wartość funkcji przynależności badanej osoby do osób zdrowych z punktu widzenia objętości tarczycy wynosi μ(v) = 0,5. Ponieważ stwierdzono umiarkowaną hipoechogeniczność, ECHO = ECHO2, z wykresu na Rys. 2 można odczytać, że wartość funkcji przynależności μ(echo) = 0,6.

Metoda obróbki i analizy danych epidemiologicznych 135 W ten sam sposób odczytujemy odpowiednio z Rys. 3 i Rys. 4 wartości funkcji przynależności μ(wask) = 0,5 i μ(lim) = 0. Ponieważ nie stwierdzono istnienia guzów, cyst, torbieli i zwapnień, odpowiednie funkcje przynależności przyjmują wartości 1: μ(guz) = 1; μ(cys) = 1; μ(torb) = 1; μ(wapn) = 1. Podstawiając obliczone wartości w równania (5) (7), otrzymujemy: D 1 = 0, D 2 = 0,93, D 3 = 0. Wartości kryteriów globalnych D 1 i D 3 okazały się równe zero. Oznacza to, że co najmniej jeden z parametrów wyniku badania ultrasonograficznego okazał się należeć do obszaru patologii. Natomiast wartość kryterium globalnego D 2 reprezentuje ocenę średniej arytmetycznej wszystkich funkcji przynależności z uwzględnieniem współczynników względnej ważności, a więc oznacza uśrednioną charakterystykę wszystkich badanych parametrów. 7. INTERPRETACJA WYNIKÓW BADAŃ W POPULACJI W dalszej części obróbki danych badania epidemiologicznego obliczamy kryteria globalne dla wszystkich osób należących do populacji generalnej. Otrzymane w ten sposób zbiory {D 1 }, {D 2 } i {D 3 } można wykorzystać dla obliczenia średniej oceny stanu tarczycy w całej populacji, a także dla przeprowadzenia badań porównawczych w innych nawet bardzo zróżnicowanych populacjach. Systematyczne prowadzenie tego typu badań i analiza trendów w zależności od zmiany warunków zewnętrznych umożliwi określenie wpływu poszczególnych czynników na powstawanie i szerzenie się chorób tarczycy w populacji. PODSUMOWANIE Przedstawiona została metoda obróbki i analizy danych badań epidemiologicznych na podstawie syntezy wybranych metod statystycznych, metod Teorii Zbiorów Rozmytych oraz Metody Analizy Hierarchii T. Saaty ego. Za

136 Ludmiła Dymowa, Krzysztof Skuza pomocą zaproponowanej metody została przeprowadzona obróbka danych badań ultrasonograficznych tarczycy u dzieci i młodzieży w niektórych regionach Białorusi po awarii w Czarnobylu. W wyniku przeprowadzonych analiz możliwe było otrzymanie zagregowanych ocen stanu tarczycy na podstawie zbiorów parametrów o charakterze jakościowym oraz ilościowym, mierzonych oraz ocenianych subiektywnie przez lekarzy w trakcie badania. Zaproponowaną metodę można wykorzystywać nie tylko w badaniach epidemiologicznych na temat stanu zdrowia tarczycy, ale praktycznie w każdym innym obszarze badań medycznych i diagnozujących stan zdrowia w danej populacji lub porównujących wybrane populacje. Wykorzystanie zaproponowanych metod w badaniach podłużnych, w których pomiary są powtarzane systematycznie, pozwoli śledzić dynamikę badanych zjawisk i zmiany stanu zdrowia populacji. Właściwa obróbka i analiza danych może być podstawą tworzenia prognoz odnośnie zmian w stanie zdrowia populacji, umożliwiających przygotowanie odpowiednich programów profilaktycznych, których skuteczność może być monitorowana również poprzez analizę danych epidemiologicznych w zaproponowany przez nas sposób. BIBLIOGRAFIA 1. Choi D.-Y., Oh K.-W., 2000, ASA and its application to multi-criteria decision making, Fuzzy Sets and Systems, Vol. 114., p. 89 102. 2. Cieślak M., 2001, Prognozowanie gospodarcze: metody i zastosowanie, Wydawnictwo Naukowe PWN, Warszawa. 3. Dymowa L., 2003, Metoda optymalizacji dystrybucji funduszy ekologicznych według kryterium stanu zdrowia ludności, Ochrona Powietrza i Problemy Odpadów, Vol. 37, No 4, lipiec sierpień, s. 124 127. 4. Dymowa L., Figat P., Zenkowa A., 2001, Metoda i oprogramowanie do oceny wielokryterialnej i wielopoziomowej decyzji w warunkach niepewności

Metoda obróbki i analizy danych epidemiologicznych 137 rozmytej, III Krajowa Konferencja Metody i systemy komputerowe w badaniach naukowych i projektowaniu inżynierskim, Kraków, 19 21 listopada, s. 575 576. 5. Dymowa L., Sewastjanow P., 2003, Metodologia rozwiązywania problemów modelowania, identyfikacji i wielokryterialnej optymalizacji w zarządzaniu jakością procesów metalurgicznych, Informatyka w Technologii Materiałów, Wydawnictwo Naukowe AKAPIT, Vol. 1, No 3, s. 21 32. 6. Saaty T., 1997, Scaling Method for Priorities in Hierarchical Structures, J. of Mathematical Psychology, Vol. 15, No 3, p. 234 281. 7. Saaty T., Thomas L., 1992, Multicriteria Decision Making. The Analytic Hierarchy Process, RWS Publications, Pittsburgh. 8. Shih H.-S., Lee E.S., 2000, Compensatory fuzzy multiple level decision making, Fuzzy Sets and Systems, Vol. 114, p. 71 87. 9. Sevastianow P., Dimova L., Zhestkova E., 2000, Methodology of the multicriteria quality estimation and software for its realizing, Proceedings of the Fourth International Conference on New Information Technologies NITs, Mińsk, Vol. 3, p. 50 54. 10. Sewastjanow P., Dymowa L., Karpelew G., Czegerowa T., 1995, Metoda określenia normalnej objętości tarczycy u dzieci i młodzieży z wykorzystaniem teorii zbiorów rozmytych, IV Międzynarodowa Konferencja Katastrofa w Czarnobylu, Białoruś Mińsk, s. 151 152. 11. Sewastjanow P., Dymowa L., Karpelew G., Ostapenko B., Czegerowa T., 1996, Metoda określenia objętości tarczycy u dzieci i młodzieży, Ochrona zdrowia, Białoruś, No 6, s. 43 44. 12. Stanisz A., 2006 2007, Przystępny kurs statystyki z zastosowaniem STATISTICA PL na przykładach z medycyny, Tom 1 3, Statsoft, Kraków. 13. Wątroba J., 2004, Planowanie i analiza eksperymentów a techniki Data Mining w badaniach empirycznych. Przykłady analiz w STATISTICA, Statystyka i Data Mining w badaniach naukowych, Statsoft, Warszawa Kraków, s. 59 72.

138 Ludmiła Dymowa, Krzysztof Skuza 14. Zadeh L., 1965, Fuzzy sets, Information and Control, Vol. 8, No 3, s. 338 353. 1. Introduction 2. Determination of thyroid gland s normal capacity 3. Problem of different values of parameters and their quantitative and qualitative nature 4. Problem of different importance of estimated parameters 5. Building the global criterion. Aggregation of local criteria of different importance 6. An example of estimation of the global criterion of thyroid gland s condition 7. Interpretation of the results of population studies Summary References