KIEDY I DLACZEGO STOSUJEMY ANALIZĘ KOWARIANCJI (ANCOVA)?

Podobne dokumenty
Statystyka i Analiza Danych

JAK PORADZIĆ SOBIE Z NIEPOŻĄDANĄ ZMIENNOŚCIĄ TYPU SYSTEMATYCZNEGO W BADANIACH MEDYCZNYCH?

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA

Wprowadzenie do analizy korelacji i regresji

Opracowywanie wyników doświadczeń

Statystyka i Analiza Danych

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

WSPOMAGANIE STATYSTYCZNEJ ANALIZY WYNIKÓW BADAŃ EMPIRYCZNYCH W STATISTICA 9

METODY STATYSTYCZNE W BIOLOGII

Analizy wariancji ANOVA (analysis of variance)

Analiza wariancji - ANOVA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

Analiza regresji - weryfikacja założeń

Analiza wariancji - ANOVA

Szkice rozwiązań z R:

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Jednoczynnikowa analiza wariancji

Elementy statystyki STA - Wykład 5

Analiza wariancji. dr Janusz Górczyński

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

PDF created with FinePrint pdffactory Pro trial version

Zadania ze statystyki cz.8. Zadanie 1.

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozdział 8. Regresja. Definiowanie modelu

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Eksperyment jako metoda badawcza

Przykład 1. (A. Łomnicki)

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Żródło:

METODY STATYSTYCZNE W BIOLOGII

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

MODELE LINIOWE. Dr Wioleta Drobik

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testy nieparametryczne

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Stosowana Analiza Regresji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka matematyczna dla leśników

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

JAK W PRAKTYCE OPTYMALNIE ZAPLANOWAĆ EKSPERYMENT BADAWCZY?

Analiza wariancji i kowariancji

METODY STATYSTYCZNE W BIOLOGII

Wykład 10 Zrandomizowany plan blokowy

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

166 Wstęp do statystyki matematycznej

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Ekonometria. Zajęcia

Zmienne zależne i niezależne

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

Regresja logistyczna (LOGISTIC)

Sposoby prezentacji problemów w statystyce

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

KARTA KURSU. Kod Punktacja ECTS* 1

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

STATYSTYKA MATEMATYCZNA

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Wykład 5 Teoria eksperymentu

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

1) Wprowadzenie; 2) Doświadczenia jednoczynnikowe; 3) Doświadczenia dwuczynnikowe; 4) Doświadczenia trójczynnikowe; 5) Badanie współzależności cech

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

PRZYSTĘPNIE O STATYSTYCZNYM PODEJŚCIU DO TESTOWANIA HIPOTEZ BADAWCZYCH I SZACOWANIA LICZEBNOŚCI PRÓBY

POLITECHNIKA OPOLSKA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Transkrypt:

KIEDY I DLACZEGO STOSUJEMY ANALIZĘ KOWARIANCJI (ANCOVA)? Janusz Wątroba, StatSoft Polska Sp. z o.o. Zmienność wyników obserwowana przy badaniu każdej zbiorowości jednostek jest nieodłącznym atrybutem każdego eksperymentu oraz jest badania typu obserwacyjnego. Jednocześnie jest to główny powód wykorzystywania podejścia statystycznego zarówno na etapie projektowania badań, jak i opracowywania ich wyników. Dobrze zaprojektowane badanie oraz sposób analizy jego wyników pozwala wskazać tę część zmienności, której źródłem są warunki kontrolowane w eksperymencie, nawet w sytuacji jednoczesnego występowania innych źródeł zmienności, wpływającej na wyniki. Dobrze zaplanowane badanie pozwala oszacować części zmienności odpowiadające poszczególnym źródłom. Dobre podejście do badania już na etapie jego planowania pozwala w porę zauważyć niepożądaną, nieplanowaną zmienność typu systematycznego i przekształcić ją w tolerowaną przez badacza zmienność przypadkową lub nawet pożądaną zaplanowaną zmienność typu systematycznego. Metodą umożliwiającą kontrolowanie niektórych (na ogół mniej interesujących dla badacza) źródeł zmienności na etapie statystycznego opracowywania wyników przeprowadzonych badań jest analiza kowariancji (ANCOVA). W trakcie wystąpienia zostanie omówiona idea tej metody, jej założenia oraz zostanie przedstawiony przykład jej prowadzenia za pomocą narzędzi statystycznych dostępnych w programie STATISTICA. Wprowadzenie Jedną z najbardziej uniwersalnych metod analizy statystycznej (chociaż bardziej trafnym byłoby określenie zespół metod statystycznych) jest analiza wariancji. Jej pomysłodawca, angielski matematyk Ronald Fisher jako pierwszy zauważył, że zmienność wyników każdego badania wyrażoną wariancją można rozdzielić (zdekomponować) na części i każdej z nich przypisać określone źródło zaobserwowanej zmienności. Ten sposób podejścia do analizy wyników badań został zarówno przez samego Fishera, jak i jego naśladowców i kontynuatorów szeroko rozwinięty i obecnie funkcjonuje jako jeden z ważnych obszarów z pogranicza statystyki matematycznej i jest stosowany pod nazwą planowanie doświadczeń (ang. experimental design). Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 23

Uniwersalność analizy wariancji wynika z faktu, iż może ona być wykorzystywana do weryfikacji bardzo szerokiego spektrum zarówno prostych, jak i złożonych hipotez statystycznych, dzięki czemu stanowi dla badacza bardzo efektywne narzędzie oceny prawdziwości stawianych przez niego hipotez badawczych. Przy projektowaniu każdego eksperymentu należy starać się zidentyfikować wszystkie potencjalne czynniki powodujące występowanie zmienności wyników badania. W każdym badaniu empirycznym można wyróżnić trzy źródła zmienności [1]: zmienność spowodowaną przez czynniki, które badacz w sposób zaplanowany poddaje eksperymentalnej kontroli (jest to zmienność, która jest pożądana i oczekiwana przez badacza), zmienność pojawiającą się w procesie pomiaru (jest to zmienność niepożądana, której na ogół badacz nie jest w stanie uniknąć ze względu na zbyt wysokie koszty lub trudności techniczne), zmienność występującą w samym materiale doświadczalnym (wynikającą np. z niejednorodności badanych jednostek, jest to również zmienność niepożądana przez badacza). Dobrze zaplanowany eksperyment pozwala oszacować części zmienności odpowiadające poszczególnym źródłom. Aby opracować strategie postępowania z niechcianą przez badacza częścią zmienności należy wziąć pod uwagę sposoby jej działania. Ten punkt widzenia pozwala wyróżnić trzy rodzaje zmienności: zmienność systematyczną, zaplanowaną przez badacza (jest to rodzaj zmienności aprobowany przez badacza), zmienność typu przypadkowego (jest to rodzaj zmienności, z którym można nauczyć się żyć ), zmienność systematyczną, niezaplanowaną przez badacza (jest to rodzaj zmienności, który grozi katastrofą ). Dzięki rozróżnianiu podanych wyżej rodzajów zmienności badacz może odnieść dwie korzyści: (1) może być w stanie w porę zauważyć niepożądaną zmienność (systematyczną, niezaplanowaną) i szukać sposobów jej przekształcenia w tolerowaną zmienność przypadkową lub nawet zmienność pożądaną (systematyczną, zaplanowaną) oraz (2) czasami badacz może zredukować pulę zmienności typu przypadkowego. Nie wszystkie źródła zmienności wyników doświadczenia są dla badacza interesujące (np. te wynikające z niejednorodności badanych jednostek lub z powodu trudności z zapewnieniem jednakowych warunków przebiegu eksperymentu). Przykłady takich czynników o charakterze zakłócającym lub towarzyszącym to różny poziom wyjściowy niektórych cech charakteryzujących badane jednostki (np. wiek, masa ciała, poziom inteligencji czy stan kliniczny) lub różne warunki, w jakich ma przebiegać doświadczenie (np. żyzność gleby na polu doświadczalnym lub pochodzenie zwierząt doświadczalnych z różnych partii). Uwzględnienie źródeł zmienności tego typu wymaga zastosowania odpowiedniego podejścia na etapie planowania eksperymentu lub na etapie opracowywania jego wyników. 24 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

W przypadku zmiennych typu jakościowego takim podejściem jest zaplanowanie doświadczenia w układzie blokowym (ang. block design), natomiast w przypadku zmiennych typu ilościowego odpowiednia metoda to analiza kowariancji (ang. analysis of covariance lub ANCOVA). Co to jest analiza kowariancji? Analizę kowariancji można traktować jako poszerzenie możliwości, jakie daje analiza wariancji, o statystyczny sposób kontroli (liniowego) wpływu zmiennych, które nie stanowią przedmiotu badania, ale badacz nie ma sposobu na ich wyeliminowanie z doświadczenia. A zatem analiza kowariancji umożliwia usuwanie tych zmiennych (traktowanych jako towarzyszące lub zakłócające) z listy potencjalnych zmiennych wyjaśniających wariancję badanej zmiennej zależnej. Dokonuje się to poprzez zastosowanie odpowiedniej techniki statystycznej (analizy regresji, która częściowo usuwa wpływ tych dodatkowych zmiennych), a nie odpowiednie eksperymentalne metody kontroli zmiennych ubocznych. Tak więc analiza kowariancji może też być traktowana jako rozszerzenie idei układów blokowych na przypadek zmiennej zakłócającej typu ilościowego pod warunkiem, że zależność pomiędzy tą zmienną a zmienną zależną daje się opisać stosunkowo prostym (zazwyczaj liniowym) modelem matematycznym. Z drugiej strony analiza kowariancji jest uważana za technikę łączącą w pewien sposób analizę wariancji i analizę regresji i z tego punktu widzenia może być też traktowana jako jeden ze szczególnych przypadków jeszcze ogólniejszego podejścia do modelowania współzależności zmiennych, jakim jest tzw. ogólny model liniowy (ang. general linear model). Dwa najważniejsze cele, dla których wykorzystywana jest analiza kowariancji to: zwiększenie precyzji porównań pomiędzy badanymi grupami poprzez uwzględnienie zmienności, która jest powodowana przez zmienne towarzyszące, skorygowanie porównań pomiędzy badanymi grupami w przypadku, gdy przeciętny poziom zmiennej towarzyszącej w grupach porównawczych też się różni. Analiza kowariancji jest powszechnie wykorzystywana w badaniach typu doświadczalnego w sytuacji, gdy badacz chce usunąć wpływ wyjściowego poziomu interesujących go zmiennych. Przykładowo w badaniach eksperymentalnych służących do porównania wyników przed i po badaniu (tzw. badania typu pretest-posttest) wyniki dla badanej zmiennej zarejestrowane przed badaniem są traktowane jako zmienna towarzysząca. ANCOVA jest także wykorzystywana w badaniach obserwacyjnych. Przykładem takich badań są badania sondażowe, badania przeprowadzane na próbach nielosowych albo tzw. badania quasieksperymentalne, w przypadku których występuje zazwyczaj spora trudność w losowym przypisaniu badanych jednostek do grupy badanej i kontrolnej. Należy jednak wspomnieć, że w literaturze poświęconej tej tematyce nie brak również opinii poddających w wątpliwość poprawność stosowania analizy kowariancji w badaniach tego rodzaju [5]. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 25

Przykłady zastosowań analizy kowariancji Jak to już wcześniej wspominano, obecnie analiza kowariancji jest metodą powszechnie wykorzystywaną, zarówno w badaniach eksperymentalnych, jak i badaniach typu obserwacyjnego. Poniżej przytoczono kilka przykładów, pochodzących z różnych dziedzin badań, w których do opracowania zebranych wyników można zastosować analizę kowariancji. W badaniach pedagogicznych oceniano różne metody nauki czytania w grupie dzieci w wieku 8 lat. Zmienną zależną był końcowy wynik w teście sprawdzającym, uzyskany przez każde dziecko, które uczestniczyło w programie nauki czytania. Jednakże każde z dzieci charakteryzowało się różnym poziomem zdolności czytania przed wejściem do programu. Ponadto występuje wiele różnych czynników pozaszkolnych, które mogą mieć wpływ na wynik w teście sprawdzającym, na przykład status socjoekonomiczny ich rodzin. Zmienne tego typu, jeśli mają charakter ilościowy, można uwzględnić w badaniu jako zmienne towarzyszące i przy opracowywaniu wyników badania użyć analizy kowariancji. Kolejny przykład dotyczy medycyny. Przeprowadzono badania, których celem było porównanie kilku tradycyjnych metod leczenia przewlekłego bólu oraz kilku nowszych metod alternatywnych. Pacjenci włączeni do badania charakteryzują się różnym nasileniem bólu, w zależności od czasu, jaki upłynął od jego pojawienia się, ich wieku, stanu zdrowia oraz wielu innych czynników mogących mieć wpływ na skuteczność leków przeciwbólowych, które były oceniane w badaniach. Badacze mogliby skupić się tylko na kilku z tych czynników, ale mogłoby okazać się też, że inne zmienne towarzyszące też mogą mieć mocny wpływ na wyniki całego badania. Założenia analizy kowariancji W związku z tym, że analiza kowariancji stanowi połączenie analizy wariancji i analizy regresji, występują więc w niej założenia tamtych metod: normalność rozkładu badanych zmiennych zależnych w obrębie porównywanych grup, równość wariancji pomiędzy grupami oraz założenia dotyczące składnika losowego modelu liniowego [3]. Ponieważ model analizy kowariancji ma komponent regresyjny, reszty w modelu będą przyjmowały różne wartości dla pomiarów w obrębie każdej z grup porównawczych oraz pomiędzy grupami. Najlepszym sprawdzianem założenia równości wariancji jest wykres reszt względem skorygowanych średnich grupowych. Jednocześnie ze względu na fakt, iż model analizy kowariancji jest modelem liniowym i zawiera zarówno zmienne niezależne o charakterze jakościowym, jak i ilościowym, występuje jeszcze dodatkowe założenie, że współczynniki regresji w obrębie porównywanych grup są sobie równe. Sposób testowania tego założenia zostanie zaprezentowany w dalszej części. Jeżeli założenie to nie jest spełnione, wówczas prowadzi to do tzw. modelu różnych nachyleń. 26 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Przykład analizy wyników badania za pomocą analizy kowariancji w programie STATISTICA Przebieg kolejnych kroków występujących w analizie kowariancji zostanie zilustrowany na przykładzie wyników obserwacji trzech grup pacjentów, u których oznaczano poziom osmolalności osocza przed i po wykonaniu pewnego zabiegu leczniczego [6]. Badanie osmolalności krwi ma na celu zidentyfikowanie stopnia zagęszczenia krwi, co umożliwia m.in. na ocenę gospodarki wodno-elektrolitowej w organizmie człowieka. W przypadku danych, które zostaną wykorzystane w prezentowanym przykładzie badacza interesowało porównanie końcowych poziomów osmolalności osocza badanych grup pacjentów nie tylko w liczbach bezwzględnych, ale także po uwzględnieniu poziomu wyjściowego przed wykonanym zabiegiem leczniczym. Tak więc pomiar osmolalności osocza przed wykonanym zabiegiem pełni rolę zmiennej towarzyszącej, której wpływ chcielibyśmy uwzględnić (wyeliminować) przy ocenie zróżnicowania średnich pomiędzy badanymi grupami pacjentów. Warto w tym miejscu dodać, że wyniki oznaczania osmolalności po zabiegu można byłoby analizować nie tylko w zależności od wyniku zaobserwowanego przed zabiegiem, ale także od takich zmiennych, jak np. wiek czy waga pacjentów. Korzystając z narzędzi analizy statystycznej zawartych w module Ogólny model liniowy programu STATISTICA, zaprezentowane zostaną kolejne kroki wykonywane przy przeprowadzaniu analizy kowariancji. Oczekiwana normalna Wykres normalności Osm osocza po; kategorie względem Grupa Osmolalność osocza.sta 3v*35c Grupa: I Osm osocza po: SW-W = 0,9694; p = 0,8283 Grupa: II Osm osocza po: SW-W = 0,8954; p = 0,1950 Grupa: III Osm osocza po: SW-W = 0,844; p = 0,0640 2,0 1,5 1,0 0,5 0,0-0,5-1,0-1,5-2,0 270 275 280 285 290 295 300 305 310 Grupa: I 2,0 1,5 1,0 0,5 0,0-0,5-1,0-1,5-2,0 270 275 280 285 290 295 300 305 310 Grupa: III Wartość obserwowana 270 275 280 285 290 295 300 305 310 Grupa: II Rys. 1. Skategoryzowane wykresy normalności. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 27

W pierwszym kroku analizy sprawdzimy, czy zmienność osmolalności osocza oznaczona przed zabiegiem ma charakter przypadkowy. W tym celu należy przeprowadzić jednoczynnikową analizę wariancji. W pierwszej kolejności sprawdzono, czy są spełnione założenia: normalność rozkładu badanej zmiennej w porównywanych grupach pacjentów oraz równość wariancji w grupach. Wyniki tej analizy przedstawiono powyżej. Wyniki testu Shapiro-Wilka wskazują na brak podstaw do kwestionowania założenia normalności. Podobny wniosek można wyciągnąć w przypadku oceny równości wariancji na podstawie testu Levene a oraz testu Browna-Forsythe a. Rys. 2. Wyniki testów oceniających równość wariancji. Wyniki testów dają podstawy do przeprowadzenia wstępnej analizy wariancji dla oceny istotności zróżnicowania osmolalności osocza przed zabiegiem. Rys. 3. Wyniki oceny zróżnicowania poziomu osmolalności osocza przed zabiegiem. Na podstawie otrzymanych wyników możemy wyciągnąć wniosek, że zróżnicowanie poziomu osmolalności osocza pomiędzy badanymi grupami pacjentów przed zabiegiem było statystycznie nieistotne (p=0,586164). W taki sam sposób można sprawdzić istotność różnic pomiędzy średnimi poziomami osmolalności osocza po zabiegu. Jak poprzednio, najpierw przedstawiono wyniki sprawdzania założeń. 28 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Oczekiwana normalna Wykres normalności Osm osocza przed; kategorie względem Grupa Osmolalność osocza.sta 3v*35c Grupa: I Osm osocza przed: SW-W = 0,8903; p = 0,0564 Grupa: II Osm osocza przed: SW-W = 0,9426; p = 0,5823 Grupa: III Osm osocza przed: SW-W = 0,9362; p = 0,5427 2,0 1,5 1,0 0,5 0,0-0,5-1,0-1,5-2,0 290 295 300 305 310 315 320 325 Grupa: I 2,0 1,5 1,0 0,5 0,0-0,5-1,0-1,5-2,0 290 295 300 305 310 315 320 325 290 295 300 305 310 315 320 325 Grupa: II Grupa: III Wartość obserwowana Rys. 4. Skategoryzowane wykresy normalności. W przypadku pomiaru osmolalności osocza po zabiegu również brak podstaw do kwestionowania założenia normalności. Jak poprzednio, podobny wniosek można wyciągnąć w przypadku oceny równości wariancji na podstawie testu Levene a oraz testu Browna- Forsythe a. Rys. 5. Wyniki testów oceniających równość wariancji. Przytoczone wyniki dają podstawę do oceny istotności zróżnicowania wartości przeciętnych osmolalności osocza za pomocą analizy wariancji. Wyniki przedstawiono poniżej w tabeli analizy wariancji. Rys. 6. Wyniki oceny zróżnicowania poziomu osmolalności osocza po zabiegu. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 29

Okazuje się, że wyniki wstępnej analizy wariancji sugerują wniosek o braku zróżnicowania przeciętnej osmolalności osocza w badanych grupach pacjentów, również po wykonanym zabiegu (p=0,425353). W kolejnym kroku najpierw sprawdzimy założenie stosowalności analizy kowariancji, tzn. istotność regresji wyników pomiaru osmolalności osocza po zabiegu od pomiaru osmolalności osocza przed zabiegiem. W tym celu należy sprawdzić prawdziwość hipotezy zerowej dotyczącej istotności współczynnika regresji: H 0 : β 1 =0 Wyniki pokazano w zamieszczonej poniżej tabeli. Rys. 7. Ocena istotności parametrów modelu regresji. Otrzymane wyniki pozwalają na odrzucenie postawionej hipotezy, tzn. stwierdzenie istotności regresji. W następnym kroku należy sprawdzić kolejne założenie analizy kowariancji, czyli hipotezę o jednakowym charakterze zależności pomiędzy osmolalnością osocza po zabiegu a osmolalnością przed zabiegiem w trzech porównywanych grupach pacjentów (Igr, IIgr, IIIgr), czyli hipotezy o równości współczynników regresji (albo inaczej równoległości linii regresji). H 0 : β 1Igr = β 1IIgr = β 1IIIgr Wyniki oceny prawdziwości tej hipotezy zostały zamieszczone w poniższej tabeli (w czwartym wierszu). Rys. 8. Wyniki oceny hipotezy o równości współczynników regresji. Na podstawie otrzymanych wyników można wyciągnąć wniosek o tym, że zależność wyników pomiaru osmolalności osocza przed zabiegiem od wyników pomiaru poziomu osmolalności osocza po zabiegu kształtuje się podobnie we wszystkich trzech porównywanych grupach pacjentów. Oznacza to, że odpowiednie teoretyczne linie regresji przebiegają w przybliżeniu równolegle do siebie. Ilustruje to pokazany poniżej wykres. 30 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

310 305 Wykres rozrzutu Osm osocza po względem Osm osocza przed; kategorie względem Grupa Osmolalność osocza.sta 3v*35c Grupa: I Osm osocza po = 94,3055+0,638*x Grupa: II Osm osocza po = 54,9567+0,7643*x Grupa: III Osm osocza po = 32,5417+0,8568*x 300 Osm osocza po 295 290 285 280 275 270 290 295 300 305 310 315 320 325 Osm osocza przed Grupa: I Grupa: II Grupa: III Rys. 9. Osmolalność osocza w grupach pacjentów (wyniki surowe i modele regresji). Możemy teraz ponownie sprawdzić, czy po uwzględnieniu poziomu osmolalności osocza przed wykonaniem zabiegu wystąpiło istotne statystycznie zróżnicowanie przeciętnego poziomu osmolalności osocza po zabiegu pomiędzy pacjentami z porównywanych trzech grup. W tym celu wykonamy właściwą analizę kowariancji. Jej wyniki zostały przedstawione w poniższej tabeli. Rys. 10. Wyniki analizy kowariancji. Wniosek wynikający z przedstawionych powyżej wyników analizy okazuje się sprzeczny z wnioskiem ze wstępnej analizy wariancji. Okazuje się jednak, że po uwzględnieniu poziomu osmolalności osocza przed zabiegiem wystąpiło istotne zróżnicowanie pomiędzy średnimi w porównywanych grupach. Zamieszczona poniżej tabela zwiera zwykłe średnie dla osmolalności osocza po zabiegu wraz z błędami standardowymi oraz odpowiednimi przedziałami ufności. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 31

Rys. 11. Średnie pomiarów osmolalności osocza po zabiegu w porównywanych grupach pacjentów. W kolejnej tabeli zamieszczono średnie poprawione, tzn. przeliczone na jednakową wartość średnią osmolalności osocza przed zabiegiem wraz z błędami standardowymi oraz odpowiednimi przedziałami ufności. Rys. 12. Poprawione średnie pomiarów osmolalności osocza po zabiegu w porównywanych grupach pacjentów. Obydwa rodzaje średnich przedstawiono też na wykresach poniżej. 300 Grupa; Średnie ważone Bieżący efekt: F(2, 31)=3,8796, p=,03136 Pionowe słupki oznaczają 0,95 przedziały ufności Grupa; Oczekiwane średnie brzegowe Bieżący efekt: F(2, 31)=3,8796, p=,03136 (Obliczone dla wartości średnich zmiennych towarzyszących) Pionowe słupki oznaczają 0,95 przedziały ufności 300 295 295 Osm osocza po 290 Osm osocza po 290 285 285 280 I II III 280 I II III Grupa Grupa Rys. 13. Zwykłe i poprawione średnie pomiarów osmolalności osocza po zabiegu w porównywanych grupach pacjentów. Po przeprowadzeniu szczegółowej oceny istności różnic pomiędzy porównywanymi grupami pacjentów okazało się, że istotne statystycznie zróżnicowanie średnich wystąpiło pomiędzy pacjentami z grupy II i III. 32 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Podsumowanie Analiza kowariancji jest metodą pozwalającą na przeprowadzenie porównania pomiędzy grupami badanych jednostek, które różnią się ze względu na inne pozostające poza głównym celem badania zmienne. Nazywa się je zmiennymi towarzyszącymi lub zakłócającymi. Uwzględnienie wpływu tych zmiennych następuje poprzez korektę bazującą na dopasowanej linii regresji. Jeśli nierównoważność pomiędzy grupami (pod względem takiej zmiennej) nie jest zbyt duża, zastosowana metoda może okazać się bardzo pomocna. Jednakże warto zdawać sobie sprawę z tego, że korekta jest przeprowadzana w ramach określonego modelu statystycznego i w związku z tym korzystanie z tego podejścia może nie być skuteczne w przypadku grup mocno odbiegających od siebie. Oprócz możliwości uwzględnienia braku równoważności porównywanych grup metod analizy kowariancji usuwa zmienność, której źródłem jest zmienna towarzysząca i dzięki temu dostarcza bardziej precyzyjnych ocen badanych efektów. Patrząc z geometrycznego punktu widzenia, polega to na tym, że niewyjaśnioną wariancją, w stosunku do której ostatecznie oceniana jest istotność różnic pomiędzy grupami, jest wariancja względem linii regresji, podczas gdy w przypadku analizy ignorującej zmienną towarzyszącą brana jest pod uwagę wariancja w stosunku do średnich grupowych, która w związku z tym jest oczywiście większa. W zaprezentowanym przykładzie analizy oceniano zróżnicowanie poziomu osmolalności osocza po pewnym zabiegu leczniczym w trzech grupach pacjentów. Zilustrowano przebieg analizy kowariancji oraz sposób testowania założeń. Najpierw we wstępnej analizie wariancji stwierdzono brak statystycznego istotnego zróżnicowania średnich grupowych. Następnie po uwzględnieniu pomiarów osmolalności osocza zarejestrowanych u pacjentów przed zabiegiem poprzez zastosowanie analizy kowariancji udało się wykazać statystycznie istotne zróżnicowanie średnich pomiędzy II i III grupą badanych. Literatura 1. Cobb G. W., (1998), Design and Analysis of Experiments, Springer. 2. Ott R.L., Longnecker M., (2010), An Introduction to Statistical Methods and Data Analysis, 6 th ed., Brooks/Cole. 3. Quinn G. P., Keough M. J., (2002), Experimental Design and Data Analysis for Biologists, Cambridge University Press. 4. StatSoft, Inc. (2011). STATISTICA (data analysis software system), version 10. www.statsoft.com. 5. Vogt W. P., (1999), Dictionary of Statistics and Methodology: A Nontechnical Guide for the Social Sciences, 2 th ed., Sage Publications. 6. Wójcik A. R., Laudański Z., (1989), Planowanie i wnioskowanie statystyczne w doświadczalnictwie, PWN. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 33