METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY

Podobne dokumenty
Michał Kusy, StatSoft Polska Sp. z o.o.

Wprowadzenie do analizy korelacji i regresji

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1.

PDF created with FinePrint pdffactory Pro trial version

Testowanie hipotez statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

KORELACJE I REGRESJA LINIOWA

Rozdział 8. Regresja. Definiowanie modelu

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Regresja logistyczna (LOGISTIC)

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Statystyka i Analiza Danych

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Analizy wariancji ANOVA (analysis of variance)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

MODELE LINIOWE. Dr Wioleta Drobik

Statystyka matematyczna dla leśników

Wykład 9 Wnioskowanie o średnich

Pobieranie prób i rozkład z próby

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Weryfikacja hipotez statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Zmienne zależne i niezależne

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Regresja linearyzowalna

Analiza wariancji - ANOVA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Metodologia badań psychologicznych. Wykład 12. Korelacje

Przykład 1. (A. Łomnicki)

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

3. Modele tendencji czasowej w prognozowaniu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Analiza składowych głównych. Wprowadzenie

Regresja i Korelacja

Własności statystyczne regresji liniowej. Wykład 4

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Stosowana Analiza Regresji

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Grupowanie materiału statystycznego

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

7.4 Automatyczne stawianie prognoz

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Oszacowanie i rozkład t

Sposoby prezentacji problemów w statystyce

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

statystyka badania epidemiologiczne

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Testy nieparametryczne

Badanie zależności skala nominalna

Szkice rozwiązań z R:

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

METODY STATYSTYCZNE W BIOLOGII

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Wykład 2: Tworzenie danych

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Badania obserwacyjne 1

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Analiza regresji - weryfikacja założeń

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Transkrypt:

METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY Michał Kusy, StatSoft Polska Sp. z o.o. Statystyczne metody łączenia wyników pochodzących z niezależnych badań muszą często radzić sobie z problemami wynikającymi ze zmienności między badaniami. Mimo że metaanaliza pozwala połączyć wyniki z badań pierwotnych w postaci efektu łącznego, jej celem nie jest sprowadzenie wszystkich wartości do jednej miary efektu. Dobrze oddaje to wykres leśny, przedstawiający uzyskany efekt łączny w kontekście poszczególnych badań i ich zmienności. W kolejnych rozdziałach przedstawimy przykład wykonania metaanalizy w programie STATISTICA Zestaw Medyczny. Do oceny zmienności wyników wykorzystamy analizę niejednorodności. Szukając przyczyn tej zmienności, sięgniemy do analizy w grupach i metaregresji, aby sprawdzić powiązania między efektem i wybranymi charakterystykami badania. Badania Przedstawiane analizy opierają się na danych pochodzących z analizy skuteczności szczepienia BCG w profilaktyce gruźlicy. Szczepionka BCG (Bacillus Calmette-Guérin) zapobiegająca rozwojowi gruźlicy została opracowana we Francji przez Alberta Calmette i Camille'a Guérin. Obecnie Światowa Organizacja Zdrowia (WHO) zaleca jej stosowanie w ramach programu szczepień ochronnych w krajach o podwyższonym ryzyku zachorowania na gruźlicę. Mimo że szczepionkę wprowadzono do użycia w 1921 roku, jej skuteczność często poddawano w wątpliwość. Dostępne wyniki badań wahają się od wartości wskazujących na przypuszczalną szkodliwość szczepienia do prawie 80% skuteczności. W latach 90., wraz z niepokojącym rozpowszechnianiem się gruźlicy w Stanach Zjednoczonych, pojawiła się potrzeba zestawienia i podsumowania dotychczasowych badań opisujących skuteczność BCG. W 1994 roku Colditz i wsp. [4] przeprowadzili metaanalizę dostępnych badań, a rok później Berkey i wsp. [2] podjęli się próby wyjaśnienia części zmienności efektów za pomocą metaregresji. Dokonano przeglądu 1264 artykułów i abstraktów dotyczących występowania samej choroby oraz szczepień BCG i innych szczepień przeciw gruźlicy. Do identyfikacji badań klinicznych oceniających skuteczność szczepionki BCG wykorzystano elektroniczne bazy publikacji medycznych, analizując odwołania do wyszukanych artykułów, przeglądając 50

` wcześniej przygotowane listy badań BCG oraz kontaktując się z ekspertami w tej dziedzinie. Przeglądane publikacje obcojęzyczne były tłumaczone na język angielski. Wyszukiwanie przeprowadzały niezależnie przynajmniej dwie osoby, a wszystkie przeglądane artykuły rejestrowano wraz z ewentualnymi przyczynami wyłączenia ich z badania. Do metaanalizy włączono jedynie badania oceniające skuteczność szczepienia BCG w zapobieganiu przypadkom gruźlicy lub śmierci. Autorzy starali się zgromadzić następujące informacje o każdym z badań: rok publikacji, rok szczepienia, sposób zaplanowania badania, przedział wiekowy badanej populacji, liczba włączonych pacjentów, położenie (szerokość geograficzna), typ i dawka użytej szczepionki, droga podania, czas badania lub czas do uodpornienia, rodzaj miary efektu oraz wynik opisujący skuteczność szczepionki. Ostatecznie kryteria włączenia do metaanalizy skuteczności szczepienia BCG w profilaktyce gruźlicy spełniło 13 badań, na których będą bazować kolejne analizy. Metaanaliza Analizę w module Metaanaliza programu STATISTICA Zestaw Medyczny rozpoczynamy od wprowadzenia wyników poszczególnych badań. Zbiór danych zawiera informacje o liczbach pacjentów z gruźlicą i pacjentów zdrowych, w grupach szczepionych BCG i nieszczepionych. Na podstawie tych wartości dla każdego badania program oblicza interesującą nas miarę efektu, którą w tym przypadku jest współczynnik ryzyka RR. W pierwszym badaniu (Aronson 1948) gruźlica wystąpiła u 4 spośród 123 osób szczepionych i 11 spośród 139 nieszczepionych. Współczynnik ryzyka i 95% przedział ufności wyniosły w tym badaniu odpowiednio: 0,411 i (0,134; 1,257). Ponieważ dane z badań pierwotnych zostały wcześniej zapisane w arkuszu STASTISTICA, można je wprowadzić do analizy jednocześnie. Moduł Metaanaliza umożliwia również wprowadzenie badań z już 51

wyliczonymi efektami, co jest szczególnie istotne w sytuacjach, gdy nie ma dostępu do szczegółowych danych dla badania, dysponujemy jednak wyliczoną na ich podstawie miarą efektu. Po wprowadzeniu poszczególnych badań program wylicza automatycznie wszystkie miary efektu dostępne dla takich danych. Istnieje również możliwość przeliczania części współczynników między sobą, dzięki czemu w analizie można jednocześnie uwzględnić badania prezentujące różne miary efektu. W przypadku miar efektu wyrażonych na skali ilorazowej (takich jak np. współczynnik ryzyka RR czy iloraz szans OR) przed przeprowadzeniem metaanalizy program zastosuje przekształcenie logarytmiczne. Pozwala ono sprowadzić wyniki do skali addytywnej, a następnie wyznaczyć średnią ważoną będącą oszacowaniem efektu łącznego w metaanalizie. Dopiero po wyliczeniu łącznego efektu przedstawiamy wynik na wyjściowej skali. Metaanaliza - model z efektem stałym i zmiennym Metaanaliza, czyli ilościowa synteza wyników pochodzących z niezależnych badań, to narzędzie badawcze, które pozwala precyzyjnie ocenić wpływ działania analizowanego czynnika oraz rozszerzyć wnioski z pojedynczych badań na szerszą populację w sytuacji, gdy nie mamy dostępu do danych surowych, a dysponujemy jedynie zbiorczymi wynikami tych badań. Jako jedną z pierwszych metaanaliz traktuje się analizę wykonaną przez Karla Pearsona w 1904 roku. Aby ocenić skuteczność szczepienia na tyfus brzuszny Pearson wykorzystał wyniki z pięciu prób o małej liczności i obliczył uśrednioną miarę korelacji między umieralnością a stosowaniem szczepionki. Mimo że metaanaliza znajduje obecnie szerokie zastosowanie w medycynie, farmakologii i epidemiologii, pierwsze publikacje oceniające skuteczność terapii za pomocą tej techniki 52

` badawczej pojawiły się stosunkowo późno. Sam termin metaanaliza (meta-analysis) sformułował po raz pierwszy Gene Glass w 1976 roku. W połowie lat 80. upowszechniły się tzw. przeglądy systematyczne (systematic reviews), w których metaanaliza odgrywa dużą rolę. O jej znaczeniu we współczesnych naukach medycznych może świadczyć chociażby fakt, że najwyżej w hierarchii wiarygodności danych z badań klinicznych stawia się właśnie metaanalizę badań z grupą kontrolną. W większości przypadków metaanaliza jest oparta na jednym z dwóch modeli statystycznych: modelu z efektem stałym (fixed-effect model) lub modelu z efektem zmiennym (random-effects model). W modelu z efektem stałym zakłada się, że wyniki wszystkich badań opisują tę samą, rzeczywistą wartość efektu, a różnice w obserwowanych efektach wynikają z błędu próby. W tym przypadku efekt łączny jest wyznaczany na podstawie średniej ważonej efektów, przy czym wagi są wyznaczane jako odwrotności wariancji odpowiednich badań. Podejmując decyzję o włączeniu do metaanalizy grupy badań, zakładamy, że mają one na tyle zgodny charakter, że synteza ich wyników ma sens. Najczęściej jednak rzeczywisty efekt nie jest w każdym z nich jednakowy, co jest spowodowane np. specyficznymi, nieopisanymi w publikacjach cechami pacjentów lub różnicami w sposobie zaplanowania badania, z których nie zdajemy sobie sprawy. W modelu z efektem zmiennym (nazywanym również modelem efektów losowych) uwzględniamy sytuację, w której nieznane, rzeczywiste efekty różnią się między badaniami. Zwykle zakłada się, że mają one rozkład normalny. Również w tym modelu efekt łączny jest wyznaczany na podstawie średniej ważonej efektów poszczególnych badań, z tym że wagi są wyznaczane jako odwrotności wariancji wewnątrz badań, powiększonej o wariancję pomiędzy badaniami. Wróćmy do naszego przykładu. Biorąc pod uwagę zróżnicowanie zgromadzonych badań wybieramy model z efektem zmiennym. Miarą efektu, którą będziemy rozpatrywać jest współczynnik ryzyka RR. Przed wykonaniem analizy program automatycznie sprowadzi wartości do skali logarytmicznej, a na koniec przeskaluje wynik do wyjściowej miary. Na karcie Badania wyświetlone zostają wyniki dla poszczególnych badań pierwotnych i wyniki metaanalizy, umieszczone w ostatnim wierszu. Uzyskany w modelu efekt łączny wynosi RR = 0,490, a odpowiedni 95% przedział ufności (0,345; 0,695). Wynik jest istotny statystycznie przy poziomie istotności α = 0,05 (p = 0,0001). Oznacza to zatem średnio o 50% niższe ryzyko zachorowania na gruźlicę wśród osób szczepionych BCG w porównaniu do grupy kontrolnej. Gdybyśmy dla porównania przeprowadzili metaanalizę, zakładając, że zbiór badań jest jednorodny, a zmienność wynika jedynie z błędu próby (model z efektem stałym), uzyskalibyśmy współczynnik ryzyka RR = 0,650 (0,601; 0,704), również istotny statystycznie. Widzimy, że w modelu z efektem stałym wyznaczony przedział ufności dla współczynnika ryzyka jest wyraźnie węższy niż w przypadku modelu z efektem zmiennym. 53

Mimo że metaanaliza pozwala połączyć wyniki wielu badań w postaci efektu łącznego, jej celem nie jest sprowadzenie tych wszystkich wartości do jednej miary efektu. W zależności od zmienności wyników badań, badacz może koncentrować uwagę na oszacowaniu efektu (w przypadku bardzo jednorodnych badań), wartości efektu i jego zmienności lub też głównie na zmienności. Dobrze oddaje to wykres leśny (forest plot), przedstawiający zarówno efekt łączny, jak i cały kontekst (poszczególne badania i ich zmienność), w którym został on wyznaczony. Najczęściej przedstawia się na nim wyniki poszczególnych badań i obliczone przedziały ufności oraz wynik łączny, umieszczany poniżej badań. Dodatkowo punkty oznaczające wartości efektu zaznaczane są najczęściej jako kwadraty o różnych polach, które odpowiadają wadze danego badania w metaanalizie. Moduł Metaanaliza pozwala również dołączyć do wykresu tabelę z wybranymi wynikami badań. Udziały poszczególnych badań w metaanalizie są dość zbliżone i mieszczą się w zakresie ok. 4-10%. Wynika to z faktu, że model z efektem zmiennym uwzględnia w obliczeniach zmienność zaobserwowaną między badaniami i nawet mało liczne badania wnoszą pewną informację o zmienności efektu. W modelu z efektem stałym wagi badań wahałyby się w tym przykładzie od niecałego 1% do 42% i byłyby w większym stopniu zależne od liczności badania. Od razu rzuca się w oczy duża zmienność wyników, od 80% zmniejszenia ryzyka w grupie szczepionych BCG (Ferguson & Simes 1949, Vandiviere 1973) do wyników świadczących na niekorzyść szczepionki, jak np. RR = 1,562 w badaniu Comstock & Webster 1969. Widzimy również, że w 5 spośród 13 rozpatrywanych badań wyniki okazały się nieistotne statystycznie. 54

` Analiza skumulowana Innym sposobem spojrzenia na wpływ poszczególnych badań na obliczany efekt łączny jest tzw. skumulowana metaanaliza (cumulative meta-analysis). Badania są w niej zwykle sortowane chronologicznie, dzięki czemu można śledzić, jak łączny efekt i błąd jego oszacowania zmieniały się w czasie, po uwzględnieniu kolejnych publikacji. 55

Powyżej przedstawiono wykres z wynikami analizy skumulowanej. Analizowane badania pochodzą z ponad 30-letniego okresu, w związku z czym ich wyniki będą oddawać zmiany, które zachodziły zarówno w praktyce medycznej, jak i sposobie planowania badań oraz raportowania ich wyników. Precyzja oszacowania efektu łącznego poprawia się naturalnie po dołączeniu do pojedynczego badania Aronson 1948 dwóch kolejnych badań. Widzimy jednak, że zmienność wyników jest na tyle duża, że dodanie kolejnych 10 badań nie powoduje znacznego zwężenia 95% przedziału ufności dla efektu łącznego. Analiza wrażliwości W trakcie przeprowadzania metaanalizy spotykamy ograniczenia związane nie tylko z zastosowanymi technikami analitycznymi, ale przede wszystkim z dostępnością danych. Przykładowo dane uzyskane z badań kohortowych nie pozwoliły na analizę czasu trwania odporności po szczepieniu, a uwzględnienie różnego wieku pacjentów było ograniczone określonym doborem pacjentów do badań oraz brakiem odpowiednich informacji w publikacjach. Potencjalnym źródłem obciążenia wyników metaanalizy są również badania niepublikowane, których wyniki są często nieistotne statystycznie lub nawet sprzeczne z publikowanymi danymi. Colditz i wsp. [4] kontaktowali się z ekspertami z WHO, CDC (Centers for Disease Control and Prevention) i innych organizacji, prosząc o pomoc w wyszukaniu jakichkolwiek niepublikowanych badań skuteczności BCG. Nie udało się jednak dotrzeć do takich badań. Przeprowadzono zatem analizę wrażliwości, w której oceniano m.in., jak wyniki metaanalizy przedstawiałyby się dla różnych zestawów uwzględnionych badań. Wykonano również metaanalizy po włączeniu dodatkowych 20 hipotetycznych badań, z których każde miało liczność porównywalną z największym badaniem rozpatrywanym w bazowej metaanalizie i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały zachowane, a efekt łączny pozostał istotny statystycznie. Aby ocenić, na ile założenia metaanalizy i uwzględnione w niej badania wpłynęły na uzyskane łączne wyniki, możemy wykonać szereg eksperymentów kryjących się pod ogólnym terminem analizy wrażliwości (sensitivity analysis). Gdy część wyników znacznie odbiega od pozostałych, można zbadać wpływ poszczególnych badań na efekt łączny, powtarzając wielokrotnie metaanalizę po wyłączeniu każdego z nich z osobna lub wyłączeniu grupy badań. Podobnie jeśli badanie nie zostało uwzględnione w metaanalizie, np. ze względu na jakość danych, możemy sprawdzić, jak zmieniłaby się łączna wartość efektu, gdyby włączyć je do analizy. Poniżej przedstawiono wykres wrażliwości, pokazujący zmiany w efekcie łącznym spowodowane wyłączeniem z metaanalizy poszczególnych badań. Pionowymi liniami zaznaczony został efekt łączny i granice przedziału ufności dla całościowej metaanalizy. Do tych poziomów możemy odnieść wartość efektu łącznego i zakres przedziału ufności dla metaanalizy przeprowadzonej bez danego badania. 56

` Na podstawie wykresu możemy stwierdzić, że nieuwzględnienie w analizie badania Aronson 1948 nie wpłynęłoby znacznie na efekt łączny, natomiast w metaanalizie przeprowadzonej bez badania TB Prevention Trial 1980 otrzymalibyśmy nieco mniejszy współczynnik ryzyka (RR = 0,454). Dodatkowy wykres przedstawiający procentową zmianę błędu standardowego po wyłączeniu badania z metaanalizy pokazuje, że w tym przypadku błąd standardowy zmniejszyłby się o około 15%. Badanie TB Prevention Trial 1980 miało silny wpływ na wyniki metaanalizy. Było to najliczniejsze spośród analizowanych badań, a wyznaczony w nim współczynnik ryzyka sugerował brak efektu (RR = 1,012, p = 0,8494). Niejednorodność wyników Rozważając niejednorodność wyników analizowanych badań, mamy na uwadze zmienność rzeczywistej wartości efektu. Obserwowana zmienność może wynikać z różnic na poziomie klinicznym (np. zróżnicowania populacji pacjentów, interwencji, czasu obserwacji) lub metodycznym (np. różnic w zaplanowaniu badań, jakości badań), jak również z błędów losowych. Aby wyodrębnić z obserwowanego rozrzutu wyników rzeczywistą wariancję, porównujemy zaobserwowaną zmienność między badaniami ze zmiennością, której oczekiwalibyśmy, gdyby badania wskazywały efekt wspólny. Różnica między nimi powinna odzwierciedlać rzeczywiste różnice między badaniami i na jej bazie konstruuje się podstawowe miary wykorzystywane w analizie niejednorodności (heterogeneity analysis). Przykładową miarą oceniającą niejednorodność wyników jest ważona suma kwadratów Q Cochrana. Przy założeniu, że każde z k badań wskazuje na ten sam stały efekt, współczynnik Q będzie pochodził z rozkładu chi-kwadrat o k-1 stopniach swobody. W ten sposób otrzymujemy test sprawdzający niejednorodność efektów. Na podstawie wartości 57

Q wyznacza się również T 2 estymator wariancji rzeczywistych efektów, oraz I 2 statystykę, która przedstawia udział procentowy zmienności rzeczywistej do łącznej. W rozważanym przykładzie interesujący jest nie tylko efekt łączny, ale również, jeśli nie przede wszystkim, znaczna wariancja efektów leczenia, które zmieniają się od RR równego 0,198 (80% zmniejszenie ryzyka) do 1,562 (56% zwiększenie ryzyka). Statystyka Q wynosi 152,233 (df = 12), a p jest mniejsze od 0,0001, w związku z czym możemy stwierdzić, że wyniki badań istotnie się od siebie różnią. Wariancja rzeczywistych efektów T 2 jest równa 0,309 i stanowi 92% obserwowanej zmienności (I 2 = 92,12). Duża zmienność powoduje, że 95% przedział predykcji dla efektu jest szeroki. W zakresie (0,135; 1,769), oznaczonym na wykresie leśnym przerywaną linią spodziewalibyśmy się z dużym prawdopodobieństwem uzyskać wartość RR w kolejnym badaniu. Do graficznej oceny niejednorodności badań, oprócz wykresu leśnego, można wykorzystać szereg wykresów przedstawiających różne aspekty zmienności. Przykładem może być wykres L Abbego, przedstawiający w tym przypadku zależność między ryzykiem wystąpienia gruźlicy w grupie pacjentów szczepionych BCG a ryzykiem gruźlicy w grupie kontrolnej. Linia ciągła odpowiada poziomowi równowagi (RR = 1,00), a linia przerywana wyznaczonemu w metaanalizie efektowi łącznemu (RR = 0,49). Wielkość znaczników jest proporcjonalna do udziału danego badania w metaanalizie. Znaczny rozrzut punktów wokół przerywanej prostej sugeruje zwykle dużą zmienność wyników badań. Naszą uwagę zwraca jednak badanie Stein & Aronson 1953. Co prawda jego wynik nie odbiega znacznie od obliczonego efektu łącznego, ale charakteryzuje się ono największym odsetkiem zachorowań na gruźlicę, zarówno wśród osób zaszczepionych, jak i grupie kontrolnej. Dodatkowo możemy zaobserwować, że wartości RR większe od obliczonego efektu łącznego występują w badaniach oznaczonych ciemniejszym kolorem, w których ryzyko wystąpienia gruźlicy w grupie kontrolnej jest stosunkowo wysokie. 58

` Analiza niejednorodności badań nie kończy się zwykle na samym stwierdzeniu istnienia zmienności. Z praktycznego punktu widzenia bardziej przydatne jest wskazanie jej potencjalnych źródeł. Wykorzystujemy w tym celu między innymi analizę w grupach i metaregresję, szukając powiązań między charakterystykami badania i wartością efektu. Analiza w grupach Analizę w grupach (subgroup analyses) wykonujemy w sytuacji, gdy chcemy porównać wyniki metaanalizy przeprowadzanej na różnych grupach badań. W analizie w grupach na obserwowaną zmienność efektu wpływają: zmienność międzygrupowa, rzeczywista zmienność efektu w grupach i błąd próby. W przypadku modelu z efektem zmiennym wariancję rzeczywistych efektów T 2 możemy szacować dla każdej z grup oddzielnie lub wspólnie. Dodatkowo przeprowadza się testy porównujące efekty łączne między grupami. Szukając przyczyn zmienności wyników poszczególnych badań, Colditz i wsp. [4] rozważali m.in. użycie różnych szczepów BCG, występowanie innych zakażeń prątkowych w badanej populacji, genetyczne lub związane z wiekiem różnice w badanych populacjach, zmniejszoną złośliwość niektórych szczepów gruźlicy itp. Rozpatrywano również błędy merytoryczne oraz różnice metodyczne powodujące obciążenie wyników poszczególnych badań. Uwzględnili przykładowo zmienną określającą sposób przypisania pacjentów do porównywanych grup. W 7 badaniach pacjentów przypisano w sposób losowy (random allocation), w 4 zastosowano losowanie systematyczne (systematic allocation), a w 2 59

pseudorandomizację (alternate allocation). Poniżej przedstawiono wyniki analizy w tak zdefiniowanych grupach. Istotny statystycznie okazał się jedynie współczynnik ryzyka w grupie z przydziałem losowym, RR = 0,366 (0,180; 0,745). Analizując wykres leśny dla analizy w grupach, nie możemy powiedzieć, że metoda przypisania pacjentów do grup wyjaśnia zróżnicowanie wyników badań. Również test oparty na statystyce Q nie wykazał istotnych różnic między trzema grupami badań (p = 0,4638). Metaregresja Metaregresja (meta-regression) to kolejne podejście powszechnie stosowane w analizie niejednorodności badań. Stanowi ona połączenie technik metaanalizy i regresji liniowej. Krótko mówiąc, metaregresja ocenia czy istnieje liniowa zależność między zmiennymi na poziomie badania a odpowiednimi efektami leczenia i określa kierunek tej zależności. W porównaniu do analizy w grupach jest to metoda bardziej zaawansowana, pozwalająca włączyć do analizy jednocześnie większą liczbę zmiennych, zarówno ilościowych, jak i jakościowych. Warto zaznaczyć, że metaregresja nie powinna być wykonywana jedynie ze względu na wyniki metaanalizy sugerujące, że powiązanie może istnieć, lub ze względu na dostępność danych w uwzględnionych badaniach. Idealnie byłoby, gdyby możliwe źródła zmienności zostały zidentyfikowane przed połączeniem wyników w metaanalizie, co jest niewątpliwie utrudnione ze względu na obserwacyjny charakter metaanalizy. Co więcej, powinien istnieć przekonujący mechanizm biologiczny lub farmakologiczny, pozwalający uzasadnić 60

` wyniki metaregresji. Powiązań odkrytych w metaregresji nie uważa się za dowód istnienia związku przyczynowo-skutkowego. Nawet dla zmiennych definiowanych a priori uzyskiwane w metaregresji wyniki traktuje się bardziej jako hipotezy czy sugestie co do możliwych rzeczywistych zależności. Berkey i wsp. [2] przypuszczali, że szczepionka może mieć inną skuteczność w różnych strefach klimatycznych. Swoją hipotezę opierali na założeniach, że w chłodniejszym klimacie skłonność do wytwarzania naturalnej odporności na gruźlicę jest słabsza, wyższe temperatury mogą osłabiać działanie BCG, a bezpośrednie działanie promieni słonecznych zabija część bakterii niezbędnych do prawidłowego działania szczepionki. Z braku lepszych predyktorów (np. danych o warunkach przechowywania szczepionki w każdym z badań), autorzy oparli się na odległości od równika, która miała być surogatem warunków klimatycznych. Odkryto, że spośród siedmiu uwzględnionych w analizie zmiennych, odległość miejsca badania od równika i ocena jakości badania charakteryzują się najsilniejszym związkiem ze skutecznością BCG. Ze względu na charakter post hoc tej analizy uzyskane wyniki nie są definitywne, mogą natomiast sugerować kierunek dodatkowych badań. W metaregresji, podobnie jak w metaanalizie, istnieją dwa powszechnie stosowane modele statystyczne. Model z efektem stałym zakłada jeden wspólny efekt dla każdego zestawu wartości predyktorów, a różnice między obserwowanymi wynikami tłumaczy błędem losowym. Alternatywnie: model z efektem zmiennym zakłada, że efekt leczenia nie jest stały w badaniach o jednakowych wartościach zmiennych objaśniających. Prognoza metaregresji wskazuje wtedy położenie wartości oczekiwanej rozkładu mierzonego efektu przy określonym zestawie wartości predyktorów. 61

Ponieważ mierzony efekt wyrażono w postaci współczynnika ryzyka RR, przed utworzeniem modelu program logarytmuje wartości RR, podobnie jak w przypadku metaanalizy. Uzyskana w ten sposób zmienna log RR, gdzie log oznacza logarytm naturalny, będzie zmienną zależną w metaregresji. Wyniki metaregresji dla modelu z efektem zmiennym przedstawiono poniżej. Dla każdego uwzględnionego predyktora testowana jest istotność współczynnika regresji. Współczynnik regresji dla zmiennej Szerokość wynosi -0,0292 i jest istotnie różny od zera, o czym mówi wartość prawdopodobieństwa testowego p = 0,00001 dla testu Z opartego na rozkładzie normalnym. Do oceny jednoczesnego wpływu wielu zmiennych objaśniających wykorzystuje się test oparty na statystyce Q. W naszym przykładzie uwzględniliśmy tylko jedną zmienną, dlatego zarówno test Q, jak i test Z prowadzą do tych samych wyników. Wyniki sugerują powiązanie szerokości geograficznej ze skutecznością szczepionki BCG. Większa skuteczność szczepionki występowała w badaniach prowadzonych dalej od równika. Zależność między log RR a zmienną Szerokość możemy zapisać w postaci: logrr = 0,2595 0,0292 Szerokość. Prezentując wyniki metaregresji staramy się pokazać zależność między rozważaną zmienną a wyznaczonym efektem. W przeciwieństwie do wykresów leśnych, wykresy tworzone w metaregresji nie przedstawiają przedziałów ufności dla poszczególnych badań, ponieważ kierują one uwagę na badania o mniejszej precyzji. Na wykresie każdy punkt wskazuje parę (Szerokość, log RR) dla danego badania. Pole znacznika jest proporcjonalne do wagi badania w metaregresji. Ponieważ analiza oparta jest na modelu z efektem zmiennym, wagi uwzględniają zmienność wewnątrz badań powiększoną o wariancję pomiędzy badaniami T 2. Pozioma linia oznacza poziom odniesienia równy 0. Na wykresie zaznaczono również przebieg dopasowania liniowego. W przypadku badań przeprowadzanych bliżej równika oczekiwana wartość efektu jest bliższa zeru, co odpowiada współczynnikowi ryzyka RR = 1,00, oznaczającemu brak skuteczności szczepienia. Z kolei dla największych rozpatrywanych tu szerokości oczekiwana wartość log RR wynosi około -1,50, co daje RR około 0,20 i 80% zmniejszenie ryzyka gruźlicy. Badając część zmienności niewyjaśnionej przez model opieramy się na odpowiedniku współczynnika determinacji R 2 dla zwykłej regresji. W modelu z efektem zmiennym zakładamy, że łączna wariancja pochodzi ze zmienności wewnątrz badań i zmienności pomiędzy badaniami. Predyktory określane na poziomie badania wyjaśniają jedynie część zmienności między badaniami. Z tego względu odpowiednik współczynnika determinacji 62

` w metaregresji bazuje jedynie na wartościach T 2. Wariancja wartości niewyjaśniona w modelu wynosi 0,063. Badając niejednorodność badań, oszacowaliśmy wariancję rzeczywistych efektów T 2 = 0,309. Stanowi ona 92% obserwowanej zmienności (I 2 = 92,12). Obliczony w metaregresji współczynnik determinacji R 2 wynosi 0,7950, co oznacza, że spośród 92% obserwowanej zmienności model wyjaśnił około 80%. Wśród pozostałych czynników rozważanych jako zmienne objaśniające uwzględniono m.in. sposób przydzielenia pacjentów do grup oraz średni wiek szczepionych. Żadna z nich nie poprawiła jakości modelu. Metaregresja jest często używana do badania relacji między efektami leczenia a zmiennymi zawierającymi dane zagregowane, jak np. średni wiek w badaniu. Dane zagregowane mogą być użyteczne do oceny zmienności w ramach czynników na poziomie badania. Do interpretacji takich analiz należy jednak podchodzić z dużą ostrożnością, ponieważ średni wiek wewnątrz badania nie oddaje prawdziwego wieku poszczególnych pacjentów. Uzyskany w ten sposób wynik może być obarczony tzw. błędem agregacji (błędem ekologicznym). Podsumowanie Wyniki metaanalizy wykonanej przez Colditza i wsp. [4] i metaregresji przeprowadzonej przez Berkeya i wsp. [2] rzuciły nowe światło na ocenę skuteczności szczepienia BCG w profilaktyce gruźlicy. Analiza nie skupiła się wyłącznie na uzyskanym efekcie łącznym. Obserwując stosunkowo dużą wariancję wyników badań, wykorzystano narzędzia pozwalające ocenić tę zmienność i podjąć próbę jej wyjaśnienia. W przedstawionych powyżej rozdziałach zobaczyliśmy m.in. przykłady wykonania metaanalizy, analizy w grupach i metaregresji w module Metaanaliza programu STATISTICA Zestaw Medyczny. 63

Literatura 1. Baker W.L., White C.M., Cappelleri J.C. i wsp. (2009), Understanding heterogeneity in meta-analysis: the role of meta-regression, The International Journal of Clinical Practice, 63, 10, 1426-1434. 2. Berkey C.S., Hoaglin D.C., Mosteller F., Colditz G.A. (1995), A random-effects regression model for meta-analysis. Statistics in Medicine, 14, 395-411. 3. Borenstein M., Hedges L.V., Higgins J.P.T., Rothstein H.R. (2009), Introduction to Meta-Analysis, John Wiley and Sons Ltd. 4. Colditz G.A., Brewer T.F., Berkey C.S. i wsp. (1994), Efficacy of BCG vaccine in the prevention of tuberculosis. Meta-analysis of the published literature. Journal of the American Medical Association, 271, 698-702. 5. Gajewski P., Jaeshke R., Brożek J. (2008), Podstawy EBM czyli medycyny opartej na danych naukowych dla lekarzy i studentów, Medycyna Praktyczna, Kraków. 6. Hartung J., Knapp G., Sinha B.K. (2008), Statistical Meta-Analysis with Applications, John Wiley and Sons Inc. 64