Evidence based medicine - questions and answers. Basic notions - part II

Wielkość: px
Rozpocząć pokaz od strony:

Download "Evidence based medicine - questions and answers. Basic notions - part II"

Transkrypt

1 324 GERIATRIA 2011; 5: Akademia Medycyny GERIATRIA OPARTA NA FAKTACH/EVIDENCE-BASED GERIATRICS Otrzymano/Submitted: Zaakceptowano/Accepted: Geriatria oparta na faktach - pytania i odpowiedzi. Podstawowe pojęcia - część II Evidence based medicine - questions and answers. Basic notions - part II Marcin Barylski 1, Małgorzata Górska-Ciebiada 2, Maciej Ciebiada 3 1 Klinika Chorób Wewnętrznych i Rehabilitacji Kardiologicznej, Uniwersytet Medyczny w Łodzi 2 Klinika Chorób Wewnętrznych i Diabetologii, Uniwersytet Medyczny w Łodzi 3 Klinika Pneumonologii i Alergologii, Uniwersytet Medyczny w Łodzi Jak oszacować efekt terapii? Biorąc pod uwagę liczbę danych dla danej terapii, wyniki oraz jakość badań, można określić wiarygodność i siłę rekomendacji do stosowania danej terapii. Zalecenie poziomu dowodu B i C nie sugeruje, że jest ono słabe. Wiele ważnych zagadnień klinicznych nie kwalifikuje się do badań o najwyższym stopniu istotności klinicznej, na przykład ze względów etycznych. Nawet, jeśli nie można zastosować randomizacji, badania jej pozbawione mogą być bardzo wyraźnym potwierdzeniem, że poszczególny test terapia są przydatne i skuteczne. Przykład: Analiza taka została schematycznie opisana w standardach według Europejskiego Towarzystwa Kardiologicznego (tabela 1) [1]. Co to jest metaanaliza? Metaanaliza jest techniką statystyczną polegającą na łączeniu wyników z niezależnych badań o podobnej tematyce. Innymi słowy, jest to zbiorcza analiza ilościowa wyników różnych badań dotyczących tego samego problemu klinicznego. Zazwyczaj metaanaliza stanowi przegląd prac dotyczących danego zagadnienia klinicznego, opatrzonego łączną analizą statystyczną wyników uzyskanych we wcześniejszych badaniach. W ten sposób dokonuje obiektywnego podsumowania istniejących dowodów badań. Metaanaliza często jest wykorzystywana do wyprowadzenia wniosków w zakresie zagadnienia, w przypadku którego istnieją sprzeczne wyniki wcześniej przeprowadzonych badań, bądź były to badania małe, które nie uzyskały istotności statystycznej. Metaanaliza oszacowuje każde uwzględnione badanie pod względem jakości jego protokołu i wykonania. Stosowanym zazwyczaj w metaanalizie głównym miernikiem efektów jest iloraz szans (OR, odds ratio). Pomimo, że metaanaliza jest uważana za swego rodzaju niezależną pracę badawczą, należy pamiętać, że nie ma ona takiej wartości jak pierwotne badania w celu sprawdzenia danej hipotezy. Istnieje szereg zastrzeżeń odnośnie metaanaliz, m.in., że nie stanowią odpowiedzi na postawione przed rozpoczęciem badania pytania kliniczne, tylko są analizą po fakcie (post hoc); włączane do metaanalizy badania na ogół różnią się kryteriami włączenia oraz charakterystyką badanej grupy pacjentów. Przykład: Rycina 1. Czym jest przedłużona obserwacja badania? W niektórych badaniach, nawet pomimo zaobserwowania korzystnego wpływu zastosowanej terapii, często prowadzi się dalszą obserwację pacjentów, którzy byli włączeni do badania. Pozwala to sprawdzić, czy korzystny efekt utrzymuje się oraz czy nie występują inne, nieoczekiwane, korzystne bądź niekorzystne, działania leku. Należy jednak pamiętać, że przedłużona obserwacja jest analizą po fakcie i naznaczona jest mniejszą siłą jako dowód naukowy, niż badanie zaprojektowane jako wieloletnia obserwacja. Przykład badania: Po zakończeniu badania 4S (Scandinavian 324

2 Tabela 1. Charakterystyka klas zaleceń i poziomów dowodów w standardach postępowania [1] Table 1. Characteristic of classification of recommendations and levels of evidence in standards of procedure [1] Klasa I Klasa IIa Klasa IIb Klasa III Korzyści >>> ryzyko Korzyści >> ryzyko Korzyści ryzyko Ryzyko korzyści Poziom A Skuteczność oceniona w kilku populacjach (3-5); ogólna konsekwencja kierunku i znaczenia efektu Poziom B Skuteczność oceniona w ograniczonej populacji (2-3) Poziom C Skuteczność oceniona w znacznie ograniczonej populacji (1-2) Postępowanie/ leczenie powinno być wprowadzone/ udzielone leczenie jest przydatne/skuteczne - Wystarczające dowody z randomizowanych badań wieloośrodkowych metaanaliz leczenie jest przydatne/skuteczne - Ograniczone dowody z randomizowanych badań jednoośrodkowych badań nierandomizowanych leczenie jest pożyteczne/skuteczne - Tylko opinie ekspertów, przypadki standardy opieki Potrzebne są dodatkowe badania skupione na objawach Uzasadnione jest wprowadzenie postępowania/ leczenia - Zalecenia na korzyść leczenia postępowania będącego przydatnym/skutecznym - Niektóre ścierające się dowody z randomizowanych badań wieloośrodkowych metaanaliz - Zalecenia na korzyść leczenia postępowania będącego przydatnym/skutecznym - Niektóre ścierające się dowody z randomizowanych badań jednoośrodkowych badań nierandomizowanych - Zalecenia na korzyść leczenia postępowania będącego pożytecznym/skutecznym - Tylko rozbieżne opinie ekspertów, przypadki standardy opieki Potrzebne są dodatkowe badania wyraźnych objawów; pomocne mogą być dodatkowe zarejestrowane dane Postępowanie/ leczenie może być rozważone - Słabiej udowodnione zalecenia przydatności/skuteczności - Bardziej ścierające się dowody z randomizowanych badań wieloośrodkowych metaanaliz - Słabiej udowodnione zalecenia przydatności/skuteczności - Bardziej ścierające się dowody z randomizowanych badań jednoośrodkowych badań nierandomizowanych - Słabiej udowodnione zalecenia przydatności/skuteczności - Tylko rozbieżne opinie ekspertów, przypadki standardy opieki Nie są potrzebne dodatkowe badania Nie ma potrzeby wprowadzania/udzielania postępowania/leczenia pod warunkiem, że będzie ono pomocne i nie będzie szkodliwe leczenie nie jest przydatne/skuteczne i może być szkodliwe - Wystarczające dowody z randomizowanych badań wieloośrodkowych metaanaliz leczenie nie jest przydatne/skuteczne i może być szkodliwe - Ograniczone dowody z randomizowanych badań jednoośrodkowych badań nierandomizowanych leczenie nie jest przydatne/skuteczne i może być szkodliwe - Tylko opinie ekspertów, przypadki standardy opieki Simvastatin Survival Study) pacjentów obserwowano pod kątem występowania zdarzeń sercowo-naczyniowych oraz chorób nowotworowych przez okres 10 lat. Mimo, że po zakończeniu badania większość pacjentów z grupy placebo rozpoczęło terapię statyną, to jednak nie uzyskano wyrównania rokowania pomiędzy grupami. W grupie pacjentów otrzymujących simwastatynę przez okres tygodni, w ciągu 10 lat zaobserwowano istotne statystycznie: 15-procentową redukcję całkowitej śmiertelności, 17-procentową redukcję śmiertelności z przyczyn sercowo-naczyniowych oraz 24-procentową redukcję śmiertelności z przyczyn wieńcowych. Nie wykazano różnic pomiędzy grupami co do występowania nowotworów oraz śmiertelności z ich powodu. Bezpieczeństwo stosowania simwastatyny dodatkowo potwierdza fakt, że nie tylko nie wykazano istotnych statystycznie różnic w krzywych występowania nowotworów, ale nawet zauważalny był pewien trend w kierunku korzyści simwastatyny w działaniu prewencyjnym [3]. 325

3 Akronimy badań włączonych do metaanalizy Liczba pacjentów biorących udział w badaniu Iloraz szans (OR) i 95% przedział ufności (CI) Leczenie Osiągnięte LDL (mg/dl) Intensywne TNT (10 001) 0.74 ( ) Atorwastatyna A to Z (4497) 0.72 ( ) Simwastatyna PROVE-IT (4162) 0.54 ( ) Atorwastatyna IDEAL (8888) 0.80 ( ) Atorwastatyna Umiarkowane Atorwastatyna Simwastatyna Prawastatyna Simwastatyna Całość (95% CI) 0.73 ( ), p< Intensywna terapia Umiarkowana terapia statyną lepsza statyną lepsza Wynik OR dla przykładowego badania, w którym wykazano skuteczność interwencji terapeutycznej Łączny wynik OR dla metaanalizy Rycina 1. Metaanaliza wpływu intensywnego leczenia statynami na ryzyko hospitalizacji z powodu niewydolności serca [2] Figure 1. Metaanalysis of influence of intensive statin therapy on the risk of hospitalization for heart failure [2] Czym jest analiza podgrup w badaniu klinicznym? Analizę podgrup przeprowadza się zwykle po zakończeniu badania. Pozwala ona sprawdzić, czy lek nie wywiera silniejszego skutku w zdefiniowanej podgrupie chorych. Za podgrupę uważa się grupę chorych charakteryzujących się wspólną podstawową cechą (np. kobiety, pacjenci starsi, chorzy z niewydolnością nerek, itp.). Należy jednak pamiętać, że analiza podgrup jest analizą po fakcie i charakteryzuje się mniejszą siłą jako dowód naukowy niż badanie pierwotnie zaprojektowane w celu przebadania określonej grupy chorych. Co więcej, przeprowadzanie analizy podgrup w sytuacji, gdy nie uzyskano istotności statystycznej dla pierwotnych punktów końcowych w całej badanej populacji, może prowadzić do błędnych wniosków. Istnieje jednak możliwość analizy podgrup zakładana jeszcze przed wynikami badania (tzw. pre- -specified sub-groups analysis). Taka analiza podgrup nie jest analizą typu post hoc. Przykład badania: Duża liczba badanych w badaniu HPS (Heart Protection Study) umożliwiła ocenę efektów stosowania simwastatyny u kobiet, u osób > 75 r.ż., u chorych na cukrzycę bez jawnej klinicznie choroby sercowo-naczyniowej i u chorych z chorobą naczyń obwodowych. Badanie HPS udowodniło skuteczność simwastatyny w zapobieganiu zdarzeniom oraz zgonom z przyczyn sercowo-naczyniowych niezależnie od wieku i płci badanych osób, a przede wszystkim niezależnie od wyjściowych wartości cholesterolu LDL. Szczególną korzyść w postaci redukcji zdarzeń sercowo-naczyniowych w wyniku terapii simwastatyną osiągnięto w grupie pacjentów z cukrzycą, którzy stanowili ¼ populacji badania, z czego połowę stanowili pacjenci tylko z cukrzycą, bez rozpoznanej choroby niedokrwiennej serca czy innej choroby naczyniowej. Co więcej, w grupie pacjentów z cukrzycą otrzymujących simwastatynę obserwowano opóźnione pogorszenie funkcji nerek w porównaniu z placebo [4]. Na rycinie 2 przedstawiono wyniki analizy pod- 326

4 Placebo Fenofibrat HR (95% CI) p ChSN Tak 25,1% 25,5% Nie 10,8% 8,9% Płeć Kobiety 9,5% 7,7% Mężczyźni 16,6% 15,4% Wiek (lata) < 65 11,6% 9,2% 65 17,4% 17,4% 0,85 0,004 0,04 0,2 0,003 0,9 0,6 0,8 Fenofibrat lepszy 1 1,2 1,4 Placebo lepsze Rycina 2. Badanie FIELD - analiza podgrup pod względem redukcji złożonego punktu końcowego [5] Figure 2. FIELD study - sub-groups analysis according to reduction of composite endpoint [5] grup pacjentów w badaniu FIELD (Fenofibrate and Intervention and Event Lowering in Diabetes) pod względem redukcji złożonego punktu końcowego (zgon z przyczyn sercowo-naczyniowych, zawał serca, udar mózgu, potrzeba rewaskularyzacji), odpowiednio w grupie pacjentów z i bez choroby układu sercowo-naczyniowego, w grupie kobiet i mężczyzn oraz u pacjentów w wieku < 65 i 65 lat, otrzymujących fenofibrat [5]. Czym jest badanie typu non-inferiority? Badanie typu non-inferiority ( testowany nie jest gorszy ) to próba kliniczna, której hipotezę roboczą stanowi przypuszczenie, że lek testowany nie jest gorszy od dotychczasowego, standardowego. Hipoteza robocza mówi, że testowany lek jest równie skuteczny. Takie badania są przeprowadzane coraz częściej, gdyż ze względów etycznych nie zawsze można zastosować placebo. Przykład badania: Badanie ONTARGET (The Ongoing Telmisartan Alone and in Combination with Ramipril Global Endpoint Trial) miało odpowiedzieć na pytanie: czy u chorych obciążonych dużym ryzykiem incydentów sercowo-naczyniowych, bez niewydolności serca, stosowanie telmisartanu jest nie mniej skuteczne niż stosowanie ramiprilu w zapobieganiu incydentom sercowo-naczyniowym oraz czy stosowanie obu tych leków jest korzystniejsze w porównaniu z samym ramiprilem? Badaniem objęto łącznie chorych z wysokim ryzykiem sercowo-naczyniowym obejmującym występowanie którejkolwiek z chorób: - choroba naczyń wieńcowych, - choroba tętnic obwodowych, - przebyty udar mózgu przejściowy atak niedokrwienny (TIA), - cukrzyca z powikłaniami narządowymi. Pacjentów randomizowano do leczenia metodą podwójnie ślepej próby, przy czym 8576 osób przydzielono do grupy otrzymującej ramipril w dawce 10 mg/dobę, 8542 do grupy otrzymującej telmisartan w dawce 80 mg/dobę, a 8502 przydzielono do grupy otrzymującej oba leki (leczenie skojarzone). Po 56 miesiącach obserwacji autorzy wyciągnęli wniosek, że antagonista receptora angiotensyny II - telmisartan jest tak samo dobry (non inferior) jak inhibitor konwertazy angiotensyny - ramipril u pacjentów wysokiego ryzyka sercowo-naczyniowego. Jednakże kombinacja tych dwóch leków nie przewyższa skutecznością leków stosowanych pojedynczo, dając więcej objawów ubocznych [6]. Co to jest analiza kosztowo-efektywna? Analiza kosztowo-efektywna (CEA, cost-effectiveness analysis) porównuje koszty i wyniki leczenia, żeby oszacować, czy warto się go podejmować z ekonomicznego punktu widzenia. Wynikiem jest porównanie kosztów interwencji z uzyskanymi (wyprodukowanymi) efektami zdrowotnymi (np. uratowanie roku życia). W analizie kosztowo-efektywnej wyróżnia się koszty bezpośrednie, pośrednie - towarzyszące interwencjom, 327

5 i koszty nienamacalne, które często są konsekwencją interwencji, a powinny być wliczone w profil kosztowy: koszty bezpośrednie: medyczne (leki, czas pracy personelu, sprzęt, transport), koszty uboczne, koszty pośrednie: straty produkcji, inne wykorzystanie czasu, nienamacalne: ból, cierpienie, efekty przeciwne (niekorzystne). Współczynniki efektywności kosztowej powinny odpowiadać stosownemu budżetowi, by zadecydować o najbardziej kosztowo-efektywnej strategii. Jednak efektywność kosztowa jest tylko jednym z kryteriów, które powinny być brane pod uwagę w podejmowaniu decyzji. Sprawy słuszności, potrzeb i priorytetów mają zazwyczaj większe znaczenie w procesach decyzyjnych. Przykład: W badaniu 4S leczenie simwastatyną w dawce mg/dobę w grupie pacjentów ze stężeniem cholesterolu całkowitego w granicach mg/dl, w porównaniu z placebo, związane było z 32-procentową redukcją kosztów hospitalizacji [7]. Jak przedstawiać wyniki badań? Głównymi wskaźnikami wyników badań klinicznych są: względna redukcja ryzyka (RRR, Relative Risk Reduction), liczba chorych, których trzeba leczyć (NNT, Number Needed to Treat), 95-procentowy przedział ufności (CI, Confidence Interval). Poniższy przykład pokazuje, że pomimo tych samych wyników badania różna ich prezentacja może powodować różne interpretacje. Tylko prawidłowe zrozumienie definicji tych wskaźników pozwala odpowiednio szacować wyniki. Przykład: W pewnym mieście 100 radnym przedstawiono do wyboru 3 programy zdrowotne, mające chronić obywateli przed epidemią grypy: 1. Zastosowana szczepionka zmniejsza względne ryzyko zapadalności na grypę o 50%, 2. Szczepionka działa tak, że trzeba zaszczepić l00 obywateli, aby uniknąć jednego przypadku grypy, 3. Zastosowana szczepionka zmniejsza bezwzględne ryzyko zapadalności na grypę o 1%. Po takiej prezentacji możliwych programów, odpowiednio tylu poniższych radnych było skłonnych do rozważenia finansowania wybranego programu: radnych 2. 8 radnych 3. 2 radnych Interpretacja zaprezentowanych programów: 1. Zastosowana szczepionka zmniejsza względne ryzyko zapadalności na grypę o 50%, czyli względna redukcja ryzyka (RRR) wynosi 50%. 2. Szczepionka działa tak, że trzeba zaszczepić 100 obywateli, aby uniknąć jednego przypadku grypy, czyli liczba chorych, których trzeba leczyć (NNT) wynosi Zastosowana szczepionka zmniejsza bezwzględne ryzyko zapadalności na grypę o 1%, czyli bezwzględna redukcja ryzyka (ARR, Absolute Risk Reduction) wynosi 1%. Mimo pozornie różnych interpretacji, zaprezentowane wyniki pochodzą jednak z tego samego badania. W grupie osób, zostało zaszczepionych (grupa A), a druga połowa otrzymała placebo (grupa B). W grupie A zachorowało 100 osób (1-procentowa zapadalność na grypę), a w grupie B zachorowało 200 osób (2-procentowa zapadalność na grypę). 1. RRR = 100/200 = 50% 2. NNT = proporcja: 100 nie zachoruje , czyli 1 nie zachoruje - X X = ARR = 2% - 1% = 1% bezwzględna redukcja ryzyka Jak interpretować wartość p? P jest to prawdopodobieństwo, z jakim zaobserwowana różnica pomiędzy badanymi grupami może być dziełem przypadku. Należy pamiętać, że wartość p oznacza znamienność statystyczną, ale nie kliniczną. Projektując badanie, stawiamy hipotezę badawczą zakładającą na przykład, że dana terapia jest skuteczniejsza od placebo, a następnie hipotezę zerową, która zakłada brak różnicy pomiędzy efektem placebo a lekiem. Przyjmujemy, że hipoteza zerowa (H 0 ) jest prawdziwa i przeprowadzamy próbę, którą testujemy w randomizowanej i kontrolowanej, najczęściej podwójnie zaślepionej próbie klinicznej. Gdy wynik jest mało bardzo mało prawdopodobny, prawdopodobna jest hipoteza alternatywna, czyli nasza pierwsza hipoteza badawcza. 328

6 Śmiertelność całkowita Nagła śmierć sercowa Prawdopodobieństwo Prawdopodobieństwo ( ) p= ( ) p=0.027 Grupa kontrolna PUFA omega Dni ( ) p= ( ) p= Grupa kontrolna PUFA omega Dni Rycina 3. Badanie GISSI-Prevenzione - redukcja śmiertelności całkowitej i nagłej śmierci sercowej u chorych przyjmujących PUFA omega-3 [8] Figure 3. GISSI-Prevenzione trial - reduction of total mortality and sudden cardiac death in subjects assigned to supplements of n-3 PUFAs [8] Interpretacja wyniku p: p > 0,05 - wynik nieistotny statystycznie, p = NS - wynik nieistotny statystycznie, p < 0,05 - wynik istotny statystycznie, p < 0,05; p = 0,01; p < 0, im mniejsze p, tym większa istotność statystyczna. Przykład: Analogicznie do założenia, że nie ma różnicy między lekiem a placebo, stawiamy hipotezę, że nie ma różnicy między orłem a reszką. Moneta wyrzucona 10 razy do góry powinna 5 razy dać reszkę, a 5 razy orła. 100 razy podrzucona - 50 reszek i 50 orłów (p = 0,5) i nie ma pomiędzy nimi różnicy. Jeżeli na 100 rzutów wyrzucilibyśmy 80 orłów (p = 0,2), nadal nie byłoby różnicy. Ale jeżeli na 100 rzutów otrzymamy 96 orłów (p = 0,04) nawet 99 (p = 0,01), różnica będzie istotna. Jeśli hipoteza zerowa jest prawdziwa (tzn. lek = placebo moneta jest idealnie wyważona), to prawdopodobieństwo (p) wyrzucenia orła 99 razy na 100 rzutów wynosi 1% (p = 0,01). Jest to tak niewielkie p, że pewnie ktoś nas oszukał i moneta nie jest prawidłowa. Odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną - moneta nie jest równo wyważona. Co to jest krzywa przeżycia? Krzywa przeżycia jest wykresem prawdopodobieństwa przeżycia przeżycia bez wystąpienia zdarzenia (np. zawału serca, zdarzenia składającego się z kilku punktów końcowych) w funkcji czasu obserwacji. Wykres tej funkcji jest krzywą schodkową nazywaną krzywą Kaplana-Meiera. Krzywe Kaplana-Meiera mogą też przedstawiać funkcję odwrotną, a mianowicie prawdopodobieństwo zgonu wystąpienia jakiegoś zdarzenia w funkcji czasu obserwacji. Przykład badania: Największym badaniem oceniającym skuteczność wielonienasyconych kwasów (PUFA, polyunsaturated fatty acids) omega-3 w prewencji wtórnej było badanie GISSI-Prevenzione (Gruppo Italiano per lo Studio della Sopravvivenza nell Infarto miocardico) [8]. W grupie chorych przyjmujących PUFA omega-3 stwierdzono istotnie mniejszą śmiertelność całkowitą już po 3 miesiącach leczenia: 1,1% v. 1,6% (RR: 0,59; 95% CI: 0,36-0,97; p = 0,037) i tendencja ta utrzymała się do końca badania: 8,4% v. 9,8% (RR: 0,79; 95% CI: 0,66-0,93; p = 0,006) - redukcja o 21% (rycina 3) [8]. Po 4 miesiącach leczenia zaobserwowano istotnie rzadsze występowanie nagłej śmierci sercowej: 0,5% w grupie osób przyjmujących kwasy omega-3 i 0,7% w grupie bez suplementacji (RR: 0,47; 95% CI: 0,22-0,99; p = 0,048), by w 42. miesiącu badania wynieść odpowiednio: 2% vs 2,7% (RR: 0,55; 95% CI: 0,39-0,77; p = 0,0006) - redukcja o 45% (rycina 3) [8]. 329

7 Iloraz szans (OR, odds ratio) -im wyższa wartość, tym silniejszy wynik Przedział ufności (CI, confidence interval) im węższy tym silniejszy wynik jeżeli zakres przechodzi przez 1 -wynik jest nieistotny statystycznie Wynik istotny statystycznie na korzyść leku 1. Wynik istotny statystycznie na korzyść leku 2. Brak różnicy pomiędzy lekami Trend na korzyść leku 2., ale wynik nieistotny statystycznie Trend na korzyść leku 1., ale wynik nieistotny statystycznie lek 1. lepszy Rycina 4. Interpretacja wyników ilorazu szansy Figure 4. Interpretation of the odds ratio 1 lek 2. lepszy Co to jest iloraz szansy? Iloraz szansy (OR, odds ratio) określa stosunek szansy wystąpienia określonego zdarzenia w grupie, gdzie zastosowano badaną interwencję, do szansy wystąpienia tego zdarzenia w grupie kontrolnej. Szansa jest stosunkiem prawdopodobieństwa wystąpienia zdarzenia do niewystąpienia tego zdarzenia w danej grupie. Iloraz szansy jest głównym miernikiem określającym korzyści z terapii, stosowanym zazwyczaj w metaanalizie. Przykład: Dla większości praktycznych celów iloraz szansy jest interpretowany, jak gdyby był względnym ryzykiem. Dlatego iloraz szansy równy 2 sugeruje, że końcowy wynik zdarzy się około dwukrotnie częściej w grupie interwencji niż w grupie kontrolowanej. Iloraz szans równy 0,5 wskazuje na prawie 50-procentową redukcję w zdefiniowanym zdarzeniu grupy leczonej w porównaniu z grupą kontrolną. Przykłady interpretacji czy dana obserwacja jest istotna statystycznie, przedstawiono na rycinie 4. Czym jest względna redukcja ryzyka? Redukcja ryzyka (RR, risk reduction) to bezwzględna arytmetyczna różnica w redukcji ryzyka (wystąpienia niekorzystnego punktu końcowego) w grupie eksperymentalnej i kontrolnej badania. Względna redukcja ryzyka (RRR, relative risk reduction) to część redukcji ryzyka wystąpienia niekorzystnego punktu końcowego wśród uczestników badania eksperymentalnego i kontrolnego, uzyskana po zastosowaniu terapii. Jest to stosunek różnicy bezwględnej redukcji w grupie kontrolnej i grupie badanej Tabela 2. Względna redukcja ryzyka incydentów wieńcowych w wybranych badaniach Table 2. Relative risk reduction of coronary events in selected trials Stężenie LDL (mgl/dl) Incydenty wieńcowe % względnej redukcji ryzyka Badanie placebo (%) lek (%) 4S ,5 23,5 42 HPS ,6 9,4 27 VA-HIT ,4 21,

8 do ryzyka w grupie kontrolnej. W tabeli 2 przedstawiono względną redukcję ryzyka incydentów wieńcowych (zgon z przyczyn sercowo-naczyniowych zawał serca niezakończony zgonem) u pacjentów z cukrzycą. Co to jest NNT? Wskaźnik NNT (number needed to treat) to liczba chorych, których trzeba leczyć dla uniknięcia jednego powikłania (np. zawału, udaru, zgonu). Wartość ta jest odwrotnością różnicy bezwzględnego ryzyka (ARR, absolute risk reduction) wystąpienia powikłania pomiędzy grupą kontrolną a grupą otrzymującą lek. NNT staje się popularną miarą efektywności interwencji. Sposób wyliczania NNT: 1 NNT = liczba pacjentów poddanych badanemu leczeniu, u których wystąpiło zdarzenie całkowita liczba pacjentów poddanych badanemu leczeniu liczba pacjentów poddanych leczeniu kontrolnemu, u których wystąpiło zdarzenie całkowita liczba pacjentów poddanych leczeniu kontrolnemu NNT jest łatwiejsze w porównaniu niż opisy statystyczne. Wskaźnik ten jest właściwy dla leczenia i opisuje różnicę pomiędzy leczeniem a kontrolą w osiąganiu konkretnego wyniku klinicznego. Jest używany do charakteryzowania wyników, w których wskaźniki zdarzeń są osiągalne i dla leczenia, i dla kontroli. NNT ma zawsze wartość powyżej 1, gdyż nie wszyscy chorzy unikną powikłania pomimo leczenia. Przykład badania: W badaniu FIELD największy wpływ na ryzyko epizodów sercowo-naczyniowych zaobserwowano u pacjentów z aterogenną dyslipidemią (TG > 204 mg/dl, HDL-C < 40 mg/dl u mężczyzn oraz < 50 mg/dl u kobiet), gdzie redukcja ryzyka w grupie otrzymującej fenofibrat wyniosła 27% (HR: 0,73; 95% CI: 0,58-0,91; p = 0,005) co odpowiada konieczności leczenia 23 chorych przez 5 lat w celu zapobiegnięcia jednemu zdarzeniu sercowo-naczyniowemu (NNT = 23) [9]. Co to jest przedział ufności? Przedział ufności (CI, confidence interval) określa stopień precyzji danego wyniku. Przedział ufności określa, czy uzyskana redukcja ryzyka wystąpienia Przedział, w którym z 95-procentową pewnością leży prawdziwy wynik dla całej populacji różnica = 0 brak efektu -20% -10% 0 10% 20% gdybyśmy to samo badanie powtórzyli 100 razy to 95 razy wynik wypadłby w tym przedziale -20% -10% 0 10% 20% Rycina procentowy przedział ufności Figure percent confidence interval 331

9 zdarzenia ma znaczenie kliniczne (inne znaczenie niż fakt, że jest znamienna statystycznie) i w jakich granicach lokuje się prawdziwa różnica (rycina 5). Zwykle podaje się 95-procentowy przedział ufności, czyli przedział, w którym z 95-procentową pewnością znajduje się prawdziwa wartość danego parametru. Przedział ufności można przedstawić m.in. dla RRR, NNT, OR. Przedział ten dodatkowo informuje o wielkości, kierunku i zakresie zaobserwowanego efektu. Jak odczytywać cytowanie artykułu? W bazie MEDLINE gromadzone są streszczenia z wybranych recenzowanych czasopism naukowych. Dodatkowo część z tych czasopism ma przyznany tzw. współczynnik oddziaływania (IF, impact factor), który jest wskaźnikiem prestiżu i siły oddziaływania danego czasopisma naukowego. IF jest ustalane przez Instytut Filadelfijski na podstawie prowadzonego przez ten instytut indeksu cytowań publikacji naukowych. Najogólniej rzecz ujmując, im wyższy IF, tym czasopismo jest bardziej wiarygodne, a publikacja bardziej prestiżowa i ma większe oddziaływanie na obecny stan wiedzy. Przykłady wartości IF z 2010 roku dla wybranych czasopism: New England Journal of Medicine (NEJM) - 53,48 Lancet - 33,63 Journal of the American Medical Association (JAMA) - 30,01 Circulation - 14,42 Journal of the American College of Cardiology (JACC) - 14,29 European Heart Journal (EHJ) - 10,04 American Heart Journal (AHJ) - 5,05 Heart - 4,70 Każda pozycja w bazie MEDLINE zawiera listę autorów artykułu, tytuł, źródło pochodzenia w postaci tytułu i numeru czasopisma. W pełnym cytowaniu artykułu znajdują się również: rok wydania, data, numer tomu i stron w czasopiśmie. Według takiego pełnego cytowania można dotrzeć do pełnego tekstu danego artykułu. Czy są inne możliwości niż EBM? Decyzje kliniczne powinny być podejmowane na podstawie dowodów naukowych. Co się dzieje jednak, kiedy nie dysponujemy wystarczającą liczbą dowodów do podjęcia decyzji? Profesor David Isaacs w swoim artykule, opublikowanym w British Medical Journal podaje 7 alternatyw dla EBM zaproponowanych przez jego współpracowników. Zaproponowane - z pewną dozą humoru - możliwości do wykorzystania w praktycznych sytuacjach, gdy brakuje wiedzy naukowej, przypominają, że medycyna jest nie tylko nauką, ale nadal pozostaje sztuką [10]. Siedem alternatyw dla EBM: 1. Medycyna oparta na doświadczeniu i zasługach (eminence based medicine) - im bardziej zasłużony lekarz, tym rzadziej zwraca uwagę na coś tak przyziemnego, jak dowody. Wiara w doświadczenie może być określona jako powtarzanie tych samych błędów przez lata z coraz większym przekonaniem o słuszności. 2. Medycyna oparta na głośności i zaciekłości (vehemence based medicine) - głośne wypowiadanie opinii jest skuteczną techniką przekonywania do swoich racji. 3. Medycyna oparta na elokwencji (eloquence based Przykład: autorzy pracy (zazwyczaj trzej pierwsi) i współpracownicy (gdy jest więcej autorów) tytuł artykułu Connolly SJ, Camm AJ, Halperin JL, et al.; PALLAS Investigators. Dronedarone in highrisk permanent atrial fibrillation. N Engl J Med 2011 Dec 15; 365(24): tytuł czasopisma (zazwyczaj skrót nazwy) rok wydania data wydania numer tom strony 332

10 medicine) - elegancja zewnętrzna i elokwencja słowna jest namiastką dowodów. 4. Medycyna oparta na zrządzeniu Opatrzności (providence based medicine) - jeżeli lekarz nie wie co robić dalej, składa błagalnie ręce do Wszechmocnego. 5. Medycyna oparta na niepewności (diffidence based medicine) - w sytuacji niepewności w odniesieniu do postępowania problem jest niezauważany i nie podejmuje się żadnego postępowania. 6. Medycyna oparta na strachu (nervousness based medicine) - z powodu strachu przed pozwaniem zlecana jest nadmierna ilość badań i leków. 7. Medycyna oparta na pewności siebie (confidence based medicine) - według brytyjskich autorów dotyczy głównie chirurgów. Adres do korespondencji: Marcin Barylski Klinika Chorób Wewnętrznych i Rehabilitacji Kardiologicznej Uniwersytet Medyczny w Łodzi Pl. Hallera 1; Łódź ( (+48 42) mbarylski3@wp.pl Piśmiennictwo clintrialresults.org/slides/ldlorhdl 3. Strandberg TE, Pyörälä K, Cook TJ, et al. Mortality and incidence of cancer during 10-year follow-up of the Scandinavian Simvastatin Survival Study (4S). Lancet 2004;364(9436): Collins R, Armitage J, Parish S, Sleigh P, Peto R; Heart Protection Study Collaborative Group. MRC/BHF Heart Protection Study of cholesterol-lowering with simvastatin in 5963 people with diabetes: a randomised placebo-controlled trial. Lancet 2003;361(9374): Keech A, Simes RJ, Barter P, et al.; FIELD study investigators. Effects of long-term fenofibrate therapy on cardiovascular events in 9795 people with type 2 diabetes mellitus (the FIELD study): randomised controlled trial. Lancet 2005;366(9500): The ONTARGET Investigators: Yusuf S, Teo KK, Pogue J, et al. Telmisartan, ramipril, or both in patients at high risk for vascular events. N Engl J Med 2008;358: Jönsson B, Cook JR, Pedersen TR. The cost-effectiveness of lipid lowering in patients with diabetes: results from the 4S trial. Diabet 1999;42(11): Marchioli R, Barzi F, Bomba E, et al. Early protection against sudden death by ω-3 polyunsaturated fatty acids after myocardial infarction: time-course analysis of the results of the Gruppo Italiano per lo Studio della Sopravvivenza nell Infarto Miocardico (GISSI)-Prevenzione. Circulation 2002,105: Scott R, O Brien R, Fulcher G, et al.; Fenofibrate Intervention and Event Lowering in Diabetes (FIELD) Study Investigators. Effects of fenofibrate treatment on cardiovascular disease risk in 9,795 individuals with type 2 diabetes and various components of the metabolic syndrome: the Fenofibrate Intervention and Event Lowering in Diabetes (FIELD) study. Diabetes Care 2009;32(3): Isaacs D, Fitzgerald D. Seven alternatives to evidence based medicine. BMJ 1999;319: