Projektowanie badań i interpretacja wyników okiem biostatystyka Warszawa, 15 marca 2016, Anna Marcisz
Agenda Część I Cel badań - hipotezy badawcze/statystyczne Wielkość próby potrzebna do badania Jak odczytywać wyniki badań Metody statystyczne w badaniach medycznych Część II Jakość danych a wyniki badań Kontrola jakości danych Błędy w trakcie badania a ich wpływ na wyniki epro (patient reported outcome) - zalety i wady 2
Cel badań - hipotezy badawcze/statystyczne Hipoteza przypuszczenie dotyczące pewnych prawidłowości, np. Lek A skutecznie leczy chorobę X Lek B jest skuteczniejszy od leku C w leczeniu choroby Y Hipotezy stawiane są na podstawie przesłanek teoretycznych lub wcześniejszych badań Hipoteza badawcza musi zostać zapisana językiem statystycznym 3
Hipoteza badawcza zapisana językiem statystycznym Lek A skutecznie leczy chorobę X Zastosowanie leku A zmniejsza/zwiększa wartości parametru Z w sposób istotny w porównaniu do placebo Hipoteza zerowa: Diff A Diff P Hipoteza alternatywna: Diff A > Diff P gdzie: Diff A spadek danego parametry podczas trwania obserwacji u pacjentów leczonych lekiem A Diff P spadek danego parametry podczas trwania obserwacji u pacjentów z grupy placebo 4
Hipoteza badawcza zapisana językiem statystycznym Lek B jest skuteczniejszy od leku C w leczeniu choroby Y Odsetek pacjentów, u których objawy choroby ustąpiły w ciągu 10 dni jest istotnie wyższy wśród pacjentów leczonych lekiem B w porównaniu do odsetka pacjentów leczonych lekiem C Hipoteza zerowa: PB PC Hipoteza alternatywna: PB>PC gdzie: PB odsetek pacjentów leczonych lekiem B, u których objawy choroby ustąpiły w ciągu 10 dni PC odsetek pacjentów leczonych lekiem C, u których objawy choroby ustąpiły w ciągu 10 dni 5
Wielkość próby potrzebna do badania Na wielkość próby wpływają: Aspekty techniczno-organizacyjne Koszty Czas Dostępność osób spełniających kryteria badania Wymogi statystyczne Wątroba J., Praktyczne aspekty szacowania liczebności próby w badaniach empirycznych, 2013, statsoft.pl/czytelnia.html 6
Wielkość próby potrzebna do badania wymogi statystyczne Wielkość próby obliczana jest dla konkretnej hipotezy badawczej Wielkość próby obliczana jest dla konkretnego testu statystycznego, który wybiera się na podstawie postawionej hipotezy. Aby obliczyć wielkość próby trzeba znać wielkość efektu. Skąd wziąć dane dla wielkości efektu : Wcześniejsze badania Badania pilotażowe na małej zbiorowości W przypadku braku powyższych: rozważenie kilku możliwości na podstawie przesłanek teoretycznych Do obliczenia wielkości próby trzeba przyjąć poziom istotności (α) oraz ustalić moc testu ( ) 7
Wpływ utraty pacjentów na wynik badania Każde badanie obarczone jest ryzykiem utraty pacjentów, dlatego uzyskaną z obliczeń wielkość próby zwiększa się o 20%. 8
Moc testu Dwa rodzaje błędów: Odrzucenie hipotezy zerowej, która jest prawdziwa (błąd I rodzaju) Nieodrzucenie hipotezy zerowej, która jest fałszywa (błąd II rodzaju) Moc - Prawdopodobieństwo odrzucenia hipotezy zerowej, gdy w rzeczywistości jest ona fałszywa, czyli 1 β. Decyzja Hipoteza zerowa Prawdziwa Fałszywa Odrzucić Nie odrzucić Błąd I rodzaju α Decyzja trafna Decyzja trafna Błąd II rodzaju β Wątroba J., Praktyczne aspekty szacowania liczebności próby w badaniach empirycznych, 2013, statsoft.pl/czytelnia.html 9
Wielkość próby potrzebna do badania przykład Jaka liczebność próby jest potrzebna do wykazania różnic dla trzech wariantów wielkości różnicy: 10 mm Hg 20 mm Hg 30 mm Hg? Założenia: Poziom istotności: 0,05 Moc testu: 0,80 SD dla skurczowego ciśnienia krwi w badanej grupie osób: 30 mm Hg Test statystyczny: test t-studenta dla prób niezależnych 10
Wielkość próby potrzebna do badania przykład Dla wykazania istotnej statystycznie różnicy przy przyjętych założeniach potrzeba następującej liczby osób w każdej z badanych grup: Zakładana różnica Liczebność próby 10 mm Hg 143 20 mm Hg 37 30 mm Hg 17 Wątroba J., Praktyczne aspekty szacowania liczebności próby w badaniach empirycznych, 2013, statsoft.pl/czytelnia.html 11
Wielkość próby potrzebna do badania metody Metoda standardowa Metoda sekwencyjna wielkość próby nie jest z góry zadana, ale podczas zbierania danych przeprowadzana jest analiza i dalsze zbieranie danych uzależnione jest od wyników tej analizy. Metoda adaptacyjna obliczana jest wielkość próby; podczas badania obserwuje się, że np. pewna podgrupa uzyskuje lepsze wyniki od pozostałych badanych, w takiej sytuacji można zdecydować, aby dobrać pacjentów z tej podgrupy. 12
Jak odczytywać wyniki badań Najczęstsze sposoby przedstawiania wyników: 36, 8 o C (0, 5) 36, 8 o C ± 0, 5 36, 8 o C (36,7; 36,9) średnia (SD) średnia ± SD średnia (95% CI) 13
Jak odczytywać wyniki badań Miary efektu: Średnia Proporcja Ryzyko względne RR Miary rozproszenia: Rozstęp (max-min) Odchylenie standardowe (SD) Wariancja Iloraz szans OR NNT 14
Jak odczytywać wyniki badań przedział ufności (CI) przedział ufności próba populacja http://pballew.blogspot.com/2011/03/100-confidence-interval.html 15
Jak odczytywać wyniki badań przedział ufności (CI) 9 8 7 6 5 4 3 2 1 0 Zmiana przedziału ufności w zależności od liczebności próby 50 100 150 200 250 300 350 400 450 500 550 Górna granica przedziału ufności Średnia Dolna granica przedziału ufności 16
Jak odczytywać wyniki badań 55 54 53 52 51 50 49 48 47 46 45 44 43 42 Wyniki głosowania (%) Partia A Partia B 17
Jak odczytywać wyniki badań 55 54 53 52 51 50 49 48 47 46 45 44 43 42 Wyniki głosowania (%) Partia A Partia B 18
Jak odczytywać wyniki badań 55 54 53 52 51 50 49 48 47 46 45 44 43 42 Wyniki głosowania (%) Partia A Partia B 19
Jak odczytywać wyniki badań 55 54 53 52 51 50 49 48 47 46 45 44 43 42 Wyniki głosowania (%) Partia A Partia B 20
Wynik testu statystycznego wartość p (p-value) Test jednostronny Test dwustronny Grafika: https://cnx.org/contents/epkvs0wt@8/additional-information-and-ful 21
Wynik testu statystycznego wartość p (p-value) p = 0,8712 α = 0,05 p > α nie ma podstaw do odrzucenia hipotezy zerowej α Grafika: https://cnx.org/contents/epkvs0wt@8/additional-information-and-ful 22
Wynik testu statystycznego wartość p (p-value) p = 0,1752 α = 0,05 1 2 α 1 2 α p > α nie ma podstaw do odrzucenia hipotezy zerowej
Wynik testu statystycznego wartość p (p-value) p = 0,0312 α = 0,05 α p < α odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną Grafika: https://cnx.org/contents/epkvs0wt@8/additional-information-and-ful 24
Wynik testu statystycznego wartość p (p-value) p = 0,0076 α = 0,05 1 2 α 1 2 α p < α odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną
Wynik testu statystycznego wartość p (p-value) α = 0,05 p NS (not significant) p = 0,1263 p = 0,8971
Istotność statystyczna a istotność medyczna W badaniu otrzymano następującą różnicę w obniżeniu ciśnienia skurczowego krwi pomiędzy dwoma grupami pacjentów leczonymi różnymi lekami hipotensyjnymi: 1 mm Hg. Wykazano, że różnica jest istotna statystycznie, ale ta różnica nie jest istotna klinicznie. Podobnie, brak istotności statystycznej nie wyklucza istotności klinicznej.
Metody statystyczne w badaniach medycznych Metody statystyczne dobieramy w zależności od: Typu zmiennych (jakościowe, ilościowe, porządkowe, itd.) Rozkładów zmiennych Liczebności próby Spełnionych założeń testów statystycznych
Metody statystyczne w badaniach medycznych Najpopularniejsze metody statystyczne: Test t-studenta (test parametryczny) Test Manna-Whitneya-Wilcoxona (test nieparametryczny) Test Chi-kwadrat Pearsona Test Shapiro-Wilka ANOVA Analiza regresji liniowej/logistycznej Uogólnione modele liniowe (GLM)
Źródła wiedzy statystycznej w internecie Przydatne strony: Podręcznik statystyki StatSoft: http://www.statsoft.pl/textbook/stathome.html Podstawowe informacje: http://www.naukowiec.org/wiedza/statystyka.html Baza wiedzy PQStat Software: http://manuals.pqstat.pl/statpqpl Artykuły z przykładami: http://www.mp.pl/artykuly/naukipokrewne/statystyka.html Zaawansowane: publikacje naukowe, materiały akademickie (strony uczelniane)
Jakość danych i ich kontrola z punktu widzenia statystyki Warszawa, 15 marca 2016, Anna Marcisz
Jakość danych a wyniki badań Wiarygodność wyników zależy od jakości danych.
Jakość danych a wyniki badań Elementy podnoszące jakość danych i wiarygodność wyników: Randomizacja i zaślepienie Odpowiednia liczebność próby Elektroniczne karty obserwacji klinicznej (ecrf) Kontrola jakości danych
Kontrola jakości danych Wybrane aspekty kontroli jakości danych: Weryfikacja danych źródłowych Monitorowanie oparte o ryzyko Zdalne monitorowanie jakości danych
Błędy w trakcie badania a ich wpływ na wyniki Rodzaje błędów: Błędy przypadkowe błędy wynikające z nieuwagi, błędy przy przepisywaniu wartości liczbowych, przypadkowe błędne zaznaczenie odpowiedzi w formularzu itp. Błędy systematyczne błędy powstające w wyniku świadomego podawania nieprawidłowych danych, np. celowe zawyżanie lub zaniżanie wyników
Błędy w trakcie badania a ich wpływ na wyniki Błędy przypadkowe mają znacznie mniejszy wpływ na wynik badania niż błędy systematyczne Błędy systematyczne są groźniejsze i mogą wpływać na ostateczne wyniki badań Znaczna część błędów wyłapywana jest podczas kontroli jakości danych Przy odpowiednio dużej liczebności próby pojedyncze błędy nie wpływają w znaczący sposób na wynik badania
epro (patient reported outcome) - zalety i wady Zalety: Możliwość zebrania wielu wartościowych, dodatkowych danych (bez zbytniego obciążania badacza) Możliwość monitorowania na bieżąco np. samopoczucia pacjenta oraz rzetelności (bądź nie) wprowadzania danych Wszystkie zalety formularzy elektronicznych w porównaniu do formularzy papierowych wypełnianych przez pacjentów
epro (patient reported outcome) - zalety i wady Wady: Koszt urządzeń (tablety, smartfony) Bariera u pacjentów związana z korzystaniem z nowoczesnych technologii Dodatkowy czas potrzebny na przeszkolenie pacjentów Kwestia prawdziwości i rzetelności wprowadzanych danych
Dziękujemy! 2KMM Al. Korfantego 79 40-161 Katowice Poland tel. +(48 32) 259 22 91 fax +(48 32) 259 23 90 www.2kmm.pl 2kmm@2kmm.pl