Statystyka pojęcia podstawowe Maciej Kostrubiec MD, PhD Klinika Chorób Wewnętrznych i Kardiologii
Statystyka "Są trzy rodzaje kłamstw: kłamstwa, bezczelne kłamstwa i statystyka. Mark Twain lub brytyjski premier lord Beaconsfield (Beniamin Disraeli)
BADANIA MARKETINGOWE PRODUKCJA STATYSTYKA POLITYKA MEDYCYNA SPORT
Statystyka Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny. Jean Rigaux
Schemat badań statystycznych Zdefiniuj problem Zbierz dane Wykonaj analizę Wyciągnij wnioski
POPULACJA (N) PRÓBA (n) Jesteśmy politycznie poprawni - próba musi być reprezentatywna!!!
Rodzaje badań klinicznych - metaanalizy badań z randomizacją (metaanalysis); - badania z randomizacją (randomised controlled trial - RCT); - badania eksperymentalne z grupą kontrolną bez randomizacji; - badania kohortowe (cohort study); - badania kliniczno-kontrolne (case-controlled study); - badania przekrojowe (cross sectional study); - opis przypadku (case report) lub serii przypadków (case series).
Statystyka Jedna śmierć to tragedia, milion to statystyka. Erich Maria Remarque, Czarny Obelisk
DANE STATYSTYCZNE mierzalne niemierzalne / jakościowe ciągłe skokowe quasi-ciągłe Mogą mieć wiele wartości Skończony zbiór wartości, niezbyt liczny Skończony zbiór wartości, bardzo liczny Nie dają się wyrazić liczbowo
Jaki to typ danych? liczba dzieci w rodzinie wykształcenie waga 1 pudełka proszku do prania ilość egzaminów w sesji metraż mieszkania preferencje wyborcze podatek zapłacony za rok 1999 ilość goli w meczu piłkarskim czas dojazdu do pracy liczba stron podręczników do statystyki
Statystyka Parametry statystyczne liczby dające sumaryczny opis badanej zbiorowości: 1. Opisujące przeciętny rozmiar i rozmieszczenie wartości zmiennej miary położenia. 2. Opisujące granice obszaru zmienności wartości zmiennej miary zmienności. 3. Opisujące skupienie i spłaszczenie oraz stopień symetrii rozkładu zmiennej miary asymetrii i koncentracji.
Statystyka Miary położenia 1. Średnia a) arytmetyczna b) harmoniczna c) geometryczna 2. Modalna wartość najczęstsza 3. Kwantyle dzielą zbiorowość na części pod względem liczby jednostek a) Kwartyl pierwszy (75% nie większe i 25% nie mniejsze) b) Kwartyl drugi mediana (50% nie większe i 50% nie mniejsze) c) Kwartyl trzeci (75% nie większe i 25% nie mniejsze) d) Decyle
Statystyka Średnia a) arytmetyczna b) harmoniczna c) geometryczna
Statystyka Jeśli mój sąsiad codziennie bije swoją żonę, ja zaś nie biję jej nigdy, to w świetle statystyki obaj bijemy je co drugi dzień. George Bernard Shaw
Statystyka 25% wartości 25% wartości 25% wartości 25% wartości Mediana Rozstęp kwartylny Rozstęp (Min Max)
Statystyka Miary zmienności 1. Rozstęp - wartości minimalna i maksymalna 2. Odchylenie standardowe pierwiastek kwadratowy z wariancji danej zbiorowości
Statystyka
Statystyka
Statystyka
Testy normalności Testy normalności rozkładu: 1. Test Kołmogorowa-Smirnowa znane średnia i SD dla całej populacji 2. Test K-S z poprawką Lilieforsa nieznane średnia i SD dla całej populacji 3. Test W Shapiro-Wilka - błędne wyniki dla n>2000
Wykres pudełkowy
Histogram
Statystyka Nic się nie da zmienić: statystycznie wypada jedna śmierć na jednego człowieka. Krzysztof Mętrak
Weryfikacja hipotez statystycznych 1. Sformułowanie hipotezy zerowej i alternatywnej Hipoteza zerowa (H0) hipoteza, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Hipoteza alternatywna (H1) - hipoteza przeciwstawna do weryfikowanej
Weryfikacja hipotez statystycznych Hipoteza zerowa Przyjąć H0 Odrzucić H0 Hipoteza zerowa prawdziwa Decyzja prawidłowa Błąd I rodzaju Hipoteza zerowa fałszywa Błąd II rodzaju Decyzja prawidłowa Błąd I rodzaju odrzucenie prawdziwej hipotezy zerowej Błąd II rodzaju przyjęcie fałszywej hipotezy zerowej
Weryfikacja hipotez statystycznych 2. Wybór statystyki testowej Budujemy pewną statystykę W, która jest funkcją wyników z próby losowej i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję W nazywa się statystyką testową lub funkcją testową.
Weryfikacja hipotez statystycznych 3. Określenie poziomu istotności α Przyjmujemy maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem α i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy poziom istotności α=0,05, czasem przyjmuje się np. α=0,01, α=0,1.
Weryfikacja hipotez statystycznych 4. Wyznaczenie obszaru krytycznego testu Obszar krytyczny - obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę H0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną. Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu (wα), czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H1
Weryfikacja hipotez statystycznych 4. Wyznaczenie obszaru krytycznego testu
Weryfikacja hipotez statystycznych 5. Podjęcie decyzji Wyznaczoną na podstawie próby wartość statystyki porównujemy z wartością krytyczną testu. Jeżeli wartość ta znajdzie się w obszarze krytycznym, to hipotezę zerową należy odrzucić jako nieprawdziwą - prawdziwa jest hipoteza alternatywna. Jeżeli natomiast wartość ta znajdzie się poza obszarem krytycznym, oznacza to, że brak jest podstaw do odrzucenia hipotezy zerowej - hipoteza zerowa może, ale nie musi, być prawdziwa, a postępowanie nie dało żadnych dodatkowych informacji uprawniających do podjęcia decyzji o przyjęciu lub odrzuceniu hipotezy zerowej. Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych.
Wybór testu zmienne niepowiązane Obserwowane zmienne mierzalne mają w dwóch zbiorowościach rozkłady normalne TAK Znane wariancje dla całej populacji NIE Wariancje jednorodne TAK Test T NIE Test Cochrana- Coxa TAK Test U Zmienne jakościowe test Chi2 Duże próby (n1>50, n2>50) Test z TAK NIE Testy nieparametyrczne (Manna-Whitnea, Walda-Wolfowitza, Kołogomorowa- Smirnowa)
Wybór testu zmienne zależne Rozkłady normalny TAK NIE Test różnic Test Wilcoxona Zmienne jakościowe test McNemara
Korelacja Współczynnik korelacji liczba określająca w jakim stopniu zmienne są współzależne. Najczęściej używany współczynnik korelacji Pearsona
Korelacja r = 0 zmienne nie są skorelowane 0 < r < 0,1 korelacja nikła 0,1 < r < 0,3 korelacja słaba 0,3 < r < 0,5 korelacja przeciętna 0,5 < r < 0,7 korelacja wysoka 0,7 < r < 0,9 korelacja bardzo wysoka 0,9 < r < 1 korelacja prawie pełna
Statystyka Statystyka jest jak kostium bikini: pokazuje wiele, ale nie pokazuje najważniejszego. Aaron Levenstein
Ocena przydatności badania Czułość odsetek wyników prawdziwie dodatnich Swoistość zdolność badania do potwierdzenia stanu prawdziwego Negatywna wartość predykcyjna odsetek wyników prawdziwie ujemnych Dodatnia wartość predykcyjna odsetek wyników prawdziwie dodatnich - dla wyznaczonego punktu odcięcia Chorzy Zdrowi Badanie dodatnie a b Badanie ujemne c d a a + c d c + d a a + b d b + d
Ocena przydatności badania AUC aera under curve - pole pod krzywą ROC
Ocena przydatności badania
Ocena ryzyka wystąpienia czegoś
Ocena ryzyka wystąpienia czegoś Bezwzględne zmniejszenie ryzyka (absolute risk reduction - ARR) to bezwzględna różnica między ryzykiem w grupie kontrolnej a ryzykiem w grupie eksperymentalnej, określająca bezwzględną wielkość "usuniętego" ryzyka. Ryzyko względne (relative risk - RR) określa, jaka część ryzyka podstawowego (tzn. ryzyka w grupie kontrolnej) "pozostała" po interwencji. Jest to iloraz prawdopodobieństwa wystąpienia określonego punktu końcowego w grupie eksperymentalnej, w której stosuje się ocenianą interwencję i tego prawdopodobieństwa w grupie kontrolnej.
Ocena ryzyka wystąpienia czegoś Względne zmniejszenie ryzyka (relative risk reduction - RRR) stanowi część prawdopodobieństwa (ryzyka) wystąpienia niekorzystnego punktu końcowego "usuniętą" w wyniku zastosowania określonej interwencji (leku lub zabiegu). Jest ilorazem bezwzględnej różnicy ryzyka między grupą kontrolną a eksperymentalną (ARR) oraz ryzyka w grupie kontrolnej. Ryzyko "pozostałe" (RR) i ryzyko "usunięte" (RRR) dopełniają się do jedności (RR + RRR = 1). NNT (number needed to treat) jest to liczba pacjentów, których trzeba poddać danej interwencji przez określony czas, aby zapobiec jednemu niekorzystnemu punktowi końcowemu. NNT wylicza się jako odwrotność ARR (1/ARR).
Ocena ryzyka wystąpienia czegoś Bezwzględne zwiększenie ryzyka (absolute risk increase - ARI), czyli bezwzględna różnica pomiędzy ryzykiem w grupie eksperymentalnej i w grupie kontrolnej. Określa, o ile zwiększyło się ryzyko wystąpienia niekorzystnego punktu końcowego w wyniku ekspozycji na dany czynnik lub interwencję. Względne zwiększenie ryzyka (relative risk increase - RRI), czyli część prawdopodobieństwa (ryzyka) wystąpienia niekorzystnego punktu końcowego "dodana" w wyniku zastosowania określonej interwencji (leku lub zabiegu). Iloraz ryzyka "dodanego" (ARI) i ryzyka w grupie kontrolnej.
Ocena ryzyka wystąpienia czegoś NNH (number needed to harm), czyli liczba pacjentów, których poddanie określonej interwencji przez określony czas wiąże się z wystąpieniem jednego dodatkowego niekorzystnego punktu końcowego. NNH wylicza się jako odwrotność ARI (1/ARI).
Ocena ryzyka wystąpienia czegoś Iloraz szans (odds ratio - OR), czyli iloraz szansy wystąpienia określonego stanu klinicznego w grupie eksponowanej na dany czynnik lub interwencję i szansy wystąpienia tego stanu w grupie nieeksponowanej (kontrolnej). Szansa jest to stosunek prawdopodobieństwa wystąpienia określonego stanu klinicznego do prawdopodobieństwa jego nie wystąpienia w danej grupie.
Ocena ryzyka wystąpienia czegoś Hazard względny (hazard ratio - HR) - pojęcie analogiczne do ryzyka względnego, ale jest wynikiem analizy krzywych lub tabeli przeżywalności. Określa względne prawdopodobieństwo zajścia jakiegoś zdarzenia w badanych grupach w określonym czasie przy założeniu, że zdarzenie to do tej pory nie wystąpiło (w uproszczeniu: określa część ryzyka podstawowego "pozostałą" po interwencji).
Ocena ryzyka wystąpienia czegoś Przykład częstość (ryzyko) rzucawki w grupie otrzymującej siarczan magnezu - 0,8%, a w grupie placebo - 1,9% ARR: 1,9% - 0,8% = 1,1% (bezwzględne zmniejszenie ryzyka) RR: 0,8%/1,9% = 0,42 (42%) (ryzyko względne) RRR: 1,1%/1,9% = 0,58 (58%) (1-0,42 = 0,58) (względne zmniejszenie ryzyka) NNT: 1/0,011 = 91 (number neded to treat)
Statystyka Ludzkie umiłowanie fantazji bywa dziś zaspokajane zazwyczaj przez statystyków i buchalterów. George Hancock
Ocena regresji Oszacowanie zależności pomiędzy dwoma i więcej zmiennymi wartość teoretyczna wyliczona dla wartości x, β0, β1 - parametry liniowej funkcji regresji ɛ - składnik losowy. metoda szacowania parametrów linii regresji nosi nazwę metody najmniejszych kwadratów
Ocena regresji
Ocena regresji
Ocena regresji Regresja liniowa wieloczynnikowa Y = β0 + β1x1 + β2x2 +...+ β kxk + ɛ Regresja krokowa postępująca - kolejne (krokowe) dołączanie do listy zmiennych objaśniających, uwzględnionych w modelu tych zmiennych, które mają najistotniejszy wpływ na zmienną zależną. Regresja krokowa wsteczna -kolejne (krokowe) usuwanie z modelu zbudowanego ze wszystkich potencjalnych zmiennych tych spośród nich, które w danym kroku mają najmniej istotny wpływ na zmienną zależną.
Ocena regresji Regresja logistyczna - dla zmiennych dychotomicznych, czyli przyjmujących wartość 0 lub 1 (np. zgon/przeżycie) Wyliczamy iloraz szans - OR
Ocena ryzyka wystąpienia czegoś Iloraz szans (odds ratio - OR), czyli iloraz szansy wystąpienia określonego stanu klinicznego w grupie eksponowanej na dany czynnik lub interwencję i szansy wystąpienia tego stanu w grupie nieeksponowanej (kontrolnej). Szansa jest to stosunek prawdopodobieństwa wystąpienia określonego stanu klinicznego do prawdopodobieństwa jego nie wystąpienia w danej grupie.
Ocena przeżycia zbiór procedur statystycznych, dla których badana zmienna jest czasem pojawiania się określonego zdarzenia (np. śmierć, nawrót choroby, wyzdrowienie).
Ocena przeżycia funkcja przeżycia Kaplana i Meiera
Ocena przeżycia porównanie dwóch krzywych przeżycia
Ocena przeżycia Hazard względny (hazard ratio - HR) - pojęcie analogiczne do ryzyka względnego, ale jest wynikiem analizy krzywych lub tabeli przeżywalności. Określa względne prawdopodobieństwo zajścia jakiegoś zdarzenia w badanych grupach w określonym czasie przy założeniu, że zdarzenie to do tej pory nie wystąpiło.
Przedział ufności Przedział ufności (CI confidence interval) - zakres, w którym mieści się wartość badanej cechy określona na podstawie badanej próby, w populacji. Poziom ufności określa prawdopodobieństwo z jakim możemy powiedzieć, że obliczona wartość danej cechy mieści się w przedziale ufności.
Przedział ufności Przykład: Nasz poziom istotności wynosi: α = 0,05 = 5%, wtedy poziom ufności wynosi = (1-0,05) = 0,95 = 95% 95% prawdopodobieństwo, że uzyskany wynik (średnia, ryzyko itp.) jest prawdziwe w badanej populacji HR dla wystąpienia zgonu w przebiegu APE GFR 1.46, CI 95%: 1.11 1.92, per 10 ml min -1 decrease, p<0.01 positive troponin 14.1, CI 95%: 1.4 137.6; p=0.02 increased heart rate 1.31, CI 95%: 1.07 1.61; per 10 beats, p< 0.01 a history of CHF 4.9, CI 95%: 1.9 12.4; p= 0.001
Statystyka Statystyka to matematyczny kamuflaż błędu. Georges Elgozy
Błędy
Błędy
Błędy
Statystyka Statystyka nie kłamie. Kłamią jedynie statystycy. Janusz Leon Wiśniewski, S@motność w Sieci