Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s 0.025 n (n 1)s 2 χ 2 < σ 2 2 (n 1)s < χ 2 n 1,0.975 n 1,0.025 estymacja parametrów rozkładu normalnego estymator MLE Estymacja Testowanie hipotez Porównanie danych z próby do oczekiwania określonego przez hipotezę zerową 1
Hipoteza zerowa H 0 : określa oczekiwanie co do własności populacji (wartości parametru opisującego jej rozkład) Hipoteza alternatywna H 1 : określa nasze oczekiwanie co do własności populacji (wartości parametru opisującego jej rozkład). Testowanie hipotezy wykorzystuje prawdopodobieństwo do określenia, czy zaobserwowana własność próby/efekt jest przypadkiem zgodnym z H0 czy tez próba oznacza, że oczekiwania H0 co do populacji należy zrewidować. Testy hipotez mogą być parametryczne: czy dane są uzgodnione ( statystycznie) z pewnym rozkładem? nieparametryczne: testy nie czynią żadnych założeń co do rozkładu w populacji, D.Makowiec: Biostatystka (142) Rozkład próbkowania jest rozkładem wszystkich możliwych wartości, które dane oszacowanie dla parametru może przyjąć na podstawie losowego próbkowania. Rozkład NULL dla hipotezy zerowej to rozkład próbkowania dla możliwych wyników badanej statystyki przy założeniu, że hipoteza zerowa jest prawdziwa. Testowanie hipotez to szukanie odpowiedzi na pytanie: w jakim stopniu spodziewane są moje dane w ramach hipotezy zerowej Przykład rozkładu NULL Wartości wokół centrum rozkładu NULL są spodziewane. Wartości w ogonach rozkładu NULL są niespodzianką D.Makowiec: Biostatystka (143) 2
Zacienione obszary to obszary krytyczne Całkowite pole obszarów krytycznych definiuje wartość krytyczna wartość krytyczna Wartości krytyczne, gdy NULL=N (0,1) D.Makowiec: Biostatystka (144) P-value to pole powierzchni pod krzywą NULL badanej statystyki, gdy wartości krytyczne są ustalone przez statystykę testu. Rezultat testu hipotezy jest istotny na poziomie istotności, jeśli wartość statystki testu wpada do obszaru krytycznego wyznaczonego przez ten poziom istotności. Przy wartości statystyki testu 2.25 pole pod krzywą jest mniejsze niż. Wnioskowanie w oparciu o p-value: Przy założonym wcześniej poziomie istotności : Jeśli p-value <=, wnioskujemy: rezultaty są istotne i pozwalają nam odrzucić hipotezę zerową i wnioskować, że nasze dane dowodzą na korzyść hipotezy alternatywnej. Jeśli p-value >, wnioskujemy: rezultaty są nieistotne. Nie uzyskaliśmy możliwości odrzucenia hipotezy zerowej i nie mamy dowodów na korzyść hipotezy alternatywnej. D.Makowiec: Biostatystka (145) 3
decyzja prawdziwe wyznacza prawdopodobieństwo tzw. zdarzenia fałszywie pozytywnego dla przeprowadzanego testu. H0 H1 Akceptujemy H0 prawdziwe i zaakceptowane H1 jest prawdziwe i zaakceptowane Błąd II typu Odrzucamy H0 prawdziwe odrzucone i H1 jest prawdziwe odrzucone i Błąd I typu Uwaga- akceptacja H0 w teście statystycznym to nie dowód prawdziwości H0, ale raczej nasza przegrana w teście odrzucenia H0. Małe oznacza, że odrzucane mniej często, gdy prawdziwe Małe oznacza, że akceptowane mniej często, gdy nieprawdziwe Strategia ustalić na poziomie akceptowalnym, np.: 0.10. 0.05, 0.01, przy czym stosować testy minimalizujące wartość Moc testu = 1 - Najsilniejszy test dla to test bazujący na średniej z próby. Ma on najwyższą moc przy ustalonym poziomie. 4
Czy dane < NULL? Jednostronny obszar krytyczny W obu przypadkach obszar pod krzywą NULL jest ten sam Czy dane Są różne od NULL? Czy dane > NULL? dwustronny obszar krytyczny Test jednostronny jest kierunkowy: Czy moje dane są mniejsze /większe niż to zakłada H0 Test dwustronny nie jest kierunkowy: Czy moje dane są różne niż to, co zakłada H0 Wybór testu MUSI nastąpić przed obróbką danych D.Makowiec: Biostatystka (148) Generalnie testy jednostronne maja większą moc. ALE: Test dwustronny nie daje wątpliwości co do konkluzji: średnia jest inna. Test dwustronny jest bardziej zachowawczy- ostrzejszy, ma większą moc. W każdym wypadku decyzji o rodzaju testu musi być podjęta przed analiza danych, nawet przed zbieraniem danych. Generalnie zaleca się używanie testów dwustronnych. 5
1. Zastanów się na jakie pytanie chcesz uzyskać odpowiedź? 2. Wybierz odpowiedni test. 3. Sprawdź, czy twoje dane spełniają założenia testu 4. Oblicz statystykę testu dla hipotezy Twojego testu i oblicz p-value 5. Przeprowadź dyskusję bazując na apriori założeniu co do wartości waga noworodka a status społeczny matki śmiertelne choroby serca a wysoki cholesterol u potomstwa Przypuśćmy, że szpital, którego dane o wadze noworodków badaliśmy, znajduje się w obszarze biednym mieszkańcy okoliczni mają niski status ekonomiczny. Załóżmy, że średnia waga noworodka w populacji ogólnej to 120 uncji. Czy waga noworodków od matek o niskim statusie ekonomicznym jest niższa niż waga noworodków z populacji ogólnej? Czy waga noworodków nie zależy od statusu ekonomicznego matki? Zidentyfikowano grupę osób, które zmarły w ostatnim okresie z powodu ataku serca. Dodatkowo, osoby te miały wysoki cholesterol, to jest > 250 mg/dl Załóżmy, że średni poziom cholesterolu w populacji ogólnej dzieci w wieku 2-14 to 175 mg/dl Czy średni poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest wyższy od średniego w populacji? Czy jest taki sam jak w populacji ogólnej? 6
waga noworodka a status społeczny matki śmiertelne choroby serca a wysoki cholesterol u potomstwa H0: 0 120 waga noworodków od matek o niższym statusie ekonomicznym jest identyczna z waga noworodków populacji ogólnej H1: 0 120 waga noworodków od matek o niskim statusie ekonomicznym jest niższa niż waga noworodków z populacji ogólnej. stawiamy dwie hipotezy: zerową: H0, prawdziwość której kwestionujemy alternatywną:h1, pewne zaprzeczenie hipotezy zerowej H0: 0 175 średni poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest taki sam jak w populacji ogólnej. H1: 0 175 średni poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest wyższy od średniego w populacji? Zał.: rozkład wag noworodków w populacji ogólnej ma rozkład normalny z i Zał.: populacja daje poziom cholesterolu o rozkładzie normalnym z i waga noworodka a status społeczny matki Zważono 100 kolejnych noworodków. Średnia waga tej próby to x = 115 uncji przy odchyleniu standardowym próby s= 24 uncje. x 115 120 5 t s / n 24 / 100 2.4 0.05 t n t 0 1,0.05 99,0.05 1.66 2.08 śmiertelne choroby serca a wysoki cholesterol u potomstwa Zmierzono cholesterol u 10 dzieci z takiej grupy. Średnia poziom cholesterolu w tej próbie to =200 mg/dl przy odchyleniu standardowym próby s= 50 mg/dl. x 200 175 25 t s / n 50 / 10 15.81 0.05 t n t 0 1,0.95 9,0.95 1.833 1.58.08 t t 1.66 1.58 t t9,0. 95 1. 833 2 99,0. 05 H0 odrzucamy przy poziomie istotności 0.05 H0 akceptujemy przy poziomie istotności 0.05 7
Testy normalności Shapiro-Wilk Test D Agostino s K^2 Test Anderson-Darling Test Testy korelacji Pearson s Correlation Coefficient Spearman s Rank Correlation Kendall s Rank Correlation Chi-Squared Test Parametryczne testy hipotezy Student s t-test Paired Student s t-test Analysis of Variance Test (ANOVA) Repeated Measures ANOVA Test Nieparametryczne testowanie hipotez Mann-Whitney U Test Wilcoxon Signed-Rank Test Kruskal-Wallis H Test Friedman Test Test średniej w populacji o nieznanej wariancji scipy.stats.ttest_1samp scipy.stats.ttest_ind D.Makowiec: Biostatystka (154) Jeśli Jeśli Jeśli 0.01 p 0.05 0.001 p 0.01 p 0.001 to mówimy, że rezultat jest istotny to mówimy, że rezultat jest wysoko istotny to mówimy, że rezultat jest bardzo wysoko istotny Jeśli p 0.05 nieznaczący Jeśli 0.1 p 0.05 statystyczności to mówimy, że rezultat jest statystycznie to mówimy, że jest trend w kierunku istotnej 8