12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Podobne dokumenty
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna dla leśników

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testowanie hipotez statystycznych

Statystyka matematyczna i ekonometria

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Edycja pierwsza 2014/1015. dla kierunku fizyka medyczna, I rok, studia magisterskie

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

166 Wstęp do statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez statystycznych.

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych.

1 Estymacja przedziałowa

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych. Wprowadzenie

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych

Przykład 1. (A. Łomnicki)

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

STATYSTYKA MATEMATYCZNA

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Wykład 8: Testy istotności

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Statystyczna analiza danych

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Metody Statystyczne. Metody Statystyczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych cd.

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Prawdopodobieństwo i rozkład normalny cd.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Weryfikacja hipotez statystycznych

Wydział Matematyki. Testy zgodności. Wykład 03

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Testowanie hipotez cz. I

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Transkrypt:

Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s 0.025 n (n 1)s 2 χ 2 < σ 2 2 (n 1)s < χ 2 n 1,0.975 n 1,0.025 estymacja parametrów rozkładu normalnego estymator MLE Estymacja Testowanie hipotez Porównanie danych z próby do oczekiwania określonego przez hipotezę zerową 1

Hipoteza zerowa H 0 : określa oczekiwanie co do własności populacji (wartości parametru opisującego jej rozkład) Hipoteza alternatywna H 1 : określa nasze oczekiwanie co do własności populacji (wartości parametru opisującego jej rozkład). Testowanie hipotezy wykorzystuje prawdopodobieństwo do określenia, czy zaobserwowana własność próby/efekt jest przypadkiem zgodnym z H0 czy tez próba oznacza, że oczekiwania H0 co do populacji należy zrewidować. Testy hipotez mogą być parametryczne: czy dane są uzgodnione ( statystycznie) z pewnym rozkładem? nieparametryczne: testy nie czynią żadnych założeń co do rozkładu w populacji, D.Makowiec: Biostatystka (142) Rozkład próbkowania jest rozkładem wszystkich możliwych wartości, które dane oszacowanie dla parametru może przyjąć na podstawie losowego próbkowania. Rozkład NULL dla hipotezy zerowej to rozkład próbkowania dla możliwych wyników badanej statystyki przy założeniu, że hipoteza zerowa jest prawdziwa. Testowanie hipotez to szukanie odpowiedzi na pytanie: w jakim stopniu spodziewane są moje dane w ramach hipotezy zerowej Przykład rozkładu NULL Wartości wokół centrum rozkładu NULL są spodziewane. Wartości w ogonach rozkładu NULL są niespodzianką D.Makowiec: Biostatystka (143) 2

Zacienione obszary to obszary krytyczne Całkowite pole obszarów krytycznych definiuje wartość krytyczna wartość krytyczna Wartości krytyczne, gdy NULL=N (0,1) D.Makowiec: Biostatystka (144) P-value to pole powierzchni pod krzywą NULL badanej statystyki, gdy wartości krytyczne są ustalone przez statystykę testu. Rezultat testu hipotezy jest istotny na poziomie istotności, jeśli wartość statystki testu wpada do obszaru krytycznego wyznaczonego przez ten poziom istotności. Przy wartości statystyki testu 2.25 pole pod krzywą jest mniejsze niż. Wnioskowanie w oparciu o p-value: Przy założonym wcześniej poziomie istotności : Jeśli p-value <=, wnioskujemy: rezultaty są istotne i pozwalają nam odrzucić hipotezę zerową i wnioskować, że nasze dane dowodzą na korzyść hipotezy alternatywnej. Jeśli p-value >, wnioskujemy: rezultaty są nieistotne. Nie uzyskaliśmy możliwości odrzucenia hipotezy zerowej i nie mamy dowodów na korzyść hipotezy alternatywnej. D.Makowiec: Biostatystka (145) 3

decyzja prawdziwe wyznacza prawdopodobieństwo tzw. zdarzenia fałszywie pozytywnego dla przeprowadzanego testu. H0 H1 Akceptujemy H0 prawdziwe i zaakceptowane H1 jest prawdziwe i zaakceptowane Błąd II typu Odrzucamy H0 prawdziwe odrzucone i H1 jest prawdziwe odrzucone i Błąd I typu Uwaga- akceptacja H0 w teście statystycznym to nie dowód prawdziwości H0, ale raczej nasza przegrana w teście odrzucenia H0. Małe oznacza, że odrzucane mniej często, gdy prawdziwe Małe oznacza, że akceptowane mniej często, gdy nieprawdziwe Strategia ustalić na poziomie akceptowalnym, np.: 0.10. 0.05, 0.01, przy czym stosować testy minimalizujące wartość Moc testu = 1 - Najsilniejszy test dla to test bazujący na średniej z próby. Ma on najwyższą moc przy ustalonym poziomie. 4

Czy dane < NULL? Jednostronny obszar krytyczny W obu przypadkach obszar pod krzywą NULL jest ten sam Czy dane Są różne od NULL? Czy dane > NULL? dwustronny obszar krytyczny Test jednostronny jest kierunkowy: Czy moje dane są mniejsze /większe niż to zakłada H0 Test dwustronny nie jest kierunkowy: Czy moje dane są różne niż to, co zakłada H0 Wybór testu MUSI nastąpić przed obróbką danych D.Makowiec: Biostatystka (148) Generalnie testy jednostronne maja większą moc. ALE: Test dwustronny nie daje wątpliwości co do konkluzji: średnia jest inna. Test dwustronny jest bardziej zachowawczy- ostrzejszy, ma większą moc. W każdym wypadku decyzji o rodzaju testu musi być podjęta przed analiza danych, nawet przed zbieraniem danych. Generalnie zaleca się używanie testów dwustronnych. 5

1. Zastanów się na jakie pytanie chcesz uzyskać odpowiedź? 2. Wybierz odpowiedni test. 3. Sprawdź, czy twoje dane spełniają założenia testu 4. Oblicz statystykę testu dla hipotezy Twojego testu i oblicz p-value 5. Przeprowadź dyskusję bazując na apriori założeniu co do wartości waga noworodka a status społeczny matki śmiertelne choroby serca a wysoki cholesterol u potomstwa Przypuśćmy, że szpital, którego dane o wadze noworodków badaliśmy, znajduje się w obszarze biednym mieszkańcy okoliczni mają niski status ekonomiczny. Załóżmy, że średnia waga noworodka w populacji ogólnej to 120 uncji. Czy waga noworodków od matek o niskim statusie ekonomicznym jest niższa niż waga noworodków z populacji ogólnej? Czy waga noworodków nie zależy od statusu ekonomicznego matki? Zidentyfikowano grupę osób, które zmarły w ostatnim okresie z powodu ataku serca. Dodatkowo, osoby te miały wysoki cholesterol, to jest > 250 mg/dl Załóżmy, że średni poziom cholesterolu w populacji ogólnej dzieci w wieku 2-14 to 175 mg/dl Czy średni poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest wyższy od średniego w populacji? Czy jest taki sam jak w populacji ogólnej? 6

waga noworodka a status społeczny matki śmiertelne choroby serca a wysoki cholesterol u potomstwa H0: 0 120 waga noworodków od matek o niższym statusie ekonomicznym jest identyczna z waga noworodków populacji ogólnej H1: 0 120 waga noworodków od matek o niskim statusie ekonomicznym jest niższa niż waga noworodków z populacji ogólnej. stawiamy dwie hipotezy: zerową: H0, prawdziwość której kwestionujemy alternatywną:h1, pewne zaprzeczenie hipotezy zerowej H0: 0 175 średni poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest taki sam jak w populacji ogólnej. H1: 0 175 średni poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest wyższy od średniego w populacji? Zał.: rozkład wag noworodków w populacji ogólnej ma rozkład normalny z i Zał.: populacja daje poziom cholesterolu o rozkładzie normalnym z i waga noworodka a status społeczny matki Zważono 100 kolejnych noworodków. Średnia waga tej próby to x = 115 uncji przy odchyleniu standardowym próby s= 24 uncje. x 115 120 5 t s / n 24 / 100 2.4 0.05 t n t 0 1,0.05 99,0.05 1.66 2.08 śmiertelne choroby serca a wysoki cholesterol u potomstwa Zmierzono cholesterol u 10 dzieci z takiej grupy. Średnia poziom cholesterolu w tej próbie to =200 mg/dl przy odchyleniu standardowym próby s= 50 mg/dl. x 200 175 25 t s / n 50 / 10 15.81 0.05 t n t 0 1,0.95 9,0.95 1.833 1.58.08 t t 1.66 1.58 t t9,0. 95 1. 833 2 99,0. 05 H0 odrzucamy przy poziomie istotności 0.05 H0 akceptujemy przy poziomie istotności 0.05 7

Testy normalności Shapiro-Wilk Test D Agostino s K^2 Test Anderson-Darling Test Testy korelacji Pearson s Correlation Coefficient Spearman s Rank Correlation Kendall s Rank Correlation Chi-Squared Test Parametryczne testy hipotezy Student s t-test Paired Student s t-test Analysis of Variance Test (ANOVA) Repeated Measures ANOVA Test Nieparametryczne testowanie hipotez Mann-Whitney U Test Wilcoxon Signed-Rank Test Kruskal-Wallis H Test Friedman Test Test średniej w populacji o nieznanej wariancji scipy.stats.ttest_1samp scipy.stats.ttest_ind D.Makowiec: Biostatystka (154) Jeśli Jeśli Jeśli 0.01 p 0.05 0.001 p 0.01 p 0.001 to mówimy, że rezultat jest istotny to mówimy, że rezultat jest wysoko istotny to mówimy, że rezultat jest bardzo wysoko istotny Jeśli p 0.05 nieznaczący Jeśli 0.1 p 0.05 statystyczności to mówimy, że rezultat jest statystycznie to mówimy, że jest trend w kierunku istotnej 8