Weryfikacja hipotez statystycznych

Podobne dokumenty
Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Prawdopodobieństwo i rozkład normalny cd.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna dla leśników

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Porównanie dwóch rozkładów normalnych

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka matematyczna

Hipotezy statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Hipotezy statystyczne

Wnioskowanie statystyczne. Statystyka w 5

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 3 Hipotezy statystyczne

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

WNIOSKOWANIE STATYSTYCZNE

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Testowanie hipotez statystycznych

Przykład 1. (A. Łomnicki)

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Rozkłady statystyk z próby. Statystyka

Testowanie hipotez statystycznych. Wprowadzenie

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Analiza niepewności pomiarów

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Wykład 9 Wnioskowanie o średnich

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Zadania ze statystyki cz.8. Zadanie 1.

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Zadanie Punkty Ocena

Estymacja parametrów rozkładu cechy

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Zadania ze statystyki, cz.6

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Estymacja punktowa i przedziałowa

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Weryfikacja hipotez statystycznych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna i ekonometria

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez statystycznych

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Rozkłady statystyk z próby

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka i Analiza Danych

Statystyka matematyczna i ekonometria

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

166 Wstęp do statystyki matematycznej

1 Estymacja przedziałowa

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Metody Statystyczne. Metody Statystyczne.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Pobieranie prób i rozkład z próby

STATYSTYKA MATEMATYCZNA

Transkrypt:

Statystyka Opisowa z Demografią oraz Biostatystyka Weryfikacja hipotez statystycznych Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka p. 1

Weryfikacja hipotez statystycznych Najnowsza wersja tego dokumentu dostępna jest pod adresem http://denisjuk.euh-e.edu.pl/ oraz Biostatystyka p. 2

Oszacowanie parametrów rozkładu normalnego Mamy do czynienia z losowa próbka wielkości N zmiennej o rozkładzie normalnym Oszacowanie wartości średniej X = Xi N Oszacowanie odchylenia standardowego s 2 = (Xi X) 2 N 1 oraz Biostatystyka p. 3

Standardowy bład oceny wartości średniej Dany jest rozkład normalny N(40,5) (wzrost Marsjan, żródło: Stanton A. Glantz, Primer of Biostatistics) oraz Biostatystyka p. 4

Oceny wartości średniej Oceniamy wartość średnia na podstawie losowej próbki 10 Marsjan oraz Biostatystyka p. 5

Jeszcze 25 próbek Ogólem jest ponad 10 16 próbek z 10 Marsjan Rozkład średnich z próbki zbliża się do normalnego dla dowolnego rozkładu Dla normalnego jest zawsze normalnym Średnia zgadza się ze średnia rozkładu poczatkowego oraz Biostatystyka p. 6

Bład standardowy Odchylenie standardowe X i jest mniejsze od odhcylenie standardowego X σ X jest błędem standardowym wartości średniej z próby σ X = σ N s X jest ocena błędu standardowego wartości średniej z próby ( s X = s Xi = X) 2 N N(N 1) Średnia w 95% przypdaków leży w przedziale X i ±2s X oraz Biostatystyka p. 7

Centralne twierdzenie graniczne Rozkład średnich z próbki jest zbliżony do rozkładu normalnego Średnia rozkładu średnich z próbki zgadza się ze średnia rozkładu poczatkowego Odchylenie standardowe rozkładu średnich z próbki zależy zarówno od odchylenia standardowego poczatkowego rozkładu jak i od wielkości próbki oraz Biostatystyka p. 8

Ilustracja oraz Biostatystyka p. 9

Przykład W artykule napisane, że w wyniku badania 20 osób średni rzut serca wyniosł 5,0 l/min z odchyleniem standardowym 1,0 l/min 95 % zmiennej o rozkładzie normalnym mieści się w przedzile średnia ±2s Czy prawie wszyscy pacjenci mieli rzut serca od 3 do 7 l/min? średnia wartość rzutu serca (z prawdopodobieństwem 95 %) znajduje się z przedziale od 4,56 do 5,44 l/min? oraz Biostatystyka p. 10

Poziom istotności różnicy Mamy kilka grup badanych jednostek Pytanie: czy różnice tych grup sa statystycznie istonte? hipoteza zerowa: różnice sa przypadkowe jakie jest prawdopodobieństwo otrzymać takie wyniki losowo? Duze: hipoteza zerowa jest przyjmowana Małe: hipoteza zerowa jest odrzucana Metoda: analiza wariancji oraz Biostatystyka p. 11

Losowe próbki z rozkładu normalnego W miasteczku (200 mieszkańców) badano wpływ diety na rzut serca Wybrano losowo 28 mieszkańców Podzielono na 4 grupy po 7 osób Pierwsza grupa nie zmieniała diety Druga jadła same makarony Trzecia mięso Czwarta owoce po miesiacu zmierzono rzut serca oraz Biostatystyka p. 12

Wyniki Czy dieta ma wpływ na rzut serca? Hipoteza zerowa: nie ma wpływu. Jakie jest prawdopodobieństwo wylosować takie wyniki? oraz Biostatystyka p. 13

Całe miasteczko Nasze grupy sa losowymi próbkami z całości oraz Biostatystyka p. 14

Czy takie wyniki się różnia? Chyba się różnia? oraz Biostatystyka p. 15

Porównywanie Czemu uważamy, że różnice w drugim przypadku sa istotne? oraz Biostatystyka p. 16

Analiza wariancji Porównujemy wariancje Założenie: rozkład normalny Kriterium parametryczne oraz Biostatystyka p. 17

Dwa sposoby na obliczenie oceny wariancji Na podstawie wariancji grup (wariancja wewnętrzna) s 2 wewn = 1 4 ( ) s 2 kontr +s2 makar +s2 mięso +s2 owoce Na podstawie wariancji oceny średnich (wariancja międzygrupowa) σ X = σ N s mg = Ns 2 X Jeżeli grupy sa losowymi podzbiorami rozkładu normalnego, to obydwie oceny daja przybliżono tez sam wynik. oraz Biostatystyka p. 18

Testf (test Fishera) F = s2 mg s 2 wewn jeżeli F 1, to hipotezę zerowa należy przyjać jeżeli F 1 (znacznie więcej), to hipotezę zerowa należy odrzucić Dla danych eksperymentu F jest blisko do jedynki Dla danych poprawionych F = 68, 0. oraz Biostatystyka p. 19

Wartość krytycznaf Wartości F dla losowych próbek będa się różnić Od jakiej wartości F należy uważać za duża? oraz Biostatystyka p. 20

ObliczymyF dla 200 próbek Dla więkzości próbek F jest około jedynki (od 0 do 2) oraz Biostatystyka p. 21

ObliczymyF dla 200 próbek Dla dziesięciu próbek F 3 Jeżeli będziemy odrzucać hipotezę zerowa dla F 3, to pomylimy się tylko w 5% przypadków F = 3 nazywa się wartościa krytyczna α = 0,05 (5%) nazywa się poziomem ufności oraz Biostatystyka p. 22

ObliczymyF dla wszystkich 7-osobowych próbek Wartość krytyczna wynosi około 3,01 na poziomie ufności 5% oraz Biostatystyka p. 23

Gdyby liczebość całej populacji dażyła do Wartość krytyczna wynosi 3,01 na poziomie ufności 5% oraz Biostatystyka p. 24

Ogólny przypadek Wartość krytyczna wynosi zależy od poziomu ufności (5%, 1%) liczby stopni swobody ν 1 = m 1, ν 2 = m(n 1), gdzie m jest ilościa grup, n jest liczebnościa każdej grupy Wartość krytyczna może być znaleziona z tablic F α (ν 1,ν 2 ). Przykład tablicy: NIST/SEMATECH e-handbook of Statistical Methods W naszym przykładzie 4 grupy po 7 osób oraz Biostatystyka p. 25

Założenia Założenia modelu matematycznego: każda próbka jest niezależna od pozostałych każda próbka wylosowana z całej populacji statystycznej populacja statystyczna ma rozkład Gaussa wariancje wszystkich próbek sa równe Jeżeli jedno z założeń jest mocno naruszono, to nie można korzystać z metody oraz Biostatystyka p. 26

Przykład pierwszy Czy poprawne leczenie pozwala na skrócenie czasu hospitalizacji? D. E. KNAPP, D. A. KNAPP, M. K. SPEEDIE, D. M. YAEGER, C. L. BAKER: Relationship of inappropriate drug prescribing to increased length of hospital stay, Am. J. Hosp. Pharm., 36:1334 1337, 1979. oraz Biostatystyka p. 27

Organizacja badań Zbadano historie choroby pacjentów szpitala z ostrym odmiedniczkowym zapaleniem nerek Badanie obserwacyjne (nie eksperymentalne) Badanie retrospektywne (nie prospektywne) oraz Biostatystyka p. 28

Kriteria właczenia pacjenta do badań 1. Diagnoza przy wypisie ze szpitala: ostre odmiedniczkowe zapalenie nerek 2. Przy przyjęciu: bole w dolnej części pleców, goraczka powyżej 37,8 3. Bakteriuria co najmniej 10000 żywych bakterii w 1 ml moczu, stwierdzona wrażliwość na antybiotyk 4. Wiek od 18 do 44 lat 5. Brak niewydolności nerek lub watroby, a także chorób, wymagajacych leczenia chirurgicznego 6. Wypis ze szpitala w zwiazku z poprawa stanu zdrowia oraz Biostatystyka p. 29

Kriterium poprawności leczenia Leczenie poprawne, jeżeli odpowiada zaleceniom Physicians Desk Reference Według tego kriterium pacjenci zostali podzieleni na dwie grupy: Leczone poprawnie Leczone niepoprawnie oraz Biostatystyka p. 30

Wyniki Obliczyć F. oraz Biostatystyka p. 31

Wnioski F = 10,81 Wartość krytyczna na poziomie 1% 7,01 Czy leczeni poprawnie byli w szpitalu dzięki poprawnemu leczeniu? Niewiadomo. Czemu? oraz Biostatystyka p. 32

Przykład drugi Halotan czy Morfina podczas operacji na otwartym sercu Halotan powoduje spadek ciśnienia tętniczego. Czy warto zastapić morfina? T. J. CONAHAN III, A. J. OMINSKY, H. WOLLMAN, R. A. STROTH: A prospectiverandom comparison of halothane and morphine for open-heart anesthe-sia: one year experience. Anesthesiology, 38:528 535, 1973. oraz Biostatystyka p. 33

Organizacja badań Pacjenci, którzy nie maja przeciwwskazań wobec halotanu, ani wobec morfiny Sposób anestezji wybierany losowo Badanie kontrolowane, prospektywne Badanie eksperymentalne Ciśnienie tętnicze między poczatkiem anestezji a poczatkiem operacji mierzono wielokrotnie C = C skurcz C rozkurcz 3 +C rozskurcz W badaniu wykorzystana najmniejsza wartość oraz Biostatystyka p. 34

Wyniki Obliczyć F. oraz Biostatystyka p. 35

Wnioski F = 6,81 Wartość krytyczna na poziomie 5% 3,92 oraz Biostatystyka p. 36

Przykład trzeci Sport a zaburzenia miesiaczkowania Czy uprawianie biegania ma zwiazek z zaburzeniem miesiaczkowania? E. DALE, D. H. GERLACH, A. L. WILHITE.: Menstrual dysfunction in distance runners. Obs. GynecoL, 54:47 53, 1979. oraz Biostatystyka p. 37

Organizacja badań 78 młodych kobiet, podzielonych na trzy grupy po 26 osób 1. Grupa kontrolna: kobiety, nie uprawiajace sportu 2. Kobiety, uprawiajace bieganie rekreacyjnie (jogging), przebiegaja od 6 do 48 kilometrów tygodniowo 3. Kobiety, uprawiajace bieganie sportowo, przebiegaja ponad 48 kilometrów tygodniowo Obliczona roczna ilość menstruacji oraz Biostatystyka p. 38

Wyniki oraz Biostatystyka p. 39

Wnioski F = 9,48 Wartość krytyczna na poziomie 1% 4,90 oraz Biostatystyka p. 40