Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl



Podobne dokumenty
Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyka matematyczna dla leśników

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Prawdopodobieństwo i rozkład normalny cd.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

WNIOSKOWANIE STATYSTYCZNE

Testy post-hoc. Wrocław, 6 czerwca 2016

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wykład 3 Hipotezy statystyczne

Testy nieparametryczne

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Wykład 8: Testy istotności

Weryfikacja hipotez statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka matematyczna

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych. Wprowadzenie

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Zadanie Punkty Ocena

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

STATYSTYKA MATEMATYCZNA

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Testowanie hipotez statystycznych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

STATYSTYKA MATEMATYCZNA

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Pobieranie prób i rozkład z próby

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Zadania ze statystyki, cz.6

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Kolokwium ze statystyki matematycznej

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Analiza wariancji. dr Janusz Górczyński

Testowanie hipotez statystycznych cd.

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

WNIOSKOWANIE STATYSTYCZNE

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Wprowadzenie do statystyki dla. chemików testowanie hipotez

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Zadania ze statystyki cz.8. Zadanie 1.

METODY STATYSTYCZNE W BIOLOGII

Analiza Współzależności

Jednoczynnikowa analiza wariancji

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Transkrypt:

Statystyka Opisowa z Demografią oraz Biostatystyka TesttStudenta Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka p. 1

TesttStudenta Najnowsza wersja tego dokumentu dostępna jest pod adresem http://denisjuk.euh-e.edu.pl/ oraz Biostatystyka p. 2

Test t-studenta Służy do porównania dwóch grup Jest bardzo popularny Często niepoprawnie stosuje się do porównania więcej niż dwóch grup oraz Biostatystyka p. 3

Zasada testu. Przykład Badamy skuteczność nowego diuretyka Dwie grupy po pięć osób Mieżono dobowa diurezę Czy nowy diuretyk jest skuteczny? oraz Biostatystyka p. 4

Większe grupy Czemu mamy większe zaufanie do drugiego doświadczenia? oraz Biostatystyka p. 5

Bo... Dokładność oceny wartości średniej z próby zależy od liczebności próby: σ X = σ N Im większa jest próba, tym mniejszy jest bład standardowy. Tym mniejsze jest prawdopodobieństwo hipotezy zerowej (że obydwie próbki pochodza z tej samej normalnej zbiorowości statystycznej). oraz Biostatystyka p. 6

Testt różnica średnich z próbki t = bład standardowy różnic średnich z próbki jeżeli t 0, to hipotezę zerowa należy przyjać jeżeli t 1 (znacznie więcej), to hipotezę zerowa należy odrzucić oraz Biostatystyka p. 7

Bład standardowy różnic średnich z próbki σ 2 X Y = σ2 X +σ2 Y oraz Biostatystyka p. 8

Ocena błędu standardowefo różnic średnich z próbki σ 2 X Y = σ2 X +σ2 Y s 2 X Y = s2 X +s2 Y s 2 X Ȳ = s2 X +s 2 Ȳ s X Ȳ = s 2 X +s 2 Ȳ oraz Biostatystyka p. 9

Ocena testut t = X 1 X 2 s 2 X1 +s 2 X2 t = X 1 X 2 s 2 1 n + s2 2 n jeżeli obydwie próbki zostały pobrane z tej samej zbiorowości, to s 2 1 oraz s2 2 s a ocenami tej samej wariancji σ zastępujemy je przez ocenę zbiorcza: s 2 = s2 1 +s2 2 2 (ta sama wielkość próbek) t = X 1 X 2 s 2 n + s2 n oraz Biostatystyka p. 10

Wartość granicznat oraz Biostatystyka p. 11

Inne dwie próbki oraz Biostatystyka p. 12

Jeszcze dwie probki oraz Biostatystyka p. 13

Dwieście i więcej prób oraz Biostatystyka p. 14

Wartość krytycznat zależy od poziomu ufności α oraz od liczby stopni swobody dla dwóch próbek wielkości n ν = 2(n 1) test dwustronny (two-sided test) Przykład tablicy: NIST/SEMATECH e-handbook of Statistical Methods oraz Biostatystyka p. 15

Próbki różnych wielkości ocena zbiorza wariancji s 2 = (n 1 1)s 2 1 +(n 2 1)s 2 2 n 1 +n 2 2 t = X 1 X 2 s 2 n 1 + s2 n 2 liczba stopni swobody ν = n 1 +n 2 2 oraz Biostatystyka p. 16

Przykład z zapaleniem nerek ponownie Obliczyć t. oraz Biostatystyka p. 17

Wnioski t = 3,30 Wartość krytyczna na poziomie 1% 6,648 Różnica długości terminu pobytu w szpitalu statystycznie znaczaca. oraz Biostatystyka p. 18

Halotan czy Morfina? oraz Biostatystyka p. 19

Wnioski t = 2,607 Wartość krytyczna na poziomie 5% 1,980 Morfina obniża ciśnienie krwi w mniejszym stopniu, niż halotan oraz Biostatystyka p. 20

Wskaźnik sercowy W badaniu został zmierzony również wskaźnik sercowy Halotan (n = 9) Morfina (n = 16) X 1 s 1 X 2 s 2 2,08 1,05 1,75 0,88 s 2 = 0,98 t = 0,84 ν = 23 Wartość krytyczna na poziomie 5% 2,069 Brak różnic statystycznych oraz Biostatystyka p. 21

Popularny bład w stosowaniu testut Test t Studenta opracowany jest dla porównywania dwóch próbek. Błędem jest stosowanie go dla większej ilości próbek. Przykładowo: Badano wpływ farmacutyków A i B na poziom glukozy w plasmie Trzy grupy: A, B, oraz placebo Trzy testy Studenta: dla każdej pary W jednym z testów t jest wystarczajaco duże Stwierdza się, że P < 5% Bład: prawdopodobieństwo blędnie odrzucić hipotezę zerowa jest znacznie większe! oraz Biostatystyka p. 22

Wpływ wielokrotnych porównań Jeżeli prawdopodobieństwo pomyłki w porównywaniu każdej pary grup jest P(= 0,05), to prawdopodobieństwo pomylić się w porównywaniu przynajmniej jednej z par wyniesie P = 1 (1 P) k, gdzie k jest liczba porównywań. W poprzednim przykadzie: P = 1 (1 0,05) 3 3 0,05 = 15% oraz Biostatystyka p. 23

Przykład Badano wpływ ludzkich hormonów na wzrost Marsjan my wiemy, że ludzkie hormoy nie działaj badacze nie wiedza, otrzymali wyniki: a na Marsjan oraz Biostatystyka p. 24

Testtdla przykładu grupy po 10 Marsjan test t wynosi: placebo testosteron 2,39 placebo estradiol 0,93 testosteron estradiol 1,34 ν = 18 wartośc krytyczna na poziomie 5%: 2,101 wnioski: 1. testosteron powoduje zmniejszenie wzrostu 2. estradiol nie powoduje zmiany wzrostu 3. działanie testosteronu nie różni się od działania estradiolu Co jest nie tak? oraz Biostatystyka p. 25

TestF dla przykładu F = 2,47 ν 1 = 2, ν 2 = 27 wartośc krytyczna na poziomie 5%: 3,35 wniosek: brak różnicy statystycznej oraz Biostatystyka p. 26

Podsumowanie Test Studenta wykorzystuje się tylko dla dwóch grup Jeżeli ilość grpu jest większa, należy korzystać z analizy wariancji Jeżeli test Studenta został wykorzystany dla większej ilości grup, to poziom ufności jest większy tyle razy, ile jest banadych grup oraz Biostatystyka p. 27

Test t-studenta dla porównań wielokrotnych porównujemy więcej niż jedna grupę testu t nie można zastosować analiza wariancji odrzuca hipotezę zerowa która z grup różni się statystycznie od innych? metody porównań wielokrotnych oparte na teście t-studenta oraz Biostatystyka p. 28

Współczynnik korekcji Bonferroniego Carlo Emilio Bonferroni, 1892 1960 Nierówność Bonferroniego Jeżeli zastosować k razy test o poziomie ufności α, to pradwopodobieństwo bładenie odrzucić hipotezę zerowa jest nie większe, niż kα: α < kα a więc, żeby zapewnić poziom ufności α, dla każdego porównania trzeba przyjać poziom α/k w szczególności, tla trzech grup 0,05/3 1,7% oraz Biostatystyka p. 29

Modyfikacja korekcji Bonferroniego Dla dużej liczby porównań (k 8) korekcja Bonferroniego staje się zbyt restrykcyjna Zmniejszmy restrykcyjność korekcji t = X 1 X 2, gdzie s 2 jest ocena zbiorcza wariancji s 2 + s2 n 1 n 2 jako oceny wariancji używamy oceny wariancji wewnętrznej s 2 wewn = 1 m ( s 2 1 + +s 2 m) t = X 1 X 2, + s2 wewn n 2 s 2 wewn n 1 dla prób tego samego rozmiaru t = X 1 = X 2 2s 2 wewn n, oraz Biostatystyka p. 30

Modyfikacja korekcji Bonferroniego, cd Ilość stopni swobody wyniesie ν = m(n 1) Jeżeli ilość grup m > 2, to ilość stopni swobody będzie większa niż 2(n 1) Co powoduje zmniejszenie wartości krytycznej t oraz Biostatystyka p. 31

Sport a zaburzenia miesiaczkowania oraz Biostatystyka p. 32

Sport a zaburzenia miesiaczkowania. Wyniki s 2 wewn = 3,95 m = 3,n = 26 ν = 75 t 2,1 = 2,54 t 3,1 = 4,35 t 2,3 = 1,81 poziom ufności α = 0,05/3 0,017 t krit = 2,45 wnoski: bieganie powoduje zmniejszenie częstotliwości miesiaczkowania nie ma różnicy statystycznej między bieganiem sportowym a bieganiem rekreacyjnym oraz Biostatystyka p. 33

Test Newmana-Keulsa Bardziej dokładne oszacowanie α niż korekta Bonferroniego, zwłaszcza dla dużej ilości porównań Za pomoca analizy wariancji sprawdzamy hipotezę zerowa Jeżeli zostaje odrzucona, to 1. uporzadkujemy grupy rosnaco względem średnich 2. dla wszystkich par obliczmay test Newmana-Keulsa q = s 2 wewn 2 X A X B ( 1 + 1 n1 n2) 3. porównujemy wynik z wartościa ktytyczna z tabeli oraz Biostatystyka p. 34

Wartośś krytyczna testu Newmana-Keulsa Zależy od α prawdopodobieństwo pomylić się przynajmniej w jednym porównywaniu ilość stopni swobody ν = N m, gdzie N jest suma liczebności wszystkich grup, a m jest ilościa grup przedział porównywań l jeżeli porównujemy grupę j z grupa i, to l = j i+1 oraz Biostatystyka p. 35

Kolejność porównywania testu Newmana-Keulsa Grupy uporzadkowane rosnaco: 1 minimalna średnia, m maksymalna m 1, m 2,..., m (m 1) (m 1) 1, (m 1) 2,..., (m 1) (m 2)............................. 3 1, 3 2 2 1 grupy i i j statystycznie się nie różnia, to nie ma potrzeby porównywać wszystkich pośrednich par przykładowo, jeżeli grupy 3 i 1 się nie różnia, to się nie różnia grupy 3 i 2, ani 2 i 1 oraz Biostatystyka p. 36

Sport a zaburzenia miesiaczkowania oraz Biostatystyka p. 37

Analiza Uporzadkujemy rosnaco 1. Bieganie sportowe X 1 = 9,1 2. Bieganie rekreacyjne X 2 = 10,1 3. Grupa kontrolna X 3 = 11,5 s wewn = 3,95, ν = 75, n 1 = n 2 = n 3 = 26 3 1 q = 6,157 l = 3, wartość krytyczna dla α = 0,05 wynosi 3,385 3 2 q = 3,592 l = 2, wartość krytyczna dla α = 0,05 wynosi 2,822 2 1 q = 2,566 oraz Biostatystyka p. 38

Test Tukeya Jak test Newmana-Keulsa, tylko zamiast l zawsze się bierze m Czyli wartość krytyczna jest taka sama W poprzednim przykładzie 3,385 3 1 q = 6,157 3 2 q = 3,592 2 1 q = 2,566 jest bardziej restrykcyjny, częsciej akceptuje hipotezę zerowa (częsciej odrzuca istnienie różnicy statystycznej) oraz Biostatystyka p. 39

Porównywanie z grupa kontrolna Zagadnienie polega na porównywaniu kilka grup z kontrolna Poprzednie metody moga niepotrzebnie zaostrzyć kriteria z powodu dużej ilości zbędnych porównywań Stosujue się inne, specjalnie opracowane metody Pierwszym krokiem zawsze jest analiza wariancji inne metody porównywania używamy tylko jeżeli hipoteza zerowa zostaje odrzucona oraz Biostatystyka p. 40

Korekta Bonferroniego Jak wyżej, z tym że ilość porównywań jest mniejsza α = α/k W poprzednim przykładzie: trzy grupy, jedna kontrolna 2 porównywania α = 0,05/2 = 0,025 (było 0,017) ν = 75 wartość krytyczna t = 2,31 (było 2,45) t 1,2 = 2,54 t 1,3 = 4,35 nic nie stwierdzamy o różnicy biegu rekreacyjnego i sportowego oraz Biostatystyka p. 41

Test Dunnetta Jest odmiana testu Newmana-Keulsa q = X kontr X A ) swewn( 2 1 n kontr + 1 n A Ilość porównań jest ilościa grup (bez kontrolnej) a więc mniejsza jest wartość krytyczna Upodrzadkowanie według wartości bezwzględnej różnicy średniej od średniej grupy kontrolnej Porównywanie się zaczyna od najwięcej różniacej się grupy Jeżeli pewna grupa nie różni się statystycznie od kontrolnej, to porównywanie się kończy Parametr l zgadza z ilościa grup m (lacznie z kontrolna) ν = N m (jak w teście Newmana-Keulsa) oraz Biostatystyka p. 42

Sport a zaburzenia miesiaczkowania oraz Biostatystyka p. 43

Analiza Bieganie sportowe: q = 4,35 ν = 75 l = 3, wartość krytyczna dla α = 0,05 wynosi 2,26 Bieganie rekreacyjne X 2 = 10,1 q = 2,54 oraz Biostatystyka p. 44

P < 0,05 P jest prawdopodobieństwem omyłkowo odrzucić hipotezę zerowa (znaleźć różnicę tam, gdzie jej nie ma) P jest prawdopodobieństwem błędu pierwszego rodzaju bład drugiego rodzaju omyłkowo przyjać hipotezę zerowa (nie zauważyć istniejacej różnicy) P nic nie mówi o błędzie drugiego rodzaju oraz Biostatystyka p. 45