Statystyka w analizie i planowaniu eksperymentu

Podobne dokumenty
Statystyka w analizie i planowaniu eksperymentu

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

1 Testowanie hipotez statystycznych

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Statystyka w analizie i planowaniu eksperymentu

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Statystyka matematyczna

Testowanie hipotez statystycznych.

Statystyka w analizie i planowaniu eksperymentu

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka w analizie i planowaniu eksperymentu

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Matematyka i statystyka matematyczna dla rolników w SGGW

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Elementy statystyki STA - Wykład 5

Statystyka matematyczna. Wykład VI. Zesty zgodności

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Testowanie hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyczna analiza danych

Wykład 11 Testowanie jednorodności

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka matematyczna dla leśników

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Zadania ze statystyki cz.8. Zadanie 1.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Weryfikacja hipotez statystycznych testy t Studenta

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Weryfikacja hipotez statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

1 Estymacja przedziałowa

S t a t y s t y k a, część 3. Michał Żmihorski

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Hipotezy statystyczne

Hipotezy statystyczne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Kolokwium ze statystyki matematycznej

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Wykład 8 Dane kategoryczne

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Porównanie wielu rozkładów normalnych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Wykład 9 Wnioskowanie o średnich

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Centralne twierdzenie graniczne

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Porównanie dwóch rozkładów normalnych

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Testowanie hipotez statystycznych cd.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna i ekonometria

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Transkrypt:

19 kwietnia 2011

Testy dla dwóch grup 1 Analiza danych dla dwóch grup: test t-studenta dla dwóch grup sparowanych; test t-studenta dla dwóch grup niezależnych (jednakowe wariancje) test Z dla dwóch grup niezależnych (różne wariancje). 2 Analiza danych dla wi ekszej ilości grup:

Schemat doświadczenia Wykonaliśmy dwie serie pomiarów. W pierwszej serii wykonano n 1 pomiarów, które bedziemy oznaczać X 1,..., X n1. W drugiej serii wykonano n 2 pomiarów, które bedziemy oznaczać Y 1,..., Y n2. Przyjmujemy, ze wartości X i N (µ X, σ X ), oraz Y i N (µ Y, σ Y ). Przyjmujemy również (o ile nie zaznaczymy, że jest inaczej), że zarówno zmienne X i jak i Y i sa niezależne

grupy sparowane Jeżeli pomiary dotycza tych samych obiektów ale w różnych warunkach i interesuje nas weryfikacja hipotezy, czy średnia wartość badanej cechy pozosta la niezmieniona, należy zastosować test dla danych sparowanych. W tym przypadku, za statystyke testowa wybieramy T = Z n S Z gdzie Z i = X i Y i oznacza rożnic e elementów w parze. Przy prawdziwej hipotezie zerowej, statystyka ta ma rozk lad t-studenta o n 1 stopniach swobody (tutaj n = n 1 = n 2 ).

test t-studenta dla dwóch grup sparowanych - zadanie Zmierzono czas reakcji na bodziec 8 kierowców przed i w 15 minut po wypiciu 100g wódki. Wyniki przed wypiciem wódki by ly nastepuj ace (w sekundach) : 0.22, 0.18, 0.16, 0.19, 0.20, 0.23, 0.17, 0.25 a po wypiciu wódki: 0.28, 0.25, 0.20, 0.30, 0.9, 0.26, 0.28.0.24. Na poziomie istotności α = 0.05 zweryfikować hipoteze, że picie alkoholu zwieksza czas reakcji na bodziec.

Rozwiazanie Paired t-test data: y and x t = 1.704, df = 7, p-value = 0.06608 alternative hypothesis: true difference in means is greater 95 percent confidence interval: -0.01551726 Inf sample estimates: mean of the differences 0.13875

Test t-studenta dla dwóch grup niezależnych (znane wariancje) Jeżeli wariancje w obu grupach sa znane, to za statystyke testowa wybieramy T = X Ȳ σ 2 X n1 + σ2 Y n2 Przy prawdziwej hipotezie zerowej, ta statystyka ma rozk lad normalny N (0, 1). Ten test, nazywany jest też testem U.

przypadek dwóch grup niezależnych (nieznane ale równe wariancje) Jeżeli wariancje w obu grupach sa równe σ 1 = σ 2 ale nie sa znane, to za statystyke testowa wybieramy T = X Ȳ (n 1 1)Sn 2 1 1 +(n 2 1)Sn 2 2 1 n 1 +n 2 2 ( 1 n 1 + 1 n 2 ) Przy prawdziwej hipotezie zerowej, ta statystyka ma rozk lad t-studenta o n 1 + n 2 2 stopniach swobody.

Zadanie Badany jest lekzatrzymujacy rozwój bia laczki. Wybrano próbe losowa 9 myszy w zaawansowanym stadium choroby. Leczeniu poddano próbe 5 myszy. Te, które leczono przeży ly (w latach): 2.1, 5.3, 1.4, 4.6, 0.9. Myszy, które nie poddano leczeniu przeży ly 1.9, 0.5, 2.8, 3.1 lat. Przy za lożeniu, że czas życia jest w obydwu przypadkach zmienna losowa o rozk ladzie normalnym z tym samym odchyleniem standardowym. Przetestować hipoteze, że obydwa średnie czasy sa sobie równe.

Two Sample t-test data: x and y t = 0.699, df = 7, p-value = 0.5071 alternative hypothesis: true difference in means is not equ 95 percent confidence interval: -1.870604 3.440604 sample estimates: mean of x mean of y 2.860 2.075

Uwaga W sytuacji gdy nieznane sa wariancje i nie jesteśmy pewni czy sa one równe, testujemy wtedy hipoteze o równości wariancji (Test F opisany w dalszej cześci).

W przypadku gdy mamy dwie próby pochodzace z rozk ladu normalnego o wariancjach, które nie sa znane przy czym rozmiary prób sa duże, do sprawdzenia hipotezy zerowej używa sie wtedy testu opartego na statystyce: Z = S 2 n X n X X Ȳ + S2 n Y n Y

Testy o wariancji Niech X 1, X 2,..., X n bedzie próba z rozk ladu normalnego N (µ, σ) gdzie zarówno parametr µ jak i parametr σ nie sa znane. Chcemy przetestować nastepuj ac a hipoteze: H 0 : σ = σ 0 ; H 1 : σ σ 0.

Testy o wariancji Uwaga Jeżeli próba losowa X 1, X 2,..., X n pochodzi z rozk ladu normalnego N (µ, σ), to statystyka n 1 σ 2 S2 n 1 ma rozk lad χ 2 z n 1 stopniami swobody.

Testy o wariancji 0.00 0.04 0.08 0.00 0.04 0.08 0 5 10 15 20 25 30 0 5 10 15 20 25 30 0.00 0.04 0.08 0 5 10 15 20 25 30

Testy o wariancji - zadanie Dla określenia dok ladności pomiarów nowo skonstruowanym aparatem wykonano 9 pomiarów danej wielkości uzyskujac dane: 6.15, 6.19, 6.03, 6.12, 6.17, 6.20, 6.04, 6.06, 6.07. Zweryfikować na poziomie istotności α = 0.05 hipoteze dotyczac a wariancji σ 2 wskazań aparatu: H 0 : σ 2 = 0.003 H 1 : σ 2 0.003.

Testy o wariancji - problem dwóch prób Niech X 1, X 2,..., X n oraz Y 1, Y 2,..., Y n bed a to próby losowe pochodzace z rozk ladów odpowiednio N (µ X, σ X ) oraz N (µ Y, σ Y ). Naszym celem jest przetestowanie nastepuj acej hipotezy: H 0 : σ X = σ Y ; H 1 : σ X σ Y.

Testy o wariancji - problem dwóch prób Uwaga Jeżeli próby losowe X 1, X 2,..., X n1 oraz Y 1, Y 2,..., Y n2 pochodza z rozk ladu normalnego N (µ X, σ) oraz N (µ Y, σ), to statystyka F = S2 n 1 1 S 2 n 2 1 ma rozk lad F -Snedeckora o n 1 1 i n 2 1 stopniach swobody.

Rozk lad F funkcje gęstości rozkładu F dla zadanych parametrów df(z, 10, 10) 0.0 0.5 1.0 1.5 F(10,10) F(20,20) F(30,30) 0 1 2 3 4 5 z

Interpretacja rozk ladu F F(20,20) Density 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 z

Przyk lad Analizujac rozk lad cen wynajecia mieszkania 1-pokojowego w Warszawie i we Wroc lawiu pobrano losowo dwie próby i obliczono na ich podstawie wariancje Warszawa n 1 = 9 Sn 1 2 = 1600zl 2 Wroc law n 2 = 6 Sn 1 2 = 1225zl 2 Co można powiedzieć o zróżnicowaniu cen? 1 Wartość statystyki F wynosi: 1.22448979591837 2 p- wartość wynosi: 0.430001156076604

Zadanie Panuje poglad, iż meżczyźni maja lepsze oceny z matematyki niż kobiety. W celu sprawdzenia pobrano dwie próby studentów, otrzymujac nastepuj ace charakterystyki: 1 Meżczyźni n 1 = 22, x = 3.52, S n 1 = 0.82; 2 Kobiety n 2 = 17, x = 3.61, S n 1 = 0.93. Sprawdź czy ten poglad jest prawdziwy.

Analiza wariancji klasyfikacja jednokierunkowa - wst ep Przypuśćmy, że chcemy porównać wieksz a (niż dwie) liczbe grup. Aby porównać średnie w kilku grupach, można przeprowadzić analize wariancji.

Wykonaliśmy k serii pomiarów. W serii i wykonaliśmy n i pomiarów. Pomiary w serii i oznaczamy przez X i1,..., X ini N (µ, σ i ) (wariancje sa równe dla wszystkich grup!!!) Przyjmujemy, że wartości X ji oraz, że zmienne X ji sa niezależne.

Stosowane modele

Analiza wariancji klasyfikacja jednokierunkowa Interesuje nas hipoteza zerowa postaci H 0 = µ 1 = µ 2 =... = µ k a hipoteze alternatywna możemy sformu lować w nastepuj acy sposób: Przynajmniej jedna ze średnich różni si e istotnie od pozosta lych

Analiza wariancji klasyfikacja jednokierunkowa Statystyka testowa w analizie wariancji jest: gdzie n = n i oraz F = SSA/(k 1) SSE/(n k) SSA = k k (ȳ i ȳ ) 2 n i, SSE = (y ij ȳ i ) 2. n i=1 j=1 Dla prawdziwej hipotezy zerowej, ta statystyka testowa ma rozk lad F Snedecora z k 1 i n k stopniami swobody.

kilka wzorów - może sie przydadza SST = SSA = SSE = k n i yij 2 nȳ i=1 j=1 k i=1 i=1 j=1 n i ȳi 2 nȳ 2 k n i yij 2 k i=1 SST = SSA + SSE n i ȳ 2 i

Zadanie Tablica: Przeżywalność chrzaszczy MPO: 58 60 51 66 62 MP5: 65 70 64 75 68 MP2: 69 62 70 63 65 MPR: 63 68 68 60 66

Analiza - wariancji jak to dzia la? Dla tych danych bedziemy testować hipoteze zerowa zak ladajac a, że nie ma różnic w przeżywalności chrzaszczy. Tablica: Średnie dla grup chrz aszczy MPO: Ȳ 1 = 59.4 MP5: Ȳ 2 = 68.4 MP2: Ȳ 3 = 65.8 MPR: Ȳ 4 = 65 Srednia dla wszystkich elementów Ȳ = 64.65.

Analiza wariancji - jak to dzia la? Zatem SSA = 215.35 a SSE = 299.20. Statystyka F przyjmuje postać F = 215.35/3 299.20/16 = 3.83868092691622 Porównajmy wartość powyższa z wartościa F 0.05,3,16 = 3.24. Otrzymana z obliczeń wartość F jest wieksza od wartośc krytycznej zatem odrzucamy hipoteze zerowa o braku wp lywu pożywki na przeżywalności chrzaszczy

Zadanie W pewnej pasiece używano nastepuj acych typów uli: A typ wielkopolski; B typ warszawski; C typ wielokorpusowy. W każdym z tych typów mamy po cztery ule. Z uli tych zebrano w ciagu roku nastepuj ace ilości miodu w kilogramach: Tablica: ilość miodu w kilogramach A: 40.5 38.0 42.1 41.3 B: 38.2 33.4 32.5 32.5 MP2: 40.0 44.6 41.2 41.3 Sprawdź czy typ ula ma wp lyw na ilość wyprodukowanego miodu.

Zadanie Do pewnych doświadczeń farmakologicznych hodowane sa cztery grupy królików pod wzgledem wagi. Wybrano losowo po 5 królików z poszczególnych grup i otrzymano nastepuj ace wagi:

I II III IV 2.95 3.20 3.05 3.00 2.80 3.05 3.30 3.30 3.10 2.90 3.15 2.75 3.00 3.05 3.20 2.85 3.15 3.05 2.80 3.10 Na poziomie istotności α = 0.1 zweryfikować hipotez e, że wariancja wagi królików we wszystkich czterech grupach jest taka sama.