Statystyka w analizie i planowaniu eksperymentu

19 kwietnia 2011

Testy dla dwóch grup 1 Analiza danych dla dwóch grup: test t-studenta dla dwóch grup sparowanych; test t-studenta dla dwóch grup niezależnych (jednakowe wariancje) test Z dla dwóch grup niezależnych (różne wariancje). 2 Analiza danych dla wi ekszej ilości grup:

Schemat doświadczenia Wykonaliśmy dwie serie pomiarów. W pierwszej serii wykonano n 1 pomiarów, które bedziemy oznaczać X 1,..., X n1. W drugiej serii wykonano n 2 pomiarów, które bedziemy oznaczać Y 1,..., Y n2. Przyjmujemy, ze wartości X i N (µ X, σ X ), oraz Y i N (µ Y, σ Y ). Przyjmujemy również (o ile nie zaznaczymy, że jest inaczej), że zarówno zmienne X i jak i Y i sa niezależne

grupy sparowane Jeżeli pomiary dotycza tych samych obiektów ale w różnych warunkach i interesuje nas weryfikacja hipotezy, czy średnia wartość badanej cechy pozosta la niezmieniona, należy zastosować test dla danych sparowanych. W tym przypadku, za statystyke testowa wybieramy T = Z n S Z gdzie Z i = X i Y i oznacza rożnic e elementów w parze. Przy prawdziwej hipotezie zerowej, statystyka ta ma rozk lad t-studenta o n 1 stopniach swobody (tutaj n = n 1 = n 2 ).

test t-studenta dla dwóch grup sparowanych - zadanie Zmierzono czas reakcji na bodziec 8 kierowców przed i w 15 minut po wypiciu 100g wódki. Wyniki przed wypiciem wódki by ly nastepuj ace (w sekundach) : 0.22, 0.18, 0.16, 0.19, 0.20, 0.23, 0.17, 0.25 a po wypiciu wódki: 0.28, 0.25, 0.20, 0.30, 0.9, 0.26, 0.28.0.24. Na poziomie istotności α = 0.05 zweryfikować hipoteze, że picie alkoholu zwieksza czas reakcji na bodziec.

Rozwiazanie Paired t-test data: y and x t = 1.704, df = 7, p-value = 0.06608 alternative hypothesis: true difference in means is greater 95 percent confidence interval: -0.01551726 Inf sample estimates: mean of the differences 0.13875

Test t-studenta dla dwóch grup niezależnych (znane wariancje) Jeżeli wariancje w obu grupach sa znane, to za statystyke testowa wybieramy T = X Ȳ σ 2 X n1 + σ2 Y n2 Przy prawdziwej hipotezie zerowej, ta statystyka ma rozk lad normalny N (0, 1). Ten test, nazywany jest też testem U.

przypadek dwóch grup niezależnych (nieznane ale równe wariancje) Jeżeli wariancje w obu grupach sa równe σ 1 = σ 2 ale nie sa znane, to za statystyke testowa wybieramy T = X Ȳ (n 1 1)Sn 2 1 1 +(n 2 1)Sn 2 2 1 n 1 +n 2 2 ( 1 n 1 + 1 n 2 ) Przy prawdziwej hipotezie zerowej, ta statystyka ma rozk lad t-studenta o n 1 + n 2 2 stopniach swobody.

Zadanie Badany jest lekzatrzymujacy rozwój bia laczki. Wybrano próbe losowa 9 myszy w zaawansowanym stadium choroby. Leczeniu poddano próbe 5 myszy. Te, które leczono przeży ly (w latach): 2.1, 5.3, 1.4, 4.6, 0.9. Myszy, które nie poddano leczeniu przeży ly 1.9, 0.5, 2.8, 3.1 lat. Przy za lożeniu, że czas życia jest w obydwu przypadkach zmienna losowa o rozk ladzie normalnym z tym samym odchyleniem standardowym. Przetestować hipoteze, że obydwa średnie czasy sa sobie równe.

Two Sample t-test data: x and y t = 0.699, df = 7, p-value = 0.5071 alternative hypothesis: true difference in means is not equ 95 percent confidence interval: -1.870604 3.440604 sample estimates: mean of x mean of y 2.860 2.075

Uwaga W sytuacji gdy nieznane sa wariancje i nie jesteśmy pewni czy sa one równe, testujemy wtedy hipoteze o równości wariancji (Test F opisany w dalszej cześci).

W przypadku gdy mamy dwie próby pochodzace z rozk ladu normalnego o wariancjach, które nie sa znane przy czym rozmiary prób sa duże, do sprawdzenia hipotezy zerowej używa sie wtedy testu opartego na statystyce: Z = S 2 n X n X X Ȳ + S2 n Y n Y

Testy o wariancji Niech X 1, X 2,..., X n bedzie próba z rozk ladu normalnego N (µ, σ) gdzie zarówno parametr µ jak i parametr σ nie sa znane. Chcemy przetestować nastepuj ac a hipoteze: H 0 : σ = σ 0 ; H 1 : σ σ 0.

Testy o wariancji Uwaga Jeżeli próba losowa X 1, X 2,..., X n pochodzi z rozk ladu normalnego N (µ, σ), to statystyka n 1 σ 2 S2 n 1 ma rozk lad χ 2 z n 1 stopniami swobody.

Testy o wariancji 0.00 0.04 0.08 0.00 0.04 0.08 0 5 10 15 20 25 30 0 5 10 15 20 25 30 0.00 0.04 0.08 0 5 10 15 20 25 30

Testy o wariancji - zadanie Dla określenia dok ladności pomiarów nowo skonstruowanym aparatem wykonano 9 pomiarów danej wielkości uzyskujac dane: 6.15, 6.19, 6.03, 6.12, 6.17, 6.20, 6.04, 6.06, 6.07. Zweryfikować na poziomie istotności α = 0.05 hipoteze dotyczac a wariancji σ 2 wskazań aparatu: H 0 : σ 2 = 0.003 H 1 : σ 2 0.003.

Testy o wariancji - problem dwóch prób Niech X 1, X 2,..., X n oraz Y 1, Y 2,..., Y n bed a to próby losowe pochodzace z rozk ladów odpowiednio N (µ X, σ X ) oraz N (µ Y, σ Y ). Naszym celem jest przetestowanie nastepuj acej hipotezy: H 0 : σ X = σ Y ; H 1 : σ X σ Y.

Testy o wariancji - problem dwóch prób Uwaga Jeżeli próby losowe X 1, X 2,..., X n1 oraz Y 1, Y 2,..., Y n2 pochodza z rozk ladu normalnego N (µ X, σ) oraz N (µ Y, σ), to statystyka F = S2 n 1 1 S 2 n 2 1 ma rozk lad F -Snedeckora o n 1 1 i n 2 1 stopniach swobody.

Rozk lad F funkcje gęstości rozkładu F dla zadanych parametrów df(z, 10, 10) 0.0 0.5 1.0 1.5 F(10,10) F(20,20) F(30,30) 0 1 2 3 4 5 z

Interpretacja rozk ladu F F(20,20) Density 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 z

Przyk lad Analizujac rozk lad cen wynajecia mieszkania 1-pokojowego w Warszawie i we Wroc lawiu pobrano losowo dwie próby i obliczono na ich podstawie wariancje Warszawa n 1 = 9 Sn 1 2 = 1600zl 2 Wroc law n 2 = 6 Sn 1 2 = 1225zl 2 Co można powiedzieć o zróżnicowaniu cen? 1 Wartość statystyki F wynosi: 1.22448979591837 2 p- wartość wynosi: 0.430001156076604

Zadanie Panuje poglad, iż meżczyźni maja lepsze oceny z matematyki niż kobiety. W celu sprawdzenia pobrano dwie próby studentów, otrzymujac nastepuj ace charakterystyki: 1 Meżczyźni n 1 = 22, x = 3.52, S n 1 = 0.82; 2 Kobiety n 2 = 17, x = 3.61, S n 1 = 0.93. Sprawdź czy ten poglad jest prawdziwy.

Analiza wariancji klasyfikacja jednokierunkowa - wst ep Przypuśćmy, że chcemy porównać wieksz a (niż dwie) liczbe grup. Aby porównać średnie w kilku grupach, można przeprowadzić analize wariancji.

Wykonaliśmy k serii pomiarów. W serii i wykonaliśmy n i pomiarów. Pomiary w serii i oznaczamy przez X i1,..., X ini N (µ, σ i ) (wariancje sa równe dla wszystkich grup!!!) Przyjmujemy, że wartości X ji oraz, że zmienne X ji sa niezależne.

Stosowane modele

Analiza wariancji klasyfikacja jednokierunkowa Interesuje nas hipoteza zerowa postaci H 0 = µ 1 = µ 2 =... = µ k a hipoteze alternatywna możemy sformu lować w nastepuj acy sposób: Przynajmniej jedna ze średnich różni si e istotnie od pozosta lych

Analiza wariancji klasyfikacja jednokierunkowa Statystyka testowa w analizie wariancji jest: gdzie n = n i oraz F = SSA/(k 1) SSE/(n k) SSA = k k (ȳ i ȳ ) 2 n i, SSE = (y ij ȳ i ) 2. n i=1 j=1 Dla prawdziwej hipotezy zerowej, ta statystyka testowa ma rozk lad F Snedecora z k 1 i n k stopniami swobody.

kilka wzorów - może sie przydadza SST = SSA = SSE = k n i yij 2 nȳ i=1 j=1 k i=1 i=1 j=1 n i ȳi 2 nȳ 2 k n i yij 2 k i=1 SST = SSA + SSE n i ȳ 2 i

Zadanie Tablica: Przeżywalność chrzaszczy MPO: 58 60 51 66 62 MP5: 65 70 64 75 68 MP2: 69 62 70 63 65 MPR: 63 68 68 60 66

Analiza - wariancji jak to dzia la? Dla tych danych bedziemy testować hipoteze zerowa zak ladajac a, że nie ma różnic w przeżywalności chrzaszczy. Tablica: Średnie dla grup chrz aszczy MPO: Ȳ 1 = 59.4 MP5: Ȳ 2 = 68.4 MP2: Ȳ 3 = 65.8 MPR: Ȳ 4 = 65 Srednia dla wszystkich elementów Ȳ = 64.65.

Analiza wariancji - jak to dzia la? Zatem SSA = 215.35 a SSE = 299.20. Statystyka F przyjmuje postać F = 215.35/3 299.20/16 = 3.83868092691622 Porównajmy wartość powyższa z wartościa F 0.05,3,16 = 3.24. Otrzymana z obliczeń wartość F jest wieksza od wartośc krytycznej zatem odrzucamy hipoteze zerowa o braku wp lywu pożywki na przeżywalności chrzaszczy

Zadanie W pewnej pasiece używano nastepuj acych typów uli: A typ wielkopolski; B typ warszawski; C typ wielokorpusowy. W każdym z tych typów mamy po cztery ule. Z uli tych zebrano w ciagu roku nastepuj ace ilości miodu w kilogramach: Tablica: ilość miodu w kilogramach A: 40.5 38.0 42.1 41.3 B: 38.2 33.4 32.5 32.5 MP2: 40.0 44.6 41.2 41.3 Sprawdź czy typ ula ma wp lyw na ilość wyprodukowanego miodu.

Zadanie Do pewnych doświadczeń farmakologicznych hodowane sa cztery grupy królików pod wzgledem wagi. Wybrano losowo po 5 królików z poszczególnych grup i otrzymano nastepuj ace wagi:

I II III IV 2.95 3.20 3.05 3.00 2.80 3.05 3.30 3.30 3.10 2.90 3.15 2.75 3.00 3.05 3.20 2.85 3.15 3.05 2.80 3.10 Na poziomie istotności α = 0.1 zweryfikować hipotez e, że wariancja wagi królików we wszystkich czterech grupach jest taka sama.