TATYTYKA I ANALIZA DANYCH Zad. Z pewej partii włókie weły wylosowao dwie próbki włókie, a w każdej z ich zmierzoo średicę włókie różymi metodami. Otrzymao astępujące wyiki: I próbka: 50; średia średica włókie,9um, odchyleie stadardowe 4,6um II próbka: 0, średia średica włókie 3,um, odchyleie stadardowe 6,87um. Zweryfikować, a poziomie istotości 0,05; hipotezę, że obie metody pomiaru staowią tak samo dobrą miarę średicy włókie. Dae: PI : 50 śr,9um s 4,6um PII : 0 śr 3,um s6,87um Typowe zadaie, liczebość obu prób >30 więc korzystamy z PORÓWNANIE DUŻYCH PRÓB. Pierwszym krokiem w obliczeiu tego zadaia jest policzeie jej zmieej losowej (u w ) charakteryzującej się rozkładem ormalym. śr śr,9 3, uw 0,349 s s 4,6 6,87 + + 50 0. Następie wyzaczoą wartość u w porówuje się z szerokością przedziału określoego przez fukcję rozkładu ormalego, dla założoego prawdopodobieństwa P. Poziom istotości w aszym zadaiu jest rówy 0,05 5%, zatem asze prawdopodobieństwo w przedziale określoym fukcją rozkładu ormalego ma wyosić 95%. Zadae 95% zajduje się w zazaczoym a szaro obszarze. Dla tego prawdopodobieństwa ależy odczytać wartości u p i u p. Poieważ dyspoujemy tablicami jedostroymi musimy w pierwszej kolejości odczytać wartość u p. Prawdopodobieństwo dla przedziału,u p wyosi 97,5%, (95%+ lewy ogo, a o wyosi 0,5 5% ). Z tablic odczytujemy, iż wartość ta wyosi u p,96. Wiadomo, że rozkład ormaly jest rozkładem symetryczym, zatem skoro asze u p,96 to u p będzie logiczie wyosiło -,96. 3. Uzyskaa wartość u w 0,349 mieści się w przedziale ( u p ; u p ),96 < 0,349 <,96
Wówczas moża stwierdzić, iż porówae próby ależą do tej samej populacji geeralej z prawdopodobieństwem 95% (lub a zadaym poziomie istotości 0,05), Potwierdzeie przyależości do tej samej populacji geeralej jest też potwierdzeiem a zadae w treści zadaia pytaie. Zatem odpowiedź brzmi :Tak, obie te metody pomiaru staowią tak samo dobrą miarę średicy włókie z prawdopodobieństwem 95%. Zad. pośród ucziów pewego liceum wylosowao 5 z klas pierwszych oraz z klas drugich i obliczoo średią oce uzyskaych w półroczu dla każdego z tych ucziów. Otrzymao astępujące rezultaty: Klasa I: 3,7; 4,8;,95; 3,0; 3,38; 4,05; 4,07; 4,98; 3,0; 3,43; 3,09; 4,50; 3,; 3,68; 3,90 Klasa II: 3,0; 3,38; 4,06; 3,60; 3,8; 4,50; 4,00; 3,5; 4,; 4,85;,80; 4,00. Zweryfikować hipotezę, że przecięte ocey uzyskiwae przez ucziów badaych klas są jedakowe. We wszystkich obliczeiach przyjmij poziom istotości rówy 0,05. To kolejy przykład a porówywaie prób o różej liczebości (posiadamy dae dla różych grup oraz prosi się as aby je porówać). Aby je porówać ależy wybrać odpowiedią metodę. Liczebości obu klas ie przekraczają umowej graicy 30, zatem wykorzystamy tu metodę Porówaie małych prób. Zmiea losowa w tej metodzie charakteryzuje się rozkładem t-tudeta. Porówaie dwu prób o różej liczebości sprowadza się do obliczeia parametru tudeta t i porówaie go z parametrem krytyczym t,r.. Obliczamy parametr t: sr y sr m t m + Jak widać ze wzoru iezbęde są wartości średie dla obu prób oraz wariację zbiorczą, którą wyliczymy z wzoru : _ s ( m ) + sy ( ) 0,589 (5 ) + 0,59 ( ) 0,348 m + 5 + Mając już obliczoą wariację zbiorczą możemy przystąpić do obliczaia parametru t: 3,703 3,788 5 t 0,37 0,348 5 +. Następie ależy określić parametr krytyczy t,r. Dobieramy go a podstawie tablic rozkładu t-tudeta dla odpowiediej liczby stopi swobody (m+-) i zadaego poziomu istotości. W aszym przypadku liczba stopi swobody jest rówa 5; (5+-) i 0,05., r,06 t 3. t < t, r, zatem jest to potwierdzeie aszej hipotezy zerowej. Odpowiedź brzmi: tak, przecięte ocey uzyskiwae przez ucziów badaych klas są jedakowe. Zad.3 W czterech iezależych pomiarach głębokości oceau otrzymao astępujące wyiki (w km): 7,8; 7,5; 8, i 8,4. Określić średią głębokość oraz przedział ufości tej wielkości dla 0,05 Średia głębokość to ic iego jak średia arytmetycza z uzyskaych pomiarów. śr 7,975 km Przedział ufości zmieej losowej obliczamy ze wzoru:
µ ± t, gdzie to odchyleie stadardowe średiej śr posiada jedostkę, taką jak zmiea). 0,403 km 0,05 km _ ( pamiętając, iż oo też Parametr tudeta t odczytujemy z tablic t-tudeta dla 0,05 i liczby stopi swobody f(-)3. t 3,8 Zatem przedział ufości zmieej losowej przedstawia się astępująco: µ ± t 7,975 ± 3,8 0,05 7,975 ± 0,647 km śr Ostatecza postać po poprawym zaokrągleiu przedstawia się astępująco: µ 7,98 ± 0, 65km Zad.4 Średia próby o liczebości 49, spełiającej rozkład ormaly wyosi 5,5; a jej wariacja rówa się 8,5. Jaka część populacji będzie posiadała wartości większe od 30? Ile wyosi prawdopodobieństwo, iż z próby otrzymamy wartości miejsze iż 0? W każdym z podpuktów zadaia ależy policzyć prawdopodobieństwo. Wiemy, że próba charakteryzuje się rozkładem ormalym, zatem możemy skorzystać ze wzoru: śr u 30 5,5 u,54, z tablic rozkładu ormalego odczytamy wartość prawdopodobieństwa,95 (dystrybuaty) P dla przedziału ( ; u), która wyosi 93,8% lub 0,938, w aszym przypadku potrzeba jest wartość prawdopodobieństwa P dla (u >,54), obliczymy ją wiedząc, że całkowite prawdopodobieństwo pod krzywą Gaussa jest rówe 00% lub po prostu. Zatem 00-93,86,8%, tyle wyosi prawdopodobieństwo dla u >,54. W zadaiu wymagae jest od as abyśmy podali jaka część populacji ma wartości większe od 30. Obliczamy to możąc liczebość próby przez prawdopodobieństwo. > 30 49 0,068 3,0 W kolejym podpukcie, podobie jak w poprzedim, mamy obliczyć prawdopodobieństwo występowaia wartości miejszych od 0. Tok obliczeń wygląda prawie idetyczie jak wyżej. śr 0 5,5 u,89,95 Prawdopodobieństwo P dla (u<,89) wyosi 97,06%. P(u>,89) P(u<-,89) - 0,9706 0,094 3% Zad5. Dwóm grupom robotików zlecoo wykoaie tej samej pracy, przy czym roboticy I grupy przeszli wcześiej przeszkoleie. Wydajość pracy w I grupie kształtowała się astępująco (w szt./godz.) 8,6 7,9 8, 7,0 8,7 8,3; podczas gdy w II grupie zaobserwowao astępujące wydajości 7,3 7,6 7, 6,0 7,8. a poziomie istotości 0,05 zweryfikować hipotezę, że średia wydajość pracy zależy od uprzediego przeszkoleia.
Typowe zadaie a porówaie prób ( typowo dwie grupy różo liczebe). Liczebość miejsza od umowej wartości 30, zatem korzystamy z testu Porówaie małych prób IG: m6 śr 8, 0,368 IIG: 5 y śr 7,6 0,493 Obliczamy parametr tudeta t: t sr y _ sr m m + 8, 7,6 0,435 6 5 6 + 5,385 Wariację zbiorczą obliczamy ze wzoru: _ s ( m ) + sy ( ) 0,368(6 ) + 0,493(5 ) 0,435 m + 6 + 5 (jeśli ktoś ie zauważył, a się dziwi to podstawiłem od razu wartości wariacji) Następie wyzaczamy parametr krytyczy tudeta. Dla 9 stopi swobody (6+5-) i poziomu istotości 0,05, parametr te przyjmuje wartość:,6 Zatem > t,,385 >,6. Postawioa w zadaiu hipoteza została obaloa a zatem odpowiedź brzmi: Tak, średia wydajość pracy zależy od uprzediego przeszkoleia. Zad.6 Zawartość Fe O 3 w badaym roztworze ozaczao spektrofotometryczie (po utworzeiu barwego kompleksu rodakowego) i otrzymao astępujące wyiki (w mg/dm 3 ): 350; 34; 366; 350; 353; 343; 354; 358; 354; 360. Niezależie wykoaa seria 8 ozaczeń metodą grawimetryczą (po wytrąceiu jako Fe(OH) 3 ) dała wyiki śr 358,5; s 4. sprawdzić, czy wyik 366 z pierwszej serii obarczoy jest błędem grubym, a astępie zweryfikować hipotezy o jedakowej precyzji i dokładości obu metod (0,05) prawdzamy czy jakaś wartość jest obarczoa błędem grubym (czy ie pasuje do reszty wyików) za pomocą Testu Q-Dioa. Pierwszym krokiem jest uszeregowaie wyików w ciąg iemalejący: 34; 343; 350; 350; 353; 354; 354; 358; 360; 366 Następie Obliczamy zmieą losową tego testu, czyli Q: w s Q Gdzie: w to wyik wątpliwy. s to wyik sąsiadujący z wyikiem wątpliwym. R to rozstęp, czyli różica wyiku ostatiego i pierwszego. R 366-34 4 366 360 Q 0,5 4 Ostatim krokiem jest odczytaie z tablicy Q-Dioa parametru krytyczego Q kr i porówaie go z uzyskaą wartością Q. Odczytywaa wartość jest dla liczby pomiarów i prawdopodobieństwa P - Q kr 0,4 koro Q < Q kr, 0,5<0,4; możemy stwierdzić, iż wyik wątpliwy jest elemetem próby. R
Do porówaia precyzji dwóch metod aalityczych ajlepszym, choć ie jedyym, jest test F-edecora. Pierwszym krokiem w obliczeiach jest wyliczei wariacji dla obu prób, astępie podstawieie ich do wzoru: s F s Pamiętając, iż wariacja w licziku musi być większa od tej w miaowiku. s 4 s 53,778 ; podstawiając do wzoru otrzymujemy wartość parametru F: 4 F, 53,778 W ostatim już kroku porówujemy uzyskay parametr F z odczytaym z tablic parametrem krytyczym F kr. Parametr krytyczy odczytujemy w te sposób, że liczebość wariacji z miaowika odpowiada wierszom (m) z tablicy a liczebość z liczika kolumom (). Pamiętając, że odczytujemy (j-) i (k-). Gdzie j i k to liczebości poszczególych prób. F kr 3,9 F < F kr zatem możemy stwierdzić, iż obie metody są tak samo precyzyje. Czy obie metody są dokłade, określa am Porówaie małych prób. Obliczamy parametr tudeta t: sr y sr m 353 358,5 0 8 t,95 _ m + 80, 0 + 8 Wariację zbiorczą obliczyliśmy a podstawie wzoru: _ s ( m ) + sy ( ) 4(8 ) + 53,778(0 ) 80, m + 8 + 0 Następie wyzaczamy parametr krytyczy tudeta. Dla 6 stopi swobody (0+8-) i poziomu istotości rówego 0,05, parametr te przyjmuje wartość:, Zatem < t,,95 <,. Zatem stwierdzam, iż obie metody są jedakowo dokłade z prawdopodobieństwem 95%. Zad.7 W celu zbadaia czy istieje prostoliiowa korelacja pomiędzy krotością dawki pewego preparatu (zmiea ), a masą wątroby szczura w gramach (zmiea y), przeprowadzoo odpowiedie badaia i otrzymao astępujące wyiki: Krotość() 3 4 5 6 7 8 9 0 Masa (y) 3, 4,5 3,8 4,8 5,5 4, 3,5 5,0 5, 4,0 Na poziomie istotości a0,05 zweryfikować hipotezę o braku korelacji między krotością dawki preparatu, a masa wątroby szczura. Zadaie to moża policzyć wykorzystując aalizę regresji. W pierwszej kolejości ależy policzyć współczyik korelacji r (współczyik liiowości, przyjmuje wartości od 0 do i im bardziej zbliżoy do tym fukcja bardziej liiowa).
r r i i yi i i 0 46,8 55 43,7 i y i i i i i i y i [ 0 385 (55) ] [ 0 96,5 (43,7) ] i yi 0,3 Kwadrat współczyika korelacji r 0,pokazuje am jak bardzo ieliiowa/liiowa jest asza zależość ( w tym wypadku fukcja jest liiowa zaledwie w 0%). Nie moża jedak opierać się tylko a tym, trzeba sprawdzić istotość regresji. Obliczamy parametr t: 0 t r 0,3 0,986 ; gdzie liczebość r 0,097 A astępie porówujemy go z parametrem krytyczym t r,, który dla waruków aszego zadaia tz. 9 stopi swobody i 0,05 wyosi,6. t < t r, Zatem moża stwierdzić a poziomie istotości 0,05, iż ie ma korelacji (prostoliiowej zależości) pomiędzy krotością dawki preparatu, a masa wątroby szczura. Nie ma sesu obliczać parametry regresji prostoliiowej. Zad.8 Wykoao 0 pomiarów ciśieia wewątrz zbiorika próżiowego otrzymując astępujące wyiki (w kpa) ;43, 45, 44, 58, 47, 45, 38, 44, 48 i 46. Wyzaczyć przedział ufości średiej odrzucając ewetualie a mocy odpowiediego kryterium wyik(i) wątpliwe. Wyiki wątpliwe odrzucamy wykorzystując test Q-Dioa. Wartości ciśieia ależy uszeregować w ciąg iemalejący: 38; 43; 44; 44; 45; 45; 46; 47; 48; 58. Wartość średia wyosi 45,8; wyikiem wątpliwym wydaje się być 58. Aby to sprawdzić ależy obliczyć parametr Q i porówać go z parametrem krytyczym Q kr. w s Q R Gdzie: w to wyik wątpliwy. s to wyik sąsiadujący z wyikiem wątpliwym. R to rozstęp, czyli różica wyiku ostatiego i pierwszego. R 58-38 0 w s 58 48 Q 0,5 R 0 Parametr krytyczy Q kr odczytay z tablicy testu Q-Dioa, dla 95% prawdopodobieństwa i 0 pomiarów, wyosi 0,4. Q > Q kr Z 95% prawdopodobieństwem odrzucamy wyik wątpliwy. (za pomocą testu Q-Dioa moża odrzucić tylko jede wątpliwy wyik). Aby obliczyć przedział ufości wartości średiej ależy policzyć odchyleie stadardowe dla wartości po odrzuceiu wyiku wątpliwego. Następie odczytać wartość parametru t dla owej serii wartości ciśieia.
,877, my do obliczeń musimy użyć odchyleie stadardowe,877 średiej 0, 959 9 Parametr tudeta t odczytujemy z tablic dla poziomu istotości 0,05 i liczby stopi swobody rówej 9-8. t,306 Przedział ufości dla wartości średiej Obliczamy ze wzoru: µ ± t µ śr śr 45,8 ±,306 0,959 µ 45,8 ±,3