Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym. Zadania: Arkusz kalkulacyjny Excel Do weryfikacji różnic między dwiema grupami obiektów w Excelu wykorzystujemy funkcję o nazwie TEST.T. Daje ona w wyniku prawdopodobieństwo związane z testem t Studenta. Funkcja ta należy do kategorii statystycznych i możemy ją stosować do określenia, czy istnieje prawdopodobieństwo, że dwie próbki pochodzą z tych samych podległych populacji, które mają taką samą wartość średnią. Zastosowany test statystyczny pozwala ocenić czy mamy podstawy do przyjęcia H o lub jej odrzuceniu na korzyść H 1 z określonym prawdopodobieństwem popełnienia błędu I rodzaju (poziom istotności). Błąd ten informuje o tym jakie jest prawdopodobieństwo odrzucenia H o, gdy jest ona prawdziwa. Tak należy traktować wartości liczbowe będące skutkiem zadziałania m.in. funkcji Test.T. Składnia TEST.T(tablica1;tablica2;ślady;typ) Tablica1 - pierwszy grupa obserwacji. Tablica2 - druga grupa obserwacji. Ślady - określa czy użyty test statystyczny ma być jednostronny (ślady=1) czy też dwustronny ( ślady = 2). Typ - jest to rodzaj testu t, który ma być przeprowadzony. Jeżeli typ równa się Przeprowadzany jest ten test 1 Sparowany 2 Wariancja równa dla dwóch prób homoscedastyczna) 3 Wariancja nierówna dla dwóch prób heteroscedastyczna) Uwagi Jeżeli tablica1 i tablica2 mają inną liczbę punktów danych, a typ = 1 (sparowane), wówczas funkcja TEST.T daje w wyniku wartość błędu #N/D Argumenty ślady i typ są sprowadzane do najbliższych mniejszych liczb całkowitych. Jeżeli argument ślady lub typ nie jest liczbowy, funkcja TEST.T daje w wyniku wartość błędu #ARG!. Jeżeli argument ślady ma wartość inną niż 1 lub 2, funkcja TEST.T daje w wyniku wartość błędu #LICZBA!. Jeśli obliczona wartość jest mniejsza niż 0,05 (niż minimalny założony poziom istotności to odrzucamy H o na korzyść H 1 ).
Autor: Dariusz Piwczyński 2 Przykładowe rozwiązanie: Zadanie 2. Średnia wydajność mleka w badanej populacji próbnej wyniosła 4888 kg mleka. Zweryfikujemy hipotezę zerową, zakładającą, iż średnia wydajność mleka w populacji bydła rasy ncb (mieszańce z HF) wynosi 4888 kg. H 0: µ = 4888 kg; H 1 : µ 4888 kg ods rtf body='e:\dane\nazwisko\ttest_h0.rtf'; Title 'Weryfikujemy hipoteze zerowa zakladajaca, iz wydajnosc mleka w populacji generalnej wynosi 4888'; proc ttest data=krowy.mleko h0=4888; var mlkg; run; ods rtf close; Wyniki zapisane w pliku ttest_h0.rtf Statistics Variable N Upper Lower Std Dev Upper Std Err Minimum Maximum mlkg 4 0 4509.1 4888. 3 5267.4 971.23 1185. 6 1522.4 187.47 2610 7280.4 dolna, lewa strona przedziału ufności Upper górna, prawa strona przedziału ufności średnia odchylenie standardowe T-Tests Variable DF Warto ść t Pr > t mlkg 39 0.00 0.998 9 DF liczba stopni swobody Prawdopodobieństw związane z testem T (0,9989) dowodzi, iż nie mamy podstaw do odrzucenia hipotezy zerowej, zakładającej, iż średnia wydajność mleka wynosi 4888 kg. Nie oznacza to jednak, że omawiana wydajność właśnie tyle wynosi! Nie udało nam się wykazać, iż wydajność mleka jest różna aniżeli 4888 kg. Zadanie 3. Weryfikujemy istotność różnic między krowami będącymi w 1 i 2 laktacji w zakresie cech mleczności. Kolejność działań: a) za pomocą procedury UNIVARIATE weryfikujemy hipotezę zerową o zgodności rozkładu analizowanych cech z rozkładem normalnym. b) weryfikujemy hipotezę zerową o równości wariancji w porównywanych populacjach:
Autor: Dariusz Piwczyński 3 H 0: D 2 (X 1 ) = D 2 (X 2 ); D 2 (X 1 ) D 2 (X 2 ) c) Weryfikujemy hipotezę zerową o równości wartości oczekiwanych porównywanych populacji, tj. krów będących w 1 i 2 laktacji: H 0: E(X 1 ) = E(X 2 ); E(X 1 ) E(X 2 ) UWAGA! W SAS testy weryfikujące istotność różnic między średnimi umieszczone są w WYNIKACH przed testami równości wariancji. ods rtf body='e:\dane\nazwisko\ttest.rtf'; title 'Comparing Group s'; proc ttest data=krowy.mleko cochran; where lakt LE 2; class lakt; var mlkg--kg_tb; run; ods rtf close; Variable lakt N Upper Statistics Upper Std Err Minimum Maximum mlkg 1 13 4030 4539.2 5048.3 604.18 842.55 1390.8 233.68 3075.9 5909.2 mlkg 2 13 3916.7 4417.3 4917.9 594 828.35 1367.4 229.74 3312 5884.7 mlkg Diff (1-2) -554.5 121.88 798.23 652.37 835.48 1162.3 327.7 tkg 1 13 168.34 181.55 194.77 15.684 21.871 36.104 6.066 146.95 229.6 tkg 2 13 168.37 192.49 216.62 28.628 39.922 65.901 11.072 140.58 281.98 tkg Diff (1-2) -37-10.94 15.119 25.133 32.188 44.779 12.625 bkg 1 13 120.28 135.97 151.66 18.617 25.962 42.856 7.2005 87.56 172.78 bkg 2 13 125.49 143.45 161.4 21.303 29.708 49.04 8.2394 96.59 194.38 bkg Diff (1-2) -30.06-7.474 15.11 21.783 27.898 38.81 10.942 t 1 13 3.7986 4.0623 4.326 0.3129 0.4364 0.7203 0.121 3.42 4.78 t 2 13 3.9948 4.3938 4.7929 0.4735 0.6603 1.09 0.1831 3.24 5.46 t Diff (1-2) -0.785-0.332 0.1215 0.437 0.5597 0.7786 0.2195 b 1 13 2.8959 2.9954 3.0949 0.1181 0.1647 0.2719 0.0457 2.73 3.23 B 2 13 3.1007 3.2431 3.3855 0.169 0.2357 0.389 0.0654 2.86 3.76 B Diff (1-2) -0.412-0.248-0.083 0.1587 0.2033 0.2828 0.0797 VCM 1 13 4397 4877.9 5358.8 570.62 795.75 1313.6 220.7 3393.6 6181.7 VCM 2 13 4543.8 5172.9 5801.9 746.46 1041 1718.4 288.71 3643.8 7233.7 VCM Diff (1-2) -1045-295 455.04 723.44 926.51 1288.9 363.41 Kg_TB 1 13 289.94 317.53 345.11 32.735 45.65 75.356 12.661 234.51 402.38 Kg_TB 2 13 295.62 335.94 376.26 47.845 66.721 110.14 18.505 246.7 476.36 Kg_TB Diff (1-2) -64.69-18.41 27.864 44.636 57.165 79.525 22.422 Jaka różnica????? Prawdopodobieństwo P > 0.05 P 0.05 P 0.01 P 0.001 Określenie istotności różnic Nieistotna statystycznie istotna statystycznie Wysoko istotna statystycznie Bardzo wysoko istotna statystycznie
Autor: Dariusz Piwczyński 4 b) Equality of Variances (Równość wariancji) Wartość Variable Method Num DF Den DF F Pr > F mlkg Folded F 12 12 1.03 0.9540 tkg Folded F 12 12 3.33 0.0471 bkg Folded F 12 12 1.31 0.6480 t Folded F 12 12 2.29 0.1656 b Folded F 12 12 2.05 0.2289 VCM Folded F 12 12 1.71 0.3649 kg_tb Folded F 12 12 2.14 0.2030 Przeprowadzona analiza statystyczna dowodzi, iż istnieją podstawy do odrzucenia H 0 o równości wariancji wyłącznie w odniesieniu do wydajności tłuszczu (kg). Przyjmujemy zatem, iż zmienność w populacji krów będących w pierwszej i drugiej laktacji jest statystycznie różna. Nie mamy podstaw do odrzucenia H 0 w przypadku pozostałych cech zakładamy zatem, iż zmienność w porównywanych populacjach jest podoba. c)wykonana wcześniej analiza równości wariancji była konieczna, abyśmy mogli dokonać prawidłowego wyboru testu istotności różnic między średnimi. Ponieważ odrzuciliśmy H 0 o równości wariancji wyłącznie w przypadku wydajności tłuszczu (kg), zatem tylko w przypadku tej cechy poszukujemy wartości t w miejscu, gdzie w kolumnie Method znajduje się komunikat: Cochran, ewentualnie Satterthwaite. W zakresie pozostałych cech statystyki t i prawdopodobieństwa z nią związanego szukamy na wysokości Equal, kolumna Variances. T-Tests Variable Method Variances DF Wartosc t Pr > t mlkg Pooled Equal 24 0.37 0.7132 mlkg Satterthwaite Unequal 24 0.37 0.7132 mlkg Cochran Unequal 12 0.37 0.7164 tkg Pooled Equal 24-0.87 0.3949 tkg Satterthwaite Unequal 18.6-0.87 0.3973 tkg Cochran Unequal 12-0.87 0.4033 bkg Pooled Equal 24-0.68 0.5011 bkg Satterthwaite Unequal 23.6-0.68 0.5013 bkg Cochran Unequal 12-0.68 0.5076 t Pooled Equal 24-1.51 0.1440 t Satterthwaite Unequal 20.8-1.51 0.1460 t Cochran Unequal 12-1.51 0.1568 b Pooled Equal 24-3.11 0.0048 b Satterthwaite Unequal 21.5-3.11 0.0053 b Cochran Unequal 12-3.11 0.0091 VCM Pooled Equal 24-0.81 0.4249 VCM Satterthwaite Unequal 22.5-0.81 0.4255 VCM Cochran Unequal 12-0.81 0.4327 kg_tb Pooled Equal 24-0.82 0.4196 kg_tb Satterthwaite Unequal 21.2-0.82 0.4207 kg_tb Cochran Unequal 12-0.82 0.4276 Przeprowadzone badania pozwalają odrzucić H 0 o równości wartości oczekiwanych wyłącznie w odniesieniu do procentowej zawartości białka. Możemy zatem stwierdzić, iż krowy będące w pierwszej i drugiej laktacji różnią się między sobą statystycznie pod względem procentowej zawartości białka w mleku. Mleko krów, które znajdowały się w drugiej laktacji zawierało 3,24 % białka, tj. o 0,5 j.p. (jednostki procentowej) więcej aniżeli mleko pierwiastek. Różnica między średnimi była wysoko istotna statystycznie. Nie stwierdzono różnic istotnych statystycznie między laktacjami w zakresie pozostałych cech mleczności.
Autor: Dariusz Piwczyński 5 Zadanie 1. Test t dla prób niezależnych Otwórz plik S:\USM_STAT\Bazy_xls\OCZY.XLS Sprawdź czy pomiędzy średnią grubością w centrum rogówki i na obwodzie istnieją różnice istotne statystycznie. UWAGA! NIE SUGEROWAĆ SIĘ WPISANYMI ZAKRESAMI GRUP Czy wariancje są równe? Test F! =test.f(x1:x30;x31:x62). Jeżeli wynik formuły jest mniejszy lub równy 0,05, to wariancje są nierówne. Jest to niezbędne do podjęcia decyzji o rodzaju testu. 1. Wstaw funkcję Test.T Kategoria statystyczne 2. Podaj zakres pierwszej grupy, np. d2:d9 (Tablica 1) 3. Podaj zakres drugiej grupy, np. d10:d24 (Tablica 2) 4. Wpisać 2 w okienku Ślady test dwustronny 5. W okienku Typ określić rodzaj testu dwie próby o równej wariancji 2 ( nierównej 3) Wynik formuły (PRZYKŁADOWY) =0,007759956 (0,01) jest komputerowym poziomem prawdopodobieństwa, tzw. prawdopodobieństwo testowe (p). Jeżeli α p, to na danym poziomie α odrzucamy hipotezę zerową. Z kolei, jeżeli α < p, to na danym poziomie istotności nie ma podstaw do odrzucenia hipotezy zerowej. Odpowiedź: Uzyskane wyniki dają podstawę do odrzucenia hipotezy zerowej, czyli pomiędzy grubością rogówki na obwodzie i w jej centrum występują różnice wysoko istotne statystycznie. Zadanie 2. Pary wiązane Zweryfikuj istotność różnic między grubością rogówki w kolejnych tygodniach (0, 2)noszenia szkieł kontaktowych! Obliczenia wykonaj oddzielnie dla punktów pomiaru na obwodzie oraz w centrum rogówki. Zadanie 3. Wykonaj identyczne analizy (Zadanie 1 i 2) w SAS. Zadanie 4. Posługując się programem SAS porównaj ze sobą liczebności mechowców oraz roztoczy pomiędzy Białowieżą oraz Cementownią.