Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

Podobne dokumenty
Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich.

Badanie normalności rozkładu

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Statystyka matematyczna dla leśników

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań

Wykład 3 Hipotezy statystyczne

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Prawdopodobieństwo i rozkład normalny cd.

Testowanie hipotez statystycznych.

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

WNIOSKOWANIE STATYSTYCZNE

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna i ekonometria

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez statystycznych cd.

Statystyka matematyczna i ekonometria

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

166 Wstęp do statystyki matematycznej

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wnioskowanie statystyczne. Statystyka w 5

Zawartość. Zawartość

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Zadanie 1. Analiza Analiza rozkładu

Hipotezy statystyczne

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki, cz.6

WNIOSKOWANIE STATYSTYCZNE

Testowanie hipotez statystycznych.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Hipotezy statystyczne

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Wydział Matematyki. Testy zgodności. Wykład 03

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Metody Statystyczne. Metody Statystyczne

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Zadania ze statystyki cz.8. Zadanie 1.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Statystyka matematyczna

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

1 Estymacja przedziałowa

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Transkrypt:

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym. Zadania: Arkusz kalkulacyjny Excel Do weryfikacji różnic między dwiema grupami obiektów w Excelu wykorzystujemy funkcję o nazwie TEST.T. Daje ona w wyniku prawdopodobieństwo związane z testem t Studenta. Funkcja ta należy do kategorii statystycznych i możemy ją stosować do określenia, czy istnieje prawdopodobieństwo, że dwie próbki pochodzą z tych samych podległych populacji, które mają taką samą wartość średnią. Zastosowany test statystyczny pozwala ocenić czy mamy podstawy do przyjęcia H o lub jej odrzuceniu na korzyść H 1 z określonym prawdopodobieństwem popełnienia błędu I rodzaju (poziom istotności). Błąd ten informuje o tym jakie jest prawdopodobieństwo odrzucenia H o, gdy jest ona prawdziwa. Tak należy traktować wartości liczbowe będące skutkiem zadziałania m.in. funkcji Test.T. Składnia TEST.T(tablica1;tablica2;ślady;typ) Tablica1 - pierwszy grupa obserwacji. Tablica2 - druga grupa obserwacji. Ślady - określa czy użyty test statystyczny ma być jednostronny (ślady=1) czy też dwustronny ( ślady = 2). Typ - jest to rodzaj testu t, który ma być przeprowadzony. Jeżeli typ równa się Przeprowadzany jest ten test 1 Sparowany 2 Wariancja równa dla dwóch prób homoscedastyczna) 3 Wariancja nierówna dla dwóch prób heteroscedastyczna) Uwagi Jeżeli tablica1 i tablica2 mają inną liczbę punktów danych, a typ = 1 (sparowane), wówczas funkcja TEST.T daje w wyniku wartość błędu #N/D Argumenty ślady i typ są sprowadzane do najbliższych mniejszych liczb całkowitych. Jeżeli argument ślady lub typ nie jest liczbowy, funkcja TEST.T daje w wyniku wartość błędu #ARG!. Jeżeli argument ślady ma wartość inną niż 1 lub 2, funkcja TEST.T daje w wyniku wartość błędu #LICZBA!. Jeśli obliczona wartość jest mniejsza niż 0,05 (niż minimalny założony poziom istotności to odrzucamy H o na korzyść H 1 ).

Autor: Dariusz Piwczyński 2 Przykładowe rozwiązanie: Zadanie 2. Średnia wydajność mleka w badanej populacji próbnej wyniosła 4888 kg mleka. Zweryfikujemy hipotezę zerową, zakładającą, iż średnia wydajność mleka w populacji bydła rasy ncb (mieszańce z HF) wynosi 4888 kg. H 0: µ = 4888 kg; H 1 : µ 4888 kg ods rtf body='e:\dane\nazwisko\ttest_h0.rtf'; Title 'Weryfikujemy hipoteze zerowa zakladajaca, iz wydajnosc mleka w populacji generalnej wynosi 4888'; proc ttest data=krowy.mleko h0=4888; var mlkg; run; ods rtf close; Wyniki zapisane w pliku ttest_h0.rtf Statistics Variable N Upper Lower Std Dev Upper Std Err Minimum Maximum mlkg 4 0 4509.1 4888. 3 5267.4 971.23 1185. 6 1522.4 187.47 2610 7280.4 dolna, lewa strona przedziału ufności Upper górna, prawa strona przedziału ufności średnia odchylenie standardowe T-Tests Variable DF Warto ść t Pr > t mlkg 39 0.00 0.998 9 DF liczba stopni swobody Prawdopodobieństw związane z testem T (0,9989) dowodzi, iż nie mamy podstaw do odrzucenia hipotezy zerowej, zakładającej, iż średnia wydajność mleka wynosi 4888 kg. Nie oznacza to jednak, że omawiana wydajność właśnie tyle wynosi! Nie udało nam się wykazać, iż wydajność mleka jest różna aniżeli 4888 kg. Zadanie 3. Weryfikujemy istotność różnic między krowami będącymi w 1 i 2 laktacji w zakresie cech mleczności. Kolejność działań: a) za pomocą procedury UNIVARIATE weryfikujemy hipotezę zerową o zgodności rozkładu analizowanych cech z rozkładem normalnym. b) weryfikujemy hipotezę zerową o równości wariancji w porównywanych populacjach:

Autor: Dariusz Piwczyński 3 H 0: D 2 (X 1 ) = D 2 (X 2 ); D 2 (X 1 ) D 2 (X 2 ) c) Weryfikujemy hipotezę zerową o równości wartości oczekiwanych porównywanych populacji, tj. krów będących w 1 i 2 laktacji: H 0: E(X 1 ) = E(X 2 ); E(X 1 ) E(X 2 ) UWAGA! W SAS testy weryfikujące istotność różnic między średnimi umieszczone są w WYNIKACH przed testami równości wariancji. ods rtf body='e:\dane\nazwisko\ttest.rtf'; title 'Comparing Group s'; proc ttest data=krowy.mleko cochran; where lakt LE 2; class lakt; var mlkg--kg_tb; run; ods rtf close; Variable lakt N Upper Statistics Upper Std Err Minimum Maximum mlkg 1 13 4030 4539.2 5048.3 604.18 842.55 1390.8 233.68 3075.9 5909.2 mlkg 2 13 3916.7 4417.3 4917.9 594 828.35 1367.4 229.74 3312 5884.7 mlkg Diff (1-2) -554.5 121.88 798.23 652.37 835.48 1162.3 327.7 tkg 1 13 168.34 181.55 194.77 15.684 21.871 36.104 6.066 146.95 229.6 tkg 2 13 168.37 192.49 216.62 28.628 39.922 65.901 11.072 140.58 281.98 tkg Diff (1-2) -37-10.94 15.119 25.133 32.188 44.779 12.625 bkg 1 13 120.28 135.97 151.66 18.617 25.962 42.856 7.2005 87.56 172.78 bkg 2 13 125.49 143.45 161.4 21.303 29.708 49.04 8.2394 96.59 194.38 bkg Diff (1-2) -30.06-7.474 15.11 21.783 27.898 38.81 10.942 t 1 13 3.7986 4.0623 4.326 0.3129 0.4364 0.7203 0.121 3.42 4.78 t 2 13 3.9948 4.3938 4.7929 0.4735 0.6603 1.09 0.1831 3.24 5.46 t Diff (1-2) -0.785-0.332 0.1215 0.437 0.5597 0.7786 0.2195 b 1 13 2.8959 2.9954 3.0949 0.1181 0.1647 0.2719 0.0457 2.73 3.23 B 2 13 3.1007 3.2431 3.3855 0.169 0.2357 0.389 0.0654 2.86 3.76 B Diff (1-2) -0.412-0.248-0.083 0.1587 0.2033 0.2828 0.0797 VCM 1 13 4397 4877.9 5358.8 570.62 795.75 1313.6 220.7 3393.6 6181.7 VCM 2 13 4543.8 5172.9 5801.9 746.46 1041 1718.4 288.71 3643.8 7233.7 VCM Diff (1-2) -1045-295 455.04 723.44 926.51 1288.9 363.41 Kg_TB 1 13 289.94 317.53 345.11 32.735 45.65 75.356 12.661 234.51 402.38 Kg_TB 2 13 295.62 335.94 376.26 47.845 66.721 110.14 18.505 246.7 476.36 Kg_TB Diff (1-2) -64.69-18.41 27.864 44.636 57.165 79.525 22.422 Jaka różnica????? Prawdopodobieństwo P > 0.05 P 0.05 P 0.01 P 0.001 Określenie istotności różnic Nieistotna statystycznie istotna statystycznie Wysoko istotna statystycznie Bardzo wysoko istotna statystycznie

Autor: Dariusz Piwczyński 4 b) Equality of Variances (Równość wariancji) Wartość Variable Method Num DF Den DF F Pr > F mlkg Folded F 12 12 1.03 0.9540 tkg Folded F 12 12 3.33 0.0471 bkg Folded F 12 12 1.31 0.6480 t Folded F 12 12 2.29 0.1656 b Folded F 12 12 2.05 0.2289 VCM Folded F 12 12 1.71 0.3649 kg_tb Folded F 12 12 2.14 0.2030 Przeprowadzona analiza statystyczna dowodzi, iż istnieją podstawy do odrzucenia H 0 o równości wariancji wyłącznie w odniesieniu do wydajności tłuszczu (kg). Przyjmujemy zatem, iż zmienność w populacji krów będących w pierwszej i drugiej laktacji jest statystycznie różna. Nie mamy podstaw do odrzucenia H 0 w przypadku pozostałych cech zakładamy zatem, iż zmienność w porównywanych populacjach jest podoba. c)wykonana wcześniej analiza równości wariancji była konieczna, abyśmy mogli dokonać prawidłowego wyboru testu istotności różnic między średnimi. Ponieważ odrzuciliśmy H 0 o równości wariancji wyłącznie w przypadku wydajności tłuszczu (kg), zatem tylko w przypadku tej cechy poszukujemy wartości t w miejscu, gdzie w kolumnie Method znajduje się komunikat: Cochran, ewentualnie Satterthwaite. W zakresie pozostałych cech statystyki t i prawdopodobieństwa z nią związanego szukamy na wysokości Equal, kolumna Variances. T-Tests Variable Method Variances DF Wartosc t Pr > t mlkg Pooled Equal 24 0.37 0.7132 mlkg Satterthwaite Unequal 24 0.37 0.7132 mlkg Cochran Unequal 12 0.37 0.7164 tkg Pooled Equal 24-0.87 0.3949 tkg Satterthwaite Unequal 18.6-0.87 0.3973 tkg Cochran Unequal 12-0.87 0.4033 bkg Pooled Equal 24-0.68 0.5011 bkg Satterthwaite Unequal 23.6-0.68 0.5013 bkg Cochran Unequal 12-0.68 0.5076 t Pooled Equal 24-1.51 0.1440 t Satterthwaite Unequal 20.8-1.51 0.1460 t Cochran Unequal 12-1.51 0.1568 b Pooled Equal 24-3.11 0.0048 b Satterthwaite Unequal 21.5-3.11 0.0053 b Cochran Unequal 12-3.11 0.0091 VCM Pooled Equal 24-0.81 0.4249 VCM Satterthwaite Unequal 22.5-0.81 0.4255 VCM Cochran Unequal 12-0.81 0.4327 kg_tb Pooled Equal 24-0.82 0.4196 kg_tb Satterthwaite Unequal 21.2-0.82 0.4207 kg_tb Cochran Unequal 12-0.82 0.4276 Przeprowadzone badania pozwalają odrzucić H 0 o równości wartości oczekiwanych wyłącznie w odniesieniu do procentowej zawartości białka. Możemy zatem stwierdzić, iż krowy będące w pierwszej i drugiej laktacji różnią się między sobą statystycznie pod względem procentowej zawartości białka w mleku. Mleko krów, które znajdowały się w drugiej laktacji zawierało 3,24 % białka, tj. o 0,5 j.p. (jednostki procentowej) więcej aniżeli mleko pierwiastek. Różnica między średnimi była wysoko istotna statystycznie. Nie stwierdzono różnic istotnych statystycznie między laktacjami w zakresie pozostałych cech mleczności.

Autor: Dariusz Piwczyński 5 Zadanie 1. Test t dla prób niezależnych Otwórz plik S:\USM_STAT\Bazy_xls\OCZY.XLS Sprawdź czy pomiędzy średnią grubością w centrum rogówki i na obwodzie istnieją różnice istotne statystycznie. UWAGA! NIE SUGEROWAĆ SIĘ WPISANYMI ZAKRESAMI GRUP Czy wariancje są równe? Test F! =test.f(x1:x30;x31:x62). Jeżeli wynik formuły jest mniejszy lub równy 0,05, to wariancje są nierówne. Jest to niezbędne do podjęcia decyzji o rodzaju testu. 1. Wstaw funkcję Test.T Kategoria statystyczne 2. Podaj zakres pierwszej grupy, np. d2:d9 (Tablica 1) 3. Podaj zakres drugiej grupy, np. d10:d24 (Tablica 2) 4. Wpisać 2 w okienku Ślady test dwustronny 5. W okienku Typ określić rodzaj testu dwie próby o równej wariancji 2 ( nierównej 3) Wynik formuły (PRZYKŁADOWY) =0,007759956 (0,01) jest komputerowym poziomem prawdopodobieństwa, tzw. prawdopodobieństwo testowe (p). Jeżeli α p, to na danym poziomie α odrzucamy hipotezę zerową. Z kolei, jeżeli α < p, to na danym poziomie istotności nie ma podstaw do odrzucenia hipotezy zerowej. Odpowiedź: Uzyskane wyniki dają podstawę do odrzucenia hipotezy zerowej, czyli pomiędzy grubością rogówki na obwodzie i w jej centrum występują różnice wysoko istotne statystycznie. Zadanie 2. Pary wiązane Zweryfikuj istotność różnic między grubością rogówki w kolejnych tygodniach (0, 2)noszenia szkieł kontaktowych! Obliczenia wykonaj oddzielnie dla punktów pomiaru na obwodzie oraz w centrum rogówki. Zadanie 3. Wykonaj identyczne analizy (Zadanie 1 i 2) w SAS. Zadanie 4. Posługując się programem SAS porównaj ze sobą liczebności mechowców oraz roztoczy pomiędzy Białowieżą oraz Cementownią.