Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność próby była poniżej 2000, gdyż w przeciwnym wypadku daje mylne wyniki. Test ten wymaga, aby cecha miała rozkład ciągły. Kołmogorowa-Smirnowa (K-S): Wymaga znajomości średniej i odchylenie standardowego dla populacji. W sytuacji, gdy nie znamy wyżej wymienionych parametrów stosujemy test K-S z poprawką Lilieforsa. Test K-S wymaga, aby cecha była ciągła. Jest to test mocniejszy, aniżeli test 2. Testujemy hipotezę zerową postaci: H 0 : X ~ N(µ, σ). Hipoteza alternatywna: H 1 : X N(µ, σ). Przykład 1 (Enterprise Guide). Sprawdź czy wydajność mleka i zawartość tłuszczu i białka w mleku posiadają rozkład zgodny z normalnym (ams.xlsx). Interpretacji poddaj wyniki dotyczące doju zautomatyzowanego (AMS1 = 3). Analizę rozkładu uruchamiamy z menu Zadanie. Strona 1
Krok 1. Ustalamy zmienne analizowane a także wprowadzamy zmienną grupującą AMS1 (dzięki czemu wykonamy oddzielną analizę dla każdej systemu doju). Krok 2. Wskazujemy rozkład, do którego odniesiemy rozkład naszej zmiennej. Strona 2
Krok 3. Określamy rodzaje wykresów, które zostaną wykonane. Krok 4. Zaznaczamy statystyki, które będą obliczane (Testy normalności). Strona 3
WYNIKI AMS = 3 W celu stwierdzenia czy badana cecha posiada rozkład zgodny z normalnym patrzymy na wartość p. Jeśli ta wartość jest równa lub mniejsza aniżeli 0,05, to mamy podstawę do odrzucenia hipotezy zerowej i stwierdzenia, iż badana cecha nie posiada rozkładu zgodnego z normalnego. W powyższym przykładzie wszystkie testy normalności rozkładu dowodzą, iż istnieją podstawy do odrzucenia hipotezy zerowej. Oznacza to, że rozkład wydajności mleka pierwiastek za 305. dniową laktację jest zgodny z rozkładem normalnym. Rycina 1. Histogram Strona 4
Rycina 2. Wykres normalności kwantyl-kwantyl Dla porównania przeanalizuj wyniki dotyczące cechy, która nie posiada rozkładu zgodnego z normalnym. (Stężenie dwutlenku siarki w otoczeniu zakładu przemysłowego cementownia (Babulice.xlsx)). Strona 5
Rycina 1. Histogram Rycina 2. Wykres normalności kwantyl-kwantyl Strona 6
2000 2250 2500 2750 3000 3250 3500 3750 4000 4250 Więcej Częstość Przykład 2. (MS EXCEL). Wykonaj wykresy typu HISTOGRAM, na którym zaprezentujesz rozkład masy i długości ciała noworodków. W tym celu posłuż się modułem Analiza danych (dziecko.xlsx). Histogram 25 20 15 10 5 0 Częstość Zbiór danych (koszyk) =========================== ZADANIA ===================================== ENTERPRISE GUIDE Zadanie 1. Sprawdź czy tętno koni, liczba oddechów oraz temperatura ciała mierzona na szyi koni sportowych i rekreacyjnych przed treningiem posiada rozkład zgodny z normalnym (konie.xlsx). Zadanie 2. Czy grubość rogówki posiada rozkład zgodny z normalnym (oczy.xlsx)? Zadanie 3. Czy wymiary studentów posiadają rozkład zgodny z normalnym (wymiarycialastudentow2012_2016.xlsx)? Zadanie 4. Czy masa ciała jagniąt ma rozkład zgodny z normalnym (MasaCiala.xls)? MS EXCEL Zadanie 1. Jaki rozkład posiada liczebności drobnoustrojów (bakterie.xlsx)? Czy rozkład uległ zmianie po wykonaniu transformacji logarytmicznych? Strona 7
Wyznaczanie przedziałów ufności Przykład 1. Posługując się programem Enterprise Guide oszacuj 95% przedział ufności dla wydajności mleka, zawartości tłuszczu i białka z uwzględnieniem systemu doku (AMS1). 1. Importuj do SAS zawartość arkusza Dane ze skoroszytu ams.xlsx. 2. Ustal role poszczególnych zmiennych w wykonywanej analizie, jak poniżej. 2. W zakładce Dodatkowe zaznacz pole wyboru Przedział ufności dla średniej. Strona 8
Wyniki Odp.: Wyznaczony przedział ufności pozwala wnioskować z prawdopodobieństwem 95%, że średnia przeciętna laktacyjna wydajność mleka w populacji generalnej krów mlecznych rasy polskiej holsztyńsko-fryzyjskiej dojonych w systemie konwencjonalnym (AMS1 = 1) zawiera się w przedziale 7536,90-7961,86 kg. Przykład 2 (MS EXCEL). Przykładowe rozwiązanie dotyczące wyznaczania przedziałów ufności dla średniej arytmetycznej w MS EXCEL znajduje się w pliku kret.xlsx, arkusz roboczy ufnosc. =========================== ZADANIA ===================================== ENTERPRISE GUIDE Zadanie 1. Skonstruuj przedziały ufności (95 i 99%) tętna, liczby oddechów i temperatury mierzonej na szyi koni sportowych i rekreacyjnych przed treningiem (konie.xlsx). Zadanie 2. Skonstruuj przedziały ufności (95 i 99%) dla wymiarów studentów (wymiarycialastudentow2012_2016.xlsx). MS EXCEL Zadanie 1. Oszacuj przedział ufności dla grubości rogówki oka ludzkiego mierzonej w CENTRUM przed rozpoczęcie noszenia szkieł kontaktowych (oczy.xlsx). A. Otwórz plik oczy.xlsx (wcześnie przekopiuj plik do własnego folderu). B. Skopiuj do kolejnego wolnego arkusza wiersz zawierający nazwy cech. C. Zmień nazwę tegoż arkusza roboczego na ufnosc. D. Sporządź tabelę zawierającą wybrane miary położenia i zmienności w odniesieniu do liczby grubości rogówki G0 w odniesieniu do pomiaru grubości w punkcie CENTRUM (średnia arytmetyczna, odchylenie standardowe). E. Oblicz lewą i prawą stronę ufności (95%) dla wszystkich rodzajów mechowców i roztoczy. x ( t Sx ) x ( t n Sx ) n, gdzie: x średnia arytmetyczna, S x odchylenie standardowe, n liczba próbek. Wartości krytyczne rozkładu t-studenta można otrzymać w wyniku zastosowania funkcji: =rozkład.t.odw(α; ν). α poziom istotności, ν liczba stopni swobody. Strona 9