WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku nazwisko_imię_cwiczenia4.doc. I. Weryfikacja hipotez statystycznych - Testy parametryczne Podstawowe etapy procesu weryfikacji hipotez statystycznych: 1. Sformułowanie hipotezy zerowej H 0 oraz hipotezy alternatywnej H 1 ; 2. Przyjęcie wartości poziomu istotności α; 3. Dobranie testu, obliczenie jego wartości w oparciu o dane z próby; 4. Wyznaczenie obszarów krytycznych przy ustalonym poziomie istotności; 5. Podjęcie decyzji o odrzuceniu lub nie odrzuceniu hipotezy zerowej; 6. Wnioski; Zadanie 1 Każda torebka mąki tortowej produkowanej przez zakład zbożowy ma określoną na opakowaniu wagę 1 kg z tolerancją ±0,017 kg. Istnieje przypuszczenie, że pewna seria mąki pochodzącej z tego zakładu nie odpowiada normom wagowym. W celu zbadania zasadności tych zastrzeżeń wylosowano 25 opakowań mąki z tej serii i otrzymano następujące wyniki (w kg): 0,940; 0,994; 0,982; 0,980; 0,965; 0,951; 0,989; 0,931; 0,951; 1,002; 0,970; 0,967; 0,960; 0,988; 0,988; 0,991; 0,963; 0,986; 0,964; 0,966; 0,964; 0,981; 0,986; 0,964; 0,962. Zakładając, że rozkład wagi opakowań mąki jest rozkładem normalnym o znanym odchyleniu standardowym σ = 0,017 kg, sprawdź, czy uzyskane wyniki potwierdzają przypuszczenie o braku zgodności badanej serii mąki z normami wagowymi. Przyjmij poziom istotności α = 0,05. Zadanie 2 Próba 50 potencjalnych klientów ogląda reklamę pewnego produktu, a następnie ma ocenić w skali od 1 do 10 czy reklama skłania, czy nie do zakupu produktu. Reklama będzie stosowana powszechnie, jeśli rezultaty eksperymentu pokażą na poziomie α = 0,05, że średnia ocena wynosi ponad 5,0 punktów. Po prezentacji okazało się, że średnia ocena wynosiła 6,3 punktu z odchyleniem standardowym 1,6. Czy zatem zostanie zastosowany ten rodzaj reklamy? 1
Zadanie 3 Zdaniem ekspertów przeciętna cena 1 m 2 nowo wybudowanego mieszkania przez spółdzielnie mieszkaniowe i firmy budowlane w Krakowie w I kwartale 2000 r. wynosiła 3 tys. PLN. W celu sprawdzenia tej opinii wylosowano 9 ofert i otrzymano następujące ceny sprzedaży (w tys. PLN) 1 m 2 takich mieszkań: 3,1; 2,9; 3,1; 3,2; 2,6; 2,8; 2,7; 2,7; 3,0. Zakładając, że badana cecha ma rozkład normalny, zweryfikuj opinię ekspertów na poziomie istotności α = 0,10, czy cena jest mniejsza od 3 tys. PLN. Zadanie 4 Właściciel firmy produkującej maszyny dla przemysłu spożywczego twierdzi, że produkowana przez niego maszyna do napełniania torebek z zupkami w proszku pakuje proszek z odchyleniem nie większym niż 0,04 g. Pobrano próbę 8 torebek i okazało się, że średnia waga torebki wynosi 10,1 g z wariancją 0,0018 g 2. Czy wyniki badań potwierdziły twierdzenie właściciela formy? Zastosuj α = 0,05. 2
II. Weryfikacja hipotez o wartościach średnich dwóch populacji (STATISTICA) Testy t-studenta służą do porównywania średnich. Hipotezę zerową można przedstawić jako: H 0 : (m 1 = m 2 ) a alternatywną: H 1 : (m 1 m 2 ) (m 1 < m 2 ) (m 1 > m 2 ) Do testów t-studenta można się dostać wybierając z menu głównego Statystyka/Statystyki podstawowe i tabele. Wyświetla się okno: Test t dla grup niezależnych (wzgl. grup) Test t dla grup niezależnych (wzgl. zmn) 3
Poziom istotności ex post czyli poziomu prawdopodobieństwa lub p-wartość oznaczone jest literą p i na jego podstawie dokonujemy weryfikacji hipotez. WAŻNE: jeśli p < α, wtedy wyniki zostaną podświetlone na czerwono, oznacza to, że są one istotne statystycznie, czyli, że odrzucamy hipotezę zerową na danym poziomie istotności α Zadanie 1 Pewnemu badaniu poddano 16 wylosowanych osób. Badanie polegało na rejestracji czasu, jaki upłynie, zanim dana osoba zidentyfikuje produkt reklamowany na dwóch kolorystycznie różnych plakatach reklamowych. Otrzymano następujące wyniki (w minutach): Projekt 1 1 3 2 1 2 1 3 2 Projekt 2 4 2 3 3 1 2 3 3 Czy istnieje istotna różnica w czasach rozpoznawania produktu na obu plakatach reklamowych? Przyjmij poziom istotności α = 0,05. 4
Zadanie 2 Chcąc ocenić rozkład masy ciała noworodka dla kobiet palących i niepalących, wylosowano grupę 36 kobiet i odnotowano wagę (w gramach) noworodka. Zebrane dane zapisano w pliku zad_ii_2_palenie.sta Sprawdzić, czy średnia waga dziecka przy narodzeniu jest naprawdę mniejsza dla matek palących. Przyjmij poziom istotności α = 0,05. Zadanie 3 Dla oceny wpływu płci na ciśnienie skurczowe przebadano trzydziestu pacjentów. Zebrane dane zapisano w pliku zad_ii_3_cisnienie.sta. Sprawdź, na poziomie istotności α = 0,1 sprawdź, czy płeć ma wpływ na ciśnienie skurczowe. 5
III. Testy zgodności dopasowanie rozkładu (STATISTICA) Hipotezy dla dopasowywania rozkładów: H 0 : rozkład badanej cechy w populacji jest rozkładem A, H 1 : rozkład badanej cechy w populacji jest różny od rozkładu A. Gdzie A to dowolny rozkład, jaki chcemy dopasować w danym momencie. Panel Dopasowywania rozkładów przywołujemy z menu Statystyka. W otwartym w ten sposób oknie znajduje się tylko jedna karta: Podstawowe, na której należy wybrać rozkład, jaki chcemy dopasować do naszej próby. Po wyborze rozkładu program przechodzi do kolejnego okna: W zakładce Opcje można wybrać test, przy pomocy którego odbędzie się dopasowywanie rozkładu: do wyboru jest test χ 2 albo test Kołmogorowa-Smirnowa. Test χ2 stosuje się dla prób o dużej liczebności, n>50, dla mniejszych wykorzystuje się test Kołmogorowa-Smirnowa. Każdy z tych testów sprawdza, czy rozkład w populacji dla pewnej zmiennej losowej, różni się od założonego rozkładu teoretycznego, gdy znana jest jedynie pewna skończona liczba obserwacji tej zmiennej (próba). Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z ustalonym poziomem istotności α: jeżeli p α => odrzucamy H 0 przyjmując H 1, jeżeli p > α => nie ma podstaw do odrzucenia H 0. Zadanie 1: Plik zad_iii_1_zarobiki.sta zawiera dane dotyczące płacy brutto dla 1255 osób. Na poziomie istotności 0,05 zweryfikuj hipotezę, że rozkład zarobków jest rozkładem: a) normalnym, b) lognormalnym. 6
Zadanie 2: Zestawienie poniżej przedstawia zawartość tłuszczu w 20 próbkach mleka (zad_iii_2_mleko.sta): 3,6 3,8 3,2 3,7 4 3,9 3,7 3,7 4 3,2 3,2 3,6 3,5 4 4 3,6 3,6 3,6 3,5 3,5 Na poziomie istotności α = 0,05 zweryfikuj zgodność tego rozkładu z rozkładem jednostajnym (prostokątnym) w przedziale od 3,2 do 4,0. 7