WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH
Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je na: hipotezy parametryczne gdy nasze przypuszczenie dotyczy wartości parametrów rozkładu (np. średniej, wariancji lub frakcji); hipotezy nieparametryczne są to pozostałe hipotezy, np. dotyczące postaci funkcyjnej rozkładu.
Ogólny schemat postępowania 1. Wypisanie danych zawartych w poleceniu zadania. 2. Sformułowanie dwóch hipotez: zerowej (H 0 ) i alternatywnej (H 1 ) odnośnie parametrów w populacji generalnej: H 0 ma zazwyczaj postać parametr=liczba; H 1 może mieć postać parametr liczba, parametr>liczba lub parametr<liczba; należy pamiętać o krótkim słownym opisie danej hipotezy! 3. Obliczenie odpowiedniej statystyki na podstawie wzoru.
Ogólny schemat postępowania 4. Stworzenie poglądowego wykresu, na którym zaznaczamy obszar krytyczny i sprawdzenie, czy mieści się w nim wartość obliczonej wcześniej statystyki: Jeśli tak, odrzucamy H 0 na rzecz H 1 ; Jeśli nie, nie mamy podstaw do odrzucenia H 0 ; Obszar krytyczny zaznaczamy na podstawie sformułowanej przez nas wcześniej H 1 (dwustronny, lewostronny lub prawostronny) oraz odpowiedniej wartości odczytanej z tablic statystycznych. 5. Udzielenie wyczerpującej odpowiedzi.
A co to jest poziom istotności? Prawdopodobieństwo błędu I rodzaju (α) prawdopodobieństwo odrzucenia H 0, gdy jest ona prawdziwa. Prawdopodobieństwo błędu II rodzaju (β) prawdopodobieństwo przyjęcia H 0, gdy jest ona fałszywa. HIPOTEZA Prawdziwa Fałszywa Przyjęta OK Błąd II rodzaju (β) Odrzucona Błąd I rodzaju (α) OK Poziom istotności α = prawdopodobieństwo błędu I rodzaju! Krytyczny poziom istotności najniższy poziom istotności, przy którym odrzucamy hipotezę zerową. Moc testu = 1 - β
TESTY ISTOTNOŚCI DLA ŚREDNIEJ
Test istotności dla jednej średniej w populacji generalnej z rozkładem normalnym przy znanym odchyleniu standardowym 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : m = m 0 H 1 : m m 0 lub m > m 0 lub m < m 0 3. Statystyka testowa Z = X m 0 σ n 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -u α > <u α ; ) czyli obustronny dla m m 0 <u 2α ; ) czyli prawostronny dla m > m 0 (- ; -u 2α > czyli lewostronny dla m < m 0 Wartości u α odczytujemy z tablic rozkładu normalnego (albo z ostatniego wiersza tablic t-studenta dla stopni swobody ) 5. Udzielenie odpowiedzi
Test istotności dla jednej średniej w populacji generalnej z rozkładem normalnym przy nieznanym odchyleniu standardowym w populacji i dużej próbie (n > 30) 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : m = m 0 H 1 : m m 0 lub m > m 0 lub m < m 0 3. Statystyka testowa Z = X m 0 n S 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -u α > <u α ; ) czyli obustronny dla m m 0 <u 2α ; ) czyli prawostronny dla m > m 0 (- ; -u 2α > czyli lewostronny dla m < m 0 Wartości u α odczytujemy z tablic rozkładu normalnego (albo z ostatniego wiersza tablic t-studenta dla stopni swobody ) 5. Udzielenie odpowiedzi
Test istotności dla jednej średniej w populacji generalnej z rozkładem normalnym przy nieznanym odchyleniu standardowym w populacji i małej próbie (n 30) 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : m = m 0 H 1 : m m 0 lub m > m 0 lub m < m 0 3. Statystyka testowa t = X m 0 n 1 S 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -t α;(n-1) > <t α;(n-1) ; ) czyli obustronny dla m m 0 <t 2α;(n-1) ; ) czyli prawostronny dla m > m 0 (- ; -t 2α;(n-1) > czyli lewostronny dla m < m 0 Wartości t α;(n-1) odczytujemy z tablic rozkładu t-studenta 5. Udzielenie odpowiedzi
Porównywanie średnich z dwóch populacji o rozkładzie normalnym przy znanych odchyleniach standardowych w populacjach 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : m 1 = m 2 H 1 : m 1 m 2 lub m 1 > m 2 lub m 1 < m 2 3. Statystyka testowa Z = X 1 X 2 σ 1 2 n 1 + σ 2 2 n 2 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -u α > <u α ; ) czyli obustronny dla m 1 m 2 <u 2α ; ) czyli prawostronny dla m 1 > m 2 (- ; -u 2α > czyli lewostronny dla m 1 < m 2 Wartości u α odczytujemy z tablic rozkładu normalnego (albo z ostatniego wiersza tablic t-studenta dla stopni swobody ) 5. Udzielenie odpowiedzi
Porównywanie średnich z dwóch populacji o rozkładzie normalnym przy nieznanych odchyleniach standardowych w populacjach i dużych próbach (n > 30) 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : m 1 = m 2 H 1 : m 1 m 2 lub m 1 > m 2 lub m 1 < m 2 3. Statystyka testowa Z = X 1 X 2 S 1 2 n 1 + S 2 2 n 2 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -u α > <u α ; ) czyli obustronny dla m 1 m 2 <u 2α ; ) czyli prawostronny dla m 1 > m 2 (- ; -u 2α > czyli lewostronny dla m 1 < m 2 Wartości u α odczytujemy z tablic rozkładu normalnego (albo z ostatniego wiersza tablic t-studenta dla stopni swobody ) 5. Udzielenie odpowiedzi
Porównywanie średnich z dwóch populacji o rozkładzie normalnym przy nieznanych odchyleniach standardowych w populacjach i małych próbach (n 30) 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : m 1 = m 2 H 1 : m 1 m 2 lub m 1 > m 2 lub m 1 < m 2 3. Statystyka testowa t = X1 X2 n1s 1 2 +n 2S 2 2 n1+n2 2 1 n1 + 1 n2 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -t α;(n1+n2-2) > <t α;(n1+n2-2) ; ) czyli obustronny dla m 1 m 2 <t 2α;(n1+n2-2) ; ) czyli prawostronny dla m 1 > m 2 (- ; -t 2α;(n1+n2-2) > czyli lewostronny dla m 1 < m 2 Wartości t α;(n-1) odczytujemy z tablic rozkładu t-studenta 5. Udzielenie odpowiedzi
Zadanie 4.1/54
Test istotności dla jednej średniej w populacji generalnej z rozkładem normalnym przy znanym odchyleniu standardowym 1. Dane 4. Konstrukcja i rysunek obszaru krytycznego 2. H 0 : m = m 0 H 1 : m m 0 3. Statystyka testowa Z = X m 0 σ n Obszar krytyczny to w tym przypadku: (- ; -u α > <u α ; ) 5. Odpowiedź
Zadanie 4.1/54
1. m 0 = 200 g x = 199,95 g σ = 0,2 g α = 0,1 n = 16 Zadanie 4.1/54 2. H 0 : m = 200 g (średnia waga tabliczki czekolady jest równa 200 g) H 1 : m 200 g (średnia waga tabliczki czekolady jest różna od wartości 200 g) 3. Z = X m 0 σ n Z = 199,95 g 200 g 0,2 g 16 = 1
Zadanie 4.1/54 4. Rysunek α = 0,1 u 0,1 = 1,645 Z = -1 5. Odpowiedź: na poziome istotności 0,1 nie mamy podstaw do odrzucenia hipotezy zerowej, a więc przyjmujemy, że średnia waga tabliczki czekolady produkowanej przez automat wynosi 200 g. Tak, konsument twierdząc że waga tabliczki nie odpowiada normie popełnia błąd pierwszego rodzaju.
Zadanie 4.9/56
Porównywanie średnich z dwóch populacji o rozkładzie normalnym przy nieznanych odchyleniach standardowych i dużych próbach 1. Dane 4. Konstrukcja i rysunek obszaru krytycznego 2. H 0 : m 1 = m 2 H 1 : m 1 > m 2 3. Statystyka testowa Z = X 1 X 2 S 1 2 n 1 + S 2 2 n 2 Obszar krytyczny to w tym przypadku: <u 2α ; ) 5. Odpowiedź
Zadanie 4.9/56
Zadanie 4.9/56 1. x 1 = 129 cm x 2 = 109 cm S 1 = 12 cm S 2 = 10 cm n 1 = 300 n 2 = 300 2. H 0 : m 1 = m 2 (zarówno w 1979 jak i w 2009 7-letni chłopcy skakali średnio na taką samą odległość) H 1 : m 1 > m 2 (w 1979 jak 7-letni chłopcy skakali średnio dalej niż w 2009) 3. Z = X 1 X2 S 1 2 n1 +S 2 2 n2 Z = 129 cm 109 cm 12 cm 2 300 + 10 cm 2 300 =22,177
Zadanie 4.9/56 4. Rysunek α =??? u 0,01 = 2,576 Z = 22,177 5. Odpowiedź: Tak, te wyniki potwierdzają postawioną przez naukowców AWF tezę o tym, że spada przeciętna sprawność dzieci i młodzieży. Poziom istotności musiałby być skrajnie mały (bliski zera), aby zmienił decyzję weryfikacyjną.
TESTY ISTOTNOŚCI DLA WARIANCJI
Testy istotności dla jednej wariancji w populacji generalnej z rozkładem normalnym 1. Dane 2. H 0 : σ = σ 0 lub H 0 : σ 2 = σ 0 2 H 1 : σ > σ 0 H 1 : σ 2 > σ 0 2 (Uwaga: w tym teście jako H 1 wybieramy zawsze parametr>liczba!) 3. Statystyka testowa 4. Konstrukcja i rysunek obszaru krytycznego (dla H 1 : σ > σ 0 lub H 1 : σ 2 > σ 02 ) Obszar krytyczny: <χ α;n 1 2 ; ) 5. Odpowiedź
Zadanie 4.21/59
Testy istotności dla jednej wariancji w populacji generalnej z rozkładem normalnym 1. Dane 2. H 0 : σ = σ 0 lub H 0 : σ 2 = σ 0 2 H 1 : σ > σ 0 H 1 : σ 2 > σ 0 2 (Uwaga: w tym teście jako H 1 wybieramy zawsze parametr>liczba!) 3. Statystyka testowa 4. Konstrukcja i rysunek obszaru krytycznego (dla H 1 : σ > σ 0 lub H 1 : σ 2 > σ 02 ) Obszar krytyczny: <χ α;n 1 2 ; ) 5. Odpowiedź
Zadanie 4.21/59
1. σ 0 = 3 x = 9 Poziom istotności: σ 0 2 = 9 S = 2,9 α = 0,1 n = 30 2. H 0 : σ = 3 lub H 0 : σ 2 = 9 (odchylenie standardowe wielkości sprzedaży jest równe 3 tys. sztuk butelek) H 1 : σ > 3 Zadanie 4.21/59 H 1 : σ 2 > 9 (odchylenie standardowe wielkości sprzedaży jest większe niż 3 tys. butelek) 3. χ 2 = 30 1 2,9 2 9 = 27,1
Zadanie 4.21/59 4. Rysunek χ 2 = 27, 1 = 39, 087 α = 0,1 v = 30 1 = 29 2 χ 0,1;29 = 39,087 χ 2 = 27,1 = 0,1 5. Odpowiedź: na poziome istotności 0,1 nie mamy podstaw do odrzucenia hipotezy zerowej, a zatem wnioskujemy, że odchylenie standardowe wielkości sprzedaży jest równe 3 tys. sztuk butelek wina.
Porównywanie wariancji z dwóch populacji o rozkładzie normalnym. 1. Dane (nadajemy takie indeksy, aby S 1 >S 2 ) 2. H 0 : σ 1 = σ 2 lub H 0 : σ 12 = σ 2 2 H 1 : σ 1 > σ 2 H 1 : σ 12 > σ 2 2 3. Statystyka testowa Uwaga: F musi być większe od 1! 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: < F α;n1 1;n 2 1; ), czyli prawostronny dla H 1 : σ 1 > σ 2 lub H 1 : σ 12 > σ 2 2 5. Odpowiedź
Zadanie 4.22/59
Porównywanie wariancji z dwóch populacji o rozkładzie normalnym. 1. Dane (nadajemy takie indeksy, aby S 1 >S 2 ) 4. Konstrukcja i rysunek obszaru krytycznego 2. H 0 : σ 1 = σ 2 lub H 0 : σ 12 = σ 2 2 H 1 : σ 1 > σ 2 H 1 : σ 12 > σ 2 3. Statystyka Uwaga: F musi być większe od 1! Obszar krytyczny: < F α;n1 1;n 2 1; ) 5. Odpowiedź
Zadanie 4.22/59 1. n 1 = 11 S 1 = 20 Poziom istotności: n 2 = 11 S 2 = 15 α = 0,1 2. H 0 : σ 1 = σ 2 lub H 0 : σ 12 = σ 2 2 (odchylenia standardowe/wariancje punktualności dostaw są równe) H 1 : σ 1 > σ 2 H 1 : σ 12 > σ 2 2 (odchylenie standardowe/wariancja punktualności dostaw jest większe u pierwszego dostawcy) 3. F = 202 15 2 = 1,778
Zadanie 4.22/59 4. Rysunek F = 1, 778 α = 0,1 v 1 = 11 1 = 10 v 2 = 11 1 = 10 = 2, 32 F = 1,778 F 0,1;10;10 = 2,32 (z tablic F-Snedecora) = 0,1 5. Odpowiedź: na poziomie istotności 0,1 nie mamy podstaw do odrzucenia hipotezy zerowej, a zatem wnioskujemy, że nie ma podstaw do preferowania jednego z dostawców ryb.
TESTY ISTOTNOŚCI DLA FRAKCJI
Testy istotności dla jednego prawdopodobieństwa (odsetka, frakcji) w populacji generalnej 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : p = p 0 H 1 : p p 0 lub p > p 0 lub p < p 0 3. Statystyka testowa Z = m n p 0 p 0 1 p 0 n 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -u α > <u α ; ) czyli obustronny dla p p 0 <u 2α ; ) czyli prawostronny dla p > p 0 (- ; -u 2α > czyli lewostronny dla p < p 0 Wartości u α odczytujemy z tablic rozkładu normalnego (albo z ostatniego wiersza tablic t-studenta dla stopni swobody ) 5. Udzielenie odpowiedzi
Testy istotności dla dwóch prawdopodobieństw (odsetków, frakcji) w populacjach generalnych 1. Wypisanie danych z właściwymi oznaczeniami 2. H 0 : p 1 = p 2 H 1 : p 1 p 2 lub p 1 > p 2 lub p 1 < p 2 3. Statystyka testowa Z = m 1 n 1 m 2 n 2 m 1 +m 2 1 m 1+m 2 n 1 +n 2 n 1 +n 2 n 1 n 2 n 1 +n 2 4. Konstrukcja i rysunek obszaru krytycznego, w zależności od hipotezy alternatywnej obszar krytyczny może przyjmować postaci: (- ; -u α > <u α ; ) czyli obustronny dla p 1 p 2 <u 2α ; ) czyli prawostronny dla p 1 > p 2 (- ; -u 2α >czyli lewostronny dla p 1 < p 2 Wartości u α odczytujemy z tablic rozkładu normalnego (albo z ostatniego wiersza tablic t-studenta dla stopni swobody ) 5. Udzielenie odpowiedzi
Zadanie 4.12/57
Testy istotności dla jednego prawdopodobieństwa (odsetka, frakcji) w populacji generalnej 1. Dane 4. Konstrukcja i rysunek obszaru krytycznego 2. H 0 : p = p 0 H 1 : p > p 0 3. Statystyka testowa Z = m n p 0 p 0 1 p 0 n Obszar krytyczny to w tym przypadku: <u 2α ; ) 5. Odpowiedź
Zadanie 4.12/57
Zadanie 4.12/57 1. m = 63 n = 120 p 0 = 0,5 2. H 0 : p = 0,5 (terapia jest skuteczna w przypadku połowy pacjentów, czyli tak jak dotychczasowa) H 1 : 0,5 < p (terapia jest skuteczna w przypadku ponad połowy pacjentów) 3. Z = m n p 0 p0 1 p0 n Z = 63 120 0,5 0,5 1 0,5 120 =0,548
Zadanie 4.12/57 4. Rysunek α = 0,01 u 0,02 = 2,326 Z = 0,548 5. Odpowiedź: Nie jest prawdą że nowa terapia jest skuteczna w przypadku ponad połowy pacjentów. Tak, twórca leku może popełnić błąd I rodzaju twierdząc, że jego produkt jest skuteczniejszy niż dotychczasowa terapia. A więc brak podstaw do odrzucenia H 0
Zadanie 4.18/58
Porównywanie dwóch prawdopodobieństw (odsetków, frakcji) w dwóch populacjach generalnych 1. Dane 4. Konstrukcja i rysunek obszaru krytycznego 2. H 0 : p 1 = p 2 H 1 : p 1 p 2 3. Statystyka testowa Z = m 1 n 1 m 2 n 2 m 1 +m 2 1 m 1+m 2 n 1 +n 2 n 1 +n 2 n 1 n 2 n 1 +n 2 Obszar krytyczny to w tym przypadku: (- ; -u α > <u α ; ) 5. Odpowiedź
Zadanie 4.18/58
Zadanie 4.18/58 1. m 1 = 147 m 2 = 138 n 1 = 300 n 2 = 300 2. H 0 : p 1 = p 2 (CITEAM jest jednakowo rozpoznawalny wśród internautów obojga płci) H 1 : p 1 p 2 (CITEAM nie jest jednakowo rozpoznawalny wśród internautów obojga płci) 3. Z = m1+m2 n1+n2 m1 n1 m 2 n2 1 m 1+m2 n1+n2 n1 n2 n1+n2 Z = 147 300 138 300 147+138 300+300 1 147+138 300+300 300 300 300+300 =0,736
Zadanie 4.18/58 4. Rysunek α = 0,1 u 0,1 = 1,645 Z = 0,736 5. Odpowiedź: na poziome istotności 0,1 nie mamy podstaw do odrzucenia hipotezy zerowej, a więc przyjmujemy, że CITEAM jest jednakowo rozpoznawalny wśród internautów obu płci. Zatem brak podstaw do odrzucenia H 0
DZIĘKUJEMY ZA UWAGĘ! Adam Wiechowski Piotr Zioło