Statystyka matematyczna Wykład 9 i 10 Magdalena Alama-Bućko 14 i 21 maja 2018 Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 1 / 25
Hipotezy statystyczne Hipoteza statystyczna nazywamy dowolne przypuszczenie co do rozkładu populacji generalnej może dotyczyć parametrów (średniej, odchylenia standardowego, wskaźnika struktury,...) jednego parametru : np. m = 80, m > 80, σ = 3, σ < 3,... wielu parametrów (np. dwóch): np. m 1 = m 2 tzn. średnia w dwóch grupach jest taka sama np. σ 1 > σ 2 tzn. odchylenie standardowe w grupie pierwszej jest większe niż w grupie drugiej może dotyczyć postaci rozkładu (rozkład normalny, jednostajny, itp.) (nie będziemy się zajmować) prawdziwość hipotezy (przypuszczenia) jest oceniana na podstawie wyników uzyskanej próby. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 2 / 25
Testy istotności to testy, które na podstawie badanej próby losowej pozwalaja jedynie podjać decyzję o odrzuceniu sprawdzanej hipotezy albo stwierdzić brak podstaw do jej odrzucenia (co wcale nie oznacza, że ja przyjmujemy!!!). Poziom istotności α to bład polegajacy na odrzuceniu hipotezy prawdziwej α - z góry ustalony ( tzn. taki bład decyzji dopuszczamy) w praktyce najczęściej przyjmujemy α = 0.1, 0.05, 0.01 α = 0, 1 oznacza, że średnio dla 100 realizacji 10-krotnie odrzucimy hipotezę prawdziwa Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 3 / 25
Słownik pojęć H 0 - hipoteza zerowa - jej prawdziwość poddajemy pod watpliwość H 0 ma zawsze postać równości, tzn. m = 2, σ = 1, m 1 = m 2,... H 1 - hipoteza alternatywna - przyjęta w przypadku odrzucenia H 0 H 1 ma zawsze postać nierówności, tzn. ( albo < albo > ) m 2, m < 2, m > 2 Obszar krytyczny - ozn. Q, zbiór wartości świadczacych na korzyść H 1 względem danej H 0 (zbiór odrzucenia H 0 i przyjęcia H 1 ) Postać Q zależy od postaci hipotezy alternatywnej H 1. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 4 / 25
Konstrukcja testu statystycznego 1 Określić H 0 i H 1 2 Określić statystykę testowa: U albo T albo χ 2 3 Wyznaczyć obszar krytyczny Q taki, że P(U Q) = α albo P(T Q) = α albo P(χ 2 Q) = α W celu wyznaczenia Q zawsze należy odczytać pewne liczby z tablic: gdy u z rozkładu normalnego, gdy t z rozkładu t-studenta, gdy χ 2 z rozkładu χ 2. 4 Na podstawie danych obliczyć wartość statystyki testowej, tzn. U obl, T obl, χ 2 obl 5 Podjać decyzję: Jeśli U obl Q odrzucamy H 0 i przyjmujemy H 1 Jeśli U obl / Q brak podstaw do odrzucenia H 0. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 5 / 25
Testy dla średniej Model I : X N(m, σ), σ- znane Hipoteza zerowa: H 0 : m = m 0 (m 0 - pewna określona liczba) Statystyka testowa: U = x m 0 σ n Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : m m 0 Q = (, u 1 α 2 ] [u 1 α 2, ) H 1 : m > m 0 Q = [u 1 α, ) H 1 : m < m 0 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 6 / 25
Przykład 1 Zbadano roczne koszty działalności w 17 firmach zatrudniajacych do 5 pracowników i otrzymano x = 229 zł. Wiedzac, że koszty maja rozkład normalny N(m, 170) na poziomie istotności α = 0.05 zweryfikować hipotezę, że średnie koszty sa większe niż 200 zł. poziom istotności α = 0.05 N(m, 170), σ = 170 H 0 : m = 200, H 1 : m > 200 obszar krytyczny: Q = [u 1 α, ) = [u 0,95, ) = [1, 64, ) statystyka testowa U = x m 0 n σ 229 200 U obl = 17 = 0, 703 170 decyzja: U obl = 0.703 / Q = [1.64, ] zatem brak podstaw do odrzucenia H 0. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 7 / 25
Model II : X N(m, σ), σ - nieznane, (n 120) Hipoteza zerowa: H 0 : m = m 0 (m 0 pewna określona liczba) Statystyka testowa: T = x m 0 s n 1 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : m m 0 Q = (, t α, n 1 ] [t α, n 1, ) H 1 : m > m 0 Q = [t 2α, n 1, + ) H 1 : m < m 0 Q = (, t 2α, n 1 ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 8 / 25
Przykład 2 Zbadano roczne koszty działalności w 17 firmach zatrudniajacych do 5 pracowników i otrzymano x = 229 zł oraz s 2 = 28031 zł 2. Wiedzac, że koszty maja rozkład normalny na poziomie istotności α = 0.05 zweryfikować hipotezę, że średnie koszty sa większe niż 200 zł. α = 0.05 s 2 = 28031, s = 167.42 N(m, σ), σ - nieznany, m - średnie koszty H 0 : m = 200, H 1 : m > 200 statystyka testowa: T = x m 0 s n 1 obszar krytyczny: Q = [t 2α, n 1, + ) = [t 0.1, 16, + ) = [1.746, ) 229 200 T obl = 167.42 16 = 0.693 decyzja: T obl = 0.693 / Q = [1.746, ] zatem brak podstaw do odrzucenia H 0. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 9 / 25
Model III : X N(m, σ), σ - nieznane, (n > 120) Hipoteza zerowa: H 0 : m = m 0 (m 0 pewna określona liczba) Statystyka testowa: U = x m 0 s n Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : m m 0 Q = (, u 1 α 2 ] [u 1 α 2, + ) H 1 : m > m 0 Q = [u 1 α, + ) H 1 : m < m 0 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 10 / 25
Przykład 3 Badania wykazały, że średnie zużycie paliwa w pewnym modelu samochodu wynosi 7 litrów na 100 km. Wprowadzono nowy model i po przeprowadzeniu 144-ciu jazd próbnych otrzymano następujace wyniki: x = 6, 95, s = 0, 16. Czy na poziomie istotności α = 0, 01 firma może twierdzić, że nowy model zużywa mniej paliwa? α = 0.01, s = 0, 16, x = 6, 95 n = 144 > 120 m średnie zużycie paliwa H 0 : m = 7, H 1 : m < 7 statystyka testowa: U = x m 0 n s obszar krytyczny: Q = (, u 1 α ] = (, u 0,99 ] = (, 2.33] U obl = 6.95 7 144 = 3.75 0.16 decyzja: U obl = 3.75 Q = (, 2.33] zatem na poziomie istotności 0.01 odrzucamy H 0 i przyjmujemy H 1. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 11 / 25
Testy dla wariancji Model I : X N(m, σ), n 31 Hipoteza zerowa: H 0 : σ 2 = σ0 2 ( σ2 0 pewna określona liczba) Statystyka testowa: χ 2 = ns2 σ 2 0 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : σ 2 σ0 2 Q = (0, χ 2 α 2, n 1] [χ2 1 α, n 1, + ) 2 H 1 : σ 2 > σ 2 0 Q = [χ 2 1 α, n 1, + ) H 1 : σ 2 < σ 2 0 Q = (0, χ 2 α, n 1 ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 12 / 25
Przykład 4 W szklarni pewnego gospodarstwa ogrodniczego pobrano losowo próbę 20 goździków i zmierzono ich długość, otrzymujac s = 3, 35 cm. Zakładajac, że długość goździków ma rozkład normalny, na poziomie istotności 0, 05, zweryfikować hipotezę, że wariancja goździków szklarniowych wynosi 6, 5cm 2, przeciw hipotezie, że jest ona większa od 6, 5cm 2. n = 20 < 31, X N(m, σ) α = 0.05, s = 3.35 H 0 : σ 2 = 6.5 H 1 : σ 2 > 6.5 statystyka testowa: χ 2 = ns2 σ0 2 obszar krytyczny: Q = [χ 2 1 α, n 1, + ) = [χ2 0.95, 19, + ) = [10.12, + ) χ 2 obl = ns2 20 3.352 σ0 2 = = 34.53 6.5 decyzja: χ 2 obl = 34.53 Q = [10.12, ) zatem na poziomie istotności 0.01 odrzucamy H 0 i przyjmujemy H 1. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 13 / 25
Model II X N(m, σ), n > 31 Hipoteza zerowa: H 0 : σ 2 = σ0 2 ( σ2 0 pewna określona liczba) Statystyka testowa: U = 2 ns2 σ 2 0 2n 3 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : σ 2 σ 2 0 Q = (, u 1 α 2 ] [u 1 α 2, ) H 1 : σ 2 > σ 2 0 Q = [u 1 α, + ) H 1 : σ 2 < σ 2 0 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 14 / 25
Przykład 5 W szklarni pewnego gospodarstwa ogrodniczego pobrano losowo próbę 40 goździków i zmierzono ich długość, otrzymujac s = 3, 35 cm. Zakładajac, że długość goździków ma rozkład normalny, na poziomie istotności 0, 05, zweryfikować hipotezę, że wariancja goździków szklarniowych wynosi 6, 5cm 2, przeciw hipotezie, że jest ona większa od 6, 5cm 2. n = 40 > 31, X N(m, σ) α = 0.05, s = 3.35 H 0 : σ 2 = 6.5 H 1 : σ 2 > 6.5 statystyka testowa: U = 2 ns2 σ0 2 2n 3 obszar krytyczny: Q = [u 1 α, + ) = [u 0.95, + ) = [1.64, ) 40 3.352 U obl = 2 77 = 2.98 6.5 decyzja: U obl = 2.98 Q = [1.64, ) zatem na poziomie istotności 0.01 odrzucamy H 0 i przyjmujemy H 1. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 15 / 25
Testy dla dwóch średnich Model I : X 1 N(m 1, σ 1 ), X 2 N(m 2, σ 2 ), σ 1, σ 2 znane Hipoteza zerowa: H 0 : m 1 = m 2 Statystyka testowa: U = x 1 x 2 σ 2 1 n 1 + σ2 2 n 2 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : m 1 m 2 Q = (, u 1 α 2 ] [u 1 α 2, + ) H 1 : m 1 > m 2 Q = [u 1 α, + ) H 1 : m 1 < m 2 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 16 / 25
Przykład 6 Wybrani studenci matematyki i fizyki na pewnej uczelni uzyskali następujace średnie wyników nauczania: x 1 = 3.6, x 2 = 4.1, przy czym n 1 = n 2 = 50. Na poziomie istotności α = 0, 08 zweryfikować hipotezę, że średnie oceny na obu kierunkach sa takie same. Założyć, że próby pochodza z populacji o rozkładzie normalnym i wariancji równej 3. α = 0.08, x 1 = 3.6, x 2 = 4.1, n 1 = n 2 = 50 X 1 N(m 1, σ 1 ), X 2 N(m 2, σ 2 ), σ 1 = σ 2 = 3 m i średnie ocen na i- tym kierunku H 0 : m 1 = m 2, H 1 : m 1 m 2 statystyka testowa: U = x 1 x 2 σ 2 1 n 1 + σ2 2 n 2 Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 17 / 25
obszar krytyczny: Q = (, u 1 α 2 ] [u 1 α 2, + ) Wyliczamy 1 α 2 = 1 0.04 = 0.96, zatem Q = (, u 0.96 ] [u 0.96, + ) = (, 1.75] [1.75, + ) U obl = x 1 x 2 = σ 2 1 n 1 + σ2 2 n 2 3.6 4.1 3 50 + 3 50 = 1.44 decyzja: U obl = 1.44 / Q = (, 1.75] [1.75, ) zatem na poziomie istotności 0.08 brak podstaw do odrzucenia H 0. Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 18 / 25
Model II : X 1 N(m 1, σ 1 ), X 2 N(m 2, σ 2 ), σ 1, σ 2 nieznane ( n 1 31, n 2 31, n 1 + n 2 122) Hipoteza zerowa: H 0 : m 1 = m 2 Statystyka testowa: T = x 1 x 2 n 1 s1 2 + n 2s2 2 ( 1 n 1 + n 2 2 + 1 ) n 1 n 2 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : m 1 m 2 Q = (, t α, n 1 ] [t α, n 1, + ) H 1 : m 1 > m 2 Q = [t 2α, n 1, + ) H 1 : m 1 < m 2 Q = (, t 2α, n 1 ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 19 / 25
Model III : X 1 N(m 1, σ 1 ), X 2 N(m 2, σ 2 ), σ 1, σ 2 nieznane ( n 1 > 31, n 2 > 31, n 1 + n 2 > 122) Hipoteza zerowa: H 0 : m 1 = m 2 Statystyka testowa: U = x 1 x 2 s1 2 + s2 2 n 1 n 2 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : m 1 m 2 Q = (, u 1 α 2 ] [u 1 α 2, + ) H 1 : m 1 > m 2 Q = [u 1 α, + ) H 1 : m 1 < m 2 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 20 / 25
Testy dla wskaźnika struktury Model : X ma rozkład dwupunktowy z parametrem p (p-stwo "sukcesu") ( n 100) Hipoteza zerowa: H 0 : p = p 0 ( p 0 pewna określona liczba) Statystyka testowa: U = m n p 0 p0 (1 p 0 ) n Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : p p 0 Q = (, u 1 α 2 ] [u 1 α 2, + ) H 1 : p > p 0 Q = [u 1 α, + ) H 1 : p < p 0 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 21 / 25
Test dla dwóch wskaźników struktury Model : dwie populacje o rozkładach dwupunktowych z parametrami p 1 i p 2 ( n 1 100, n 2 100 ) Hipoteza zerowa: Statystyka testowa: m 1 H 0 : p 1 = p 2 m 2 n U = 1 n p 2 n gdzie p = m 1 + m 2, n = n 1 n 2 (1 p) n 1 + n 2 n 1 + n 2 Hipotezy alternatywne i odpowiednie obszary krytyczne: H 1 : p 1 p 2 Q = (, u 1 α 2 ] [u 1 α 2, + ) H 1 : p 1 > p 2 Q = [u 1 α, + ) H 1 : p 1 < p 2 Q = (, u 1 α ] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 22 / 25
Przykład 7 23 z 251 osób, które zostały zaszczepione przeciw grypie, zachorowało na nia, natomiast wśród 214 osób nie szczepionych zachorowało 91. Czy można wyciagn ać wniosek, że ta szczepionka jest skuteczna? Zastosować test dla dwóch frakcji przyjmujac α = 0.05. badamy frakcję osób chorujacych na grypę populacja pierwsza (szczepieni): n 1 = 251, m 1 = 23 populacja druga (nieszczepieni): n 2 = 214, m 2 = 91 p 1 - frakcja chorujacych na grypę wśród szczepionych p 2 - frakcja chorujacych na grypę wśród nieszczepionych α = 0.05, H 0 : p 1 = p 2, H 1 : p 1 < p 2 obszar krytyczny: Q = (, u 1 α ] = (, u 0.95 ] = (, 1.64] Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 23 / 25
statystyka testowa: U = m 1 m 2 n 1 n p 2 n gdzie p = m 1 + m 2, n = n 1 n 2 (1 p) n 1 + n 2 n 1 + n 2 p = 23 + 91 251 + 214 = 114 251 214 = 0.245, n = 465 251 + 214 = 53714 465 =115.51 23 U obl = 251 91 214 115.51 = 8.34 0.245 (1 0.245) decyzja: U obl = 8.34 Q = (, 1.64] zatem na poziomie istotności 0.05 odrzucamy H 0 i przyjmujemy H 1. (Czyli szcepionka jest skuteczna) Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 24 / 25
Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka matematyczna 14 i 21 maja 2018 25 / 25