STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Podobne dokumenty
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Hipotezy statystyczne

Hipotezy statystyczne

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna dla leśników

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Wykład 3 Hipotezy statystyczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Testowanie hipotez statystycznych

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Testowanie hipotez cz. I

Kolokwium ze statystyki matematycznej

Testowanie hipotez statystycznych.

Statystyka matematyczna i ekonometria

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka Matematyczna Anna Janicka

166 Wstęp do statystyki matematycznej

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka matematyczna i ekonometria

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez statystycznych. Wprowadzenie

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka Matematyczna Anna Janicka

Statystyka matematyczna

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Prawdopodobieństwo i statystyka

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych

STATYSTYKA

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wydział Matematyki. Testy zgodności. Wykład 03

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testowanie hipotez statystycznych

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez statystycznych cd.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wykład 12 Testowanie hipotez dla współczynnika korelacji

1 Estymacja przedziałowa

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Weryfikacja hipotez statystycznych

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Testowanie hipotez statystycznych

Dokładne i graniczne rozkłady statystyk z próby

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Rozkłady statystyk z próby

Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Statystyka matematyczna. Wykład VI. Zesty zgodności

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

WNIOSKOWANIE STATYSTYCZNE

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Estymacja parametrów rozkładu cechy

Transkrypt:

STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Karl Popper... no matter how many instances of white swans we may have observed, this does not justify the conclusion that all swans are white. Good tests kill flawed theories; we remain alive to guess again.

Hipoteza statystyczna Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące postaci rozkładu cechy w populacji generalnej (hipotezy nieparametryczne) lub wartości jego parametrów (hipotezy parametryczne). Postępowanie służące rozstrzygnięciu czy hipotezę należy odrzucić czy też nie, nazywamy weryfikacją lub testowaniem hipotezy. Weryfikowaną hipotezę nazywamy zerową (H 0 ). Oprócz niej formułujemy także drugą hipotezę: alternatywną (H 1 ), której prawdziwość przyjmujemy w przypadku odrzucenia hipotezy zerowej. Hipoteza mówiąca, że parametr przyjmuje pewną dokładną (punktową) wartość, nazywa się hipotezą prostą (np. θ = 3). Hipotezę określająca zbiór wartości parametru nazywamy hipotezą złożoną (np. θ < 0).

Test statystyczny Test statystyczny to reguła (procedura) postępowania służąca do podjęcia decyzji o przyjęciu lub odrzuceniu sprawdzanej hipotezy, na podstawie wyników z próby. Formalnie procedura testowa to mierzalna funkcja ϕ : X {0, 1}, gdzie ϕ(x ) = 1 oznacza decyzję o odrzuceniu H 0 (i przyjęcie H 1 ), a wartość ϕ(x ) = 0 oznacza przyjęcie H0 (i odrzucenie H 1 ). Testy parametryczne służą do weryfikacji hipotez parametrycznych. Testy nieparametryczne służą do weryfikacji hipotez nieparametrycznych.

Błędy I i II rodzaju Hipoteza zerowa może być prawdziwa lub fałszywa. My możemy podjąć dwie decyzje: odrzucić H 0 albo nie odrzucać H 0. Hipoteza statystyczna jest weryfikowana w oparciu o dane z próby, więc istnieje prawdopodobieństwo popełnienia błędu. Możliwe są cztery sytuacje: Wynik testu Rzeczywistość H 0 jest prawdziwa H 0 jest fałszywa Odrzucamy H 0 Błąd I rodzaju decyzja poprawna Brak podstaw do odrzucenia H 0 decyzja poprawna Błąd II rodzaju

Obserwacja: Cecha X ma rozkład normalny N(m, 1) o nieznanej wartości przeciętnej m. Wysuwamy przypuszczenie, że H 0 : m = 0 (hipoteza zerowa). Załóżmy teraz, że z wylosowanej próby prostej zwierającej 10 elementów uzyskano wartość x = 0.977. Wiemy, że jeśli X N(0, 1), to X 10 N(0, 1/10), zatem P( X 10 0.977) = P( 10 X 10 0.977 10) = = 2(1 Φ(0.977 10)) 0.002. Jeśli H 0 jest prawdziwa, to zdarzenie { X 10 0.977} jest mało prawdopodobne, jednakże możliwe.

Poziom istotności, testy istotności Musimy podjąć decyzję (czy też ustalić regułę decyzyjną), jak małe prawdopodobieństwo nastąpienia obserwowanego zdarzenia (przy zachodzeniu H 0 ) skłania nas do odrzucenia H 0. Takie krytyczne prawdopodobieństwo α (0, 1), że odrzucamy H 0, jeżeli (przy zachodzeniu H 0 ) prawdopodobieństwo nastąpienia zaobserwowanego zdarzenia jest nie większe niż α, nazywamy poziomem istotności. P(ϕ(X ) = 1 H 0 ) = P(odrzucamy H 0 H 0 ) α. Testy, przy których interesuje nas jedynie prawdziwość lub fałszywość H 0, i nie interesuje na błąd II rodzaju, nazywamy testami istotności. Testy istotności pozwalają na odrzucenie H 0, lub stwierdzenie, że zaobserwowane wartości nie dają podstaw do odrzucenia H 0.

Poziom istotności, rozmiar i moc testu Rozmiarem testu nazywamy liczbę P(błędu I rodzaju) = P(odrzucenie H 0 H 0 jest prawdziwa). Test na poziomie istotności α ma rozmiar α. Mocą testu nazywamy liczbę 1 β, gdzie β = P(błędu II rodzaju) = = P(nieodrzucenie H 0 H 1 jest prawdziwa), czyli moc testu = P(odrzucenie H 0 H 1 jest prawdziwa).

Obszar krytyczny Test istotności składa się: ze statystyki testowej (T ) zwanej także sprawdzianem hipotezy, oraz obszaru krytycznego (K), który wyznaczamy tak, aby α = P(T K H 0 ). ( ) Jeśli zachodzi T K, to H 0 odrzucamy, na korzyść H 1. Jeśli T K, to nie ma podstaw do odrzucenia H 0. Hipoteza zerowa w testach parametrycznych ma zwykle postać: H 0 : θ = θ 0, gdzie θ 0 jest ustaloną liczbą rzeczywistą. Hipotezę alternatywną w testach istotności możemy sformułować na trzy sposoby; każdemu z nich odpowiada inny typ obszaru krytycznego: H 1 : θ θ 0, obszar krytyczny dwustronny: K = (, a) (b, ), H1 : θ > θ 0, obszar krytyczny prawostronny: K = (b, ), H1 : θ < θ 0, obszar krytyczny lewostronny: K = (, a) (gdzie a, b należy wyznaczyć z warunku ( )).

Schemat weryfikacji hipotez Sformułowanie hipotezy zerowej i alternatywnej, Wybór statystyki testowej, Określenie poziomu istotności α, Wyznaczenie obszaru krytycznego testu, Obliczenie oceny statystyki testowej na podstawie próby, Podjęcie decyzji.

Test dla wartości oczekiwanej w populacji normalnej o znanej wariancji, H 1 : µ m 0 Zakładamy, że X N(µ, σ 2 ), gdzie σ 2 jest znane. Chcemy zweryfikować hipotezę H 0 : µ = m 0 wobec H 1 : µ m 0. Statystyką testową jest Z = X m 0 n. σ Ustalamy poziom istotności α (0, 1). Z uwagi na postać H 1 obszar krytyczny jest dwustronny: K = (, z α ) (z α, ), gdzie wartość krytyczną z α dobieramy tak, aby P( Z z α H 0 ) = α. Pod założeniem H 0 mamy Z N(0, 1), zatem ( α 2 = P(Z z α H 0 ) = 1 Φ(z α ) z α = Φ 1 1 α ). 2 Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej z K, czyli z z α.

Przykład Czas pracy pewnego rodzaju baterii ma rozkład N(µ, 70 2 ). Na poziomie istotności α = 0.05 zweryfikować hipotezę, że przeciętny czas pracy tego typu baterii jest równy 500 godz., jeżeli dla 16 losowo wybranych baterii otrzymano x = 530 godz. H 0 : µ = 500 H 1 : µ 500, α = 0.05 z α = Φ 1 (1 0.05/2) = 1.96, K = (, 1.96) (1.96, ), x = 530, σ = 70, n = 16, z = x m 0 530 500 n = 16 = 1.714286 K. σ 70 Nie ma podstaw do odrzucenia hipotezy H 0. Wniosek: Przeciętny czas pracy tego typu baterii nie jest istotnie różny od 500 godzin (na poziomie istotności 0.05).

p-value Gdybyśmy w powyższym przykładzie przyjęli α = 0.1, to wówczas z α = Φ(0.95) = 1.645, Wtedy z = 1.714286 K = (, 1.645) (1.645, ), więc H 0 należałoby odrzucić. Najmniejszy poziom istotności α dla którego odrzucamy H 0 (lub największy dla którego nie odrzucamy H 0 ) nazywamy p-wartością testu (p-value). p-value dostarcza dodatkową informację o dowodach za lub przeciw H 0, ułatwiając podejmowanie decyzji o jej przyjęciu lub odrzuceniu. W naszym przykładzie: 1.714286 = Φ 1 (1 p/2) p = 2(1 Φ(1.714286)) = 0.08647621. Zauważmy, że w tym przykładzie ( ) p = P Z z H 0, gdzie z jest wartością statystyki Z zaobserwowaną w próbie.

Test dla wartości oczekiwanej w populacji normalnej o znanej wariancji, H 1 : µ > m 0 Zakładamy, że X N(µ, σ 2 ), gdzie σ 2 jest znane. Chcemy zweryfikować hipotezę H 0 : µ = m 0 wobec H 1 : µ > m 0. Statystyką testową jest Z = X m 0 n. σ Ustalamy poziom istotności α (0, 1). Z uwagi na postać H 1 obszar krytyczny jest prawostronny: K = (z 2α, ), gdzie z 2α dobieramy tak, aby P(Z z 2α H 0 ) = α. Pod założeniem H 0 mamy Z N(0, 1), zatem α = P(Z z 2α H 0 ) = 1 Φ(z α ) z 2α = Φ 1 (1 α). Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej z K, czyli z > z 2α.

Przykład Czas pracy pewnego rodzaju baterii ma rozkład N(µ, 70 2 ). Odpowiedz na pytanie, czy przeciętny czas pracy tego typu baterii wynosi ponad 500 godz., jeżeli dla 16 losowo wybranych baterii otrzymano x = 530 godz. Przyjmij poziom istotności α = 0.05. H 0 : µ = 500 H 1 : µ > 500, α = 0.05 z α = Φ 1 (1 0.05) = 1.645, K = (, 1.645) (1.645, ), x = 530, σ = 70, n = 16, z = x m 0 530 500 n = 16 = 1.714286 K. σ 70 Odrzucamy H 0 : Przeciętny czas pracy tego typu baterii jest istotnie większy niż 500 godzin (na poziomie istotności 0.05). ( ) p = P Z > 1.714286 H 0 = 1 Φ(1.714286) = 0.04323811.

Test dla wartości oczekiwanej w populacji normalnej o znanej wariancji, H 1 : µ < m 0 Zakładamy, że X N(µ, σ 2 ), gdzie σ 2 jest znane. Chcemy zweryfikować hipotezę H 0 : µ = m 0 wobec H 1 : µ < m 0. Statystyką testową jest Z = X m 0 n. σ Ustalamy poziom istotności α (0, 1). Z uwagi na postać H 1 obszar krytyczny jest lewostronny: K = (, z 2α ), gdzie z 2α dobieramy tak, aby P(Z z 2α H 0 ) = α. Pod założeniem H 0 mamy Z N(0, 1), zatem α = P(Z z 2α H 0 ) = 1 Φ(z 2α ) z 2α = Φ 1 (1 α). Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej z K, czyli z < z 2α.

Test dla wartości oczekiwanej w populacji normalnej o nieznanej wariancji, H 1 : µ m 0 Zakładamy, że X N(µ, σ 2 ), gdzie σ 2 jest nieznane. Chcemy zweryfikować hipotezę H 0 : µ = m 0 wobec H 1 : µ m 0. Statystyką testową jest T = X m 0 n 1. S Ustalamy poziom istotności α (0, 1). Z uwagi na postać H 1 obszar krytyczny jest dwustronny: K = (, t α ) (t α, ), gdzie wartość krytyczną t α dobieramy tak, aby P( T t α H 0 ) = α. Pod założeniem H 0 mamy T t n 1, zatem α = P( T t α H 0 ) t α = Ft,n 1 1 (1 α/2), gdzie F t,n 1 oznacza dystrybuantę rozkładu t-studenta o n 1 stopniach swobody. Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej t K, czyli t > t α.

Przykład Na podstawie 10 elementowej próby obliczono średnią czasu toczenia detalu na tokarce równą 27 minut i odchylenie standardowe 5 minut. Na poziomie istotności α = 0.02 zweryfikować hipotezę, że przeciętny czas toczenia na tej tokarce wynosi 30 minut, przy założeniu, że czas toczenia detalu ma rozkład normalny. H 0 : µ = 30 H 1 : µ 30, α = 0.02, n = 10 t α = Ft,9 1 (1 0.05/2) = 2.821, K = (, 2.821) (2.821, ), x = 27, S = 5, t = x m 0 27 30 n 1 = 10 1 = 1.8 K. S 5 Nie ma podstaw do odrzucenia H 0 : Przeciętny czas toczenia detalu na tokarce nie różni się istotnie od 30 minut. ( ) p = P T > 1.8 H 0 = 2(1 F t,9 (1.8)) = 0.1053907.

Test dla wartości oczekiwanej w populacji normalnej o nieznanej wariancji, H 1 : µ > m 0 Zakładamy, że X N(µ, σ 2 ), gdzie σ 2 jest nieznane. Chcemy zweryfikować hipotezę H 0 : µ = m 0 wobec H 1 : µ > m 0. Statystyką testową jest T = X m 0 n 1. S Ustalamy poziom istotności α (0, 1). Z uwagi na postać H 1 obszar krytyczny jest prawostronny: K = (t 2α, ), gdzie t 2α dobieramy tak, aby P(T t 2α H 0 ) = α. Pod założeniem H 0 mamy T t n 1, zatem α = P(T t 2α H 0 ) P( T t 2α ) = 2α t 2α = F 1 t,n 1 (1 α), gdzie F t,n 1 oznacza dystrybuantę rozkładu t-studenta o n 1 stopniach swobody. Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej t K, czyli t > t 2α.

Test dla wartości oczekiwanej w populacji normalnej o nieznanej wariancji, H 1 : µ < m 0 Zakładamy, że X N(µ, σ 2 ), gdzie σ 2 jest nieznane. Chcemy zweryfikować hipotezę H 0 : µ = m 0 wobec H 1 : µ < m 0. Statystyką testową jest T = X m 0 n 1. S Ustalamy poziom istotności α (0, 1). Z uwagi na postać H 1 obszar krytyczny jest lewostronny: K = (, t 2α ), gdzie t 2α dobieramy tak, aby P(T t 2α H 0 ) = α. Pod założeniem H 0 mamy T t n 1, zatem α = P(T t 2α H 0 ) P( T t 2α ) = 2α t 2α = F 1 t,n 1 (1 α), gdzie F t,n 1 oznacza dystrybuantę rozkładu t-studenta o n 1 stopniach swobody. Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej t K, czyli t < t 2α.

Test dla wartości oczekiwanej w dowolnej populacji o nieznanej wariancji, dla dużej próby Dysponujemy liczną próbą (n > 120). X ma dowolny rozkład o skończonej wariancji σ 2, gdzie σ 2 jest nieznane. Chcemy zweryfikować hipotezę H 0 : µ = m 0, gdzie µ = E(X ). Jako statystyki testowej używamy Z = X m 0 n, która przy S prawdziwości H 0 ma asymptotyczny rozkład N(0, 1). Dalej postępujemy jak w przypadku testu w populacji o znanej wariancji.

Test równości wartości oczekiwanych w dwóch populacjach normalnych o znanych wariancjach Badamy dwie populacje generalne: X 1 N(µ 1, σ1 2), X 2 N(µ 2, σ2 2). Parametry µ 1, µ 2 są nieznane, σ1 2, σ2 2 są znane. Chcemy zweryfikować hipotezę H 0 : µ 1 = µ 2 wobec H 1 : µ 1 µ 2. Próby wylosowane z populacji ( mają liczebności n 1 i n 2. Ponieważ X 1 X 2 N µ 1 µ 2, σ2 1 n 1 + σ2 2 n 2 ), więc sprawdzianem jest statystyka Z = X 1 X 2, σ1 2 n 1 + σ2 2 n 2 która przy prawdziwości H 0 ma rozkład N(0, 1). Przy poziomie istotności α (0, 1), obszar krytyczny ma postać K = (, z α ) (z α, ), gdzie wartość krytyczną z α dobieramy tak, aby P( Z z α H 0 ) = α. H 0 odrzucamy, jeśli obliczona z próby wartość z K, czyli z z α.

Test równości wartości oczekiwanych w dwóch populacjach normalnych o nieznanych wariancjach Badamy dwie populacje generalne: X 1 N(µ 1, σ1 2), X 2 N(µ 2, σ2 2). Parametry µ 1, µ 2, a także σ1 2, σ2 2 są nieznane, jednakże σ2 1 = σ2 2. Chcemy zweryfikować hipotezę H 0 : µ 1 = µ 2 wobec H 1 : µ 1 µ 2. Próby wylosowane z populacji mają liczebności n 1 i n 2. Przy prawdziwości H 0 ma statystyka t = X 1 X 2 n1 n 2 (n 1 + n 2 2), n 1 S1 2 + n 2S2 2 n 1 + n 2 ma rozkład t-studenta o (n 1 + n 2 2) stopniach swobody. Przy poziomie istotności α (0, 1), obszar krytyczny ma postać K = (, t α ) (t α, ), gdzie wartość krytyczną t α dobieramy tak, aby P( t t α H 0 ) = α. H 0 odrzucamy, jeśli obliczona z próby wartość t K, czyli t t α.

Przykład (Jóźwiak, Podgórski, przykład 10.4) Przypuszcza się, że młodsze osoby łatwiej decydują się na zakup nowych, nieznanych produktów. Zapytano o wiek 20 wybranych przypadkowo nabywców nowego produktu i 22 nabywców znanego już wyrobu pewnej firmy. Otrzymano dane: nowy produkt: średnia 27.7 lat, odchylenie standardowe 5.5 lat, stary produkt: średnia 32.1 lat, odchylenie standardowe 6.3 lat. Weryfikujemy hipotezę H 0 : µ 1 = µ 2 wobec H 1 : µ 1 < µ 2, α = 0.05. Zakładamy, że wiek kupujących jest normalny o takim samym zróżnicowaniu. 27.7 32.1 20 22 t = (20 + 22 2) = 2.343. 20 5.5 2 + 22 6.3 2 20 + 22 dla 20 + 22 2 = 40 stopni swobody, oraz 2α = 0.1 odczytujemy t 0.1,40 = 1.684, obszar krytyczny K = (, 1.684). Ponieważ t K, więc H 0 odrzucamy na korzyść hipotezy alternatywnej: wyniki próby potwierdzają przypuszczenie.

Test dla wariancji w populacji normalnej Zakładamy, że cecha X ma rozkład normalny N(µ, σ 2 ), o nieznanych parametrach. Weryfikujemy hipotezę, że wariancja ma ustaloną wartość σ 2 0 : H 0 : σ 2 = σ 2 0, wobec H 1 : σ 2 > σ 2 0. Statystyką testową jest χ 2 = ns2 σ 2 0 = 1 σ 2 0 ni=1 (X i X ) 2, która przy prawdziwości H 0 ma rozkład χ 2 o n 1 stopniach swobody. Na poziomie istotności α (0, 1), z uwagi na postać H 1 obszar krytyczny ma postać: K = (χ 2 α, ), gdzie wartość krytyczną χ 2 α dobieramy tak, by P(χ 2 χ 2 α H 0 ) = α. Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej χ 2 K, czyli χ 2 χ 2 α.

Test dla wariancji w populacji normalnej Tygodniowe wydatki na żywność per capita mają rozkład N(µ, σ 2 ). Dla 10 losowo wybranych rodzin otrzymano x = 48 i s = 10.8. Czy na poziomie istotności α = 0.05 można uważać, że odchylenie standardowe wydatków wynosi 9? Weryfikujemy H 0 : σ 2 = 9 2 wobec H 0 : σ 2 > 9 2. Mamy n = 10, σ 2 0 = 92, s 2 = 10.8 2, więc χ 2 = ns 2 σ 2 0 = 10 10.82 9 2 = 14.4, oraz χ 2 0.05,9 = 16.919. Ponieważ χ 2 = 14.4 < 16.919 = χ 2 0.05,9, więc nie ma podstaw do odrzucenia H 0.

Test dla wariancji w populacji normalnej, n > 30 Zakładamy, że cecha X ma rozkład normalny N(µ, σ 2 ), o nieznanych parametrach. Dysponujemy dużą próbą: n > 30. Weryfikujemy hipotezę, że wariancja ma ustaloną wartość σ 2 0 : H 0 : σ 2 = σ 2 0, wobec H 1 : σ 2 > σ 2 0. Statystyką testową jest Z = 2χ 2 2n 3, gdzie χ 2 = ns2, która przy prawdziwości H 0 ma asymptotyczny rozkład N(0, 1). Na poziomie istotności α (0, 1), z uwagi na postać H 1, obszar krytyczny ma postać: K = (z α, ), gdzie wartość krytyczną z α dobieramy tak, by P(Z z α H 0 ) = α. Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej z K, czyli z z α. σ 2 0

Test równości wariancji w dwóch populacjach normalnych Badamy dwie populacje generalne: X 1 N(µ 1, σ 2 1 ), X 2 N(µ 2, σ 2 2 ). Wszystkie parametry są nieznane. Chcemy zweryfikować hipotezę H 0 : σ 2 1 = σ2 2 wobec H 1 : σ 2 1 σ2 2. Próby wylosowane z populacji mają liczebności n 1 i n 2. Statystyką testową jest F = Ŝ 2 1 Ŝ 2 2 = n 1S 2 1 /(n 1 1) n 2 S 2 2 /(n 2 1), która przy prawdziwości H 0 ma rozkład F -Snedecora o (n 1 1) oraz (n 2 1) stopniach swobody. Obszar krytyczny ma postać: gdzie K = (, F 1 α/2 ) (F α/2, ), P(F F α/2 ) = α/2, P(F F 1 α/2 ) = α/2.

Test równości wariancji w dwóch populacjach normalnych, c.d. Dla H 1 : σ1 2 σ2 2 zwykle postępujemy następująco: umieszczamy w liczniku większą wariancję, niezależnie czy jest obliczona z pierwszej czy drugiej próby, tak by obliczona z próby wartość F > 1, wyznaczamy liczbę Fα/2 taką, że P(F F α/2 ) = α/2, odrzucamy H0, jeżeli F F α/2. Jeśli H 1 : σ1 2 > σ2 2, to obszar krytyczny jest prawostronny i wyznaczany z relacji P(F F α ) = α. Jeśli H 1 : σ 2 1 < σ2 2, to najlepiej przenumerować populacje uzyskując poprzedni przypadek.

Przykład Sprawdzimy czy założenie o takim samym zróżnicowaniu wieku nabywców było słuszne. Weryfikujemy hipotezę: H 0 : σ 2 1 = σ 2 2, wobec H 1 : σ 2 1 σ 2 2. Ponieważ odchylenie standardowe wieku nabywców znanego wyrobu jest większe, więc tą populację będziemy traktować jako pierwszą. W tych oznaczeniach: Statystyka testowa: n 1 = 22, n 2 = 20, s 1 = 6.3, s 2 = 5.5. F = 22 6.32 /21 20 5.5 2 /19 = 1.306. Dla α = 0.05, n 1 = 22, n 2 = 19 odczytujemy F 0.025,21,19 = 2.493. Ponieważ F < F 0.025,21,19, więc nie ma podstaw do odrzucenia hipotezy o równości wariancji.

Test dla wskaźnika struktury Zakładamy, że X ma rozkład zero-jedynkowy z parametrem p. Dysponujemy dużą próbą n > 100. Weryfikujemy hipotezę H 0 : p = p 0 wobec H 1 : p p 0. Statystyka testowa Z = m n p 0 p0 (1 p 0 ) n ma przy prawdziwości H 0 asymptotyczny rozkład N(0, 1). m jest liczbą wyróżnionych elementów w próbie posiadających daną cechę. Na poziomie istotności α (0, 1) obszar krytyczny ma postać K = (, z α ) (z α, ), gdzie z α dobieramy tak, aby P( Z z α H 0 ) = α. Hipotezę H 0 odrzucamy, jeśli obliczona z próby wartość statystyki testowej z K, czyli z > z α.

Test równości wskaźników struktury Badamy dwie populacje X 1 i X 2 o rozkładach zero-jedynkowych z parametrami p 1 i p 2. Dysponujemy dużymi próbami n 1, n 2 > 100. Weryfikujemy hipotezę H 0 : p 1 = p 2 wobec H 1 : p 1 p 2. Niech m 1 i m 2 oznacza liczbę wyróżnionych elementów w próbach. Liczymy: w 1 = m 1, w 2 = m 2, p = m 1 + m 2, n = n 1n 2. n 1 n 2 n 1 + n 2 n 1 + n 2 Statystyka testowa Z = w 1 w 2 p(1 p) n ma przy prawdziwości H 0 asymptotyczny rozkład N(0, 1). Obszar krytyczny wyznaczamy i decyzję podejmujemy tak jak przy teście dla pojedynczego wskaźnika struktury.

Test zgodności χ 2 Weryfikujemy hipotezę, że badana populacja ma rozkład określony dystrybuantą F 0 : H 0 : F = F 0 wobec H 1 : F F 0. Wyniki dużej próby porządkujemy w r klas o liczebnościach n i. Niech p i oznaczają teoretyczne prawdopodobieństwo przyjęcia wartości z i-tej klasy (przy założeniu H 0 ), i = 1,..., r. Statystyka testowa χ 2 = r (n i np i ) 2 i=1 ma przy prawdziwości H 0 asymptotyczny rozkład χ 2 o (r k 1) stopniach swobody, gdzie k jest liczbą parametrów rozkładu oszacowanych na podstawie rozkładu empirycznego metodą największej wiarygodności. Wartość krytyczną χ α wyznaczamy z relacji: P(χ 2 χ 2 α) = α. Hipotezę zerową odrzucamy, jeśli χ 2 χ 2 α. np i

Przykład Rejestrując liczbę zgłoszeń w 300 losowo wybranych, pięciosekundowych odcinkach pracy pewnej centrali telefonicznej otrzymano dane: Liczba zgłoszeń 0 1 2 3 4 5 Liczba odcinków 40 110 80 40 20 10 Na poziomie istotności α = 0.05 zweryfikować hipotezę, że rozkład liczby zgłoszeń napływających do tej centrali jest rozkładem Poissona: P(X = k) = λk k! e λ, k = 0, 1, 2,....

Przykład, c.d. Estymatorem NW parametru λ jest średnia arytmetyczna: ˆλ = 1.733. Dla x i = 0, 1, 2, 3, 4, obliczamy p i z powyższego wzoru. Dla ostatniej klasy p i liczymy jako dopełnienie do 1. Otrzymujemy χ 2 = 7.57. x i n i p i np i (n i np i ) 2 np i 0 40 0.177 53.0 3.19 1 110 0.306 91.9 3.57 2 80 0.265 79.6 0.00 3 40 0.153 46.0 0.78 4 20 0.066 19.9 0.00 5 i więcej 10 0.032 9.5 0.02 Ponieważ r = 6, k = 1, więc χ 2 0.05,4 = 9.487729. Nie ma podstaw do odrzucenia H 0.

Test niezależności χ 2 Rozważamy dwie cechy X i Y. Weryfikujemy hipotezę, że: H 0 : zmienne X i Y są niezależne, wobec H 1 : zmienne X i Y nie są niezależne. Przypomnienie: do oceny zależności służy wielkość Z = r s i=1 j=1 (n ij ˆn ij ) 2 ˆn ij, gdzie n ij są liczebnościami z tablicy korelacyjnej, zaś ˆn ij = n i n j. n Statystyka Z przy prawdziwości H 0 ma asymptotyczny rozkład χ 2 o (r 1)(s 1) stopniach swobody, i nie powinna przyjmować zbyt dużych wartości. Obszar krytyczny wyznaczamy z relacji: P(Z χ 2 α) = α, a hipotezę zerową odrzucamy, jeśli Z χ 2 α. Uwaga: stosujemy, gdy ˆn ij 5 dla wszystkich i, j.

Przykład Dane dotyczące jakości wyrobu A produkowanego w ciągu I i II zmiany są następujące: Zmiana Jakość I II Dobra 52 18 Zła 8 22 Zweryfikuj hipotezę, że jakość wyrobu nie zależy od zmiany, na której jest produkowany. Przyjmij poziom istotności α = 0.05. Mamy ˆn ij I II n i Dobra 42 28 70 Zła 18 12 30 n j 60 40 100 (n ij ˆn ij ) 2 ˆn ij I II Dobra 100/42 100/28 Zła 100/18 100/12 skąd Z = 19.84, (r 1)(s 1) = 1, χ 2 0.05,1 = 3.84. Hipotezę o niezależności odrzucamy. (p = 8.414615 10 6 )