TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej. Posługujemy się przy tym testem statystycznym, który ma na celu rozstrzygnięcie, jakie wyniki próby pozwalają uznać sprawdzaną hipotezę za prawdziwą, a jakie za fałszywą. Wyróżnia się hipotezy parametryczne (dotyczą wartości parametrów rozkładu) oraz nieparametryczne. Etapy testowania statystycznego: ) sformułowanie hipotez: - zerowej H 0 - alternatywnej H zaprzeczenie H 0, przyjmuje się ją za prawdziwą w sytuacji odrzucenia H 0 ) obliczenie statystyki testującej 3) wyznaczenie obszaru krytycznego testu (obszaru odrzucenia hipotezy); jeśli statystyka testująca należy do obszaru krytycznego, odrzucamy H 0 na korzyść H, w przeciwnym wypadku przyjmujemy H 0 Przy decyzji po przyjęciu / odrzuceniu H 0 popełniamy rodzaje błędów: - błąd I rodzaju (odrzucenie prawdziwej H 0 ) - błąd II rodzaju (przyjęcie fałszywej H 0 ). Testy statystyczne konstruuje się w taki sposób, aby zminimalizować prawdopodobieństwo błędu II rodzaju (β) przy ustalonym z góry poziomie prawdopodobieństwa popełnienia błędu I rodzaju (α). Tak zbudowane testy nazywa się najmocniejszymi (odpowiada im największa moc). Moc testu jest to prawdopodobieństwo odrzucenia fałszywej H 0 i przyjęcie prawdziwej H : M=- β.
PARAMETRYCZNE TETY ITOTNOŚCI A. Testy istotności dla średniej H 0 : m=m 0 H : m m 0 lub m>m 0 lub m<m 0 I. X ~ N( m, ), - znane u x m = 0 n ma rozkład normalny N(0,) ) = α (gdy H : m m 0 ), ) = α (gdy H : m>m 0 ), ) = α (gdy H : m<m 0 ), - - II. X ~ N( m, ), -nieznane, ν > 30 u x m = 0 n ma rozkład normalny N(0,) ) = α (gdy H : m m 0 ), ) = α (gdy H : m>m 0 ), ) = α (gdy H : m<m 0 ), - -
III. X ~ N( m, ), -nieznane, ν <= 30 t x m = 0 n ma rozkład t-tudenta z n- stopniami swobody Pt ( t α ) = α (gdy H : m m 0 ), -, n Pt ( t α ) = α (gdy H : m>m 0 ), -, n Pt ( t α ) = α (gdy H : m<m 0 ). -, n IV. Populacja ma rozkład dowolny z nieznanymi parametrami ale n>=00 Wówczas x Nm ( 0, / n). x m 0 n ma rozkład normalny N(0,) ) = α (gdy H : m m 0 ), - PU ( u α ) = α (gdy H : m>m 0 ), ) = α (gdy H : m<m 0 ), -
B. Testy istotności dla dwóch średnich H 0 : m =m H : m m lub m >m lub m <m I. niezależne populacje, X ~ N( m, ), X ~ N( m, ),, - znane x x ma rozkład normalny N(0,) + n n ) = α (gdy H : m =m ), ) = α (gdy H : m >m ), ) = α (gdy H : m <m ), - - II. niezależne populacje, X ~ N( m, ), X ~ N( m, ),, - nieznane, =, ν=n +n ->30 x x ma rozkład normalny N(0,) + n n ) = α (gdy H : m =m ), ) = α (gdy H : m >m ), ) = α (gdy H : m <m ), - -
III. niezależne populacje, X ~ N( m, ), X ~ N( m, ),, - nieznane, =, ν=n +n -<=30 x x t = ( n ) + ( n ), gdzie p = n+ n p + n n ma rozkład t-tudenta z n +n - stopniami swobody. P( t t α ) = α (gdy H : m m ), -, n+ n - n+ n - n n Pt ( t α ) = α (gdy H : m >m ),, Pt ( t α ) = α (gdy H : m <m )., + IV. niezależne populacje, rozkład X i X nieznany, ale n i n >=00 x x ma rozkład normalny N(0,) + n n ) = α (gdy H : m =m ), ) = α (gdy H : m >m ), ) = α (gdy H : m <m ), - -
V. populacje zależne, gdy obserwacje do prób dobierane są parami R = ( X X )~ N( m, ) i i i R R H m m 0: R = 0 H: mr m0 lub H: mr > m0lub H: mr < m0 R m n R t = n, gdzie R = ( ) Ri R ma rozkład t-tudenta z n- R n i= stopniami swobody. P( t t α ) = α (gdy H : m R m 0 ), - n n, + Pt ( t α ) = α (gdy H : m R >m 0 ), - n n, + Pt ( t α ) = α (gdy H : m R <m 0 ). - n n, + C. Test istotności dla wariancji X ~ N( m, ), -znane H0: = 0 H: 0 lub > 0 Jeśli prawdziwa jest H 0 to statystyka ( n ) χ = 0 ma rozkład Chi-kwadrat z υ = n stopniami swobody. Obszar odrzuceń: jeśli H : 0 P ( χ χ ) = α / - prawostronna część obszaru krytycznego α /, n P ( χ χ ) = α /- lewostronna część obszaru krytycznego α /, n jeśli H : > 0 P( χ χ ) = α α, n
D. Test istotności dla dwóch wariancji niezależne populacje, X ~ N( m, ), X ~ N( m, ),, -nieznane H 0 : = H : lub > Jeśli prawdziwa jest H 0 F = ( x) ( x) to statystyka F ma rozkład F-nedecora z υ = n i υ = n stopniami swobody. Obszar odrzuceń: jeśli H : α P( F F α /) = - prawostronna część obszaru krytycznego α P( F F α /) = - lewostronna część obszaru krytycznego jeśli H : > P( F F α ) = α Ponieważ tablice statystyczne pozwalają odczytać tylko wartość F α / określającą prawostronną część obszaru krytycznego, za populację z numerem należy uznać populację o większej wariancji w próbie (wówczas sprawdzamy czy wartość statystyki F wpada do prawostronnej części obszaru krytycznego).
E. Testy istotności dla frakcji H 0 : p=p 0 H : p p 0 lub p>p 0 lub p<p 0 pˆ p 0 p0( p0) n ma rozkład normalny N(0,). ) = α (gdy H : p p 0 ), ) = α (gdy H : p>p 0 ), ) = α (gdy H : p<p 0 ), - - F. Test istotności dla dwóch frakcji H 0 : p =p H : p p lub p >p lub p <p pˆ pˆ, gdzie p ( p ) + n n x n + x + n p = ma rozkład normalny N(0,) ) = α (gdy H : p p ), ) = α (gdy H : p >p ), ) = α (gdy H : p <p ). - -
NIEPARAMETRYCZNE TETY ITOTNOŚCI Test nieparametryczny, weryfikuje czy zmienna losowa ma określony rozkład, np. rozkład normalny z parametrami m i. Test zgodności Chi-kwadrat H 0 : F(x)=F 0 (x) H : F(x) F 0 (x) χ i n ( n ˆ i ni) = nˆ i= n - liczebności empiryczne i n ˆi liczebności teoretyczne, oczekiwane (jeśli zmienna ma weryfikowany rozkład) nˆi = n p i, musi być spełniony warunek n ˆi > 5, w przeciwnym wypadku należy połączyć dwie sąsiadujące ze sobą klasy tatystyka χ ma rozkład Chi-kwadrat z υ = r k stopniami swobody, gdzie r liczba klas wartości zmiennej, k- liczba parametrów rozkładu szacowanych na podstawie próby (jeśli nie szacujemy parametrów na podstawie próby, ale zakładamy je, to k=0). Obszar krytyczny P( χ >= χ α, )=α