ZASADY TESTOWANIA HIPOTEZ STATYSTYCZNYCH. TESTY DOTYCZĄCE WARTOŚCI OCZEKIWANEJ Przez hipotezę tatytyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu intereującej na cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy ię hipotezami parametrycznymi. Są to hipotezy dotyczące nieznanego parametru θ (rozważamy tylko przypadek, gdy θ = µ, czyli jet nieznaną wartością oczekiwaną rozkładu cechy). Na podtawie próbki (x 1,..., x n ) mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Nieściśle mówiąc, poób potępowania, który prowadzi do podjęcia decyzji, nazywamy tetem (tatytycznym). Ogólny chemat potępowania. 1. Formułujemy dwie wzajemnie wykluczające ię hipotezy: H 0 (zerowa) i H 1 (alternatywna).. Określamy poziom itotności tetu α (0, 1) (tandardowo α = 0.05). Jet to prawdopodobieńtwo popełnienia błędu I rodzaju. 1
Błąd I rodzaju - prawdziwa jet H 0, a my ją odrzucamy. Błąd II rodzaju - prawdziwa jet H 1, a my decydujemy na rzecz H 0. tan rzeczy/decyzja przyjąć H 0 przyjąć H 1 H 0 prawdziwa OK błąd I rodzaju H 1 prawdziwa błąd II rodzaju OK Pożądane jet, by prawdopodobieńtwa popełnienia błędów obu rodzajów były jak najmniejze. Okazuje ię, że tego nie da ię zrobić jednocześnie. Wobec tego potępujemy w poób natępujący: przede wzytkim taramy ię kontrolować prawdopodobieńtwo popełnienia błędu I rodzaju. Właśnie dlatego taramy ię, przy już formułowanych hipotezach, oznaczyć je tak, by popełnienie błędu I rodzaju miało gorze kutki. 3. Wybieramy tatytykę (nazywamy ją tatytyką tetową, której rozkład potrafimy określić (nie może on zależeć od nieznanych parametrów) przy założeniu prawdziwości hipotezy H 0. Zgodnie z tym rozkładem oraz przyjętą wartością α określamy tzw. zbiór krytyczny K. Jet to podzbiór R taki, że prawdopodobieńtwo wpadnięcia do K zmiennej loowej o określonym wyżej rozkładzie wynoi właśnie α (czyli jet bardzo małe). 4. Jeśli obliczona na podtawie próbki wartość taty-
tyki tetowej wpada do K, to hipotezę H 0 odrzucamy. Jeśli obliczona wartość tatytyki tetowej nie wpada do K, to nie mamy podtaw do odrzucenia H 0. Uwaga. Decyzje brzmią różnie! Tety dotyczące wartości oczekiwanej (1 próbka). 1. H 0 : µ = µ 0 H 1 : µ µ 0 lub µ < µ 0 lub µ > µ 0.. Określamy α (0, 1). 3. Rozważamy trzy ytuacje: 3a. cecha ma rozkład normalny, wariancja σ jet znana; 3b. cecha ma rozkład normalny, wariancja σ nie jet znana; 3c. cecha ma rozkład dowolny, ale n jet duże. 3a. Jeśli H 0 jet prawdziwa, to {x i } - niezależne zmienne loowe o rozkładzie N(µ 0, σ ) = x N(µ 0, σ n ) = n x µ 0 σ N(0, 1). Zatem bierzemy n x µ 0 σ jako tatytykę tetową. Potać zbioru krytycznego K zależy od potaci hipotezy alternatywnej H 1. Pod tym względem rozróżniamy: dwutronny obzar krytyczny K = (, z 1 α/ ) (z 1 α/, ) (gdy H 1 : µ µ 0 ); 3
lewotronny obzar krytyczny K = (, z 1 α ) (gdy H 1 : µ < µ 0 ); prawotronny obzar krytyczny K = (z 1 α, ) (gdy H 1 : µ > µ 0 ). 3b. Statytyka tetowa ma potać n x µ 0 hipotezy H 0 ma ona rozkład Studenta o (n 1) topniach wobody. K = (, t 1 α/,n 1 ) (t 1 α/,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 3c. Statytyka tetowa ma potać n x µ 0 hipotezy H 0 ma ona (na mocy CTG, w przybliżeniu) rozkład N(0, 1). K = (, z 1 α/ ) (z 1 α/, ) lub 4. Podejmujemy decyzje. Przykład (tet dotyczący proporcji) H 0 : p = p 0, H 1 : p p 0 lub p < p 0 lub p > p 0. p0 (1 p 0 ) Statytyka tetowa ma potać n p p 0 hipotezy H 0 ma ona (na mocy Twierdzenia de Moivre a-laplace a, w przybliżeniu) rozkład N(0, 1). 4
K = (, z 1 α/ ) (z 1 α/, ) lub Pojęcie p-wartości. Jeśli zaoberwowana wartość tatytyki tetowej S to 0, to p-wartość określamy jako: p=p ( S > 0 ), jeśli obzar krytyczny jet dwutronny; p = P (S < 0 ), jeśli obzar krytyczny jet lewotronny; p=p (S > 0 ), jeśli obzar krytyczny jet prawotronny. Teraz podejmujemy decyzję na podtawie porównania p-wartości z poziomem itotności tetu α : jeśli p < α, to odrzucamy H 0 ; jeśli p α, to nie mamy podtaw do odrzucenia H 0. Tety dotyczące wartości oczekiwanej ( próbki). H 0 : µ 1 = µ, H 1 : µ 1 µ lub µ 1 < µ lub µ 1 > µ. (a) Mamy niezależne próbki: x (1) 1,..., x(1) n 1 N(µ 1, σ1); x () 1,..., x() n N(µ, σ); σ 1, σ ą znane. Statytyka tetowa ma potać x 1 x ; σ 1 n 1 + σ n przy prawdziwości hipotezy H 0 ma ona rozkład N(0, 1). 5
K = (, z 1 α/ ) (z 1 α/, ) lub (b) Mamy niezależne próbki: x (1) 1,..., x(1) x () 1,..., x() n 1 N(µ 1, σ1); n N(µ, σ); σ 1, σ ą nieznane, σ 1 = σ. Statytyka tetowa ma potać x 1 x ; (n 1 1) 1 +(n 1) n 1 +n n1+n n 1 n przy prawdziwości hipotezy H 0 ma ona rozkład Studenta o (n 1 + n ) topniach wobody. K = (, t 1 α/,n1 +n ) (t 1 α/,n1 +n, ) lub K = (, t 1 α,n1 +n ) lub K = (t 1 α,n1 +n, ). (c) Mamy niezależne próbki: x (1) 1,..., x(1) n 1 oraz x () 1,..., x() n o nieznanych wariancjach, ale n 1, n ą duże. Statytyka tetowa ma potać x 1 x ; 1 n 1 + n przy prawdziwości hipotezy H 0 ma ona (na mocy CTG, w przybliżeniu) rozkład N(0, 1). 6
K = (, z 1 α/ ) (z 1 α/, ) lub (d) Mamy zależne próbki: x (1) 1,..., x(1) n oraz x () 1,..., x() n ; obie mają rozkład normalny. Oznaczmy: d i = x (1) i x () i. Statytyka tetowa ma potać n d hipotezy H 0 ma ona rozkład Studenta o (n 1) d topniach wobody (porównaj z 3b). K = (, t 1 α/,n 1 ) (t 1 α/,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 7