Testy dotyczące wartości oczekiwanej (1 próbka).

ZASADY TESTOWANIA HIPOTEZ STATYSTYCZNYCH. TESTY DOTYCZĄCE WARTOŚCI OCZEKIWANEJ Przez hipotezę tatytyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu intereującej na cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy ię hipotezami parametrycznymi. Są to hipotezy dotyczące nieznanego parametru θ (rozważamy tylko przypadek, gdy θ = µ, czyli jet nieznaną wartością oczekiwaną rozkładu cechy). Na podtawie próbki (x 1,..., x n ) mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Nieściśle mówiąc, poób potępowania, który prowadzi do podjęcia decyzji, nazywamy tetem (tatytycznym). Ogólny chemat potępowania. 1. Formułujemy dwie wzajemnie wykluczające ię hipotezy: H 0 (zerowa) i H 1 (alternatywna).. Określamy poziom itotności tetu α (0, 1) (tandardowo α = 0.05). Jet to prawdopodobieńtwo popełnienia błędu I rodzaju. 1

Błąd I rodzaju - prawdziwa jet H 0, a my ją odrzucamy. Błąd II rodzaju - prawdziwa jet H 1, a my decydujemy na rzecz H 0. tan rzeczy/decyzja przyjąć H 0 przyjąć H 1 H 0 prawdziwa OK błąd I rodzaju H 1 prawdziwa błąd II rodzaju OK Pożądane jet, by prawdopodobieńtwa popełnienia błędów obu rodzajów były jak najmniejze. Okazuje ię, że tego nie da ię zrobić jednocześnie. Wobec tego potępujemy w poób natępujący: przede wzytkim taramy ię kontrolować prawdopodobieńtwo popełnienia błędu I rodzaju. Właśnie dlatego taramy ię, przy już formułowanych hipotezach, oznaczyć je tak, by popełnienie błędu I rodzaju miało gorze kutki. 3. Wybieramy tatytykę (nazywamy ją tatytyką tetową, której rozkład potrafimy określić (nie może on zależeć od nieznanych parametrów) przy założeniu prawdziwości hipotezy H 0. Zgodnie z tym rozkładem oraz przyjętą wartością α określamy tzw. zbiór krytyczny K. Jet to podzbiór R taki, że prawdopodobieńtwo wpadnięcia do K zmiennej loowej o określonym wyżej rozkładzie wynoi właśnie α (czyli jet bardzo małe). 4. Jeśli obliczona na podtawie próbki wartość taty-

tyki tetowej wpada do K, to hipotezę H 0 odrzucamy. Jeśli obliczona wartość tatytyki tetowej nie wpada do K, to nie mamy podtaw do odrzucenia H 0. Uwaga. Decyzje brzmią różnie! Tety dotyczące wartości oczekiwanej (1 próbka). 1. H 0 : µ = µ 0 H 1 : µ µ 0 lub µ < µ 0 lub µ > µ 0.. Określamy α (0, 1). 3. Rozważamy trzy ytuacje: 3a. cecha ma rozkład normalny, wariancja σ jet znana; 3b. cecha ma rozkład normalny, wariancja σ nie jet znana; 3c. cecha ma rozkład dowolny, ale n jet duże. 3a. Jeśli H 0 jet prawdziwa, to {x i } - niezależne zmienne loowe o rozkładzie N(µ 0, σ ) = x N(µ 0, σ n ) = n x µ 0 σ N(0, 1). Zatem bierzemy n x µ 0 σ jako tatytykę tetową. Potać zbioru krytycznego K zależy od potaci hipotezy alternatywnej H 1. Pod tym względem rozróżniamy: dwutronny obzar krytyczny K = (, z 1 α/ ) (z 1 α/, ) (gdy H 1 : µ µ 0 ); 3

lewotronny obzar krytyczny K = (, z 1 α ) (gdy H 1 : µ < µ 0 ); prawotronny obzar krytyczny K = (z 1 α, ) (gdy H 1 : µ > µ 0 ). 3b. Statytyka tetowa ma potać n x µ 0 hipotezy H 0 ma ona rozkład Studenta o (n 1) topniach wobody. K = (, t 1 α/,n 1 ) (t 1 α/,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 3c. Statytyka tetowa ma potać n x µ 0 hipotezy H 0 ma ona (na mocy CTG, w przybliżeniu) rozkład N(0, 1). K = (, z 1 α/ ) (z 1 α/, ) lub 4. Podejmujemy decyzje. Przykład (tet dotyczący proporcji) H 0 : p = p 0, H 1 : p p 0 lub p < p 0 lub p > p 0. p0 (1 p 0 ) Statytyka tetowa ma potać n p p 0 hipotezy H 0 ma ona (na mocy Twierdzenia de Moivre a-laplace a, w przybliżeniu) rozkład N(0, 1). 4

K = (, z 1 α/ ) (z 1 α/, ) lub Pojęcie p-wartości. Jeśli zaoberwowana wartość tatytyki tetowej S to 0, to p-wartość określamy jako: p=p ( S > 0 ), jeśli obzar krytyczny jet dwutronny; p = P (S < 0 ), jeśli obzar krytyczny jet lewotronny; p=p (S > 0 ), jeśli obzar krytyczny jet prawotronny. Teraz podejmujemy decyzję na podtawie porównania p-wartości z poziomem itotności tetu α : jeśli p < α, to odrzucamy H 0 ; jeśli p α, to nie mamy podtaw do odrzucenia H 0. Tety dotyczące wartości oczekiwanej ( próbki). H 0 : µ 1 = µ, H 1 : µ 1 µ lub µ 1 < µ lub µ 1 > µ. (a) Mamy niezależne próbki: x (1) 1,..., x(1) n 1 N(µ 1, σ1); x () 1,..., x() n N(µ, σ); σ 1, σ ą znane. Statytyka tetowa ma potać x 1 x ; σ 1 n 1 + σ n przy prawdziwości hipotezy H 0 ma ona rozkład N(0, 1). 5

K = (, z 1 α/ ) (z 1 α/, ) lub (b) Mamy niezależne próbki: x (1) 1,..., x(1) x () 1,..., x() n 1 N(µ 1, σ1); n N(µ, σ); σ 1, σ ą nieznane, σ 1 = σ. Statytyka tetowa ma potać x 1 x ; (n 1 1) 1 +(n 1) n 1 +n n1+n n 1 n przy prawdziwości hipotezy H 0 ma ona rozkład Studenta o (n 1 + n ) topniach wobody. K = (, t 1 α/,n1 +n ) (t 1 α/,n1 +n, ) lub K = (, t 1 α,n1 +n ) lub K = (t 1 α,n1 +n, ). (c) Mamy niezależne próbki: x (1) 1,..., x(1) n 1 oraz x () 1,..., x() n o nieznanych wariancjach, ale n 1, n ą duże. Statytyka tetowa ma potać x 1 x ; 1 n 1 + n przy prawdziwości hipotezy H 0 ma ona (na mocy CTG, w przybliżeniu) rozkład N(0, 1). 6

K = (, z 1 α/ ) (z 1 α/, ) lub (d) Mamy zależne próbki: x (1) 1,..., x(1) n oraz x () 1,..., x() n ; obie mają rozkład normalny. Oznaczmy: d i = x (1) i x () i. Statytyka tetowa ma potać n d hipotezy H 0 ma ona rozkład Studenta o (n 1) d topniach wobody (porównaj z 3b). K = (, t 1 α/,n 1 ) (t 1 α/,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 7