Biostatystyka, # 5 /Weterynaria I/ dr n. mat. Zdzisªaw Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowa«Matematyki i Informatyki ul. Gª boka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl materiaªy: http://kzmi.up.lublin.pl/ zotachel/wet konsultacje: poniedziaªek 11.30-13.30, wtorek 10-12 Lublin, 2019
Estymacja
Estymacja punktowa, estymatory W danej populacji rozwa»my cech X o rozkªadzie zale»nym od nieznanego parametru θ. Estymacja to metoda wnioskowania statystycznego o nieznanych parametrach populacji polegaj ca na szukaniu ich przybli»e«(oszacowa«). Estymacja punktowa polega na szacowaniu nieznanych parametrów rozkªadu za pomoc warto±ci pewnych statystyk. Estymatorem (oszacowaniem) nieznanego parametru θ nazywamy dowoln statystyk opart na próbie X 1, X 2,..., X n, oznaczymy j przez ˆθ := ˆθ(X 1,..., X n ). Zast puj c nieznany parametr warto±ci estymatora popeªniamy pewien bª d, który jest tym wi kszy im wi ksza jest wariancja tego estymatora.
Wªasno±ci estymatorów nieobci»ono± : Eˆθ = θ; zgodno± : dla dowolnego ε > 0 lim P( ˆθ(X 1,..., X n ) θ ε) = 0; n efektywno± : estymator efektywny to taki estymator nieobci»ony, który spo±ród wszystkich nieobci»onych estymatorów ma najmniejsz wariancj ; (taki estymator nie zawsze istnieje; mo»na powiedzie,»e jest on najlepszy - ±rednio nie mylimy si co do jego oszacowa«, a jednocze±nie popeªniamy najmniejszy bª d.
Przykªady estymatorów Ka»dy moment z próby jest zgodnym estymatorem odpowiadaj cego mu momentu dla cechy; ±rednia z próby X jest zgodnym i nieobci»onym estymatorem warto±ci oczekiwanej cechy; wariancja z próby S 2 jest zgodnym, ale obci»onym estymatorem wariancji cechy; ES 2 = n 1 n σ2 ; ns 2 n 1 = 1 ni=1 n 1 (X i X ) 2 jest zgodnym i nieobci»onym estymatorem wariancji cechy; ±rednia z próby X jest efektywnym estymatorem warto±ci oczekiwanej cechy, o której wiemy,»e ma rozkªad normalny lub wykªadniczy lub Poissona;
Rozkªady podstawowych statystyk (X 1,..., X n ) - próba prosta z rozkªadu N(µ X, σ X ), (Y 1,..., Y m ) - próba prosta z rozkªadu N(µ Y, σ Y ), S 2 X = 1 n ni=1 (X i X ) 2, S 2 Y = 1 m mi=1 (Y i Y ) 2 X 1,..., X m, Y 1,..., Y n - niezale»ne zmienne losowe, przyjmujemy: µ := µ X, σ := σ X, S 2 := S 2 X i S = S 2 Statystyka Rozkªad U = X µ σ n U N(0, 1) T = X µ S n 1 T t(n 1) V = ns 2 /σ 2 V χ 2 (n 1) F = ns2 X (n 1)σ 2 X : ms 2 Y (m 1)σ 2 Y F F (n, m)
Twierdzenia o dodawaniu rozkªadów Je»eli X 1 N(µ 1, σ 1 ) i X 2 N(µ 2, σ 2 ) i s niezale»ne, to X 1 ± X 2 N(µ 1 ± µ 2, σ1 2 + σ2 2 ). Je»eli X 1 χ 2 (r 1 ) i X 2 χ 2 (r 2 ) i s niezale»ne, to X 1 + X 2 χ 2 (r 1 + r 2 ).
Problemy estymacji punktowej: dla rozkªadów ci gªych prawdopodobie«stwo,»e estymator jest rzeczywi±cie równy nieznanemu parametrowi wynosi 0; estymator punktowy nie daje nam»adnej informacji na temat dokªadno±ci oszacowania.
Estymacja przedziaªowa - przedziaª ufno±ci Estymacja przedziaªowa to szacowanie nieznanego parametru θ rozkªadu badanej cechy X w populacji poprzez konstrukcj takiego przedziaªu (a, b), gdzie a i b s statystykami, który z zadanym z góry prawdopodobie«stwem 1 α pokrywa nieznany parametr tzn. P(a < θ < b) = 1 α. Przedziaª (a, b) nazywa si wtedy przedziaªem ufno±ci dla parametru θ na poziomie ufno±ci (1 α) 100%. Je»eli utworzymy przedziaªy ufno±ci dla wielu n-elementowych prób na ustalonym poziomie ufno±ci (1 α) 100% to ±rednio w (1 α) 100% przypadków skonstruowany przedziaª b dzie pokrywaª nieznany, estymowany parametr θ. Koncepcj estymacji przedziaªowej stworzyª polski statystyk Jerzy Spªawa-Neyman (1894-1981).
Wªasno±ci przedziaªów ufno±ci dªugo± przedziaªu ufno±ci jest miar bª du szacowania, im wi ksza pewno± (wy»szy poziom ufno±ci),»e wyznaczony przedziaª ufno±ci pokrywa nieznany parametr, tym dªu»szy przedziaª ufno±ci; przedziaªy ufno±ci wyznaczone dla bardziej licznych prób s krótsze, do konstrukcji przedziaªu ufno±ci dla nieznanego parametru θ potrzebujemy statystyki zale»nej od tego parametru, której rozkªad jest znany, poziom ufno±ci ustala si arbitralnie zwykle jest on równy 90%, 95%, 99% czyli prawdopodobie«stwo α = 0, 1; 0, 05; 0, 01.
Przedziaª ufno±ci dla ±redniej z populacji normalnej ze znanym parametrem σ Niech (X 1,..., X n ) b dzie prób prost z rozkªadu N(µ, σ), gdzie parametr µ jest przedmiotem estymacji, natomiast warto± σ jest znana. Podstaw konstrukcji przedziaªu ufno±ci dla µ jest statystyka U = (X µ) n σ N(0, 1). Dla 0 < α < 1 wyznaczymy tak liczb u α (warto± krytyczna rozkªadu normalnego standardowego),»e P ( u α < (X µ) n σ < u α ) = 1 α. P(X u α σ n < µ < X + u α σ n ) = 1 α. Skonstruowali±my zatem przedziaª ufno±ci dla ±redniej µ na poziomie ufno±ci (1 α) 100%. Zauwa»my,»e ±rodkiem przedziaªu ufno±ci dla µ jest statystyka X = µ, natomiast jego dªugo± wynosi 2u α σ n i maleje wraz ze wzrostem liczebno±ci próby n.
Przedziaª ufno±ci dla ±redniej z populacji normalnej z nieznanym parametrem σ Niech (X 1,..., X n ) b dzie prób prost z rozkªadu N(µ, σ), gdzie µ i σ sa nieznane. Podstaw konstrukcji przedziaªu ufno±ci dla µ jest statystyka T = X µ S n 1 t(n 1). Niech tα,r b dzie warto±ci krytyczn tego rozkªadu odpowiadaj c prawdopodobie«stwu α (r = n 1), tzn. P( t > t α,r ) = α. Wtedy P P ( ( X t α,r t α,r < X µ S n 1 < tα,r ) S n 1 < µ < X + t α,r = 1 α. S n 1 ) = 1 α. ( ) S Przedziaª X t α,r S n 1, X + t α,r n 1 jest przedziaªem ufno±ci dla ±redniej µ na poziomie ufno±ci (1 α) 100%.
Przedziaª ufno±ci dla ±redniej bez zaªo»enia normalno±ci W praktyce cz sto nie znamy typu rozkªadu badanej cechy i nie ma podstaw do zaªo»enia,»e jest to rozkªad normalny. Je»eli dysponujemy odpowiednio liczn prób (co najmniej 30 obserwacji) to mo»emy skorzysta tzw. Centralnego Twierdzenia Granicznego orzekaj cego,»e graniczny rozkªad statystyki U = X µ S n 1 (przy liczebno±ci próby n ) jest rozkªadem N(0, 1). Niech u α b dzie warto±ci krytyczn tego rozkªadu odpowiadaj c prawdopodobie«stwu α, tzn. P( U > u α ) = α. Wtedy ( P u α < X µ ) n 1 < uα = 1 α S ( ) S S P X u α < µ < X + u α = 1 α. n 1 n 1 ( ) S Przedziaª X u α S n 1, X + u α n 1 jest przedziaªem ufno±ci dla ±redniej µ na poziomie ufno±ci (1 α) 100% o ile liczebno± próby n 30.
Elementy przedziaªów ufno±ci dla ±redniej w Excelu 2013 Warto± d = u α σ/ n - poªowy przedziaªu ufno±ci dla ±redniej przy zaªo»eniu normalno±ci i znanym σ podaje funkcja UFNO.NORM(α; σ; n). Warto± d = t α S/ n 1 - poªowy przedziaªu ufno±ci dla ±redniej przy zaªo»eniu normalno±ci podaje funkcja UFNO.T(α; σ; n), gdzie pod sigma podstawiamy nieobci»one oszacowanie odchylenia standardowego, które liczy funkcja ODCH.STANDARD.PRÓBKI.
Przedziaª ufno±ci dla ró»nicy ±rednich #1 (X 1,..., X n ), (Y 1,..., Y m ) - 2 próby proste z rozkªadów N(µ i, σ), i = 1, 2; znane σ wspólne dla obu rozkªadów X 1,..., X n, Y 1,..., Y m - niezale»ne obserwacje X N(µ 1, σ/ n) i Y N( µ 2, σ/ m) wi c X Y N(µ 1 µ 2, σ 1 n + 1 m ), standaryzuj c (X Y ) (µ 1 µ 2 ) σ 1 n + 1 m N(0, 1). Niech u α b dzie warto±ci krytyczn rozkªadu N(0, 1), odpowiadaj c ( prawdopodobie«stwu ) α. Wtedy P u α (X Y ) (µ 1 µ 2 ) σ 1 u n + 1 α = 1 α. St d [ m ] (X Y ) u α σ 1 n + 1 m ασ ; (X Y ) + u 1 n + 1 m jest przedziaªem ufno±ci dla ró»nicy ±rednich µ 1 µ 2 na poziomie ufno±ci (1 α) 100%.
Przedziaª ufno±ci dla ró»nicy ±rednich #2 Mamy: (X 1,..., X n ), (Y 1,..., Y m ) - 2 próby proste z rozkªadów N(µ i, σ), i = 1, 2; nieznane σ wspólne dla obu rozkªadów X 1,..., X n, Y 1,..., Y m - niezale»ne obserwacje U = (X Y ) (µ 1 µ 2 ) σ 1 N(0, 1); n + 1 m ns 2 X σ 2 χ 2 (n 1), Wtedy T = ms 2 Y σ 2 χ 2 (m 1) i s niezale»ne, st d Z = ns2 X + ms 2 Y σ 2 χ 2 (n + m 2). U t(n + m 2) oraz Z/(n+m 2) T = (X Y ) (µ 1 µ 2 ) ( ). 1 n + 1 m ns 2 X +ms2 Y n+m 2
Niech t α,r b dzie warto±ci krytyczn rozkªadu t(n + m 2), odpowiadaj c prawdopodobie«stwu α (r = n + m 2). Mamy P( t α,r T t α,r ) = 1 α. Ostatecznie przedziaª o ±rodku X Y i poªowie dªugo±ci d okre±lonej wzorem d = t α,r ns 2 X + ms 2 Y n + m 2 ( 1 n + 1 m ) jest przedziaªem ufno±ci dla ró»nicy ±rednich µ 1 µ 2 na poziomie ufno±ci (1 α) 100%.
Przedziaª ufno±ci dla wariancji (X 1,..., X n ) - próba prosta z rozkªadu N(µ, σ); nieznane σ jest przedmiotem estymacji. Z twierdzenia Fishera, statystyka ns 2 σ 2 χ2 (n 1). Dla prawdopodobie«stwa α mamy: ( P χ 2 ns2 1 α/2,n 1 σ 2 χ2 α/2,n 1 ) = 1 α, gdzie χ 2 p,n 1 s odpowiednimi warto±ciami krytycznymi dla rozkªadu χ 2. St d przedziaª ufno±ci dla wariancji σ 2 na poziomie ufno±ci (1 α) 100% ma posta : ns 2 χ 2 α/2,n 1 σ 2 ns 2 χ 2 1 α/2,n 1.
Przedziaª ufno±ci dla ilorazu wariancji (X 1,..., X n ), (Y 1,..., Y m ) - 2 próby proste z rozkªadów normalnych o nieznanych wariancjach σ X, σ Y, odpowiednio, X 1,..., X n, Y 1,..., Y m - niezale»ne obserwacje Statystyka F = ms 2 Y (m 1)σ 2 Y ns 2 X (n 1)σ 2 X = σ 2 X σ 2 y S 2 X S 2 Y F (m 1, n 1) (rozkad F Snedecora z (m 1, n 1) stp swobody), gdzie S 2 X = ns2 X n 1 = 1 n 1 n (X i X ) 2, S Y 2 = ms Y 2 m 1 = 1 m (Y i Y ) 2. m 1 i=1 i=1
Zatem dla dowolnie wybranego prawdopodobie«stwa 0 < α < 1 P(F 1 α/2 F F α/2 ) = 1 α, gdzie F p jest odpowiedni warto±ci krytyczn rozkªadu F (m 1, n 1) Snedecora z (m 1, n 1) stp swobody. St d ( S X 2 P F S Y 2 1 α/2 σ2 X σy 2 S X 2 ) F S Y 2 α/2 = 1 α, czyli [ S X 2 F S Y 2 1 α/2, S X 2 ] F S Y 2 α/2 jest (1 α) 100% przedziaªem ufno±ci dla ilorazu σ2 X σ 2 y.