Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r
Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem ufności dla parametru θ Θ na poziomie ufności 1 α nazywamy przedział (θ 1, θ 2 ), gdzie 1 θ 1 = θ 1 (X 1, X 2,..., X n ) oraz θ 2 = θ 2 (X 1, X 2,..., X n ) są funkcjami próby i nie zależą od parametru θ. 2 dla każdego θ Θ P(θ 1 θ θ 2 ) = 1 α.
Przedział ufności 1 Końce przedziału ufności (θ 1, θ 2 ) są zmiennymi losowymi. 2 Przedziału ufności pokrywa parametr θ z prawdopodobieństwem w przybliżeniu równym 1 α. 3 Długość przedziału ufności: d θ = θ 2 θ 1 4 Najlepszy przedział ufności to ten najkrótszy.
Przedział ufności dla średniej w rozkładzie normalnym ze znaną wariancją
Przedział ufności dla średniej w rozkładzie normalnym ze znanym odchyleniem standardowym X 1, X 2,..., X n - próba z rozkładu normalnego N (µ, σ 2 ), µ - nieznane, σ - znane. Znanym faktem jest, że: X = 1 ( ) n X i N µ, σ2 n tn i=1 oraz, że: Z = X µ σ/ n N (0, 1)
Przedział ufności dla średniej w rozkładzie normalnym ze znanym odchyleniem standardowym Dla danego α można wyznaczyć takie stałe u 1, u 2, dla których P(u 1 Z u 2 ) = Φ(u 2 ) Φ(u 1 ) = 1 α Niech u 1 = Φ 1 (α 1 ) oraz u 2 = Φ 1 (1 α 2 ), wówczas Φ(u 2 ) Φ(u 1 ) = Φ(Φ 1 (1 α 2 )) Φ(Φ 1 (α 1 )) = = 1 α 2 α 1 = 1 (α 1 + α 2 )
Przedział ufności dla średniej w rozkładzie normalnym ze znanym odchyleniem standardowym Niech teraz α = α 1 + α 2, α 1, α 2 > 0 oraz przyjmijmy, że u 1 = u α1 oraz u 2 = u 1 α2 - kwantyle rzędów α 1 oraz 1 α 2 z rozkładu N (0, 1). Wówczas ( P(u 1 Z u 2 ) = P u α1 X ) µ σ/ n u 1 α ( 2 ) = P X σ u 1 α2 n σ µ X u α1 n. Przedział ufności dla µ na poziomie ufności 1 α [ X u 1 α2 σ n ; X u α1 σ n ].
Przedział ufności dla średniej w rozkładzie normalnym ze znanym odchyleniem standardowym Jeśli α 1 = 0, to przedział ufności jest postaci: [ X u 1 α2 ] σ n ; Jeśli α 2 = 0, to przedział ufności jest postaci: [ ; X u α1 σ n ] Jeśli α 1 = α 2 = α 2, to przedział ufności jest postaci: [ ] σ σ X u 1 α/2 n ; X u α/2 n
Przedział ufności dla średniej w rozkładzie normalnym ze znanym odchyleniem standardowym Zauważmy, że u (1 α/2) = u (α/2), a stąd [ X u ] [ 1 α/2 σ u α/2 σ ; X n n Przedział ten ma długość σ d µ = 2u 1 α. 2 n X u ] 1 α/2 σ u 1 α/2 σ ; X + n n Jest to najkrótszy = najlepszy przedział ufności dla średniej w rozkładzie normalnym.
Przedziały ufności dla średniej Długość przedziału ufności zależy od: 1 rozmiaru próby - większa próba = krótszy przedział 2 poziomu ufności - większy poziom = dłuższy przedział
Przykład 10.1 Z populacji, o rozkładzie normalnym o nieznanej średniej i znanej wariancji równej 0.5, przedstawiającej średnią ocen pewnych uczniów z klasy pierwszej wylosowano próbę 6 osób, dla których ta średnia wynosiła 3.71, 4.28, 2.95, 3.38, 4.05, 4.98. Wyznaczyc 99% przedział ufności dla średniej średniej ocen uczniów. Dane: n = 6 σ 2 = 0.5, a stąd σ = 0.7 X = 1 6 (3.71 + 4.28 + 2.95 + 3.38 + 4.05 + 4.98) = 3.9 1 α = 0.99 - poziom ufności, a zatem α = 0.01 u 0.995 = 2.57
Przykład 10.1 - cd Obliczmy końce przedziałów ufności: X u 1 α/2 σ 0.7 2.57 = 3.9 = 3.9 0.73 = 3.15 n 6 stąd X + u 1 α/2 σ 0.7 2.57 = 3.9 + = 3.9 + 0.73 = 4.63, n 6 µ [3.15, 4.63]. A zatem mamy 99% pewności, że średnia parametr średniej ocen wśród uczniów rozważanej klasy pierwszej mieści się w przedziale [3.15, 4.63].
Przedział ufności dla średniej w rozkładzie normalnym z nieznaną wariancją
Przedział ufności dla średniej w rozkładzie normalnym z nieznanym odchyleniem standardowym X 1, X 2,..., X n - próba z rozkładu normalnego N (µ, σ 2 ), µ - nieznane, σ - nieznane. Wiemy, że: oraz ns 2 0 σ 2 = 1 σ 2 Z = X µ σ/ n N (0, 1) n (X i X ) 2 χ 2 (n 1) i=1
Przedział ufności dla średniej w rozkładzie normalnym z nieznanym odchyleniem standardowym Fakt Jeżeli zmienne losowe Y i Z są niezależne, przy czym Y N (0, 1) oraz Z χ 2 (n), to zmienna losowa T = Y t(n) Z/n Korzystając z powyższego faktu: T = X µ σ/ n ns 2 0 σ 2 (n 1) = X µ S 0 n 1 t(n 1)
Przedział ufności dla średniej w rozkładzie normalnym z nieznanym odchyleniem standardowym Niech teraz t 1 α2 (n 1) oraz t α1 (n 1) oznaczają kwantyle z rozkładu studenta z n 1 stopniami swobody rzędu 1 α 2 i α 1 odpowiednio. P(t α1 (n 1) T t 1 α2 (n 1)) = 1 α 2 α 1 = 1 α ( ) X µ P t α1 (n 1) S 0 / n 1 t 1 α 2 (n 1) = ( ) S 0 S = P X t α1 (n 1) µ X t 1 α2 (n 1) 0 = 1 α n 1 n 1
Przedział ufności dla średniej w rozkładzie normalnym z nieznaną wariancją Przedział ufności dla µ przy nieznanym σ jest postaci [ X t ] α 1 (n 1) S 0 t 1 α2 (n 1) S ; X 0 n 1 n 1 Niech teraz α 1 = α 2 = α 2, wówczas najkrótszy przedział ufności dla µ jest postaci [ X t 1 α/2(n 1) S 0 ; X + t ] 1 α/2(n 1) S 0. n 1 n 1
Przykład 10.2 Na podstawie wielokrotnych obserwacji ustalono, że rozkład czasu dojazdu do pracy osób zatrudnionych w sklepach pewnej sieci jest rozkładem normalnym. W celu oszacowania nieznanej średniej w tym rozkładzie wylosowano niezależnie 17 elementową próbę pracowników. Średni czas dojazdu w tej próbie wynosił 40 minut a odchylenie standardowe stanowiło połowę czasu średniego. Wyznacz 95% przedział ufności dla średniego czasu dojazdu do pracy dla ogółu pracowników. Dane: X = 40 S = 0.5 40 = 20 n = 17 1 α = 0.95 - poziom ufności, a stąd α = 0.05 t 0.975 (16) = 2.12.
Przykład 10.2 - cd. Obliczmy końce przedziałów ufności X t 1 α/2(n 1) S 20 2.12 = 40 = 40 10.59 = 29.4 n 1 16 X + t 1 α/2(n 1) S 20 2.12 = 40 + = 40 + 10.59 = 50.59, n 1 16 stąd µ [29.4, 50.59] A zatem z prawdopodobieństwem 0.95 możemy stwierdzić, że średni czasu dojazdu do pracy dla ogółu pracowników mieści się w przedziale [29.4, 50.59].
Przedział ufności dla średniej w dowolnym rozkładzie
Przedziały ufności dla średniej w dowolnym rozkładzie X 1, X 2,..., X n - próba z rozkładu o rozmiarze n 100 o nieznanej średniej EX i = µ i wariancji Var(X i ) = σ 2. Z Centralnego Twierdzenia Granicznego: a stąd: lim P n Z = X µ σ/ n ( gdzie u 1 = u α1, u 2 = u 1 α2. n Y N (0, 1), u 1 X ) µ σ/ n u 2 = 1 α,
Przedziały ufności dla średniej w dowolnym rozkładzie Przedział ufności (asymptotyczny) dla średniej µ na poziomie ufności 1 α jest postaci: 1 gdy σ znane: 2 gdy σ nie jest znane: [ [ X u 1 α/2 σ ; X + u ] 1 α/2 σ n n X u 1 α/2 S ; X + u ] 1 α/2 S n n
Przykład 10.3 Załóżmy, że p 100%, 0 p 1 wyborców jest zdecydowana poprzeć pewnego kandydata w najbliższych wyborach. W celu oszacowania wartości p przeprowadzono ankietę (przewidującą dwie odpowiedzi: TAK lub NIE) wśród 1076 osób, z czego 324 odpowiedziały TAK. Wyznaczymy 90% przedział ufności dla p. Zauważmy, że mamy do czynienia z rozkładem dwumianowym, gdzie p jest wartością oczekiwaną zmiennej losowej X i zdefiniowanej następująco: { 1 pytana osoba odpowie TAK X i = 0 pytana osoba odpowie NIE
Przykład 10.3 - cd Dane: n = 1076 X = 324 1076 = ( 0.301 ) S 2 = 324 1076 1 324 1076 = 0.21 1 α = 0.90 - poziom ufności, a zatem α = 0.1 u 0.95 = 1.64. Przedział ufności dla p jest postaci: (0.278; 0.324) Zatem na danego kandydata zdecydowanych jest głosować 324 1076 100% = 30.1% wyborców, z dopuszczalnym błędem statystycznym równym d n = 2.3%.
Literatura: Bartoszewicz J.,Wykłady ze statystyki matematycznej, PWN, Warszawa 1989 E.L. Lehmann,Teoria estymacji punktowej, PWN Warszawa 1991 M. Krzyśko,Statystyka matematyczna, Wyd. UAM, Poznań 2004