ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA Mamy populację geeralą i iteresujemy się pewą cechą X jedostek statystyczych, a dokładiej pewą charakterystyką liczbową θ tej cechy (p. średią wartością tej cechy). Przeprowadzamy doświadczeia, w wyiku których mamy próbę losową (x 1,..., x ). Na podstawie obserwacji chcemy odpowiedzieć a pewe pytaia a temat iezaego θ Θ. Celem estymacji θ jest odpowiedź a pytaie: Ile miej więcej wyosi wartość parametru θ? Formalizacja probabilistyczo-statystycza tego zagadieia: {x i } - iezależe zmiee losowe o tym samym rozkładzie (=rozkładzie cechy X), którego wartość oczekiwaa θ (=średia wartość cechy X) ie jest zaa; mamy oszacować θ. Są dwa podstawowe sposoby estymacji (szacowaia) θ: 1. estymacja puktowa (wyik estymacji brzmi: θ wyosi miej więcej, powiedzmy, θ 0 ); 2. estymacja przedziałowa (wyik estymacji brzmi: θ 1

leży w przedziale, powiedzmy, θ, θ + ] z określoą dozą pewości, czyli z prawdopodobieństwem 1 α zadaym z góry). Przykład 1. Mamy oszacować średią procetową zawartość tłuszczu w mleku pochodzącym od pewego produceta. Zbadaliśmy 10 kartoów z mlekiem i uzyskaliśmy astępujące wyiki: 3,26; 3,12; 3,24; 3,16; 3,08; 3,14; 3,23; 3,11; 3,09; 3,24. Defiicja. Statystyką azywamy każdą fukcję T (x 1,..., x ) od próby (jest to zmieą losową). Postać statystyki ie może zależeć od iezaego parametru. Przykłady statystyk: x = x 1+ +x 1, i=1 (x i x) 2, przykłady ie statystyk: x 1+ +x 1 θ, i=1 (x i θ) 2. Defiicja. Estymatorem puktowym parametru θ azywamy dowolą statystykę T (x 1,..., x ), która aszym zdaiem dobrze przybliża wartość θ. 2

Rozważmy statystykę x jako estymator iezaej średiej wartości θ cechy X. Mamy: E x = E x 1 + + x Var x = Var x 1 + + x = Ex 1 + + Ex = θ, = 1 2(Varx 1 + + Varx ) = Varx 1 = σ2 2, gdzie przez σ 2 ozaczyliśmy wariację cechy X. Zaleta uśrediaia - redukcja zmieości. Defiicja. Estymator T (x 1,..., x ) parametru θ azywamy ieobciążoym, jeśli ET (x 1,..., x ) = θ (średio estymator szacuje parametr θ bez błędu). Estymator x jest estymatorem ieobciążoym dla θ. Defiicja. Estymator T (x 1,..., x ) parametru θ azywamy zgodym, jeśli dla T (x 1,..., x ) θ w pewym sesie probabilistyczym, tz. im większy jest rozmiar próby, tym lepiej estymator szacuje parametr. 3 θ θ

Estymator x jest zgodym estymatorem dla θ (a mocy Prawa Wielkich Liczb). Tak, w Przykładzie 1 szacujemy iezay parametr θ (średia procetowa zawartość tłuszczu w mleku) jako x = x 1 + + x 10 10 = 3,166(6). Przykład 2. Zmierzoo objętości V pięciu losowo wybraych kulek z partii kulek lożyskowych, otrzymując wyiki (w cm 3 ): 1,24; 1,38; 1,25; 1,17; 1,27. Zaleźć oceę wartości przeciętej średicy d kulki pochodzącej z tej partii. Jako oceę wartości przeciętej średicy d kulki wybierzemy średią z próbki x (jak wiemy, jest to estymator ieobciążoy i zgody dla parametru d). Poieważ objętość kulki i średica są związae rówością V = πd3 6, 6V otrzymujemy d = 3 π. Z tego wzoru, podstawiając wyiki obserwacji objętości, uzyskujemy odpowiedie wyiki dla średicy: x 1 1,33 cm, x 2 1,38 cm, x 3 1,34 cm, x 4 1,31 cm, x 5 1,34 cm. Stąd x 1,34 cm. Przykład 3. Zmierzoo pola S sześciu losowo wybraych kwadratowych działek z pewej okolicy, otrzymując wyiki (w m 2 ): 2809; 2916; 2704; 2809; 2601; 2704. 4

Oszacować średią długość boku a działki z tej okolicy. Przykład 4. Przeprowadzoo badaie zużycia bezyy w losowo wybraej grupie 6 samochodów tej samej marki i tego samego roczika. Po przejechaiu 200 km drogi uzyskao astępujące obserwacji zużycia bezyy (w l): 11,2; 10,8; 10,9; 12,0; 11,8; 11,5. Oszacować średie zużycie bezyy θ (w litrach a 100 km jazdy). Niech jedostki statystycze albo posiadają pewą własość (kodujemy to jako 1), albo ie (kod - 0). Jak oszacować iezaa proporcję p jedostek w populacji posiadających tą własość? (x 1,..., x ) - próba z rozkładu zero-jedykowego o iezaym prawdopodobieństwie p, P (X = 1) = p, P (X = 0) = 1 p, EX = p. Zatem zagadieie szacowaia parametru p sprowadza się do szacowaia iezaej wartości oczekiwaej. Więc, proporcja jedostek w próbie posiadających tą własość, czyli p = x 1+ +x, jest dobrym estymatorem dla p. Przykład 5. Jeda z agecji badających opiię publiczą w czerwcu 2000 roku przeprowadziła badaie 500 dorosłych obywateli polskich a temat poparcia (bądź ie) wejścia Polski do UE. Okazało się, że 285 5

osób opowiedziało się pozytywie a te temat. Oszacować proporcję p dorosłych obywateli Polski popierających wejście Polski do UE. Szacujemy p za pomocą proporcji dorosłych obywateli w próbie popierających wejście do UE, czyli jako p = 285 500 = 0,57. Przykład 6. Zgodie z przeprowadzoym badaiem a próbie w 300 dorosłych osób w Polsce, 117 osób miały kłopoty ze sem. Oszacować proporcję p dorosłych obywateli Polski mających kłopoty ze sem. Niech α (0, 1) będzie ustaloą liczbą (stadardowo α = 0.05); liczbę 1 α azywamy poziomem ufości. Defiicja. Estymatorem przedziałowym (przedziałem ufości) parametru θ a poziomie ufości 1 α azywamy przedział θ, θ + ], końce którego są statystykami (czyli θ = θ (x 1,..., x ), θ + = θ + (x 1,..., x )), taki, że dla dowolego θ zachodzi P (θ θ, θ + ]) 1 α. Tak aprawdę, zawsze staramy się skostruować przedział ufości, dla którego powyższe prawdopodobieństwo jest rówe 1 α, poieważ im miejsze jest prawdopodobieństwo, tym, a ogół, krótszy jest przedział θ, θ + ], a krótszy przedział, przy takim samym pozio- 6

mie ufości, ozacza bardziej precyzyje oszacowaie. Kostrukcja przedziałów ufości dla przypadków: 1. cecha ma rozkład ormaly, wariacja σ 2 jest zaa; 2. cecha ma rozkład ormaly, wariacja σ 2 ie jest zaa; 3. cecha ma rozkład dowoly, ale jest duże. 1. {x i } - iezależe zmiee losowe o rozkładzie N(θ, σ 2 ) = x ma rozkład N(θ, σ2 ) = x θ σ rozkład N(0, 1). Weźmy taką liczbę z 1 α/2, że ( P z 1 α/2 x θ ) z 1 α/2 = 1 α. σ Estymator przedziałowy dla θ ma zatem postać: ] σ σ θ, θ + ] = x z 1 α/2, x + z 1 α/2. ma Długość tego przedziału ufości wyosi 2z 1 α/2 σ i ie jest losowa. Od czego zależy długość przedziału? Jeśli σ jest ustaloe, to jedyie od poziomu 1 α i rozmiaru próbki. Aby zwiększyć precyzję estymatora poprzez zmiejszeie długości przedziału ufości, musimy albo zmiejszyć 1 α, co ie jest rozsąde, albo zwiększyć. 7

1 2. Zamiast σ bierzemy s = 1 j=1 (x j x) 2, zamiast rozkładu N(0, 1) rozkład Studeta o ( 1) stopiach swobody. Estymator przedziałowy dla θ ma postać: ] s s θ, θ + ] = x t 1 α/2, 1, x + t 1 α/2, 1. Tutaj t 1 α/2, 1 jest taką liczbą, że ( P t 1 α/2, 1 x θ ) t 1 α/2, 1 = 1 α. s Długość tego przedziału ufości wyosi 2t 1 α/2, 1 s i jest losowa. Średia długość tego przedziału zależy wyłączie od 1 α i w taki sam sposób, jak w poprzedim pukcie. 3. (estymator przybliżoy) W porówaiu z poprzedim przypadkiem, zamiast rozkładu Studeta poowie bierzemy rozkład N(0, 1). Przybliżoy estymator przedziałowy dla θ ma zatem postać: ] s s θ, θ + ] = x z 1 α/2, x + z 1 α/2. 8

W Przykładzie 1 przy założeiu, że cecha ma rozkład ormaly i p. σ = 0,05 stosujemy przedział ufości z puktu 1. Przy 1 α = 0,95 otrzymujemy z tablic z 0,975 = 1,960 i θ, θ + ] = 3,1667 1,960 0,05 ; 3,1667 + 1,960 0,05 ] = 10 10 = 3,1357; 3,1977]. Jeśli ie ma wiedzy o σ, to stosujemy przedział ufości z puktu 2. Przy 1 α = 0,95 otrzymujemy z tablic t 0,975,9 = 2,2622 i ] 0,0048 0,0048 θ, θ + ]= 3,1667 2,2622 ; 3,1667+2,2622 10 10 = 3,1171; 3,2163]. W Przykładzie 2 przy założeiu, że cecha ma rozkład ormaly i p. σ = 0,025 stosujemy przedział ufości z puktu 1. Przy 1 α = 0,95 otrzymujemy z tablic z 0,975 = 1,960 i d, d + ] = 1,340 1,960 0,025 ; 1,340 + 1,960 0,025 ] = 5 5 = 1,318; 1,362]. Jeśli ie ma wiedzy o σ, to stosujemy przedział ufości z puktu 2. Przy 1 α = 0,95 otrzymujemy z tablic t 0,975,4 = 2,776 i 9

d, d + ]=1,340 2,776 0,027 5 ; 1,340+2,776 0,027 5 ] = = 1,307; 1,373]. Niech jedostki statystycze albo posiadają pewą własość (1), albo ie (0). Cel: oszacowaie iezaej proporcji p jedostek posiadających tą własość. (x 1,..., x ) - próba z rozkładu zero-jedykowego o iezaym prawdopodobieństwie p, P (X = 1) = p, P (X = 0) = 1 p, EX = p, VarX = p(1 p), Var p = Var x 1+ +x = p(1 p). Estymator przedziałowy dla iezaej proporcji p ma postać: ] p(1 p) p(1 p) p, p + ] = p z 1 α/2, p + z 1 α/2. Dla dobrego przybliżeia, oprócz wymagaego waruku, że jest duże (powiedzmy 100), często wymagae jest, by p 5 oraz (1 p) 5. Dla daych z Przykładu 5 otrzymujemy astępujący przedział ufości dla p przy 1 α = 0,95: 0,57 0,43 0,57 0,43 p, p + ]=0,57 1,96, 0,57+1,96 ] 500 500 = 0,53; 0,61]. Zadaie. Wypisać estymatory przedziałowe w Przykładach 3,4,6. Przyjąć 1 α = 0,95. Założyć ormalość rozkładu cechy w Przykładach 3,4. 10