Estymacja przedziałowa Przedział ufności
Estymacja przedziałowa jest to szacowanie wartości danego parametru populacji, ρ za pomocą tak zwanego przedziału ufności. Przedziałem ufności nazywamy taki przedział domknięty a, b, który z zadanym z góry prawdopodobieństwem 1 α, zwanym poziomem ufności, pokrywa nieznaną wartość szacowanego parametru ρ. P ρ a, b = 1 α
Przedział ufności dla średniej w populacji, gdy odchylenie standardowe jest znane 1 α 100% przedziałem ufności dla μ, gdy σ jest znane, a próba została pobrana z populacji normalnej lub jest dużą próbą (n 30) wyznacza wzór: x ± z 9 σ 6/8 n, gdzie z 6/8 oznacza taką wartość standaryzowanej zmiennej losowej normalnej Z, która odcina pod prawym ogonem krzywej gęstości normalnej pole o mierze α/2.
F z 6/8 = 1 α/2 α/2 z 6/8
Przykład 1. Właściciel kopalni miedzi zainteresowany jest oszacowaniem przeciętnej zawartości rudy miedzi w tonie urobku. Próby losowe dokonane na 50 tonach urobku wykazały średnią zawartość rudy na poziomie 66,57 kg w tonie urobku. Prowadząc badania pilotażowe, właściciel kopalni ustalił wcześniej odchylenie standardowe wyników badań w populacji na 15,97 kg. Właścicielowi kopalni wystarczy 95% poziom ufności, że średnia zawartość rudy mieści się w danym przedziale. n = 50 1 α = 0,95 Dystrybuanta standardowego rozkładu normalnego x = 66,57 σ = 15,97 95% przedział ufności α = 0,05 X zmienna losowa, f(x) funkcja gęstości, F(x) dystrybuanta X~N (0, 1), f ( x ) 0,85769 0,85993 0,86214 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 1 α/2 = 0,975 z = 1,96 6/8 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91308 0,91466 0,91621 0,91774 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 x 0,94520 0,00 0,94630 0,01 0,94738 0,02 0,94845 0,03 0,94950 0,04 0,95053 0,05 0,95154 0,06 0,95254 0,07 0,95352 0,08 0,95449 0,09 1,7 0,0 0,95543 0,50000 0,95637 0,50399 0,95728 0,50798 0,95818 0,51197 0,95907 0,51595 0,95994 0,51994 0,96080 0,52392 0,96164 0,52790 0,96246 0,53188 0,96327 0,53586 1,8 0,1 0,96407 0,53983 0,96485 0,54380 0,96562 0,54776 0,96638 0,55172 0,96712 0,55567 0,96784 0,55962 0,96856 0,56356 0,96926 0,56749 0,96995 0,57142 0,97062 0,57535 1,9 0,2 0,97128 0,57926 0,97193 0,58317 0,97257 0,58706 0,97320 0,59095 0,97381 0,59483 0,97441 0,59871 0,97500 0,60257 0,97558 0,60642 0,97615 0,61026 0,97670 0,61409 2,0 0,3 0,97725 0,61791 0,97778 0,62172 0,97831 0,62552 0,97882 0,62930 0,97932 0,63307 0,97982 0,63683 0,98030 0,64058 0,98077 0,64431 0,98124 0,64803 0,98169 0,65173 2,1 0,4 0,98214 0,65542 0,98257 0,65910 0,98300 0,66276 0,98341 0,66640 0,98382 0,67003 0,98422 0,67364 0,98461 0,67724 0,98500 0,68082 0,98537 0,68439 0,98574 0,68793 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 x 2 α/2 1 = 0,025 = e 2, F(x)= 2π x f ( t ) dt
x ± z 6/8 9 σ n = 66,57 ± 1,96 9 15,97 50 = 66,57 ± 4,43 Zatem 95% przedziałem ufności jest: 62,14; 71 Mamy 95% zaufania do tego, że przeciętna zawartość miedzi w tonie urobku będzie mieściła się między 62,14 kg, a 71 kg. Przyjmując, że rocznie kopalnia wydobywa 30 mln ton urobku, właściciel może prognozować, że (na 95%) uzyska: Prognoza pesymistyczna 62,14 kg 9 30 mln = 1 mln 864 tys 200 ton rudy miedzi, Prognoza optymistyczna 71 kg 9 30 mln = 2 mln 130 tys ton rudy miedzi.
Przypuśćmy, że właścicielowi kopalni nie wystarczy 95% poziom ufności i poprosił nas o wyznaczenie 99% przedziału ufności, że średnia zawartość rudy miedzi w tonie urobku się w nim znajdzie. n = 50 x = 66,57 1 α/2 = 0,995 z 6/8 = 2,58 σ = 15,97 99% przedział ufności x ± z 6/8 9 σ n 15,97 = 66,57 ± 2,58 9 = 0,85769 0,85993 0,8621450 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1 α = 0,99 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91308 0,91466 0,91621 0,91774 α = 0,01 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 α/2 = 0,005 Dystrybuanta standardowego rozkładu normalnego X zmienna losowa, f(x) funkcja gęstości, F(x) dystrybuanta X~N (0, 1), f ( x ) = 66,57 ± 5,83 1 x = e 2, F(x)= 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670 2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169 2,1 x 0,98214 0,00 0,98257 0,01 0,98300 0,02 0,98341 0,03 0,98382 0,04 0,98422 0,05 0,98461 0,06 0,98500 0,07 0,98537 0,08 0,98574 0,09 2,2 0,0 0,98610 0,50000 0,98645 0,50399 0,98679 0,50798 0,98713 0,51197 0,98745 0,51595 0,98778 0,51994 0,98809 0,52392 0,98840 0,52790 0,98870 0,53188 0,98899 0,53586 2,3 0,1 0,98928 0,53983 0,98956 0,54380 0,98983 0,54776 0,99010 0,55172 0,99036 0,55567 0,99061 0,55962 0,99086 0,56356 0,99111 0,56749 0,99134 0,57142 0,99158 0,57535 2,4 0,2 0,99180 0,57926 0,99202 0,58317 0,99224 0,58706 0,99245 0,59095 0,99266 0,59483 0,99286 0,59871 0,99305 0,60257 0,99324 0,60642 0,99343 0,61026 0,99361 0,61409 2,5 0,3 0,99379 0,61791 0,99396 0,62172 0,99413 0,62552 0,99430 0,62930 0,99446 0,63307 0,99461 0,63683 0,99477 0,64058 0,99492 0,64431 0,99506 0,64803 0,99520 0,65173 2,6 0,4 0,99534 0,65542 0,99547 0,65910 0,99560 0,66276 0,99573 0,66640 0,99585 0,67003 0,99598 0,67364 0,99609 0,67724 0,99621 0,68082 0,99632 0,68439 0,99643 0,68793 x 2 f ( t ) dt 99% 2πprzedział ufności 60,74; 72,4
95% przedział ufności - 62,14; 71 99% przedział ufności - 60,74; 72,4 60,74 62,14 μ 71 72,4 95% przedział 99% przedział ufności
Przedział ufności dla średniej w populacji, gdy odchylenie standardowe nie jest znane 1 α 100% przedziałem ufności dla μ, gdy σ nie jest znane, a próba została pobrana z populacji normalnej lub jest dużą próbą (n 30) wyznacza wzór: x ± t 6/8 9 s n, gdzie t 6/8 jest wartością rozkładu t Studenta o n 1 stopniach swobody, która odcina pod prawym ogonem krzywej gęstości tego rozkładu pole o mierze α/2.
t 6/8 α/2
Przykład 2. Analityk giełdowy chce oszacować przeciętny przychód z pewnej akcji (w procentach). Losowa próba z 15 dni wykazała przeciętny przychód x = 10,37%, przy odchyleniu standardowym z próby s = 3,5%. Zakładając, że rozkład przychodów jest normalny, wyznaczymy 95% przedział ufności dla przeciętnego przychodu z tej akcji. n = 15 df = n 1 = 14 1 α = 0,95 α = 0,05 α/2 = 0,025 t 6/8 = t M,M8N = 2,145 Degrees of Freedom t 0.100 t 0.050 t 0.025 t 0.010 t 0.005 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898
Przykład 2. Analityk giełdowy chce oszacować przeciętny przychód z pewnej akcji (w procentach). Losowa próba z 15 dni wykazała przeciętny przychód x = 10,37%, przy odchyleniu standardowym z próby s = 3,5%. Zakładając, że rozkład przychodów jest normalny, wyznaczymy 95% przedział ufności dla przeciętnego przychodu z tej akcji. n = 15 df = n 1 = 14 x = 10,37 1 α = 0,95 α = 0,05 s = 3,5 α/2 = 0,025 t 6/8 = t M,M8N = 2,145 Końce 95% przedziału ufności wyrażają się wzorem: x ± t 6/8 9 sn = 10,37 ± 2,145 9 3,5 = 10,37 ± 1,94 15
Przykład 2. Analityk giełdowy chce oszacować przeciętny przychód z pewnej akcji (w procentach). Losowa próba z 15 dni wykazała przeciętny przychód x = 10,37%, przy odchyleniu standardowym z próby s = 3,5%. Zakładając, że rozkład przychodów jest normalny, wyznaczymy 95% przedział ufności dla przeciętnego przychodu z tej akcji. Końce 95% przedziału ufności wyrażają się wzorem: x ± t 6/8 9 sn = 10,37 ± 2,145 9 3,5 = 10,37 ± 1,94 15 95% przedział ufności dla przeciętnego przychodu z akcji: 8,43; 12,31
Ilekroć σ nie jest znane (a rozkład w populacji jest normalny), właściwym rozkładem, którym powinniśmy się posługiwać, jest rozkład t przy n 1 stopniach swobody. Jednak przy dużej liczbie stopni swobody dobrym przybliżeniem rozkładu t jest standardowy rozkład normalny Z. Dla dużej próby (n 30) 1 α 100% przedział ufności dla μ wyznacza wzór: x ± z 6/8 9 s n.
Przykład 3. Chcemy oszacować przeciętny stan rachunków czekowych w bankach w danym regionie. W pobranej próbie 100 rachunków otrzymano x = 357,60 $ i s = 140 $. Ponieważ liczebność próby jest duża n = 100 > 30, to 95% przedział ufności możemy wyznaczyć zatem następująco: x ± z 6/8 9 sn = 357,60 ± 1,96 9 140 = 330,16; 385,04 100 Możemy mieć zatem 95% zaufanie do tego, że przeciętny stan rachunków czekowych mieści się w przedziale między 330,16 $ i 385,04 $.
Korekta wzorów ze względu na skończoność populacji Czynnik korygujący ze względu na skończoność populacji: N n N 1, gdzie N - liczebność populacji, n - liczebność próby. 1 α 100% przedziałem ufności dla μ z uwzględnieniem czynnika korygującego, gdy próba jest duża i n 0,05 9 N: x ± z 6/8 9 sn 9 N n N 1.
Przykład 4. Firma ma 1000 należności. W celu oszacowania przeciętnej wartości tych należności pobrano próbę 100 należności. W próbie stwierdzono przeciętną wartość x = 532,25 $, przy odchyleniu standardowym w próbie s = 61,22 $. Znajdźmy 95% przedział ufności dla przeciętnej z 1000 należności. n = 100, N = 1000, n N = 0,1 > 0,05 x ± z 6/8 9 sn 9 N n N 1 61,22 = 532,35 ± 1,96 9 9 900 100 999 = = 532,35 ± 11,39 = 520,96; 543,74 Możemy mieć zatem 95% zaufanie do tego, że przeciętna należność mieści się w przedziale od 520,96 $ i 543,74 $.
Przedział ufności dla wariancji w populacji 1 α 100% przedziałem ufności dla wariancji w populacji σ 8, gdy rozkład w populacji jest normalny, wyznacza wzór: (n 1)s 8, χ8 6/8 (n 1)s8, χ8 XY6/8 8 gdzie χ 6/8 jest wartością zmiennej chi- kwadrat o n 1 stopniach swobody, która odcina pole o mierze α/2 z prawej 8 strony, χ XY6/8 jest wartością zmiennej chi- kwadrat, która odcina pole o mierze α/2 z lewej strony (a tym samym pole o mierze 1 α/2 z prawej strony).
α/2 α/2 χ 8 XY6/8 χ 8 6/8
Przykład 5. Maszyna automatycznie napełnia pojemniki z kawą. Jeżeli przeciętne napełnienie jest różne od normy, pracę maszyny można uregulować tak, by dawała żądaną przeciętną. Jeżeli jednak wariancja procesu napełniania jest zbyt wielka, pracy maszyny nie da się uregulować i trzeba ją oddać do naprawy. Dlatego od czasu do czasu przeprowadza się kontrolę wariancji procesu napełniania. Wybrano próbę 30 pojemników, która dała ocenę wariancji s 8 = 18540. Wyznaczmy 95% przedział ufności dla wariancji w populacji σ 8. α 8 = 45,7, χ8 = 16 M,Z[N 2 = 0,025, 1 α 2 = 0,975 χ M,M8N df 0.995 0.990 0.975 0.950 0.900 0.100 0.050 0.025 0.010 0.005 1 0.0 4 393 0.0 3 157 0.0 3 982 0.0 2 393 0.0158 2.71 3.84 5.02 6.63 7.88 27 11.8 12.9 14.6 16.2 18.1 36.7 40.1 43.2 47.0 49.6 28 12.5 13.6 15.3 16.9 18.9 37.9 41.3 44.5 48.3 51.0 29 13.1 14.3 16.0 17.7 19.8 39.1 42.6 45.7 49.6 52.3 30 13.8 15.0 16.8 18.5 20.6 40.3 43.8 47.0 50.9 53.7
Przykład 5. Maszyna automatycznie napełnia pojemniki z kawą. Jeżeli przeciętne napełnienie jest różne od normy, pracę maszyny można uregulować tak, by dawała żądaną przeciętną. Jeżeli jednak wariancja procesu napełniania jest zbyt wielka, pracy maszyny nie da się uregulować i trzeba ją oddać do naprawy. Dlatego od czasu do czasu przeprowadza się kontrolę wariancji procesu napełniania. Wybrano próbę 30 pojemników, która dała ocenę wariancji s 8 = 18540. Wyznaczmy 95% przedział ufności dla wariancji w populacji σ 8. α 8 = 45,7, χ8 = 16 M,Z[N 2 = 0,025, 1 α 2 = 0,975 χ M,M8N 95% przedział ufności dla wariancji w populacji: 29 9 18540 45,7 ; 29 9 18540 16 = 11765; 33604
Wyznaczanie liczebności próby Zanim odpowie się na pytanie o liczebność próby, którą należy pobrać do oszacowania średniej w populacji należy zadać sobie trzy pytania: Jakiego przybliżenia B do nieznanego parametru domagasz się od jego oceny na podstawie próby? Jakiego poziomu ufności oczekujesz od stwierdzenia, że odchylenie oceny na podstawie próby od parametru nie przekroczy B? Jaka jest twoja ocena wariancji (lub odchylenia standardowego) w populacji, którą się interesujesz?
Odpowiedź na trzecie pytanie bywa najtrudniejsze. Jeśli mamy przeświadczenie, że rozkład w populacji jest normalny i potrafimy (my, lub klient) oszacować w jakich granicach w przybliżeniu mieści się 95% wartości zmiennej w interesującej nas populacji, to podzielenie rozpiętości między górną i dolną granicą przez 4 da orientacyjny szacunek σ. Można też, ewentualnie pobrać niewielką próbę pilotażową i posłużyć się odchyleniem standardowym z próby jako szacunkiem σ. Minimalna wymagana liczebność próby do oszacowania średniej w populacji μ jest najmniejszą liczbą całkowitą _ n ]^/_ 9`_ a _, gdzie B jest żądanym przybliżeniem odchylenia standardowego.
Przykład 6. Firma zajmująca się analizą rynku chce przeprowadzić badania ankietowe w celu oszacowania wydatków na rozrywki przez przeciętnego kuracjusza odwiedzającego popularne uzdrowisko. Osoba, która zlecała badania, chciałaby znać te wydatki z przybliżeniem nie większym niż 120 $, przy poziomie ufności 95%. Na podstawie dotychczasowych obserwacji działalności uzdrowiska odchylenie standardowe w populacji σ szacuje się na 400 $. Jaka jest minimalna wymagana liczebność próby? B = 120, σ 8 = 400 8 = 160000 z = z = 1,96 6/8 M,M8N Minimalna wymagana liczebność próby: n 1,968 9 160000 120 8 = 42,68 Najmniejsza liczba całkowita, która spełnia tę nierówność to 43.
Jednostronne przedziały ufności Gdy jesteśmy zainteresowani tylko górną lub tylko dolną granicą przedziału, w którym mieści się parametr populacji, przydatne są jednostronne przedziały ufności. 1 α 100% przedziałem ufności dla μ, ograniczonym z prawej strony jest: b, x + z 6 9 e f g. 1 α 100% przedziałem ufności dla μ, ograniczonym z lewej strony jest: hx z 9 e, + ). 6 f