Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1
Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora 3. Idea i pojęcia estymacji przedziałowej przedział ufności, poziom ufności 4. Wzory na przedziały ufności dla wybranych parametrów
Przykład Cel badania: określić średnią masę jednego owocu wybranej odmiany. Wylosowano 160 owoców. Zważono każdą sztukę. Otrzymane wyniki (w gramach) zestawiono w tabeli. 191, 193,5 190,0 195,3 197,1 199,5 189,8 197,1 193,0 194,5 197,7 193,1 194, 00,5 193,5 185,3 195,1 196, 195,8 196,9 00,6 189,0 191,6 01,5 184,3 186,9 195,1 198,0 0, 03,5 195,3 00,1 197,6 191,5 188,6 19, 194,6 188,8 193,3 196,8 00,8 19,1 195,6 199,8 193,8 189,9 197,0 187,0 194, 190,8 193,9 196,3 198,1 194, 199,6 196,5 198,7 05,8 198,9 190,8 193,8 193,0 194,3 195,4 189,5 198,4 199,5 197,7 189,3 197,8 19,5 194,7 00, 197,0 199,9 191,0 189,8 188,3 193,7 193,3 196,7 196,9 00, 197,3 01,8 189,4 06,3 191,6 0,7 193, 193, 191,6 189,7 194, 188,1 193, 189,6 193, 199,5 193, 194,7 193,7 193,6 197, 197,1 196,0 196,7 194,6 198,1 198,0 199,9 189, 00, 191,3 191,0 191,9 191,1 193,1 195,4 19,3 194,6 197,0 193,4 199,4 198,3 01,4 198,5 01,7 195,5 199,4 190,1 00,7 01,6 190,0 196, 194,1 196,7 197,3 194,6 195,6 198,6 197,8 197,3 193,4 194,8 197, 196,1 19,6 0,4 19,7 00,7 189,1 194,3 190,7 196,5 194,6 197,6 19,1 190,9 198,8 3
Terminologia przypomnienie Populacja wybrana odmiana Badana cecha X masa jednego owocu tej odmiany Próba: x 1, x,..., x 160 Liczebność pobranej próby n = 160 4
Opis statystyczny próby opis parametryczny wyznaczenie parametrów próby, np.: średniej arytmetycznej, mediany, wariancji, odchylenia standardowego, itd. empiryczny rozkład wartości prezentacja rozkładu wartości w próbie przy użyciu np.: szeregu rozdzielczego, histogramu, wieloboku częstości, dystrybuanty empirycznej 5
6 Parametry próby Średnia arytmetyczna: = = + + + = n i i n x n n x x x x 1 1 1 Wariancja (nieobciążona): ( ) ( ) ( ) ( ) 1 1 1 1 1 1 1 1 = = = + + + = = = = n x n x n x x n x x x x x x s n i i n i i n i i n
W przykładzie: Parametry próby cd. x = 195, 15 g s = 16,63 g 7
Rozkład empiryczny w próbie Granice przedziału Liczebność n i Częstość w i =n i /n <184,05; 186,55) 0,013 <186,55;189,05) 7 0,044 <189,05;191,55) 3 0,144 <191,55;194,05) 3 0,00 <194,05;196,55) 33 0,06 <196,55;199,05) 34 0,13 <199,05;01,55) 0 0,15 <01,55;04,05) 7 0,044 <04,05;06,55> 0,013 160 1,000 8
Histogram liczebności dla próby Empiryczny rozkład wartości w próbie Rozkład masy owocu w próbie Liczebność ni 40 35 3 33 34 30 5 0 15 3 0 10 5 7 7 0 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 masa owocu 9
Histogramy inne warianty częstość (%) 0,10 0,05 vi=wi/dł klasy 0,00 0,080 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 0,060 0,040 masa owocu 0,00 0,000 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 masa owocu Komentarz 10
Problem Jaka jest średnia masa jednego owocu tej odmiany? Na podstawie wyników pomiaru cechy otrzymanych dla próby będziemy charakteryzować odmianę. 11
Średnia masa owocu odmiany vi 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 masa owocu Komentarz 1
Średnia masa owocu odmiany cd. vi 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 masa owocu Rozkład empiryczny wartości cechy (masa jednego owocu) jest dobrze opisany przez teoretyczny rozkład normalny. Zmienna losowa o rozkładzie normalnym jest modelem cechy (masa jednego owocu) w populacji. 13
Średnia masa owocu odmiany cd. vi 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 masa owocu Zmienna losowa o rozkładzie normalnym jest modelem cechy X w populacji. Mówimy: Cecha X ma rozkład normalny. Masa jednego owocu ma rozkład normalny. 14
Średnia masa owocu odmiany cd. vi 185,3 187,8 190,3 19,8 195,3 197,8 00,3 0,8 05,3 masa owocu Zmienna losowa o rozkładzie normalnym jest modelem cechy masa jednego owocu w populacji. N(μ ; σ ) - parametry nie muszą być znane μ, σ - nazywane są parametrami populacyjnymi (teoretycznymi) 15
Średnia masa owocu odmiany cd. vi 185 188 190 193 195 198 00 03 05 masa owocu x średnia arytmetyczna dla próby μ średnia populacyjna, parametr rozkładu teoretycznego 16
Idea estymacji przyjmujemy, że: średnia masa jednego owocu dla odmiany wynosi μ; wartość μ jest nieznana, ale można ją szacować (estymować, oceniać) na podstawie danych z próby wariancja masy jednego owocu tej odmiany wynosi σ ; wartość σ jest nieznana, ale można ją estymować na podstawie danych z próby odchylenie standardowe masy jednego owocu tej odmiany wynosi σ; wartość σ jest nieznana, ale można ją estymować na podstawie danych z próby 17
Rodzaje estymacji punktowa przedziałowa Wzory podające oszacowania (oceny) parametrów rozkładów teoretycznych (μ, σ, σ i innych) nazywamy estymatorami punktowymi. Oceną przedziałową nazywamy przedział liczbowy, w którym z dużym p-stwem zawarty jest parametr rozkładu teoretycznego (μ, σ, σ i inne). 18
Oznaczenie estymatora punktowego Parametr μ Estymator parametru μˆ σ σˆ σ p σˆ pˆ 19
Wzory estymatorów punktowych Cecha X~N(μ, σ ), μ, σ nieznane Próba: x 1, x,..., x n μˆ = x, σˆ = s, σˆ = s *Cecha Y ma rozkład 0-1 z nieznanym parametrem p Próba: y 1, y,...,y n k liczba elementów wyróżnionych p ˆ = k n 0
* Uwagi Metody otrzymywania estymatorów punktowych: metoda największej wiarogodności (Fisher) metoda najmniejszych kwadratów (Gauss) metoda momentów Własności estymatorów punktowych: nieobciążoność zgodność efektywność dostateczność 1
*Objaśnienie własności estymatorów nieobciążoność - wartość średnia estymatora jest równa wartości parametru populacyjnego ( x oraz s są nieobciążone, s jest obciążony, ale asympotycznie nieobciążony, p jest nieobciążony), zgodność - wraz ze wzrostem liczebności próby wartość estymatora zbliża się do wartości parametru ( x, s, s, p są zgodne), efektywność - miarą efektywności estymatora jest rozrzut otrzymywanych wartości, czyli wariancja; najefektywniejszy estymator ma najmniejszą wariancję ( x,p efektywne), dostateczność - estymator jest dostateczny, jeśli wykorzystuje całą informację o parametrze, jaka zawarta jest w próbie (tę własność posiada x ).
Estymacja punktowa 3
Estymacja punktowa Cecha X, np. masa owocu wybranej odmiany; założenie: X~N(μ, σ ), gdzie μ, σ nieznane Pytanie: Ile wynosi średnia wartość cechy X w populacji? Odpowiedź: wynosi μ; wartość nieznana, ale można ją estymować na podstawie danych z próby. Losujemy próbę: x1, x,..., xn. Obliczamy średnią arytmetyczną x dla próby. Przyjmujemy, że oceną średniej populacyjnej μ jest średnia dla próby x. 4
Estymacja punktowa - komentarz x = 195,15g oś liczbowa y x = 195,15g z oś liczbowa 5
Przykład 1. Smakowitość produktu Badano smakowitość pewnego produktu przygotowanego według ustalonej receptury. Dziesięciu konsumentów oceniło organoleptyczne w skali 1-5 cztery próbki produktu. Wyliczono średnie z 10 ocen: x i : 4, 4,5 4,0 4,5 6
Smakowitość produktu, cd. Cecha X smakowitość produktu; założenie: X ~ N(μ, σ ), gdzie μ, σ są nieznane. Polecenie 1. Wyznacz ocenę średniej smakowitości produktu przygotowanego według badanej receptury. Średnia dla receptury wynosi μ (wartość nieznana, można ją estymować na podstawie danych z próby). Próba: x1, x, x3, x4 Obliczamy średnią arytmetyczną dla próby: x = 4,30. Odp.: Średnia dla receptury wynosi 4,30. 7
Smakowitość produktu, cd. Polecenie. Wyznacz ocenę odchylenia standardowego dla produktu przygotowanego według badanej receptury. Odchylenie stand. dla receptury wynosi σ (wartość nieznana, można ją estymować na podstawie danych z próby). Próba: x1, x, x3, x4 Obliczamy odchylenie stand. dla próby: s = 0,06 s = 0, 4. Odp.: Odchylenie stand. dla receptury wynosi 0,4. 8
Przykład. Transport owoców Oceną sposobu transportu owoców jest procent owoców uszkodzonych podczas takiego transportu. W doświadczeniu wylosowano 150 owoców spośród transportowanych i w tej próbie stwierdzono 10 dobrych. 9
Transport owoców, cd. Cecha Y stan owocu po transporcie; założenie: Y ~ B(n, p), gdzie p jest nieznane. Polecenie. Wyznacz frakcję owoców uszkodzonych podczas transportu. Frakcja owoców uszkodzonych wynosi p (wartość nieznana, można ją estymować na podstawie danych z próby). Próba: y1, y,..., y150 Obliczamy frakcję owoców uszkodzonych dla próby: 30 p = = 0,0 = 0% 150 Odp.: Frakcja owoców uszkodzonych podczas transportu badaną metodą wynosi 0%. 30
Estymacja przedziałowa 31
Idea estymacji przedziałowej K L??? K P oś liczbowa μ μ ( K ) L ; K P 3
Estymacja przedziałowa Szukamy takiego przedziału: μ ( K ) L ; K P który będzie spełniał warunek: ( ) P K L ; K P μ - duże Np.: albo P P μ ( K ; ) = 0, 95 L K μ ( K ; ) = 0, 99 L K P P 33
Estymacja przedziałowa cd. Ogólnie: gdzie: P μ( K ; ) = 1 α L K P 1 α duże (np. równe 0,95 albo 0,99) α małe (np. równe 0,05 albo 0,01) 34
Estymacja przedziałowa - terminologia P μ( K ; ) = 1 α L K P α poziom istotności 1 α poziom ufności ( K ; K ) L P przedział ufności dla estymowanego parametru przy poziomie ufności 1 α 35
Estymacja przedziałowa terminologia P μ( K ; ) = 1 α L K Np. dla α = 0,05 mówimy: przedział ufności dla średniej μ przy poziomie ufności 95% albo 95% przedział ufności dla średniej μ. Np. dla α = 0,01 mówimy: przedział ufności dla średniej μ przy poziomie ufności 99% albo 99% przedział ufności dla średniej μ. P 36
Estymacja polecenia Wyznacz ocenę punktową oraz przedziałową średniej, wariancji, odchylenia standardowego, gdy cecha X ma w populacji rozkład normalny z nieznanymi parametrami; poziom ufności - dany Wyznacz ocenę punktową oraz przedziałową frakcji, gdy cecha X ma w populacji rozkład dwupunktowy z nieznanym parametrem; poziom ufności - dany 37
Przedział ufności dla średniej μ Cecha X ma w populacji rozkład normalny, X ~ N(μ, σ ), μ, σ nieznane; Losujemy próbę: x 1, x,..., x n ; np.: n=10 191, 193,0 195,1 184,3 197,6 00,8 194, 198,7 189,5 00, Obliczamy parametry próby: x = 194, 46 g, s = 6,89 g, s = 5,19 g, Wyznaczamy końce przedziału ufności ze wzoru: 38
Przedział ufności dla średniej μ cd. Przedział ufności dla μ przy poziomie ufności P=1-α: s μ ( x t ; x + t α, v α, n v s n ) x t, v s n x x + t, v s n wartość krytyczna t α, v, v liczba stopni swobody, v = n-1 39
Tablica wartości krytycznych rozkładu t-studenta X ~ tν - X zmienna losowa o rozkładzie t-studenta z liczbą stopni swobody v, α - poziom istotności, t α, ν - wartość krytyczna - liczba taka, że P( X > t α, ν ) = α ν \ α 0,400 0,300 0,00 0,100 0,050 0,05 0,05 0,010 0,005 0,001 1 1,3764 1,966 3,0777 6,3137 1,706 5,4519 5,4519 63,6559 17,311 636,5776 1,0607 1,386 1,8856,900 4,307 6,054 6,054 9,950 14,089 31,5998 3 0,9785 1,498 1,6377,3534 3,184 4,1765 4,1765 5,8408 7,453 1,944 : 8 0,8889 1,1081 1,3968 1,8595,3060,7515,7515 3,3554 3,835 5,0414 9 0,8834 1,0997 1,3830 1,8331,6,6850,6850 3,498 3,6896 4,7809 10 0,8791 1,0931 1,37 1,815,81,6338,6338 3,1693 3,5814 4,5868 11 0,8755 1,0877 1,3634 1,7959,010,5931,5931 3,1058 3,4966 4,4369 : 85 0,8459 1,048 1,916 1,6630 1,9883,818,818,6349,88 3,4086 90 0,8456 1,044 1,910 1,660 1,9867,795,795,6316,8779 3,4019 95 0,8454 1,041 1,905 1,6611 1,985,775,775,686,8741 3,3958 100 0,845 1,0418 1,901 1,660 1,9840,757,757,659,8707 3,3905 40
Przykład Wyznaczymy 95% przedział ufności dla średniej μ na podstawie wylosowanej próby (poziom ufności P = 95% = 0,95). Z tablic wartości krytycznych rozkładu t-studenta odczytujemy t α, v dla α = 0,05, v = 9; t 0,05, 9 =,6. Podstawiamy do wzoru: x x s 5,19 tα, v = 194,46,6 = n 10 s 5,19 + tα, v = 194,46 +,6 = n 10 190,75 198,17 41
Przykład cd. Odp.: 95% przedziałem ufności dla średniej μ jest (,75 ; 198,17) 190. Średnia μ przy poziomie ufności P=0,95 (z pstwem 0,95) należy do tego przedziału. 4
*Interpretacja poziomu ufności Druga próba wylosowana z tej samej populacji: 198,7; 189,5; 00,; 196,7; 0,7; 189,6; 197,1; 00,; 194,6; 195,5 95% przedział ufności dla średniej μ: ( 193,35 ; 199,61) μ? oś liczbowa 43
*Precyzja oceny parametru Wyniki pomiarów masy: 191,; 193,0; 195,1; 184,3; 197,6; 00,8; 194,; 198,7; 189,5; 00, Parametry próby: n = 10, x = 194, 46 g, s = 6,89 g, s = 5,19 g. t 0,05, 9 =,6. 95% przedziałem ufności dla średniej μ ( ) jest,75 ; 198,17 190. t 0,01, 9 = 3,498; 99% przedziałem ufności dla średniej μ ( ) jest,13 ; 199,79 189. 44
Przedział ufności dla wariancji σ Cecha X ma w populacji rozkład normalny, X ~ N(μ, σ ), μ, σ nieznane; Losujemy próbę: x 1, x,..., x n ; np.: 191,; 193,0; 195,1; 184,3; 197,6; 00,8; 194,; 198,7; 189,5; 00, Obliczamy parametry próby: s = 6,89 g, Podstawiamy do wzoru: 45
Przedział ufności dla wariancji σ Przedział ufności dla σ przy poziomie ufności P=1-α σ s χ ( n 1) s ( n 1) ; α /, v χ 1 α /, v χ -wartość krytyczna rozkładu chi-kwadrat, v liczba stopni swobody, v = n 1 46
Tablica wartości krytycznych rozkładu chi-kwadrat X ~ χ ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody v, α - poziom istotności, χ α, ν - wartość krytyczna - liczba taka, że P(X > χ α, ν ) = α ν \ α 0,995 0,990 0,975 0,950 0,900 0,100 0,050 0,05 0,010 0,005 1 0,0 4 393 0,000 0,0010 0,0039 0,0158,7055 3,8415 5,039 6,6349 7,8794 0,0100 0,001 0,0506 0,106 0,107 4,605 5,9915 7,3778 9,104 10,5965 3 0,0717 0,1148 0,158 0,3518 0,5844 6,514 7,8147 9,3484 11,3449 1,8381 : 8 1,3444 1,6465,1797,736 3,4895 13,3616 15,5073 17,5345 0,090 1,9549 9 1,7349,0879,7004 3,351 4,168 14,6837 16,9190 19,08 1,6660 3,5893 10,1558,558 3,470 3,9403 4,865 15,987 18,3070 0,483 3,093 5,1881 11,603 3,0535 3,8157 4,5748 5,5778 17,750 19,675 1,900 4,750 6,7569 : 85 55,1695 57,6339 61,3888 64,7494 68,7771 10,0789 107,517 11,3933 118,356 1,344 90 59,1963 61,7540 65,6466 69,160 73,911 107,5650 113,145 118,1359 14,116 18,987 95 63,495 65,8983 69,949 73,5198 77,8184 113,0377 118,7516 13,8580 19,975 134,466 100 67,375 70,0650 74,19 77,994 8,3581 118,4980 14,341 19,5613 135,8069 140,1697 47
Przykład Wyznaczymy 95% przedział ufności dla wariancji σ na podstawie wylosowanej próby. Odczytujemy wartości krytyczne rozkładu chi-kwadrat z tablic: χ α/, ν - dla α=0,05, v=9; χ 0,05, 9=19,08, χ 1-α/, ν - dla α=0,05, v=9; χ 0,975, 9=,7004. 48
Przykład wyniki cd. Podstawiamy do wzoru: s χ ( n 1) α /, v = 6,899 19,08 = 1,7 s χ ( n 1) 1 α /, v = 6,899,7004 = 89,6 Odp.: 95% przedziałem ufności dla wariancji σ ( ) jest,7 ; 89,6 1. Wariancja σ przy poziomie ufności P=0,95 (z p-stwem 0,95) należy do tego przedziału. 49
Przedział ufności dla odch. std. σ Cecha X~N(μ, σ ), μ, σ nieznane Próba: x 1, x,..., x n Przedział ufności dla σ przy poziomie ufności P=1-α σ s χ ( n 1) s ( n 1) α /, v ; χ 1 α /, v 50
Przedział ufności dla odch. std. σ Wyznaczamy pierwiastki: s χ ( n 1) α /, v = 0,0193 = 0,14 s χ ( n 1) 1 α /, v = 0,8341 = 0,91 Odp.: 95% przedziałem ufności dla odchylenia standardowego σ jest ( 0,14 ; 0,91) Odchylenie standardowe należy do niego z p-stwem 0,95. 51
Przedział ufności dla frakcji p Cecha X~B(n, p), p nieznane Próba: x 1, x,..., x n (duża, n > 100) Przedział ufności dla p przy poziomie ufności P=1-α p p u 1 α / p(1 n p) ; p + u 1 α / p(1 n p) u 1-α/ kwantyl rzędu 1-α/ 5
Kwantyl u1-α/ u 1- α / kwantyl rzędu 1- α/, to wartość z tablicy dystrybuanty rozkładu X~N(0,1) taka, że F(u1-α/) = 1- α/ α 1- α/ u1- α/ 0,01 0,995,5758 0,05 0,975 1,9600 53
Przykład. Transport owoców Oceną sposobu transportu owoców jest procent owoców uszkodzonych podczas takiego transportu. W doświadczeniu wylosowano 150 owoców spośród transportowanych i w tej próbie stwierdzono 10 dobrych. 54
Przykład estymacja parametru p Cecha Y stan owocu po transporcie Założenie: Y ~ B(n, p), gdzie p jest nieznane Polecenie. Wyznacz przedział ufności dla frakcji owoców uszkodzonych podczas transportu. Odp. Frakcja owoców uszkodzonych podczas transportu wynosi p (wartość nieznana, przedział ufności wyznaczamy na podstawie danych z próby). 55
Przykład estymacja parametru p Próba: y 1, y,..., y n n = 150, k = 30 Wyznaczamy przedział ufności dla p przy poziomie ufności P = 1 - α ze wzoru: p p u 1 α / p(1 n p) ; p + u 1 α / p(1 n p) 56
Przykład estymacja parametru p Obliczamy frakcję owoców uszkodzonych dla próby: p = 0,0 = 0% Odczytujemy kwantyl z tablicy dystrybuanty rozkładu N(0, 1): α = 1-0,95 = 0,05 α/ = 0,05 1 - α/ = 0,975 u 0,975 = 1,96 Podstawiamy do wzoru: 57
Przykład estymacja parametru p p p p(1 p) 0,0(1 0,0) u1 α / = 0,0 1,96 = n 150 p(1 p) 0,0(1 0,0) + u1 α / = 0,0+ 1,96 = n 150 0,14 0,6 Odp.: Odp.: 95% przedziałem ufności dla frakcji owoców uszkodzonych jest ( 0,14 ; 0,6) Frakcja owoców uszkodzonych podczas transportu należy do niego z p-stwem 0,95. 58