Statystyka i Opracowaie Daych W7. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl
Estymacja parametrycza Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie próby. p. dla wartości oczekiwaej jest to średia arytmetycza. Liczba możliwych estymatorów kokretego parametru rozkładu może być duża ale, bierze się pod uwagę tylko te, które posiadają określoe właściwości cechy. Estymator ma być zgody, ieobciążoy i ajefektywiejszy. Ze względu a formę wyiku estymacji wyróżimy Estymacja puktowa gdy szacujemy liczbową wartość określoego parametru rozkładu cechy w całej populacji Estymacja przedziałowa gdy wyzaczamy graice przedziału liczbowego, w których, z określoym prawdopodobieństwem, mieści się prawdziwa wartość szacowaego parametru.
Estymator NMW Def. Niech θbędzie liczbąrzeczywistąozaczająca iezay parametr populacji. Nieobciążoym estymatorem ˆ θ parametru θ, azywamy estymatorem,,... ieobciążoym o miimalej wariacji estymatorem NMW, jeśli wśród wszystkich ieobciążoych estymatorów szacowaego parametru, ie istieje estymator, którego wariacja byłaby miejsza dla jakiejś wartości θ. Czyli dla wszystkich możliwych wartości θi wszystkich ieobciążoych estymatorów ~ ~ θ T,,... ~ Var ˆ θ Var θ
Błąd średiokwadratowy estymatora Błędem średiokwadratowym estymatora θˆ, azywamy wartość średią kwadratu odległości µ θˆ θ Dla każdego estymatora θˆ jego błąd średiokwadratowy jest sumą jego wariacji i kwadratu obciążeia µ ˆ σ + µ ˆ ~ θ θ θ θ θ Błędem stadardowym estymatora θˆ parametru θazywamy dowoly estymator jego odchyleia stadardowego SE ~ S
Przykłady estymatorów puktowych Estymatorem zgodym, ieobciążoym i ajefektywiejszym dla wartości oczekiwaej w populacji jest średia arytmetycza i i Mediaa wyzaczoa z próby jest ieobciążoym ale miej efektywym od średiej arytmetyczej estymatorem wartości oczekiwaej
Przykłady estymatorów puktowych Niech m ozacza liczbęwyróżioych elemetów w próbie elemetowej p. liczbęwyrobów wadliwych, wtedy statystyka będąca częstością w próbie P m jest estymatorem zgodym, ieobciążoym i ajefektywiejszym frakcji P w populacji
Przykłady estymatorów puktowych S i i S jest estymatorem zgodym ale obciążoym wariacji w całej populacji. Wskazówka: tego wzoru używamy obliczając wariacjęz całej populacji, atomiast do estymacji a podstawie próbki ależy wyik z próby pomożyć przez współczyik /-
Obciążoość i ieobciążoość estymatora Odchyleie stadardowe dae wzorem s i i jest estymatorem obciążoym odchyleia stadardowego w całej populacji, a ieobciążoym jest odchyleie obliczoe z wzoru s i i
Estymator obciążoy wariacji ] [ E E s E i i + + k j k j i i k k j j i i i i E E E E E ] [ s i i i i Estymator wariacji Stąd obliczymy Obliczmy: Zatem: ] [ D E E E s E
Estymator asymptotyczie ieobciążoy D D D s b s s ] [ D D s E s E Def: Estymator T jest asymptotyczie ieobciążoy, jeśli 0 lim T b Stąd dla przyjmuje się s jako estymator wariacji
Przedziały ufości dla klasyczych parametrów statystyczych Estymacja przedziałowa polega a wyzaczeiu graic przedziału liczbowego, w którym, z określoym prawdopodobieństwem, rówym -, zawiera się wartość szacowaego parametru
Estymacja przedziałowa P Θ d,..., < Θ < Θ g,..., - Losowy przedział Θd,Θg azywa się przedziałem ufości parametru Θ Graice przedziału ufości są fukcjami zmieych losowych,..., - azywamy poziomem ufości lub współczyikiem ufości Zwykle przyjmuje się - 0,99 lub 0,95 lub 0,90 w zależości od rozpatrywaego zagadieia
Przedział ufości dla wartości oczekiwaej, gdy zae jest odchyleie stadardowe gdzie: Cecha ma w populacji rozkład ormaly N µ, σ, odchyleie stadardowe σ jest zae. Estymatorem wartości oczekiwaej µ, uzyskaym MNW jest średia arytmetycza, która jest zmieąlosowąo rozkładzie Nµ, σ/ Po stadaryzacji otrzymuję zmieą U o rozkładzie N0, U jest liczbą elemetów z próby losowej ozacza średią arytmetyczą obliczoą z próby losowej σ odchyleie stadardowe populacji σ µ
Przedział ufości dla wartości oczekiwaej gdy zae jest odchyleie stadardowe σ P u Φu -/ - / σ µ < σ < + u Poziom ufości - / / - u / 0 u -/ u
Praktycza realizacja przedziałów ufości dla µ, dla prostych prób losowych o liczościach 5, z rozkładu N 0, dla poziomu ufości - 0.9
Problem miimalej liczości próby σ µ σ < + < u u P Długość przedziału ufości wyosi u σ Żądamy by maksymaly błąd oszacowaia ie przekraczał zadaej z góry wartości d d u σ Z tej relacji wyika, że d u σ
Zadaie Wykoujemy pomiary grubości płytki metalowej. Jak dużąliczbępomiarów ależy przeprowadzić, aby prawdopodobieństwem ufością wyoszącym 0,95 maksymaly błąd ocey ie przekraczał0,0 mm. Zakładamy, że odchyleie stadardowe błędów pomiarów σ0.
Przedział ufości dla wartości oczekiwaej, gdy odchyleie stadardowe jest iezae Estymatorem µ, uzyskaym MNW jest średia arytmetycza, ie zamy σ, musimy zatem wybraćstatystykę, która od σie zależy t m S Statystyka t ma rozkład Studeta z - stopiami swobody, ie zależy od parametru σ ale od parametru S, S jest odchyleiem stadardowym obliczoym z próby.
Przedział ufości dla wartości oczekiwaej, gdy odchyleie stadardowe jest iezae P Przedziałufości dla wartości oczekiwaej ma wtedy postać S t, < m < + t, S gdzie wartośćt,-, jest kwatylem rzędu, z - stopiami swobody Długość przedziału wyosi t,-s/ -
Kwatyle t -, rzędu -,rozkładu Studeta o stopiach swobody 3.850 3.55 3.53.845.58.086.75.35 0.687 0.57 0 3.883 3.579 3.74.86.539.093.79.38 0.688 0.57 9 3.9 3.60 3.97.878.55.0.734.330 0.688 0.57 8 3.965 3.646 3..898.567.0.740.333 0.689 0.57 7 4.05 3.686 3.5.9.583.0.746.337 0.690 0.58 6 4.073 3.733 3.86.947.60.3.753.34 0.69 0.58 5 4.40 3.787 3.36.977.64.45.76.345 0.69 0.58 4 4. 3.85 3.37 3.0.650.60.77.350 0.694 0.59 3 4.38 3.930 3.48 3.055.68.79.78.356 0.695 0.59 4.437 4.05 3.497 3.06.78.0.796.363 0.697 0.60 4.587 4.44 3.58 3.69.764.8.8.37 0.700 0.60 0 4.78 4.97 3.690 3.50.8.6.833.383 0.703 0.6 9 5.04 4.50 3.833 3.355.896.306.860.397 0.706 0.6 8 5.408 4.785 4.09 3.499.998.365.895.45 0.7 0.63 7 5.959 5.08 4.37 3.707 3.43.447.943.440 0.78 0.65 6 6.869 5.893 4.773 4.03 3.365.57.05.476 0.77 0.67 5 8.60 7.73 5.598 4.604 3.747.776.3.533 0.74 0.7 4.94 0.4 7.453 5.84 4.54 3.8.353.638 0.765 0.77 3 3.598.37 4.089 9.95 6.965 4.303.90.886 0.86 0.89 636.6 38.3 7.3 63.657 3.8.706 6.34 3.078.000 0.35 0.9995 0.999 0.9975 0.995 0.99 0.975 0.95 0.9 0.75 0.6 -
Przedział ufości dla wartości oczekiwaej, gdy iezay jest rozkład w populacji W praktyce często ie zay jest rozkład cechy w populacji i brak jest podstaw do przyjęcia, że jest o ormaly. Wiadomo, że średia arytmetycza wyzaczoa z próby o dowolym rozkładzie jest zmieąlosowąo rozkładzie Nm, σ/, dlatego Niezae σmoża przybliżyćobliczoym z dużej próby odchyleiem stadardowym S σ µ σ + < < u u P µ + < < s u s u P
Zadaie Dokoao 0 pomiarów ciśieia wody a ostatim piętrze bloku 5 piętrowego i okazało się, że średie ciśieie wyosiło, podczas gdy wariacja wyiosła 4,4. Zaleźćliczbowe wartości krańców przedziałów ufości dla wartości oczekiwaej przyjmując poziom ufości - 0,95-0,90-0,98
Przedziałufości dla wariacji w populacji ormalej Przedziałjest zbudoway w oparciu o statystykę χ s / σ,która ma rozkład χ o - stopiach swobody. W rozkładzie χ określa siędwie wartości, spełiające odpowiedio rówości P χ χ, P χ χ,
Przedziałufości dla wariacji w populacji ormalej Z podaych wzorów wyika, że ; Po przekształceiu których otrzymujemy przedział ufości dla wariacji χ χ χ < <,, P χ σ χ < <,, S P χ σ χ < <,, S S P
Zadaie Odchyleie stadardowe σbłędu przyrządu pomiarowego jest iezae. Zakładamy, że rozkład błędów pomiarów jest rozkładem ormalym. Przeprowadzoo 0 pomiarów i otrzymao astępujące wyiki {7; 7,5; 8,5; 8; 6; 7,5; 6,5; 5;5 7,5; 6 } Wyzaczyćliczbowe wartości krańców przedziałów ufości dla Wartości oczekiwaej Dla odchyleia stadardowego Na poziomie ufości - 0,95
Przedziały ufości dla proporcji p Opierając sięa częstości skostruujemy przedziały ufości dla proporcji p. Jeśli próba losowa iezależych zmieych o rozkładzie puktowym P-P0 p jest dostateczie licza, by móc skorzystaćz przybliżeia rozkładem N0,, statystyki * Wówczas pˆ ˆ ˆ ˆ u p p p p u P p p p p ˆ ˆ ˆ
Zastosowaie Agecja badająca w 000 roku opiie Polaków a podstawie 000 elemetowej próby stwierdziła, że 57% popiera wejście Polski do Uii. Uzając, ze mamy do czyieia z rozkładem dwupuktowym skostruujemy przedziałufości a poziomie 0,95 dla proporcji Polaków popierających wejście Polski do UE Próba o 000 jest dostateczie licza by skorzystać ze rozkładu statystyki * Przedział95% ufości to [0,54,0,60], atomiast wielkość 0,57-0,57/000 0,0056 moża uzaćza błąd stadardowy otrzymaej częstości, w ujęciu procetowym wyosi o około,6%
Przedział ufości dla proporcji p + ˆ ˆ ˆ ˆ ˆ ˆ p p u p p p p u p P Waże jest aby pamiętać jakie są miimale wymagaia a liczość próby i proporcję p, by móc rozkład podaej w * statystyki przybliżać rozkładem N0,
Zadaie Odchyleie stadardowe σbłędu przyrządu pomiarowego jest iezae. Zakładamy, że rozkład błędów pomiarów jest rozkładem ormalym. Przeprowadzoo 0 pomiarów i otrzymao astępujące wyiki {7; 7,5; 8,5; 8; 6; 7,5; 6,5; 5;5 7,5; 6 } Wyzaczyćliczbowe wartości krańców przedziałów ufości dla Wartości oczekiwaej Dla odchyleia stadardowego Na poziomie ufości - 0,95