Statystyka i opracowaie daych Podstawy wioskowaia statystyczego. Prawo wielkich liczb. Cetrale twierdzeie graicze. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl
Wprowadzeie Jeśli S jest przestrzeią zdarzeń elemetarych w statystyce azywaa populacją, to Prostą próbą losową próbką statystyczą o liczości azywamy ciąg iezależych zmieych losowych,,..,, określoych a przestrzei S i takich, że każda z ich ma te sam rozkład. Ciąg wartości,,.., próby losowej,,.., azywamy realizacją próby losowej. Wybór elemetów populacji powiie być dokoay w taki sposób, żeby każdy podzbiór populacji, składający się z elemetów miał taką samą szasę wybraia
Wybór próby reprezetatywej Od próby wymaga się reprezetatywości, czyli aby z przyjętą dokładością opisywała strukturę badaej populacji. O reprezetatywości decydują dwa czyiki: Liczebość Sposób doboru grupy Wybór celowy, o przyależości do grupy decyduje badacz, stopień reprezetatywości zależy wyłączie od jakości selekcji Wybór losowy- każdy elemet populacji ma jedakową szasę zalezieia się w próbie z takim samym prawdopodobieństwem, stopień reprezetatywości rośie wraz ze wzrostem liczebości grupy. Stosowae są dwie techiki losowaia: Losowaie iezależe zwrote Losowaie zależe bezzwrote
Zadaie: oceić średi wzrost dorosłych Polaków. Jeśli wybieramy próbę spośród studetów ie jest to jedak próba wszystkich dorosłych Polaków Utożsamiamy populację z badaą cechą Szacujemy szukaą wartość średi wzrost obliczając pewą wartość z próby Niech T,,..,, w aszym rozumieiu, dobrze przybliża wartość iezaego wskaźika. Taką fukcję T azywamy statystyką. Każda tak rozumiaa statystyka jest zmieą losową, a zatem posiada określoy rozkład i te rozkład odgrywa bardzo ważą rolę w aalizie statystyczej.
Rozkład średiej w prostej próbie losowej Średią, w prostej próbie losowej,,.., o liczości, azywamy statystykę + +... + Podaa defiicja jest szczególym przypadkiem statystyki T,,.., Średia jest zmieą losową, a jest kokretą wartością z jedej kokretej próby. Możemy wylosować kilka prób 00 elemetowych i z każdej otrzymać ią wartość p. `76,5; 77,8...
Prawo Wielkich Liczb PWL Prawo Wielkich Liczb: Niech będzie zmieą losową o wartości oczekiwaej µ i skończoej wariacji σ < i iech,,.., będzie prostą próbą losową z rozkładu zmieej. Wówczas dla dowolie małej dodatiej liczby ε i [ µ ε, µ + ε ] P
Charakterystyki rozkładu wartości średiej Zakładając, że prosta próba losowa,,.., pochodzi z rozkładu o wartości średiej µ i wariacji σ, Otrzymamy.......... σ σ σ σ σ µ µ µ µ µ µ µ µ + + + + + + + + + σ σ µ µ zatem
Cetrale twierdzeie graicze Jeśli,,.., jest prostą próbą losową z rozkładu o wartości średiej µ i skończoej wariacji σ. Wówczas dla prób losowych o dużej liczebości rozkład stadaryzowaej średiej jest bliski stadardowemu rozkładowi ormalemu N0,, tz rozkład średiej jest w przybliżeiu rówy rozkładowi N µ, σ / Zatem dla dowolych a i b a b i zmieej losowej Z o stadardowym rozkładzie ormalym P a µ σ / b P a Z b Φ b Φ a
Zastosowaie - przykład P Rozkład aszego codzieego dojazdu do pracy jest w przybliżeiu jedostajy a odciku 0,5h,h a jedocześie czasy dojazdów w róże di są iezależe. Jakie w przybliżeiu jest prawdopodobieństwo zdarzeia, że średi dziey dojazd w ciągu 30 di ie przekroczy 0,8h 48 mi Rozwiązaie: iech i ozacza czas dojazdu w i-tym diu, i,,30 i ma rozkład jedostajy a odciku [0,5, ], zatem stąd 0,5 + 3 µ oraz σ i 4 48 * i 3 4 30 > 0, 8 48 * 3 4 30 P Z > 0,5, 89 Φ 48, 89 0, 03
Rozkład częstości Zakładamy, że zmiea z rozkładu, z którego pochodzi próba, może przyjmować tylko dwie wartości: ozaczmy, gdy baday obiekt posiada określoą cechę 0, gdy obiekt tej cechy ie posiada pp q-pp0 Liczba p, zwaa proporcją jest rówa prawdopodobieństwu posiadaia wybraej cechy własości przez losowo wybraą jedostkę. Zauważmy, że µ *p+0*-pp, stąd też wyika że rozpatryway wcześiej problem szacowaia wartości średiej jest w tym kokretym przypadku jedozaczy z szacowaiem proporcji. Przykłady zastosowań: szacowaie proporcji produktów wadliwych wyprodukowaych w ciągu miesiąca, albo leworęczych ucziów przychodzących do I klasy
Rozkład częstości Częstością występowaia w prostej próbie losowej azywamy statystykę pˆ i gdzie,,.., jest prostą próbą losową z rozkładu dwupuktowego o wartościach 0 i. Statystykę p obliczoą dla kokretych wartości w próbie azywamy wartością częstości i
Twierdzeia o częstości występowaia. Częstość występowaia pomożoa przez liczość próby ma rozkład dwumiaowy Berouliego B, p. Poadto. Dla dowolych rzeczywistych a i b, gdy p p p p p ˆ ˆ σ µ ˆ a b b p p p p a P Φ Φ
Przykład zastosowań W populacji dorosłych Polaków 39% ma kłopoty ze sem. Jakie jest prawdopodobieństwo, że w próbie 00 elemetowej, częstość osób mających kłopoty ze sem ie przekroczy 0,33. Iteresuje as P pˆ 0,33 P Dae: a-, b33, 00 33 + 0.5 39 pˆ 33 + 0.5 Φ Φ.3 0. 9 00*0.39*0.6
Estymacja i estymatory.
Techiki wioskowaia statystyczego W statystyce matematyczej stosowae są dwie techiki wioskowaia: Estymacja polegająca a oszacowaiu z pewą dokładością określoych wartości charakteryzujących rozkład badaej cechy p. częstości, wartości oczekiwaej, wariacji. Weryfikacja hipotez statystyczych polegająca a sprawdzeiu słuszości przypuszczeń dotyczących postaci rozkładu cechy testy zgodości bądź wartości jego parametrów parametrycze testy istotości Obie wymieioe techiki uzupełiają się wzajemie.
Co to jest estymator Zakładamy, że rozkład badaej cechy w populacji geeralej jest opisay za pomocą dystrybuaty F ;Θ, gdzie Θ ozacza parametr od którego zależy ta dystrybuata taki jak p. λ w rozkładzie Poissoa. Niezaa wartość parametru Θ będzie szacowaa obliczoa a podstawie próby -elemetowej,.,
Defiicja estymatora Estymatorem T parametru Θ rozkładu populacji geeralej azywa się statystykę dowolą z próby T t,...,, która służy do oszacowaia wartości liczbowej tego parametru. Skoro szacuku parametru dokouje się w oparciu o dae z próby, zatem istieje możliwość popełieia błędu iech go ozacza litera d, który azyway jest błędem szacuku estymacji parametru Θ d T -Θ
Błąd estymacji Błąd d jest też zmieą losową zależą od próby losowej, a za miarę tego błędu przyjmuje się E T Θ Zauważmy, że jeśli E T Θ wtedy wyrażeie określające, jest wariacją D T estymatora T,, a odchyleie stadardowe DT jest średim stadardowym błędem szacuku parametru Θ, błędem względym oszacowaia jest iloraz DT / Θ
Estymacja i estymatory Rozpatrywae dotychczas statystyki: średia i częstość ależą do ajczęściej stosowaych w praktyce. W przypadku gdy statystyki używae są do szacowaia przybliżaia iezaych parametrów rozkładu zmiee losowej oszą specjalą azwę: Statystykę T,,..,, służącą do oszacowaia iezaego parametru populacji azywamy estymatorem. Dla kokretych wartości próby,,.., liczbę T,,.., azywamy wartością estymatora
Estymacja i estymatory W zależości od tego co chcemy oszacować rozróżia się estymację parametryczą, gdy szacowae są parametry rozkładu zmieej p. E, D Estymację ieparametryczą, gdy próbujemy wioskować o postaci rozkładu cechy w populacji. Podstawy teorii estymacji sformułował Karl Pearso a przełomie I i wieku.. Pierwszym krokiem w estymacji jest wylosowaie z populacji - elemetowej próby, po czym. a podstawie badań próby - obliczeń wykoaych a daych zawartych w próbce 3. wyciągamy wioski dotyczące badaej cechy w całej populacji.
Rodzaje estymacji wg kryterium wyiku Estymacja puktowa ma zastosowaie gdy, a podstawie daych z próby, chcemy ustalić liczbową wartość określoego parametru rozkładu cechy w całej populacji Estymacja przedziałowa polega a wyzaczeiu graic przedziału liczbowego, w którym, z określoym prawdopodobieństwem, zawiera się wartość szacowaego parametru Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie próby. p. dla wartości oczekiwaej jest to średia arytmetycza, albo średia ważoa. Liczba możliwych estymatorów kokretego parametru rozkładu może być duża ale, bierze się pod uwagę tylko te, które posiadają określoe właściwości cechy.
Cechy dobrego estymatora Zgody Nieobciążoy Najefektywiejszy Estymator jest zgody jeśli jest stochastyczie zbieży z szacowaym parametrem. W praktyce ozacza to, że im większa próba liczość próbki tym większe prawdopodobieństwo, że estymator przyjmie wartości bliższe szacowaemu parametrowi. Przykład im więcej ćwiczymy tym bardziej prawdopodoby sukces.
Zbieżość stochastycza Ciąg zmieych losowych,,.., { } jest stochastyczie zbieży do stałej c, jeśli dla dowolego ε>0, jest spełioa zależość lim P c < ε Ozacza to, że prawdopodobieństwo zdarzeia c < ε wzrasta do, co ie ozacza zbieżości w sesie aalizy matematyczej
Estymator zgody Estymator T jest zgody jeśli dla dowolego ε>0. lim P { T Θ < ε } Jeśli wybray estymator ie jest zgody to zwiększeie liczebości próby może go oddalić od wartości szacowaej. Przykład estymatorem średich wyików grupy jest średia ocea ajlepszego studeta, tak skrajie zdefiioway estymator ie jest zgody, bo zwiększeie liczości grupy zwiększa prawdopodobieństwo oddalaia go od średiej ocey w całej grupie. Jeśli estymator jest zgody to jest asymptotyczie ieobciążoy
Podstawowe własości estymatorów Tw.: Jeśli estymator jest ieobciążoy lub asymptotyczie ieobciążoy oraz jego wariacja spełia relację D T 0 lim to jest o estymatorem zgodym Estymator T parametru Θ jest ieobciążoy jeśli spełioa jest relacja E T Θ Jeśli ta relacja ie zachodzi, to estymator azywamy obciążoym, a wielkość b T E T - Θ azywamy obciążeiem estymatora
Cechy dobrego estymatora - Nieobciążoość Nieobciążoość estymatora ozacza, że wartość oczekiwaa estymatora ieobciążoego jest dokładie rówa wartości szacowaego parametru. Obciążoość ozacza, że wartości dostarczae przez taki estymator obciążoe są błędem systematyczym
Obciążoość i ieobciążoość estymatora Odchyleie stadardowe dae wzorem s i i jest estymatorem obciążoym odchyleia stadardowego w całej populacji, a ieobciążoym jest odchyleie obliczoe z wzoru s i i
Estymator obciążoy wariacji ] [ E E s E i i + + k j k j i i k k j j i i i i E E E E E ] [ s i i i i Estymator wariacji Stąd obliczymy Obliczmy: Zatem: ] [ D E E E s E
Estymator asymptotyczie ieobciążoy D D D s b s s ] [ D D s E s E Def: Estymator T jest asymptotyczie ieobciążoy, jeśli 0 lim T b Stąd dla przyjmuje się s jako estymator wariacji
Cechy dobrego estymatora - Efektywość Efektywość estymator jest tym efektywiejszy im miejsza jest jego wariacja. Spośród wszystkich estymatorów, które są zgode i ieobciążoe wybieramy te, który ma ajmiejszą wariację, jest ajefektywiejszy.
Przykłady estymatorów puktowych Estymatorem zgodym, ieobciążoym i ajefektywiejszym dla wartości oczekiwaej w populacji jest średia arytmetycza i i Mediaa wyzaczoa z próby jest ieobciążoym ale miej efektywym od średiej arytmetyczej estymatorem wartości oczekiwaej
Przykłady estymatorów puktowych Niech m ozacza liczbę wyróżioych elemetów w próbie elemetowej p. liczbę wyrobów wadliwych, wtedy statystyka będąca częstością w próbie P m jest estymatorem zgodym, ieobciążoym i ajefektywiejszym frakcji P w populacji
Przykłady estymatorów puktowych S i i S jest estymatorem zgodym ale obciążoym wariacji w całej populacji. Wskazówka: tego wzoru używamy obliczając wariację z całej populacji, atomiast do estymacji a podstawie próbki ależy wyik z próby pomożyć przez współczyik /-
Własości estymatora - podsumowaie Jeśli day jest zbiór estymatorów T,... T r ieobciążoych, to te estymator, który ma w tym zbiorze ajmiejsza wariację, jest estymatorem ajefektywiejszym. Tw. Estymator parametru statystyczego powiie być: ieobciążoy zgody ajefektywiejszy Metody wyzaczaia estymatorów: metoda mometów, metoda ajwiększej wiarygodości