Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Podobne dokumenty
Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

Statystyka matematyczna. Wykład II. Estymacja punktowa

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

STATYSTYKA MATEMATYCZNA

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Lista 6. Estymacja punktowa

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Liczebnośd (w tys.) n

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Modele probabilistyczne zjawisk losowych

Parametryczne Testy Istotności

16 Przedziały ufności

STATYSTKA I ANALIZA DANYCH LAB II

Prawdopodobieństwo i statystyka r.

Rozkłady statystyk z próby Twierdzenia graniczne

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne

Estymacja przedziałowa - przedziały ufności

Twierdzenia graniczne:

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Statystyka matematyczna dla leśników

θx θ 1, dla 0 < x < 1, 0, poza tym,

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Estymacja parametrów populacji

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Estymacja punktowa i przedziałowa

Estymacja przedziałowa

1 Twierdzenia o granicznym przejściu pod znakiem całki

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Komputerowa analiza danych doświadczalnych

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Prawdopodobieństwo i statystyka r.

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

Prawdopodobieństwo i statystyka

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

1 Testy statystyczne. 2 Rodzaje testów

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Komputerowa analiza danych doświadczalnych

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Estymatory nieobciążone o minimalnej wariancji

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

ANALIZA DANYCH DYSKRETNYCH

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

STATYSTYKA I ANALIZA DANYCH

Statystyka i rachunek prawdopodobieństwa

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Estymacja przedziałowa:

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

0.1 Statystyczne Podstawy Modelu Regresji

2.1. Studium przypadku 1

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Rozkład normalny (Gaussa)

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

Wykład 11 ( ). Przedziały ufności dla średniej

Matematyka ubezpieczeń majątkowych r.

Elementy modelowania matematycznego

ZADANIA NA ĆWICZENIA 3 I 4

1 Dwuwymiarowa zmienna losowa

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

40:5. 40:5 = υ5 5p 40, 40:5 = p 40.

(X i X) 2. n 1. X m S

1) Jakie są różnice pomiędzy analiza danych a wnioskowaniem statystycznym?

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Kurs Prawdopodobieństwo Wzory

Komputerowa analiza danych doświadczalnych

Wykład 8: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

Wykład 13: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,

Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Statystyczny opis danych - parametry

P ( i I A i) = i I P (A i) dla parami rozłącznych zbiorów A i. F ( ) = lim t F (t) = 0, F (+ ) = lim t + F (t) = 1.

Stwierdzenie 1. Jeżeli ciąg ma granicę, to jest ona określona jednoznacznie (żaden ciąg nie może mieć dwóch różnych granic).

STATYSTYKA OPISOWA WYKŁAD 1 i 2

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Jarosław Wróblewski Analiza Matematyczna 1A, zima 2012/13. Ciągi.

Transkrypt:

Statystyka i opracowaie daych Podstawy wioskowaia statystyczego. Prawo wielkich liczb. Cetrale twierdzeie graicze. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl

Wprowadzeie Jeśli S jest przestrzeią zdarzeń elemetarych w statystyce azywaa populacją, to Prostą próbą losową próbką statystyczą o liczości azywamy ciąg iezależych zmieych losowych,,..,, określoych a przestrzei S i takich, że każda z ich ma te sam rozkład. Ciąg wartości,,.., próby losowej,,.., azywamy realizacją próby losowej. Wybór elemetów populacji powiie być dokoay w taki sposób, żeby każdy podzbiór populacji, składający się z elemetów miał taką samą szasę wybraia

Wybór próby reprezetatywej Od próby wymaga się reprezetatywości, czyli aby z przyjętą dokładością opisywała strukturę badaej populacji. O reprezetatywości decydują dwa czyiki: Liczebość Sposób doboru grupy Wybór celowy, o przyależości do grupy decyduje badacz, stopień reprezetatywości zależy wyłączie od jakości selekcji Wybór losowy- każdy elemet populacji ma jedakową szasę zalezieia się w próbie z takim samym prawdopodobieństwem, stopień reprezetatywości rośie wraz ze wzrostem liczebości grupy. Stosowae są dwie techiki losowaia: Losowaie iezależe zwrote Losowaie zależe bezzwrote

Zadaie: oceić średi wzrost dorosłych Polaków. Jeśli wybieramy próbę spośród studetów ie jest to jedak próba wszystkich dorosłych Polaków Utożsamiamy populację z badaą cechą Szacujemy szukaą wartość średi wzrost obliczając pewą wartość z próby Niech T,,..,, w aszym rozumieiu, dobrze przybliża wartość iezaego wskaźika. Taką fukcję T azywamy statystyką. Każda tak rozumiaa statystyka jest zmieą losową, a zatem posiada określoy rozkład i te rozkład odgrywa bardzo ważą rolę w aalizie statystyczej.

Rozkład średiej w prostej próbie losowej Średią, w prostej próbie losowej,,.., o liczości, azywamy statystykę + +... + Podaa defiicja jest szczególym przypadkiem statystyki T,,.., Średia jest zmieą losową, a jest kokretą wartością z jedej kokretej próby. Możemy wylosować kilka prób 00 elemetowych i z każdej otrzymać ią wartość p. `76,5; 77,8...

Prawo Wielkich Liczb PWL Prawo Wielkich Liczb: Niech będzie zmieą losową o wartości oczekiwaej µ i skończoej wariacji σ < i iech,,.., będzie prostą próbą losową z rozkładu zmieej. Wówczas dla dowolie małej dodatiej liczby ε i [ µ ε, µ + ε ] P

Charakterystyki rozkładu wartości średiej Zakładając, że prosta próba losowa,,.., pochodzi z rozkładu o wartości średiej µ i wariacji σ, Otrzymamy.......... σ σ σ σ σ µ µ µ µ µ µ µ µ + + + + + + + + + σ σ µ µ zatem

Cetrale twierdzeie graicze Jeśli,,.., jest prostą próbą losową z rozkładu o wartości średiej µ i skończoej wariacji σ. Wówczas dla prób losowych o dużej liczebości rozkład stadaryzowaej średiej jest bliski stadardowemu rozkładowi ormalemu N0,, tz rozkład średiej jest w przybliżeiu rówy rozkładowi N µ, σ / Zatem dla dowolych a i b a b i zmieej losowej Z o stadardowym rozkładzie ormalym P a µ σ / b P a Z b Φ b Φ a

Zastosowaie - przykład P Rozkład aszego codzieego dojazdu do pracy jest w przybliżeiu jedostajy a odciku 0,5h,h a jedocześie czasy dojazdów w róże di są iezależe. Jakie w przybliżeiu jest prawdopodobieństwo zdarzeia, że średi dziey dojazd w ciągu 30 di ie przekroczy 0,8h 48 mi Rozwiązaie: iech i ozacza czas dojazdu w i-tym diu, i,,30 i ma rozkład jedostajy a odciku [0,5, ], zatem stąd 0,5 + 3 µ oraz σ i 4 48 * i 3 4 30 > 0, 8 48 * 3 4 30 P Z > 0,5, 89 Φ 48, 89 0, 03

Rozkład częstości Zakładamy, że zmiea z rozkładu, z którego pochodzi próba, może przyjmować tylko dwie wartości: ozaczmy, gdy baday obiekt posiada określoą cechę 0, gdy obiekt tej cechy ie posiada pp q-pp0 Liczba p, zwaa proporcją jest rówa prawdopodobieństwu posiadaia wybraej cechy własości przez losowo wybraą jedostkę. Zauważmy, że µ *p+0*-pp, stąd też wyika że rozpatryway wcześiej problem szacowaia wartości średiej jest w tym kokretym przypadku jedozaczy z szacowaiem proporcji. Przykłady zastosowań: szacowaie proporcji produktów wadliwych wyprodukowaych w ciągu miesiąca, albo leworęczych ucziów przychodzących do I klasy

Rozkład częstości Częstością występowaia w prostej próbie losowej azywamy statystykę pˆ i gdzie,,.., jest prostą próbą losową z rozkładu dwupuktowego o wartościach 0 i. Statystykę p obliczoą dla kokretych wartości w próbie azywamy wartością częstości i

Twierdzeia o częstości występowaia. Częstość występowaia pomożoa przez liczość próby ma rozkład dwumiaowy Berouliego B, p. Poadto. Dla dowolych rzeczywistych a i b, gdy p p p p p ˆ ˆ σ µ ˆ a b b p p p p a P Φ Φ

Przykład zastosowań W populacji dorosłych Polaków 39% ma kłopoty ze sem. Jakie jest prawdopodobieństwo, że w próbie 00 elemetowej, częstość osób mających kłopoty ze sem ie przekroczy 0,33. Iteresuje as P pˆ 0,33 P Dae: a-, b33, 00 33 + 0.5 39 pˆ 33 + 0.5 Φ Φ.3 0. 9 00*0.39*0.6

Estymacja i estymatory.

Techiki wioskowaia statystyczego W statystyce matematyczej stosowae są dwie techiki wioskowaia: Estymacja polegająca a oszacowaiu z pewą dokładością określoych wartości charakteryzujących rozkład badaej cechy p. częstości, wartości oczekiwaej, wariacji. Weryfikacja hipotez statystyczych polegająca a sprawdzeiu słuszości przypuszczeń dotyczących postaci rozkładu cechy testy zgodości bądź wartości jego parametrów parametrycze testy istotości Obie wymieioe techiki uzupełiają się wzajemie.

Co to jest estymator Zakładamy, że rozkład badaej cechy w populacji geeralej jest opisay za pomocą dystrybuaty F ;Θ, gdzie Θ ozacza parametr od którego zależy ta dystrybuata taki jak p. λ w rozkładzie Poissoa. Niezaa wartość parametru Θ będzie szacowaa obliczoa a podstawie próby -elemetowej,.,

Defiicja estymatora Estymatorem T parametru Θ rozkładu populacji geeralej azywa się statystykę dowolą z próby T t,...,, która służy do oszacowaia wartości liczbowej tego parametru. Skoro szacuku parametru dokouje się w oparciu o dae z próby, zatem istieje możliwość popełieia błędu iech go ozacza litera d, który azyway jest błędem szacuku estymacji parametru Θ d T -Θ

Błąd estymacji Błąd d jest też zmieą losową zależą od próby losowej, a za miarę tego błędu przyjmuje się E T Θ Zauważmy, że jeśli E T Θ wtedy wyrażeie określające, jest wariacją D T estymatora T,, a odchyleie stadardowe DT jest średim stadardowym błędem szacuku parametru Θ, błędem względym oszacowaia jest iloraz DT / Θ

Estymacja i estymatory Rozpatrywae dotychczas statystyki: średia i częstość ależą do ajczęściej stosowaych w praktyce. W przypadku gdy statystyki używae są do szacowaia przybliżaia iezaych parametrów rozkładu zmiee losowej oszą specjalą azwę: Statystykę T,,..,, służącą do oszacowaia iezaego parametru populacji azywamy estymatorem. Dla kokretych wartości próby,,.., liczbę T,,.., azywamy wartością estymatora

Estymacja i estymatory W zależości od tego co chcemy oszacować rozróżia się estymację parametryczą, gdy szacowae są parametry rozkładu zmieej p. E, D Estymację ieparametryczą, gdy próbujemy wioskować o postaci rozkładu cechy w populacji. Podstawy teorii estymacji sformułował Karl Pearso a przełomie I i wieku.. Pierwszym krokiem w estymacji jest wylosowaie z populacji - elemetowej próby, po czym. a podstawie badań próby - obliczeń wykoaych a daych zawartych w próbce 3. wyciągamy wioski dotyczące badaej cechy w całej populacji.

Rodzaje estymacji wg kryterium wyiku Estymacja puktowa ma zastosowaie gdy, a podstawie daych z próby, chcemy ustalić liczbową wartość określoego parametru rozkładu cechy w całej populacji Estymacja przedziałowa polega a wyzaczeiu graic przedziału liczbowego, w którym, z określoym prawdopodobieństwem, zawiera się wartość szacowaego parametru Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie próby. p. dla wartości oczekiwaej jest to średia arytmetycza, albo średia ważoa. Liczba możliwych estymatorów kokretego parametru rozkładu może być duża ale, bierze się pod uwagę tylko te, które posiadają określoe właściwości cechy.

Cechy dobrego estymatora Zgody Nieobciążoy Najefektywiejszy Estymator jest zgody jeśli jest stochastyczie zbieży z szacowaym parametrem. W praktyce ozacza to, że im większa próba liczość próbki tym większe prawdopodobieństwo, że estymator przyjmie wartości bliższe szacowaemu parametrowi. Przykład im więcej ćwiczymy tym bardziej prawdopodoby sukces.

Zbieżość stochastycza Ciąg zmieych losowych,,.., { } jest stochastyczie zbieży do stałej c, jeśli dla dowolego ε>0, jest spełioa zależość lim P c < ε Ozacza to, że prawdopodobieństwo zdarzeia c < ε wzrasta do, co ie ozacza zbieżości w sesie aalizy matematyczej

Estymator zgody Estymator T jest zgody jeśli dla dowolego ε>0. lim P { T Θ < ε } Jeśli wybray estymator ie jest zgody to zwiększeie liczebości próby może go oddalić od wartości szacowaej. Przykład estymatorem średich wyików grupy jest średia ocea ajlepszego studeta, tak skrajie zdefiioway estymator ie jest zgody, bo zwiększeie liczości grupy zwiększa prawdopodobieństwo oddalaia go od średiej ocey w całej grupie. Jeśli estymator jest zgody to jest asymptotyczie ieobciążoy

Podstawowe własości estymatorów Tw.: Jeśli estymator jest ieobciążoy lub asymptotyczie ieobciążoy oraz jego wariacja spełia relację D T 0 lim to jest o estymatorem zgodym Estymator T parametru Θ jest ieobciążoy jeśli spełioa jest relacja E T Θ Jeśli ta relacja ie zachodzi, to estymator azywamy obciążoym, a wielkość b T E T - Θ azywamy obciążeiem estymatora

Cechy dobrego estymatora - Nieobciążoość Nieobciążoość estymatora ozacza, że wartość oczekiwaa estymatora ieobciążoego jest dokładie rówa wartości szacowaego parametru. Obciążoość ozacza, że wartości dostarczae przez taki estymator obciążoe są błędem systematyczym

Obciążoość i ieobciążoość estymatora Odchyleie stadardowe dae wzorem s i i jest estymatorem obciążoym odchyleia stadardowego w całej populacji, a ieobciążoym jest odchyleie obliczoe z wzoru s i i

Estymator obciążoy wariacji ] [ E E s E i i + + k j k j i i k k j j i i i i E E E E E ] [ s i i i i Estymator wariacji Stąd obliczymy Obliczmy: Zatem: ] [ D E E E s E

Estymator asymptotyczie ieobciążoy D D D s b s s ] [ D D s E s E Def: Estymator T jest asymptotyczie ieobciążoy, jeśli 0 lim T b Stąd dla przyjmuje się s jako estymator wariacji

Cechy dobrego estymatora - Efektywość Efektywość estymator jest tym efektywiejszy im miejsza jest jego wariacja. Spośród wszystkich estymatorów, które są zgode i ieobciążoe wybieramy te, który ma ajmiejszą wariację, jest ajefektywiejszy.

Przykłady estymatorów puktowych Estymatorem zgodym, ieobciążoym i ajefektywiejszym dla wartości oczekiwaej w populacji jest średia arytmetycza i i Mediaa wyzaczoa z próby jest ieobciążoym ale miej efektywym od średiej arytmetyczej estymatorem wartości oczekiwaej

Przykłady estymatorów puktowych Niech m ozacza liczbę wyróżioych elemetów w próbie elemetowej p. liczbę wyrobów wadliwych, wtedy statystyka będąca częstością w próbie P m jest estymatorem zgodym, ieobciążoym i ajefektywiejszym frakcji P w populacji

Przykłady estymatorów puktowych S i i S jest estymatorem zgodym ale obciążoym wariacji w całej populacji. Wskazówka: tego wzoru używamy obliczając wariację z całej populacji, atomiast do estymacji a podstawie próbki ależy wyik z próby pomożyć przez współczyik /-

Własości estymatora - podsumowaie Jeśli day jest zbiór estymatorów T,... T r ieobciążoych, to te estymator, który ma w tym zbiorze ajmiejsza wariację, jest estymatorem ajefektywiejszym. Tw. Estymator parametru statystyczego powiie być: ieobciążoy zgody ajefektywiejszy Metody wyzaczaia estymatorów: metoda mometów, metoda ajwiększej wiarygodości