Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Podobne dokumenty
Statystyka matematyczna. Wykład II. Estymacja punktowa

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Estymacja przedziałowa

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA MATEMATYCZNA

Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne

Estymatory nieobciążone o minimalnej wariancji

Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

16 Przedziały ufności

Liczebnośd (w tys.) n

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

θx θ 1, dla 0 < x < 1, 0, poza tym,

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Lista 6. Estymacja punktowa

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

1 Dwuwymiarowa zmienna losowa

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

Twierdzenia graniczne:

Estymacja parametrów populacji

Prawdopodobieństwo i statystyka r.

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Komputerowa analiza danych doświadczalnych

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Matematyka ubezpieczeń majątkowych r.

0.1 ROZKŁADY WYBRANYCH STATYSTYK

1 Twierdzenia o granicznym przejściu pod znakiem całki

Modele probabilistyczne zjawisk losowych

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Statystyka Matematyczna. Skrypt. Spis treści. SKN Matematyki Stosowanej. s k n. m s 23 kwietnia Oznaczenia i definicje 3

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Komputerowa analiza danych doświadczalnych

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

0.1 Statystyczne Podstawy Modelu Regresji

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Estymacja przedziałowa:

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

STATYSTKA I ANALIZA DANYCH LAB II

Rozkład normalny (Gaussa)

MACIERZE STOCHASTYCZNE

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

Statystyka Inżynierska

Statystyka Matematyczna. Skrypt. Spis treści. SKN Matematyki Stosowanej. s k n. m s 11 czerwca Oznaczenia i definicje 4

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Prawdopodobieństwo i statystyka r.

Wykład 8: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

Statystyka i rachunek prawdopodobieństwa

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

ZSTA LMO Zadania na ćwiczenia

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

1 Układy równań liniowych

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Elementy modelowania matematycznego

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

ZADANIA NA ĆWICZENIA 3 I 4

Wybrane litery alfabetu greckiego

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład 13: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

P ( i I A i) = i I P (A i) dla parami rozłącznych zbiorów A i. F ( ) = lim t F (t) = 0, F (+ ) = lim t + F (t) = 1.

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

STATYSTYKA OPISOWA WYKŁAD 1 i 2

ANALIZA DANYCH DYSKRETNYCH

Estymacja przedziałowa - przedziały ufności

Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna.

Wzór Taylora. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski

Estymacja punktowa i przedziałowa

1) Jakie są różnice pomiędzy analiza danych a wnioskowaniem statystycznym?

Komputerowa analiza danych doświadczalnych

Wykład nr 2. Statystyka opisowa część 2. Plan wykładu

4. Symulacje. Estymacja punktowa.

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

1. Element nienaprawialny, badania niezawodności. Model matematyczny elementu - dodatnia zmienna losowa T, określająca czas życia elementu

Rozkłady statystyk z próby Twierdzenia graniczne

a 1, a 2, a 3,..., a n,...

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Analiza numeryczna. Stanisław Lewanowicz. Aproksymacja funkcji

Transkrypt:

Metody probabilistycze i statystyka Estymacja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej

Metody probabilistycze i statystyka 20. Estymacja puktowa Estymacja puktowa metoda szacowaia pewego iezaego parametru rozkładu zmieej losowej X (cechy populacji), p. EX, D 2 X, a podstawie wyików próby losowej dla zmieej X (tj. a podstawie wartości pewej kokretej próbki) Estymator parametru θ rozkładu zmieej X to dowola statystyka T = T (X 1,, X ), której wartości przyjmujemy za oceę wielkości parametru θ (20.1) Uwagi a) Jeśli (x 1,, x ) jest dowolą próbką dla cechy X i t = T (x 1,, x ), to θ t b) Dla dowolego parametru θ moża określić wiele estymatorów (p. dla θ = EX moża rozważaćśredią arytmetyczą, geometryczą, harmoiczą, mediaę z próbki), ale zależy am, aby estymator spełiał pewe własości gwaratujące jego jakość Opracowała Joaa Baaś

Metody probabilistycze i statystyka Wykład 6 Estymatory zgode Estymator T to estymator zgody parametru θ, jeśli (20.2) ε> 0 ε> 0 ( T ) lim P θ ε = 0 ( T ) lim P θ < ε = 1 (20.3) Uwagi a) Zbieżość z waruków (20.2) jest zbieżością według prawdopodobieństwa lub zbieżością stochastyczą b) Dla estymatora zgodego ze wzrostem liczebości próbki wzrasta dokładość oszacowaia parametru θ c) Dla daego parametru θ moża utworzyć wiele estymatorów zgodych Opracowała Joaa Baaś

Metody probabilistycze i statystyka Wykład 6 Estymatory obciążoe i ieobciążoe Estymator T to estymator ieobciążoy parametru θ, jeśli (20.4) E( T ) = θ dla każdego N (20.5) Uwaga Estymator ieobciążoy szacuje parametr θ bez błędu systematyczego Jeżeli E(T ) istieje, ale E(T ) θ, to T azywamy estymatorem obciążoym parametru θ, zaś różicę E(T ) θ azywamy obciążeiem estymatora Estymator T to estymator asymptotyczie ieobciążoy parametru θ, jeśli (20.6) lim E( T ) θ = 0 Opracowała Joaa Baaś

Metody probabilistycze i statystyka Wykład 6 Estymatory efektywe Kolejym kryterium, umożliwiającym oceę estymatorów jest wariacja, która powia być jak ajmiejsza (20.7) Twierdzeie Jeśli estymator T parametru θ jest (asymptotyczie) ieobciążoy oraz 2 lim D ( T ) = 0, to T jest estymatorem zgodym T i T * dwa estymatory ieobciążoe parametru θ, mające skończoe wariacje D 2 (T ) i D 2 (T * ) Estymator T (20.8) jest estymatorem efektywiejszym iż estymator T *, jeśli D ( T ) < D ( T ) 2 2 * Estymator ajefektywiejszy (efektywy) estymator ieobciążoy T daego parametru θ, który ma ajmiejszą wariację spośród wszystkich ieobciążoych estymatorów parametru θ Opracowała Joaa Baaś

Metody probabilistycze i statystyka Wykład 6 Nierówość Rao-Cramera Dla prawie wszystkich rozkładów zmieych losowych (za wyjątkiem rozkładu jedostajego) wariacja dowolego ieobciążoego estymatora T parametru θ spełia tzw. ierówość Rao-Cramera: 2 1 (20.9) D ( T ) 2 E[ θ l f ( X, θ )] gdzie f jest gęstością zmieej losowej X typu ciągłego lub rozkładem prawdopodobieństwa zmieej losowej X typu skokowego E [ l f ( X, θ) ] 2 θ (20.10) Wiosek iformacja Fishera, zawarta w próbce Jeśli dla pewego estymatora ieobciążoego T parametru θ w waruku (20.9) zachodzi rówość, to estymator te jest ajefektywiejszy Opracowała Joaa Baaś

Metody probabilistycze i statystyka 21. Estymacja podstawowych parametrów rozkładu (21.1) Twierdzeie Jeśli istieje wartość oczekiwaa m = EX zmieej losowej X (cechy w populacji), to średia z próby 1 X = X 1 + X 2 +... + X ( ) jest zgodym i ieobciążoym estymatorem wartości oczekiwaej m = EX (21.2) Twierdzeie Jeśli zmiea losowa X ma rozkład ormaly N(m,σ) o zaej wartości σ, to średia z próby X jest ajefektywiejszym estymatorem wartości oczekiwaej m = EX (21.3) Uwaga Jeśli chcemy oszacować wartość oczekiwaą m cechy X w pewej populacji o iezaym rozkładzie, to a podstawie -elemetowej próbki (x 1,, x ) 1 obliczamy średią arytmetyczą x = ( x1 + x2 +... + x ) i przyjmujemy m x Opracowała Joaa Baaś

Metody probabilistycze i statystyka Estymacja wariacji (21.4) Twierdzeie Jeśli istieje skończoa wariacja σ 2 = D 2 X zmieej losowej X, to statystyka 1 gdzie X = X 1 + X 2 +... + X, jest zgodym i asymptotyczie ieobciążoym estymatorem wariacji σ 2 (21.5) Twierdzeie Estymator 2 1 i=1 ( ) 2 i S = X X ( ) Sˆ = S = X X 2 2 1 1 1 i= 1 ( ) 2 i jest estymatorem zgodym i ieobciążoym wariacji σ 2 Opracowała Joaa Baaś

Metody probabilistycze i statystyka Estymacja wariacji (21.6) Twierdzeie Jeżeli wartość oczekiwaa m = EX zmieej losowej X jest zaa, to statystyka 2 1 * i=1 ( ) 2 i S = X m jest estymatorem zgodym i ieobciążoym wariacji σ 2 (21.7) Twierdzeie Jeśli zmiea losowa X ma rozkład ormaly N(m,σ) 2 i m jest zae, to S * jest estymatorem ajefektywiejszym wariacji σ 2 Opracowała Joaa Baaś

Metody probabilistycze i statystyka Estymacja wskaźika struktury X ma charakter iemierzaly podstawowym parametrem populacji jest frakcja p elemetów wyróżioych przez tą cechę w populacji, zwaa wskaźikiem struktury badaej cechy populacji (częstość względa) Jeśli populacja jest -elemetowa, zaś m jej elemetów posiada badaą cechę, to p = m Jeśli w próbce -elemetowej z populacji, m elemetów posiada badaą cechę, to p m Opracowała Joaa Baaś

Metody probabilistycze i statystyka Estymacja wskaźika struktury Aby utworzyć model matematyczy rozkładu cechę jakościową zamieia się a ilościową dla dowolego elemetu populacji ω: Tak zdefiiowaa zmiea losowa ma rozkład 0-1 z parametrem p, tj. P (X = 1) = p, P ( X = 0) = q = 1 p Jeśli (x 1,, x ) jest próbką dla zmieej losowej X, odpowiadającą próbce elemetów (ω 1,, ω ), w której m elemetów ma wyróżioą cechę, to w ciągu tym jest m jedyek, a zatem x 1 + + x = m W rezultacie 1 gdy ω posiada wyróżioą cechę X ( ω ) = 0 gdy ω ie posiada wyróżioej cechy p ( x... x ) 1 1 + + Opracowała Joaa Baaś

Metody probabilistycze i statystyka Estymacja wskaźika struktury (21.8) Twierdzeie Średia arytmetycza z próby M 1 (... ) = X 1 + + X jest zgodym, ieobciążoym i ajefektywiejszym estymatorem parametru p rozkładu 0-1 zmieej losowej X, tj. P (X = 1) = p, P ( X = 0) = q = 1 p Opracowała Joaa Baaś

Metody probabilistycze i statystyka Zestawieie estymatorów Tablica 21.1. Podstawowe estymatory Parametr Estymator Własości estymatora Wartość oczekiwaa m = EX Wariacja σ 2 = D 2 X Wskaźik struktury p Współczyik zmieości ( 1... ) X X X 1 = + + mediaa z próby 2 1 * i=1 ( ) 2 i S = X m 2 1 i=1 ( ) 2 i S = X X M Sˆ 2 2 = 1 S 1 (... ) V = S X = X 1 + + X zgody, ieobciążoy zgody, asymptotyczie ieobciążoy zgody, ieobciążoy zgody, asymptotyczie ieobciążoy zgody, ieobciążoy zgody, ieobciążoy ajefektywiejszy zgody Klasy rozkładów dla N(m,σ) estymator ajefektywiejszy dowoly dla N(m,σ) estymator ajefektywiejszy dowoly dowoly 0-1 dowoly Opracowała Joaa Baaś

Metody probabilistycze i statystyka Dziękuję za uwagę Opracowała Joaa Baaś