ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Podobne dokumenty
X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Estymacja przedziałowa

Lista 6. Estymacja punktowa

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

θx θ 1, dla 0 < x < 1, 0, poza tym,

16 Przedziały ufności

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Statystyka matematyczna. Wykład II. Estymacja punktowa

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Wykład 11 ( ). Przedziały ufności dla średniej

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

STATYSTYKA I ANALIZA DANYCH

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Prawdopodobieństwo i statystyka r.

Na podstawie dokonanych obserwacji:

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Estymacja punktowa i przedziałowa

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

ZADANIA NA ĆWICZENIA 3 I 4

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

STATYSTYKA MATEMATYCZNA

Prawdopodobieństwo i statystyka r.

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

Estymacja przedziałowa:

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

STATYSTYKA OPISOWA WYKŁAD 1 i 2

1 Dwuwymiarowa zmienna losowa

Estymatory nieobciążone o minimalnej wariancji

Parametryczne Testy Istotności

Porównanie dwu populacji

Estymacja przedziałowa - przedziały ufności

Statystyka Matematyczna Anna Janicka

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

(X i X) 2. n 1. X m S

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

2.1. Studium przypadku 1

Estymacja parametrów populacji

STATYSTKA I ANALIZA DANYCH LAB II

Liczebnośd (w tys.) n

0.1 ROZKŁADY WYBRANYCH STATYSTYK

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Statystyka Matematyczna Anna Janicka

I kolokwium z Analizy Matematycznej

Prawdopodobieństwo i statystyka r.

Estymacja parametrów rozkładu cechy

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Matematyka ubezpieczeń majątkowych r.

oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka Inżynierska

Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna.

ANALIZA DANYCH DYSKRETNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Statystyka matematyczna dla leśników

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Wykład 10 Wnioskowanie o proporcjach

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

Metody probabilistyczne

Ciągi liczbowe wykład 3

Prawdopodobieństwo i statystyka

Matematyka I. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr zimowy 2018/2019 Wykład 11

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Wnioskowanie statystyczne. Statystyka w 5

Transkrypt:

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA Mamy populację geeralą i iteresujemy się pewą cechą X jedostek statystyczych, a dokładiej pewą charakterystyką liczbową θ tej cechy (p. średią wartością tej cechy). Przeprowadzamy doświadczeia, w wyiku których mamy próbę losową (x 1,..., x ). Na podstawie obserwacji chcemy odpowiedzieć a pewe pytaia a temat iezaego θ Θ. Celem estymacji θ jest odpowiedź a pytaie: Ile miej więcej wyosi wartość parametru θ? Formalizacja probabilistyczo-statystycza tego zagadieia: {x i } - iezależe zmiee losowe o tym samym rozkładzie (=rozkładzie cechy X), którego wartość oczekiwaa θ (=średia wartość cechy X) ie jest zaa; mamy oszacować θ. Są dwa podstawowe sposoby estymacji (szacowaia) θ: 1. estymacja puktowa (wyik estymacji brzmi: θ wyosi miej więcej, powiedzmy, θ 0 ); 2. estymacja przedziałowa (wyik estymacji brzmi: θ 1

leży w przedziale, powiedzmy, θ, θ + ] z określoą dozą pewości, czyli z prawdopodobieństwem 1 α zadaym z góry). Przykład 1. Mamy oszacować średią procetową zawartość tłuszczu w mleku pochodzącym od pewego produceta. Zbadaliśmy 10 kartoów z mlekiem i uzyskaliśmy astępujące wyiki: 3,26; 3,12; 3,24; 3,16; 3,08; 3,14; 3,23; 3,11; 3,09; 3,24. Defiicja. Statystyką azywamy każdą fukcję T (x 1,..., x ) od próby (jest to zmieą losową). Postać statystyki ie może zależeć od iezaego parametru. Przykłady statystyk: x = x 1+ +x 1, i=1 (x i x) 2, przykłady ie statystyk: x 1+ +x 1 θ, i=1 (x i θ) 2. Defiicja. Estymatorem puktowym parametru θ azywamy dowolą statystykę T (x 1,..., x ), która aszym zdaiem dobrze przybliża wartość θ. 2

Rozważmy statystykę x jako estymator iezaej średiej wartości θ cechy X. Mamy: E x = E x 1 + + x Var x = Var x 1 + + x = Ex 1 + + Ex = θ, = 1 2(Varx 1 + + Varx ) = Varx 1 = σ2 2, gdzie przez σ 2 ozaczyliśmy wariację cechy X. Zaleta uśrediaia - redukcja zmieości. Defiicja. Estymator T (x 1,..., x ) parametru θ azywamy ieobciążoym, jeśli ET (x 1,..., x ) = θ (średio estymator szacuje parametr θ bez błędu). Estymator x jest estymatorem ieobciążoym dla θ. Defiicja. Estymator T (x 1,..., x ) parametru θ azywamy zgodym, jeśli dla T (x 1,..., x ) θ w pewym sesie probabilistyczym, tz. im większy jest rozmiar próby, tym lepiej estymator szacuje parametr. 3 θ θ

Estymator x jest zgodym estymatorem dla θ (a mocy Prawa Wielkich Liczb). Tak, w Przykładzie 1 szacujemy iezay parametr θ (średia procetowa zawartość tłuszczu w mleku) jako x = x 1 + + x 10 10 = 3,166(6). Przykład 2. Zmierzoo objętości V pięciu losowo wybraych kulek z partii kulek lożyskowych, otrzymując wyiki (w cm 3 ): 1,24; 1,38; 1,25; 1,17; 1,27. Zaleźć oceę wartości przeciętej średicy d kulki pochodzącej z tej partii. Jako oceę wartości przeciętej średicy d kulki wybierzemy średią z próbki x (jak wiemy, jest to estymator ieobciążoy i zgody dla parametru d). Poieważ objętość kulki i średica są związae rówością V = πd3 6, 6V otrzymujemy d = 3 π. Z tego wzoru, podstawiając wyiki obserwacji objętości, uzyskujemy odpowiedie wyiki dla średicy: x 1 1,33 cm, x 2 1,38 cm, x 3 1,34 cm, x 4 1,31 cm, x 5 1,34 cm. Stąd x 1,34 cm. Przykład 3. Zmierzoo pola S sześciu losowo wybraych kwadratowych działek z pewej okolicy, otrzymując wyiki (w m 2 ): 2809; 2916; 2704; 2809; 2601; 2704. 4

Oszacować średią długość boku a działki z tej okolicy. Przykład 4. Przeprowadzoo badaie zużycia bezyy w losowo wybraej grupie 6 samochodów tej samej marki i tego samego roczika. Po przejechaiu 200 km drogi uzyskao astępujące obserwacji zużycia bezyy (w l): 11,2; 10,8; 10,9; 12,0; 11,8; 11,5. Oszacować średie zużycie bezyy θ (w litrach a 100 km jazdy). Niech jedostki statystycze albo posiadają pewą własość (kodujemy to jako 1), albo ie (kod - 0). Jak oszacować iezaa proporcję p jedostek w populacji posiadających tą własość? (x 1,..., x ) - próba z rozkładu zero-jedykowego o iezaym prawdopodobieństwie p, P (X = 1) = p, P (X = 0) = 1 p, EX = p. Zatem zagadieie szacowaia parametru p sprowadza się do szacowaia iezaej wartości oczekiwaej. Więc, proporcja jedostek w próbie posiadających tą własość, czyli p = x 1+ +x, jest dobrym estymatorem dla p. Przykład 5. Jeda z agecji badających opiię publiczą w czerwcu 2000 roku przeprowadziła badaie 500 dorosłych obywateli polskich a temat poparcia (bądź ie) wejścia Polski do UE. Okazało się, że 285 5

osób opowiedziało się pozytywie a te temat. Oszacować proporcję p dorosłych obywateli Polski popierających wejście Polski do UE. Szacujemy p za pomocą proporcji dorosłych obywateli w próbie popierających wejście do UE, czyli jako p = 285 500 = 0,57. Przykład 6. Zgodie z przeprowadzoym badaiem a próbie w 300 dorosłych osób w Polsce, 117 osób miały kłopoty ze sem. Oszacować proporcję p dorosłych obywateli Polski mających kłopoty ze sem. Niech α (0, 1) będzie ustaloą liczbą (stadardowo α = 0.05); liczbę 1 α azywamy poziomem ufości. Defiicja. Estymatorem przedziałowym (przedziałem ufości) parametru θ a poziomie ufości 1 α azywamy przedział θ, θ + ], końce którego są statystykami (czyli θ = θ (x 1,..., x ), θ + = θ + (x 1,..., x )), taki, że dla dowolego θ zachodzi P (θ θ, θ + ]) 1 α. Tak aprawdę, zawsze staramy się skostruować przedział ufości, dla którego powyższe prawdopodobieństwo jest rówe 1 α, poieważ im miejsze jest prawdopodobieństwo, tym, a ogół, krótszy jest przedział θ, θ + ], a krótszy przedział, przy takim samym pozio- 6

mie ufości, ozacza bardziej precyzyje oszacowaie. Kostrukcja przedziałów ufości dla przypadków: 1. cecha ma rozkład ormaly, wariacja σ 2 jest zaa; 2. cecha ma rozkład ormaly, wariacja σ 2 ie jest zaa; 3. cecha ma rozkład dowoly, ale jest duże. 1. {x i } - iezależe zmiee losowe o rozkładzie N(θ, σ 2 ) = x ma rozkład N(θ, σ2 ) = x θ σ rozkład N(0, 1). Weźmy taką liczbę z 1 α/2, że ( P z 1 α/2 x θ ) z 1 α/2 = 1 α. σ Estymator przedziałowy dla θ ma zatem postać: ] σ σ θ, θ + ] = x z 1 α/2, x + z 1 α/2. ma Długość tego przedziału ufości wyosi 2z 1 α/2 σ i ie jest losowa. Od czego zależy długość przedziału? Jeśli σ jest ustaloe, to jedyie od poziomu 1 α i rozmiaru próbki. Aby zwiększyć precyzję estymatora poprzez zmiejszeie długości przedziału ufości, musimy albo zmiejszyć 1 α, co ie jest rozsąde, albo zwiększyć. 7

1 2. Zamiast σ bierzemy s = 1 j=1 (x j x) 2, zamiast rozkładu N(0, 1) rozkład Studeta o ( 1) stopiach swobody. Estymator przedziałowy dla θ ma postać: ] s s θ, θ + ] = x t 1 α/2, 1, x + t 1 α/2, 1. Tutaj t 1 α/2, 1 jest taką liczbą, że ( P t 1 α/2, 1 x θ ) t 1 α/2, 1 = 1 α. s Długość tego przedziału ufości wyosi 2t 1 α/2, 1 s i jest losowa. Średia długość tego przedziału zależy wyłączie od 1 α i w taki sam sposób, jak w poprzedim pukcie. 3. (estymator przybliżoy) W porówaiu z poprzedim przypadkiem, zamiast rozkładu Studeta poowie bierzemy rozkład N(0, 1). Przybliżoy estymator przedziałowy dla θ ma zatem postać: ] s s θ, θ + ] = x z 1 α/2, x + z 1 α/2. 8

W Przykładzie 1 przy założeiu, że cecha ma rozkład ormaly i p. σ = 0,05 stosujemy przedział ufości z puktu 1. Przy 1 α = 0,95 otrzymujemy z tablic z 0,975 = 1,960 i θ, θ + ] = 3,1667 1,960 0,05 ; 3,1667 + 1,960 0,05 ] = 10 10 = 3,1357; 3,1977]. Jeśli ie ma wiedzy o σ, to stosujemy przedział ufości z puktu 2. Przy 1 α = 0,95 otrzymujemy z tablic t 0,975,9 = 2,2622 i ] 0,0048 0,0048 θ, θ + ]= 3,1667 2,2622 ; 3,1667+2,2622 10 10 = 3,1171; 3,2163]. W Przykładzie 2 przy założeiu, że cecha ma rozkład ormaly i p. σ = 0,025 stosujemy przedział ufości z puktu 1. Przy 1 α = 0,95 otrzymujemy z tablic z 0,975 = 1,960 i d, d + ] = 1,340 1,960 0,025 ; 1,340 + 1,960 0,025 ] = 5 5 = 1,318; 1,362]. Jeśli ie ma wiedzy o σ, to stosujemy przedział ufości z puktu 2. Przy 1 α = 0,95 otrzymujemy z tablic t 0,975,4 = 2,776 i 9

d, d + ]=1,340 2,776 0,027 5 ; 1,340+2,776 0,027 5 ] = = 1,307; 1,373]. Niech jedostki statystycze albo posiadają pewą własość (1), albo ie (0). Cel: oszacowaie iezaej proporcji p jedostek posiadających tą własość. (x 1,..., x ) - próba z rozkładu zero-jedykowego o iezaym prawdopodobieństwie p, P (X = 1) = p, P (X = 0) = 1 p, EX = p, VarX = p(1 p), Var p = Var x 1+ +x = p(1 p). Estymator przedziałowy dla iezaej proporcji p ma postać: ] p(1 p) p(1 p) p, p + ] = p z 1 α/2, p + z 1 α/2. Dla dobrego przybliżeia, oprócz wymagaego waruku, że jest duże (powiedzmy 100), często wymagae jest, by p 5 oraz (1 p) 5. Dla daych z Przykładu 5 otrzymujemy astępujący przedział ufości dla p przy 1 α = 0,95: 0,57 0,43 0,57 0,43 p, p + ]=0,57 1,96, 0,57+1,96 ] 500 500 = 0,53; 0,61]. Zadaie. Wypisać estymatory przedziałowe w Przykładach 3,4,6. Przyjąć 1 α = 0,95. Założyć ormalość rozkładu cechy w Przykładach 3,4. 10