metoda momentów, Wartość oczekiwana (pierwszy moment) dla zmiennej o rozkładzie γ(α, λ) to E(X) = αλ, drugi moment (wariancja) to



Podobne dokumenty
1 Podstawy rachunku prawdopodobieństwa

Probabilistyka i statystyka - Teoria

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

STATYSTYKA MATEMATYCZNA

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Estymacja punktowa i przedziałowa

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wykład 3 Momenty zmiennych losowych.

Spis treści 3 SPIS TREŚCI

Wykład 3 Momenty zmiennych losowych.

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Kolokwium ze statystyki matematycznej

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Pozyskiwanie wiedzy z danych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Własności statystyczne regresji liniowej. Wykład 4

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

KORELACJE I REGRESJA LINIOWA

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

W1. Wprowadzenie. Statystyka opisowa

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Wnioskowanie statystyczne. Statystyka w 5

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Liczby rzeczywiste, wyrażenia algebraiczne, równania i nierówności, statystyka, prawdopodobieństwo.

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Monte Carlo, bootstrap, jacknife

Wykład 5: Statystyki opisowe (część 2)

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Inteligentna analiza danych

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zaliczenie. Ćwiczenia (zaliczenie = min. 15 punktów)

Statystyka. Opisowa analiza zjawisk masowych

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Komputerowa Analiza Danych Doświadczalnych

Statystyka opisowa. Robert Pietrzykowski.

Metody probabilistyczne

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Parametry statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Estymacja parametrów w modelu normalnym

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

STATYSTYKA

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

METODY STATYSTYCZNE W BIOLOGII

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Prawdopodobieństwo i statystyka r.

Wykład 4: Statystyki opisowe (część 1)

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Egzamin ze Statystyki, Studia Licencjackie Stacjonarne czerwiec 2007 Temat A

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka Matematyczna Anna Janicka

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Statystyki opisowe i szeregi rozdzielcze

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok akademicki 2014/2015

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych.

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Transkrypt:

3.1 Wprowadzenie do estymacji Ile mamy czerwonych krwinek w krwi? Ile karpi żyje w odrze? Ile ton trzody chlewnej będzie wyprodukowane w przyszłym roku? Ile białych samochodów jeździ ulicami Warszawy? Ile liści rośnie na najwyższym drzewie we Wrocławiu? W większości przypadków są to ciekawe pytania, w większości przypadków nie jesteśmy w stanie poznać prawdziwej odpowiedzi na to pytanie, w każdym przypadku możemy tą wartość ocenić. O sposobach oceny interesujących nas parametrów będzie poniżej. Zacznijmy jednak od słownikowych definicji Estymacja, to proces, którego celem jest ocena nieznanej wartości (funkcji) parametru na podstawie obserwacji. Estymator, to funkcja służąca do oceny nieznanej wartości (funkcji) parametru. Wartość estymatora, to ocena wartości (funkcji) parametru dla danej obserwacji. Poniżej omówimy kilka sposobów konstrukcji estymatorów. W dalszej części znajdą się przykłady użycia, oraz zadania do wykonania. Więcej informacji o estymatorach pojawi się na zajęciach poświęconych regresji. Rozmawiając z prowadzącym, dobrze rozróżniać estymator od wartości estymatora. 3.2 Konstrukcja estymatorów Teoria estymacji to dział statystyki zajmujący się dwoma zagadnieniami: konstrukcją estymatorów oraz wykazywaniem ich właściwości. Nie jest to najwłaściwsze miejsce aby opisywać metody konstrukcji estymatorów (będzie na wykładzie, jest w polecanych książkach, pokażemy prosty przykład dla rozkładu gamma), osoby zainteresowane powinny szukać informacji o metodach (poniżej najpopularniejsze) metoda momentów, Wartość oczekiwana (pierwszy moment) dla zmiennej o rozkładzie γ(α, λ) to E(X) = αλ, drugi moment (wariancja) to V ar(x) = αλ 2. Powyższe wzory można przekształcić i sprowadzić do następującej postaci λ α = V ar(x), E(X) = (E(X))2 V ar(x). 1

Teraz możemy posłużyć się znanymi estymatorami średniej i wariancji, by wyznaczyć estymatory interesujących parametrów V ar(x) λ = E(X), α = ( E(X)) 2 V ar(x). Estymatory otrzymane tą metodą nie zawsze są dobre, dla rozkładu gamma stosowanie estymatorów wyznaczonych metodą momentów jest niepolecane (zadanie: zbadaj wariancje i obciążenie takiego estymatora). Zaletą takich estymatorów jest łatwość ich wyznaczenia. W znakomitej liczbie przypadków wystarczy wyznaczy dwa pierwsze momenty. Bardziej zaawansowaną metodą wyznaczania estymatorów metodą momentów jest numeryczna aproksymacja parametrów rozkładu na bazie czterech pierwszych momentów z próby. metoda największej wiarogodności, metoda najmniejszych kwadratów, estymacja Bayesowska, metoda bootstrapowa. 3.3 Właściwości estymatorów Nie jest sztuką powiedzieć, że za tydzień w poniedziałek będzie słonecznie. Sztuką jest mieć racje. Każdy może zaproponować jakiś estymator, poniżej przedstawiamy zestaw własności, które powinien mieć dobry estymator. To, który estymator ma które własności będziemy a zajęciach. Wymienione własności to nie wszystkie możliwe własności, a tylko te najczęściej opisywane. Nieobciążoność. Estymator T (X) jest nieobciążonym estymatorem funkcji g(θ) jeżeli E θ [T (X)] = g(θ), czyli jeżeli wartość oczekiwana wartości estymatora jest równa wartości ocenianego parametru. Minimalna wariancja. Estymator T (X) jest estymatorem o minimalnej wariancji w danej klasie estymatorów, jeżeli dla każdego θ ma najmniejszą wariancje, spośród estymatorów w danej klasie. 2

Dopuszczalność. Estymator jest dopuszczalny w danej klasie estymatorów, jeżeli w tej klasie nie ma estymatora lepszego (w sensie błędu średniokwadratowego). proponuje jeszcze Normalność. Estymator jest normalny, jeżeli rozkład wartości estymatora jest rozkładem normalnym. Ta własność przydaje się przy konstrukcji przedziałów ufności. Zgodność. Estymator jest zgodny, jeżeli z n estymator zbiega do prawdziwej wartości ocenianego parametru (wariancja i obciążenie estymatora zbiega do zera). niezależność - jeżeli wynik estymacji nie zależy od badacza. 3.4 Popularne estymatory Przez x = (x 1,..., x n ) oznaczmy wektor obserwacji. Poniżej przedstawiamy najpopularniejsze estymatory. Średnia arytmetyczna Średnia jest też pierwszym momentem z próby. x = 1 n (xi ), Wariancja Estymator wariancji gdy średnia jest znana S 2 1 = 1 n ( x xi ) 2, Estymator wariancji gdy średnia jest nie znana (nieobciążony) Odchylenie standardowe Odchylenie średnie S2 2 = 1 ( x xi ) 2. n 1 ˆσ = sqrt(s 2 ) d = 1 n x xi 3

Współczynnik zmienności V s = ˆσ x V d = d x Współczynnik skośności Współczynnik asymetrii Współczynnik kurtozy W S = x d ˆσ A = 1 nˆσ 3 (xi x) 3 A = 1 nˆσ 4 (xi x) 4 3.4.1 Miary pozycyjne Dominana Najczęstsza wartość w próbie Mediana Wartość środkowego elementu (jeżeli elementów jest nieparzysta liczba), lub średniej z dwóch elementów najbliższych środka (jeżeli elementów jest parzysta liczba). Kwantyl Kwantyl rzędu p to wartość p n tej statystyki pozycyjnej z próby. Percentyle - kwantyle o rzędach będących wielokrotnością 0.01. Kwartyle - kwantyle o rzędach będących wielokrotnością 0.25 (są trzy, górny oznaczany Q 3, dolny oznaczany Q 1 i środkowy). Rozstęp R = max(x) min(x) 4

Rozstęp kwartylowy 3.4.2 Miary zależności Q 1,3 = Q 3 (x) Q 1 (x) Kowariancja Cov(x, y) = 1 n 1 (x i y j xȳ) i j Korelacja Pearsona Cor(x, y) = cov(x, y) ˆσ xˆσ y Korelacja rang Spearmana r s = 1 6 i r i n(n 2 1) gdzie r i - różnica pomiędzy rangą elementu x i i y i. Korelacja rang Kendalla τ = 2(N + N ) n(n 1) gdzie N + liczba zgodnych par, czyli takich par (i, j) że (x i, x j ) są w tej samej relacji (większe lub mniejsze) co (y i, y j ). N to liczba par niezgodnych. 5

3.5 Zadania: 1. Czy średnia z próby jest nieobciążonym estymatorem parametru średniej (położenia) dla rozkładów normalnym, log-normalnym, cauchego. 2. Czy mediana z próby jest nieobciążonym estymatorem mediany dla rozkładów normalnym, log-normalnym, cauchego. 3. Czy estymator wariancji S 1 = 1 n (x x) 2 jest estymatorem nieobciążonym dla rozkładów normalnym, log-normalnym, cauchego. Porównać z estymatorem S 2 = 1 n 1 (x x) 2. 4. Wyznacz metodą momentów estymatory parametrów rozkładu gamma, następnie zbadaj czy są to estymatory nieobciążone. 5. Wyznacz 95% przedział ufności dla estymatora średniej dla rozkładu normalnego dla n=20 obserwacji. 6. Wyznacz 95% przedział ufności dla parametru p w rozkładzie dwumianowym. 7. Niech f : R R będzie monotoniczną i odwracalną funkcją, a T (X) będzie nieobciążonym estymatorem parametru p. Czy f(t (X)) jest nieobciążonym estymatorem parametru f(p)? Czy i kiedy taka zależność zachodzi? Czy zachodzi dla f(x) = x? 8. Wyniki jednego z ostatnich sondaży przeprowadzonego przed wyborami prezydenckimi były następujące: 52% poparcia dla Donalda Tuska i 48% poparcia dla Lecha Kaczyńskiego. Wiedząc, że w sondażu uczestniczyło 1234 osób, wyznacz 95% przedział ufności dla parametru poparcie dla Donalda Tuska. Zinterpretuj wyniki. 6

9. Obserwujesz kolejne realizacje zamiennej losowej o rozkładzie normalnym o nieznanej wartości średniej i wariancji. Ile obserwacji musisz zarejestrować, aby 95% przedział ufności dla oceny wariancji był węższy niż 0.1? 10. Czy można symulacyjnie wykazać asymptotyczne nieobciążenie? 11. Napisz program do wyznaczania bootstrapowego estymatora średniej. Sprawdź czy ten estymator jest nieobciążony. 12. Jak mała może być wariancja estymatora? Jak mała może być wariancja estymatora nieobciążonego? 7