Przykład zastosowania optymalnej alokacji w estymacji frakcji

Podobne dokumenty
STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Estymacja parametrów rozkładu cechy

Metoda reprezentacyjna

1.1 Wstęp Literatura... 1

STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Statystyka matematyczna

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA

Wnioskowanie statystyczne. Statystyka w 5

Testowanie hipotez statystycznych.

PRZEDZIAŁ UFNOŚCI DLA FRAKCJI. Ryszard Zieliński. XXXVIII Konferencja Zastosowań Matematyki Zakopane Kościelisko 8-15 września 2009

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Metody probabilistyczne

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Estymacja parametro w 1

Estymacja gęstości prawdopodobieństwa metodą selekcji modelu

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Dokładne i graniczne rozkłady statystyk z próby

Estymacja punktowa i przedziałowa

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Pobieranie prób i rozkład z próby

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

STATYSTYKA MATEMATYCZNA

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

WYKŁAD 5 TEORIA ESTYMACJI II

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

LABORATORIUM 6 ESTYMACJA cz. 2

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

Rozkłady statystyk z próby. Statystyka

Oszacowanie i rozkład t

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Spis treści 3 SPIS TREŚCI

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna i ekonometria

Wykład Ćwiczenia Laboratorium Projekt Seminarium

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Własności statystyczne regresji liniowej. Wykład 4

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

O ŚREDNIEJ STATYSTYCZNEJ

Zawartość WSTĘP DO METODY REPREZENTACYJNEJ

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych cd.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym:

STATYSTYKA wykład 5-6

1 Podstawy rachunku prawdopodobieństwa

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

METODY STATYSTYCZNE W BIOLOGII

EGZAMIN MAGISTERSKI, 18 września 2013 Biomatematyka

Na podstawie dokonanych obserwacji:

Metoda najmniejszych kwadratów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Metody Statystyczne. Metody Statystyczne.

Weryfikacja hipotez statystycznych

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Praktyczne aspekty doboru próby. Dariusz Przybysz Warszawa, 2 czerwca 2015

1 Estymacja przedziałowa

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Janusz Wywiał Katedra Statystyki Akademia Ekonomiczna w Katowicach

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2

Teoria Estymacji. Do Powyżej

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Prawdopodobieństwo i statystyka r.

STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Transkrypt:

optymalnej alokacji w estymacji frakcji Katedra Ekonometrii i Statystyki SGGW XVIII Metody Ilościowe w Badaniach Ekonomicznych Rogów 20 czerwca 2017 r.

Plan prezentacji 1 2 3 4

Rozważmy skończona populację U = {u 1,..., u N }.

Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość.

Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość. Zadanie

Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość. Zadanie Oszacować nieznana wielkość M

Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość. Zadanie Oszacować nieznan a wielkość M lub równoważnie wskaźnik struktury (frakcja, odsetek, proporcja) θ = M N.

y

y stopa bezrobocia wadliwość produkcji poparcie partii politycznej badania ankietowe (cecha binarna)

y stopa bezrobocia wadliwość produkcji poparcie partii politycznej badania ankietowe (cecha binarna)

Z populacji pobieramy próbę n-elementow a zgodnie ze schematem lpbz.

Z populacji pobieramy próbę n-elementowa zgodnie ze schematem lpbz. Liczba obiektów wyróżnionych w próbie jest zmienna losowa o rozkładzie hipergeometrycznym. ξ Hip(N, θ, n) P N,θ,n {ξ = k} = ( θn )( (1 θ)n k n k ( N n) k max{0, n (1 θ)n}, min{n, θn} )

ENMW (θ) jest ˆθ c = ξ n

ENMW (θ) jest ˆθ c = ξ n Wariancja tego estymatora jest równa Dθ 2 ˆθ c = N n θ(1 θ) dla wszystkich θ. N 1 n

Powiedzmy, że populacja U podzielona jest na dwie warstwy U 1 i U 2 o liczebnościach N 1 oraz N 2, odpowiednio.

Estymator w 1 = N 1 N, w 2 = N 2 N

Estymator w 1 = N 1 N, w 2 = N 2 N θ = w 1 θ 1 + w 2 θ 2 w 1, w 2 (0, 1) w 1 + w 2 = 1

Estymator n = n 1 + n 2

Estymator n = n 1 + n 2 ξ 1 Hip(N 1, θ 1, n 1 ), ξ 2 Hip(N 2, θ 2, n 2 )

Estymator n = n 1 + n 2 ξ 1 Hip(N 1, θ 1, n 1 ), ξ 2 Hip(N 2, θ 2, n 2 ) ˆθ w = w 1 ξ 1 n 1 + w 2 ξ 2 n 2

Powstaje pytanie, ile pobrać jednostek z każdej warstwy do próby, aby dokładność estymacji θ była jak najlepsza?

Alokacja próby

Alokacja próby Alokacja proporcjonalna n i = w i n, i = 1, 2

Alokacja próby Alokacja proporcjonalna Alokacja Neymana n i = n i = w i n, i = 1, 2 w i θi (1 θ i ) i w n, i = 1, 2 i θi (1 θ i )

Pomysł

Pomysł Dla zago θ odsetek θ 1 może być dowolna liczba } (postaci M 1 N 1 ) ze zbioru A = {a θ, a θ + 1, a N1 θ + 2..., b N1 θ, gdzie { a θ = max 0, θ w } { } 2 θ ; b θ = min 1,. w 1 w 1

Pomysł Dla zago θ odsetek θ 1 może być dowolna liczba } (postaci M 1 N 1 ) ze zbioru A = {a θ, a θ + 1, a N1 θ + 2..., b N1 θ, gdzie { a θ = max 0, θ w } { } 2 θ ; b θ = min 1,. w 1 w 1 Niech L θ będzie liczebnościa zbioru A.

Pomysł Dla zago θ odsetek θ 1 może być dowolna liczba } (postaci M 1 N 1 ) ze zbioru A = {a θ, a θ + 1, a N1 θ + 2..., b N1 θ, gdzie { a θ = max 0, θ w } { } 2 θ ; b θ = min 1,. w 1 w 1 Niech L θ będzie liczebnościa zbioru A. Zastosujmy uśrednienie ze względu na parametr θ 1.

Pomysł Wariancja estymatora warstwowego D 2 θ ˆθ w = D 2 θ = 1 L θ b θ ( w 1 ξ 1 n 1 + w 2 ξ 2 θ 1 =a θ n 2 ) [ w 2 1 θ 1 (1 θ 1 ) N 1 n 1 n 1 N 1 1 + w2 2 n 2 θ w 1 θ 1 w 2 ( 1 θ w 1θ 1 w 2 ) ] N2 n 2 N 2 1

Pomysł Wariancja estymatora warstwowego dla 0 θ w 1 wielomian stopnia 2 względem f 6(N 1 1)(N 2 1)Nf(1 f)n θ + (N 2 1)N 1 (N(n + 1) 2(N 1 + n))f + (N 2)nf 2 θ 2 3(N 1 1)(N 2 1)f(1 f)n (w 1 0.5; f = n 1 /n)

Pomysł Wariancja estymatora warstwowego dla w 1 θ 1 w 1 (N 2 (1 f)n) θ(1 θ) (N 2 1)(1 f)n N ( 1 2(N +1)f 2 +(3NN 2 +N 2 N 1 2n(N +1))f N 1 (N 2 1) ) 6N 2 (N 2 1)nf(1 f) (w 1 0.5; f = n 1 /n)

Pomysł Dalsze postępowanie 1 Szukamy maksimum wariancji D 2 θ ˆθ w ze względu na parametr θ. 2 Szukamy minimum największej wartości wariancji znalezionej w punkcie 1 ze względu na f = n 1 n. 3 Otrzymujemy alokację próby między warstwy (n 1, n 2 ).

Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku.

Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931.

Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045

Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045 Pobieramy próbę o liczebności n = 1000.

Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045 Pobieramy próbę o liczebności n = 1000. Optymalny podział f = 0.343

Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045 Pobieramy próbę o liczebności n = 1000. Optymalny podział f = 0.343 n 1 = 343, n 2 = 657

ξ = 200; ˆv c (200) = 0.0001599948

ξ = 200; ˆv c (200) = 0.0001599948 ξ 1 ξ 2 wariancja redukcja 25 175 0.000109763 5.23%

ξ = 200; ˆv c (200) = 0.0001599948 ξ 1 ξ 2 wariancja redukcja 25 175 0.000109763 5.23% 50 150 0.000158481 0.94% 75 125 0.000159807 0.11% 100 100 0.000155599 2.74% 125 75 0.000145855 8.83% 150 50 0.000130577 18.38% 175 25 0.000109763 31.39%

Wnioski

Wnioski Wniosek 1 Dla każdego N, w 1 oraz n można znaleźć optymalna alokację próby pomiędzy warstwy, tzn. taka alokację, że wariancja estymatora ˆθ w jest jednostajnie mniejsza od wariancji estymatora nie warstwowego.

Wnioski Wniosek 1 Dla każdego N, w 1 oraz n można znaleźć optymalna alokację próby pomiędzy warstwy, tzn. taka alokację, że wariancja estymatora ˆθ w jest jednostajnie mniejsza od wariancji estymatora nie warstwowego. Wniosek 2 Zaproponowana alokacja próby między warstwy jest możliwa do wyznaczenia tylko numerycznie.

Wnioski Wniosek 1 Dla każdego N, w 1 oraz n można znaleźć optymalna alokację próby pomiędzy warstwy, tzn. taka alokację, że wariancja estymatora ˆθ w jest jednostajnie mniejsza od wariancji estymatora nie warstwowego. Wniosek 2 Zaproponowana alokacja próby między warstwy jest możliwa do wyznaczenia tylko numerycznie. Wniosek 3 Zaproponowana alokacja próby pozwala unikn ać dodatkowej estymacji frakcji w warstwach.

Dodatek N = 100000, n = 100 w 1 f opt 0.05 0.018 0.10 0.041 0.15 0.071 0.20 0.111 0.25 0.166 0.30 0.250 0.35 0.350 0.40 0.400 0.45 0.450 0.50 0.500