optymalnej alokacji w estymacji frakcji Katedra Ekonometrii i Statystyki SGGW XVIII Metody Ilościowe w Badaniach Ekonomicznych Rogów 20 czerwca 2017 r.
Plan prezentacji 1 2 3 4
Rozważmy skończona populację U = {u 1,..., u N }.
Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość.
Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość. Zadanie
Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość. Zadanie Oszacować nieznana wielkość M
Rozważmy skończona populację U = {u 1,..., u N }. W populacji tej jest nieznana liczba M obiektów, które maja pewna interesujac a nas właściwość. Zadanie Oszacować nieznan a wielkość M lub równoważnie wskaźnik struktury (frakcja, odsetek, proporcja) θ = M N.
y
y stopa bezrobocia wadliwość produkcji poparcie partii politycznej badania ankietowe (cecha binarna)
y stopa bezrobocia wadliwość produkcji poparcie partii politycznej badania ankietowe (cecha binarna)
Z populacji pobieramy próbę n-elementow a zgodnie ze schematem lpbz.
Z populacji pobieramy próbę n-elementowa zgodnie ze schematem lpbz. Liczba obiektów wyróżnionych w próbie jest zmienna losowa o rozkładzie hipergeometrycznym. ξ Hip(N, θ, n) P N,θ,n {ξ = k} = ( θn )( (1 θ)n k n k ( N n) k max{0, n (1 θ)n}, min{n, θn} )
ENMW (θ) jest ˆθ c = ξ n
ENMW (θ) jest ˆθ c = ξ n Wariancja tego estymatora jest równa Dθ 2 ˆθ c = N n θ(1 θ) dla wszystkich θ. N 1 n
Powiedzmy, że populacja U podzielona jest na dwie warstwy U 1 i U 2 o liczebnościach N 1 oraz N 2, odpowiednio.
Estymator w 1 = N 1 N, w 2 = N 2 N
Estymator w 1 = N 1 N, w 2 = N 2 N θ = w 1 θ 1 + w 2 θ 2 w 1, w 2 (0, 1) w 1 + w 2 = 1
Estymator n = n 1 + n 2
Estymator n = n 1 + n 2 ξ 1 Hip(N 1, θ 1, n 1 ), ξ 2 Hip(N 2, θ 2, n 2 )
Estymator n = n 1 + n 2 ξ 1 Hip(N 1, θ 1, n 1 ), ξ 2 Hip(N 2, θ 2, n 2 ) ˆθ w = w 1 ξ 1 n 1 + w 2 ξ 2 n 2
Powstaje pytanie, ile pobrać jednostek z każdej warstwy do próby, aby dokładność estymacji θ była jak najlepsza?
Alokacja próby
Alokacja próby Alokacja proporcjonalna n i = w i n, i = 1, 2
Alokacja próby Alokacja proporcjonalna Alokacja Neymana n i = n i = w i n, i = 1, 2 w i θi (1 θ i ) i w n, i = 1, 2 i θi (1 θ i )
Pomysł
Pomysł Dla zago θ odsetek θ 1 może być dowolna liczba } (postaci M 1 N 1 ) ze zbioru A = {a θ, a θ + 1, a N1 θ + 2..., b N1 θ, gdzie { a θ = max 0, θ w } { } 2 θ ; b θ = min 1,. w 1 w 1
Pomysł Dla zago θ odsetek θ 1 może być dowolna liczba } (postaci M 1 N 1 ) ze zbioru A = {a θ, a θ + 1, a N1 θ + 2..., b N1 θ, gdzie { a θ = max 0, θ w } { } 2 θ ; b θ = min 1,. w 1 w 1 Niech L θ będzie liczebnościa zbioru A.
Pomysł Dla zago θ odsetek θ 1 może być dowolna liczba } (postaci M 1 N 1 ) ze zbioru A = {a θ, a θ + 1, a N1 θ + 2..., b N1 θ, gdzie { a θ = max 0, θ w } { } 2 θ ; b θ = min 1,. w 1 w 1 Niech L θ będzie liczebnościa zbioru A. Zastosujmy uśrednienie ze względu na parametr θ 1.
Pomysł Wariancja estymatora warstwowego D 2 θ ˆθ w = D 2 θ = 1 L θ b θ ( w 1 ξ 1 n 1 + w 2 ξ 2 θ 1 =a θ n 2 ) [ w 2 1 θ 1 (1 θ 1 ) N 1 n 1 n 1 N 1 1 + w2 2 n 2 θ w 1 θ 1 w 2 ( 1 θ w 1θ 1 w 2 ) ] N2 n 2 N 2 1
Pomysł Wariancja estymatora warstwowego dla 0 θ w 1 wielomian stopnia 2 względem f 6(N 1 1)(N 2 1)Nf(1 f)n θ + (N 2 1)N 1 (N(n + 1) 2(N 1 + n))f + (N 2)nf 2 θ 2 3(N 1 1)(N 2 1)f(1 f)n (w 1 0.5; f = n 1 /n)
Pomysł Wariancja estymatora warstwowego dla w 1 θ 1 w 1 (N 2 (1 f)n) θ(1 θ) (N 2 1)(1 f)n N ( 1 2(N +1)f 2 +(3NN 2 +N 2 N 1 2n(N +1))f N 1 (N 2 1) ) 6N 2 (N 2 1)nf(1 f) (w 1 0.5; f = n 1 /n)
Pomysł Dalsze postępowanie 1 Szukamy maksimum wariancji D 2 θ ˆθ w ze względu na parametr θ. 2 Szukamy minimum największej wartości wariancji znalezionej w punkcie 1 ze względu na f = n 1 n. 3 Otrzymujemy alokację próby między warstwy (n 1, n 2 ).
Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku.
Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931.
Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045
Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045 Pobieramy próbę o liczebności n = 1000.
Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045 Pobieramy próbę o liczebności n = 1000. Optymalny podział f = 0.343
Dane na podstawie PKW Wybory parlamentarne w Polsce w 2011 roku. Liczba uprawnionych do głosowania N = 30762931. Udziały warstw: w 1 = 10540517/30762931 = 0.342636955 w 2 = 20222414/30762931 = 0.657363045 Pobieramy próbę o liczebności n = 1000. Optymalny podział f = 0.343 n 1 = 343, n 2 = 657
ξ = 200; ˆv c (200) = 0.0001599948
ξ = 200; ˆv c (200) = 0.0001599948 ξ 1 ξ 2 wariancja redukcja 25 175 0.000109763 5.23%
ξ = 200; ˆv c (200) = 0.0001599948 ξ 1 ξ 2 wariancja redukcja 25 175 0.000109763 5.23% 50 150 0.000158481 0.94% 75 125 0.000159807 0.11% 100 100 0.000155599 2.74% 125 75 0.000145855 8.83% 150 50 0.000130577 18.38% 175 25 0.000109763 31.39%
Wnioski
Wnioski Wniosek 1 Dla każdego N, w 1 oraz n można znaleźć optymalna alokację próby pomiędzy warstwy, tzn. taka alokację, że wariancja estymatora ˆθ w jest jednostajnie mniejsza od wariancji estymatora nie warstwowego.
Wnioski Wniosek 1 Dla każdego N, w 1 oraz n można znaleźć optymalna alokację próby pomiędzy warstwy, tzn. taka alokację, że wariancja estymatora ˆθ w jest jednostajnie mniejsza od wariancji estymatora nie warstwowego. Wniosek 2 Zaproponowana alokacja próby między warstwy jest możliwa do wyznaczenia tylko numerycznie.
Wnioski Wniosek 1 Dla każdego N, w 1 oraz n można znaleźć optymalna alokację próby pomiędzy warstwy, tzn. taka alokację, że wariancja estymatora ˆθ w jest jednostajnie mniejsza od wariancji estymatora nie warstwowego. Wniosek 2 Zaproponowana alokacja próby między warstwy jest możliwa do wyznaczenia tylko numerycznie. Wniosek 3 Zaproponowana alokacja próby pozwala unikn ać dodatkowej estymacji frakcji w warstwach.
Dodatek N = 100000, n = 100 w 1 f opt 0.05 0.018 0.10 0.041 0.15 0.071 0.20 0.111 0.25 0.166 0.30 0.250 0.35 0.350 0.40 0.400 0.45 0.450 0.50 0.500