Statystyka Małych Obszarów w badaniach próbkowych



Podobne dokumenty
Niepełnosprawność w świetle estymacji pośredniej na przykładzie województwa wielkopolskiego

STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE

STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wnioskowanie statystyczne. Statystyka w 5

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń

Prawdopodobieństwo i statystyka

Metody Statystyczne. Metody Statystyczne.

Pobieranie prób i rozkład z próby

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

PRZEWODNIK PO PRZEDMIOCIE

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Rozkłady statystyk z próby. Statystyka

Taksonomiczne aspekty estymacji pośredniej uwzględniającej autokorelację przestrzenną w statystyce gospodarczej

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

STATYSTYKA MATEMATYCZNA

Metoda reprezentacyjna

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Metody probabilistyczne

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka Matematyczna Anna Janicka

dr Tomasz Jurkiewicz mgr Krzysztof Najman Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Estymacja punktowa i przedziałowa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Estymacja parametrów rozkładu cechy

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Spis treści 3 SPIS TREŚCI

Tematyka seminariów z informatyki dla studentów I roku kierunku lekarsko-dentystycznego w roku akademickim 2017/2018.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

METODY STATYSTYCZNE. Studia stacjonarne, semestr zimowy 2017/2018. Motto III: In God we trust. All others must bring data (z internetu)

Statystyka matematyczna i ekonometria

Statystyka matematyczna

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

WYKŁAD 5 TEORIA ESTYMACJI II

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Komputerowa Analiza Danych Doświadczalnych

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Opis programu studiów

Data wydruku: Dla rocznika: 2015/2016. Opis przedmiotu

Grupowanie materiału statystycznego

STATYSTYKA

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

STATYSTYKA wykład 5-6

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Prawdopodobieństwo i statystyka r.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Własności statystyczne regresji liniowej. Wykład 4

STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR

Stanisław Cichocki. Natalia Nehrebecka

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Testowanie hipotez statystycznych.

LABORATORIUM 6 ESTYMACJA cz. 2

Estymacja parametro w 1

Metody Ekonometryczne

Testowanie hipotez statystycznych.

Wykład Ćwiczenia Laboratorium Projekt Seminarium

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

ŁUKASZ WAWROWSKI ANALIZA UBÓSTWA W PRZEKROJU POWIATÓW W WOJEWÓDZTWIE WIELKOPOLSKIM Z WYKORZYSTANIEM METOD STATYSTYKI MAŁYCH OBSZARÓW 1.

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

METODY STATYSTYCZNE W BIOLOGII

PRZEWODNIK DYDAKTYCZNY I PROGRAM NAUCZANIA PRZEDMIOTU FAKULTATYWNEGO NA KIERUNKU LEKARSKIM ROK AKADEMICKI 2016/2017

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

przedmiot podstawowy obowiązkowy polski drugi

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nie dotyczy

Metoda najmniejszych kwadratów

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna dla leśników

Transkrypt:

Statystyka Małych Obszarów w badaniach próbkowych Łukasz Wawrowski l.wawrowski@stat.gov.pl Urząd Statystyczny w Poznaniu SKN Estymator, UEP 5.03.2012

1 Wprowadzenie Podstawowe pojęcia Badanie 2 Estymator Horwitza-Thompsona Estymator regresyjny 3 Broad Area Ratio Estimator 4 5

Podstawowe pojęcia Badanie Statystyka Małych Obszarów gałąź metody reprezentacyjnej, przedmiotem zainteresowania charakterystki podpopulacji, szacowanie dziedzin nie objętych planem losowania, losowa liczebność domeny w próbie, szacunki nawet przy zerowej liczbności próby w podpopulacji, wykorzystanie wszystkich dostępnych źródeł danych.

Podstawowe pojęcia Badanie Statystyka Małych Obszarów gałąź metody reprezentacyjnej, przedmiotem zainteresowania charakterystki podpopulacji, szacowanie dziedzin nie objętych planem losowania, losowa liczebność domeny w próbie, szacunki nawet przy zerowej liczbności próby w podpopulacji, wykorzystanie wszystkich dostępnych źródeł danych. Mały obszar Domena (obszar geograficzny, typ przedsiębiorstwa, grupa wiekowa), której liczebność w próbie jest mała.

Podstawowe pojęcia Badanie Estymator bezpośredni Estymator bezpośredni wykorzystuje informacje o zmiennej badanej y pochodzące wyłącznie z domeny będącej przedmiotem badania w danym momencie czasu. Mała liczebność próby duża wariancja, ale nieobciążony, więc wykorzystywany przy tworzeniu estymatorów pośrednich.

Podstawowe pojęcia Badanie Estymator pośredni Estymator pośredni wykorzystuje informacje o wartościach zmiennej badanej y spoza okresu i domeny będącej przedmiotem zainteresowania. Obciążony, ale niska wariancja, pożycza moc spoza domeny przy spełnionych założeniach.

Podstawowe pojęcia Badanie Opis badania Celem badania było poznanie odsetka studentów zaliczających praktyki zgodnie z regulaminem studiów. Liczebność populacji: 308 osób, liczebność próby: 62 osoby (20%), badana domena: wydział.

Podstawowe pojęcia Badanie Przygotowanie zbioru library(teachingsampling) dane=read.csv(file="ankieta.csv") los=sample(dane$id, 62, replace=f) dane_los=dane[los,] p=rep(nrow(dane_los)/nrow(dane), nrow(dane_los)) dane_los=cbind(dane_los, p)

Podstawowe pojęcia Badanie Przygotowanie zbioru dane1=dane_los[dane_los$m5==1, ] #WE dane2=dane_los[dane_los$m5==2, ] #WIGE dane3=dane_los[dane_los$m5==3, ] #WGM dane4=dane_los[dane_los$m5==4, ] #WT dane5=dane_los[dane_los$m5==5, ] #WZ

Podstawowe pojęcia Badanie Tablica: Częstości Wydział Populacja Próba N Tak Nie n Tak Nie WE 112 96 16 18 17 1 WIGE 28 24 4 7 6 1 WGM 58 45 13 13 12 1 WT 22 20 2 4 4 0 WZ 88 75 13 20 18 2 Źródło: opracowanie własne.

Estymator Horwitza-Thompsona Estymator regresyjny Estymator Horwitza-Thompsona ŷ HT d = i s d y i π i, (1) gdzie: π i - prawdopodobieństwo wylosowania i-tego elementu do próby.

Estymator Horwitza-Thompsona Estymator regresyjny Jak w R? Funkcja: E.SI(N, n, y) Argumenty: N - wielkość populacji, n - wielkość próby, y - wektor zawierający dane jednostkowe zmiennej objaśnianej. Wynik: wartość wyestymowana, wariancja, współczynnik zmienności.

Estymator Horwitza-Thompsona Estymator regresyjny Przykład Estymacja liczby osób, które odbyły praktykę zgodnie z regulaminem na Wydziale Gospodarki Międzynarodowej. E.SI(N=58, n=nrow(dane3), dane3$q1_tak) y Estimation 53.538462 Variance 15.443787 CVE 7.340253

Estymator Horwitza-Thompsona Estymator regresyjny GREG ŷ GREG d = ŷ HT d + ˆβ d (x d ˆx HT d ), (2) gdzie: ˆβ d - współczynnik regresji między zmienną objaśnianą, a zmiennymi dodatkowymi.

Estymator Horwitza-Thompsona Estymator regresyjny Jak w R? Funkcja: E.Beta(y, x, Pik, ck=1, b0=false) GREG.SI(N, n, y, x, tx, b, b0=false) Argumenty: x - macierz zawierająca zmienne dodatkowe, Pik - wektor prawdopodobieństw dostania się do próby, ck - wektor wag, tx - wielkość populacji zmiennych dodatkowych, b0 - wyraz wolny. Wynik: wartość wyestymowana, wariancja, współczynnik zmienności.

Estymator Horwitza-Thompsona Estymator regresyjny Przykład Estymacja liczby osób, które odbyły praktykę zgodnie z regulaminem na Wydziale Gospodarki Międzynarodowej z wykorzystaniem zmiennych dodatkowych: płeć oraz doświadczenie. dane_pom=cbind(dane3$q3, dane3$m1) b=e.beta(dane3$q1_tak,dane_pom,dane3$p,b0=t) GREG.SI(58,nrow(dane3),dane3$q1_tak,dane_pom,58,b,b0=T) y Estimation 58.000000 Variance 13.384615 CVE 6.307757

Broad Area Ratio Estimator Broad Area Ratio Estimator (BARE) ŷd BARE = ŷ d HT N n d, (3) gdzie: N - populacja dużego obszaru, n d - populacja małego obszaru.

Broad Area Ratio Estimator Jak w R? BARE.SI=function(N, n, nd, y){ Total <- matrix(na, nrow = 3, ncol = 1) rownames(total) = c("estimation", "Variance", "CVE") colnames(total) = "y" ht=e.si(n, n, y) BARE=(ht[1,1]/N)*nd var=((nd/n)^2)*ht[2,1] Cve=100*sqrt(var)/BARE Total[,1]=c(BARE, var, Cve) return(total) }

Broad Area Ratio Estimator Przykład Estymacja liczby osób, które odbyły praktykę zgodnie z regulaminem na Wydziale Gospodarki Międzynarodowej z wykorzystaniem wiedzy na temat całej populacji. BARE.SI(N=308, n=62, nd=58, dane_los$q1_tak) y Estimation 53.322581 Variance 3.265668 CVE 3.389026

Zastosowanie Statystyka Małych Obszarów wykorzystywana jest w sytuacjach, w których tradycyjne metody okazują się niewydolne i nieekonomiczne, kiedy istnieje zapotrzebowanie na informację na niskim poziemie agregacji przestrzennej, przy ograniczonym budżecie.

W prezentacji został przedstawiony zarys SMO oraz randomizacyjne podejście do estymacji. Oprócz niego w SMO wyróżnia się także: podejście modelowe, podejście bayesowskie. O czym innym razem...

Australian Bureau of Statistics, 2006, A Guide to Small Area Estimation, Australia. Paradysz J., 2009, Kryteria dobroci estymacji dla małych obszarów, Poznań. Rao J.N.K., 2003, Small Area Estimation, John Wiley & Sons, New York. Żądło T., 2008, Elementy statystyki małych obszarów z programem R, Wydawnictwo Akademii Ekonomicznej im. Karola Adamieckiego, Katowice.

Dziękuje za uwagę.