Tomasz Żądło (2008), Elementy statystyki małych obszarów z programem R, Akademia Ekonomiczna w Katowicach, Katowice, 202 strony. ISBN 978-83-7246-863-5
Spis treści Wprowadzenie... 7 1. Zagadnienia wstępne... 9 1.1. Podstawowe definicje... 1.2. Wstęp do podejścia randomizacyjnego... 1.3. Wstęp do podejścia modelowego... 1.4. Wybrane modele nadpopulacji... 1.5. Podstawowe pojęcia w statystyce małych obszarów... 1.6. Wybrane zastosowania statystyki małych obszarów... 2. Metody demograficzne... 49 2.1. Metody rachunku symptomatycznego... 2.2. Metoda współczynników ruchu demograficznego i jej modyfikacja 2.3. Model alokacji proporcjonalnej... 2.4. Regresyjne metody symptomatyczne... 3. Elementy podejścia randomizacyjnego... 57 3.1. Wybrane estymatory bezpośrednie... 3.2. Wybrane estymatory pośrednie... 3.3. Estymatory złożone... 3.4. Ocena precyzji i dokładności estymacji... 3.5. Analiza Monte Carlo... 4. Elementy podejścia modelowego... 95 4.1. Predyktory typu BLU... 4.2. Przykładowe predyktory bezpośrednie typu BLU... 4.3. Przykładowe predyktory pośrednie typu BLU... 4.4. Predyktory typu EBLU... 4.5. Ocena elementów macierzy wariancji i kowariancji*... 4.6. Błąd średniokwadratowy predyktora typu EBLU... 4.7. Estymatory błędu średniokwadratowego predyktora typu EBLU... 4.8. Przykładowe predyktory typu EBLU*... 4.9. Analiza Monte Carlo... 5. Elementy podejścia mieszanego... 137 5.1. Estymatory kalibrowane wartości globalnej w populacji... 5.2. Ogólne estymatory regresyjne wartości globalnej w domenie przy nieznanych wartościach globalnych cech dodatkowych w domenie...
5.3. Ogólne estymatory regresyjne wartości globalnej w domenie przy znanych wartościach globalnych cech dodatkowych w domenie... 5.4. Zmodyfikowane ogólne estymatory regresyjne wartości globalnej w domenie... 6. Elementy podejścia bayesowskiego... 149 6.1. Podstawowe definicje... 6.2. Elementy klasycznego wnioskowania bayesowskiego... 6.3. Elementy empirycznej estymacji bayesowskiej... 6.4. Elementy hierarchicznej estymacji bayesowskiej... 7. Dodatek... 161 7.1. Populacja powiatów w województwie śląskim... 7.2. Definicje... 7.3. Wprowadzenie do analizy danych z programem R... 7.4 Analiza Monte Carlo dokładności estymatorów... 7.5 Analiza Monte Carlo dokładności predyktorów... 7.6. Dokładność i precyzja estymatorów i predyktorów - interpretacje.. Bibliografia... 195
Bibliografia Bolfarine, H., Zacks, S. (1992), Prediction theory for finite populations, Springer- Verlag, New York. Bracha, Cz. (1993), Properties of total value estimators for domains in two-stage sample surveys, w: Small area Statistics and Survey. International Scientific Conference Warsaw 30 September 3 October 1992. Volume II. Contributed papers and panel discussion, Central Statistical Office of Poland, Warsaw, 169-183. Bracha, Cz. (1994), Metodologiczne aspekty badania małych obszarów, Studia i Materiały, Z Prac ZAkładu Badań Statystyczno- Ekonomicznych, nr 43, GUS, Warszawa. Bracha, Cz. (1996), Teoretyczne podstawy metody reprezentacyjnej, PWN, Warszawa. Bracha, Cz. (1998), Metoda reprezentacyjna w badaniu opinii publicznej i marketingu, Efekt, Warszawa. Cantoni, E., Ronchetti, E. (2001), Robust inference for generalized linear models, Journal of the American Statistical Association, 96, 1022-1030. Cassel, C.M., Särndal, C.E., Wretman J.H. (1977), Foundations of inference in survey sampling, John Wiley & Sons, New York London Sydney Toronto. Chambers, R.L. (1986), Outlier robust finite population estimation, Journal of the American Statistical Association, 81, 1063-1069. Chattopadhyah, M., Lahiri, P., Larsen, M., Reimnitz, J. (1999), Composite Estimation of drug prevalences for sub-state areas,
Survey Methodology, 25, 81-86. Das, K., Jiang, J., Rao, J.N.K (2004), Mean squared error of empirical predictor, The Annals of Statistics, 32, 818-840. Datta, G. S., Lahiri, P. (2000), A unified measure of uncertainty of estimated best linear unbiased predictors in small area estimation problems, Statistica Sinica, 10, 613-627. Dehnel, G. (1997), Estymacja wskaźników rozwoju gospodarczego regionów za pomocą statystyki małych obszarów, w: Paradysz J. (red.) Statystyka regionalna, Sondaż i integracja baz danych, Akademia Ekonomiczna w Poznaniu, Urząd Statystyczny w Poznaniu, 99-109. Dehnel, G. (2003), Statystyka małych obszarów jako narzędzie oceny rozwoju ekonomicznego regionów, Wydawnictwo Akademii Ekonomicznej w Poznaniu, Poznań. Deville, J.C., Särndal, C.E. (1992), Calibration estimators in survey sampling, Journal of the American Statistical Association, 87, 376-382. Dol, W. (1991), Small area estimation: a synthesis between sampling theory and econometrics, Wolters-Noordhoff Groningen. Domański, Cz., Pruska, K. (1996), Reprezentatywność próby w statystyce małych obszarów, Wiadomości Statystyczne, 5, 11-16. Domański, Cz., Pruska, K. (1997), Prognozowanie w przedsiębiorstwie z wykorzystaniem statystyki małych obszarów, w: Cieślak M. (red.), Prognozowanie w zarządzaniu firmą, Materiały konferencyjne, Akademia Ekonomiczna we Wrocławiu, Wrocław, 49-56. Domański Cz. i Pruska K. (2000), Nieklasyczne metody statystyczne,
PWE, Warszawa Domański, Cz., Pruska, K. (2001), Metody statystyki małych obszarów, Wydawnictwo Uniwersytetu Łódzkiego, Łódź. Efron B. and Morris C. (1973), Stein s estimation rule and its competitors An empirical bayes approach, Journal of the American Statistical Association, Vol. 68, 117-130. Estevao, V., Hidiroglou, M.A., Särndal, C.E (1995), Methodological Principles for Generalized Estimation Systems at Statistics Canada, Journal of Official Statistic, 11, 181-204. Ericksen, E.P. (1973), A method for combining sample survey data and asymptomatic indicators to obtain population estimates for local areas, Demography, 11, 137-160. Fuller, W.A.(1976), Introduction to statistical time series, John Wiley & Sons, New York London Sydney Toronto. Getka-Wilczyńska, E. (2000a), Estymacja zjawisk rzadkich w populacji skończonej, praca doktorska, SGH, Warszawa. Getka-Wilczyńska, E. (2000b), Estimation of total domain in finite population, Statistics in Transition, 4, 711-728. Gołata, E. (2004), Estymacja pośrednia bezrobocia na lokalnym rynku pracy, Prace habilitacyjne, Wydawnictwo Akademii Ekonomicznej w Poznaniu, Poznań. Gismondi, R. (1999), Estimation of tourist flows for the Veneto s communes, w: Small Area Estimation, International Association of Survey Statisticians Satellite Conference Proceedings, Riga 20-21 August 1999, Latvia, 239-244. Gonzalez, M.E. (1973), Use nad evaluation of synthetic estimates,
Proceedings of the Social Statistics Section, American Statistical Association, pp.33-36. Greń J. (1972), Gry statystyczne i ich zastosowania, PWE, Warszawa Harvey, J. (1999), Application of satellite remote sensing to small area population estimation, w: Small Area Estimation, International Association of Survey Statisticians Satellite Conference Proceedings, Riga 20-21 August 1999, Latvia, 65-80. Harville, D.A. (1977), Maximum likelihood approaches to variance component estimation and to related problems, Journal of the American Statistical Association, 72, 322-340. Henderson, C.R. (1950), Estimation of genetic parameters (Abstract), Annals of MathematicalStatistics, 21, 309-310. Henderson, C.R. (1963), Selection index and expected genetic advance, w: Statistical genetics and plant breeding, National Academy of Science, National Research Council, Publication 982, Washington, DC, 141-163. Henderson, C.R. (1975), Best linear unbiased estimation and prediction under a selection model, Biometrics, 31, 423-447. Jiang, J. (1996), REML estimation: Asymptotic behavior and related topics, The Annals of Statistics, 24, 255-286. Jiang, J., Lahiri, P., Wan S-M. (2002), A unified jackknife theory for empirical best prediction with M-estimation, The Annals of Statistics, 30, 1782-1810. Jiang, J., Zhang, W. (2001), Robust estimation in generalised linear mixed models, Biometrika, 88, 753-765. Kackar, R.N., Harville, D.A. (1981), Unbiasedness of two-stage
estimation and prediction procedures for mixed linear models, Communications in Statistics, Series A, 10, 1249-1261. Kackar, R.N. i Harville, D.A. (1984), Approximations for standard errors of estimators of fixed and random effects in mixed linear models, Journal of the American Statistical Association, 79, 853-862. Kish, L. (1965), Survey sampling, John Wiley & Sons, New York Kordos, J. (1997), Efektywne wykorzystanie statystyki małych obszarów, Wiadomości Statystyczne, 1, 11-19. Kordos, J. (1999), Problemy estymacji danych dla małych obszarów, Wiadomości Statystyczne, 1, 85-101. Kordos, J., Kubacki, J. (1999), Możliwości oceny rozmiarów ubóstwa dla małych obszarów, Wiadomości Statystyczne, 3, 5-15. Kott, P.S. (1989), Robust small domain estimation using random effects modeling, Survey Methodology, 15, 3-12. Kubacki, J. (1997), Ważniejsze metody estymacji w statystyce małych obszarów, Wiadomości Statystyczne, 5, 13-21. Lahiri, P., Rao, J.N.K (1995), Robust estimation of mean squared error of small area estimators, Journal of the American Statistical Association, 90, 758-766. Little, R.J.A. (1982), Models for nonresponse in sample surveys, Journal of the American Statistical Association, 77, 237-250. Malec, D., Sedransk, J., Moriarity, C. L., LeClere F. B. (1997), Small area inference for binary variables in the National Health Review Survey, Journal of the American Statistical Association, 92, 815-826. McCullagh, P., Nelder, J.A. (1990), Generalized linear models, Chapman & Hall/CRC, Boca, Raton, London, New York, Washington.
Morrison, P.A., Relles, D.A. (1975), A method for monitoring small-area population changes in cities, Public Data Use, 3, 10-15. O Hagan, A. (1994), Bayesian inference, Kendall s Advanced Theory of Statistics, volume 2 B, Wiley & Sons, New York. Pannekoek, J., de Waal, T. (1998), Small area estimators in statistical disclosure control, Research paper no. 9805, Statistics Netherlands. Paradysz, J. (1997a), Systemy informacji przestrzennej jako źródła zasila nia w statystyce regionalnej, [w:] Prace z zakresu statystyki i demografii, red. J.Paradysz, Zeszyty Naukowe nr 251, Wydawnictwo Akademii Ekonomicznej w Poznaniu, s.16-28. Paradysz, J. (1997b), Integraca komputerowych baz danych stare koncepcje i nowe perspektywy, [w] Statystyka regionalna. Sondaż i integracja baz danych, Wydawnictwo Urzędu Statystycznego w Poznaniu, Poznań, s.245-254. Pawłowski, Z (1972), Wstęp do statystycznej metody reprezentacyjnej, PWN, Warszawa. Pekasiewicz, D. (2000), Zastosowanie metod sekwencyjnych w statystyce małych obszarów, Praca doktorska, Uniwersytet Łódzki, Łódź. Pffefermann, D. (1993), The role of sampling weights when modeling survey data, International Statistical Review, 61, 317-337. Pfefferman, D., Moura, F., Silva, P.N. (2001), Multi-level modeling under informative probability sampling, w: Invited papers, IASS topics, Seoul, August 22-29, 505-524. Prasad, N.G.N, Rao, J.N.K. (1990), The estimation of mean the mean squared error of small area estimators, Journal of the American Statistical Association, 85, 163-171.
Prasad, N.G.N, Rao, J.N.K. (1999), On robust small area estimation using a simple random effects model, Survey Methodology, 25, 67-72. Pruska, K. (2003), Badanie istotności różnicy pomiędzy średnią dla populacji i średnią dla małego obszaru, w: Metoda reprezentacyjna w badaniach ekonomiczno-społecznym, pod. red. J.Wywiała, 141-155. R Development Core Team (2006), R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, Austria, URL http://www.r-project.org. Rao, J.N.K (1994), Estimating Totals and Distribution Functions Using Auxiliary Information at the Estimation Stage, Journal of Official Statistics, 10, 153-165. Rao, J.N.K. (1999), Some recent advances in model-based small area estimation, Survey Methodology, 25, 175-186. Rao, J.N.K. (2003), Small area estimation. John Wiley & Sons, New York. Rao, J.N.K (2005), Inferential issues in small area estimation: some new developments, Statistics in Transition, Vol 7, No. 3, 513-526. Rao, T.V.H. (1962), An existence theorem in sampling theory, Sankhya A, 24, 327-330. Royall, R.M. (1976), The linear least squares prediction approach to twostage sampling. Journal of the American Statistical Association, 71, 657-473. Rubin, D.B. (1976), Inference and missing data, Biometrika, 581-592. Särndal, C.E. (1993a), Design-based approaches in estimation for
domains, w: Small area statistics and survey designs, International Scientific Conference, Warsaw, 30 September 3 October 1992, Volume I. Invited papers, GUS, Warszawa, 175-189. Särndal, C.E. (1993b), Panel discussion, w: Small area statistics and survey designs, International Scientific Conference, Warsaw, 30 September 3 October 1992, Volume II. Contributed papers and panel discussion, GUS, Warszawa. Särndal, C.E., Hidiroglou, M.A. (1989), Small domain estimation: A conditional analysis, Journal of the American Statistical Association, 84, 266-275. Särndal, C.E., Swensson B., Wretman, J.H. (1989), The weighted Regression Technique for Estimating the Variance of Generalized Regression Estimator, Biometrika, 76, 527-537. Särndal, C.E., Swensson, B., i Wretman J. (1992), Model assisted survey sampling, Springer-Verlag, New York. Shao, J., Tu, D. (1995), The jackknife and bootstrap, Springer Verlag, New York Singh, A.C., Mohl, C.A. (1996), Understanding calibration estimators in survey sampling, Survey Methodology, 22, 107-115. Smith, T.M.F. (1983), On the validity of inferences from non-random samples, Journal of the Royal Statistical Society A, 146, 394-403. Som, R.K. (1996), Practical sampling techniques, Marcel Dekker Inc., New York. Steczkowski J. (1995), Metoda reprezentacyjna w badaniach zjawisk ekonomiczno-społecznych, PWN, Warszawa. Stukel, D.M., Hidiroglou, M.A., Särndal, C.E. (1996), Variance
estimation for calibration estimators: A comparison of jackknifing versus Taylor linearization, Survey Methodology, 22, 177-125. Sugden, R.A., Smith, T.M.F. (1984), Ignorable and Informative designs in survey sampling inference, Biometrika, 71, 495-506. Świercz, K. (1993), Methodological aspects of data assessment on dwelling stock for small area, w: Small area statistics and survey designs, International Scientific Conference, Warsaw, 30 September 3 October 1992, Volume II. Contributed papers and panel discussion, GUS, Warszawa, 45-54. Templeton, R. (1999), Regional business indicators using tax data, w: Small Area Estimation, International Association of Survey Statisticians Satellite Conference Proceedings, Riga 20-21 August 1999, Latvia, 147-156. Theberge, A. (1999), Extensions of calibration estimators in survey sampling, Journal of the American Statistical Association, 99, 635-644. Theberge, A. (2000), Calibration and restricted weights, Survey Methodology, 26, 99-107. Theil H. (1979), Zasady ekonometrii, PWN, Warszawa Thompson, W.A., Jr. (1962), The problem of negative estimates of variance components, Annals of Mathematical Statistics, 33, 273-289. Valliant, R. (2002), Variance estimation for the general regression estimator, Survey methodology, 28, 103-114. Valliant, R., Dorfman, A.H., Royall, R.M. (2000), Finite population sampling and inference. A prediction approach, John Wiley & Sons, New York.
Witkowski, J. (1992), Szacowanie bezrobocia dla małych obszarów, Wiadomości Statystyczne, Nr 11, 1-5. Wu, C., Sitter, R.R. (2001), A model-calibration approach to using complete auxiliary information from survey data, Journal of the American Statistical Association, 96, 185-193. Wywiał, J. (1992), Statystyczna metoda reprezentacyjna w badaniach ekonomicznych (Optymalizacja badań próbkowych), Wydawnictwo Akademii Ekonomicznej w Katowicach, Katowice. Wywiał, J. (1995), Wielowymiarowe aspekty metody repreznetacyjnej, Wydawnictwo Ossolineum, Wrocław. Wywiał, J. (1999a), Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu SPSS, Akademia Ekonomiczna w Katowicach, Katowice. Wywiał, J. (1999b), Simulation study of estimation precision of average in small populations by means of Horvitz-Thompson type sampling strategies, Proceedings of the Satellite Conference Small Area Estimation, Riga, Latvia 20-21 August, 291-296. Wywiał, J. (2003), Some contributions to multivariate methods in survey sampling, Wydawnictwo Akademii Ekonomicznej w Katowicach, Katowice. Wywiał, J., Żądło, T. (2003), On mean square error of synthetic ratio estimator, Studia Ekonomiczne, Akademia Ekonomiczna w Katowicach, Katowice, 167-175. Wywiał, J., Żądło, T. (2004), On some robust against outliers predictor of total value in small domain, Folia Oeconomica, 105, Wydawnictwo Uniwersytetu Łódzkiego, 107-113. Zasępa, R. (1972), Metoda reprezentacyjna, PWE, Warszawa
Żądło, T. (2003a), On some -unbiased predictor of vector of total values in population. w: Metoda Reprezentacyjna w Badaniach Ekonomicznych- Społecznych, red. J.Wywiał, Akademia Ekonomiczna w Katowicach, Katowice, s.233-248. Żądło, T. (2003b), On synthetic regression estimator based on superpopulation approach, w: Metoda reprezentacyjna w badaniach ekonomiczno-społecznych, Cześć 2, red. J. Wywiał, Akademia Ekonomiczna w Katowicach, Katowice, 55-77. Żądło, T. (2004a), On unbiasedness of some EBLU predictor. In: Proceedings in Computational statistics 2004, Antoch J. (red.), Physica-Verlag, Heidelberg-New York, 2019-2026. Żądło, T. (2004b), On mean square error of synthetic regression estimator, Folia Oeconomica, 105, Wydawnictwo Uniwersytetu Łódzkiego, 73-90. Żądło, T. (2004c), O pewnym predyktorze wartości globalnej w małym obszarze w przypadku losowania warstwowego, XX Seminarium Ekonometryczne im. Profesora Zbigniewa Pawłowskiego, pod red. A Zeliasia, Akademia Ekonomiczna w Krakowie, 2004, 385-402. Żądło, T. (2004d), On some calibration estimators based on superpopulation approach, Taksonomia 11, Klasyfikacja i analiza danych teoria i zastosowania, Prace Naukowe Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław, 431-440. Żądło, T. (2004e), On some linear and bilinear predictors of total value in incompletely specified domains. w: Metoda reprezentacyjna w badaniach ekonomiczno-społecznych, Cześć 3, red. J. Wywiał, Akademia Ekonomiczna w Katowicach, Katowice, 77-106.
Żądło T. (2005), On synthetic ratio estimator based on superpopulation approach, Folia Oeconomica, 194, Wydawnictwo Uniwersytetu Łódzkiego, s.81-96. Żądło T. (2006a), On accuracy of EBLUP under random regression coef ficient model, Statistics in Transition, Vol. 7, No. 6, pp. 887 903. Żądło T. (2006b), On prediction of total value in incompletely specified domains, Australian and New Zealand Journal of Statistics, 48 (3), 269-283.