ESTYMACJA PRZYCHODU PRZEDSI BIORSTW NA PODSTAWIE MODELU FAYA-HERRIOTA 4

Podobne dokumenty
STRUKTURALNE MODELE SZEREGÓW CZASOWYCH W ESTYMACJI STOPY BEZROBOCIA W DEZAGREGACJI NA WOJEWÓDZTWA,

I Kolokwium z Ekonometrii. Nazwisko i imi...grupa...

estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń

Rynek motoryzacyjny 2011 Europa vs Polska

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci

Dobór modelu a obciążenie szacunku na przykładzie estymatora GREG w badaniu małych przedsiębiorstw

Niepełnosprawność w świetle estymacji pośredniej na przykładzie województwa wielkopolskiego

Statystyka Małych Obszarów w badaniach próbkowych

DIAGNOZOWANIE STANÓW ZDOLNO CI JAKO CIOWEJ PROCESU PRODUKCYJNEGO

Taksonomiczne aspekty estymacji pośredniej uwzględniającej autokorelację przestrzenną w statystyce gospodarczej

Nadwyka operacyjna w jednostkach samorzdu terytorialnego w latach

PRZESTRZENNO-CZASOWE MODELOWANIE ZMIENNO CI PRODUKCJI PRZEDSI BIORSTW W POLSCE 1

PORÓWNANIE METODY REDNIEJ ORAZ REDNIEJ WA ONEJ KONSTRUOWANIA INDEKSÓW CEN NIERUCHOMO CI MIESZKANIOWYCH

Biostatystyka, # 5 /Weterynaria I/

Uniwersytet Ekonomiczny w Poznaniu

Poprawa efektywnoci metody wstecznej propagacji bdu. Jacek Bartman

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

MOC TESTÓW NIEZALE NO CI W TABLICY DWUDZIELCZEJ WI KSZEJ NI 2 2

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

KOSZTY PLANOWEJ OBSŁUGI TECHNICZNEJ CIGNIKÓW ROLNICZYCH NOWEJ GENERACJI

ZASTOSOWANIE ODCINKOWO-LINIOWEGO MINIMODELU DO MODELOWANIA PRODUKCJI SPRZEDANEJ PRZEMYSŁU

Instrumenty rynku pracy dla osób poszukuj cych pracy, aktualnie podlegaj cych ubezpieczeniu spo ecznemu rolników w pe nym zakresie.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wymierne korzyci wynikajce z analizy procesów

Spis treści 3 SPIS TREŚCI

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Pi lat programu promocji kultury przedsibiorczoci PRZEDSI BIORSTWO FAIR PLAY

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

OBCI ENIE PROGNOZ STRUKTURY UZYSKANYCH PRZY POMOCY A CUCHÓW MARKOWA

Wprowadzenie: Krystyna Gurbiel Dyrektor Generalny Polskiej Fundacji Promocji i Rozwoju Ma"ych i (rednich Przedsi)biorstw Streszczenie...

KONKURENCJA DOSKONA!A

STATYSTYKA MATEMATYCZNA

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

Testy nieparametryczne

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Monte Carlo, bootstrap, jacknife

5. Model sezonowości i autoregresji zmiennej prognozowanej

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka matematyczna

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

OP ATY ZA US UG ZBIOROWEGO ODPROWADZANIA I OCZYSZCZANIA CIEKÓW A ZASADA SPRAWCA ZANIECZYSZCZENIA P ACI

Zeszyty Naukowe UNIWERSYTETU PRZYRODNICZO-HUMANISTYCZNEGO w SIEDLCACH Nr 95 Seria: Administracja i Zarz dzanie 2012

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Ekonometria - wykªad 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

In»ynierskie zastosowania statystyki wiczenia

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE

Banki spółdzielcze na tle systemu finansowego w Polsce

Zastosowanie rozk adów stabilnego, hiperbolicznego i odwrotnego gaussowskiego do opisu dziennych stóp zwrotu indeksów gie d europejskich

WYKORZYSTANIE ROZ O ENIA POTOKU RUCHU DO WYBRANYCH ELEMENTÓW ORGANIZACJI KOLEJOWYCH PRZEWOZÓW TOWAROWYCH

Kryteria dla Dziaania 3.2

ANALIZA I OCENA SYTUACJI NA RYNKU PRACY W WOJEWÓDZTWIE WI TOKRZYSKIM W 2008 ROKU

Projektowanie (design) Eurostat

Metoda reprezentacyjna

URZĄD STATYSTYCZNY W WARSZAWIE ul. 1 Sierpnia 21, Warszawa PRODUKT KRAJOWY BRUTTO W WOJEWÓDZTWIE MAZOWIECKIM W LATACH

W Y B R A N E P R O B L E M Y I N Y N I E R S K I E ALGORYTM STEROWANIA ADAPTACYJNEGO HYBRYDOWEGO POJAZU KOŁOWEGO

POPYT NA PRACĘ W WOJEWÓDZTWIE WIELKOPOLSKIM W 2013 R.

NOWOCZESNE ROZWI ZANIA IT KLUCZEM DO ZDOBYCIA PRZEWAGI KONKURENCYJNEJ PRZEDSI BIORSTW PRZEMYSŁU ROLNO-SPO YWCZEGO W POLSCE

Bezrobotni według rodzaju działalności ostatniego miejsca pracy w województwie zachodniopomorskim w 2017 roku

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Estymacja punktowa i przedziałowa

Próba własności i parametry

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

ESTYMACJA WARIANCJI ARYTMETYCZNEGO RUCHU BROWNA NA PODSTAWIE ZNANYCH WARTO CI MINIMUM, MAKSIMUM, KO COWEJ ORAZ DRYFU 1

ARKUSZ EGZAMINACYJNY ETAP PRAKTYCZNY EGZAMINU POTWIERDZAJ CEGO KWALIFIKACJE ZAWODOWE CZERWIEC 2011

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Planowanie adresacji IP dla przedsibiorstwa.

Art. 1. W ustawie z dnia 20 pa dziernika 1994 r. o specjalnych strefach ekonomicznych (Dz. U. z 2007 r. Nr 42, poz. 274) wprowadza si nast puj ce

DZIAŁALNO INNOWACYJNA I JEJ FINANSOWANIE W SEKTORZE MAŁYCH I REDNICH PRZEDSI BIORSTW W WOJEWÓDZTWIE ZACHODNIOPOMORSKIM

W1. Wprowadzenie. Statystyka opisowa

Logistyka - nauka. Polski sektor TSL w latach Diagnoza stanu

ROLA INFRASTRUKTURY W ASPEKCIE ZRÓWNOWA ONEGO SYSTEMU TRANSPORTU

O PREDYKCJI WARTO CI GLOBALNEJ W DOMENIE Z WYKORZYSTANIEM INFORMACJI O ZMIENNYCH DODATKOWYCH PRZY ZA O ENIU MODELU FAYA-HERRIOTA

U Z A S A D N I E N I E

Elementy pneumatyczne

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Liczby rzeczywiste poziom Arkusz podstawowy

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

! "#$%&$&'()(*+',-&./#0%($',%,+./#0! +,1&%($',%,#"&2

Ekonometryczna analiza popytu na wodę

ZMIANY W KRZYWIZNACH KRGOSŁUPA MCZYZN I KOBIET W POZYCJI SIEDZCEJ W ZALENOCI OD TYPU POSTAWY CIAŁA WSTP

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Podmioty gospodarki narodowej w województwie małopolskim

ODPOWIEDZI I SCHEMAT PUNKTOWANIA ZESTAW NR 2 POZIOM PODSTAWOWY. 1. x y x y

Obraz regionalnego rynku pracy w świetle danych GUS oraz badań własnych pracodawców

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Bezrobotni według rodzaju działalności ostatniego miejsca pracy w województwie zachodniopomorskim w 2015 r.

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

EKONOMICZNY PLAN PROJEKTU

Dyskretyzacja sygnałów cigłych.

Transkrypt:

PRZEGLD STATYSTYCZNY R. LXIV ZESZYT 1 2017 GRAYNA DEHNEL 1, MICHA PIETRZAK 2, UKASZ WAWROWSKI 3 ESTYMACJA PRZYCHODU PRZEDSIBIORSTW NA PODSTAWIE MODELU FAYA-HERRIOTA 4 1. WPROWADZENIE Badania reprezentacyjne, prowadzone przez Gówny Urzd Statystyczny (GUS), s jednym z najwaniejszych róde informacji o miesicznych charakterystykach sektora maych przedsibiorstw. Wybór przekrojów, w jakich szacowane mog by parametry, determinowany jest przez takie aspekty jak rozmiar próby, schemat badania czy metoda szacunku. Badania statystyczne prowadzone przez GUS metod reprezentacyjn z reguy opieraj si na próbach, umoliwiajcych ocen parametru dla stosunkowo duych jednostek terytorialnych i przedmiotowych. W badaniu DG1, bdcym najwikszym badaniem z zakresu statystyki krótkookresowej przedsibiorstw, próba pozwala na precyzyjne szacunki parametrów jedynie na poziomie województw lub w przekroju sekcji PKD. Zejcie na niszy poziom agregacji, przy zachowaniu klasycznego podejcia, prowadzi do znacznego spadku precyzji szacunku oraz wzrostu obcienia. Utrzymanie jednak estymacji na poziomie NTS 2, wobec zgaszanego zapotrzebowania na szczegóow informacje, nie jest moliwe. Zmiana metodyki badania w kierunku zwikszenia liczebnoci próby wizaaby si przede wszystkim ze wzrostem kosztów badania oraz wydueniem czasu jego realizacji. Std te raczej powinny by brane pod uwag rozwizania zmierzajce w kierunku odejcia od klasycznych metod estymacji, na rzecz chociaby estymacji poredniej, proponowanej przez statystyk maych obszarów. W przeciwiestwie do klasycznych estymatorów, estymatory porednie wykorzystuj dodatkowe róda danych zawierajce informacje o tak zwanych zmiennych pomocniczych, wspomagajcych szacunek. Popraw precy- 1 Uniwersytet Ekonomiczny w Poznaniu, Wydzia Informatyki i Gospodarki Elektronicznej, Katedra Statystyki, al. Niepodlegoci 10, 61-875 Pozna, Polska, Urzd Statystyczny w Poznaniu, ul. Wojska Polskiego 27/29, 60-624 Pozna, autor prowadzcy korespondencj e-mail: grazyna.dehnel@ue.poznan.pl. 2 Uniwersytet Ekonomiczny w Poznaniu, Wydzia Informatyki i Gospodarki Elektronicznej, Katedra Statystyki, al. Niepodlegoci 10, 61-875 Pozna, Polska, Urzd Statystyczny w Poznaniu, ul. Wojska Polskiego 27/29, 60-624 Pozna. 3 Uniwersytet Ekonomiczny w Poznaniu, Wydzia Informatyki i Gospodarki Elektronicznej, Katedra Statystyki, al. Niepodlegoci 10, 61-875 Pozna, Polska, Urzd Statystyczny w Poznaniu, ul. Wojska Polskiego 27/29, 60-624 Pozna. 4 Projekt finansowany ze rodków Narodowego Centrum Nauki przyznanych na podstawie decyzji numer DEC-2015/17/B/HS4/00905.

80 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski zji uzyskuje si poprzez poyczanie mocy spoza badanej domeny studiów lub spoza badanego przedziau czasowego. Takie podejcie umoliwia estymacj parametrów dla bardzo maych jednostek, nawet przy tzw. zerowej próbie w przypadku niektórych wyrónionych domen. Szersza aplikacja nieklasycznych metod w badaniach statystycznych wymaga prowadzenia szeregu bada empirycznych w celu oceny wasno- ci estymatorów porednich. W artykule zaproponowano wykorzystanie w estymacji podejcia typu model-based na poziomie obszaru. Celem badania by szacunek rocznych przychodów maych przedsibiorstw w przekroju województw oraz sekcji PKD w oparciu o model Faya-Herriota (Fay, Herriot, 1979). W estymacji, w celu poprawy jakoci szacunku, uwzgldniono zmienne pomocnicze, których ródem byy rejestry administracyjne Ministerstwa Finansów oraz ZUS. Niniejsza publikacja zostaa podzielona na cztery czci. Pierwsza z nich zawiera charakterystyk wykorzystanych w pracy zbiorów danych, druga opis przeprowadzonego badania empirycznego. W czci trzeciej przedstawiono teoretyczne podstawy analizowanych metod szacunku. Ostatni cz powicono rezultatom badania empirycznego. 2. RÓDA DANYCH DO BADANIA Badanie empiryczne oparto na danych pochodzcych z badania statystycznego DG1. Podlegaj mu przedsibiorstwa, w których liczba pracujcych jest nie mniejsza ni 10 osób. Operat losowania zawiera 98 tysicy jednostek, przy czym 19 tysicy to przedsibiorstwa rednie oraz due, a pozostaych 80 tysicy jednostek to mae przedsibiorstwa. Badaniem objta jest 10-procentowa próba maych jednostek oraz wszystkie rednie i due podmioty gospodarcze. Oznacza to, e próba liczy okoo 30 tysicy przedsibiorstw. Badanie prowadzone jest z czstotliwoci miesiczn. Dostarcza informacji m.in. na temat takich zmiennych, jak przychód, koszt, wynagrodzenia, liczba zatrudnionych pracowników, wielko sprzeday hurtowej oraz detalicznej, podatek akcyzowy, dotacje podmiotowe. 3. CHARAKTERYSTYKA BADANIA W przeprowadzonym badaniu empirycznym ograniczono si do maych przedsibiorstw (liczba pracujcych zawarta jest w przedziale od 10 do 49 osób). Dane dotyczyy jednostek aktywnie dziaajcych w grudniu 2012 roku. W pracy rozpatrzono modele dla dwóch zmiennych objanianych. Pierwsz z nich byy przychody netto ze sprzeday produktów (wyrobów i usug wasnej produkcji) SW. Za drug zmienn objanian natomiast przyjto przychody netto ze sprzeday towarów i materiaów SH. Obydwie zmienne wyraaj warto przychodu (w tysicach zotych) uzyskan przez przedsibiorstwo w 2012 roku. Jako zmienne pomocnicze w obydwu modelach uwzgldniono przychód oraz liczb pracujcych. ródem informacji o nich

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 81 byy odpowiednio: rejestr administracyjny Ministerstwa Finansów oraz rejestr ZUS, wedug stanu na grudzie 2011 roku. Przyjcie takiego schematu badania wynikao z dostpnoci danych administracyjnych z jak spotyka si GUS w praktyce bada statystycznych. Wykorzystanie zasobów rejestrów cigle bowiem uzalenione jest od pewnych ogranicze. Jednym z nich jest przesunicie czasowe, jakie obserwujemy pomidzy okresem, którego dotycz dane, a okresem, w którym s udostpnione statystyce publicznej. W przeprowadzonym badaniu empirycznym zostao to uwzgldnione wanie przy doborze zmiennych pomocniczych. Wartoci przychodu SW i SH oszacowano w przekroju 16 województw oraz wybranych 8 sekcji Polskiej Klasyfikacji Dziaalnoci (PKD) 5 : Przetwórstwo przemysowe (przemys), Dostawa wody, gospodarowanie ciekami i odpadami oraz dziaalno zwizana z rekultywacj (gospodarka wodna), Budownictwo (budownictwo), Handel hurtowy i detaliczny, naprawa pojazdów samochodowych (handel), Transport i gospodarka magazynowa (transport), Dziaalno zwizana z zakwaterowaniem i usugami gastronomicznymi (zakwaterowanie), Dziaalno w zakresie usug administrowania i dziaalno wspierajca (administrowanie), Dziaalno zwizana z kultur, rozrywk i rekreacj (kultura). Gównym celem badania bya ocena moliwoci wykorzystania modelu Faya- Herriota (FH) do szacunku rednich rocznych przychodów maych przedsibiorstw, w przekroju województw oraz sekcji PKD. Oceny dokonano biorc pod uwag dwie podstawowe wasnoci estymatorów: efektywno i obcienie. Efektywno oszacowa przeanalizowano przyjmujc jako punkt odniesienia klasyczne, bezporednie podejcie reprezentowane przez estymacj Horvitza-Thompsona (HT). Porównanie ocen estymatora bezporedniego (HT) i poredniego (model FH) pozwolio na przeanalizowanie wpywu zastosowania nieklasycznej metody estymacji na precyzj szacunku. Na potrzeby niniejszego badania empirycznego jako miar precyzji oszacowa uzyskanych na podstawie estymatora HT oraz modelu FH przyjto wspóczynnik zmiennoci, okrelony jako stosunek bdu standardowego do oceny parametru. Analiza obcienia wymagaaby znajomoci wartoci szacowanych parametrów (przychodów netto ze sprzeday produktów SW oraz przychodów netto ze sprzeday towarów i materiaów SH) w populacji generalnej. Ze wzgldu na to, e w populacji generalnej znana bya jedynie warto przychodu ogóem stanowicego sum skadników SW i SH, podjto decyzj o ograniczeniu oceny wielkoci obcienia do jego przyblionej wartoci przyrównujc zmienn przychodu ogóem do sumy oszacowa otrzymanych dla parametru SW i SH (Dehnel, 2015). 5 W nawiasach podano przyjte w dalszej czci artykuu skróty nazw sekcji PKD.

82 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski 4. WYBRANE METODY ESTYMACJI 4.1. ESTYMATOR BEZPOREDNI HORVITZA-THOMPSONA Przez s oznaczmy prób wylosowan z populacji U, gdzie s d oznacza podpróbk z domeny d. Liczebnoci w domenach speniaj nastpujce ograniczenie: n d < N d, przy czym n d oznacza liczebno próby z domeny d, natomiast N d to liczebno populacji z teje domeny. Estymator bezporedni Horvitza-Thompsona (HT) zaliczany jest do grupy klasycznych estymatorów stosowanych w ramach metody reprezentacyjnej (Horvitz, Thompson, 1952). Estymator redniej w domenie d jest dany nastpujcym wzorem:, (1) gdzie: jest szacunkiem redniej wartoci cechy y w domenie d oraz to warto badanej cechy dla i-tej jednostki w d-tej domenie, natomiast, oznacza wag wynikajc ze schematu losowania dla i-tej jednostki w d-tej domenie. Powyej przedstawiony estymator bezporedni jest nieobciony i zgodny przy. Charakteryzuje si on bardzo ma efektywnoci w przypadku domen, dla których liczba jednostek w próbie jest bardzo maa. Ponadto nie jest moliwe uzyskanie szacunku dla domen niereprezentowanych przez adn jednostk w próbie ( = 0) (Guadarrama i inni, 2016). Problemy, na jakie napotykamy stosujc ten rodzaj estymacji, mona pomin wykorzystujc w badaniu metody estymacji poredniej proponowane przez statystyk maych obszarów. Ich idea polega na wzmocnieniu estymacji poprzez wykorzystanie wszelkich wiarygodnych róde informacji, takich jak: spisy powszechne, czy rejestry administracyjne. W niniejszym artykule podjto prób zastosowania jednej z metod estymacji poredniej reprezentujcej podejcie typu model- -based na poziomie obszaru modelu Faya-Herriota. 4.2. MODEL FAYA-HERRIOTA Model Faya-Herriota (1979) opracowano i po raz pierwszy wykorzystano w badaniu przeprowadzonym w USA. Jego celem by szacunek poziomu dochodu gospodarstw domowych w przekroju maych domen. Z uwagi jednak na specyfik podejcia, stosunkowo ma jego zoono, a take waciwoci empiryczne, model FH obecnie wykorzystywany jest przy szacowaniu wielu wskaników w rónych dziedzinach. Przykadem mog by badania prowadzone w ramach statystyki przedsibiorstw, czy oceny poziomu ubóstwa (Pratesi, Salvati, 2008; Wawrowski, 2014). Model FH jest budowany na poziomie obszaru i opiera si na wartociach zmiennych pomocniczych okrelonych na poziomie badanej domeny. Mona go zapisa nastpujcym wzorem:

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 83, (2) przy czym oznacza zmienn objanian wektor oszacowa bezporednich, szacowanej zmiennej, to wektor zmiennych pomocniczych, to wektor parametrów regresji, jest losowym efektem domeny, niezalenym i o identycznym rozkadzie (0, ), a jest niezalenym bdem losowania, o rozkadzie (0, ). Rozkad efektu losowego jest okrelany na podstawie modelu, natomiast parametry rozkadu wynikaj ze schematu losowania. Zakada si, e wariancja z losowania jest znana, jednak w praktyce jest ona z reguy szacowana. Podobnie jak wariancja losowego efektu, któr równie naley oszacowa. W tym celu posuy si mona szerok gam metod, takich jak metoda momentów, metoda najwikszej wiarygodnoci (ML) czy metoda najwikszej wiarygodnoci z ograniczeniami (REML). Wspomniane metody bazuj na podejciu iteracyjnym. W przypadku, gdy nie istnieje dodatnie rozwizanie parametru, wówczas przyjmuje si = 0 co oznacza, e w modelu nie ma efektów losowych. Po oszacowaniu wyej wskazanych komponentów, mona wyznaczy warto estymatora EBLUP, którego posta przedstawia si nastpujcym wzorem:, (3) gdzie oznacza oceny bezporednie szacowanej zmiennej, to wektor zmiennych pomocniczych, to wektor parametrów regresji. Z równania (3) wynika, e oceny otrzymane na podstawie modelu FH s redni waon szacunku estymatora bezpo- redniego HT oraz wartoci teoretycznych uzyskanych na podstawie modelu regresji liniowej. Wagi wyraone jako, mierz niepewno oceny szacowanego parametru otrzymanej na podstawie modelu regresji. W przypadku, gdy wariancja oszacowania na podstawie estymatora bezporedniego jest maa, warto wagi jest dua. Oznacza to, i estymator EBLUP w wikszym stopniu opiera si na szacunku bezporednim, poniewa uzyskane na jego podstawie oceny cechuj si dostateczn precyzj. W przeciwnym wypadku wikszy udzia w oszacowaniu ma warto wynikajca z modelu regresji (Boonstra, Buelens, 2011). Parametry regresji mona oszacowa zgodnie z ponisz formu:, (4) gdzie oznacza wag dla d-tej domeny, to wektor zmiennych pomocniczych, a oznacza oceny bezporednie szacowanej zmiennej. Dla domen niereprezentowanych w próbie przez adn jednostk, a take w przypadku, gdy = 0, oszacowanie porednie parametru jest równe wycznie szacunkowi otrzymanemu na podstawie modelu regresji.

84 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski 4.3. OCENA PRECYZJI OSZACOWA Jedn z podstawowych bezwzgldnych miar wykorzystywanych przy ocenie jako- ci szacunku jest redni bd kwadratowy (MSE). W celu jego wyznaczenia, w przypadku estymacji bezporedniej, posuono si linearyzacj Taylora przy zaoeniu losowania prostego. Z kolei w przypadku modelu FH wykorzystano estymator MSE opisany w monografii Rao, Moliny (2015) dany wzorem:, (5) gdzie: ( ) mierzy niepewno zwizan z planem losowania i wariancj z próby, ( ) odpowiada za bd estymacji parametrów, a skadnik ( ) odpowiada za bd estymacji wariancji efektu losowego. W artykule wykorzystano dwie róne metody oceny MSE. W podejciu bezporednim redni bd estymatora mierzony by ze wzgldu na plan losowania, a w przypadku estymacji poredniej ze wzgldu na model. Porównanie i ocena MSE na podstawie tak wyznaczonych wartoci jest jednak stosowana w literaturze przedmiotu (Benavent, Morales, 2015; Rao, Molina, 2015). Wzgldn miar jakoci szacunku opart na MSE jest wspóczynnik zmiennoci (CV), dany wzorem:. (6) Wskanik ten okrela udzia bdu estymacji w wartoci szacowanej zmiennej na poziomie domeny. W badaniach prowadzonych przez GUS oraz badaniach empirycznych przyjmuje si, e wyniki szacunków mog by uznane za wiarygodne jeli warto wspóczynnika zmiennoci nie przekracza 10%. Jeli CV przyjmuje wartoci z przedziau 10 20% szacunki powinny by interpretowane w sposób ostrony. Jeeli natomiast poziom CV jest wyszy od 20%, oceny estymatorów na analizowanym poziomie agregacji nie s uznawane za wiarygodne i mog by publikowane jedynie na wyszym poziomie agregacji (GUS 2013). 5. WYNIKI PRZEPROWADZONEGO BADANIA 5.1. ESTYMACJA PRZYCHODU Analiz rozpoczto od oceny rozkadów liczby przedsibiorstw biorcych udzia w badaniu DG1 uwzgldniajc przyjty w badaniu empirycznym poziom agregacji przestrzenno-rzeczowej.

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 85 Rysunek 1. Wielko próby maych przedsibiorstw w województwach, w przekroju sekcji PKD ródo: opracowanie wasne na podstawie danych z badania DG1. Najwiksz zmiennoci pod wzgldem wielkoci próby w województwach cechoway si sekcje: przemys (od 129 do 440 przedsibiorstw) oraz handel (od 131 do 562). Due zrónicowanie liczebnoci próby jest widoczne równie w sekcji budownictwo (od 41 do 197 jednostek). W pozostaych piciu sekcjach PKD dyspersja liczby przedsibiorstw w województwach jest zdecydowanie mniejsza, a wielko próby w adnej domenie nie przekracza 102 podmiotów gospodarczych. Relacj pomidzy wielkoci próby, a wielkoci populacji generalnej zaprezentowano na rysunku 2. Zgodnie z zao- eniami badania DG1 udzia próby w populacji ksztatuje si na poziomie okoo 10%. Rysunek 2. Porównanie wielkoci próby maych przedsibiorstw w województwach, w przekroju sekcji PKD z wielkoci populacji ródo: opracowanie wasne na podstawie danych z badania DG1.

86 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski Szacunki przeprowadzone w ramach badania empirycznego dotyczyy dwóch opisanych wyej rodzajów przychodów SW i SH. Ocen ich jakoci oparto na analizie precyzji i przyblionej wartoci obcienia. Przy ocenie precyzji jako punkt referencyjny przyjto oszacowania parametrów otrzymane na podstawie klasycznego podejcia reprezentowanego przez estymator HT. W tabeli 1 przedstawiono wybrane charakterystyki opisujce rozkady otrzymanych ocen estymatora bezporedniego w przekroju wszystkich wyrónionych w badaniu domen. Wybrane charakterystyki opisowe oszacowa bezporednich HT redniego przychodu netto ze sprzeday produktów SW i przychodu netto ze sprzeday towarów i materiaów SH w województwach, w zalenoci od sekcji PKD (w tys. z) Tabela 1. Sekcja PKD Przychody netto ze sprzeday produktów SW Przychody netto ze sprzeday towarów i materiaów SH Mediana Wsp. zmiennoci % Skono Mediana Wsp. zmiennoci % Skono Przemys 7664 22,31 0,38 1169 84,38 1,73 Gospodarka wodna 4996 42,23 1,00 355 260,91 3,71 Budownictwo 7240 23,72 0,28 339 68,84 1,91 Handel 1214 31,08 1,75 15346 40,33 3,06 Transport 9247 44,96 1,90 691 91,77 1,93 Zakwaterowanie 1981 28,65 0,70 1461 57,78 2,91 Administracja 3674 43,37 1,35 251 91,29 0,97 Kultura 1913 76,11 0,88 59 201,80 3,49 ródo: opracowanie wasne na podstawie danych z badania DG1. Widoczne s rónice w ocenie parametrów struktury przedsibiorstw pomidzy badanymi zmiennymi. Zmienna SH przychody netto ze sprzeday towarów i materiaów ksztatuje si na zdecydowanie niszym poziomie (poza sekcj handel) ni zmienna SW przychody netto ze sprzeday produktów. Ponadto w przypadku zmiennej SH obserwujemy du dyspersje oraz siln asymetri. Relacje midzy zmiennymi w poszczególnych sekcjach PKD zarówno co do poziomu przecitnego, jak i zmiennoci, czy skonoci wynikaj ze specyfiki badanej sekcji. Na rysunku 5 przedstawiono z kolei rozkad wartoci parametru charakteryzujcego precyzj szacunku zmiennych SW i SH dla maych przedsibiorstw w przekroju województw i sekcji PKD otrzymanych na podstawie estymatora bezporedniego HT. Wartoci wspóczynnika wskazuj, e dla zmiennej SW zarówno poziom przecitny, jak i dyspersja precyzji ksztatuj si na znacznie niszym poziomie ni w przypadku zmiennej SH. Mediana wskanika precyzji dla cechy SW w siedmiu z omiu anali-

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 87 zowanych sekcji PKD wynosi poniej 25%. Jednak we wszystkich sekcjach znale mona województwa, w których warto wspóczynnika zmiennoci przekracza próg 20% uznawany za granic dopuszczalnego wzgldnego bdu oszacowania. Precyzja estymacji bezporedniej dla zmiennej SH jest zdecydowanie gorsza. Jedynie dla sekcji handel CV nie przekracza 20%, w siedmiu sekcjach mona z kolei natrafi na domeny, dla których wzgldna miara precyzji przewysza 75%. Szacunki otrzymane z wykorzystaniem estymacji bezporedniej stanowiy punkt odniesienia przy ocenie estymacji redniego przychodu z wykorzystaniem modelu Faya- Herriota peniy one rol zmiennej objanianej. Jako zmienne pomocnicze wykorzystano dwie cechy: przychód oraz liczb pracujcych pochodzce z rejestrów administracyjnych. W tabeli 2 przedstawiono wybrane charakterystyki opisujce rozkady otrzymanych ocen porednich w przekroju wszystkich wyrónionych w badaniu domen. Tabela 2. Wybrane charakterystyki opisowe oszacowa porednich FH redniego przychodu netto ze sprzeday produktów SW i przychodu netto ze sprzeday towarów i materiaów SH w województwach, w zalenoci od sekcji PKD (w tys. z) Sekcja PKD Przychody netto ze sprzeday produktów SW Przychody netto ze sprzeday towarów i materiaów SH Mediana Wsp. zmiennoci % Skono Mediana Wsp. zmiennoci % Skono Przemys 7177 12,10-0,10 1017 29,72-1,45 Gospodarka wodna 4876 25,57 0,79 212 39,95-0,43 Budownictwo 6994 15,50-0,49 256 41,56-2,31 Handel 1168 19,18 1,03 15231 18,41-1,38 Transport 9035 21,16 0,37 417 31,66-0,69 Zakwaterowanie 1978 21,06 0,64 1315 18,62-0,75 Administracja 3318 42,83 1,50 100 49,66-1,45 Kultura 1879 66,25 1,31 35 52,12-0,63 ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych. Zastosowanie estymacji poredniej w gównej mierze przyczynio si do zmniejszenia wspóczynnika zmiennoci estymowanych cech. Rysunek 3 przedstawia porównanie wartoci standaryzowanych reszt z modelu Faya-Herriota oraz teoretycznych wartoci kwantyli rozkadu normalnego. Rozkad reszt z modelu odbiega od rozkadu normalnego, mona take zidentyfikowa wystpowanie obserwacji odstajcych, co jest charakterystyczne przy estymacji zmiennych opisywanych w niniejszym artykule. Pomimo niespenienia zaoenia o normalnoci reszt, oszacowania otrzymane na podstawie modelu Faya-Herriota cechuj si mniejszym bdem szacunku w porównaniu do estymacji bezporedniej (por. rysunek 5).

88 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski Rysunek 3. Porównanie wartoci reszt z modelu Faya-Herriota oraz standaryzowanych wartoci kwantyli teoretycznych ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych. Rysunek 4. Porównanie charakterystyk opisowych szacunków bezporednich HT oraz oszacowa porednich z wykorzystaniem modelu FH rednich przychodów SW i SH w województwach, w przekroju sekcji PKD ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych.

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 89 Na rysunku 4 porównano oceny zmiennych SW i SH otrzymane na podstawie obu opisanych w pracy metod. Oszacowania otrzymane na podstawie modelu FH, w kadej z omiu sekcji PKD charakteryzuj si zarówno mniejszym zrónicowaniem, jak i niszym poziomem przecitnym wyraonym za pomoc mediany ni szacunki bezporednie. Wiksze rozbienoci pomidzy estymacj bezporedni i poredni zanotowano dla zmiennej SW. Podobnie, jak w przypadku estymatora HT (por. tabela 1). Oceny otrzymane na podstawie estymatora poredniego dla sekcji handel, dla zmiennej SH (przychodu netto ze sprzeday towarów i materiaów) zdecydowanie przewyszaj oceny uzyskane dla pozostaych sekcji PKD (w sekcji handel SH od ok. 12 500, do okoo 17 500 tys. z, w przypadku pozostaych siedmiu sekcji SH nie przekracza 5 000 tys. z). Jako estymacji otrzymanych w bezporednim i porednim ujciu oceniono poprzez porównanie rozkadów wspóczynników zmiennoci (por. rysunek 5). Zastosowanie modelu FH przynioso zdecydowan popraw precyzji szacunku w przypadku zmiennej SW. Mediana wspóczynnika zmiennoci, w siedmiu sekcjach (z wyjtkiem kultury), nie przekracza poziomu 20%. Ponadto dla estymacji poredniej widoczne jest zdecydowanie mniejsze zrónicowanie wartoci miary precyzji. Rysunek 5. Porównanie charakterystyk opisowych wskaników precyzji szacunków bezporednich HT oraz oszacowa porednich z wykorzystaniem modelu FH rednich przychodów SW i SH w województwach, w przekroju sekcji PKD ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych.

90 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski Precyzja szacunku dla drugiej z analizowanych zmiennych SH jest zdecydowanie gorsza. Co prawda, zastosowanie modelu FH przynosi popraw, biorc pod uwag zarówno zrónicowanie, jak i poziom przecitny, jednak nadal wartoci wspóczynników CV w wikszoci przypadków przekraczaj 20%. Niska jako szacunku wynika przede wszystkim z charakteru zmiennej badanej. Wiele podmiotów gospodarczych wykazuje bowiem zerow warto przychodu ze sprzeday towarów i materiaów. Uzupenieniem tej oceny jest analiza relacji pomidzy wartociami mnonika gamma, okrelajcego udzia szacunku bezporedniego w modelu FH, a precyzj szacunku bezporedniego (por. rysunek 6). Mnonik gamma przyjmuje wartoci z zakresu od 0 do 1 i im wysza jest jego warto, tym wikszy jest udzia estymatora HT w ostatecznym szacunku otrzymanym na podstawie modelu FH. Rysunek 6. Zaleno pomidzy mnonikiem gamma, wykorzystanym w konstrukcji modelu FH, a wskanikiem precyzji estymatora HT, przy szacowaniu rednich przychodów SW i SH, w przekroju województw i sekcji PKD ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych. Przedstawione powyej diagramy rozrzutu wskazuj na siln zaleno pomidzy wartoci parametru gamma, a precyzj szacunku dla zmiennej SW w nastpujcych sekcjach: przemys (r = 0,92), gospodarka wodna (r = 0,80) oraz zakwaterowanie (r = 0,76). W przypadku zmiennej SH nie obserwuje si a tak silnej korelacji. Mona zauway, e wyszym wartociom wspóczynnika zmiennoci towarzyszy nisza warto gamma. Na przykad dla wszystkich województw w sekcji handel waga równa jest 0, co oznacza wyczny udzia estymacji regresyjnej w szacunku modelem FH. Z kolei niszym wartociom wspóczynnika zmiennoci odpowiada wiksza warto gamma. Oznacza to, e udzia estymacji HT w ocenie parametru wzrasta kosztem podejcia modelowego.

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 91 5.2. PORÓWNANIE PRZYCHODÓW Z REJESTRAMI ADMINISTRACYJNYMI Ostatni etap badania obejmowa analiz obcienia. Oszacowane wartoci porównano z danymi pochodzcymi z rejestrów administracyjnych. Porównanie to miao charakter przybliony, poniewa zasoby administracyjne nie zawieraj informacji o kadej z analizowanych zmiennych SW i SH, a jedynie o ich sumie przychodzie ogóem. Std przy ocenie obcienia ograniczono si do porównania wartoci przychodu ogóem z sum oszacowa otrzymanych dla zmiennych SW i SH. Relacj pomidzy wartociami rzeczywistymi, a szacunkami otrzymanymi na podstawie estymatora HT oraz modelu FH przedstawiono w postaci diagramów rozrzutu na rysunku 7. Z brakiem obcienia mielibymy do czynienia, jeli punkty znajdowayby si na przektnej. Wyniki przeprowadzonego badania wskazuj, e w zdecydowanej wikszoci domen, oceny estymatorów otrzymane na podstawie podejcia bezporedniego oraz poredniego s przeszacowane, w porównaniu z wartociami zawartymi w rejestrach administracyjnych. Wiksze rozbienoci widoczne s jednak w przypadku estymatora HT. Co wicej, im wysza jest warto przychodu, tym widoczne s wiksze rónice. Rysunek 7. Porównanie rednich przychodów netto ze sprzeday, wedug oszacowa estymatora HT oraz oszacowa porednich z wykorzystaniem modelu FH, z danymi z rejestru administracyjnego, w przekroju województw i sekcji PKD ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych. W celu lepszego zobrazowania rozbienoci pomidzy oszacowaniami i warto- ciami rzeczywistymi sporzdzono wykresy mapowe ukazujce nasilenie obcienia w ramach wszystkich analizowanych sekcji PKD (por. rysunek 8).

92 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski Estymator Horvitza-Thompsona Model Faya-Herriota Rysunek 8. Porównanie wzgldnego obcienia szacunków bezporednich HT oraz oszacowa porednich z wykorzystaniem modelu FH przychodów ogóem w województwach, w przekroju sekcji PKD ródo: opracowanie wasne na podstawie danych z badania DG1 oraz rejestrów administracyjnych. 6. WNIOSKI ORAZ DALSZE KIERUNKI BADANIA Problemem badawczym poddanym weryfikacji w niniejszym artykule, bya ocena moliwoci wykorzystania modelu Faya-Herriota do szacunku rocznych przychodów maych przedsibiorstw, w przekroju województw oraz sekcji PKD. Wyniki badania empirycznego wskazay, e poziom ocen otrzymanych na podstawie modelu FH jest nieco niszy, ale do zbliony do oszacowa otrzymanych na podstawie klasycznego podejcia bezporedniego HT biorc pod uwag warto mediany. Rónice przede wszystkim dotycz dyspersji szacunków. Oszacowania otrzymane na podstawie modelu FH, w kadej z omiu sekcji PKD, charakteryzuj si zdecydowanie mniejszym zrónicowaniem ni szacunki bezporednie. Podkreli naley jednak, e nie wszystkie

Estymacja przychodu przedsibiorstw na podstawie modelu Faya-Herriota 93 oceny parametru cechuje warto wskanika precyzji nie przekraczajca 20% progu, przyjtego za granic uznawania szacunków za wiarygodne. Wielko obcienia pozwala stwierdzi, e w znaczcej wikszoci domen oceny parametrów otrzymane na podstawie zarówno podejcia bezporedniego, jak i poredniego przewyszaj wartoci rzeczywiste. Co wicej, im wysza jest warto przychodu, tym widoczne s wiksze rónice. Warto jednak zauway, e szacunki uzyskane przy zastosowaniu modelu Faya-Herriota w wikszoci przypadków cechoway si mniejszym obcieniem anieli oszacowania bezporednie. W dalszych badaniach planowane jest przeanalizowanie moliwoci zastosowania wielowymiarowego modelu Faya-Herriota, zaproponowanego przez Benavent, Morales (2015), z którego mona skorzysta równie w sytuacji, gdy nie ma dodatniego rozwizania oszacowania losowych efektów wariancji. LITERATURA Benavent R., Morales D., (2015), Mul tivariate Fay-Herriot Models for Small Area Estimation, Computational Statistics & Data Analysis, 94, 372 390. Boonstra H. J., Buelens B., (2011), Model-Based Estimation, Statistics Netherlands, Hague. Dehnel G., (2015), Rejestr podatkowy oraz rejestr ZUS jako ródo informacji dodatkowej dla statystyki gospodarczej moliwoci i ograniczenia, w: Jajuga K., Walesiak M., (red.), Taksonomia 24. Klasyfikacji i analiza danych teoria i zastosowania, Wydawnictwo UE we Wrocawiu, Wrocaw, 51 59. Fay R., Herriot R., (1979), Estimates of Income for Small Places: An Application of James-Stein Procedures to Census Data, Journal of American Statistical Association, 74, 269 277. Guadarrama M., Molina I., Rao J. N. K., (2016), A Comparison of Small Area Estimation Methods for Poverty Mapping, Statistics in Transition new series and Survey Methodology, 17 (1), 41 66. GUS (2013), Ludno. Stan i struktura demograficzno-spoeczna. Narodowy Spis Powszechny Ludnoci i Mieszka 2011, Zakad Wydawnictw Statystycznych, Warszawa. Horvitz D. G., Thompson D. J., (1952), A Generalization of Sampling Without Replacement from a Finite Universe, Journal of the American Statistical Association, 47, 663 685. Pratesi M., Salvati N., (2008), Small Area Estimation: the EBLUP Estimator Based on Spatially Correlated Random Area Effects, Statistical Methods and Applications, 17, 113 141. Rao J. N. K., Molina I., (2015), Small Area Estimation, 2 nd Edition, Hoboken, New Jersey, Wiley. Wawrowski., (2014), Wykorzystanie metod statystyki maych obszarów do tworzenia map ubóstwa w Polsce, Wiadomoci Statystyczne, 9, 46 56. ESTYMACJA PRZYCHODU PRZEDSIBIORSTW NA PODSTAWIE MODELU FAYA-HERRIOTA Streszczenie Gównym ródem informacji o przychodach sektora maych przedsibiorstw s obecnie badania reprezentacyjne prowadzone przez Gówny Urzd Statystyczny. Szacunki z akceptowaln precyzj, ze wzgldu na rozmiar próby, schemat badania czy metoda szacunku, mog by estymowane co najwyej w przekroju kraju, województw lub sekcji Polskiej Klasyfikacji Dziaalnoci. Motywacj do podjcia badania byo obserwowalne w ostatnich latach rosnce zapotrzebowanie na informacje w jak najmniej

94 Grayna Dehnel, Micha Pietrzak, ukasz Wawrowski zagregowanej postaci. Celem niniejszego artykuu jest próba aplikacji modelu Faya-Herriota, wykorzystujcego zmienne pomocnicze, do oszacowania przychodów przedsibiorstw zatrudniajcych od 10 do 49 pracowników. W badaniu wykorzystano dane z meldunku DG1, najwikszego badania z zakresu statystyki przedsibiorstw, jak równie dane pochodzce z rejestrów administracyjnych. Badanie pozwolio na zaobserwowanie pewnych prawidowoci i charakterystyk sektora maych przedsibiorstw w Polsce. Sowa kluczowe: statystyka maych obszarów, estymacja porednia, model Faya-Herriota, rejestry administracyjne, statystyka przedsibiorstw ESTIMATION OF INCOME OF COMPANIES ON THE BASIS OF THE FAY-HERRIOT MODEL Abstract The main source of information about revenues of small business sector is currently provided mainly by sample surveys conducted by the Central Statistical Office. Parameters of interest can only be estimated with acceptable precision at the level of the country and province or by NACE section. It is caused by the sample size, method of estimation and sample design. The motivation for the study was the growing demand for reliable estimates at a low level of aggregation. The aim of this study was application of the Fay-Herriot model, one of the methods, which use auxiliary variables, for estimating revenue of enterprises employing 10 to 49 employees. The study used data from a meld DG 1, the most important research in the field of business statistics, as well as data from administrative registers. The study allowed to observe some regularities and characteristics of the small business sector in Poland. Keywords: small area estimation, indirect estimation, Fay-Herriot model, administrative registers economic statistics