Dobór modelu a obciążenie szacunku na przykładzie estymatora GREG w badaniu małych przedsiębiorstw
|
|
- Robert Janicki
- 6 lat temu
- Przeglądów:
Transkrypt
1 Zeszyty Uniwersytet Ekonomiczny w Krakowie Naukowe 11 (971) ISSN Zesz. Nauk. UEK, 217; 11 (971): 5 25 DOI: /ZNUEK Dobór modelu a obciążenie szacunku na przykładzie estymatora GREG w badaniu małych przedsiębiorstw Streszczenie Estymacja dotycząca populacji charakteryzujących się silną asymetrią i obecnością obserwacji odstających jest zagadnieniem trudnym, zwłaszcza gdy prowadzona jest na niskim poziomie agregacji. Zastosowanie klasycznych, bezpośrednich metod estymacji nie pozwala na otrzymanie wiarygodnych szacunków. Potrzeba uzyskania szczegółowych informacji oraz szerszych możliwości wykorzystania danych pochodzących z rejestrów administracyjnych skłania do poszukiwania innych, nieklasycznych metod szacunku. Przykładem może być estymacja typu GREG. W artykule podjęto próbę zbadania wpływu wyboru modelu uwzględnionego w ramach estymatora GREG na jakość szacunku parametru populacji przedsiębiorstw. Analizę przeprowadzono na podstawie danych pochodzących z badania małych przedsiębiorstw. Badaną zmienną był przeciętny przychód przedsiębiorstwa. Jako zmienne pomocnicze wykorzystano zmienne opóźnione pochodzące z rejestrów Badanie prowadzono w przekroju województw z uwzględnieniem rodzaju prowadzonej działalności gospodarczej. Słowa kluczowe: estymacja GREG, statystyka gospodarcza, estymacja typu model -assisted, obserwacje odstające. Klasyfikacja JEL: C4, C51., Uniwersytet Ekonomiczny w Poznaniu, Wydział Informatyki i Gospodarki Elektronicznej, Katedra Statystyki, al. Niepodległości 1, Poznań, g.dehnel@ue. poznan.pl
2 6 1. Wprowadzenie Rosnące potrzeby informacyjne w zakresie statystyki gospodarczej powodują konieczność prowadzenia badań w kierunku wzbogacenia i rozszerzania zakresu dostarczanych danych dotyczących przedsiębiorczości. Zadanie to jest o tyle trudne, że badaniom prowadzonym na podstawie populacji przedsiębiorstw towarzyszy zwiększający się z roku na rok odsetek braków odpowiedzi. Dodatkowo zakres zmian w systemie statystyki gospodarczej, które brane są pod uwagę, jest ograniczony przez takie czynniki, jak koszty badania oraz obciążenie respondentów wynikające ze sprawozdawczości statystycznej. Zaspokojenie potrzeby uzyskania informacji wymusza zatem poszukiwanie metod szacunku zmierzających do zwiększenia stopnia wykorzystania źródeł Adaptacja nowych rozwiązań ma przyczynić się do poprawy efektywności prowadzonych szacunków, a przede wszystkim do zwiększenia liczby przekrojów, w których publikowane są dane. Próby adaptacji nieklasycznych metod estymacji w odniesieniu do podmiotów gospodarczych zostały podjęte m.in. w pracach: [Chambers i in. 214, Clark, Kokic i Smith 217, Dehnel 214, 216]. Szukając nowych podejść do estymacji parametrów dotyczących przedsiębiorstw, należy uwzględnić specyfikę badanej populacji. Populacja przedsiębiorstw charakteryzuje się m.in. obecnością obserwacji odstających. Mając to na względzie, w niniejszym artykule poddano analizie metodę szacunku stosowaną w ramach statystyki małych obszarów zaliczaną do grupy model-assisted. Celem badania była ocena wpływu doboru modelu uwzględnionego w ramach estymatora typu GREG na jakość szacunku przeciętnego przychodu małych przedsiębiorstw. W estymacji zaproponowano wykorzystanie opóźnionych zmiennych pomocniczych pochodzących z zasobów Oceny estymatorów dokonano na podstawie badania empirycznego, w którym wykorzystano dane dotyczące małych przedsiębiorstw działających w ramach sekcji: przemysł, budownictwo, handel i transport. 2. Metoda estymacji W badaniach prowadzonych w zakresie statystyki przedsiębiorstw opartych na podejściu modelowym często zdarza się, że warunek dotyczący homoskedastyczności nie jest zachowany. Prowadzi to do nieefektywnych ocen parametrów regresji. Stąd też poszukuje się metod, które pozwolą na złagodzenie naruszenia założeń liniowego modelu regresji. Przykładem może być modyfikacja estymatora GREG zaproponowana w pracy R. Chambersa, H. Falveya, D. Hedlina i P. Kokica [21], zwana dalej modelem Chambersa.
3 Dobór modelu a obciążenie szacunku 7 W modelu Chambersa proponuje się włączenie do modelu dodatkowej zmiennej pomocniczej z i r. W ramach klasycznej postaci estymatora GREG wartości globalnej zmiennej Y [Lehtonen, Särndal i Veijanen 216] Yt = yt + w e, GREG, d / / (1) i i! Ud i! sd gdzie yt i = x i lβt d, wektor parametrów modelu β t d szacowany jest na podstawie zmodyfikowanego wzoru uwzględniającego dodatkową zmienną z [Chambers i in. 21]: -1 wi xi xli wixiyi β t d = U / γ, i s z Z T / γ! i i s z Y (2) d! d i gdzie: w i wagi wynikające ze schematu losowania, x wektor zmiennych pomocniczych, w zależności od podejścia liczba osób pracujących lub przychód, z γ i zmienna pomocnicza w modelu regresji y względem x zakładającym heteroskedastyczność, w zależności od podejścia liczba osób pracujących lub przychód, γ parametr określający stopień heteroskedastyczności, U d część populacji generalnej o elementach należących do domeny d, s d część próby wylosowanej z populacji o elementach należących do domeny d. Estymator modelu Chambersa wyrażony za pomocą wzoru (1) można przedstawić w postaci, która jest tożsama z formułą klasycznego estymatora GREG: i i Y t = / w g y. (3) GREG, d i i i i! s d Różnica dotyczy jedynie definicji wagi g i zależnej od wartości cechy dodatkowej x u jednostek wylosowanych do próby, zdefiniowanej jako: 1 wixixli xi gi = 1 + RXd Xt HT, dw lu / γ γ, i! s z Z T Y (4) i z d i gdzie: d domena, g i wagi zależne od wartości cechy dodatkowej u i-tej jednostki wylosowanej do próby, Y t GREG, d ocena wartości globalnej w domenie d na podstawie estymatora GREG, X t HT, d estymator bezpośredni Horvitza-Thompsona wartości globalnej zmiennej pomocniczej x w domenie d, X wartość globalna zmiennej pomocniczej x, γ parametr określający stopień heteroskedastyczności, dla γ = estymator modelu Chambersa przyjmuje klasyczną postać estymatora GREG.
4 8 Na podstawie wcześniej prowadzonych badań statystycznych wiadomo, że wartość parametru γ zawiera się w przedziale 1, 2 [Särndal, Swensson i Wretman 1992], stąd też w przeprowadzonym badaniu przeanalizowano trzy podejścia (dla γ równego odpowiednio 1, 1,5 i 2) reprezentujące estymatory Yt 1 GREG, Y t 1 GREG, 5, Yt 2 GREG. W estymatorach tych w liniowym modelu regresji dopuszcza się niezachowanie warunku homoskedastyczności, przy czym poziom heteroskedastyczności określany jest przez parametr γ. 3. Założenia badania Badaniem empirycznym objęto małe przedsiębiorstwa (1 49 pracujących) prowadzące działalność gospodarczą w ramach sekcji: przemysł, budownictwo, handel i transport. Analizie poddano model, w którym zmienną zależną stanowił przychód uzyskany przez przedsiębiorstwa w czerwcu 212 r. Za zmienne niezależne przyjęto przychód, koszt oraz liczbę pracujących według stanu zanotowanego w grudniu 211 r. Decyzję o wykorzystaniu zmiennych opóźnionych podjęto, biorąc pod uwagę ograniczenia czasowe, z jakimi musi się liczyć GUS, prowadząc badania statystyczne. Chodzi przede wszystkim o opóźnienie, jakie ma miejsce przy przekazywaniu statystyce publicznej zasobów administracyjnych [Wykorzystanie danych 216]. Dane dotyczące zmiennej zależnej pochodziły z badania DG-1 [Dehnel 214]. Z kolei źródłem informacji o zmiennych niezależnych były rejestry administracyjne. Szacunku dokonano w przekroju regionalnym, z uwzględnieniem rodzaju prowadzonej działalności gospodarczej. Przekrój regionalny obejmował jednostki na poziomie województw, zaś rodzajowi prowadzonej działalności odpowiadały sekcje PKD. W ocenie jakości estymacji za punkt odniesienia przyjęto oszacowania otrzymane na podstawie estymatorów bezpośrednich Horvitza-Thompsona (HT) i typu GREG, włączając w to jego postać ilorazową (oznaczoną w artykule jako RAT). Estymator HT Y t Nd HT, d = n / yi, (5) d idsd gdzie: Y t HT, d estymator bezpośredni HT wartości globalnej zmiennej y w domenie d, N d liczebność populacji generalnej w domenie d, n d liczebność próby w domenie d, y i wartość zmiennej badanej u i-tej jednostki.
5 Dobór modelu a obciążenie szacunku 9 Estymator GREG Y t = Y t = y t + w e, GREG, d GREG, d i i! Ud i! sd / / (6) gdzie yt i = xilβ t d, wektor parametrów modelu β t d szacowany jest na podstawie wzoru [Rao, Molina 215]: 1 β t d = T / wixixli Y T / wi xi yiy. (7) i! sd i! sd Estymator Yt GREG przyjmuje postać estymatora typu GREG, jednak jego wartości różnią się od szacunków otrzymanych na podstawie klasycznego podejścia GREG. Różnice wynikają z tego, że w przypadku estymatora modelu Chambersa Yt GREG w szacunku nie są uwzględniane wszystkie jednostki wylosowane do próby z domeny d. Pomijane są bowiem te, dla których zmienna pomocnicza z przyjmie wartość zero. Jako zmienne pomocnicze typu x i z wykorzystano liczbę osób pracujących (dane pochodzące z ZUS) oraz przychody (dane pochodzące z rejestru podatkowego). W modelu Chambersa zakłada się, że każda ze zmiennych pomocniczych może być wykorzystana zarówno jako zmienna x, jak i z (z zastrzeżeniem, że zmienną z nie może być taka zmienna, która przyjmuje wartości zerowe). W związku z powyższym ostatecznie głębszej analizie poddano podejście, w którym za zmienną z przyjęto liczbę osób pracujących. i i 4. Metoda oceny precyzji Do oceny precyzji i dokładności otrzymanych szacunków wykorzystano metodę bootstrapową. Wykonano 1 repetycji losowania podprób, na podstawie których oszacowano wartość przychodu przedsiębiorstw dla czerwca 212 r. w przekroju przyjętych domen studiów. Efektywność estymacji oceniono na podstawie współczynnika zmienności estymatora [Bracha 24]: VarRYt dw CVRYt dw = = ERYt W d / b = 1 RYt ERYt W d b, d Yt dw. Wskaźnik ten określa udział błędu estymacji w wartości szacowanej zmiennej na poziomie domeny. W badaniach prowadzonych przez GUS oraz badaniach empirycznych przyjmuje się, że wyniki szacunków mogą być uznane za wiarygodne, jeżeli wartość CV nie przekracza 1%. Jeśli przyjmuje on wartości z przedziału 1 2%, szacunki należy interpretować ostrożnie. Jeżeli natomiast poziom CV jest wyższy od 2%, oceny estymatorów nie są uznawane za wiarygodne [Ludność 213]. (8)
6 DG-1 XII 212 RejAd_XII 212 DG-1 VI 212 RejAd_est VI 212 Rys. 1. Wartości przychodu przedsiębiorstw w czerwcu i grudniu 212 r. zarejestrowane na podstawie badania DG-1 oraz zeznań podatkowych w sekcji przemysł Ocena obciążenia wymaga znajomości wartości szacowanego parametru w populacji generalnej. Ze względu na brak dostępu w badaniu do informacji o tej wielkości oszacowano ją w sposób pośredni, na podstawie danych pochodzących z zeznań podatkowych z grudnia 212 r. Przyjęto, że relacja przychodu zarejestrowanego w zeznaniach podatkowych dla badanych przedsiębiorstw na poziomie domeny studiów do przychodu określonego na podstawie badania DG-1 jest stała. W celu graficznej prezentacji zależności między wielkościami wykorzystano dane dotyczące sekcji przemysł (por. rys. 1). W pozostałych sekcjach PKD relacja między zmiennymi przedstawia się podobnie. Przychód_ RejAd XII 212 PrzychódRejAd _ VI 212 PrzychódDG _ 1 = PrzychódDG _ 1. (9) XII 212 VI 212 Takie podejście pozwoliło na wyznaczenie przybliżonej wartości przychodu przedsiębiorstw dla czerwca 212 r.
7 Dobór modelu a obciążenie szacunku Wyniki szacunków i ocena ich jakości* Analizę rozpoczęto od oceny rozkładów przedsiębiorstw według badanych zmiennych. Wartości współczynnika zmienności wahały się w granicach %. Zanotowano również silną asymetrię, współczynnik asymetrii przyjmował wartości w przedziale,6 17,1. Biorąc pod uwagę własności rozkładów podmiotów gospodarczych, za pomocą testów White a oraz Breuscha-Pagana weryfikacji poddano hipotezę zakładającą homoskedastyczność. Wyniki testów w przypadku zdecydowanej większości wyróżnionych domen potwierdziły słuszność tezy o zmienności składnika losowego (por. tabela 1). To z kolei uzasadniało wykorzystanie opisanych wyżej estymatorów GREG uwzględniających dodatkową cechę z. Ocenie poddano zarówno efektywność, jak i dokładność estymacji. W ocenie precyzji estymacji za punkt odniesienia przyjęto szacunek otrzymany za pomocą klasycznych, bezpośrednich estymatorów HT oraz typu GREG, włączając w to jego postać ilorazową. Biorąc pod uwagę wartości miary efektywności CV, można zauważyć, że największym zróżnicowaniem charakteryzuje się estymator HT (por. rys. 2 5 i tabela 2). Mniejszą zmienność obserwujemy w przypadku klasycznych estymatorów GREG, w których wykorzystuje się zmienne pomocnicze pochodzące z rejestrów Analizując wyniki można zauważyć, że precyzja szacunku estymacji typu GREG zależy od liczebności próby. Jest ona z reguły wyższa w sekcjach liczniej reprezentowanych w próbie, takich jak handel i przemysł. W większości wyróżnionych domen współczynniki zmienności estymatorów modelu Chambersa kształtują się na podobnym poziomie. Wyjątek stanowi sekcja transport, w której liczebność próby jest najmniejsza i wynosi w niektórych domenach 5 jednostek. W ocenie dokładności szacunku przychodu przedsiębiorstw wykorzystano wartości referencyjne wyznaczone na podstawie zależności ilorazowej opisanej powyżej (por. wzór (9)). Dodatkowo, w celu pełniejszej oceny, model Chambersa porównano z estymacją HT oraz GREG (por. rys. 6 9, tabela 3). Otrzymane wyniki wskazują, że zastosowanie modelu Chambersa w znacznym stopniu poprawiło dokładność szacunku w przypadku estymacji HT i GREG. Zastosowanie estymacji HT w prawie wszystkich badanych domenach doprowadziło do znacznego przeszacowania wartości przychodu. Z kolei w przypadku wszystkich estymatorów typu GREG widoczne jest niedoszacowanie badanego parametru, jednak wielkość odchylenia od wartości referencyjnej jest zdecydowanie mniejsza niż w przypadku estymatora HT. Zastosowanie estymatora GREG, a w szczególności jego zmodyfikowanej wersji, przyniosło największą poprawę dokładności szacunku dla domen, dla których zanotowano największą dyspersję zmiennych uwzględnionych w modelu. * Wybrane wyniki badań zostały opublikowane w pracy [Dehnel 217].
8 12 Tabela 1. Wartości statystyk testów White a i Breuscha-Pagana na heteroskedastyczność w przekroju województw Test White a Test Breuscha-Pagana Test White a Test Breuscha-Pagana Województwo statystyka p-wartość statystyka p-wartość statystyka p-wartość statystyka p-wartość Przemysł Budownictwo 15,28,92 7,75,27 39,93 * 3,4 * Kujawsko 12 * 97,4 * 6,99,2217,75, ,4 * 25,31 * 28,92 * 12,14,23 2,5,1 8,87,118 2,7,9 16,63,2 179,3 * 97,86 * 35,21 * 21,22 * 9,51 * 89,76 * 14,55,125 9,77,76 276,5 * 24,85 *,69,9835,2, ,6 * 33,44 * 2,31,11 17,71,1 171,3 * 131 * 16,89,47 16,1,3 41,21 * 28,77 * 11,27,462 4,75, ,4 * 6,2 * 14,69,118 12,28,22 267,8 * 19,2 * 77,15 * 53,72 * 34,8 * 24,3 * 36,33 * 29,4 * mazurskie 125,8 * 14,91,6 5,29,3818 3,73, ,9 * 89,19 * 81,53 * 6,22,445 Zachodnio 25,87 * 3,83, ,92 * 42,71 *
9 Dobór modelu a obciążenie szacunku 13 cd. tabeli 1 Test White a Test Breuscha-Pagana Test White a Test Breuscha-Pagana Województwo statystyka p-wartość statystyka p-wartość statystyka p-wartość statystyka p-wartość Handel Transport 121,9 * 86,7 * 14,63,121 12,9,16 Kujawsko 46,13 * 35,5 * 16,2,63 1,48,53 49,7 * 1,95,3771 2,34,7998,21,913 8,34 * 37,33 * 9,48,913 4,16, ,18 * 34,9 * 11,98,35 1,6,65 136,1 * 6,36,417 18,27,26 15,31,5 169,7 * 142,6 * 2,11,8333,5, ,65 * 36,43 * 13,18,217 1,86, ,91 * 18,9,1 8,71,1213 5,39,677 33,33 * 16,64,2 5,63,3439,72,698 4,15 * 36,32 * 24,63,2 16,54,3 97,41 * 82,98 * 23,18,3 2,51 * 23,45,3 6,18,456 16,32,6 9,4,19 mazurskie 48,97 * 25,96 * 14,15,147,44, ,5 * 74,83 * 45,67 * 12,75,17 121,1 * 113,9 * 2,77,9 11,41,33 * p <,1 Źródło: opracowanie własne na podstawie danych pochodzących z badania DG-1.
10 14 CV (w %) HT RAT GREG GREGz1 GREGz1,5 GREGz2 Rys. 2. Precyzja szacunku CV w przekroju województw przemysł CV (w %) HT RAT GREG GREGz1 GREGz1,5 GREGz2 Rys. 3. Precyzja szacunku CV w przekroju województw budownictwo
11 Dobór modelu a obciążenie szacunku 15 CV (w %) HT RAT GREG GREGz1 GREGz1,5 GREGz2 Rys. 4. Precyzja szacunku CV w przekroju województw handel CV (w %) HT RAT GREG GREGz1 GREGz1,5 GREGz2 Rys. 5. Precyzja szacunku CV w przekroju województw transport
12 16 Tabela 2. Precyzja szacunku CV w przekroju województw i czterech sekcji PKD Estymator Województwo HT RAT GREG GREGz1 GREGz1,5 GREGz2 HT RAT GREG GREGz1 GREGz1,5 GREGz2 Przemysł Budownictwo 15,5 9,8 5,8 7,7 11,7 15,1 16,1 18,6 7,3 37,1 25,7 31,6 Kujawsko 13,2 6,6 13,1 1,2 9,7 11,8 15,3 11,4 15,3 13,2 23,2 31, 13,6 5, 8,3 5,4 5,9 6,5 16,5 12,7 13,3 28,3 45,1 71,2 14, 6,9 11,3 1,6 11,2 14, 2,7 16,2 23,4 19, 17,5 17,7 9,8 3,6 9,1 7,3 11,1 11,9 21, 19,8 151,1 3,2 17,6 17,5 1,5 3, 5,2 8,1 9,9 2,4 9,4 7,5 12,7 12,4 14,1 17,9 16,8 12,4 16,2 14,6 13,3 12,5 15,5 15,8 2,3 17,9 16,3 17,5 1,1 3,6 5, 3,6 3,8 4,3 9,2 7,3 1,3 9,4 9,3 9,4 13, 5,7 11,8 8,2 8,4 11, 23,9 16,9 44,3 42,2 33,3 3, 12,2 4,4 5,1 5,2 8,3 1,7 2,8 17,1 2,3 18, 18,8 2,4 14,3 4,3 5, 4,6 5,4 7,1 16,1 13,6 16,4 14,4 17,7 21,4 36,1 8,2 24,2 7,6 9,1 11,4 7,3 4,6 8,9 7, 7,5 8,3 19,3 4,7 5,8 5,1 4,7 4,5 19,9 1,4 27, 33,9 39,8 46,7 mazurskie 48,1 15,9 57,7 51,8 19, 14,3 14, 11,8 2,1 13,2 12,3 16, 11, 8,7 32,8 5,7 6,4 7,8 2,4 6,7 1,9 9,4 9,5 1,5 Zachodnioporskie 26,1 7, 6,9 5,8 6,9 8,5 15,7 8,5 17,1 13,3 19,2 36,8
13 Dobór modelu a obciążenie szacunku 17 cd. tabeli 2 Estymator Województwo HT RAT GREG GREGz1 GREGz1,5 GREGz2 HT RAT GREG GREGz1 GREGz1,5 GREGz2 Handel Transport 1,4 3,2 5,4 6,3 1,1 13,3 15,4 6,9 1,5 9,6 9,6 9,7 Kujawsko 16,1 4,1 6,2 9,6 9,7 13,1 13,6 8,6 12,5 18,5 9,7 179,5 28,8 3,5 4,3 4,8 6,7 9,6 28,7 6,8 11, 9,3 8,7 8,4 18,5 3,9 9,5 5,6 8,3 1,9 17,5 3, 4,4 3,7 3,6 3,7 13,6 3,3 3,7 3, 3,2 3,4 16,2 7,4 23,4 28,2 33,4 39,2 3,2 2,4 3,2 7,6 13,9 19,8 11,9 5, 1,5 6,8 6,5 7, 14,2 4,3 8,1 6, 7,6 11,3 15,4 11,5 17,1 17,1 2,1 24,1 1,7 2,5 2,9 2,4 2,4 2,5 26,4 5,4 7,2 6,1 5,8 5,6 12,7 2,7 3,8 4, 4,4 5,3 2,6 12,2 45,8 18,5 127,5 132,5 13,4 4,8 6,2 4,7 4,2 4,1 32,6 5,5 9,8 9,6 9,4 9,2 8,8 3,2 5,1 5,9 7,9 11,5 2,2 5,5 7,1 7,3 11,1 2,6 9,5 2,7 4,2 4,5 5,4 7,8 13,1 4,2 7,6 7,8 8,5 1, 16,5 3,1 4,4 7,7 12,5 14,6 3,2 11,9 13,9 9,5 9,1 1,2 mazurskie 9, 2,9 3,5 2,9 3, 3,3 23,2 17, 37, 27,8 25, 22,7 11,3 3,2 3,6 3,6 3,8 4,4 33,2 6, 11,5 1,4 12,1 15,3 Zachodnioporskie 14, 7,3 9,4 7,1 7,1 8,7 21,2 9,2 15,9 18,6 2,8 23,8
14 HT RAT GREG GREGz1 GREGz1,5 GREGz2 szacunek_ra VI Rys. 6. Szacunek przychodu przedsiębiorstw dla czerwca 212 r. w przekroju województw przemysł HT RAT GREG GREGz1 GREGz1,5 GREGz2 szacunek_ra VI Rys. 7. Szacunek przychodu przedsiębiorstw dla czerwca 212 r. w przekroju województw budownictwo
15 Dobór modelu a obciążenie szacunku HT RAT GREG GREGz1 GREGz1,5 GREGz2 szacunek_ra VI Rys. 8. Szacunek przychodu przedsiębiorstw dla czerwca 212 r. w przekroju województw handel HT RAT GREG GREGz1 GREGz1,5 GREGz2 szacunek_ra VI Rys. 9. Szacunek przychodu przedsiębiorstw dla czerwca 212 r. w przekroju województw transport
16 2 Tabela 3. Szacunek przychodu przedsiębiorstw dla czerwca 212 r. w przekroju województw i czterech sekcji PKD (w tys. zł) Estymator Województwo HT RAT GREG GREGz1 GREGz1,5 GREGz2 HT RAT GREG GREGz1 GREGz1,5 GREGz2 Przemysł Budownictwo Kujawsko mazurskie Zachodnioporskie
17 Dobór modelu a obciążenie szacunku 21 cd. tabeli 3 Estymator Województwo HT RAT GREG GREGz1 GREGz1,5 GREGz2 HT RAT GREG GREGz1 GREGz1,5 GREGz2 Handel Transport Kujawsko mazurskie Zachodnioporskie
18 22 Przemysł Województwo dolnośląskie Budownictwo % 3 2 % Województwo wielkopolskie % 1 5 % Województwo zachodniopomorskie % % HT RAT GREG GREG 1 GREG 1,5 GREG 2 Przychód_6_RA Rys. 1. Rozkład szacunków dla wybranych województw przemysł i budownictwo
19 Dobór modelu a obciążenie szacunku 23 HT GREG GREG ilorazowy GREG Yt1 GREG GREG Yt1,5 GREG GREG Yt2 GREG poniżej 3% od 3% do 1% od 1% do 1% od 1% do 3% powyżej 3% Rys. 11. Porównanie względnego obciążenia szacunku przychodów przedsiębiorstw na podstawie estymatorów HT oraz typu GREG w województwach przemysł
20 24 Na rys. 1 przedstawiono histogramy prezentujące rozkłady szacunków otrzymanych na podstawie badanych estymatorów metodą bootstrap dla sekcji przemysł i budownictwo dla wybranych województw. Estymatory GREG, w których wykorzystano zmienne pomocnicze pochodzące z rejestrów, charakteryzują się zdecydowanie mniejszym obciążeniem szacunków. W ich przypadku widoczna jest wyraźna koncentracja rozkładów wokół wartości referencyjnej oznaczonej czerwoną linią. W celu przestrzennego zobrazowania rozbieżności pomiędzy oszacowaniami i wartościami rzeczywistymi sporządzono wykresy mapowe ukazujące nasilenie obciążenia w przekroju wszystkich województw (por. rys. 11). Wyniki przeprowadzonego badania wskazują, że w zdecydowanej większości domen oceny estymatorów otrzymane na podstawie estymatora HT są przeszacowane w porównaniu z wartościami zawartymi w rejestrach Największe rozbieżności widoczne są w przypadku estymatora HT. Zastosowanie estymacji typu GREG wpłynęło na zmniejszenie obciążenia, jednak zakres poprawy był zróżnicowany. Na różnice miał wpływ nie tylko rodzaj estymatora GREG, ale również badana domena. 6. Wnioski Otrzymane wyniki badań pozwalają na sformułowanie następujących wniosków: włączenie do szacunku zmiennych pomocniczych w ramach estymacji GREG wpłynęło na znaczną poprawę precyzji w porównaniu z estymacją HT, w przypadku zastosowania metody nieklasycznej większą poprawę obserwujemy dla domen charakteryzujących się znacznym zróżnicowaniem i silną asymetrią zarówno jeśli chodzi o precyzję, jak i dokładność szacunku, w badaniu biorą udział jedynie jednostki, dla których zmienna z jest różna od ; oznacza to, że w badaniu za zmienną z można przyjąć jedynie cechę, która nie przyjmuje wartości zerowych, stopień poprawy precyzji estymacji w przypadku estymatorów uwzględniających transformację uzależniony jest od odpowiedniego doboru wartości parametru γ. Znaczną poprawę można osiągnąć, dobierając do danej domeny odpowiedni model. Postępowanie takie powoduje jednak, że stosowanie przedstawionych w artykule zmodyfikowanych estymatorów GREG w przypadku dużej liczby małych domen jest czasochłonne i znacznie utrudnione. Literatura Bracha C. [24], Estymacja danych z badania aktywności ekonomicznej ludności na poziomie powiatów dla lat , GUS, Warszawa.
21 Dobór modelu a obciążenie szacunku 25 Chambers R., Chandra H., Salvati N., Tzavidis N. [214], Outlier Robust Small Area Estimation, Journal of the Royal Statistical Society: Series B (Statistical Methodology), vol. 76, no 1, Chambers R. L., Falvey H., Hedlin D., Kokic P. [21], Does the Model Matter for GREG Estimation? A Business Survey Example, Journal of Official Statistics, vol. 17, nr 4. Clark R.G., Kokic P., Smith P.A. [217], A Comparison of Two Robust Estimation Methods for Business Surveys, International Statistical Review, vol. 85, nr 2, doi.org/1.1111/insr Dehnel G. [214], Winsorization Methods in Polish Business Survey, Statistics in Transition New Series, vol. 15, nr 1. Dehnel G. [216], M-estimators in Business Statistics, Statistics in Transition New Series, vol. 17, nr 4. Dehnel G. [217], GREG Estimation with Reciprocal Transformation for a Polish Business Survey [w:] Proceedings of the 11th Professor Aleksander Zelias International Conference on Modelling and Forecasting of Socio-Economic Phenomena, eds M. Papież, S. Śmiech, Foundation of the Cracow University of Economics, Cracow. Lehtonen R., Särndal C.E., Veijanen A. [216], Generalized Regression and Model-calibration Estimation for Domains: Accuracy Comparison, net/publication/ _generalized_regression_and_model-calibration_estimation_for_domains_accuracy_comparison (data dostępu: ). Ludność. Stan i struktura demograficzno-społeczna. Narodowy Spis Powszechny Ludności i Mieszkań 211 [213], GUS, Warszawa. Rao J.N.K., Molina I. [215], Small Area Estimation, 2nd ed., Wiley Series in Survey Methodology, Wiley, Hoboken, New Jersey. Särdnal C. E., Swensson B., Wretman J. [1992], Model Assisted Survey Sampling, Springer Verlag, New York. Wykorzystanie danych administracyjnych w badaniu: Ocena bieżącej działalności gospodarczej przedsiębiorstw [216], GUS, Warszawa. Model Selection and the GREG Estimator Bias in a Small Business Survey (Abstract) Estimation for a very skewed population containing extreme values is problematic, especially at a low level of aggregation. Traditional direct estimation methods do not provide satisfactory results. The growing demand for detailed information and the wider possibility of using data from administration registers has increased the importance of recognising more sophisticated estimation methods. Generalised Regression (GREG) estimation is an example of one such type. The paper examines the importance of the model chosen in GREG estimation in dealing with highly variable and outlier-prone populations. The model-assisted GREG estimator is applied to a real business survey. Lagged variables from administrative registers were used as the auxiliary variables. The variable of interest mean revenue of small companies was estimated for provinces cross-classified by categories of economic activity. Keywords: GREG, business statistics, model-assisted estimation, outliers.
Nr 11 (971) Cracow Review of Economics and Management. Uniwersytet Ekonomiczny w Krakowie ISSN Zeszyty Naukowe Nr 11 (971) ISSN
ISSN 1898-6447 Uniwersytet Ekonomiczny w Krakowie UNIWERSYTET EKONOMICZNY W KRAKOWIE 31-510 Kraków, ul. Rakowicka 27 WYDAWNICTWO www.uek.krakow.pl Zamówienia na wydane prace przyjmuje Księgarnia Uniwersytetu
Statystyka Małych Obszarów w badaniach próbkowych
Statystyka Małych Obszarów w badaniach próbkowych Łukasz Wawrowski l.wawrowski@stat.gov.pl Urząd Statystyczny w Poznaniu SKN Estymator, UEP 5.03.2012 1 Wprowadzenie Podstawowe pojęcia Badanie 2 Estymator
Taksonomiczne aspekty estymacji pośredniej uwzględniającej autokorelację przestrzenną w statystyce gospodarczej
Urząd Statystyczny w Poznaniu Taksonomiczne aspekty estymacji pośredniej uwzględniającej autokorelację przestrzenną w statystyce gospodarczej Grażyna Dehnel Tomasz Klimanek Jacek Kowalewski CEL BADANIA:
Niepełnosprawność w świetle estymacji pośredniej na przykładzie województwa wielkopolskiego
Niepełnosprawność w świetle estymacji pośredniej na przykładzie województwa wielkopolskiego Michał Pietrzak 1,2, Tomasz Józefowski 2, Tomasz Klimanek 2, Marcin Szymkowiak 1,2 Uniwersytet Ekonomiczny w
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Statystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE
1 STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE 1.1 Podejścia w statystyce małych obszarów Randomizacyjne Wektor wartości badanej cechy traktowany jest jako nielosowy. Szacowana charakterystyka jest nielosowa
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń
estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń Łukasz Wawrowski, Maciej Beręsewicz 12.06.2015 Urząd Statystyczny w Poznaniu, Uniwersytet
STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY
STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY 2.1 Estymator Horvitza-Thompsona 2.1.1 Estymator Horvitza-Thompsona wartości średniej i globalnej w populacji p-nieobciążony
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy
STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR
1 STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR 3.1 Najlepszy predyktor i empiryczny najlepszy predyktor 3.1.1 Najlepszy predyktor i empiryczny najlepszy predyktor Ogólny mieszany model
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE
EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE ZADANIE 1 Oszacowano zależność między luką popytowa a stopą inflacji dla gospodarki niemieckiej. Wyniki estymacji są następujące: Estymacja KMNK,
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci Łukasz Wawrowski Katedra Statystyki Uniwersytet Ekonomiczny w Poznaniu Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci 2 / 23 Plan
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych
Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
Stanisław Cichocki Natalia Nehrebecka. Wykład 7
Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Ćwiczenia IV
Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez
Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14
Statystyka #6 Analiza wariancji Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2015/2016 1 / 14 Analiza wariancji 2 / 14 Analiza wariancji Analiza wariancji jest techniką badania wyników,
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa. Paweł Strawiński Uniwersytet Warszawski Wydział Nauk Ekonomicznych 16 stycznia 2006 Streszczenie W artykule analizowane są właściwości
K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach Opis danych statystycznych
3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach 1995-2005 3.1. Opis danych statystycznych Badanie zmian w potencjale opieki zdrowotnej można przeprowadzić w oparciu o dane dotyczące
Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład I, 22.02.2016 STATYSTYKA OPISOWA, cz. I Kwestie techniczne Kontakt: ajanicka@wne.uw.edu.pl Dyżur: strona z materiałami z przedmiotu: wne.uw.edu.pl/azylicz akson.sgh.waw.pl/~aborata
WSPÓŁCZYNNIK DWUMODALNOŚCI BC I JEGO ZASTOSOWANIE W ANALIZACH ROZKŁADÓW ZMIENNYCH LOSOWYCH
METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH Tom XV/3, 2014, str. 20 29 WSPÓŁCZYNNIK DWUMODALNOŚCI BC I JEGO ZASTOSOWANIE W ANALIZACH ROZKŁADÓW ZMIENNYCH LOSOWYCH Aleksandra Baszczyńska, Dorota Pekasiewicz
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
Ekonometria Ćwiczenia 19/01/05
Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Analiza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne
Etapy modelowania ekonometrycznego
Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,
Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji
Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.48 WIESŁAWA MALSKA Wykorzystanie testu Levene a i testu Browna-Forsythe
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
dr Tomasz Jurkiewicz mgr Krzysztof Najman Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański K.Najman@panda.bg.univ.gda.pl
Propozycja zastosowania metody klasyfikacji k-średnich oraz sieci neuronowej typu SOM do poprawy efektywności estymacji dla małych domen w reprezentacyjnym badaniu małych i średnich przedsiębiorstw dr
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA
Statystyka opisowa PRZEDMIOT: PODSTAWY STATYSTYKI PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA Statystyka opisowa = procedury statystyczne stosowane do opisu właściwości próby (rzadziej populacji) Pojęcia:
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Teoria Estymacji. Do Powyżej
Teoria Estymacji Zad.1. W pewnym przedsiębiorstwie wylosowano niezależnie próbę 25 pracowników. Staż pracy (w latach) tych pracowników w 1996 roku był następujący: 37; 34; 0*; 5; 17; 17; 0*; 2; 24; 33;
Metoda reprezentacyjna
Metoda reprezentacyjna Stanisław Jaworski Katedra Ekonometrii i Statystyki Zakład Statystyki Populacja, cecha, parametr, próba Metoda reprezentacyjna Przedmiotem rozważań metody reprezentacyjnej są metody
METODY STATYSTYCZNE. Studia stacjonarne, semestr zimowy 2017/2018. Motto III: In God we trust. All others must bring data (z internetu)
METODY STATYSTYCZNE Studia stacjonarne, semestr zimowy 017/018 Motto I: Prawie każdy jest statystykiem ale niewielu o tym wie (inspiratorzy: Molier i Joseph Schumpeter) Motto II: Statystyka jest bodajże
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1
Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów
Projektowanie (design) Eurostat
Projektowanie (design) Eurostat Podstawa prezentacji moduł Overall design autor Eva Elvers ze Statistics Sweden Prezentacja autora na szkoleniu w Hadze 28-29 listopada 2013 r. Zarys Badanie statystyczne
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym:
Metodologiczne Inspiracje 2014 Badania ilościowe w naukach społecznych Wyzwania i problemy Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym: możliwości i ograniczenia prawidłowego wykorzystania
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS
FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,