Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
|
|
- Kacper Marczak
- 8 lat temu
- Przeglądów:
Transkrypt
1 PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof Jajuga Marek Walesiak Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2013
2 Redaktor Wydawnictwa: Aleksandra Śliwka Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis Łamanie: Małgorzata Czupryńska Projekt okładki: Beata Dębska Publikacja jest dostępna w Internecie na stronach: The Central and Eastern European Online Library a także w adnotowanej bibliografii zagadnień ekonomicznych BazEkon Informacje o naborze artykułów i zasadach recenzowania znajdują się na stronie internetowej Wydawnictwa Tytuł dofinansowany ze środków Narodowego Banku Polskiego oraz ze środków Sekcji Klasyfikacji i Analizy danych PTS Kopiowanie i powielanie w jakiejkolwiek formie wymaga pisemnej zgody Wydawcy Copyright by Uniwersytet Ekonomiczny we Wrocławiu Wrocław 2013 ISSN (Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu) ISSN (Taksonomia) Wersja pierwotna: publikacja drukowana Druk: Drukarnia TOTEM
3 Spis treści Wstęp... 9 Sabina Denkowska, Kamil Fijorek, Marcin Salamaga, Andrzej Sokołowski: Sejm VI kadencji maszynka do głosowania Barbara Pawełek, Adam Sagan: Zmienne ukryte w modelach ekonomicznych respecyfikacja modelu Kleina I Jan Paradysz: Nowe możliwości badania koniunktury na rynku pracy Krzysztof Najman: Samouczące się sieci GNG w grupowaniu dynamicznym zbiorów o wysokim wymiarze Kamila Migdał-Najman: Zastosowanie jednowymiarowej sieci SOM do wyboru cech zmiennych w grupowaniu dynamicznym Aleksandra Matuszewska-Janica, Dorota Witkowska: Zróżnicowanie płac ze względu na płeć: zastosowanie drzew klasyfikacyjnych Iwona Foryś, Ewa Putek-Szeląg: Przestrzenna klasyfikacja gmin ze względu na sprzedaż użytków gruntowych zbywanych przez ANR w województwie zachodniopomorskim Joanna Banaś, Małgorzata Machowska-Szewczyk: Klasyfikacja internetowych rachunków bankowych z uwzględnieniem zmiennych symbolicznych Marta Jarocka: Wpływ metody doboru cech diagnostycznych na wynik porządkowania liniowego na przykładzie rankingu polskich uczelni Anna Zamojska: Badanie zgodności rankingów wyznaczonych według różnych wskaźników efektywności zarządzania portfelem na przykładzie funduszy inwestycyjnych Dorota Rozmus: Porównanie dokładności taksonomicznej metody propagacji podobieństwa oraz zagregowanych algorytmów taksonomicznych opartych na idei metody bagging Ewa Wędrowska: Wrażliwość miar dywergencji jako mierników niepodobieństwa struktur Katarzyna Wójcik, Janusz Tuchowski: Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji charakteru opinii konsumenckich Małgorzata Misztal: Ocena wpływu wybranych metod imputacji na wyniki klasyfikacji obiektów w modelach drzew klasyfikacyjnych Anna Czapkiewicz, Beata Basiura: Badanie wpływu wyboru współczynnika zależności na grupowanie szeregów czasowych Tomasz Szubert: Czynniki różnicujące poziom zadowolenia z życia oraz wartości życiowe osób sprawnych i niepełnosprawnych w świetle badań Diagnozy społecznej
4 6 Spis treści Marcin Szymkowiak: Konstrukcja estymatorów kalibracyjnych wartości globalnej dla różnych funkcji odległości Wojciech Roszka: Szacowanie łącznych charakterystyk cech nieobserwowanych łącznie Justyna Brzezińska: Metody wizualizacji danych jakościowych w programie R Agata Sielska: Regionalne zróżnicowanie potencjału konkurencyjnego polskich gospodarstw rolnych w województwach po akcesji do Unii Europejskiej Mariusz Kubus: Liniowy model prawdopodobieństwa z regularyzacją jako metoda doboru zmiennych Beata Basiura: Metoda Warda w zastosowaniu klasyfikacji województw Polski z różnymi miarami odległości Katarzyna Wardzińska: Wykorzystanie metody obwiedni danych w procesie klasyfikacji przedsiębiorstw Katarzyna Dębkowska: Modelowanie upadłości przedsiębiorstw oparte na próbach niezbilansowanych Danuta Tarka: Wpływ metody doboru cech diagnostycznych na wyniki klasyfikacji obiektów na przykładzie danych dotyczących ochrony środowiska Artur Czech: Zastosowanie wybranych metod doboru zmiennych diagnostycznych w badaniach konsumpcji w ujęciu pośrednim Beata Bal-Domańska: Ocena relacji zachodzących między inteligentnym rozwojem a spójnością ekonomiczną w wymiarze regionalnym z wykorzystaniem modeli panelowych Mariola Chrzanowska: Ordinary kriging i inverse distance weighting jako metody szacowania cen nieruchomości na przykładzie warszawskiego rynku Adam Depta: Zastosowanie analizy wariancji w badaniu jakości życia na podstawie kwestionariusza SF-36v Maciej Beręsewicz, Tomasz Klimanek: Wykorzystanie estymacji pośredniej uwzględniającej korelację przestrzenną w badaniach cen mieszkań Karolina Paradysz: Benchmarkowa analiza estymacji dla małych obszarów na lokalnych rynkach pracy Anna Gryko-Nikitin: Dobór parametrów w równoległych algorytmach genetycznych dla problemu plecakowego Tomasz Ząbkowski, Piotr Jałowiecki: Zastosowanie reguł asocjacyjnych do analizy danych ankietowych w wybranych obszarach logistyki przedsiębiorstw przetwórstwa rolno-spożywczego Agnieszka Przedborska, Małgorzata Misztal: Zastosowanie metod statystyki wielowymiarowej do oceny wydolności stawów kolanowych u pacjentów z chorobą zwyrodnieniową leczonych operacyjnie Dorota Perło: Rozwój zrównoważony w wymiarze gospodarczym, społecznym i środowiskowym analiza przestrzenna
5 Spis treści 7 Ewa Putek-Szeląg, Urszula Gierałtowska, Analiza i diagnoza wielkości produkcji energii odnawialnej w Polsce na tle krajów Unii Europejskiej Summaries Sabina Denkowska, Kamil Fijorek, Marcin Salamaga, Andrzej Sokołowski: VIth-term Sejm a voting machine Barbara Pawełek, Adam Sagan: Latent variables in econometric models respecification of Klein I model Jan Paradysz: New possibilities for studying the situation on the labour market Krzysztof Najman: Self-learning neural network of GNG type in the dynamic clustering of high-dimensional data Kamila Migdał-Najman: Applying the one-dimensional SOM network to select variables in dynamic clustering Aleksandra Matuszewska-Janica, Dorota Witkowska: Gender wage gap: application of classification trees Iwona Foryś, Ewa Putek-Szeląg: Spatial classification of communes by usable land traded by the APA in the Zachodniopomorskie voivodeship Joanna Banaś, Małgorzata Machowska-Szewczyk: Classification of Internet banking accounts including symbolic variables Marta Jarocka: The impact of the method of the selection of diagnostic variables on the result of linear ordering on the example of ranking of universities in Poland Anna Zamojska: Empirical analysis of the consistency of mutual fund ranking for different portfolio performance measures Dorota Rozmus: Comparison of accuracy of affinity propagation clustering and cluster ensembles based on bagging idea Ewa Wędrowska: Sensitivity of divergence measures as structure dissimilarity measurements Katarzyna Wójcik, Janusz Tuchowski: Machine translation impact on the results of the sentiment analysis Małgorzata Misztal: Assessment of the influence of selected imputation methods on the results of object classification using classification trees Anna Czapkiewicz, Beata Basiura: Simulation study of the selection of coefficient depending on the clustering time series Tomasz Szubert: Factors differentiating the level of satisfaction with life and the life s values of people with and without disabilities in the light of the Social Diagnosis survey Marcin Szymkowiak: Construction of calibration estimators of totals for different distance measures
6 8 Spis treści Wojciech Roszka: Joint characteristics estimation of variables not jointly observed Justyna Brzezińska: Visualizing categorical data in R Agata Sielska: Regional diversity of competitiveness potential of Polish farms after the accession to the European Union Mariusz Kubus: Regularized linear probability model as a filter Beata Basiura: The Ward method in the application for classification of Polish voivodeships with different distances Katarzyna Wardzińska: Application of Data Envelopment Analysis in company classification process Katarzyna Dębkowska: Modeling corporate bankruptcy based on unbalanced samples Danuta Tarka: Influence of the features selection method on the results of objects classification using environmental data Artur Czech: Application of chosen methods for the selection of diagnostic variables in indirect consumption research Beata Bal-Domańska: Assessment of relations occurring between smart growth and economic cohesion in regional dimension using panel models. 263 Mariola Chrzanowska: Ordinary kriging and inverse distance weighting as methods of estimating prices based on Warsaw real estate market Adam Depta: Application of analysis of variance in the study of the quality of life based on questionnaire SF-36v Maciej Beręsewicz, Tomasz Klimanek: Using indirect estimation with spatial autocorrelation in dwelling price surveys Karolina Paradysz: Benchmark analysis of small area estimation on local labor markets Anna Gryko-Nikitin: Selection of various parameters of parallel evolutionary algorithm for knapsack problems Tomasz Ząbkowski, Piotr Jałowiecki: Application of association rules for the survey of data analysis in the selected areas of logistics in food processing companies Agnieszka Przedborska, Małgorzata Misztal: Using multivariate statistical methods to assess the capacity of the knee joint among the patients treated surgically for osteoarthritis Dorota Perło: Sustainable development in the economic, social and environmental dimensions spatial analysis Ewa Putek-Szeląg, Urszula Gierałtowska: Analysis and diagnosis of the volume of renewable energy production in Poland compared to EU countries
7 PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 207 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania ISSN Maciej Beręsewicz, Tomasz Klimanek Uniwersytet Ekonomiczny w Poznaniu WYKORZYSTANIE ESTYMACJI POŚREDNIEJ UWZGLĘDNIAJĄCEJ KORELACJĘ PRZESTRZENNĄ W BADANIACH CEN MIESZKAŃ Streszczenie: Artykuł przedstawia propozycję wykorzystania metod estymacji pośredniej (w tym także metody, która uwzględnia korelację przestrzenną) do oszacowania pewnych charakterystyk rynku nieruchomości w województwie wielkopolskim. W konstrukcji odpowiednich estymatorów statystyki małych obszarów autorzy postanowili wykorzystać, oprócz modeli przekrojowych, także najnowsze podejścia w estymacji pośredniej wykorzystujące zależności przestrzenne. Ze względu na utrudniony dostęp do danych transakcyjnych badania oparte zostały na danych ofertowych zawierających informację o lokalizacji nieruchomości w przestrzeni geograficznej (dane zorientowane przestrzennie). Słowa kluczowe: statystyka małych obszarów, autokorelacja przestrzenna, analiza rynku nieruchomości. 1. Wstęp W ostatnich latach obserwuje się wzrost zainteresowania metodami estymacji pośredniej w Polsce. Wiele z dotychczasowych zastosowań dotyczyło problemów zwiększenia pokrycia informacyjnego dla potrzeb statystyki publicznej [Dehnel, Gołata 2006; Gołata 2004; Klimanek, Szymkowiak 2012; Kubacki 2008; Paradysz 2003]. Jednakże od samego początku stosowania metod statystyki małych obszarów podkreślano, że naturalnym odbiorcą wyników szacunków wydaje się obok statystyki publicznej i instytucji samorządowych także szeroko rozumiany biznes. Należy także zwrócić uwagę na fakt, że większość zastosowań statystyki małych obszarów dotyczy estymacji charakterystyk rynku pracy, demografii i statystyki społecznej; stosunkowo niewielka jest liczba artykułów poświęconych zastosowaniom estymacji pośredniej w badaniach biznesowych. Celem artykuł jest zastosowanie estymacji pośredniej do oszacowania przeciętnej ceny metra kwadratowego mieszkań na rynku nieruchomości mieszkaniowych w Poznaniu w sierpniu 2012 r.. Zastosowane podejście może zdaniem autorów, stanowić alternatywę w przypadku braku dostępu do danych transakcyjnych. Ponadto, przyjmując założenie o występowaniu wpływu lokalizacji w mieście na średnią cenę
8 282 Maciej Beręsewicz, Tomasz Klimanek mieszkania, autorzy podjęli próbę zastosowania w konstrukcji estymatora modelu wykorzystującego autokorelację przestrzenną. Tego rodzaju podejście zostało opisane w projekcie EURAREA, ale liczba zastosowań modeli wciąż jest niewystarczająca i wynika głównie z niedostatecznego wykorzystania istniejących informacji geoprzestrzennych informacji opartych na współrzędnych geograficznych obiektów lub pewnych szczególnych charakterystykach związanych z tymi punktami. 2. Opis procedury badawczej Rynek nieruchomości charakteryzuje się utrudnionym dostępem do danych charakteryzujących zawierane transakcje kupna-sprzedaży. W Internecie natomiast znajduje się spora liczba portali zajmujących się przedstawianiem ofert dotyczących m.in. sprzedaży mieszkań na rynku zarówno pierwotnym, jak i wtórnym. Stanowią one cenne źródło informacji na temat mieszkań oferowanych przez osoby prywatne oraz pośredników. Portale zawierają ceny ofertowe, co oznacza, że mogę się różnić od cen transakcyjnych, jednak m.in. Narodowy Bank Polski publikuje ceny ofertowe jako element cyklicznych raportów dotyczących rynku nieruchomości 1, a także tworzy bazę rynku nieruchomości (BaRn), w której uwzględnia zmiany cen zarówno transakcyjnych, jak i ofertowych. Portale, takie jak Gratka, Domy.pl (przy współpracy Open Finance) czy OtoDom, na podstawie cen ofertowych tworzą indeksy cen mieszkań oraz analizują sytuację na rynku nieruchomości 2. W związku z ograniczonymi możliwościami uzyskania informacji na temat cen transakcyjnych oraz wykorzystywaniem cen ofertowych w analizach GUS i NBP postanowiono przeprowadzić analizę z wykorzystaniem cen oferowanych na portalach internetowych. W tym celu w programie R z wykorzystaniem pakietów XML oraz RCurl został napisany program (potocznie nazywany pająkiem internetowym ) umożliwiający automatyczne pobieranie informacji o ofertach mieszkań z rynku pierwotnego i wtórnego. Działanie programu opiera się na następujących krokach: 1. Wejdź na stronę wyników mieszkań dla Poznania. Ustal i = 1 oraz n, które oznacza ostatnią stronę. 1.1 Pobierz ze strony wszystkie linki, które dotyczą ofert mieszkań (j = 1 m). 1.2 Dla każdego linku (j = 1... m) z punktu 1.1 wejdź na stronę i pobierz informacje o mieszkaniu. 1.3 Jeżeli pobrano informacje o wszystkich mieszkaniach z 1.1, wróć do punktu 1. 1 Raporty można znaleźć na stronie: nieruchomosci/index1.html. 2 Opracowania i raporty można znaleźć na stronach internetowych czy
9 Wykorzystanie estymacji pośredniej uwzględniającej korelację przestrzenną Przejdź na kolejną stronę wyszukiwań (i = i + 1). Jeżeli nie jest to ostatnia strona (i n), wróć do punktu 1, w przeciwnym wypadku przejdź do punktu Zakończ działanie pętli. Program działa do momentu, aż odwiedzi wszystkie strony zawierające wyniki wyszukiwań zadanych na początku (Poznań, rynek wtórny) oraz podstrony zawierające informacje o mieszkaniach. Oferty mieszkań były opisane szeregiem zmiennych, m.in. takich jak ceny mieszkania, ceny metra kwadratowego, liczba pokoi, powierzchnia, jak również informacja na temat położenia (w postaci współrzędnych geograficznych). Osoby zajmujące się publikowaniem informacji o danej nieruchomości umieszczały dodatkowe informacje, które nie występowały dla wszystkich ofert (np. typ budynku, rok budowy, stan). Na potrzeby artykułu z portalu Domy.pl pobrano ofert dotyczących mieszkań z wtórnego rynku nieruchomości mieszkaniowych w Poznaniu w sierpniu 2012 r., które po zastosowaniu omówionych w kolejnym rozdziale technik czyszczenia danych ograniczono do 9952 ofert. Pierwszym etapem czyszczenia uzyskanego zbioru danych była eliminacja obserwacji powtarzających się. Deduplikacji dokonano, porównując ID oraz linki do ofert mieszkań. Następnie usunięto z analizy oferty mieszkań, które nie zawierały informacji o powierzchni, liczbie pokoi oraz położeniu. Kolejnym etapem było wykorzystanie metody Least Trimmed Squares znajdującej się w poleceniu PROC ROBUSTREG pakietu SAS w celu detekcji wartości odstających. Metoda ta została zaproponowana przez Rousseeuwa [1984] i ma następującą postać: gdzie: θ LTS = arg min θ Q LTS (θ), (1) h 2 Q LTS (θ) = i=1 r (i), (2) r 2 (1) r 2 2 (2) r (n) są uszeregowanymi kwadratami reszt r 2 i = y i x T i θ 2, i = 1,, n, a h określone jest w przedziale n + 1 h 3n+p W pakiecie SAS wartość progowa jest domyślnie ustawiona na h = 3n+p+1. 4 Efektem etapu czyszczenia danych była baza, którą na potrzeby badania nazwano pseudopopulacją mieszkań w Poznaniu w sierpniu 2012 r. Na rysunku 1 zaprezentowano rozkład cen mieszkań oraz cen metra kwadratowego mieszkań w pseudopopulacji, tzn. po zastosowaniu procedur czyszczenia danych. Rozkład ceny metra kwadratowego jest bardziej zbliżony do rozkładu normalnego niż rozkład cen mieszkań. W związku z faktem, że celem badania symulacyjnego miało być oszacowanie średniej ceny metra kwadratowego według jednostek ewidencyjnych miasta Pozna-
10 284 Maciej Beręsewicz, Tomasz Klimanek Rys. 1. Rozkład ceny oraz (PRICE) ceny m 2 (UNIT_PRICE) mieszkań w pseudopopulacji Źródło: opracowanie własne w pakiecie SAS. nia (obrębów 3 ), a w populacji zawarta była jedynie informacja o współrzędnych geograficznych mieszkań znajdujących się na rynku ofert, należało przyporządkować mieszkaniom identyfikator obrębu. W tym celu posłużono się procedurą PROC GINSIDE, która sprawdza, czy podane współrzędne geograficzne mieszkania należą do określonego poligonu (obrębu miasta Poznania), a jeśli tak, to rekord w bazie zostaje uzupełniony o identyfikator tego poligonu. Następnie z populacji tej wylosowano 1000 prób o wielkości 5%, stosując schemat losowania prostego. Zastosowany schemat losowania spowodował, że w przypadku obrębów o niewielkiej liczebności mieszkań w populacji, w wylosowanych próbach reprezentacja mieszkań była niewielka lub nawet równa 0. Rozkład przestrzenny liczebności mieszkań w pseudopopulacji i badaniu symulacyjnym przedstawia rys Autorzy zdają sobie sprawę z faktu, że obręb geodezyjny nie jest najlepszym kryterium delimitacji przestrzeni dla wyznaczenia obszarów cenności, gdyż te przekraczają granice administracyjne (geodezyjne). Przyjęcie takiej jednostki przestrzennej wynikało z określonego zdefiniowania małego obszaru (domeny), dla której można było uzyskać podkład dla mapy numerycznej.
11 Wykorzystanie estymacji pośredniej uwzględniającej korelację przestrzenną Rys. 2. Przestrzenny rozkład liczby mieszkań w pseudopopulacji i badaniu symulacyjnym Źródło: opracowanie własne w pakiecie SAS.
12 286 Maciej Beręsewicz, Tomasz Klimanek Dla każdej z prób do oszacowania średniej ceny metra kwadratowego w obrębach miasta Poznania zastosowano 4 estymatory, przy czym w przypadku estymatorów typu GREG, EBLUP_B i SEBLUP, które wykorzystują zmienne pomocnicze z próby i spoza próby, do modelowania ceny metra kwadratowego wykorzystano powierzchnię mieszkania i liczbę pokoi. Należy zwrócić uwagę, że jakość modelu jest słaba, gdyż zmienność ceny metra kwadratowego została wyjaśniona przez wybrane zmienne objaśniające jedynie w około 12%. Charakterystykę modelu w pseudopopulacji przedstawia tab. 1. Tabela 1. Charakterystyka modelu w pseudopopulacji Zmienna Liczba stopni swobody Oszacowanie parametru Błąd standardowy Statystyka t-studenta Prawdopodobieństwo testowe Wyraz wolny ,65 32,58 207,05 <,0001 AREA 1 16,00 0,98 16,36 <,0001 ROOMS 1 135,55 18,27 7,42 <,0001 R 2 = 0,123, współczynnik zmienności losowej = 16,2% Źródło: obliczenia własne w pakiecie SAS. Zastosowano estymatory 4 : estymator bezpośredni (Horvitza-Thompsona) Y DIRECT d = 1 N i ud w id y id, (3) d gdzie N d = i ud w id oraz w id = 1 π id przy założeniu, że π id,jd = 0 dla wszystkich d d lub i j; estymator GREG yid T id = x β + ε, (4) id gdzie E( εid ) 0, Var ( ε ) σε 2 = id =, Yˆ GREG d 1 y 1 x i T i = Xd ˆ + N ˆ d i sd i N π d i s π d i T βˆ, (5) 1 gdzie Nˆ d = i βˆ są oszacowane z wykorzystaniem ważonej metody najmniejszych kwadratów poprzez użycie wag wynikających ze schematu i s π d i losowania: 4 Wzory na oszacowania błędów średniokwadratowych zostały pominięte ze względu na ograniczania objętości tekstu niniejszej publikacji. Są one umieszczone w dokumentacji projektu EURAREA na stronie Urzędu Statystycznego Wielkiej Brytanii
13 Wykorzystanie estymacji pośredniej uwzględniającej korelację przestrzenną β ˆ T = wid xid xid wid xid y ; (6) id i ud i ud estymator EBLUP_B będący kombinacją liniową estymatora bezpośredniego i syntetycznego (EURAREA_Project_Reference_Volume 2004), Y d EBLUP_B = γ d Y d DIRECT + (1 γ d )X.d T β (7) γ d = σ u 2 σ u 2 +σ e 2, przy czym u iid N e iid N 2 2 d ~ (0, σu ), id ~ (0, σe ) β = (x T D 1 x) 1 x T D 1 y, gdzie: y wektor obserwacji na zmiennej objaśnianej, T x macierz o wierszach składających się z x. d, D macierz o iteracyjnie aktualizowanych elementach (σ 2 u + σ 2 e ) na diagonali; estymator SEBLUP 5 uwzględniający autokorelację efektów losowych związanych z lokalizacją domen w przestrzeni [Saei, Chambers 2004; D Alò, Falorsi, Solari 2004]. W zapisie macierzowym model można zapisać następująco: y = Xβ + Zu + e, (8) gdzie: y jest wektorem zmiennej objaśnianej, X i Z są znanymi macierzami rzędu odpowiednio: N P (liczba obserwacji razy liczba zmiennych pomocniczych) i N D (liczba obserwacji razy liczba małych obszarów). Macierz Z jest macierzą incydencji zdefiniowaną następująco:.. 0 1N Z =, gdzie 1N d jest wektorem o wymiarach N, którego d 0.. 1N D wszystkie elementy są równe 1, u oraz e są wektorami zmiennych losowych o wartościach oczekiwanych równych 0 oraz macierzy wariancji kowariancji odpowiednio: 2 2 N ~ [ 0, σ A] oraz N [ 0, σ I ], elementy a (dd ') macierzy A są dane wzorem: U ~ N 5 SEBLUP Spatial EBLUP.
14 288 Maciej Beręsewicz, Tomasz Klimanek dist( dd') a( dd ') = 1 + δ ( dd ') exp, (9) α gdzie: dist(dd' ) oznacza odległość między małymi obszarami d i d. 1 a α jest parametrem skali. 3. Uzyskane wyniki δ ( dd ') 0 for = 1 for d = d' d d', (10) Ze względu na ograniczania objętości tekstu niniejszej publikacji wyniki zostaną przedstawione w sposób bardzo syntetyczny 6. Jednostki ewidencyjne (obręby) zostały podzielone na trzy kategorie: Kategoria A liczebność próby we wszystkich symulacjach przekraczała 3 mieszkania. Kategoria B liczebność próby w ponad 50% symulacji przekraczała 3. Kategoria C liczebność próby w więcej niż 50% symulacji była mniejsza bądź równa 3. Dla wymienionych powyżej kategorii wybrano po jednym przykładzie obrębu i dokonano oceny obciążenia 4 zastosowanych estymatorów i oceny wzrokowej wariancji tych estymatorów. Podkreślić jednak należy, że charakterystyki rozkładów są podobne dla pozostałych obrębów w ramach danej kategorii, stąd w ocenie autorów zaprezentowane przypadki są dobrymi reprezentantami obrębów w poszczególnych kategoriach. Rys. 3. Rozkład estymatorów w obrębie Golęcina (kat. A), Moraska (kat. B) oraz Radojewa (kat. C) Źródło: opracowanie własne w pakiecie SAS. 6 Autorzy dysponują rozkładem estymatorów dla wszystkich 33 analizowanych obrębów, ale ograniczenia publikacji spowodowały to, że możliwa jest prezentacja jedynie wybranych jednostek ewidencyjnych.
15 Wykorzystanie estymacji pośredniej uwzględniającej korelację przestrzenną Wnioski Przeprowadzone badanie symulacyjne dostarczyło pewnych wniosków, które można sformułować następująco: estymator bezpośredni, chociaż nieobciążony, charakteryzuje się dwiema podstawowymi wadami w przypadku estymacji dla małych domen: 1) ma nieakceptowalną wariancję, a w związku z tym także błąd szacunku, 2) w przypadku zerowej próby w domenie nie można wyznaczyć oceny estymatora; uogólniony estymator regresyjny, chociaż umożliwia uzyskanie oceny estymatora w przypadku zerowych prób, to jednak charakteryzuje sie równie dużą wariancją co estymator bezpośredni; estymatory syntetyczne i uwzględniające autokorelację przestrzenną charakteryzują się niewielką wariancją. W porównaniu do estymatorów bezpośrednich są one jednak obciążone; analiza przestrzennego rozkładu estymatora uwzględniającego autokorelację przestrzenną sugeruje, że może być on dobrym narzędziem do szacowania cen nieruchomości w domenach, którymi są na przykład części miast o niewielkiej liczbie mieszkań na wtórnym rynku nieruchomości mieszkaniowych. Literatura AiM Property Małeccy Adamiczka spółka jawna, Analiza cen transakcyjnych lokali mieszkalnych, Poznań D Alò M., Falorsi S., Solari F., EURAREA Documentation on SAS/IML program on Linear Mixed Model with Spatial Correlated Area Effects in Small Area Estimation, EURAREA Deliverable, Dehnel G., Gołata E., Attempts to estimate basic information for small business in Poland, Statistics in Transition, Główny Urząd Statystyczny, Warszawa 2006, vol. 6, Number 5, s EURAREA_Project_Reference_Volume, Gołata E., Problems of estimate unemployment for small domains in Poland, Statistics in Transition, Główny Urząd Statystyczny, Warszawa 2004, vol. 6, Number 5, s Instytut Ekonomiczny Narodowego Banku Polskiego, Raport o sytuacji na rynku nieruchomości mieszkaniowych i komercyjnych w Polsce w 2011 r., NBP, Warszawa 2012 Klimanek T., Szymkowiak M., Zastosowanie estymacji pośredniej uwzględniającej korelację przestrzenną w opisie niektórych charakterystyk rynku pracy, [w:] Taksonomia 19, Klasyfikacja i analiza danych teoria i zastosowania, Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu, 2012, s Kubacki, J., Application of Bayesian estimation methods for small domains in the Polish Labor Force Survey, Acta Universitatis Lodziensis, Folia Oeconomica 216, Łódź 2008, s Paradysz J., Zasilanie publicznej statystyki regionalnej za pomocą estymacji dla małych obszarów w perspektywie wykorzystania rejestrów administracyjnych, Wiadomości Statystyczne, Główny Urząd Statystyczny, Warszawa 2003, nr 4, s Rao J.N.K., Small Area Estimation, John Wiley & Sons, Inc, 2004.
16 290 Maciej Beręsewicz, Tomasz Klimanek Rousseeuw P.J., Least median of squares regression, Journal of the American Statistical Association 1984, 79, Saei A., Chambers R., Small Area Estimation Under Linear and Generalized Linear Mixed Models With Time and Area Effects, University of Southampton, USING INDIRECT ESTIMATION WITH SPATIAL AUTOCORRELATION IN DWELLING PRICE SURVEYS Summary: The article presents the application of indirect estimation methods (including the method accounting for spatial correlation) to estimate some characteristics of real estate market in Wielkopolska Voivodeship. To build the small area estimators the authors decided to apply not only cross-sectional models but also the most up to date approach using spatial correlation. Because the access to the transactional data was not possible the research was based on the Internet data (offers) which included information about localization (spatially oriented data). Keywords: small area statistics, spatial autocorrelation, real estate market analysis.
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
Niepełnosprawność w świetle estymacji pośredniej na przykładzie województwa wielkopolskiego
Niepełnosprawność w świetle estymacji pośredniej na przykładzie województwa wielkopolskiego Michał Pietrzak 1,2, Tomasz Józefowski 2, Tomasz Klimanek 2, Marcin Szymkowiak 1,2 Uniwersytet Ekonomiczny w
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
Statystyka Małych Obszarów w badaniach próbkowych
Statystyka Małych Obszarów w badaniach próbkowych Łukasz Wawrowski l.wawrowski@stat.gov.pl Urząd Statystyczny w Poznaniu SKN Estymator, UEP 5.03.2012 1 Wprowadzenie Podstawowe pojęcia Badanie 2 Estymator
Ekonometria. Zastosowania Metod Ilościowych 30/2011
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2011 Ekonometria. Zastosowania Metod Ilościowych 30/2011 Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Available at:
Taksonomiczne aspekty estymacji pośredniej uwzględniającej autokorelację przestrzenną w statystyce gospodarczej
Urząd Statystyczny w Poznaniu Taksonomiczne aspekty estymacji pośredniej uwzględniającej autokorelację przestrzenną w statystyce gospodarczej Grażyna Dehnel Tomasz Klimanek Jacek Kowalewski CEL BADANIA:
PROGRAM KONFERENCJI SKAD 2012
PROGRAM KONFERENCJI SKAD 2012 9 września 2012 r. NIEDZIELA 15.00 21.00 Rejestracja uczestników konferencji - recepcja hotelu Golf Park Lipowy Most 17.00 21.00 Kolacja Restauracja Lipowy Most 18.30 20.00
estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń
estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń Łukasz Wawrowski, Maciej Beręsewicz 12.06.2015 Urząd Statystyczny w Poznaniu, Uniwersytet
STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY
STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY 2.1 Estymator Horvitza-Thompsona 2.1.1 Estymator Horvitza-Thompsona wartości średniej i globalnej w populacji p-nieobciążony
Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE
1 STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE 1.1 Podejścia w statystyce małych obszarów Randomizacyjne Wektor wartości badanej cechy traktowany jest jako nielosowy. Szacowana charakterystyka jest nielosowa
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci Łukasz Wawrowski Katedra Statystyki Uniwersytet Ekonomiczny w Poznaniu Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci 2 / 23 Plan
Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 2 3 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów
Pokój z widokiem: hedoniczne modele cen mieszkań. dr hab. Emilia Tomczyk Instytut Ekonometrii SGH
Pokój z widokiem: hedoniczne modele cen mieszkań dr hab. Emilia Tomczyk Instytut Ekonometrii SGH Artykuł M. Widłak [Instytut Ekonomiczny NBP], E. Tomczyk (2010) Measuring price dynamics: evidence from
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
strona 1 / 5 Specjalizacja: B4. Analiza kointegracyjna Publikacje:
Specjalizacja: B4. Analiza kointegracyjna Publikacje: 1. Autorzy: Grabowski Wojciech; Welfe Aleksander Tytuł: Global Stability of Dynamic Models Strony: 782-784 - Teoria ekonometrii (B1. Makroekonometria)
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój
1 REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój 2 DOTYCHCZASOWE MODELE Regresja liniowa o postaci: y
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
ŚLĄSKI PRZEGLĄD STATYSTYCZNY
Polskie Towarzystwo Statystyczne Oddział we Wrocławiu ŚLĄSKI Silesian Statistical Review Nr 8 (14) Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2o10 RADA PROGRAMOWA Walenty Ostasiewicz (przewodniczący),
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
Ewa Pancer-Cybulska, tukasz Olipra, Leszek Cybulski, Agata Suröwka TRANSPORT LOTNICZY A REGIONALNE RYNKI PRACY W POLSCE THE IMPACT OF AIR TRANSPORT
Ewa Pancer-Cybulska, tukasz Olipra, Leszek Cybulski, Agata Suröwka TRANSPORT LOTNICZY A REGIONALNE RYNKI PRACY W POLSCE THE IMPACT OF AIR TRANSPORT ON REGIONAL LABOUR MARICETS IN POLAND jt^l Wydawnictwo
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Ekonometria. Zastosowania metod ilościowych 18/2007
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2007 Ekonometria. Zastosowania metod ilościowych 18/2007 Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Available at:
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską
Dr Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską 1.
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych
Jacek Batóg Uniwersytet Szczeciński Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Agregacja wyników uzyskiwanych w odrębnych badaniach, często również przy pomocy
Instrumenty i efekty wsparcia Unii Europejskiej dla regionalnego rozwoju obszarów wiejskich w Polsce
Katarzyna Zawalińska Instrumenty i efekty wsparcia Unii Europejskiej dla regionalnego rozwoju obszarów wiejskich w Polsce Instytut Rozwoju Wsi i Rolnictwa Polskiej Akademii Nauk Warszawa 2009 SPIS TREŚCI
STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych
STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe
Część 1 to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych Czyli obserwujemy te
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 4 Mikołaj Czajkowski Wiktor Budziński Regresja kwantylowa W standardowej Metodzie Najmniejszych Kwadratów modelujemy warunkową średnią zmiennej objaśnianej: E( yi Xi) = μ ( Xi) Pokazaliśmy,
Spis treści. Wstęp... 9
Spis treści Wstęp.............................................................. 9 Małgorzata Rószkiewicz, Wizualizacja danych nominalnych oraz różnego typu danych porządkowych w procedurze skalowania optymalnego...
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
PORZĄDKOWANIE LINIOWE BŁĘDY PRZY INTERPRETACJI WYNIKÓW ORAZ SPOSÓB ICH ELIMINACJI
METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH Tom XVI/3, 2015, str. 118 128 PORZĄDKOWANIE LINIOWE BŁĘDY PRZY INTERPRETACJI WYNIKÓW ORAZ SPOSÓB ICH ELIMINACJI Marta Jarocka Katedra Informatyki Gospodarczej
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Zawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...
4 Prognozowanie historyczne Prognozowanie - przewidywanie przyszłych zdarzeń w oparciu dane - podstawowy element w podejmowaniu decyzji... prognozowanie nie jest celem samym w sobie a jedynie narzędziem
Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 2 Mikołaj Czajkowski Wiktor Budziński Klasyczny Model Regresji Liniowej (KMRL) Postać modelu regresji liniowej: yi = Xiβ + εi Modelujemy liniową zależność y od zmiennych objaśniających
Metody Ekonometryczne
Metody Ekonometryczne Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Metody Ekonometyczne Wykład 4 Uogólniona Metoda Najmniejszych Kwadratów (GLS) 1 / 19 Outline 1 2 3 Jakub Mućk Metody Ekonometyczne
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Metoda reprezentacyjna
Metoda reprezentacyjna Stanisław Jaworski Katedra Ekonometrii i Statystyki Zakład Statystyki Populacja, cecha, parametr, próba Metoda reprezentacyjna Przedmiotem rozważań metody reprezentacyjnej są metody
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
Czasowy wymiar danych
Problem autokorelacji Model regresji dla szeregów czasowych Model regresji dla szeregów czasowych y t = X t β + ε t Zasadnicze różnice 1 Budowa prognoz 2 Problem stabilności parametrów 3 Problem autokorelacji
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona
Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona
SYMULACYJNA OCENA POTENCJAŁU ROZWOJOWEGO MIAST WOJEWÓDZTWA LUBUSKIEGO W KONTEKŚCIE WSPÓŁPRACY TRANSGRANICZNEJ Z BRANDENBURGIĄ
Streszczenie SYMULACYJNA OCENA POTENCJAŁU ROZWOJOWEGO MIAST WOJEWÓDZTWA LUBUSKIEGO W KONTEKŚCIE WSPÓŁPRACY TRANSGRANICZNEJ Z BRANDENBURGIĄ Celem analiz było wskazanie miast i obszarów w województwie lubuskim,
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład II bogumil.konopka@pwr.edu.pl 2017/2018 Określenie rzeczywistej dokładności modelu Zbiór treningowym vs zbiór testowy Zbiór treningowy
Oszczędności gospodarstw domowych Analiza przekrojowa i analiza kohort
Oszczędności gospodarstw domowych Analiza przekrojowa i analiza kohort Barbara Liberda prof. zw. Uniwersytetu Warszawskiego Wydział Nauk Ekonomicznych Konferencja Długoterminowe oszczędzanie Szkoła Główna
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14
Statystyka #6 Analiza wariancji Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2015/2016 1 / 14 Analiza wariancji 2 / 14 Analiza wariancji Analiza wariancji jest techniką badania wyników,
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa. Paweł Strawiński Uniwersytet Warszawski Wydział Nauk Ekonomicznych 16 stycznia 2006 Streszczenie W artykule analizowane są właściwości
Opis wykonanych badań naukowych oraz uzyskanych wyników
Opis wykonanych badań naukowych oraz uzyskanych wyników 1. Analiza danych (krok 2 = uwzględnienie epistazy w modelu): detekcja QTL przy wykorzystaniu modeli dwuwymiarowych z uwzględnieniem różnych modeli
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
ROZKŁADY WYBRANYCH BOOTSTRAPOWYCH ESTYMATORÓW MEDIANY ORAZ ZASTOSOWANIE DOKŁADNEJ METODY PERCENTYLI DO JEJ PRZEDZIAŁOWEGO SZACOWANIA
PRZEGLĄD STATYSTYCZNY R. LXIII ZESZYT 4 2016 JOANNA KISIELIŃSKA 1 ROZKŁADY WYBRANYCH BOOTSTRAPOWYCH ESTYMATORÓW MEDIANY ORAZ ZASTOSOWANIE DOKŁADNEJ METODY PERCENTYLI DO JEJ PRZEDZIAŁOWEGO SZACOWANIA 1.
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Statystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba