Rola badań statystycznych w naukach ekonomicznych w świetle nowych możliwości określanych mianem big data

Podobne dokumenty
Rola badań statystycznych w naukach ekonomicznych w świetle nowych możliwości określanych mianem big data

Badania marketingowe

DYDAKTYKA I NAUKA MIROSŁAW SZREDER LOSOWE I NIELOSOWE PRÓBY W BADANIACH STATYSTYCZNYCH WPROWADZENIE

W8. Metody doboru próby w badaniach rynkowych

Rodzaje badań statystycznych

Badania marketingowe. Omówione zagadnienia. Społeczna Wyższa Szkoła Przedsiębiorczości i Zarządzania

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Jan Paradysz Nowe źródła danych w klasycznym paradygmacie informacji statystycznej

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

BADANIA PRÓBKOWE PROJEKTOWANIE I WNIOSKOWANIE

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA. CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe

Badania marketingowe. Podstawy metodyczne Stanisław Kaczmarczyk

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Badania marketingowe : podstawy metodyczne / Stanisław Kaczmarczyk. - wyd. 4. Warszawa, 2011

Statystyka w pracy badawczej nauczyciela

Wykład 2: Tworzenie danych

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Badania marketingowe

Badania marketingowe 2013_3. Krzysztof Cybulski Katedra Marketingu Wydział Zarządzania Uniwersytet Warszawski

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

Przykłady błędów w komunikatach prasowych dotyczących badań sondażowych. Etyka dziennikarska czy niewiedza?

W1. Wprowadzenie. Statystyka opisowa

W VI edycji badania w 2017 roku zastosowano następujące metody badawcze:

Wprowadzenie do analizy korelacji i regresji

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

Projektowanie (design) Eurostat

STATYSTYKA. dr Agnieszka Figaj

Statystyka wczoraj i dziś

CZĘŚĆ I. PRZYGOTOWANIE PROCESU BADAŃ MARKETINGOWYCH Faza identyfikacji problemów decyzyjnych lub okoliczności sprzyjających

kod nr w planie ECTS Przedmiot studiów PODSTAWY STATYSTYKI 7 2

Prawdopodobieństwo i statystyka

Przedmiot kod nr w planie ECTS studiów PODSTAWY STATYSTYKI TR/2/PP/STAT 6 3

METODY STATYSTYCZNE W BIOLOGII

Etapy modelowania ekonometrycznego

Dagmara Walada. Bezrobocie w UE na przykładzie Polski i wybranego kraju UE

Komitet Nauk Demograficznych PAN

PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA. CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe

Psychometria. Psychologia potoczna. Psychometria (z gr. psyche dusza, metria miara) Plan wykładów. Plan wykładów. Wprowadzenie w problematykę zajęć

Wykład z dnia 8 lub 15 października 2014 roku

Efekty kształcenia dla kierunku EKONOMIA

Odniesienie do opisu efektów kształcenia dla obszaru nauk społecznych WIEDZA K_W01

EFEKTY KSZTAŁCENIA ORAZ MACIERZE POKRYCIA KIERUNKU ANALITYKA GOSPODARCZA STUDIA LICENCJACKIE

studiów Podstawy Statystyki TR/2/PP/STAT 7 3

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Załącznik Nr 5 do Zarz. Nr 33/11/12 KARTA PRZEDMIOTU. 2. Kod przedmiotu ZP-Z1-19

MIĘDZYNARODOWE STOSUNKI GOSPODARCZE

METODY STATYSTYCZNE W BIOLOGII

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci

Testowanie hipotez statystycznych.

Statystyka i Analiza Danych

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

Metody statystyczne.

ANALITYKA GOSPODARCZA, STUDIA LICENCJACKIE WIEDZA

Podstawowe pojęcia statystyczne

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Badania marketingowe popytu jako podstawa rozliczeń w ramach umów o powierzenie organizacji komunikacji miejskiej. dr hab.

Ekonomiczny Uniwersytet Dziecięcy. Plan wykładu

ALGORYTM RANDOM FOREST

Dr hab. inż. Andrzej Szarata. Katedra Systemów Komunikacyjnych Politechnika Krakowska

Ewaluacja w polityce społecznej

Osoba posiadająca kwalifikacje II stopnia WIEDZA

Analiza współzależności zjawisk

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Badania marketingowe. Omówione zagadnienia

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

UCHWAŁA NR 50 Senatu Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie z dnia 28 maja 2012 r.

22-24 września, Gdynia

Statystyka matematyczna i ekonometria

Katedra Demografii i Statystki Ekonomicznej

KARTA KURSU. Kod Punktacja ECTS* 1

Statystyczno ekonometryczna analiza danych ekonomicznych

Kryteria i zasady w badaniach społecznych

W zależności od zajętego miejsca może otrzymać następujące godło: złote srebrne brązowe wyróżnienie

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Liczba godzin Punkty ECTS Sposób zaliczenia

O PEWNEJ ANOMALII W WYCENIE INSTRUMENTÓW DŁUŻNYCH

SYLABUS rok akademicki 2017/18 Wydział Ekonomiczny Uniwersytet Gdański

166 Wstęp do statystyki matematycznej

Kierunek studiów: EKONOMIA Specjalność: Analityka gospodarcza

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Testowanie hipotez statystycznych.

INTERNET ZASIĘG I KORZYSTANIE

METODY I TECHNIKI BADAŃ SPOŁECZNYCH

STUDIA METODOLOGICZNE

PRZEWODNIK PO PRZEDMIOCIE

Pierwszy indeks polskiego rynku sztuki

ZAKRES TEMATYCZNY EGZAMINU LICENCJACKIEGO

Wymagania edukacyjne przedmiot "Podstawy ekonomii" Dział I Gospodarka, pieniądz. dopuszczający

Badania sondażowe. Dobór próby do badania Rodzaje błędów w badaniach. Agnieszka Zięba

Zadania NBP inne niż polityka pieniężna. Anna Ziętek Paweł Zaniewski

Osoba posiadająca kwalifikacje II stopnia WIEDZA

Objaśnienie oznaczeń:

Wyniki badania profilaktyki lekarskiej w zakresie porad żywieniowych dla dzieci do lat 3

Transkrypt:

Mirosław Szreder Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański miroslaw.szreder@ug.edu.pl Rola badań statystycznych w naukach ekonomicznych w świetle nowych możliwości określanych mianem big data Komitet Statystyki i Ekonometrii PAN Warszawa, 14 marca 2018

Współczesne trendy i wyzwania 1. Rosnąca popularność badań próbkowych (niewyczerpujących) w ekonomii Zagrożenia: A) Skłonność do zastępowania właściwszych w danej problematyce badań jakościowych badaniami statystycznymi (ankietowymi); B) Nieświadomość zmian w strukturze całkowitego błędu badania próbkowego (w tym reprezentacyjnego) wśród części badaczy.

Wzrost w ostatnich latach roli błędów nielosowych: błędu pokrycia (coverage error) niekompletny lub złej jakości operat losowania, błędu spowodowanego odmowami respondentów udziału w badaniu (nonresponse error), błędu pomiaru (measurement error) zarejestrowaniem nieprawdziwych danych z winy ankietera lub respondenta, błędu przetwarzania zgromadzonych danych (postsurvey processing error). Powszechność stosowania badań statystycznych, a także trudności z ograniczeniem oddziaływania błędów nielosowych, powodują obniżanie się jakości badań i spadek zaufania do ich wyników.

Baker, H.K., Mukherjee T.K. (2007), Survey Research in Finance: Views from Journal Editors, International Journal of Managerial Finance, Vol. 3(1), s.11-25. Tablica 1. Rola badań ankietowych w czasopismach naukowych z zakresu finansów opinie redaktorów czasopism (odpowiedzi udzieliło jedynie 23 spośród 50 redaktorów czasopism). Które z następujących stwierdzeń najlepiej opisuje rolę, jaką powinny odgrywać badania próbkowe w literaturze z zakresu finansów Redaktorzy kluczowych czasopism Redaktorzy pozostałych czasopism Ogółem (n) Ogółem (%) A. Badanie próbkowe powinno być traktowane na równi z innymi oryginalnymi badaniami. B. Badanie próbkowe powinno pełnić rolę uzupełniającą względem innego oryginalnego badania. C. Rola badania próbkowego jest ograniczona (lub nie ma ono żadnego znaczenia) w stosunku do innych oryginalnych badań. D. Rola badania próbkowego powinna być następująca (podaj): - 10 10 43,5 4 6 10 43,5 2 1 3 13,0 - - - - Źrodło: [Baker i Mukherjee, 2007, s. 21].

Współczesne trendy i wyzwania 2. Integracja źródeł danych w badaniach statystycznych Tendencja ta kształtowana jest przez czynniki popytowe i podażowe. Popyt na dodatkową informację dążenie do większej dokładności badań (techniki ważenia, kalibracji), eliminowanie wpływu błędów nielosowych (i większa świadomość tych błędów) Stwierdzenie Lesliego Kisha: "sampling error is «over-researched«" z artykułu Richarda Platka i Carla-Erika Särndala pt. Can a statistician deliver?, "Wiadomości Statystyczne", 2001, nr 4, dobrze charakteryzuje zmianę akcentów w analizie błędów badań próbkowych.

Podaż informacji i danych: rejestry urzędowe (register-based statistics) cyt. z publikacji GUS: Statystyka publiczna współczesne oblicze (s. 34) Tam, gdzie to tylko możliwe, staramy się ograniczać zbieranie danych bezpośrednio od obywateli i przedsiębiorców, wykorzystując nowe, alternatywne źródła danych. Zgodnie ze światową tendencją, w ostatnich latach zintensyfikowaliśmy pozyskiwanie danych z systemów administracyjnych i pozaadministracyjnych.. metadata ogół informacji o zebranych danych statystycznych (ang. data about the data), czyli w szczególności ich struktura, zakres i kontekst, np. instrumenty pomiarowe, instrukcje dla ankieterów, sposoby pomiaru sondażowego, programy do przetwarzania danych; paradata zbiór szczegółowych informacji towarzyszących badaniu, na ogół trudnych do zarejestrowania, lecz użytecznych, np. czas, jaki potrzebował respondent na odpowiedzi w poszczególnych pytaniach czas między kliknięciami w ankiecie komputerowej;

Wyzwanie brak ugruntowanego i powszechnie akceptowanego podejścia teoretycznego. Przez big data rozumie się najczęściej taki sposób zdobywania nowej wiedzy i poznawania otaczającej nas rzeczywistości, który może być zrealizowany w dużej skali, dzięki nowym możliwościom gromadzenia i przetwarzania wielkich zbiorów danych.

Wyzwania dla statystyki Duże zbiory danych liczbowych to szansa dla statystyki, ale i zagrożenie. Są one rzadko jednorodne i nie jest uzasadnione założenie, iż dane te stanowią realizację ciągu zmiennych losowych o jednakowych rozkładach. Jednak ograniczanie się we wnioskowaniu statystycznym jedynie do podzbiorów danych jednorodnych pozbawia statystyka możliwości wiarygodnego opisania danego zjawiska lub procesu, a także trafnego przewidywania jego rozwoju w przyszłości.

Alan Greenspan doszukujący się przyczyn kryzysu (2007-2008) o modelach ryzyka: Gdyby modele te były poprawniej dopasowane do danych historycznych, obejmujących także okresy załamania gospodarczego, określiłyby one wymogi kapitałowe na znacznie wyższym poziomie, a świat finansowy byłby teraz w znaczne lepszym stanie. ( Had instead models been fitted more appropriately to historic periods of stress, capital requirements would have been much higher, and the financial world would be in far better shape, in my judgment )

Analityczna strona big data sprowadza się przede wszystkim do badania powiązań, współzależności i korelacji. Przewidywania oparte na korelacji są sercem big data Mayer-Schönberger V., Cukier K., BIG DATA, Rewolucja, która zmieni nasze myślenie, pracę i życie, Wyd. MT Biznes, Warszawa 2013

Zagrożenia: pozorne lub sztuczne korelacje (ang. spurious correlations), próba ograniczenia celów poznania: W big data ważna jest odpowiedź na pytanie, co się dzieje, a nie dlaczego. Nie zawsze musimy znać przyczyny jakiegoś zjawiska, możemy po prostu pozwolić danym mówić za siebie (s. 30). niepełna adekwatność technik wnioskowania statystycznego do bardzo dużych zbiorów danych z próby.

Wnioski Oba podejścia: klasyczne badania statystyczne oraz techniki eksploracji dużych zbiorów danych (big data) będą jeszcze przez dłuższy okres czasu komplementarne względem siebie. W niektórych zastosowaniach (np. w predykcji) big data wypiera stopniowo badania próbkowe. W tych zagadnieniach z kolei, w których wymagana jest duża precyzja szacunku, wiodące pozostaną badania reprezentacyjne.

Dziękuję za uwagę!