XGBOOST JAKO NARZĘDZIE PROGNOZOWANIA SZEREGÓW CZASOWYCH
|
|
- Jakub Stankiewicz
- 5 lat temu
- Przeglądów:
Transkrypt
1 XGBOOST JAKO NARZĘDZIE PROGNOZOWANIA SZEREGÓW CZASOWYCH Filip Wójcik Objectivity Digital Transformation Specialists Doktorant na Uniwersytecie Ekonomicznym we Wrocławiu
2 Agenda Czym jest xgbost? Rossmann - konkurs/legenda Prognozowanie trudności w szkoleniu 04 Przygotowanie danych 05 Schemat treningowy 06 Porównanie z innymi modelami 07 Analiza wyników 08 Inne zbiory danych 09 Podsumowanie
3 Czym jest Xgboost? Algorytm klasyfikacyjno-regresyjny Przeznaczony głównie do klasyfikacji i regresji Optymalizuje wiele różnych funkcji scoringowych i błędu Obsługuje funkcje docelowe: Softmax Logit Liniowa Poissona Gamma Oparty na drzewach Bazowym estymatorem są drzewa decyzyjne Algorytm złożony ensemble Algorytm typu boosting zwiększenie wagi błędnych przykładów Każde kolejne drzewo uczy się na błędach poprzedniego Dobrze zrównoleglony Drzewa są zależne od siebie Zrównoleglenie następuje na poziomie pojedynczego drzewa przy budowaniu kolejnych węzłów XGBoost używa skompresowanego formatu danych, dzięki czemu oszczędzana jest pamięć
4 Czym jest Xgboost? l x 1, x 2 funkcja kosztu f i x funkcja budująca i te drzewo Źródło:
5 Czym jest Xgboost? Źródło:
6 Rossmann konkurs legenda Konkurs Kaggle.com z 2016r., w którym zadaniem było prognozowanie obrotu na podstawie wartości historycznych i danych z makrootocznia sklepów Udział wzięły 3303 drużyny Znacząca większość kerneli implementowała algorytm Xgboost Metryka ewaluacyjna RMSPE (and. Root mean squared percentage error) RMSPE = n 1 n i=1 y i y i y i 2 Zwycięzca osiągnął wynik ok. 10% błędu Typowy problem prognozowania szeregów czasowych, a nie klasyfikacji czy regresji
7 Prognozowanie trudności w szkoleniu Dwa rodzaje zmiennych: Zmienne statyczne opisujące mikrootocznie sklepu Szeregi czasowe wielkość sprzedaży i ilość klientów Problem szkolenia modelu dla szeregów czasowych: Standardowa walidacja krzyżowa nie zdaje egzaminu Losowy wybór obserwacji zaburza chronologię OOB error z tego samego powodu nie musi być najlepszym estymatorem błędu rzeczywistego Duża wariancja predykcji i rozbieżność walidacji lokalnej i na zbiorze walidacyjnym Konieczność zachowania zależności czasowych i nauczenia modelu ich rozumienia Zależności sezonowe (trendy miesięczne i tygodniowe) Zależności autokorelacyjne
8 Przygotowanie danych Day: 19, month: 3, year: 2015, Q: 1 Wyznaczenie numerycznych zmiennych czasu: Numer dnia tygodnia Numer miesiąca Numer kwartału μ q2 = 3835, σ q2 = 1805 Wyznaczenie indeksów sezonowych: Średnie i odchylenia standardowe Wyliczane dla dni tygodnia / kwartałów / miesięcy / półroczy / weekendów Wyznaczenie indeksów pomocniczych: Średnie ruchome różnych rzędów Liczone względem różnych okresów (dni tygodnia/kwartałów/miesięcy)
9 Przygotowanie danych Znaczniki czasu Zmienne statyczne y Indeksy sezonowe dzień tyg. Sklep Data Dzień tyg. Miesiąc Kwartał Typ sklepu Promocja Asortyment Sprzedaż μ sprzedaż miesiąc μ sprzedaż kwartał μ sprzedaż A TAK B C NIE A
10 Schemat treningowy Klasyczna walidacja krzyżowa nie sprawdziła się ze względu na zmienność danych w czasie Zastosowano metodologię charakterystyczną dla szkolenia modeli prognostycznych ARIMA, etc. Stopniowe przesuwanie okna prognozy i danych treningowych Szkolenie modelu na coraz większym wolumenie Dodatkowo, XGBoost wewnętrznie wyliczał OOBscore, oparty na próbkowaniu bootstrapowym Zbiór walidacyjny w konkursie obejmował dwa ostatnie miesiące udostępnionego wolumenu Źródło:
11 Porównanie z innymi modelami CEL BADAŃ I ICH ZAŁOŻENIA Problem badawczy Analiza porównawcza modeli prognozowania wykorzystujących zmienne egzogeniczne Porównanie trafności predykcji Porównanie w sposób systematyczny i dokładny prognoz modeli klasycznych oraz XGBoost Czy zachodzi statystycznie istotna różnica pomiędzy trafnością XGBoost a pozostałych modeli? Analiza istotności współczynników W przypadku modeli klasycznych interpretacja parametrów (średnich ruchomych, autokorelacji, różnicowania, etc.) W przypadku XGBoost istotność atrybutów
12 Porównanie z innymi modelami WYBÓR MODELI KLASYCZNYCH Sezonowość SARIMAX Średnie ruchome Zmienne egzogeniczne?? Modele klasyczne Postać parametryczna i interpretowalność XGBoost HOLT-WINTERS Sezonowość Wygładzanie wykładnicze?
13 Porównanie z innymi modelami SCHEMAT TRENIGOWY MODELI MODELE KLASYCZNE XGBOOST Jeden model per sklep Dla każdego sklepu wyszkolono osobny model Automatyczny dobór parametrów Parametry dla modeli wybierane były w sposób automatyczny, z użyciem funkcji optymalizacyjnych Interpolacja obserwacji brakujących W przypadku obserwacji brakujących uzupełniono je za pomocą interpolacji wielomianowej Jeden model dla wszystkich sklepów Badania eksperymentalne pokazały, że zmienne czasowe + zmienne egzogeniczne zapewniają dostateczny poziom generalizacji. Jeden model dla wszystkich sklepów jest wystarczający Walidacja szeregu czasowego Model trenowano w oparciu o kroczącą walidację szeregu czasowego dodatkowych instancji wybranych w każdej iteracji Drzewa regresji Estymatorem były drzewa regresji liniowej, a funkcją błędu - RMSPE
14 Analiza wyników Metryka (mediana) Wsp. Theila SARIMAX Holt-Winters XGBoost Wsp. R RMSPE (walidacja) RMSPE (oficjalny) Modele XGBoost - SARIMAX XGBoost - Holt- Winters Różnica średnich RMSPE Przedział ufności od Przedział ufności do P-wartość << << 0.01
15 CompetitionDistance Promo Store meansalesdow CompetitionOpenSinceMonth CompetitionOpenSinceYear day meansalesmonth Promo2SinceYear Promo2SinceWeek DayOfWeek meancustdow month StoreType meancustmonth Promo2 Assortment PromoInterval year meansalesq meancustq SchoolHoliday quarter Analiza wyników Istotność atryubutów Gain Cover Frequency 0,00% 5,00% 10,00% 15,00% 20,00% 25,00% 30,00% 35,00%
16 Analiza wyników XGBoost lepsze wyniki Wartości wszystkich metryk osiągają lepsze wartości dla algorytmu XGBoost Mniejsza wariancja Predykcje algorytmu XGBoost są stabilniejsze od pozostałych modeli odznaczają się dużo mniejsza wariancją 04 Istotność atrybutów znaczniki czasu Wśród pierwszych 15 najważniejszych atrybutów, znalazły się znaczniki czasu dzień, miesiąc, rok. XGBoost był w stanie zidentyfikować wpływ sezonowości 05 Istotność atrybutów indeksy sezonowe Wśród pierwszych 15 najważniejszych atrybutów, znalazły się indeksy sezonowe, takie jak średnia sprzedaż w dniu tygodnia czy miesiącu 03 Krótszy czas działania Szkolenie jednego modelu globalnie, dla wszystkich sklepów, zajmuje znacznie mniej czasu niż szkolenie 1115 modeli SARIMAX lub Holta-WIntersa 06 Istotność atrybutów zmienne statyczne Wśród pierwszych 15 najważniejszych atrybutów znalazły się także zmienne statyczne egzogeniczne opisujące charakterystykę sklepów
17 Inne zbiory danych RMSE MAE RMSPE XGB ARIMA RMSE MAE RMSPE XGB ARIMA
18 Wstępne wyniki badań zdają się wskazywać, że XGBoost dobrze sprawdza się, jako narzędzie prognozowania zarówno w typowych szeregach czasowych, jak i w przypadku danych o charakterze mieszanym. Niska wariancja Na wszystkich testowanych zbiorach danych, predykcje XGBoost odznaczają się niską wariancją i są stabilne. Podsumowanie Identyfikacja trendów i sezonowości Model jest w stanie rozpoznawać trendy i wahania sezonowe, a istotność tych atrybutów potwierdza manualna analiza. Obsługa zmiennych statycznych Model potrafi jednocześnie obsługiwać zmienne o charakterze indeksów czasowych oraz statycznych zmiennych egzogenicznych
19 Publikacje Chen, T. i Guestrin, C. (2016) XGBoost: A scalable tree boosting system, w Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD 16. New York, USA: ACM Press, s Ghosh, R. i Purkayastha, P. (2017) Forecasting profitability in equity trades using random forest, support vector machine and xgboost, w 10th International Conference on Recent Trades in Engineering Science and Management, s Gumus, M. i Kiran, M. S. (2017) Crude oil price forecasting using XGBoost, w 2017 International Conference on Computer Science and Engineering (UBMK). IEEE, s Gurnani, M. i in. (2017) Forecasting of sales by using fusion of machine learning techniques, w 2017 International Conference on Data Management, Analytics and Innovation (ICDMAI). IEEE, s
20 DZIĘKUJĘ ZA UWAGĘ
PROGNOZOWANIE DZIENNYCH OBROTÓW PRZEDSIĘBIORSTWA ZA POMOCĄ ALGORYTMU XGBOOST STUDIUM PRZYPADKU
Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN 2083-8611 Nr 375 2018 Informatyka i Ekonometria 14 Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki
Bardziej szczegółowo5. Model sezonowości i autoregresji zmiennej prognozowanej
5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowo3. Analiza własności szeregu czasowego i wybór typu modelu
3. Analiza własności szeregu czasowego i wybór typu modelu 1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej
Bardziej szczegółowoĆwiczenie 5 PROGNOZOWANIE
Ćwiczenie 5 PROGNOZOWANIE Prognozowanie jest procesem przewidywania przyszłych zdarzeń. Obszary zastosowań prognozowania obejmują np. analizę danych giełdowych, przewidywanie zapotrzebowania na pracowników,
Bardziej szczegółowoPROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK
1 PROGNOZOWANIE I SYMULACJE 2 http://www.outcome-seo.pl/excel1.xls DODATEK SOLVER WERSJE EXCELA 5.0, 95, 97, 2000, 2002/XP i 2003. 3 Dodatek Solver jest dostępny w menu Narzędzia. Jeżeli Solver nie jest
Bardziej szczegółowoDRZEWA REGRESYJNE I LASY LOSOWE JAKO
DRZEWA REGRESYJNE I LASY LOSOWE JAKO NARZĘDZIA PREDYKCJI SZEREGÓW CZASOWYCH Z WAHANIAMI SEZONOWYMI Grzegorz Dudek Instytut Informatyki Wydział Elektryczny Politechnika Częstochowska www.gdudek.el.pcz.pl
Bardziej szczegółowoZapraszamy do współpracy FACULTY OF ENGINEERING MANAGEMENT www.fem.put.poznan.pl Agnieszka Stachowiak agnieszka.stachowiak@put.poznan.pl Pokój 312 (obok czytelni) Dyżury: strona wydziałowa Materiały dydaktyczne:
Bardziej szczegółowo4. Średnia i autoregresja zmiennej prognozowanej
4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoStatystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Bardziej szczegółowoAnaliza autokorelacji
Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.
Bardziej szczegółowoPrognozowanie popytu. mgr inż. Michał Adamczak
Prognozowanie popytu mgr inż. Michał Adamczak Plan prezentacji 1. Definicja prognozy 2. Klasyfikacja prognoz 3. Szereg czasowy 4. Metody prognozowania 4.1. Model naiwny 4.2. Modele średniej arytmetycznej
Bardziej szczegółowoSTATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND Finanse i Rachunkowość rok 2 Analiza dynamiki Szereg czasowy: y 1 y 2... y n 1 y n. y t poziom (wartość) badanego zjawiska w
Bardziej szczegółowo7.4 Automatyczne stawianie prognoz
szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu
Bardziej szczegółowoStatystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Bardziej szczegółowoSystemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania
Bardziej szczegółowoEkonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Bardziej szczegółowo3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Bardziej szczegółowoSpis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Bardziej szczegółowoMotto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.
Motto Cz to nie zabawne, że ci sami ludzie, którz śmieją się z science fiction, słuchają prognoz pogod oraz ekonomistów? (K. Throop III) 1 Specfika szeregów czasowch Modele szeregów czasowch są alternatwą
Bardziej szczegółowot y x y'y x'x y'x x-x śr (x-x śr)^2
Na podstawie:w.samuelson, S.Marks Ekonomia menedżerska Zadanie 1 W przedsiębiorstwie toczy się dyskusja na temat wpływu reklamy na wielkość. Dział marketingu uważa, że reklama daje wysoce pozytywne efekty,
Bardziej szczegółowoRozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Bardziej szczegółowo... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...
4 Prognozowanie historyczne Prognozowanie - przewidywanie przyszłych zdarzeń w oparciu dane - podstawowy element w podejmowaniu decyzji... prognozowanie nie jest celem samym w sobie a jedynie narzędziem
Bardziej szczegółowoAnaliza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny
Analiza sezonowości Wiele zjawisk charakteryzuje się nie tylko trendem i wahaniami przypadkowymi, lecz także pewną sezonowością. Występowanie wahań sezonowych może mieć charakter kwartalny, miesięczny,
Bardziej szczegółowoPROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY
Joanna Chrabołowska Joanicjusz Nazarko PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY NA PRZYKŁADZIE PRZEDSIĘBIORSTWA HANDLOWEGO TYPU CASH & CARRY Wprowadzenie Wśród wielu prognoz szczególną rolę w zarządzaniu
Bardziej szczegółowoWydatki [zł] Wydatki 36,4 38, ,6 37,6 40, , ,5 33 Czas
Wydatki [zł] Zestaw zadań z Zastosowania metod progn. Zadanie 1 Dany jest następujący szereg czasowy: t 1 2 3 4 5 6 7 8 y t 11 14 13 18 17 25 26 28 Dokonaj jego dekompozycji na podstawowe składowe. Wykonaj
Bardziej szczegółowoALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Bardziej szczegółowoPROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU
PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU prof. dr hab. Andrzej Sokołowski 2 W tym opracowaniu przedstawiony zostanie przebieg procesu poszukiwania modelu prognostycznego wykorzystującego jedynie przeszłe
Bardziej szczegółowoZajęcia 1. Statystyki opisowe
Zajęcia 1. Statystyki opisowe 1. Znajdź dane dotyczące liczby mieszkańców w polskich województwach. Dla tych danych oblicz: a) Średnią, b) Medianę, c) Dominantę, d) Wariancję, e) Odchylenie standardowe,
Bardziej szczegółowoĆwiczenia IV
Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie
Bardziej szczegółowoZagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA
Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA Zadanie 1 (Plik danych: Transport w Polsce (1990-2015)) Na
Bardziej szczegółowoMetody Prognozowania
Wprowadzenie Ewa Bielińska 3 października 2007 Plan 1 Wprowadzenie Czym jest prognozowanie Historia 2 Ciągi czasowe Postępowanie prognostyczne i prognozowanie Predykcja długo- i krótko-terminowa Rodzaje
Bardziej szczegółowoUniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2010/2011
SYLLABUS na rok akademicki 00/0 Tryb studiów Stacjonarne Nazwa kierunku studiów EKONOMIA Poziom studiów Stopień pierwszy Rok studiów/ semestr III; semestr 5 Specjalność Bez specjalności Kod przedmiotu
Bardziej szczegółowoImię, nazwisko i tytuł/stopień KOORDYNATORA przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, dr
Tryb studiów Stacjonarne Nazwa kierunku studiów EKONOMIA Poziom studiów Stopień pierwszy Rok studiów/ semestr III; semestr 5 Specjalność Bez specjalności Kod przedmiotu w systemie USOS 1000-ES1-3EC1 Liczba
Bardziej szczegółowoImportowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22
Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach
Bardziej szczegółowowprowadzenie do analizy szeregów czasowych
19 stycznia 2016 Wprowadzenie Prezentacja danych Dekompozycja Preprocessing Model predykcji ARIMA Dobór parametrów modelu ARIMA Podsumowanie Definicje i przykłady Definicje Szeregiem czasowym nazywamy
Bardziej szczegółowoPrognozowanie na podstawie modelu ekonometrycznego
Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)
Bardziej szczegółowoEkonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE
Ekonometria Wykład 4 Prognozowanie, sezonowość Dr Michał Gradzewicz Katedra Ekonomii I KAE Plan wykładu Prognozowanie Założenia i własności predykcji ekonometrycznej Stabilność modelu ekonometrycznego
Bardziej szczegółowoEkonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota
Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych
Bardziej szczegółowoUCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji
UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji Filip Wójcik Wydział Zarządzania, Informatyki i Finansów Instytut Informatyki Ekonomicznej
Bardziej szczegółowoPROGNOZOWANIE CEN ENERGII NA RYNKU BILANSUJĄCYM
"DIALOG 0047/2016" PROGNOZOWANIE CEN ENERGII NA RYNKU BILANSUJĄCYM WYDZIAŁ ELEKT RYCZ N Y Prof. dr hab. inż. Tomasz Popławski Moc zamówiona 600 Rynek bilansujący Moc faktycznie pobrana Energia zakupiona
Bardziej szczegółowoProjekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski
Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem
Bardziej szczegółowoWytyczne do projektów
Wytyczne do projektów Prognozowanie i symulacje wszystkie rodzaje studiów Politechnika Śląska Wydział Organizacji i Zarządzania w Zabrzu rok akademicki 2012/13 Wytyczne do projektów Prognozowanie i symulacje
Bardziej szczegółowoSTATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Bardziej szczegółowoZad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Bardziej szczegółowoStudia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych
Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych PRZEDMIOT (liczba godzin konwersatoriów/ćwiczeń) Statystyka opisowa z elementami analizy regresji (4/19) Wnioskowanie
Bardziej szczegółowoĆwiczenia 13 WAHANIA SEZONOWE
Ćwiczenia 3 WAHANIA SEZONOWE Wyrównanie szeregu czasowego (wyodrębnienie czystego trendu) mechanicznie Zadanie. Badano spożycie owoców i przetworów (yt) (w kg) w latach według kwartałów: kwartał lata 009
Bardziej szczegółowoWprowadzenie do teorii prognozowania
Wprowadzenie do teorii prognozowania I Pojęcia: 1. Prognoza i zmienna prognozowana (przedmiot prognozy). Prognoza punktowa i przedziałowa. 2. Okres prognozy i horyzont prognozy. Prognozy krótkoterminowe
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Bardziej szczegółowoStatystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Bardziej szczegółowoDrzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
Bardziej szczegółowoPrzykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość
Dwie metody Klasyczna metoda histogramu jako narzędzie do postawienia hipotezy, jaki rozkład prawdopodobieństwa pasuje do danych Indukcja drzewa decyzyjnego jako metoda wykrycia klasyfikatora ukrytego
Bardziej szczegółowoKolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Bardziej szczegółowoTestowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Bardziej szczegółowoK wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Bardziej szczegółowoWykorzystanie metod wygładzania wykładniczego do prognozowania kursu sprzedaży EUR
Wykorzystanie metod wygładzania wykładniczego do prognozowania kursu sprzedaży EUR Katarzyna Halicka Politechnika Białostocka, Wydział Zarządzania, Katedra Informatyki Gospodarczej i Logistyki, e-mail:
Bardziej szczegółowoStatystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Bardziej szczegółowoFORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS
FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION
Bardziej szczegółowoStosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
Bardziej szczegółowoPrognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB
Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB Plan prezentacji Wprowadzenie do prognozowania Metody
Bardziej szczegółowoAnaliza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres
Bardziej szczegółowoKRÓTKOOKRESOWE PROGNOZOWANIE CENY EKSPORTOWEJ WĘGLA ROSYJSKIEGO W PORTACH BAŁTYCKICH. Sławomir Śmiech, Monika Papież
KRÓTKOOKRESOWE PROGNOZOWANIE CENY EKSPORTOWEJ WĘGLA ROSYJSKIEGO W PORTACH BAŁTYCKICH Sławomir Śmiech, Monika Papież email: smiechs@uek.krakow.pl papiezm@uek.krakow.pl Plan prezentacji Wprowadzenie Ceny
Bardziej szczegółowo-materiały reklamowe- PROGRAM WYCENA NIERUCHOMOŚCI W PODEJŚCIU PORÓWNAWCZYM METODAMI NUMERYCZNYMI
-materiały reklamowe- PROGRAM WYCENA NIERUCHOMOŚCI W PODEJŚCIU PORÓWNAWCZYM METODAMI NUMERYCZNYMI ADRESACI APLIKACJI. To nie jest aplikacja dla wszystkich. Ta aplikacja jest kierowana do AMBITNYCH RZECZOZNAWCÓW,
Bardziej szczegółowoZadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Bardziej szczegółowoArkadiusz Manikowski Zbigniew Tarapata. Prognozowanie i symulacja rozwoju przedsiębiorstw
Arkadiusz Manikowski Zbigniew Tarapata Prognozowanie i symulacja rozwoju przedsiębiorstw Warszawa 2002 Recenzenci doc. dr. inż. Ryszard Mizera skład i Łamanie mgr. inż Ignacy Nyka PROJEKT OKŁADKI GrafComp,
Bardziej szczegółowoAnaliza Szeregów Czasowych
Analiza Szeregów Czasowych Plan 1. Uwagi wstępne (szeregi, przykłady, prognozowanie, ) 2. Cel analizy szeregów czasowych 3. Struktura szeregów czasowych (trend/składowa stała, wahania sezonowe, wahania
Bardziej szczegółowoMETODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoPodstawy statystyki - ćwiczenia r.
Zadanie 1. Na podstawie poniższych danych wyznacz i zinterpretuj miary tendencji centralnej dotyczące wysokości miesięcznych zarobków (zł): 1290, 1500, 1600, 2250, 1400, 1600, 2500. Średnia arytmetyczna
Bardziej szczegółowoPrzedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Bardziej szczegółowoPo co w ogóle prognozujemy?
Po co w ogóle prognozujemy? Pojęcie prognozy: racjonalne, naukowe przewidywanie przyszłych zdarzeń stwierdzenie odnoszącym się do określonej przyszłości formułowanym z wykorzystaniem metod naukowym, weryfikowalnym
Bardziej szczegółowoBudowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego
Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne
Bardziej szczegółowoWłasności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Bardziej szczegółowoMetody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Bardziej szczegółowoTablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Bardziej szczegółowoStatystyka w zarządzaniu : pełny wykład / Amir D. Aczel. wyd. 1, dodr. 5. Warszawa; Spis treści
Statystyka w zarządzaniu : pełny wykład / Amir D. Aczel. wyd. 1, dodr. 5. Warszawa; 2011 Spis treści Od autora 11 1. Wprowadzenie i statystyka opisowa 15 1.1. Wprowadzenie 15 1.2. Percentyle i kwartyle
Bardziej szczegółowoNarzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
Bardziej szczegółowoStatystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33
Statystyka Wykład 4 Magdalena Alama-Bućko 19 marca 2018 Magdalena Alama-Bućko Statystyka 19 marca 2018 1 / 33 Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia,
Bardziej szczegółowoAnaliza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Bardziej szczegółowoRok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -
Nazwa modułu: Statystyka opisowa i ekonomiczna Rok akademicki: 2013/2014 Kod: ZIE-1-205-n Punkty ECTS: 6 Wydział: Zarządzania Kierunek: Informatyka i Ekonometria Specjalność: - Poziom studiów: Studia I
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoSzkolenie Analiza dyskryminacyjna
Szkolenie Analiza dyskryminacyjna program i cennik Łukasz Deryło Analizy statystyczne, szkolenia www.statystyka.c0.pl Szkolenie Analiza dyskryminacyjna Co to jest analiza dyskryminacyjna? Inną nazwą analizy
Bardziej szczegółowoLaboratorium 11. Regresja SVM.
Laboratorium 11 Regresja SVM. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk Dalej>. 3. Z
Bardziej szczegółowoEgzamin z ekonometrii - wersja ogólna
Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoLEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Bardziej szczegółowoBarometr Finansów Banków (BaFiB) propozycja badania koniunktury w sektorze bankowym
Jacek Batóg Uniwersytet Szczeciński Barometr Finansów Banków (BaFiB) propozycja badania koniunktury w sektorze bankowym Jednym z ważniejszych elementów każdej gospodarki jest system bankowy. Znaczenie
Bardziej szczegółowoRegresja nieparametryczna series estimator
Regresja nieparametryczna series estimator 1 Literatura Bruce Hansen (2018) Econometrics, rozdział 18 2 Regresja nieparametryczna Dwie główne metody estymacji Estymatory jądrowe Series estimators (estymatory
Bardziej szczegółowoPrognozowanie krótkoterminowe w procesie planowania zasobów
Analiza danych Data mining Sterowanie jakością Analityka przez Internet Prognozowanie krótkoterminowe w procesie planowania zasobów Marzena Imiłkowski,, GE Money Bank Andrzej Sokołowski, StatSoft Polska
Bardziej szczegółowoAgnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Bardziej szczegółowoLiczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
Bardziej szczegółowoPrognoza wybranych wskaźników rozwoju obrotu bezgotówkowego na lata
Prognoza wybranych wskaźników rozwoju obrotu bezgotówkowego na lata 2011 2016 Mariusz Kozakiewicz i Marek Kwas Szkoła Główna Handlowa 15 grudnia 2011 Spis treści Rozdział 1 Wprowadzenie... 3 1.1 Charakterystyka
Bardziej szczegółowoWidzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Bardziej szczegółowo1 Modele ADL - interpretacja współczynników
1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać
Bardziej szczegółowoSTATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
Bardziej szczegółowoTeoria Estymacji. Do Powyżej
Teoria Estymacji Zad.1. W pewnym przedsiębiorstwie wylosowano niezależnie próbę 25 pracowników. Staż pracy (w latach) tych pracowników w 1996 roku był następujący: 37; 34; 0*; 5; 17; 17; 0*; 2; 24; 33;
Bardziej szczegółowoSpis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Bardziej szczegółowoDOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,
Bardziej szczegółowoDopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
Bardziej szczegółowoPrognoza wybranych wskaźników rozwoju obrotu bezgotówkowego na lata 2014 2020
Prognoza wybranych wskaźników rozwoju obrotu bezgotówkowego na lata 2014 2020 Mariusz Kozakiewicz i Marek Kwas Szkoła Główna Handlowa 18 grudnia 2014 Spis treści Prognoza wybranych wskaźników rozwoju obrotu
Bardziej szczegółowo