Ćwiczenie 5 PROGNOZOWANIE

Podobne dokumenty
ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

3. Modele tendencji czasowej w prognozowaniu

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Analiza autokorelacji

Ćwiczenia 13 WAHANIA SEZONOWE

5. Model sezonowości i autoregresji zmiennej prognozowanej

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Rozdział 8. Regresja. Definiowanie modelu

Statystyka i Analiza Danych

Wprowadzenie do analizy korelacji i regresji

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Prognozowanie popytu. mgr inż. Michał Adamczak

EKONOMETRYCZNA PROGNOZA ODPŁYWÓW Z BEZROBOCIA

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Po co w ogóle prognozujemy?

Ćwiczenia IV

Regresja i Korelacja

Metoda najmniejszych kwadratów

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej


Dopasowywanie modelu do danych

STATYSTYKA MATEMATYCZNA, LISTA 3

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

7.4 Automatyczne stawianie prognoz

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

4. Średnia i autoregresja zmiennej prognozowanej

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Analiza współzależności zjawisk

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Stosowana Analiza Regresji

3. Analiza własności szeregu czasowego i wybór typu modelu

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Wykład 6. Badanie dynamiki zjawisk

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

Wprowadzenie do teorii prognozowania

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Statystyka. Wykład 13. Magdalena Alama-Bućko. 18 czerwca Magdalena Alama-Bućko Statystyka 18 czerwca / 36

Indeksy dynamiki (o stałej i zmiennej podstawie)

Zajęcia 1. Statystyki opisowe

Analiza dynamiki zjawisk STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

LABORATORIUM Z FIZYKI

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

PDF created with FinePrint pdffactory Pro trial version

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Stosowana Analiza Regresji

Wykład 6. Badanie dynamiki zjawisk

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Ekonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wydatki [zł] Wydatki 36,4 38, ,6 37,6 40, , ,5 33 Czas

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

1 Podstawy rachunku prawdopodobieństwa

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Metoda najmniejszych kwadratów

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Regresja linearyzowalna

Testowanie hipotez statystycznych.

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

WYKŁAD 8 ANALIZA REGRESJI

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Prognozowanie na podstawie modelu ekonometrycznego

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

KORELACJE I REGRESJA LINIOWA

STATYSTYKA MATEMATYCZNA

Wykład 3 Hipotezy statystyczne

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Barometr Finansów Banków (BaFiB) propozycja badania koniunktury w sektorze bankowym

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Estymacja w regresji nieparametrycznej

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Rozpoznawanie obrazów

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Analiza Zmian w czasie

Transkrypt:

Ćwiczenie 5 PROGNOZOWANIE Prognozowanie jest procesem przewidywania przyszłych zdarzeń. Obszary zastosowań prognozowania obejmują np. analizę danych giełdowych, przewidywanie zapotrzebowania na pracowników, analizę trendów produkcji i sprzedaży, przewidywanie zużycia surowców, opracowanie urzędowych danych statystycznych, analizę wyników eksperymentów naukowych, itp. Wspólnymi cechami prognozowania są: - założenie, że podstawowe współzależności opisujące badany system będą istniały w przyszłości, - zmniejszanie się dokładności prognozowania wraz z czasem, - dokładność wyników prognozowania dla grup zjawisk jest zazwyczaj większa niż dla pojedynczych zjawisk - dokładność prognozowania zwiększa się wraz ze wzrostem liczby parametrów w modelu. Podstawowymi metodami prognozowania są: - analiza regresji, - analiza szeregów czasowych. Zarówno metody analizy regresji, jak i szeregów czasowych, można wykorzystać do uzupełniania brakujących danych w zbiorze danych, do diagnozowania badanych zjawisk oraz do prognozowania przebiegu badanych zjawisk w przyszłości. ANALIZA REGRESJI Termin regresja oznacza zależność funkcyjną pomiędzy zmienną niezależną X (lub kilkoma zmiennymi niezależnymi X 1, X 2, X n ) a zmienną zależną Y, tzn. szukamy zależności postaci: lub Y = f (X) + ε Regresja liniowa prosta Y = f (X 1, X 2,... X n ) + ε Opisuje zależność między cechami X i Y w postaci funkcji liniowej: Y = a + b X + ε Istnieją przy tym metody umożliwiające oszacowanie nieznanych parametrów a i b oraz nieznanej wariancji σ 2 losowego błędu ε. gdzie ε jest błędem losowym o rozkładzie normalnym o wartości oczekiwanej E(ε) = 0 i nieznanej wariancji, czyli N(0, σ). 1

Regresja nieliniowa prosta Opisuje zależność nieliniową typu: G(Y) = a + b H(X) + ε gdzie G i H są znanymi funkcjami. Wybrane modele nieliniowe oparte na powyższej zależności: model wykładniczy (exponential) Y e a b X model odwrotnościowy Y (reciprocal Y) model potęgowy (multiplicative) 1 Y a b X Y a b X model logarytmiczny (logarithmic) Y a b ln(x ) model pierwiastkowy X (square root X) Y a b X model pierwiastkowy Y (square root Y) 2 Y a b X Regresja wielomianowa pojedyncza (nieliniowa) Model ten stosujemy wtedy, gdy spodziewamy się, że zależność Y od X jest nieliniowa i jest szczególnej postaci, mianowicie ma postać zależności wielomianowej. Możemy wtedy dopasować model zależności typu wielomianowego, w którym n jest stopniem wielomianu, tzn. Y = b 0 + b 1 X + b 2 X 2 + + b n X n + ε, gdzie ε jest zmienną losową jak w modelu regresji prostej. Regresja liniowa wielokrotna Polega ona na znalezieniu zależności liniowej pomiędzy zmienną zależną Y a zmiennymi niezależnymi X 1, X 2, Xn, tzn. szukamy współczynników a 0, a 1, a n takich, że Y = a 0 + a 1 X 1 + a 2 X 2 + + a n X n + ε. 2

Procedury programu STATGRAPHICS Aby wyznaczyć model regresji prostej dla zmiennej niezależnej X i zmiennej zależnej Y należy wybrać narzędzie Relate / Simple Regression i wskazać, która zmienna jest niezależna a która zależna. W oknie analizy domyślnym modelem jest model liniowy. Aby znaleźć model najlepiej dopasowany dla zmiennych należy spośród opcji tekstowych wybrać Comparison of Alternative Models. Najlepszym model dla badanych cech jest pierwszy model z listy. Jest to model o największej wartości R kwadrat. Aby wykonać analizę dla wybranego modelu należy zaznaczyć jego nazwę w opcjach panelu Regression Analysis. Opcja tekstowa Forecasts umożliwia wyznaczenie nieznanych wartości zmiennej zależnej Y na podstawie podanych (w opcjach panelu) wartości zmiennej niezależnej X. W celu przeprowadzenia analizy regresji wielomianowej należy: w poleceniu Relate wybrać Polynomial Regression, a dla regresji wielokrotnej: w poleceniu Relate wybrać Multiple Regression. SZEREGI CZASOWE Szereg czasowy jest zbiorem danych pochodzących z następujących po sobie punktów czasowych (np. sprzedaż roczna z dziesięciu kolejnych lat). Tworzą go więc obserwacje Y 1, Y 2, Y n pewnej zmiennej losowej Y, dokonywane w równych odstępach czasu. Przyjmujemy, że Y jest zależną od czasu zmienną losową, a zmiany jej wartości oczekiwanych są opisywane następująco: Y t =E(Y t ) + ε t t = 1, 2,, n gdzie: E(Y t ) = f(t) + α(t) ( 1 ) E(Y t ) = f(t) * α(t) ( 2 ) ε t błąd losowy, f(t) funkcja czasu zwana trendem, α(t) regularne wahania sezonowe nakładające się na trend: - w sposób addytywny w przypadku zależności ( 1 ), i - w sposób multiplikatywny w przypadku ( 2 ). Błąd losowy ε t odzwierciedla przypadkowe odchylenie wartości badanej cechy od jej wartości oczekiwanej. Powstaje on na skutek między innymi: - losowego charakteru opisywanych zjawisk, - niedoskonałości modelu, - niedokładności przyrządów pomiarowych i - błędów pomiarowych. 3

Trend będziemy rozumieć jako funkcję odzwierciedlającą ogólne długoterminowe zachowanie się danych zmiany badanego zjawiska. Cykle to okresowe wahania danych nawet na bardzo długich przedziałach czasowych (nawet kilka lat), niekoniecznie o tej samej długości i niekoniecznie powtarzające się co ten sam okres. Sezonowość to okresowe wahania danych w stałym przedziale czasowym, które powtarzają się pewną ilość razy. Zakładając, że postać trendu f(t) oraz funkcja α(t) nie są znane, należy oszacować f(t) i α(t) na podstawie obserwacji Y 1, Y 2, Y n. Tak oszacowaną wartość Y t oznaczamy Ŷ t. Następnym zagadnieniem jest wyeliminowanie opisanych powyżej wahań w czasie metodą wyrównania lub wygładzania szeregów czasowych. Metoda ta oparta jest na zastępowaniu szeregu czasowego średnimi ruchomymi. Kolejnym zagadnieniem jest wnioskowanie o przyszłości, czyli obliczanie prognoz wartości cech w przyszłych okresach. Do wyznaczenia prognozy, w programie STATGRAPHICS jest do dyspozycji wiele modeli, jak np.: Linear Trend - model z trendem liniowym Quadratic Trend - model z trendem wielomianowym 2-go stopnia Exponential Trend - model z trendem w postaci wykładniczej Moving Average - średnie ruchome Simple Exponential Smoothing - proste wygładzanie wykładnicze Brown s Linear Exponential Smoothing - proste wyrównanie wykładnicze ze stałą wygładzania α Holt s Linear Exponential Smoothing - wyrównanie wykładnicze z trendem o stałej wygładzania trendu β Przy analizie danych i doborze najlepszego modelu dla tych danych brane są pod uwagę wartości obliczonych błędów: RMSE - średni błąd kwadratowy Najlepszym modelem dla analizowanych MAE - średni błąd absolutny danych, będzie model, w którym wartości ME - błąd przeciętny RMSE i MAE są najmniejsze, MPE - procentowy błąd przeciętny a ME i MPE są najbliższe zeru. 4

Procedury programu STATGRAPHICS Aby przeprowadzić obliczenia metodami analizy szeregów czasowych wybieramy polecenie: Special / Time Series Analysis do dyspozycji mamy cztery moduły: Descriptive Methods (metody opisowe), Smoothing (wygładzanie), Seasonal Decomposition (eliminacja wahań sezonowych), Forecasting (prognozowanie). Metody opisowe służą do badania kształtu, trendu i sposobu zmian oraz historii okresowości danych. Techniki wygładzania pozwalają estymować funkcje i przygotować dane do statystycznych procedur. Eliminacja z szeregu wahań sezonowych pozwala na wydzielenie w danych trzech składowych: trendy, cykle i sezonowość. W module prognozowania badamy te trzy składowe i prognozujemy przyszłe wartości szeregów czasowych. ZADANIA Zadanie 1 Rozważmy zbiór danych CARDATA, który jest przykładowym zbiorem informacji o różnych modelach samochodów, dostępnym w pakiecie STATGRAPHICS. a) zbadać model prostej regresji liniowej dla zależności zmiennej mpg od zmiennej weight. Czy można poprawić stopień dopasowania danych do modelu za pomocą, odpowiednich transformacji rozważanych zmiennych? b) metodami regresji wielokrotnej dopasować najlepszy model opisujący zależność zmiennej mpg od pozostałych zmiennych numerycznych w zbiorze CARDATA. Zadanie 2 Badano wpływ dawki pewnego leku na puls pacjenta. Oto wyniki uzyskane dla 10 osób: Dawka leku 2 2 4 4 8 8 16 16 32 32 Puls 60 58 63 62 67 65 70 70 74 73 Dopasować właściwy model regresji do tych danych. Korzystając z wyznaczonego modelu obliczyć prognozowane wartości pulsu przy dawkach leku równych 20 oraz 40. 5

Zadanie 3 W latach 1991-1995 sprzedaż pewnej marki samochodu w Polsce kształtowała się następująco: Kwartał I II III IV Lata 1991 340 380 560 380 1992 440 460 615 450 1993 516 570 685 560 1994 610 630 770 660 1995 630 610 900 740 a) wyrównać podany szereg metodą średniej ruchomej wyznaczając 3-okresowe i 4-okresowe średnie ruchome. b) dokonać pomiaru wahań okresowych w sprzedaży samochodów i wyeliminować je z szeregu czasowego. c) obliczyć popyt na produkt w 1996 roku poznanymi metodami analizy szeregów czasowych; dokonać wyrównania szeregu czasowego metodą wyrównywania wykładniczego z trendem przyjmując stałą a = 0,1 oraz 0,3 oraz β = 0,1 oraz 0,4, d) narysować szereg czasowy. Zadanie 4 Liczba zarejestrowanych samochodów osobowych w Polsce w latach 1980-1992 tworzyła następujący szereg czasowy (w tys. pojazdów): 2383 2634 2882 3179 3426 3671 3964 4232 4519 4846 5261 6112 6505. Wyznaczyć wartości prognozowane na lata 1993-1998, stosując metody analizy szeregów czasowych. 6