4. Średnia i autoregresja zmiennej prognozowanej
1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.) w hurtowni ASKO w okresie 01.2016 02.2017 w podziale na próbę uczącą i testową była następująca: t = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 y t = 54 52 64 48 66 64 68 58 64 68 52 56 59 55 2.1. Oceń własności szeregu czasowego obserwacji. Czy obserwacje szeregu mają rozkład losowy wokół średniej? 2.2. Oblicz prognozy i ich błędy.
2.1.Wykres sprzedaży żelazek (Zmienna\ Wykres szeregu czasowego) 70 65 Sprzedaz_zelazek 60 55 50 45 2016 Obserwacje w próbie uczącej: 2016:01-2016:12 Statystyki opisowe `Sprzedaz_zelazek (Zmienna\ Statystyki opisowe) Średnia 59,500 Mediana 61,000 Minimalna 48,000 Maksymalna 68,000 Odchylenie standardowe 6,9870 Wsp. zmienności 0,11743 Skośność -0,22298 Kurtoza -1,4044
Korelogram (Zmienna\ Korelogram) Rząd opóźnień K ze względu na liczbę sezonów powinien wynieść 12 ale ze względu na 12 obserwacji może wynosić co najwyżej 2. ACF dla zmiennej Sprzedaz_zelazek 1 +- 1,96/T^0,5 0,5 0-0,5-1 0 0,5 1 1,5 2 2,5 3 opóľnienia PACF dla zmiennej Sprzedaz_zelazek 1 +- 1,96/T^0,5 0,5 0-0,5-1 0 0,5 1 1,5 2 2,5 3 opóľnienia Nieistotny współczynniki autokorelacji rzędu 1 i 2 (symbol ρ1 i ρ2) zilustrowano na dolnym wykresie jako PACF dla opóźnienia 1 i 2.
Test ADF (Zmienna\ Testy pierwiastka jednostkowego\ Test ADF) zmiennej `Sprzedaz_zelazek` Wybieramy w oknie funkcji: -opóźnienie dla testu ADF: równe 0 (to istotny rząd autokorelacji K), -z wyrazem wolnym (założyliśmy, że trend, a więc współczynnik kierunkowy b 1 przy zmiennej czasowej t nie jest istotny), -wykorzystaj poziomy zmiennej. Wynik w GRETLU: Test Dickeya-Fullera dla procesu `Sprzedaz_zelazek` liczebność próby 11 Hipoteza zerowa: występuje pierwiastek jednostkowy a = 1; proces I(1) test z wyrazem wolnym (const) model: (1-L)y = b0 + (a-1)*y(-1) + e Autokorelacja reszt rzędu pierwszego: -0,105 estymowana wartość (a-1) wynosi: -1,1375 Statystyka testu: tau_c(1) = -3,51302 wartość p 0,02943
2.2. Model średniej sprzedaży Oszacowanie modelu (Model\ Klasyczna metoda najmniejszych kwadratów) W oknie modelu wybieramy: - Zmienna zależna (Y): `Sprzedaz_zelazek`, - Regresory (inaczej zmienne niezależne lub objaśniające modelu): domyślnie jest const - zmienna sztuczna o stałym poziomie = 1. gretl: model 1 Model 1: Estymacja KMNK, wykorzystane obserwacje 2016:01-2016:12 (N = 12) Zmienna zależna (Y): Sprzedaz_zelazek Współczynnik Błąd stand. t-studenta wartość p const 59,5 2,01697 29,4996 <0,00001 *** Średn.aryt.zm.zależnej 59,50000 Odch.stand.zm.zależnej 6,987001 Suma kwadratów reszt 537,0000 Błąd (odchylenie) 6,987001 standardowy reszt Wsp. determ. R-kwadrat 0,000000 Skorygowany R-kwadrat 0,000000 Logarytm wiarygodności -39,83381 Kryt. inform. Akaike'a 81,66762 Kryt. bayes. Schwarza 82,15253 Kryt. Hannana-Quinna 81,48809 Autokorel.reszt - rho1-0,133873 Stat. Durbina-Watsona 2,182495
Obliczenie prognoz i błedów W oknie gretl: model 1 wybieramy: Analiza\ Prognoza W oknie gretl: prognoza wybieramy: - zakres prognozy 2017.01 2017.02, - prognoza statyczna, - liczba obserwacji przed prognozą na wykresie: 10. Okno gretl: Prognozy : Dla 95% przedziału ufności, t(11, 0,025) = 2,201 Sprzedaz_zelazek prognoza błąd ex ante 95% przedział ufn. 2017:01 59,00 59,50 7,272 43,49-75,51 2017:02 55,00 59,50 7,272 43,49-75,51 Średni błąd predykcji ME = -2,5 Błąd średniokwadratowy MSE = 10,25 Pierwiastek błędu średniokwadr. RMSE = 3,2016 Średni błąd absolutny MAE = 2,5 Średni błąd procentowy MPE = -4,5146 Średni absolutny błąd procentowy MAPE = 4,5146
Wykres prognoz 80 75 Sprzedaz_zelazek prognoza 95 procentowy przedział 70 65 60 55 50 45 40 2016 2016,2 2016,4 2016,6 2016,8 2017
3. Model stałej z autoregresją zmiennej prognozowanej jednego istotnego rzędu K y = b + ρ y Własności: y = b + ρ y równoważnie b = y (1 ρ ) Prognoza statyczna stawiana na podstawie obserwacji w próbie uczącej: y = b + ρ y t = N + 1,, N + K Prognoza krocząca (ruchoma) stawiana na podstawie obserwacji w próbie testowej y = b + ρ y N + K < t T + K Prognoza dynamiczna stawiana na podstawie wcześniejszych prognoz statycznych, kroczących, a następnie dynamicznych: y = b + ρ y t > N + K
4. Przykład. Sprzedaż y t (tys. zł) sklepu RTV AGD w w okresie 01.2016 02.2017 w podziale na próbę uczącą (1-12.2016) i próbę testową była następująca t = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 y t = 21 19 17 23 21 21 18 19 23 17 18 23 23 21 2.1. Oceń własności szeregu czasowego obserwacji. 2.2. Oblicz prognozy i błędy z modelu stałej z autoregresją Odpowiedzi: 2.1. Model stałej i autoregresji sprzedaży pasuje. y = 20, s = 2,30, wsp. zmienności = 0,115, ρ = 0,57 (korelogram). W teście ADF zmienna czasowa t jest nieistotna, a empiryczny poziom istotności wskazuje, że należy odrzucić hipotezę H 0 o niestacjonarności. Model: y = 31,97 0,6y (w oknie gretl: specyfikacja modelu należy użyć przycisku opóźnienia, opcji opóźnienia dla zmiennej zależnej i opcji pola, w które wpisujemy 2.
Odpowiedzi cd.: 2.2. Prognozy statyczne: y = 31,97 0,6 y = 31,97 0,6 18 = 21,17 = 31,97 0,6 y = 31,97 0,6 23 = 18,17 y = 31,97 0,6 y = 31,97 0,6 20 = 19,97 y Prognozy kroczące (z wykorzystaniem obserwacji próby testowej): y = 31,97 0,6 y = 31,97 0,6 23 = 18,17 = 31,97 0,6 y = 31,97 0,6 21 = 19,37 y Prognozy dynamiczne (z wykorzystaniem wcześniejszych prognoz najpierw statycznych później dynamicznych): y = 31,97 0,6 y = 31,97 0,6 21,17 = 19,27 y = 31,97 0,6 y = 31,97 0,6 18,17 = 21,07 y = 31,97 0,6 y = 31,97 0,6 19,27 = 20,41 Miary błędów szacunkowych: s = 2,23 R = 0,29 v = 2,32 Miary błędów faktycznych (przyjęto dla prognoz statycznych): ME = 2,3608 MSE = 5,8267 RMSE = 2,4139 MAPE = 10,857