3. Analiza własności szeregu czasowego i wybór typu modelu
1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej dla zakresu czasowego próby uczącej: y - średnia arytmetyczna obserwacji zmiennej prognozowanej, s y odchylenie standardowe obserwacji zmiennej prognozowanej, Współczynnik zmienności = s y y 1.3. Korelogram autokorelacji wykres szeregu współczynników korelacji liniowej Pearsona między szeregiem czasowym obserwacji, a opóźnieniem tego szeregu o k okresów. Parametr k jest nazywany rzędem autokorelacji. Współczynnik autokorelacji rzędu k-tego oznaczany jest przez ρ k albo przez PACF(współczynnik autokorelacji cząstkowej), dany jest wzorem: K wynosi początkowo tyle, ile ma sezonów cykl roczny dla przyjętej długości okresu prognozy, ale nie więcej niż 1/5 wszystkich obserwacji. Końcowo to najwyższy istotny rząd autokorelacji.
1.4. Testy w postaci rozbudowanych modeli testujących stacjonarność (stałość wartości oczekiwanej i wariancji szeregu lub jego składnika losowego):adf, KPSS. Test ADF stacjonarności poziomu szeregu czasowego ma postać modelu empirycznego przyrostu zmiennej prognozowanej w okresie t-tym Δy t : y t b b t ( a 1) y 0 1 0 t 1 l l k t k t l 1 k 1 b 0 szacunek parametru oznaczającego stały poziom zmiennej prognozowanej y w próbie, a nawet średni poziom, jeśli szacunek współczynnika b 1 jest nieistotny, b 1 szacunek średniego przyrostu okresowego zmiennej prognozowanej y t, jego poziom istotnie statystycznie różny od 0 sygnalizuje trend w całej próbie uczącej, t indeks czasu (nazywany zmienną czasową), t = 1, 2,, N, L c dq c l szacunek średniego efektu w l-tym spośród L sezonów cyklu: l = 1, 2, L, dq l zmienna binarna identyfikująca l-ty spośród L sezonów cyklu: l = 1, 2, L, e t szacunek realizacji składnika losowego zmiennej prognozowanej y, a 1, a 2,, a K szacunki współczynników autokorelacji z przyrostami zmiennej y, a 0 szacunek współczynnika wpływu opóźnionego poziomu zmiennej y t-1, jeśli: H 0 : a 0 = 1 (równoważnie a 0 1 = 0), to szereg jest niestacjonarnym procesem błądzenia przypadkowego, H 1 : a 0 < 1 (równoważnie a 0 1 < 0), to szereg jest stacjonarny lub trendostacjonarny. α = 0,05 albo 0,1 to przyjęty poziom istotności testu. Jeśli dla współczynnika (a 0 1) empiryczny poziom istotności p > α, to nie ma podstaw do odrzucenia H 0. K a y e.
2. Stacjonarny szereg czasowy: - obserwacje zmiennej prognozowanej mają ten sam rozkład prawdopodobieństwa w całej próbie uczącej, - współczynnik zmienności jest poniżej 0,5, a odchylenia obserwacji od poziomu średniego (reszty) nie powinny przekraczać 2,5 krotności odchylenia standardowego w próbie, - korelogram powinien wskazać na istotną autokorelację co najwyżej dwóch rzędów opóźnienia obserwacji, a drugie opóźnienie powinno być rzędu sezonowego, - test ADF wykazuje nieistotność współczynnika kierunkowego b 1, a powtórzony bez trendu (bez współczynnika b 1 ) daje podstawy do odrzucenia H 0 na rzecz H 1 o stacjonarności. Rodzaje modeli: - Średnia z próby - Model z wyrazem wolnym i autoregresją zmiennej prognozowanej, - Składowa sezonowa jest potrzebna w każdym modelu, jeśli zmienna prognozowana podlega sezonowości (na wykresie szeregu czasowego widoczna jest cykliczność, a w testach istotne są parametry c l ), - Model dynamiczny procesu stochastycznego ARMA.
3. Trendostacjonarny szereg czasowy - obserwacje mają ten sam rozkład prawdopodobieństwa względem wartości oczekiwanej będącej funkcją czasu (trednd), - współczynnik zmienności 0-1, - reszty modelu nie powinny przekraczać 2,5 krotności odchylenia standardowego reszt, - korelogram powinien wskazać na istotną autokorelację co najwyżej dwóch rzędów opóźnienia, przy czym drugie powinno być sezonowe, - test ADF wykazuje istotność współczynnika kierunkowego b 1 oraz daje podstawy do odrzucenia H 0 na rzecz H 1 o stacjonarności. Rodzaje modeli i składowych: - Model trendu, czyli funkcja zmiennej czasowej, funkcja liniowa lub nieliniowa (wykładnicza, potęgowa lub hiperboliczna) - Model trendu z autoregresją, czyli model z opóźnioną zmienną prognozowaną, - Składowa sezonowa w razie sezonowości (cykliczność wykresu lub istotne parametry c l ),
4. Modele wygładzania szeregu czasowego - współczynnik zmienności szeregu obserwacji powyżej 0,5, - rozkład losowy obserwacji nie jest jednakowy dla całej próby uczącej, ale jest stały lokalnie, - obserwacje w próbie uczącej można podzielić na podpróby, w których występuje odmienny trend, nazywany segmentowym, - korelogram powinien wskazać na istotną autokorelację co najwyżej dwóch rzędów opóźnienia obserwacji, a drugie opóźnienie powinno być rzędu sezonowego, -test ADF nie daje podstaw do odrzucenia H 0 : o niestacjonarności, Rodzaje modeli: - średnia ruchoma (wygładzanie ruchome, - średnia wykładnicza (model Browna), - wygładzanie wykładnicze trendu (model Holta), - wygładzanie wykładnicze trendu i sezonowości (model Wintersa), - model trendu segmentowego, - model trendu pełzającego.
5. Szeregi przyrostostacjonarne: - współczynnik zmienności obserwacji powyżej 0,5, - korelogram wskazuje istotną autokorelację wielu rzędów opóźnienia szeregu czasowego, - test ADF (zaprezentowana postać jest dla poziomów zmiennej) daje podstawy do odrzucenia H 0 : o niestacjonarności. Wtedy stosuje się model ARMA. - test ADF dla szeregu obserwacji przyrostów zmiennej prognozowanej daje podstawy do odrzucenia H 0 i przyjęcia H 1 : o przyrostostacjonarności szeregu obserwacji zmiennej prognozowanej. Wtedy stosuje się model ARIMA stacjonarnych przyrostów. ARMA i ARIMA to modele procesów stochastycznych opisujące złożoną strukturę wielu rzędów autokorelacji zmiennej prognozowanej i jej składnika losowego