Wydział Matematyki kierunek studiów: Matematyka specjalność: Matematyka Finansowa i Ubezpieczeniowa Praca dyplomowa - magisterska Krótkoterminowe prognozowanie cen energii elektrycznej z wykorzystaniem modeli siostrzanych Michał Kucharczyk słowa kluczowe: prognozowanie cen energii elektrycznej, modele siostrzane, model ARX, rynek dnia następnego krótkie streszczenie: W pracy zastosowano modele siostrzane, zbudowane na bazie modelu autoregresji ze zmiennymi zewnętrznymi, do prognozowania cen energii elektrycznej na rynku dnia następnego. W tym celu wykorzystano dane z konkursu GEFCom2014. Następnie porównano błędy uzyskanych prognoz z modelami referencyjnymi oraz zbadano ich zachowanie się w czasie. opiekun pracy dyplomowej prof. Rafał Weron...... Tytuł/stopień naukowy/imię i nazwisko ocena podpis Do celów archiwalnych pracę dyplomową zakwalifikowano do:* a) kategorii A (akta wieczyste) b) kategorii BE 50 (po 50 latach podlegające ekspertyzie) * niepotrzebne skreślić pieczątka wydziałowa Wrocław, 2016
Wydział Matematyki kierunek studiów: Matematyka specjalność: Matematyka Finansowa i Ubezpieczeniowa Praca dyplomowa - magisterska Short-term forecasting of electricity prices using sister models Michał Kucharczyk keywords: electricity price forecasting, sister models, ARX model, day-ahead market short abstract: In this thesis, sister models are used to forecast electricity prices in the dayahead market. They are based on an autoregressive model with exogenous variables and calibrated to data from the GEFCom2014 competition. Errors of the obtained predictions are compared with benchmark models and their behaviour over time is assessed. opiekun pracy dyplomowej prof. Rafał Weron...... Tytuł/stopień naukowy/imię i nazwisko ocena podpis Do celów archiwalnych pracę dyplomową zakwalifikowano do:* a) kategorii A (akta wieczyste) b) kategorii BE 50 (po 50 latach podlegające ekspertyzie) * niepotrzebne skreślić pieczątka wydziałowa Wrocław, 2016
SPIS TREŚCI 1. Wstęp............................................... 2 2. Rynek energii elektrycznej................................... 4 2.1. Deregulacja......................................... 4 2.2. Specyfika rynku...................................... 4 3. Dane i modele.......................................... 7 3.1. Rodzaje metod w użyciu.................................. 7 3.2. Dane............................................ 7 3.3. Oznaczenia......................................... 8 3.4. Bazowy model ARX.................................... 10 3.5. Modele siostrzane..................................... 11 3.6. Wybór modelu....................................... 11 4. Wyniki.............................................. 14 4.1. Prognozy.......................................... 14 4.2. Zachowanie w czasie.................................... 16 5. Podsumowanie.......................................... 24 Bibliografia.............................................. 25 1
1. WSTĘP Elektryczność odgrywa kluczową rolę w rozwoju ludzkości, od zaopatrzenia w nią praktycznie całkowicie zależy obecna rozwinięta cywilizacja. Początkowo handel energią elektryczną był regulowany i sterowany na poziomie centralnym. Konsumenci nie mieli prawa wyboru dostawcy, a ceny były odgórnie narzucane. Jednak w latach 90 ubiegłego wieku nastąpiła deregulacja rynku energii m.in. w większości krajów europejskich oraz w Stanach Zjednoczonych, Kanadzie i Australii. Tam też obecnie znajdują się najbardziej rozwinięte giełdy handlu energią elektryczną. Konsumenci (na rynku hurtowym) mają możliwość wyboru dostawcy, a ceny kształtuje prawo popytu i podaży. Taka sytuacja powoduje jednak, że zwiększa się ryzyko dla wytwórców energii elektrycznej. Na rynku regulowanym przedsiębiorstwa te musiały jedynie prognozować zapotrzebowanie na energię, aby zapewnić odpowiednią jej produkcję na dany dzień. Obecnie natomiast zmienne jest zarówno zapotrzebowanie, jak i ceny. Właściwe zarządzanie przedsiębiorstwem energetycznym wymaga więc odpowiedniej predykcji obu czynników. Rynek energii elektrycznej jest spoód wszystkich rynków towarowych najbardziej zmiennym ceny osiągają nawet zmienność 50% w skali dziennej, to jest dziesięciokrotnie więcej niż np. dla surowców takich jak ropa naftowa czy gaz ziemny (Weron, 2006). W związku z tym gracze na rynku energii zabezpieczają się nie tylko przed zmianami zapotrzebowania, lecz także przed wahaniami cen. Powoduje to duże zainteresowanie tematem krótkoterminowego prognozowania cen energii elektrycznej w celu bieżącego planowania działalności firmy (Aggarwal i in., 2009; Misiorek, 2012). Istnieje wiele metod predykcji cen energii elektrycznej. Ich wybór zależy od sytuacji przedsiębiorstwa, dostępnych danych czy horyzontu czasowego, na który chcemy uzyskać prognozę. W krótkoterminowym prognozowaniu cen energii jedną z metod jest prognozowanie przy pomocy modeli statystycznych. Bazuje ona na założeniu, że zmiany cen można przewidzieć na podstawie danych o przeszłych zachowaniach tej wielkości (Dittman, 2004). Najczęściej stosuje się tutaj modele regresji, autoregresji lub ich modyfikacje. Jednak zarówno wybór właściwej klasy modelu, jak i późniejsze dobranie odpowiednich zmiennych jest zadaniem trudnym. Modele siostrzane mogą w tym pomóc. Idea opiera się na zastosowaniu jednej rodziny modeli (np. autoregresji albo sieci neuronowych) o pewnym zestawie zmiennych objaśniających do uzyskania wielu prognoz (tzw. prognoz siostrzanych) dla jednego zbioru danych. Wprowadzenie ich jest stosunkowo nową koncepcją, zaproponowaną w pracy Liu i in. (2016) dotyczącej krótkoterminowego prognozowania zapotrzebowania na energię elektryczną. Autorzy stworzyli kilka modeli o podobnej budowie, a następnie uednili odpowiednio otrzymane prognozy. Tak uzyskane wyniki okazały się lepsze od rozważanych tam modeli referencyjnych. 2
Celem niniejszej pracy jest sprawdzenie, czy wykorzystanie modeli siostrzanych do krótkoterminowego prognozowania cen energii elektrycznej może poprawić jakość prognoz. Zbuduję rodzinę modeli opierając się na modelu typu autoregresji ze zmiennymi zewnętrznymi i sprawdzę, czy otrzymane wyniki są lepsze od modeli referencyjnych. Niniejsza praca składa się z pięciu rozdziałów. W rozdziale drugim przestawiam krótko charakterystykę rynku energii elektrycznej oraz wyjaśniam, dlaczego predykcja cen jest ważnym i interesującym zadaniem. W trzecim rozdziale przedstawiam metody stosowane w prognozowaniu cen oraz dane, z których korzystam. Przybliżam ideę modeli siostrzanych oraz wprowadzam modele referencyjne. W czwartym rozdziale prezentuję prognozy oraz ich analizę przy pomocy różnych miar błędu. W ostatnim rozdziale podsumowuję otrzymane wyniki.
2. RYNEK ENERGII ELEKTRYCZNEJ 2.1. DEREGULACJA Po deregulacji rynków energii elektrycznej pod koniec XX wieku, powstały giełdy, na których handlowany jest ten towar. Argumentem za wprowadzeniem konkurencji w tę dziedzinę gospodarki jest przekonanie, że spowoduje to obniżenie cen przy jednoczesnym podniesieniu jakości obsługi (CIRE, 2016). Jest to zrozumiałe na wolnym rynku. Należy jednak pamiętać, że rynki energii nadal są pod nadzorem odpowiednich urzędów (w Polsce jest to Urząd Regulacji Energetyki), aby zapewnić m.in. odpowiednią jakość dostarczanych usług oraz kontrolować taryfy dla odbiorców, którzy ze względów technicznych nie mają wyboru dostawcy energii. Na giełdach energii handel odbywa się najczęściej w formie tzw. rynku dnia następnego (ang. day-ahead market). Ustalanie ceny odbywa się osobno dla każdej z 24 godzin kolejnego dnia (Nowotarski i in., 2014). Każdy uczestnik rynku może złożyć nawet kilka ofert na daną godzinę, np. jeśli jest gotów zwiększyć produkcję przy wyższej osiągniętej cenie. Ostateczna cena rozliczeniowa ustalana jest na podstawie przecięcia się krzywych popytu i podaży, utworzonych odpowiednio z ofert odbiorców i dostawców energii (patrz rys. 1). Tak ustaloną cenę nazywamy ceną spotową lub ceną dzień przed (Nowotarski i Weron, 2016). Cena natychmiastowa występuje z kolei na rynku bilansującym. Należy zwrócić jednak uwagę, że w Stanach Zjednoczonych różni się nieco nomenklatura i ceny te nazywane są odpowiednio ceną forward i spotową (Weron, 2006). Oprócz instrumentu podstawowego, giełdy są również miejscem handlu instrumentami pochodnymi. Podobnie jak na rynkach innych towarów lub rynkach finansowych możemy kupić lub sprzedać m.in. kontrakty futures czy opcje. Służą one do ograniczania ryzyka i zabezpieczania swoich pozycji przed nieprzewidywalnymi ruchami cen. Poza rynkiem giełdowym można wyróżnić również transakcje dwustronne na rynku pozagiełdowym (ang. OTC over-the-counter). Strony takich transakcji nie mają obowiązku upubliczniania szczegółów zawieranych umów w przeciwieństwie do transakcji giełdowych, gdzie występuje pełna jawność. W celu ułatwienia zawierania takich transakcji istnieją platformy handlu pozagiełdowego, których główną rolą jest prezentowanie ofert poszczególnych podmiotów, jednak nie sprawują one nadzoru typowego dla giełd. 2.2. SPECYFIKA RYNKU Rynek energii elektrycznej jest specyficzny. Podstawową różnicą charakteryzującą energię elektryczną na tle innych towarów jest to, że nie ma możliwości jej magazynowania na dużą skalę. W związku z tym w każdym momencie na rynku musi być zachowany bilans energii 4
Cena [EUR/MWh] 3000 2500 2000 1500 1000 500 0 krzywa podazy krzywa popytu 500 400 300 200 100 0 0 2 4 6 8 x 10 6 500 1 2 3 4 5 6 7 8 Zapotrzebowanie x 10 6 Rys. 1: Wykres obrazujący ustalanie ceny energii elektrycznej na godzinę 12 dnia 1 stycznia 2015 na giełdzie EPEX SPOT SE we Francji. Wykres wstawiony wewnątrz jest przybliżeniem okolicy punktu przecięcia krzywych popytu i podaży. produkowanej i wykorzystywanej. Często może to powodować ekstremalnie wysokie ceny lub przeciwnie: bardzo niskie, bo ograniczenie produkcji lub jej wstrzymanie na krótki okres jest niemożliwe lub nieopłacalne. Druga sytuacja może zaistnieć przykładowo przy nadprodukcji energii przez turbiny wiatrowe (Woo i in., 2011). Może to doprowadzić nawet do ujemnych cen energii elektrycznej, jak to miało miejsce na przykład 8 maja 2016 roku na rynku niemieckim (rys. 2). Innym ograniczeniem jest brak swobodnego przesyłu energii na większe odległości ze względu na straty mocy (Bamigbola i in., 2014). W związku z tym kupno lub sprzedaż energii elektrycznej ograniczone są do pewnego obszaru. Między innymi z tego powodu większe państwa (np. Stany Zjednoczone) podzielone są na strefy, w których ceny ustalane są oddzielnie. Kolejnym czynnikiem charakteryzującym rynek energetyczny jest duża zmienność zapotrzebowania, od którego zależą ceny. Na konsumpcję prądu wpływ mają m.in. czynniki atmosferyczne oraz biznesowe. W miesiącach zimowych wzrasta zużycie energii w celu ogrzewania oraz, w związku z wcześniejszym zapadaniem zmroku, dłużej pali się światło. Z kolei w lecie ze względu na wysokie temperatury intensywnie pracują klimatyzatory, które również korzystają z energii elektrycznej. Ponadto zapotrzebowanie zmienia się także w mniejszej skali można zauważyć różnice między dniami roboczymi a weekendem, czy nawet pomiędzy godzinami pracy a pozostałymi (Kirschen i Strbac, 2004). Dla rynku energii elektrycznej charakterystyczne jest również występowanie rynku bilansującego. Jako że równowaga ustalana jest dzień przed faktycznym wykonaniem kontraktów, może dojść do różnic pomiędzy szacunkami a rzeczywistymi wartościami zapotrzebowania. Wymaga to korekty właśnie w ramach rynku bilansującego. Konsekwencję błędnej prognozy
40 20 0 Cena [EUR/MWh] 20 40 60 80 100 120 140 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Godziny Rys. 2: Wykres cen energii elektrycznej w kolejnych godzinach dnia 8 maja 2016 na giełdzie EPEX SPOT SE w Niemczech ponosi przedsiębiorstwo, które dokonuje korekty. Sytuacja ta nie dotyczy oczywiście małych odbiorców, w tym np. gospodarstw domowych (CIRE, 2016). 6
3. DANE I MODELE 3.1. RODZAJE METOD W UŻYCIU W prognozowaniu cen energii można wyróżnić kilka rodzajów stosowanych metod (Weron, 2014): 1. agentowe (równowagowe, teoriogrowe) modelują zachowanie uczestników rynku (sprzedawców i kupców) oddziałujących między sobą, ustalając prognozę jako punkt równowagi pomiędzy popytem a podażą; 2. fundamentalne (strukturalne) opisują dynamikę cen przez uwzględnienie czynników fizycznych i ekonomicznych wpływających na cenę; 3. stochastyczne modelują rozkłady cen energii w dłuższym horyzoncie czasowym (tygodnie, miesiące), celem jest zwykle wycena instrumentów pochodnych i zarządzanie ryzykiem; 4. statystyczne głównie modele regresyjne i autoregresyjne opracowywane na potrzeby prognozowania krótkoterminowego (rynek dnia następnego); 5. sztucznej inteligencji w procesie uczenia maszynowego dopasowują się do skomplikowanych systemów dynamicznych, podobnie jak metody statystyczne stosowane są głównie do prognozowania krótkoterminowego (rynek dnia następnego). Modele, które będę wykorzystywał w niniejszej pracy, należą do czwartej z powyższych grup. 3.2. DANE Dane, z których korzystam, pochodzą z konkursu GEFCom2014 (Global Energy Forecasting Competition 2014 Światowy Konkurs Prognozowania [Rynku] Energii 2014). Konkurs ten miał na celu między innymi wypracowanie najlepszych metod w prognozowaniu oraz zbliżenie badaczy akademickich z praktykami w przedsiębiorstwach energetycznych (Hong, 2016). W roku 2014 konkurs był podzielony na cztery części: prognozowanie zapotrzebowania, cen oraz mocy wytwarzanej przez elektrownie wiatrowe i słoneczne (Hong i in., 2016). W części dotyczącej cen energii elektrycznej dane zawierają cenę w danej godzinie, zapotrzebowanie całkowite i strefowe oraz sygnaturę czasową. Początek danych to północ dnia 1 stycznia 2011 r., dane kończą się natomiast 17 grudnia 2013 r. o godzinie 23 (tj. ostatniej godzinie doby 23:00-23:59). Informacje o zapotrzebowaniu są prognozą na odpowiednią godzinę, zatem mogą być wykorzystywane w prognozowaniu cen spotowych. Jak możemy zauważyć na rysunku 3, ceny cechują się dużą zmiennością. Widzimy również istotne wzrosty cen zimą i latem. W okresie letnim spowodowane jest to zapewne większym 7
400 350 dwuletni okres testowy Cena [USD/MWh] 300 250 200 150 100 50 01.01.2011 01.01.2012 01.01.2013 17.12.2013 Godziny Rys. 3: Wykres cen, P (t), dla danych z GEFCom2014 zapotrzebowaniem na energię elektryczną (rys. 5, 6) w związku z pracą klimatyzatorów w dni z wysoką temperaturą. W okresie zimowym wzrosty zapotrzebowania są mniejsze wynikają prawdopodobnie z większego zużycia energii na oświetlenie związanego z krótszym dniem oraz ogrzewania spowodowanego niskimi temperaturami. W obu tych okresach widocznie rośnie zmienność cen i pojawiają się obserwacje odstające znacznie od pozostałych wartości, tzw. piki (Nowotarski i in., 2013). Dla danych dotyczących cen zastosowałem transformację poprzez funkcję logarytmiczną. Tak utworzony nowy szereg czasowy charakteryzuje się mniejszą zmiennością, a piki nie są już tak odbiegające od pozostałych danych. Zachowana jest jednak widoczna sezonowość danych, patrz rys. 4. 3.3. OZNACZENIA Wprowadźmy oznaczenia: P (t) cena energii o godzinie t, na którą ustalamy cenę na rynku dnia następnego; p(t) logarytm ceny energii, tzn. p(t) = log P (t); z(t) logarytm całkowitego zapotrzebowania na energię; z zon (t) logarytm strefowego zapotrzebowania na energię; D xxx (t) zmienna binarna (tzw. dummy), która pokazuje spełnienie warunku xxx wartość 1 jest osiągana tylko w momencie, gdy spełniony jest warunek xxx; poniżej będę stosował te zmienne dla xxx będącymi dniami tygodnia (pn, wt,...) lub godzinami (0, 1,...); p min (t) minimum p(t) w danej dobie; p max (t) maksimum p(t) w danej dobie; p avg (t) ednia p(t) w danej dobie; ε(t) ciąg niezależnych zmiennych o jednakowym rozkładzie, o edniej zero i skończonej wariancji (tzw. biały szum). 8
6.5 6 dwuletni okres testowy 5.5 Logarytm ceny 5 4.5 4 3.5 3 01.01.2011 01.01.2012 01.01.2013 17.12.2013 Godziny Rys. 4: Wykres zlogarytmowanych cen, p(t), z GEFCom2014 Zapotrzebowanie [MWh] 40000 35000 30000 25000 20000 15000 dwuletni okres testowy 01.01.2011 01.01.2012 01.01.2013 17.12.2013 Godziny Rys. 5: Wykres zapotrzebowania na energię elektryczną z GEFCom2014 Zapotrzebowanie strefowe [MWh] 14000 dwuletni okres testowy 12000 10000 8000 6000 4000 01.01.2011 01.01.2012 01.01.2013 17.12.2013 Godziny Rys. 6: Wykres strefowego zapotrzebowania na energię elektryczną z GEFCom2014 9
350 300 cena o godzinie 3 cena o godzinie 17 Cena [USD/MWh] 250 200 150 100 50 01.01.2011 01.01.2012 01.01.2013 17.12.2013 Dni Rys. 7: Wykres cen dla godziny 3 (odek nocy, najniższe ceny) i 17 (godzina szczytowa, najwyższe ceny w ciągu dnia) dla danych z GEFCom2014 3.4. BAZOWY MODEL ARX W praktyce w modelowaniu spotowych cen energii elektrycznej najczęściej wykorzystuje się modele autoregresji i ich modyfikacje. Metody te opierają się nie tylko na aktualnych danych, ale również na przeszłych wartościach szeregu czasowego. Takie modele oznacza się przez AR (Brockwell i Davis, 2002). Dodatkowo, jeśli do modelu AR dołączymy dodatkowy komponent związany z inną zmienną, mówimy o modelu typu ARX (ang. Auto-Regressive with exogenous variable autoregresyjny ze zmienną zewnętrzną). Jako jeden z modeli referencyjnych będę wykorzystywał model typu ARX zaproponowany w pracy Misiorka i in. (2006), a później wykorzystywany m.in. w pracach Werona (2006), Werona i Misiorka (2008), Serinaldiego (2011), Kristiansena (2012), Nowotarskiego i in. (2014), Werona (2014), Gaillarda i in. (2016), Nowotarskiego i Werona (2016) czy Ziela (2016): p(t) = β 1 p(t 24) + β 2 p(t 48) + β 3 p(t 168) + β 4 p min (t 24) + β 5 z(t) + β 6 D pn (t) + β 7 D sob (t) + β 8 D nd (t) + ε(t), (1) gdzie p(t 24), p(t 48), p(t 168) oznaczają (zlogarytmowane) wartości cen odpowiednio dobę, dwie doby i tydzień wcześniej część autoregresyjna modelu. Zapotrzebowanie z(t) jest tutaj zmienną zewnętrzną. Minimum ceny wiąże wartości cen również dla pozostałych godzin z danego dnia, natomiast zmienne binarne (indykatory poniedziałku, soboty i niedzieli) odpowiadają za sezonowość tygodniową. Należy zwrócić uwagę, że odnosimy się do przeszłych cen jedynie z tej samej godziny, na którą wykonujemy prognozę. Wynika to ze znacznych różnic cen pomiędzy godzinami w tym samym dniu (zob. rys. 7). Model ten będę nazywał modelem ARX1. 10
3.5. MODELE SIOSTRZANE Modele siostrzane zostały zaproponowane w pracy Liu i in. (2016). Pomysł ten polega na wykorzystaniu jednej rodziny modeli (np. autoregresji albo sieci neuronowych) o pewnym zestawie predyktorów do opisu zbioru danych. Co więcej, używając różnych okien kalibracji możemy otrzymać modele o tych samych zmiennych objaśniających, ale innych parametrach (Wang i in., 2016). Takie modele nazywamy siostrzanymi (ang. sister models), a prognozy otrzymane z tych modeli prognozami siostrzanymi (ang. sister forecasts). W pracy Liu i in. (2016) modele siostrzane wykorzystywane były do wyznaczania prognoz przedziałowych zapotrzebowania na energię. Uednianie prognoz siostrzanych za pomocą regresji kwantylowej (tzw. metoda Quantile Regression Averaging QRA, zob. Nowotarski i Weron, 2015) prowadziło do lepszych wyników niż modele referencyjne. Podobne wyniki otrzymali Nowotarski i in. (2016) w kontekście uedniania prognoz punktowych zapotrzebowania. Podejście to nie było jednak jeszcze wykorzystywane do prognozy cen energii. 3.6. WYBÓR MODELU W związku ze specyfiką cen spotowych na rynku energii elektrycznej, prognozy wykonywałem co godzinę. Okno kalibracji modelu dla każdej godziny miało długość jednego roku, to jest 8760 godzin. Prognozy dotyczyły okresu testowego obejmującego daty 01.01.2012 17.12.2013 (patrz rys. 3, 4). Dopasowanie wykonywałem przy pomocy funkcji regress.m w oprogramowaniu Matlab. W celu wybrania modelu do dalszych analiz wyszedłem od modelu postaci p(t) = β 1 p(t 24) + β 2 p(t 48) + β 3 p(t 168) + β 4 p min (t 24) + β 5 Z(t) + β 6 D pn (t) + β 7 D sob (t) + β 8 D nd (t) + β 9 p min (t 48) + β 10 p max (t 24) + β 11 p max (t 48) + β 12 p avg (t 24) + β 13 p avg (t 48) + β 14 z(t 24) + β 15 z(t 168) + β 16 z zon (t) + [β 17... β 17+22 ] D godz (t) + [β 40... β 40+23 ] (D godz (t) p(t 24)) + β 64 + ε(t). (2) W powyższym wzorze D godz (t) oznacza 23 zmienne pomocnicze oznaczające kolejne godziny (zmienna oznaczająca ostatnią godzinę jest kombinacją liniową tych zmiennych). Z kolei w przypadku składników (D godz (t) p(t 24)), D godz (t) oznacza 24 zmienne dummy, które po przemnożeniu przez p(t 24) przyjmują tylko wartość w odpowiadającej godzinie (zamiast wartości 0 i 1 przyjmowane są odpowiednio wartości 0 i cena dla danej godziny). Można to interpretować jako rozbicie predykcji na 24 osobne prognozy dotyczące kolejnych go- 11
dzin. We wzorze (2) oznacza standardowy iloczyn skalarny, czyli sumę iloczynów. Zatem [β 17... β 17+22 ] D godz (t) = β 17 D 0 (t) +... + β 39 D 22 (t). Model ten zawiera 8 zmiennych z podstawowego modelu ARX1, zob. wzór (1). Ponadto, dodałem do modelu czynniki podobne, które przypuszczalnie mogą mieć wpływ na zachowanie się cen energii. Bazowałem na obserwacji danych, analogii do prognoz zapotrzebowania oraz specyfice rynku energii. Dodatkowo, oprócz powyższych zmiennych, zastosowałem wyraz wolny (β 64 ). Dopasowałem ten model do danych z 2011 roku, a następnie wybrałem zmienne, które na poziomie istotności 0.05 okazały się nieistotne w modelu, czyli nie miały wpływu na cenę energii. Wybierałem zmienną, która była najmniej istotna statystycznie i ją usuwałem. Operację powtarzałem, aż wszystkie zmienne w modelu były istotne. Przy wykonywaniu tej czynności sprawdzałem przy pomocy testu Diebolda-Mariano (1995), jak zmienia się moc predykcyjna modelu na przestrzeni dwóch lat prognozy i czy jest to zmiana znacząca (również na poziomie 0.05). Podczas usuwania zmiennych test nie wykazywał statystycznie istotnych różnic w mocy predykcyjnej; nie zmieniał się również istotnie błąd edniokwadratowy. Powyższa procedura doprowadziła mnie do modelu ARX2 postaci: p(t) = β 1 p(t 24) + β 2 p(t 48) + β 3 p(t 168) + β 4 p min (t 24) + β 5 z(t) + β 6 D pn (t) + β 7 D sob (t) + β 8 D nd (t) + β 9 p min (t 48) + β 10 p max (t 24) + β 12 p avg (t 24) + β 13 p avg (t 48) + β 14 z(t 24) + β 16 z zon (t) + β 64 + ε(t). (3) W powyższym wzorze możemy zauważyć powtarzające się zmienne, brane jedynie w różnych momentach czasowych. Możemy to uznać za podstawę do skonstruowania modeli siostrzanych. Jeżeli w przypadku zmiennych najbardziej podstawowych, czyli przeszłych cen oraz zapotrzebowania, będziemy włączać do modelu nie tylko wartości dla godziny, na którą wykonywana jest prognoza, ale również dla innych godzin, otrzymamy rodzinę podobnych modeli. Ponadto, jeśli dodatkowo zmienne dotyczące maksimum, minimum i edniej z całej doby będziemy opóźniać nie tylko o dobę i dwie, jak to ma miejsce w modelu ARX2, lecz o dowolną liczbę dni (do 7 włącznie), dostaniemy większą rodzinę zbliżonych do siebie modeli. 12
Na podstawie powyższych obserwacji skonstruowałem następujące modele siostrzane p(t) = β 1 p(t 24) + β 2 p(t 48) + β 3 p(t 168) + β 4 p min (t 24) + β 5 z(t) + β 6 D Mon (t) + β 7 D Sat (t) + β 8 D Sun (t) + β 10 p max (t 24) + β 12 p avg (t 24) + β 14 z(t 24) + β 16 z zon (t) + β 64 + γ 1 p(t 24 i) + γ 2 p(t 48 i) + γ 3 z(t i) + γ 4 p max (t 24 j) + γ 5 p min (t 24 j) + γ 6 p avg (t 24 j) + ε(t), (4) dla i = 0,..., 24; j = 1,..., 7. Zauważmy, że dla i = 0 będzie to model z γ 1, γ 2, γ 3 = 0, a dla j = 1 otrzymamy γ 4, γ 5, γ 6 = 0, ponieważ odpowiednie zmienne występują już wcześniej w modelu.
4. WYNIKI 4.1. PROGNOZY Do oceny błędu wykorzystywałem następujące miary: błąd edniokwadratowy (root mean square error) RMSE = 1 T T h=1 ( P (h) ˆP (h)) 2; (5) edni bezwzględny błąd procentowy (mean average percentage error) MAPE = 1 T T P (h) ˆP (h) P (h) ; (6) h=1 edni błąd bezwzględny ważony tygodniowo (weekly-weighted mean absolute error), gdzie P (h) jest ednią dla danego tygodnia WMAE = 1 T T P (h) ˆP (h) P (h) ; (7) h=1 edni skalowany błąd bezwzględny (mean absolute scaled error), który porównuje błąd prognozy modelu z błędem modelu przyjmującego jako prognozę wartość ceny na dobę wcześniej. MASE = 1 T 24 1 T T h=1 T h=24+1 P (h) ˆP (h) P (h) P (h 24). (8) W tabeli 1 widzimy błędy obliczone na przestrzeni całych dwóch lat prognozy. Wyniki najbardziej różnią się pomiędzy błędem RMSE, który odchylenia podnosi do kwadratu, a grupą błędów wykorzystującą wartość bezwzględną. Pierwszy błąd charakteryzuje się tym, że nieprawidłowe prognozy karane są za duże odchylenia od wartości rzeczywistej, w drugim przypadku natomiast bardziej zwracana jest uwaga na powtarzające się małe błędy. Zauważalne różnice to przede wszystkim dużo mniejsze wartości dla j = 2 w stosunku do reszty modeli w przypadku błędu RMSE. Z kolei dla pozostałych miar widzimy znaczące zmniejszenie błędu dla i około 12. Mimo różnic, najlepsze modele ednio w ciągu dwóch lat prognozy są wskazywane podobnie dla j = 2 oraz i 12. Wszystkie rozważane modele siostrzane mają znacznie mniejsze błędy niż model referencyjny ARX1. Widzimy jednak, że model ARX2 jest bardzo zbliżony, jeśli chodzi o błędy, do 14
Tabela 1: Błędy modeli siostrzanych, liczone dla okresu testowego dwóch lat prognozy. Poniżej każdej tabeli znajdują się odpowiadające jej błędy dla modeli ARX1 i ARX2 oraz modelu będącego ednią ze wszystkich prognoz siostrzanych. Jaśniejszy kolor oznacza mniejszy błąd, a pogrubienie mniejszą wartość błędu od modelu ARX2. Wszystkie modele mają mniejsze błędy niż ARX1 RMSE 0 10.5682 10.4766 10.6118 10.5722 10.5405 10.5052 10.5377 1 10.5586 10.4852 10.6036 10.5647 10.5338 10.4990 10.5285 2 10.5571 10.4902 10.6001 10.5632 10.5330 10.4977 10.5257 3 10.5611 10.4943 10.6033 10.5674 10.5376 10.5016 10.5280 4 10.5680 10.4976 10.6097 10.5743 10.5446 10.5080 10.5329 5 10.5731 10.5015 10.6149 10.5796 10.5505 10.5135 10.5371 6 10.5739 10.5016 10.6158 10.5809 10.5526 10.5156 10.5389 7 10.5768 10.4991 10.6187 10.5837 10.5565 10.5197 10.5429 8 10.5758 10.4931 10.6159 10.5816 10.5565 10.5205 10.5448 9 10.5678 10.4812 10.6052 10.5722 10.5497 10.5152 10.5414 10 10.5536 10.4674 10.5892 10.5571 10.5372 10.5043 10.5324 11 10.5438 10.4565 10.5789 10.5471 10.5285 10.4971 10.5258 12 10.5497 10.4577 10.5845 10.5523 10.5337 10.5034 10.5320 13 10.5721 10.4684 10.6073 10.5739 10.5533 10.5229 10.5503 14 10.5921 10.4720 10.6270 10.5924 10.5689 10.5376 10.5640 15 10.6018 10.4682 10.6346 10.5997 10.5736 10.5414 10.5676 16 10.6019 10.4663 10.6367 10.6006 10.5721 10.5382 10.5644 17 10.5989 10.4671 10.6341 10.5970 10.5669 10.5325 10.5595 18 10.5950 10.4765 10.6316 10.5935 10.5613 10.5264 10.5533 19 10.5869 10.4784 10.6193 10.5819 10.5497 10.5161 10.5444 20 10.5796 10.4744 10.6093 10.5731 10.5417 10.5090 10.5396 21 10.5755 10.4704 10.6019 10.5668 10.5369 10.5056 10.5388 22 10.5761 10.4654 10.5958 10.5631 10.5354 10.5064 10.5424 23 10.5792 10.4627 10.5919 10.5613 10.5361 10.5093 10.5471 24 10.5822 10.4640 10.5965 10.5653 10.5400 10.5132 10.5509 RMSE ARX1 = 12.7032; RMSE ARX2 = 10.466; RMSE = 10.5198 WMAE 0 0.0933 0.0932 0.0933 0.0930 0.0935 0.0932 0.0929 1 0.0930 0.0930 0.0930 0.0927 0.0933 0.0930 0.0927 2 0.0931 0.0930 0.0930 0.0928 0.0934 0.0931 0.0928 3 0.0931 0.0929 0.0930 0.0928 0.0934 0.0931 0.0929 4 0.0930 0.0928 0.0930 0.0928 0.0933 0.0931 0.0929 5 0.0930 0.0928 0.0929 0.0927 0.0933 0.0930 0.0929 6 0.0929 0.0927 0.0929 0.0926 0.0932 0.0930 0.0928 7 0.0930 0.0927 0.0929 0.0927 0.0932 0.0930 0.0928 8 0.0929 0.0927 0.0929 0.0926 0.0932 0.0929 0.0928 9 0.0928 0.0926 0.0927 0.0925 0.0930 0.0928 0.0927 10 0.0926 0.0924 0.0925 0.0923 0.0928 0.0926 0.0925 11 0.0924 0.0922 0.0924 0.0921 0.0927 0.0924 0.0924 12 0.0924 0.0920 0.0923 0.0921 0.0926 0.0923 0.0923 13 0.0925 0.0922 0.0924 0.0922 0.0927 0.0924 0.0924 14 0.0928 0.0924 0.0927 0.0925 0.0930 0.0927 0.0926 15 0.0930 0.0926 0.0929 0.0927 0.0932 0.0929 0.0927 16 0.0931 0.0928 0.0930 0.0929 0.0933 0.0931 0.0928 17 0.0932 0.0928 0.0931 0.0929 0.0934 0.0931 0.0928 18 0.0932 0.0928 0.0931 0.0930 0.0934 0.0931 0.0929 19 0.0933 0.0929 0.0931 0.0930 0.0935 0.0932 0.0929 20 0.0933 0.0930 0.0932 0.0931 0.0935 0.0932 0.0929 21 0.0933 0.0930 0.0932 0.0931 0.0935 0.0932 0.0929 22 0.0932 0.0930 0.0931 0.0930 0.0934 0.0931 0.0928 23 0.0931 0.0929 0.0930 0.0929 0.0933 0.0930 0.0927 24 0.0931 0.0929 0.0929 0.0929 0.0932 0.0929 0.0926 WMAE ARX1 = 0.1180; WMAE ARX2 = 0.0931; WMAE = 0.0921 MAPE 0 0.0903 0.0902 0.0903 0.0900 0.0904 0.0903 0.0897 1 0.0900 0.0899 0.0899 0.0897 0.0901 0.0900 0.0895 2 0.0900 0.0899 0.0899 0.0897 0.0901 0.0900 0.0896 3 0.0900 0.0899 0.0899 0.0897 0.0901 0.0900 0.0896 4 0.0899 0.0898 0.0899 0.0896 0.0901 0.0900 0.0896 5 0.0898 0.0897 0.0898 0.0895 0.0900 0.0899 0.0896 6 0.0898 0.0896 0.0898 0.0895 0.0900 0.0899 0.0896 7 0.0898 0.0896 0.0898 0.0895 0.0900 0.0899 0.0896 8 0.0898 0.0895 0.0897 0.0895 0.0899 0.0898 0.0896 9 0.0897 0.0894 0.0896 0.0894 0.0898 0.0897 0.0895 10 0.0895 0.0892 0.0895 0.0892 0.0896 0.0895 0.0894 11 0.0894 0.0890 0.0893 0.0891 0.0894 0.0893 0.0893 12 0.0893 0.0889 0.0893 0.0890 0.0894 0.0893 0.0892 13 0.0894 0.0890 0.0893 0.0891 0.0895 0.0894 0.0893 14 0.0897 0.0892 0.0895 0.0893 0.0897 0.0896 0.0894 15 0.0899 0.0894 0.0897 0.0896 0.0900 0.0898 0.0895 16 0.0900 0.0896 0.0898 0.0897 0.0901 0.0900 0.0896 17 0.0902 0.0896 0.0899 0.0898 0.0902 0.0901 0.0897 18 0.0902 0.0896 0.0900 0.0899 0.0903 0.0902 0.0897 19 0.0903 0.0898 0.0901 0.0900 0.0904 0.0902 0.0898 20 0.0904 0.0899 0.0902 0.0901 0.0904 0.0903 0.0898 21 0.0904 0.0900 0.0902 0.0901 0.0904 0.0903 0.0898 22 0.0903 0.0901 0.0901 0.0900 0.0903 0.0902 0.0897 23 0.0902 0.0900 0.0900 0.0899 0.0902 0.0901 0.0896 24 0.0901 0.0900 0.0900 0.0898 0.0901 0.0900 0.0895 MAPE ARX1 = 0.1148; MAPE ARX2 = 0.0901; MAPE = 0.0890 MASE 0 0.4559 0.4552 0.4564 0.4551 0.4555 0.4549 0.4533 1 0.4550 0.4545 0.4553 0.4540 0.4547 0.4542 0.4527 2 0.4552 0.4545 0.4554 0.4542 0.4549 0.4544 0.4530 3 0.4552 0.4541 0.4554 0.4542 0.4549 0.4544 0.4533 4 0.4551 0.4538 0.4554 0.4542 0.4549 0.4544 0.4534 5 0.4549 0.4537 0.4551 0.4539 0.4547 0.4542 0.4533 6 0.4546 0.4534 0.4548 0.4536 0.4544 0.4540 0.4532 7 0.4547 0.4532 0.4548 0.4536 0.4544 0.4540 0.4532 8 0.4544 0.4531 0.4545 0.4533 0.4540 0.4537 0.4530 9 0.4537 0.4524 0.4537 0.4526 0.4532 0.4530 0.4524 10 0.4527 0.4515 0.4528 0.4517 0.4523 0.4519 0.4517 11 0.4519 0.4507 0.4521 0.4510 0.4516 0.4511 0.4511 12 0.4520 0.4504 0.4522 0.4511 0.4517 0.4511 0.4511 13 0.4529 0.4510 0.4530 0.4520 0.4525 0.4520 0.4517 14 0.4541 0.4520 0.4541 0.4532 0.4536 0.4531 0.4525 15 0.4550 0.4527 0.4549 0.4541 0.4545 0.4540 0.4530 16 0.4555 0.4533 0.4554 0.4546 0.4549 0.4545 0.4533 17 0.4558 0.4534 0.4556 0.4548 0.4550 0.4547 0.4534 18 0.4560 0.4536 0.4558 0.4550 0.4552 0.4549 0.4535 19 0.4561 0.4539 0.4558 0.4551 0.4552 0.4549 0.4535 20 0.4562 0.4542 0.4561 0.4554 0.4554 0.4550 0.4536 21 0.4562 0.4544 0.4562 0.4554 0.4554 0.4549 0.4535 22 0.4559 0.4543 0.4557 0.4550 0.4549 0.4546 0.4532 23 0.4555 0.4541 0.4551 0.4544 0.4543 0.4541 0.4528 24 0.4553 0.4539 0.4550 0.4542 0.4541 0.4539 0.4526 MASE ARX1 = 0.5706; MASE ARX2 = 0.4546; MASE = 0.4508 15
modeli siostrzanych. Mimo to nadal najlepsze prognozy siostrzane są lepsze od predykcji modelem ARX2. Ponadto w tabeli 1 przedstawiłem również błędy dla modelu będącego ednią arytmetyczną wszystkich prognoz siostrzanych przyjęcie takiej edniej jest uznawane za podejście najbardziej uniwersalne w uednianiu cen energii elektrycznej (Bordignon i in., 2013). W przypadku RMSE błąd takiej prognozy jest większy niż dla modelu ARX2, ale mniejszy niż dla ARX1. Z kolei dla pozostałych miar błędu prognoza powstała z uedniania modeli siostrzanych jest lepsza od obu modeli referencyjnych ARX1 i ARX2. Zauważmy dodatkowo, że najlepsze modele siostrzane są lepsze od modelu bez komponentu zmienianego dla tej rodziny modeli (tj. z i = 0, j = 1), zatem dodanie tych zmiennych do modelu poprawia jego własności predykcyjne. 4.2. ZACHOWANIE W CZASIE Błędy zmieniają się w czasie. Rozważmy błędy RMSE uedniane z prognoz na przestrzeni kolejnych kwartałów (wartości w tabelach 2 i 3). Zmienia się ednia wartość błędu dla każdego pomiaru od niewiele ponad 4 w pierwszym kwartale 2012 do ponad 18 w pierwszym kwartale 2013 roku. Zmienia się również to, który z modeli siostrzanych jest najlepszy. W pierwszym kwartale 2012 najmniejsze błędy osiągają modele z j = 2, zwłaszcza ten wyróżniający się dla i = 24. W kolejnym kwartale różnice są mniejsze, również nie ma zdecydowanie najlepszego modelu. Nieznacznie wygrywa model dla j = 2, i = 0, choć na pierwszy rzut oka mogłoby się wydawać, że najlepsze modele znajdują się w okolicy i = 20. W trzecim kwartale wartości RMSE są podobne dla wszystkich modeli, najlepszy okazuje się j = 2, i = 12. Ostatni kwartał 2012 roku to zmiana jeśli chodzi o najlepszą wartość j. Tu najlepsze modele są na poziomie j = 4, 5, a model z najmniejszym błędem to ten dla j = 4, i = 12. W pierwszym kwartale 2013 roku znacznie rośnie błąd dla wszystkich modeli, wyraźnie najmniejsze błędy występują dla j = 2, a dla i = 11 model jest najlepszy. W przeciwieństwie do kolejnego kwartału, gdzie błędy są dużo niższe, a modele z j = 2 są najgorsze. Najlepszym modelem jest ten sam model, co w ostatnim kwartale 2012, czyli z j = 4, i = 12. W następnym okresie najmniejszy błąd jest przy j = 5 i i = 0. Ostatni kwartał 2013 jest bardzo podobny do pierwszego kwartału 2012, z tym samym najlepszym modelem: dla j = 2, i = 24. Jeśli rozważymy miarę błędu MAPE (tabele 4 i 5), również zauważymy zróżnicowanie w kolejnych kwartałach lat 2012 i 2013. W pierwszym kwartale 2012 roku, podobnie jak dla błędu RMSE, najlepszym modelem jest ten dla j = 2 i i = 24. W następnym kwartale najmniejsza wartość MAPE osiągana jest dla j = 2 oraz i = 11. W kolejnym okresie najlepszym modelem okazuje się model z j = 7, i = 12. W ostatnim kwartale 2012 najlepsze modele to te dla j = 4, 5 oraz i około 10-11. Najmniejszy błąd jest osiągnięty dla j = 5 i i = 10. W pierwszym kwartale 2013 błędy znacznie rosną, podobnie jak w przypadku RMSE. Najmniejszy błąd MAPE ma tutaj model dla j = 2, i = 11. W kolejnym kwartale błędy maleją, a najlepszym modelem jest ten 16
Tabela 2: Błędy RMSE modeli siostrzanych, liczone w kolejnych kwartałach dla roku 2012. Poniżej każdej tabeli znajdują się odpowiadające jej błędy dla modeli ARX1 i ARX2 oraz modelu będącego ednią ze wszystkich prognoz siostrzanych. Jaśniejszy kolor oznacza mniejszy błąd, a pogrubienie mniejszą wartość błędu od modelu ARX2. Wszystkie modele mają mniejsze błędy niż ARX1 Q1 0 4.2940 4.2264 4.3009 4.2577 4.2469 4.2804 4.3093 1 4.2664 4.2064 4.2658 4.2267 4.2191 4.2562 4.2907 2 4.2650 4.2086 4.2627 4.2265 4.2224 4.2583 4.2963 3 4.2733 4.2130 4.2700 4.2351 4.2328 4.2680 4.3076 4 4.2731 4.2108 4.2678 4.2343 4.2338 4.2689 4.3095 5 4.2694 4.2064 4.2614 4.2296 4.2298 4.2652 4.3066 6 4.2700 4.2034 4.2600 4.2286 4.2283 4.2643 4.3047 7 4.2754 4.2029 4.2649 4.2326 4.2305 4.2670 4.3051 8 4.2885 4.2078 4.2804 4.2461 4.2408 4.2759 4.3083 9 4.3000 4.2137 4.2953 4.2597 4.2513 4.2835 4.3092 10 4.3078 4.2182 4.3059 4.2697 4.2593 4.2885 4.3093 11 4.3082 4.2141 4.3090 4.2716 4.2597 4.2872 4.3063 12 4.2986 4.2077 4.2981 4.2613 4.2487 4.2774 4.2988 13 4.2851 4.1973 4.2841 4.2473 4.2345 4.2656 4.2910 14 4.2783 4.1974 4.2781 4.2406 4.2274 4.2610 4.2875 15 4.2762 4.1985 4.2769 4.2395 4.2274 4.2621 4.2903 16 4.2786 4.1959 4.2827 4.2444 4.2329 4.2665 4.2958 17 4.2807 4.1879 4.2890 4.2494 4.2371 4.2688 4.2973 18 4.2812 4.1846 4.2927 4.2519 4.2371 4.2668 4.2919 19 4.2783 4.1829 4.2901 4.2485 4.2322 4.2615 4.2849 20 4.2764 4.1812 4.2887 4.2469 4.2302 4.2583 4.2828 21 4.2751 4.1785 4.2870 4.2456 4.2286 4.2559 4.2820 22 4.2653 4.1673 4.2740 4.2346 4.2165 4.2433 4.2705 23 4.2493 4.1490 4.2513 4.2164 4.1977 4.2242 4.2533 24 4.2299 4.1196 4.2169 4.1920 4.1767 4.2032 4.2337 RMSE 2012Q1 ARX1 = 5.2736; RMSE 2012Q1 ARX2 = 4.2126; RMSE 2012Q1 = 4.2258 Q3 0 10.7661 10.6853 10.7681 10.7104 10.8423 10.7268 10.6908 1 10.7800 10.7000 10.7892 10.7243 10.8558 10.7453 10.7064 2 10.7760 10.6990 10.7861 10.7182 10.8499 10.7410 10.7011 3 10.7638 10.6951 10.7739 10.7044 10.8371 10.7294 10.6900 4 10.7562 10.6961 10.7663 10.6952 10.8294 10.7229 10.6839 5 10.7491 10.7007 10.7595 10.6861 10.8223 10.7170 10.6798 6 10.7469 10.7021 10.7571 10.6821 10.8201 10.7151 10.6800 7 10.7467 10.7029 10.7567 10.6804 10.8200 10.7143 10.6827 8 10.7442 10.6953 10.7542 10.6772 10.8179 10.7107 10.6840 9 10.7322 10.6769 10.7427 10.6651 10.8056 10.6975 10.6771 10 10.7087 10.6503 10.7187 10.6422 10.7815 10.6726 10.6594 11 10.6873 10.6266 10.6963 10.6218 10.7599 10.6507 10.6426 12 10.6854 10.6163 10.6914 10.6231 10.7592 10.6497 10.6415 13 10.7056 10.6207 10.7061 10.6476 10.7813 10.6715 10.6586 14 10.7365 10.6359 10.7308 10.6822 10.8137 10.7029 10.6828 15 10.7614 10.6503 10.7514 10.7099 10.8392 10.7262 10.6983 16 10.7755 10.6644 10.7627 10.7244 10.8527 10.7371 10.7046 17 10.7815 10.6806 10.7659 10.7298 10.8578 10.7393 10.7044 18 10.7851 10.7006 10.7692 10.7326 10.8603 10.7401 10.7045 19 10.7887 10.7165 10.7762 10.7349 10.8630 10.7423 10.7069 20 10.7908 10.7254 10.7808 10.7364 10.8647 10.7440 10.7093 21 10.7862 10.7265 10.7763 10.7320 10.8599 10.7398 10.7061 22 10.7870 10.7275 10.7727 10.7365 10.8611 10.7404 10.7093 23 10.8012 10.7365 10.7848 10.7552 10.8771 10.7551 10.7260 24 10.8146 10.7470 10.7984 10.7710 10.8920 10.7691 10.7405 RMSE 2012Q3 ARX1 = 13.3495; RMSE 2012Q3 = 10.7148 RMSE2012Q3 ARX2 = 10.6845; Q2 0 12.5186 12.4245 12.6330 12.5890 12.5959 12.4896 12.6129 1 12.5309 12.4574 12.6540 12.6047 12.6126 12.5047 12.6151 2 12.5410 12.4700 12.6633 12.6142 12.6208 12.5133 12.6209 3 12.5450 12.4733 12.6662 12.6183 12.6245 12.5159 12.6212 4 12.5443 12.4748 12.6654 12.6187 12.6253 12.5148 12.6185 5 12.5434 12.4777 12.6646 12.6196 12.6269 12.5145 12.6168 6 12.5397 12.4748 12.6604 12.6177 12.6255 12.5115 12.6144 7 12.5390 12.4672 12.6583 12.6182 12.6259 12.5114 12.6163 8 12.5362 12.4557 12.6538 12.6147 12.6222 12.5094 12.6183 9 12.5282 12.4471 12.6449 12.6049 12.6134 12.5040 12.6177 10 12.5173 12.4444 12.6345 12.5917 12.6024 12.4963 12.6133 11 12.5095 12.4463 12.6278 12.5833 12.5955 12.4907 12.6069 12 12.5155 12.4564 12.6362 12.5899 12.6032 12.4972 12.6111 13 12.5351 12.4667 12.6575 12.6115 12.6231 12.5145 12.6244 14 12.5532 12.4696 12.6747 12.6302 12.6381 12.5277 12.6348 15 12.5605 12.4674 12.6791 12.6372 12.6408 12.5296 12.6352 16 12.5567 12.4661 12.6732 12.6318 12.6325 12.5221 12.6294 17 12.5434 12.4599 12.6583 12.6151 12.6148 12.5068 12.6196 18 12.5284 12.4569 12.6406 12.5974 12.5957 12.4904 12.6074 19 12.5105 12.4473 12.6199 12.5783 12.5760 12.4724 12.5931 20 12.4956 12.4355 12.6037 12.5621 12.5609 12.4586 12.5842 21 12.4967 12.4304 12.6059 12.5613 12.5632 12.4618 12.5919 22 12.5124 12.4320 12.6252 12.5722 12.5784 12.4795 12.6137 23 12.5439 12.4497 12.6650 12.5994 12.6089 12.5123 12.6464 24 12.5766 12.4757 12.7111 12.6301 12.6409 12.5460 12.6770 RMSE 2012Q2 ARX1 = 14.9577; RMSE 2012Q2 = 12.5562 Q4 RMSE2012Q2 ARX2 = 12.4136; 0 4.9861 4.9670 4.9960 4.9015 4.9096 4.9503 4.9378 1 4.9682 4.9613 4.9787 4.8869 4.8950 4.9345 4.9247 2 4.9679 4.9621 4.9780 4.8889 4.8970 4.9356 4.9266 3 4.9627 4.9595 4.9725 4.8854 4.8940 4.9313 4.9248 4 4.9586 4.9541 4.9677 4.8821 4.8909 4.9271 4.9237 5 4.9514 4.9450 4.9596 4.8750 4.8842 4.9195 4.9204 6 4.9462 4.9356 4.9542 4.8693 4.8788 4.9140 4.9188 7 4.9456 4.9294 4.9527 4.8679 4.8774 4.9126 4.9198 8 4.9464 4.9286 4.9528 4.8680 4.8777 4.9128 4.9207 9 4.9446 4.9249 4.9509 4.8665 4.8758 4.9103 4.9185 10 4.9390 4.9209 4.9462 4.8605 4.8700 4.9040 4.9135 11 4.9302 4.9131 4.9401 4.8520 4.8614 4.8948 4.9057 12 4.9192 4.8993 4.9331 4.8417 4.8511 4.8846 4.8969 13 4.9222 4.8985 4.9407 4.8460 4.8554 4.8898 4.8991 14 4.9346 4.9019 4.9545 4.8584 4.8680 4.9042 4.9092 15 4.9484 4.9068 4.9677 4.8703 4.8804 4.9188 4.9199 16 4.9568 4.9046 4.9734 4.8756 4.8861 4.9269 4.9260 17 4.9639 4.9052 4.9767 4.8791 4.8902 4.9330 4.9296 18 4.9737 4.9245 4.9858 4.8867 4.8977 4.9417 4.9333 19 4.9765 4.9368 4.9857 4.8872 4.8980 4.9427 4.9314 20 4.9761 4.9437 4.9836 4.8854 4.8960 4.9409 4.9284 21 4.9769 4.9458 4.9838 4.8858 4.8962 4.9409 4.9294 22 4.9726 4.9432 4.9791 4.8790 4.8902 4.9358 4.9253 23 4.9669 4.9387 4.9734 4.8709 4.8827 4.9292 4.9204 24 4.9631 4.9344 4.9690 4.8662 4.8779 4.9247 4.9169 RMSE 2012Q4 ARX1 = 5.9909; RMSE 2012Q4 = 4.8950 RMSE2012Q4 ARX2 = 4.9239; 17
Tabela 3: Błędy RMSE modeli siostrzanych, liczone w kolejnych kwartałach dla roku 2013. Poniżej każdej tabeli znajdują się odpowiadające jej błędy dla modeli ARX1 i ARX2 oraz modelu będącego ednią ze wszystkich prognoz siostrzanych. Jaśniejszy kolor oznacza mniejszy błąd, a pogrubienie mniejszą wartość błędu od modelu ARX2. Wszystkie modele mają mniejsze błędy niż ARX1 Q1 0 18.2703 17.9326 18.3341 18.3154 18.1443 18.1639 18.1296 1 18.2149 17.9295 18.2894 18.2738 18.0982 18.1209 18.0872 2 18.1983 17.9292 18.2705 18.2602 18.0867 18.1093 18.0741 3 18.1980 17.9269 18.2683 18.2621 18.0898 18.1127 18.0766 4 18.1986 17.9176 18.2695 18.2658 18.0935 18.1173 18.0809 5 18.1928 17.9078 18.2661 18.2646 18.0927 18.1173 18.0807 6 18.1790 17.8932 18.2534 18.2542 18.0848 18.1107 18.0754 7 18.1778 17.8737 18.2521 18.2533 18.0897 18.1166 18.0822 8 18.1719 17.8531 18.2429 18.2457 18.0904 18.1181 18.0844 9 18.1617 17.8288 18.2265 18.2334 18.0881 18.1172 18.0837 10 18.1581 17.8120 18.2156 18.2270 18.0905 18.1209 18.0861 11 18.1752 17.8109 18.2262 18.2410 18.1093 18.1414 18.1038 12 18.2103 17.8329 18.2591 18.2730 18.1412 18.1747 18.1362 13 18.2543 17.8546 18.3075 18.3164 18.1793 18.2124 18.1731 14 18.2891 17.8505 18.3399 18.3444 18.2022 18.2346 18.1959 15 18.3109 17.8311 18.3454 18.3523 18.2097 18.2420 18.2045 16 18.3197 17.8193 18.3453 18.3549 18.2123 18.2429 18.2051 17 18.3271 17.8128 18.3357 18.3527 18.2132 18.2441 18.2073 18 18.3344 17.8418 18.3347 18.3554 18.2152 18.2453 18.2052 19 18.3254 17.8581 18.3111 18.3364 18.1973 18.2290 18.1885 20 18.3200 17.8690 18.2993 18.3280 18.1895 18.2212 18.1796 21 18.3184 17.8822 18.2937 18.3250 18.1873 18.2183 18.1747 22 18.3249 17.8877 18.2836 18.3241 18.1909 18.2233 18.1782 23 18.3257 17.8869 18.2577 18.3116 18.1856 18.2214 18.1754 24 18.3209 17.8857 18.2453 18.3058 18.1811 18.2174 18.1710 RMSE 2013Q1 ARX1 = 21.5818; RMSE 2013Q1 ARX2 = 17.9218; RMSE 2013Q1 = 18.1172 Q3 0 9.3107 9.4165 9.2559 9.1884 9.0674 9.1289 9.4369 1 9.3124 9.4294 9.2645 9.2022 9.0792 9.1281 9.4171 2 9.3341 9.4597 9.2876 9.2270 9.1002 9.1423 9.4243 3 9.3684 9.4987 9.3214 9.2616 9.1337 9.1694 9.4388 4 9.4107 9.5426 9.3624 9.3027 9.1751 9.2049 9.4590 5 9.4636 9.5963 9.4146 9.3551 9.2288 9.2529 9.4892 6 9.5065 9.6427 9.4574 9.3983 9.2729 9.2944 9.5175 7 9.5403 9.6773 9.4886 9.4291 9.3057 9.3288 9.5407 8 9.5509 9.6864 9.4950 9.4365 9.3183 9.3476 9.5539 9 9.5274 9.6670 9.4683 9.4120 9.3015 9.3395 9.5422 10 9.4780 9.6257 9.4153 9.3612 9.2592 9.3060 9.5073 11 9.4318 9.5863 9.3660 9.3136 9.2183 9.2711 9.4726 12 9.4260 9.5712 9.3548 9.3040 9.2124 9.2664 9.4715 13 9.4563 9.5836 9.3788 9.3274 9.2358 9.2871 9.4996 14 9.4713 9.5869 9.3924 9.3382 9.2422 9.2891 9.5137 15 9.4587 9.5786 9.3819 9.3211 9.2196 9.2650 9.5044 16 9.4310 9.5861 9.3779 9.3044 9.1927 9.2338 9.4803 17 9.4021 9.6077 9.3879 9.2963 9.1718 9.2077 9.4545 18 9.3623 9.5971 9.3896 9.2863 9.1479 9.1757 9.4241 19 9.3334 9.5629 9.3631 9.2575 9.1184 9.1486 9.4038 20 9.3067 9.5133 9.3337 9.2316 9.0954 9.1284 9.3938 21 9.2922 9.4720 9.3079 9.2115 9.0826 9.1201 9.3958 22 9.2878 9.4414 9.2906 9.1980 9.0776 9.1205 9.4049 23 9.2854 9.4266 9.2842 9.1902 9.0750 9.1208 9.4088 24 9.2777 9.4238 9.2988 9.1992 9.0781 9.1169 9.4026 RMSE 2013Q3 ARX1 = 12.2477; RMSE 2013Q3 ARX2 = 9.421; RMSE 2013Q3 = 9.3089 Q2 0 4.8558 4.8978 4.8161 4.7945 4.7951 4.7933 4.7934 1 4.8590 4.8961 4.8294 4.8022 4.8012 4.8000 4.8003 2 4.8678 4.8982 4.8404 4.8110 4.8093 4.8081 4.8081 3 4.8699 4.8958 4.8449 4.8135 4.8117 4.8109 4.8112 4 4.8683 4.8948 4.8463 4.8129 4.8112 4.8108 4.8113 5 4.8720 4.8965 4.8538 4.8174 4.8154 4.8148 4.8149 6 4.8749 4.9011 4.8602 4.8212 4.8188 4.8173 4.8162 7 4.8755 4.9028 4.8617 4.8221 4.8197 4.8171 4.8152 8 4.8681 4.8973 4.8570 4.8162 4.8136 4.8101 4.8086 9 4.8476 4.8784 4.8386 4.7970 4.7946 4.7904 4.7905 10 4.8098 4.8485 4.8020 4.7604 4.7591 4.7549 4.7574 11 4.7759 4.8255 4.7645 4.7257 4.7265 4.7236 4.7280 12 4.7711 4.8290 4.7509 4.7181 4.7214 4.7209 4.7251 13 4.7933 4.8582 4.7607 4.7356 4.7411 4.7432 4.7458 14 4.8202 4.8921 4.7766 4.7599 4.7662 4.7692 4.7707 15 4.8424 4.9216 4.7892 4.7823 4.7879 4.7894 4.7896 16 4.8546 4.9384 4.7989 4.7976 4.8009 4.7995 4.7978 17 4.8626 4.9528 4.8145 4.8149 4.8137 4.8076 4.8029 18 4.8665 4.9559 4.8291 4.8285 4.8225 4.8123 4.8054 19 4.8716 4.9549 4.8434 4.8430 4.8325 4.8191 4.8107 20 4.8739 4.9556 4.8538 4.8532 4.8389 4.8230 4.8127 21 4.8736 4.9585 4.8624 4.8607 4.8423 4.8241 4.8110 22 4.8770 4.9626 4.8742 4.8728 4.8498 4.8292 4.8133 23 4.8779 4.9663 4.8789 4.8772 4.8520 4.8307 4.8123 24 4.8757 4.9689 4.8806 4.8776 4.8512 4.8287 4.8080 RMSE 2013Q2 ARX1 = 6.5556; RMSE 2013Q2 ARX2 = 4.9194; RMSE 2013Q2 = 4.7916 Q4 0 11.5319 11.5050 11.6944 11.6571 11.6640 11.5079 11.4247 1 11.5398 11.5234 11.6666 11.6387 11.6598 11.5105 11.4350 2 11.5240 11.5192 11.6378 11.6169 11.6446 11.4953 11.4195 3 11.5322 11.5205 11.6435 11.6231 11.6513 11.5023 11.4265 4 11.5602 11.5226 11.6680 11.6459 11.6732 11.5244 11.4501 5 11.5746 11.5166 11.6788 11.6548 11.6818 11.5349 11.4642 6 11.5725 11.5043 11.6766 11.6514 11.6775 11.5327 11.4652 7 11.5650 11.4950 11.6738 11.6465 11.6691 11.5241 11.4581 8 11.5611 11.4966 11.6658 11.6412 11.6615 11.5164 11.4541 9 11.5658 11.5009 11.6602 11.6391 11.6563 11.5108 11.4563 10 11.5599 11.5047 11.6527 11.6324 11.6454 11.5007 11.4545 11 11.5458 11.4957 11.6478 11.6221 11.6302 11.4883 11.4472 12 11.5431 11.4875 11.6544 11.6192 11.6245 11.4877 11.4459 13 11.5660 11.4972 11.6871 11.6379 11.6404 11.5073 11.4600 14 11.5815 11.4927 11.7181 11.6540 11.6513 11.5182 11.4637 15 11.5815 11.4735 11.7406 11.6611 11.6503 11.5134 11.4540 16 11.5707 11.4508 11.7476 11.6591 11.6425 11.5017 11.4414 17 11.5623 11.4340 11.7379 11.6436 11.6246 11.4852 11.4288 18 11.5620 11.4427 11.7225 11.6276 11.6097 11.4766 11.4251 19 11.5544 11.4519 11.7019 11.6088 11.5932 11.4645 11.4170 20 11.5452 11.4500 11.6800 11.5907 11.5777 11.4546 11.4136 21 11.5322 11.4373 11.6516 11.5651 11.5555 11.4401 11.4078 22 11.5124 11.4154 11.6168 11.5314 11.5242 11.4192 11.3973 23 11.4925 11.3837 11.5832 11.5005 11.4952 11.3989 11.3868 24 11.4885 11.3669 11.5717 11.4912 11.4867 11.3958 11.3887 RMSE 2013Q4 ARX1 = 12.6848; RMSE 2013Q4 ARX2 = 11.4629; RMSE 2013Q4 = 11.5233 18
Tabela 4: Błędy MAPE modeli siostrzanych, liczone w kolejnych kwartałach dla roku 2012. Poniżej każdej tabeli znajdują się odpowiadające jej błędy dla modeli ARX1 i ARX2 oraz modelu będącego ednią ze wszystkich prognoz siostrzanych. Jaśniejszy kolor oznacza mniejszy błąd, a pogrubienie mniejszą wartość błędu od modelu ARX2. Wszystkie modele mają mniejsze błędy niż ARX1 Q1 0 0.0872 0.0871 0.0872 0.0868 0.0884 0.0885 0.0895 1 0.0865 0.0864 0.0862 0.0860 0.0878 0.0878 0.0889 2 0.0865 0.0864 0.0862 0.0860 0.0880 0.0879 0.0892 3 0.0867 0.0865 0.0863 0.0862 0.0882 0.0881 0.0895 4 0.0868 0.0865 0.0863 0.0862 0.0882 0.0882 0.0895 5 0.0868 0.0865 0.0863 0.0862 0.0882 0.0882 0.0896 6 0.0869 0.0864 0.0864 0.0862 0.0881 0.0882 0.0896 7 0.0870 0.0864 0.0865 0.0863 0.0881 0.0882 0.0895 8 0.0871 0.0865 0.0867 0.0863 0.0882 0.0882 0.0895 9 0.0873 0.0866 0.0869 0.0865 0.0882 0.0883 0.0894 10 0.0875 0.0865 0.0871 0.0866 0.0883 0.0883 0.0893 11 0.0875 0.0863 0.0872 0.0867 0.0883 0.0882 0.0892 12 0.0873 0.0859 0.0871 0.0865 0.0881 0.0880 0.0891 13 0.0868 0.0857 0.0866 0.0861 0.0877 0.0877 0.0889 14 0.0865 0.0858 0.0863 0.0859 0.0875 0.0875 0.0888 15 0.0864 0.0859 0.0862 0.0859 0.0875 0.0876 0.0888 16 0.0865 0.0860 0.0864 0.0860 0.0877 0.0877 0.0890 17 0.0866 0.0860 0.0866 0.0862 0.0879 0.0879 0.0891 18 0.0866 0.0858 0.0867 0.0864 0.0880 0.0879 0.0891 19 0.0866 0.0859 0.0868 0.0865 0.0881 0.0880 0.0891 20 0.0867 0.0859 0.0869 0.0867 0.0882 0.0880 0.0891 21 0.0866 0.0859 0.0869 0.0866 0.0880 0.0879 0.0889 22 0.0863 0.0857 0.0866 0.0864 0.0877 0.0875 0.0885 23 0.0860 0.0853 0.0863 0.0861 0.0872 0.0870 0.0880 24 0.0856 0.0848 0.0859 0.0857 0.0867 0.0866 0.0877 MAPE 2012Q1 ARX1 = 0.1109; MAPE 2012Q1 ARX2 = 0.0869; MAPE 2012Q1 = 0.0867 Q3 0 0.0898 0.0888 0.0894 0.0892 0.0882 0.0885 0.0858 1 0.0893 0.0883 0.0891 0.0890 0.0881 0.0884 0.0856 2 0.0892 0.0881 0.0889 0.0889 0.0879 0.0883 0.0855 3 0.0889 0.0878 0.0887 0.0886 0.0877 0.0879 0.0854 4 0.0887 0.0876 0.0885 0.0885 0.0874 0.0877 0.0854 5 0.0885 0.0875 0.0883 0.0882 0.0872 0.0875 0.0853 6 0.0884 0.0873 0.0882 0.0882 0.0872 0.0875 0.0853 7 0.0883 0.0872 0.0881 0.0881 0.0871 0.0874 0.0853 8 0.0881 0.0870 0.0879 0.0878 0.0868 0.0872 0.0852 9 0.0877 0.0866 0.0875 0.0874 0.0864 0.0868 0.0850 10 0.0871 0.0861 0.0868 0.0868 0.0858 0.0863 0.0847 11 0.0867 0.0856 0.0863 0.0864 0.0853 0.0858 0.0844 12 0.0866 0.0855 0.0862 0.0864 0.0852 0.0857 0.0843 13 0.0868 0.0855 0.0864 0.0866 0.0855 0.0860 0.0845 14 0.0875 0.0859 0.0869 0.0872 0.0861 0.0866 0.0850 15 0.0883 0.0864 0.0876 0.0879 0.0868 0.0874 0.0854 16 0.0889 0.0869 0.0882 0.0884 0.0874 0.0879 0.0857 17 0.0894 0.0874 0.0887 0.0888 0.0879 0.0884 0.0861 18 0.0898 0.0879 0.0890 0.0891 0.0883 0.0887 0.0863 19 0.0901 0.0883 0.0893 0.0894 0.0885 0.0890 0.0864 20 0.0903 0.0887 0.0896 0.0896 0.0887 0.0891 0.0865 21 0.0903 0.0889 0.0896 0.0895 0.0886 0.0891 0.0864 22 0.0901 0.0891 0.0895 0.0893 0.0885 0.0890 0.0863 23 0.0901 0.0893 0.0896 0.0890 0.0884 0.0889 0.0864 24 0.0900 0.0893 0.0895 0.0888 0.0881 0.0887 0.0862 MAPE 2012Q3 ARX1 = 0.1092; MAPE 2012Q3 = 0.0869 MAPE2012Q3 ARX2 = 0.0889; Q2 0 0.0913 0.0905 0.0904 0.0907 0.0946 0.0927 0.0925 1 0.0910 0.0901 0.0900 0.0901 0.0943 0.0923 0.0920 2 0.0911 0.0901 0.0902 0.0903 0.0944 0.0924 0.0922 3 0.0912 0.0901 0.0903 0.0904 0.0944 0.0925 0.0923 4 0.0911 0.0899 0.0902 0.0903 0.0944 0.0924 0.0924 5 0.0910 0.0898 0.0902 0.0902 0.0943 0.0924 0.0924 6 0.0910 0.0896 0.0902 0.0901 0.0942 0.0923 0.0924 7 0.0910 0.0895 0.0901 0.0900 0.0941 0.0922 0.0923 8 0.0909 0.0894 0.0901 0.0899 0.0940 0.0921 0.0923 9 0.0907 0.0892 0.0899 0.0897 0.0938 0.0919 0.0921 10 0.0904 0.0888 0.0896 0.0895 0.0935 0.0916 0.0919 11 0.0902 0.0886 0.0895 0.0894 0.0934 0.0914 0.0917 12 0.0903 0.0886 0.0896 0.0895 0.0935 0.0915 0.0917 13 0.0905 0.0889 0.0897 0.0898 0.0937 0.0917 0.0917 14 0.0908 0.0892 0.0899 0.0902 0.0939 0.0919 0.0919 15 0.0910 0.0895 0.0901 0.0904 0.0942 0.0922 0.0920 16 0.0911 0.0900 0.0901 0.0905 0.0943 0.0923 0.0921 17 0.0911 0.0901 0.0901 0.0906 0.0944 0.0924 0.0921 18 0.0911 0.0902 0.0900 0.0906 0.0944 0.0925 0.0921 19 0.0911 0.0902 0.0900 0.0906 0.0945 0.0925 0.0921 20 0.0912 0.0903 0.0902 0.0908 0.0947 0.0927 0.0923 21 0.0913 0.0904 0.0904 0.0910 0.0947 0.0927 0.0924 22 0.0912 0.0905 0.0903 0.0910 0.0948 0.0927 0.0924 23 0.0912 0.0905 0.0904 0.0912 0.0948 0.0927 0.0924 24 0.0912 0.0906 0.0907 0.0914 0.0949 0.0927 0.0925 MAPE 2012Q2 ARX1 = 0.1172; MAPE 2012Q2 = 0.0906 Q4 MAPE2012Q2 ARX2 = 0.0907; 0 0.0745 0.0753 0.0744 0.0727 0.0727 0.0737 0.0739 1 0.0741 0.0751 0.0741 0.0723 0.0723 0.0734 0.0737 2 0.0741 0.0751 0.0741 0.0724 0.0723 0.0734 0.0737 3 0.0740 0.0751 0.0739 0.0723 0.0722 0.0733 0.0737 4 0.0740 0.0750 0.0739 0.0723 0.0722 0.0733 0.0737 5 0.0740 0.0750 0.0738 0.0722 0.0723 0.0733 0.0737 6 0.0740 0.0751 0.0738 0.0722 0.0723 0.0733 0.0738 7 0.0741 0.0752 0.0739 0.0723 0.0724 0.0734 0.0738 8 0.0741 0.0753 0.0738 0.0723 0.0723 0.0733 0.0738 9 0.0739 0.0753 0.0738 0.0722 0.0722 0.0731 0.0736 10 0.0738 0.0753 0.0737 0.0721 0.0721 0.0729 0.0735 11 0.0737 0.0753 0.0738 0.0721 0.0722 0.0729 0.0734 12 0.0737 0.0753 0.0740 0.0722 0.0722 0.0729 0.0734 13 0.0739 0.0754 0.0742 0.0724 0.0724 0.0731 0.0735 14 0.0742 0.0755 0.0745 0.0726 0.0726 0.0734 0.0737 15 0.0744 0.0755 0.0747 0.0728 0.0728 0.0737 0.0739 16 0.0745 0.0754 0.0747 0.0728 0.0728 0.0737 0.0738 17 0.0744 0.0751 0.0747 0.0727 0.0727 0.0737 0.0738 18 0.0744 0.0750 0.0747 0.0728 0.0727 0.0737 0.0738 19 0.0744 0.0750 0.0746 0.0728 0.0727 0.0737 0.0738 20 0.0744 0.0749 0.0745 0.0728 0.0727 0.0737 0.0738 21 0.0744 0.0749 0.0745 0.0728 0.0727 0.0736 0.0738 22 0.0743 0.0749 0.0744 0.0727 0.0726 0.0735 0.0738 23 0.0742 0.0749 0.0742 0.0725 0.0724 0.0734 0.0736 24 0.0740 0.0749 0.0741 0.0724 0.0722 0.0732 0.0734 MAPE 2012Q4 ARX1 = 0.0932; MAPE 2012Q4 = 0.073 MAPE2012Q4 ARX2 = 0.0742; 19