Modelowanie sezonowości a prognozowanie zapotrzebowania na energię elektryczną

Podobne dokumenty
Modelowanie sezonowo ci a prognozowanie zapotrzebowania na energi elektryczn

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

3. Analiza własności szeregu czasowego i wybór typu modelu

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Zachowania odbiorców. Grupa taryfowa G

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

4. Średnia i autoregresja zmiennej prognozowanej

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Metody Prognozowania

3. Modele tendencji czasowej w prognozowaniu

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

5. Model sezonowości i autoregresji zmiennej prognozowanej

Przykład 2. Stopa bezrobocia

7.4 Automatyczne stawianie prognoz

Ćwiczenie 5 PROGNOZOWANIE

Modelowanie i prognozowanie zapotrzebowania oraz cen energii elektrycznej w warunkach rynkowych

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Prognozowanie zapotrzebowania na energię w ujęciu Earnings at Risk (EaR) 1)

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zakładamy, że są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej i wariancji.

WYKŁAD: Szeregi czasowe I. Zaawansowane Metody Uczenia Maszynowego

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Analiza szeregów czasowych bezrobocia i inflacji w Danii

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Metody systemowe i decyzyjne w informatyce

Kolokwium ze statystyki matematycznej

Analiza autokorelacji

wprowadzenie do analizy szeregów czasowych

PROGNOZOWANIE CEN ENERGII NA RYNKU BILANSUJĄCYM

Ekonometryczna analiza popytu na wodę

PROGNOZA WYSTĄPIENIA WSTRZĄSU ZA POMOCĄ SZEREGÓW CZASOWYCH. 1. Wprowadzenie. Zdzisław Iwulski* Górnictwo i Geoinżynieria Rok 31 Zeszyt 3/1 2007

Stacjonarność Integracja. Integracja. Integracja

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4.

Wprowadzenie do szeregów czasowych i modelu ARIMA

Joanicjusz Nazarko, Joanna Chrabołowska, Mikołaj Rybaczuk Politechnika Białostocka

MODELE AUTOREGRESYJNE W PROGNOZOWANIU CEN ZBÓŻ W POLSCE

Wprowadzenie do analizy korelacji i regresji

Analiza składowych głównych. Wprowadzenie

Rozpoznawanie obrazów

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Statystyka Matematyczna Anna Janicka

Modelowanie ekonometryczne

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Stanisław Cihcocki. Natalia Nehrebecka

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Co trzeba wiedzieć korzystając z modelu ARIMA i które parametry są kluczowe?

Weryfikacja hipotez statystycznych

PDF created with FinePrint pdffactory Pro trial version

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0,

LABORATORIUM PODSTAW TELEKOMUNIKACJI

KORELACJE I REGRESJA LINIOWA

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

Matematyka ubezpieczeń majątkowych r.

ANALIZA SYSTEMU POMIAROWEGO (MSA)

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Sposoby opisu i modelowania zakłóceń kanałowych

Analiza regresji - weryfikacja założeń

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wprowadzenie do teorii prognozowania

Wiadomości ogólne o ekonometrii

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Zmienne zależne i niezależne

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka matematyczna dla leśników

Analiza składowych głównych

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Analiza metod prognozowania kursów akcji

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Układy stochastyczne

Prognozowanie zanieczyszczeń atmosferycznych przy użyciu sieci neuronowych

Ćwiczenia IV

KRÓTKOOKRESOWE PROGNOZOWANIE CENY EKSPORTOWEJ WĘGLA ROSYJSKIEGO W PORTACH BAŁTYCKICH. Sławomir Śmiech, Monika Papież

Natalia Neherbecka. 11 czerwca 2010

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Zmienność wiatru w okresie wieloletnim

Rozdział 8. Regresja. Definiowanie modelu

Transkrypt:

Mgr inż. Adam Misiorek, 1) IASE Wrocław dr inż. Rafał Weron Centrum im. H. Steinhausa, Politechnika Wrocławska Modelowanie sezonowości a prognozowanie zapotrzebowania na energię elektryczną 1) Praca wykonana w ramach projektu KBN nr 4 T10B 030 25 Prognozowanie zapotrzebowania na energię elektryczną stanowi jeden z najważniejszych obszarów badań w elektroenergetyce. Przedsiębiorstwa tej branży potrzebują zarówno prognoz krótkoterminowych (minutowych, godzinnych czy dobowych) jak i długoterminowych (dochodzących do kilkunastu lat). Znaczenie tych pierwszych wzrasta wraz z rozwojem konkurencji i mechanizmów wolnorynkowych na rynkach energii elektrycznej. Prognozowanie zapotrzebowania, niezwykle istotne dla branży elektroenergetycznej, jest zadaniem trudnym. Po pierwsze, z uwagi na fakt, że szereg czasowy zapotrzebowania wykazuje sezonowość dobową, tygodniową i roczną. Po drugie, ze względu na czynniki zewnętrzne, które mają istotny wpływ na wysokość zapotrzebowania (z czynnikami meteorologicznymi na czele). Nie jest rzeczą trudną stworzyć prognozę krótkoterminową obarczoną kilkuprocentowym błędem. Jednak koszty finansowe takiego błędu są na tyle wysokie, że podjęto badania w celu zredukowania choćby ułamkowej jego części. Wiele modeli i metod prognostycznych zostało wypróbowanych z różnymi efektami do prognozowania zapotrzebowania. Można je podzielić na dwie grupy technik bazujących na sztucznej inteligencji oraz klasycznych (statystycznych) modeli. Pierwsze z nich obejmują systemy ekspertowe, wnioskowanie rozmyte, rozmyte modele neuronowe i, przede wszystkim, sieci neuronowe (SN). W latach dziewięćdziesiątych wiele badań zostało przeprowadzonych z użyciem tych modeli. Niemniej jednak raporty o wykorzystaniu SN w prognozowaniu nie w pełni przekonały badaczy i praktyków. Ostatnie opracowania i podręczniki na temat prognozowania utrzymują, że, jak dotąd znaleziono niewiele dowodów, że SN mogą przewyższać standardowe metody prognostyczne [7, 8]. Przegląd systemów prognostycznych bazujących na SN prowadzi do spostrzeżenia, że należy usprawnić, aby zostały uznane za dobrą metodę prognozowania i choć są one obiecujące, to znacznej liczbie wyników badań nad zastosowaniem SN w predykcji brakuje wiarygodności. Wysuwano zasadnicze mankamenty: proponowana architektura SN była zbyt duża dla dostępnych danych (SN najwyraźniej przerastały dane) oraz modele nie były testowane w sposób systematyczny [7]. Metody statystyczne różnią się od poprzednio zaprezentowanych tym, że prognoza wartości analizowanej zmiennej jest ścisłą matematyczną kombinacją wcześniejszych wartości tej zmiennej oraz, czasami, wartości zmiennych zewnętrznych (przede wszystkim parametrów pogody oraz wpływu zjawisk społecznych). Podejścia, które są stosowane, obejmują modele autoregresji (AR), modele regresji liniowej, dynamiczne modele liniowe i nieliniowe, modele typu ARMAX, progowe modele AR (Threshold AR), metody bazujące na filtrze Kalmana, technikach optymalizacyjnych i procedurach dopasowania krzywych. Statystyczne modele są atrakcyjne ze względu na fakt, iż stosunkowo łatwo można interpretować poszczególne składniki tych modeli, umożliwiając inżynierom i operatorom systemu zrozumienie ich zachowań. Jednocześnie oferują one relatywnie wysoką dokładność [5, 12, 14, 15]. W niniejszym artykule analizujemy dwa statystyczne podejścia do prognozowania zapotrzebowania na energię elektryczną. W obu modelujemy zapotrzebowanie jako sumę dwóch komponent deterministycznej (reprezentującej sezonowości) oraz stochastycznej (reprezentującej szum). Różnią się one jednak zastosowaną techniką usuwania sezonowości. W modelu A używamy różnicowania, natomiast w modelu B wykorzystujemy niedawno zaproponowaną technikę sezonowej zmienności [16]. W obu modelach komponenta stochastyczna opisywana jest szeregiem ARMA. Tym samym zakładamy, że wpływ zewnętrznych czynników może być modelowany przez odpowiednio skalibrowaną komponentę deterministyczną. Stanowi to oczywiście uproszczenie problemu ale, jak pokażemy w dalszej części artykułu, nawet takie podejście pozwala uzyskać dobrą prognozę zapotrzebowania. Analizowane dane Analizowany szereg czasowy zapotrzebowania na energię elektryczną został skonstruowany na podstawie danych publikowanych przez kalifornijskiego operatora systemu (CAISO, http://oasis.caiso.com). W artykule będziemy korzystali z danych obejmujących okres od 1 stycznia 1999 r. do 31 grudnia 2002 r. Pierwsze dwa lata posłużą nam wyłącznie do kalibracji modeli, natomiast lata 2001 i 2002 zostaną wykorzystane w celu przetestowania modeli. Zauważmy, że w tym okresie wystąpiła drastyczna eskalacja cen na rynku kalifornijskim, która doprowadziła do zaciemnień w San Francisco w połowie stycznia 2001 r. oraz bankructwa kalifornijskiej giełdy energii (CalPX) z końcem stycznia 2001 r. [2] Ponieważ w danych był widoczny bardzo wyraźny cykl dobowy utworzyliśmy szereg dobowego zapotrzebowania, gdyż w niniejszym artykule nie chcieliśmy się zajmować modelowaniem cyklu dobowego (rys. 1). strona 794 (10)

Rys. 1. Dobowe zapotrzebowanie na energię elektryczną w Kalifornii (1999 2002) Rys. 3. Funkcja autokorelacji ACF(k) dla zapotrzebowania na energię elektryczną w Kalifornii (1999 2000). Widoczna okresowość tygodniowa Oprócz cyklu dobowego, analizowany szereg czasowy charakteryzuje się sezonowością tygodniową i roczną. Muszą zostać one usunięte zanim będziemy mogli kalibrować modele części stochastycznej. Modelowanie sezonowości Sezonowość (okresowość, cykle) najprościej można zaobserwować w domenie częstotliwościowej korzystając z estymatora gęstości spektralnej, czyli z periodogramu. Dla wektora obserwacji {x 1,...,x n } periodogram jest definiowany jako: gdzie: ω k = k/n, k = 1,..., [n/2] oraz [x] oznacza największą liczbę całkowitą mniejszą lub równą x. Zauważmy, że I n jest kwadratem wartości bezwzględnej transformaty Fouriera. Na rysunku 2 przedstawiono periodogram dla zapotrzebowania, na którym wyraźnie widać duże skoki dla częstotliwości odpowiadającej cyklom o okresie 7 i 365 dni. Mniejsze skoki w okolicy ω k = 0,29 i 0,43 odpowiadają cyklom 3,5- oraz 2,33-dniowym. Oba skoki to tzw. harmoniczne (wielokrotności sezonowości tygodniowej) i dowodzą, że dane wykazują okres 7-dniowy, który nie jest jednak sinusoidalny. Zauważmy, że transformata Fouriera to tak naprawdę rozbicie na sumę sinusów i cosinusów o różnych częstotliwościach (czyli różnych okresach, gdyż obie wartości są powiązane relacją: okres = 1/częstotliwość). Cykl tygodniowy można również zaobserwować na wykresie autokorelacji (rys. 3). Przypomnijmy, że funkcja autokorelacji ACF(k)= CF(x,x,k) mierzy korelację pomiędzy wartościami szeregu danych oddalonymi od siebie o k punktów. Model A Jak już wspomniano, zapotrzebowanie na energię elektryczną Z t będzie przedstawione jako suma dwóch składowych deterministycznej (inaczej okresowej) X t oraz stochastycznej (inaczej losowej) Y t. Podejście to można zrealizować na wiele sposobów. Prawdopodobnie najprostszym jest wykorzystanie różnicowania, czyli wyliczenia różnic między bieżącymi wartościami zapotrzebowania a wartościami przeszłymi [2]. W modelu A wykorzystujemy formułę: gdzie Y t = Zt X t, Rys. 2. Periodogram zapotrzebowania na energię elektryczną w Kalifornii (1999 2000). Widoczne duże skoki dla częstotliwości odpowiadającym cyklom o okresie 7 i 365 dni T = 168 h (tydzień), D = 24 h (doba), N = 4 lub 5 jest liczbą tygodni użytych do kalibracji, M = 7 jest liczbą dni w tygodniu. Procedura ta prowadzi do uzyskania w przybliżeniu stacjonarnego ciągu Y t. Test KPSS [10] nie odrzuca hipotezy o stacjonarności na poziomie 5%. Przedstawiony na rysunku 4 periodogram komponenty Y t również nie wykazuje wyraźnej sezonowości. Widzimy jednak, że dla małych wartości częstości (powiązanych z najdłuższymi okresami) wciąż pozostały duże wartości liczbowe. Oznacza to, że metoda ta nie jest w stanie usunąć sezonowości o dużym okresie. Pozwala ona jednak na modelowanie części stochastycznej Y t za pomocą szeregu czasowego typu ARMA. strona 795 (11)

Aby usunąć cykl tygodniowy wystarczy teraz odjąć go od danych: d t = x t s t dla t =1,...,731. Ostatecznie, aby usunąć trend z odsezonowanych danych d t policzyliśmy zwroty logarytmiczne r t = log(d t +1/d t ). Po usunięciu cyklu tygodniowego pozostał jeszcze cykl roczny. Niestety, z powodu małej liczby danych użytych do kalibracji (obejmujących tylko dwa lata) metoda średniej ruchomej nie mogła być zastosowana. Zastosowaliśmy więc metodę sezonowej zmienności [16], która polega na: policzeniu 25-dniowej rolowanej zmienności [7]: ˇ Rys. 4. Periodogram zapotrzebowania na energię elektryczną w Kalifornii (1999 2000) po usunięciu sezonowości w modelu A Model B Technika różnicowania zastosowana w modelu A ma pewną niekorzystną własność. Mianowicie, jest ona bardzo wrażliwa na wartości zapotrzebowania obserwowane w poprzednich dniach czy tygodniach. Jeśli w okresie bezpośrednio poprzedzającym horyzont prognozy wystąpiły jakieś anomalie w modelowanym procesie zapotrzebowania, to będą się one propagowały na prognozowany okres. Alternatywne podejście, które nie ma tej wady, polega na dopasowaniu zazwyczaj poprzez metodę najmniejszych kwadratów sumy sinusoid o różnych amplitudach, częstotliwościach oraz/lub przesunięciach fazowych [13]. Jednak nasze dane obejmują okres tylko czterech lat i nie wskazują na istotną zmianę amplitudy. Co więcej, jak można zauważyć na rysunku 1, proces zapotrzebowania w Kalifornii nie przypomina sinusoidy. Jest on raczej stały w ciągu roku, z wyjątkiem wyraźnego garbu występującego pod koniec lata i jesienią. Ponieważ tradycyjne metody modelowania trendu i okresowości (np. metoda średniej ruchomej) działają niepoprawnie, gdy dane zawierają tylko kilka okresów w Modelu B zastosowaliśmy nową technikę usuwania sezonowości rocznej. W celu usunięcia sezonowości tygodniowej zastosowaliśmy tzw. technikę średniej ruchomej [4, s. 30]. Dla wektora dobowego zapotrzebowania {x 1,...,x 731 } w pierwszej kolejności estymowaliśmy trend poprzez zastosowanie filtru wybranego w taki sposób, aby usunąć cykl 7-dniowy i wyciszyć szum: gdzie t = 4,...,728. Następnie estymowaliśmy komponentę sezonową. Dla każdego k = 1,...,7 policzyliśmy średnią w k różnic: Ponieważ te średnie niekoniecznie sumują się do zera, komponenta sezonowa jest liczona jako: gdzie k = 1,...,7 oraz s k = s k 7 dla k >7. ˇ ˇ dla t = 1,,730 i wektora {R t } zwrotów takiego, że R 1 = R 2 = = R 12 = r 1, R 12+t = r t dla t = 1,,730, oraz R 743 = R 744 = = R 754 = r 730 ; policzeniu średniej zmienności dla jednego roku: ν t =(ν t 1999 +ν t 2000 )/2; wygładzeniu średniej zmienności poprzez policzenie 25- -dniowej średniej ruchomej ν t ; przeskalowaniu zwrotów r t poprzez podzielenie ich przez wygładzoną roczną zmienność. Tak otrzymany szereg czasowy nie przejawia trendu ani sezonowości, co potwierdza jego periodogram (rys. 5). Co więcej, struktura zależności wykazuje jedynie korelacje krótkozasięgowe funkcja autokorelacji (ACF), jak i funkcja częściowej autokorelacji (PACF) szybko zanikają. Sugeruje to, że odsezonowane zwroty zapotrzebowania mogą być modelowane przez szeregi typu ARMA. Rys. 5. Periodogram zapotrzebowania na energię elektryczną w Kalifornii (1999 2000) po usunięciu sezonowości w modelu B Modelowanie komponenty stochastycznej Otrzymane zwroty procesu zapotrzebowania po usunięciu średniej próbkowej oraz składowych okresowych były modelowane za pomocą procesu ARMA o postaci: Y t φ 1 Y t 1... φ p Y t p = ε t + θ 1 ε t 1 +... θ q ε t q gdzie (p, q) oznaczają rząd modelu a {ε t } jest ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, średniej równej 0 oraz skończonej wariancji σ 2 (oznaczanych w tekście przez iid(0; σ 2 )). strona 796 (12)

W obydwu przypadkach metodę największej wiarygodności została zastosowana do otrzymania estymatorów: (φ 1,...,φ p,θ 1,...,θ q,σ 2 ). Estymatory największej wiarygodności zakładają rozkład normalny (gaussowski) szumów {ε t }. Jakkolwiek nie wyklucza to modeli z szumami niegaussowskimi, gdyż dla dużych próbek rozkład estymatorów jest taki sam, niezależnie czy {ε t }~idd(0; σ 2 ) są, czy nie są gaussowskie, zob. [3, sec. 10.8]). W modelu A rząd został ustalony na (p,q)=(3,2) na bazie zaimplementowanych w systemie SAS metod Extended Sample Autocorrelation Function (ESACF) oraz Smallest CANonical correlation (SCAN) [6,16]. W modelu B estymatory parametrów oraz rząd modelu (p,q)=(1,3) wybrano takie, które minimalizują wartość nieobciążonej wersji kryterium Akaike, tzw. statystyki AICC (zob. [4, sec. 5.5]). Do obliczeń wykorzystano pakiety ITSM i Matlab, jakkolwiek identyczne wyniki można uzyskać również za pomocą systemu SAS. Po skalibrowaniu procesu ARMA należało przetestować jego residua. Jak się okazało, w obydwu przypadkach nie było podstaw do odrzucenia hipotezy o niezależności reszt na poziomie 5%. Jednak ich rozkład okazał się nie gaussowski, lecz posiadał cięższe ogony. Bardzo dobrze dopasowany do residuów modelu B okazał się rozkład hiperboliczny [1] (zob. również [12]). Wyniki porównania zostały przedstawione na rysunkach 6 11 oraz zebrane w tabeli 1. Dla prognoz na rok 2002 do kalibracji komponenty deterministycznej wykorzystaliśmy dane z okresu od 1 stycznia 2000 r. do 31 grudnia 2001 r. Rys. 6. Zapotrzebowanie dobowe w Kalifornii (styczeń luty 2001) porównane z prognozami na dobę naprzód stworzonymi na bazie modeli A i B oraz z prognozą CAISO Prognoza Nie jest zaskoczeniem, że modele okazały się dobrze dopasowane do zbioru danych, na bazie którego zostały stworzone. Prawdziwym sprawdzianem dla nich będzie ocena ich przydatności do opisu innego zbioru danych dotyczącego tego samego procesu. Najwłaściwszym sposobem porównania różnych modeli jest obliczenie ich dokładności na zbiorze, do którego nie były dopasowywane. Najczęściej stosowaną miarą dokładności dopasowania są różnice pomiędzy rzeczywistymi a prognozowanymi wartościami zapotrzebowania. Wadą tej metody jest fakt, że musimy część posiadanych danych (w naszym przypadku dwa lata) poświęcić do porównań i nie możemy wykorzystać informacji zawartych w nich do budowy modelu. Skalibrowaliśmy komponenty deterministyczne procesu zapotrzebowania na energię elektryczną z okresu od 1 stycznia 1999 r. do 31 grudnia 2000 r. Następnie dobraliśmy modele ARMA do stochastycznej składowej. Dla każdego dnia okresu testowego wykonaliśmy prognozę na dzień naprzód. Zastosowaliśmy przy tym metodę adaptacyjną, tzn. zamiast używać jednego ustalonego modelu dla całej próbki, każdego dnia kalibrowaliśmy model ARMA określonego rzędu (odpowiednio (3,2) oraz (1,3) dla modeli A i B) do poprzednich wartości składowej stochastycznej i na ich podstawie otrzymywaliśmy prognozę na kolejny dzień. Następnie poprzez odwrócenie metod stacjonaryzacji (uwzględnienie składowej sezonowej) otrzymywaliśmy wartość, która mogła być porównana z rzeczywistym zapotrzebowaniem oraz oficjalną prognozą CAISO na dzień naprzód. Rys. 7. Średni procentowy błąd bezwzględny (absolutny) prognozy na dobę naprzód dla modeli A i B oraz prognozy CAISO (styczeń luty 2001) Rys. 8. Zapotrzebowanie dobowe w Kalifornii (listopad grudzień 2001) porównane z prognozami na dobę naprzód stworzonymi na bazie modeli A i B oraz z prognozą CAISO strona 797 (13)

Porównując średni procentowy błąd bezwzględny: Rys. 9. Średni procentowy błąd bezwzględny (absolutny) prognozy na dobę naprzód dla modeli A i B oraz prognozy CAISO (listopad grudzień 2001) Rys. 10. Zapotrzebowanie dobowe w Kalifornii (luty kwiecień 2002) porównane z prognozami na dobę naprzód stworzonymi na bazie modeli A i B oraz z prognozą CAISO dla obu odcinków testowych (rok 2001 oraz rok 2002) można zauważyć, że najlepszy wynik daje prognoza CAISO. Jednak największe błędy modeli A i B występują dla amerykańskich świąt państwowych Nowego Roku, urodzin Waszyngtona, itd. Oczywiście, ze względu na prostotę, nasze modele nie uwzględniają struktury świąt. Można to łatwo zmienić poprzez odjęcie pewnych wartości na podstawie doświadczeń z lat poprzednich. Kiedy porównaliśmy dokładność w tych samych okresach testowych, pomijając jednak amerykańskie święta państwowe, nasze modele wypadają dużo lepiej. Rezultaty poprawiają się jeszcze bardziej, jeśli wyeliminujemy niektóre dni poprzedzające lub następujące po świętach (w roku 2001 były to 2 stycznia, 29 maja, 5 lipca, 4 września, 22 listopada, 24 i 31 grudnia, natomiast w 2002 28 maja, 5 lipca, 1 września, 26 grudnia). Po tych zabiegach dokładność modelu A znacząco się poprawia (choć nadal jest gorsza od prognoz CAISO), natomiast modelu B okazuje się na tyle dobra, że w roku 2001 jest najlepsza. Warty odnotowania jest fakt, że model B ma najmniejszy błąd przez prawie cały rok aż do listopada 2001 (rys. 12). Zaskakujący jest również fakt, że oba nasze modele mają stosunkowo małe błędy podczas zaciemnień w San Francisco (rys. 6 7), podczas gdy prognoza CAISO jest prawie dwa razy gorsza w tym samym czasie. Potwierdza to dodatkowo fakt, iż w ciągu pierwszych dwóch miesięcy średni absolutny błąd bezwzględny modelu B wyniósł jedynie 1,23% w porównaniu z 1,71% dla prognozy CAISO w tym samym czasie. Jak już wspomnieliśmy, technika różnicowania zastosowana w modelu A jest bardzo czuła na wartości zapotrzebowania z ostatnich dni czy tygodni. Można to zaobserwować na rysunkach 6 7, gdzie duży błąd prognozy na 1 stycznia negatywnie rzutuje na prognozy z 8 stycznia i 15 stycznia, tj. tydzień i dwa tygodnie później. Rys. 11. Średni procentowy błąd bezwzględny (absolutny) prognozy na dobę naprzód dla modeli A i B oraz prognozy CAISO (luty kwiecień 2002) Tabela 1 Średnie procentowe błędy bezwzględne (absolutne) MAPE dla obu modeli oraz prognozy CAISO. Najlepszy rezultat w danej kategorii został pogrubiony MAPE CAISO Model A Model B 2001 2002 Ze świętami 1,84% 2,29% 2,08% Bez świąt 1,83% 2,00% 1,74% Ze świętami 1,37% 2,06% 1,86% Bez świąt 1,35% 1,86% 1,67% Rys. 12. 30-dniowa średnia krocząca dla procentowych błędów bezwzględnych (po usunięciu błędów z dni świątecznych). Znacząca zmiana jakości prognoz CAISO nastąpiła w październiku 2001 r. strona 798 (14)

Porównując wyniki dla roku 2001 oraz 2002 widzimy, że prognozy wszystkich modeli są lepsze w drugim okresie testowym (tab. 1). O ile jednak prognozy wykonane za pomocą modeli A i B są dokładniejsze jedynie o kilka procent, to prognozy CAISO są aż o ponad 25% lepsze. Dlatego też w roku 2002 prognoza CAISO okazuje się bezkonkurencyjna. Zakończenie Prognozy krótkoterminowe odgrywają ważna rolę w sterowaniu i planowaniu w systemie elektroenergetycznym. Dokładność prognoz zapotrzebowania zmniejsza koszty przez usprawnienie procesu zamówień i rozdziału. Jednocześnie poprawione zostaje bezpieczeństwo systemu. W niniejszym artykule rozważaliśmy dwa podejścia statystyczne do problemu prognoz krótkoterminowych. W obu z nich zapotrzebowanie było modelowane jako suma dwóch składowych deterministycznej (reprezentującej okresowość) oraz stochastycznej (reprezentującej zakłócenia). Różniły się one sposobem wydzielenia części sezonowej. Model A stosował do tego celu różnicowanie, natomiast model B nową technikę usuwania sezonowości. Oba modele zostały z powodzeniem zastosowane do rzeczywistych danych. Zostało przeprowadzone porównanie pomiędzy modelami a oficjalną prognozą niezależnego operatora systemowego z Kalifornii (CAISO). Skuteczność metod przedstawiono poprzez porównanie rzeczywistego zapotrzebowania z otrzymanymi prognozami krótkoterminowymi. Porównując, możemy zauważyć, że prosty, nie korzystający z informacji o zmiennych zewnętrznych model B ma mniejszy średni procentowy błąd w roku 2001 niż prognoza CAISO. Być może jest to spowodowane faktem, iż właśnie rok 2001 był nietypowy i obfitował w ekstremalne zdarzenia, jak zaciemnienia w San Francisco i bankructwo giełdy CalPX. Po okresie destabilizacji, już od października 2001 prognozy CAISO zdecydowanie zyskały na jakości. Może być jednak jeszcze inne wytłumaczenie tego faktu. Otóż błędy prognoz CAISO dla lat 1998 2001, czyli okresu funkcjonowania giełdy CalPX, kształtowały się mniej więcej na tym samym poziomie (tab. 2). Tabela 2 Średnie procentowe błędy bezwzględne (absolutne) MAPE dla prognozy CAISO oraz średnie procentowe bezwzględne (absolutne) dobowe zmiany rzeczywistego zapotrzebowania. (*) Dane obejmują okres 1.4.1998 31.12.1998 Prognozy CAISO Rzeczywiste zapotrzebowanie 1998 (*) 2,02% 5,26% 1999 1,79% 5,22% 2000 1,96% 4,99% Dopiero po ponownej regulacji systemu, po upadku kalifornijskiego modelu wolnorynkowego, prognozy CAISO istotnie zyskały na dokładności. Wydaje się, że polepszenie prognoz wynika ze zmiany charakteru zjawiska. Faktycznie, średnie procentowe bezwzględne (absolutne) dobowych zmian rzeczywistego zapotrzebowania zmniejszyły się w 2002 roku w stosunku do lat 1998 2001 (tab. 2). Innymi słowy zmniejszyła się zmienność zapotrzebowania. Naturalnie, w takim przypadku modele kalibrowane do danych z lat 1999 2001 nie będą dobrze oddawały charakteru zjawiska w 2002 r. Ponadto mniejsza zmienność powoduje, że większego znaczenia nabierają czynniki zewnętrzne (pogodowe czy systemowe), które w modelach A i B nie są uwzględniane. LITERATURA [1] Barndorff-Nielsen O.E. (1977): Exponentially decreasing distributions for the logarithm of particle size, Proc. Roy. Soc. London A 353, 401 419 [2] Borgosz-Koczwara M., Kozłowski M., Misiorek A., Piesiewicz T. (2001): Analiza metod prognozowania procesu zapotrzebowania na energię elektryczną. Energetyka 12/2001, 759 764 [3] Brockwell P.J., Davis R.A. (1991): Time Series: Theory and Methods, 2nd Edition, Springer, New York [4] Brockwell P.J., Davis R.A. (1996): Introduction to Time Series and Forecasting, Springer, New York [5] Bunn D. (2000): Forecasting loads and prices in competitive power markets. Proc. IEEE 88 (2), 163 169 [6] Choi, ByoungSeon (1992): ARMA Model Identification, New York, Springer-Verlag, 129 132 [7] Hippert H.S., Pedreira C.E., Souza R.C. (2001): Neural networks for short-term load forecasting: a review and evaluation. IEEE Trans. Power Systems 16 (1), 44 55 [8] Kaminski V. (1997): The challenge of pricing and risk managing electricity derivatives [in:] P. Barber, ed., The US Power Market, Risk Books, London [9] Makridakis S., Wheelwright S. C., Hyndman R. J. (1998) Forecasting methods and applications, 3rd ed., Wiley, New York [10] Malko J., Weron A. (2001): Kalifornia anatomia zaćmienia. Rynek Terminowy 12 (2/01), 70 78 [11] Misiorek A., Piesiewicz T. (2002): Dekompozycja jako istotny etap prognozowania zapotrzebowania na energię elektryczną. Materiały IX Konf. Nauk.-Techn. REE 2002, Kazimierz Dolny, 13 15 maja 2002, tom II, 161 167 [12] Nowicka-Zagrajek J., Weron R. (2002): Modeling electricity loads in California: ARMA models with hyperbolic noise. Signal Processing 82 (12), 1903 1915 [13] Pandit S.M., Wu S.M. (1983): Time Series and System Analysis with Applications, Wiley, New York [14] Sadownik R., Barbosa E.P. (1999): Short-term forecasting of industrial electricity consumption in Brasil, J. Forecast. 18, 215 224 [15] Smith M. (2000): Modeling and short-term forecasting of New South Wales electricity system load, J. Bus. Econom. Statist. 18, 465 478 [16] Tsay R.S., Tiao G.C. (1984): Consistent Estimates of Autoregressive Parameters and Extended Sample Autocorrelation Function for Stationary and Nonstationary ARMA Models, JASA 79 (385), 84 96 [17] Weron R., Kozlowska B., Nowicka-Zagrajek J. (2001): Modeling electricity loads in California: a continuous-time approach. Physica A 299, 344 350 2001 1,84% 4,91% 2002 1,37% 4,42% strona 799 (15)