Modelowanie sezonowo ci a prognozowanie zapotrzebowania na energi elektryczn Autorzy: Mgr in. Adam Misiorek - IASE Wroc aw, dr in. Rafa Weron, Centrum im. H. Steinhausa, Politechnika Wroc awska Praca wykonana w ramach projektu KBN nr 4 T10B 030 25 ( Energetyka grudzie 2004) Prognozowanie zapotrzebowania na energi elektryczn stanowi jeden z najwa niejszych obszarów bada w elektroenergetyce. Przedsi biorstwa tej bran y potrzebuj zarówno prognoz krótkoterminowych (minutowych, godzinnych czy dobowych) jak i d ugoterminowych (dochodz cych do kilkunastu lat). Znaczenie tych pierwszych wzrasta wraz z rozwojem konkurencji i mechanizmów wolnorynkowych na rynkach energii elektrycznej. Prognozowanie zapotrzebowania niezwykle istotne dla bran y elektroenergetycznej, jest zadaniem trudnym. Po pierwsze, z uwagi na fakt, e szereg czasowy zapotrzebowania wykazuje sezonowo - dobow, tygodniow i roczn. Po drugie, ze wzgl du na czynniki zewn trzne, które maj istotny wp yw na wysoko zapotrzebowania (z czynnikami meteorologicznymi na czele). Nie jest rzecz trudn stworzy prognoz krótkoterminow obarczon kilkuprocentowym b dem. Jednak koszty finansowe takiego b du s na tyle wysokie, e podj to badania w celu zredukowania cho by u amkowej jego cz ci. Wiele modeli i metod prognostycznych zosta o wypróbowanych z ró nymi efektami do prognozowania zapotrzebowania Mo na je podzieli na dwie grupy - technik bazuj cych na sztucznej inteligencji oraz klasycznych (statystycznych) modeli. Pierwsze z nich obejmuj systemy ekspertowe, wnioskowanie rozmyte, rozmyte modele neuronowe i, przede wszystkim, sieci neuronowe (SN). W latach dziewi dziesi tych wiele bada zosta o przeprowadzonych z u yciem tych modeli. Niemniej jednak raporty o wykorzystaniu SN w prognozowaniu nie w pe ni przekona y badaczy i praktyków. Ostatnie opracowania i podr czniki na temat prognozowania utrzymuj, e, jak dot d znaleziono niewiele dowodów, e SN mog przewy sza standardowe metody prognostyczne [7, 8]. Przegl d systemów prognostycznych bazuj cych na SN prowadzi do spostrze enia e nale y usprawni, aby zosta y uznane za dobr metod prognozowania i cho s one obiecuj ce, to znacznej liczbie wyników bada nad zastosowaniem SN w predykcji brakuje wiarygodno ci". Wysuwano zasadnicze mankamenty: proponowana architektura SN by a zbyt du a dla dost pnych danych (SN najwyra niej przerasta y" dane) oraz modele nie by y testowane w sposób systematyczny [7]. Metody statystyczne ró ni si od poprzednio zaprezentowanych tym, e prognoza warto ci analizowanej zmiennej jest cis matematyczn kombinacj wcze niejszych warto ci tej zmiennej oraz, czasami, warto ci zmiennych zewn trznych (przede wszystkim parametrów pogody oraz wp ywu zjawisk spo ecznych). Podej cia które s stosowane, obejmuj modele autoregresji (AR), modele regresji liniowej, dynamiczne modele liniowe i nieliniowe, modele typu ARMAX, progowe" modele AR (Threshold AR), metody bazuj ce na filtrze Kalman technikach optymalizacyjnych i procedurach dopasowania krzywych.
Statystyczne modele s atrakcyjne ze wzgl du na fakt, i stosunkowo atwo mo na interpretowa poszczególne sk adniki tych modeli, umo liwiaj c in ynierom i operatorom systemu zrozumienie ich zachowa. Jednocze nie oferuj one relatywnie wysok dok adno [5, 12, 14, 15]. W niniejszym artykule analizujemy dwa statystyczne podej cia do prognozowania zapotrzebowania na energi elektryczn. W obu modelujemy zapotrzebowanie jako sum dwóch komponent - deterministycznej (reprezentuj cej sezonowo ci) oraz stochastycznej (reprezentuj cej szum). Ró ni si one jednak zastosowan technik usuwania sezonowo ci. W modelu A u ywamy ró nicowania natomiast w modelu B wykorzystujemy niedawno zaproponowan technik sezonowej zmienno ci [16]. W obu modelach komponenta stochastyczna opisywana jest szeregiem ARMA. Tym samym zak adamy, e wp yw zewn trznych czynników mo e by modelowany przez odpowiednio' skalibrowan komponent deterministyczn. Stanowi to oczywi cie uproszczenie problemu ale, jak poka emy w dalszej cz ci artyku u, nawet takie podej cie pozwala uzyska dobr prognoz zapotrzebowania Analizowane dane Analizowany szereg czasowy zapotrzebowania na energi elektryczn zosta skonstruowany na podstawie danych publikowanych przez kalifornijskiego operatora systemu (CAISO, http://oasis.caiso.com). W artykule b dziemy korzystali z danych obejmuj cych okres od 1 stycznia 1999 r. do 31 grudnia 2002 r. Pierwsze dwa lata pos u nam wy cznie do kalibracji modeli, natomiast lata 2001 i 2002 zostan wykorzystane w celu przetestowania modeli. Zauwa my, e w tym okresie wyst pi a drastyczna eskalacja cen na rynku kalifornijskim, która doprowadzi a do zaciemnie w San Francisco w po owie stycznia 2001 r. oraz bankructwa kalifornijskiej gie dy energii (CalPX) z ko cem stycznia 2001 r. [2] Poniewa w danych by widoczny bardzo wyra ny cykl dobowy utworzyli my szereg dobowego zapotrzebowania gdy w niniejszym artykule nie chcieli my si zajmowa modelowaniem cyklu dobowego (rys. 1). Oprócz cyklu dobowego, analizowany szereg czasowy charakteryzuje si sezonowo ci tygodniow i roczn. Musz zosta one usuni te zanim b dziemy mogli kalibrowa modele cz ci stochastycznej.
Modelowanie sezonowo ci Sezonowo (okresowo, cykle) najpro ciej mo na zaobserwowa w domenie cz stotliwo ciowej korzystaj c z estymatora g sto ci spektralnej, czyli z periodogramu. Dla wektora obserwacji {x 1,...x n } periodogram jest definiowany jako: gdzie: k = k/n, k = 1,..., [n/2] oraz [x] oznacza najwi ksz liczb ca kowit mniejsz lub równ x. Zauwa my, e I n jest kwadratem warto ci bezwzgl dnej transformaty Fouriera Na rysunku 2 przedstawiono periodogram dla zapotrzebowania, na którym wyra nie wida du e skoki dla cz stotliwo ci odpowiadaj cej cyklom o okresie 7 i 365 dni. Mniejsze skoki w okolicy co k = 0,29 i 0,43 odpowiadaj cyklom 3,5- oraz 2,33-dniowym. Oba skoki to tzw. harmoniczne (wielokrotno ci sezonowo ci tygodniowej) i dowodz, e dane wykazuj okres 7-dniowy, który nie jest jednak sinusoidalny. Zauwa my, e transformata Fouriera to tak naprawd rozbicie na sum sinusów i cosinusów o ró nych cz stotliwo ciach (czyli ró nych okresach, gdy obie warto ci s powi zane relacj :
okres = 1/cz stotliwo ). Cykl tygodniowy mo na równie zaobserwowa na wykresie autokorelacji (rys. 3). Przypomnijmy, e funkcja autokorelacji ACF(k)= CF(x,x,k) mierzy korelacj pomi dzy warto ciami szeregu danych oddalonymi od siebie o k punktów. Model A Jak ju wspomniano, zapotrzebowanie na energi elektryczn Z t b dzie przedstawione jako suma dwóch sk adowych - deterministycznej (inaczej okresowej) X t oraz stochastycznej (inaczej losowej) Y t. Podej cie to mo na zrealizowa na wiele sposobów. Prawdopodobnie najprostszym jest wykorzystanie ró nicowania, czyli wyliczenia ró nic mi dzy bie cymi warto ciami zapotrzebowania a warto ciami przesz ymi [2]. W modelu A wykorzystujemy formu : gdzie T = 168 h (tydzie ), D = 24 h (doba), N = 4 lub 5 jest liczb tygodni u ytych do kalibracji, M = 7 jest liczb dni w tygodniu. Procedura ta prowadzi do uzyskania w przybli eniu stacjonarnego ci gu Y t. Test KPSS [10] nie odrzuca hipotezy o stacjonarno ci na poziomie 5%. Przedstawiony na rysunku 4 periodogram komponenty Y t równie nie wykazuje wyra nej sezonowo ci. Widzimy jednak, e dla ma ych warto ci cz sto ci (powi zanych z najd u szymi okresami) wci pozosta y du e warto ci liczbowe. Oznacza to, e metoda ta nie jest w stanie usun sezonowo ci o du ym okresie. Pozwala ona jednak na modelowanie cz ci stochastycznej Y t za pomoc szeregu czasowego typu ARMA. Model B Technika ró nicowania zastosowana w modelu A ma pewn niekorzystn w asno. Mianowicie, jest ona bardzo wra liwa na warto ci zapotrzebowania obserwowane w poprzednich dniach czy tygodniach. Je li w okresie bezpo rednio poprzedzaj cym horyzont prognozy wyst pi y jakie anomalie w modelowanym procesie zapotrzebowania, to b d si one propagowa y na prognozowany okres.
Alternatywne podej cie, które nie ma tej wady, polega na dopasowaniu - zazwyczaj poprzez metod najmniejszych kwadratów - sumy sinusoid o ró nych amplitudach, cz stotliwo ciach oraz/lub przesuni ciach fazowych [13]. Jednak nasze dane obejmuj okres tylko czterech lat i nie wskazuj na istotn zmian amplitudy. Co wi cej, jak mo na zauwa y na rysunku 1, proces zapotrzebowania w Kalifornii nie przypomina sinusoidy. Jest on raczej sta y w ci gu roku, z wyj tkiem wyra nego garbu wyst puj cego pod koniec lata i jesieni. Poniewa tradycyjne metody modelowania trendu i okresowo ci (np. metoda redniej ruchomej) dzia aj niepoprawnie, gdy dane zawieraj tylko kilka okresów w Modelu B zastosowali my now technik usuwania sezonowo ci rocznej. W celu usuni cia sezonowo ci tygodniowej zastosowali my tzw. technik redniej ruchomej [4, s. 30]. Dla wektora dobowego zapotrzebowania {x 1...,x 731 } w pierwszej kolejno ci estymowali my trend poprzez zastosowanie filtru wybranego w taki sposób, aby usun cykl 7-dniowy i wyciszy szum: gdzie t = 4,...,728. Nast pnie estymowali my komponent sezonow. Dla ka dego k = 1,...,7 policzyli my redni w k ró nic: Poniewa te rednie niekoniecznie sumuj si do zera komponenta sezonowa jest liczona jako: Aby usun cykl tygodniowy wystarczy teraz odj go od danych: d t = x- t dla t =1,...,731. Ostatecznie, aby usun trend z odsezonowanych" danych d t policzyli my zwroty logarytmiczne r t = log(d t+1 /d t,). Po usuni ciu cyklu tygodniowego pozosta jeszcze cykl roczny. Niestety, z powodu ma ej liczby danych u ytych do kalibracji (obejmuj cych tylko dwa lata) metoda redniej ruchomej nie mog a by zastosowana Zastosowali my wi c metod sezonowej zmienno ci [16], która polega na: policzeniu 25-dniowej rolowanej" zmienno ci [7]: dla t = 1,...,730 i wektora {R t } zwrotów takiego, e R 1 = R 2 =... = R 12 = r 1, R 12+t = r t, dla t = 1...730, oraz R 743 = R 744 =... R 754 = r 730 policzeniu redniej zmienno ci dla jednego roku: v t =(v t 1999 +v t 2000 )/2; wyg adzeniu redniej zmienno ci poprzez policzenie 25-dniowej redniej ruchomej v t ; przeskalowaniu zwrotów r t poprzez podzielenie ich przez wyg adzon roczn zmienno. Tak otrzymany szereg czasowy nie przejawia trendu ani sezonowo ci, co potwierdza jego
periodogram (rys. 5). Co wi cej, struktura zale no ci wykazuje jedynie korelacje krótkozasi gowe - funkcja autokorelacji (ACF), jak i funkcja cz ciowej autokorelacji (PACF) szybko zanikaj. Sugeruje to, e odsezonowane zwroty zapotrzebowania mog by modelowane przez szeregi typu ARMA. Modelowanie komponenty stochastycznej Otrzymane zwroty procesu zapotrzebowania po usuni ciu redniej próbkowej oraz sk adowych okresowych by y modelowane za pomoc procesu ARMA o postaci: gdzie (p, q) oznaczaj rz d modelu a { t } jest ci giem niezale nych zmiennych losowych o jednakowym rozk adzie, redniej równej 0 oraz sko czonej wariancji 2 (oznaczanych w tek cie przez iid(0; 2 )). W obydwu przypadkach metod najwi kszej wiarygodno ci zosta a zastosowana do otrzymania estymatorów: Estymatory najwi kszej wiarygodno ci zak adaj rozk ad normalny (gaussowski) szumów { t }. Jakkolwiek nie wyklucza to modeli z szumami niegaussowskimi, gdy dla du ych próbek rozk ad estymatorów jest taki sam, niezale nie czy { t }~idd(0; 2 ) s, czy nie s gaussowskie, zob. [3, sec. 10.8]). W modelu A rz d zosta ustalony na (p,q)=(3,2) na bazie zaimplementowanych w systemie SAS metod Extended Sample Autocorrelation Function (ESACF) oraz Smallest CANonical correlation (SCAN) [6,16].
W modelu B estymatory parametrów oraz rz d modelu (p,q)=(1,3) wybrano takie, które minimalizuj warto nieobci onej wersji kryterium Akaike, tzw. statystyki AICC (zob. [4, sec. 5.5]). Do oblicze wykorzystano pakiety ITSM i Matlab, jakkolwiek identyczne wyniki mo na uzyska równie za pomoc systemu SAS. Po skalibrowaniu procesu ARMA nale a o przetestowa jego residua Jak si okaza o, w obydwu przypadkach nie by o podstaw do odrzucenia hipotezy o niezale no ci reszt na poziomie 5%. Jednak ich rozk ad okaza si nie gaussowski, lecz posiada ci sze ogony. Bardzo dobrze dopasowany do residuów modelu B okaza si rozk ad hiperboliczny [1] (zob. równie [12]). Prognoza Nie jest zaskoczeniem, e modele okaza y si dobrze dopasowane do zbioru danych, na bazie którego zosta y stworzone. Prawdziwym sprawdzianem dla nich b dzie ocena ich przydatno ci do opisu innego zbioru danych dotycz cego tego samego procesu. Najw a ciwszym sposobem porównania ró nych modeli jest obliczenie ich dok adno ci na zbiorze, do którego nie by y dopasowywane. Najcz ciej stosowan miar dok adno ci dopasowania s ró nice pomi dzy rzeczywistymi a prognozowanymi warto ciami zapotrzebowania. Wad tej metody jest fakt, e musimy cz posiadanych danych (w naszym przypadku dwa lata) po wi ci do porówna i nie mo emy wykorzysta informacji zawartych w nich do budowy modelu. Skalibrowali my komponenty deterministyczne procesu zapotrzebowania na energi elektryczn z okresu od 1 stycznia 1999 r. do 31 grudnia 2000 r. Nast pnie dobrali my modele ARMA do stochastycznej sk adowej. Dla ka dego dnia okresu testowego wykonali my prognoz na dzie naprzód. Zastosowali my przy tym metod adaptacyjn, tzn. zamiast u ywa jednego ustalonego modelu dla ca ej próbki, ka dego dnia kalibrowali my model ARMA okre lonego rz du (odpowiednio (3,2) oraz (1,3) dla modeli A i B) do poprzednich warto ci sk adowej stochastycznej i na ich podstawie otrzymywali my prognoz na kolejny dzie. Nast pnie poprzez odwrócenie" metod stacjonaryzacji (uwzgl dnienie sk adowej sezonowej) otrzymywali my warto, która mog a by porównana z rzeczywistym zapotrzebowaniem oraz oficjaln prognoz CAISO na dzie naprzód. Wyniki porównania zosta y przedstawione na rysunkach 6-11 oraz zebrane w tabeli 1. Dla prognoz na rok 2002 do kalibracji komponenty deterministycznej wykorzystali my dane z okresu od 1 stycznia 2000 r. do 31 grudnia 2001 r.
Porównuj c redni procentowy b d bezwzgl dny: dla obu odcinków testowych (rok 2001 oraz rok 2002) mo na zauwa y, e najlepszy wynik daje prognoza CAISO. Jednak najwi ksze b dy modeli A i B wyst puj dla ameryka skich
wi t pa stwowych - Nowego Roku, urodzin Waszyngtona itd. Oczywi cie, ze wzgl du na prostot, nasze modele nie uwzgl dniaj struktury wi t. Mo na to atwo zmieni poprzez odj cie pewnych warto ci na podstawie do wiadcze z lat poprzednich. Kiedy porównali my dok adno w tych samych okresach testowych, pomijaj c jednak ameryka skie wi ta pa stwowe, nasze modele wypadaj du o lepiej. Rezultaty poprawiaj si jeszcze bardziej, je li wyeliminujemy niektóre dni poprzedzaj ce lub nast puj ce po wi tach (w roku 2001 by y to 2 stycznia 29 maj 5 lipca 4 wrze nia 22 listopada 24 i 31 grudnia, natomiast w 2002-28 maja, 5 lipca 1 wrze nia 26 grudnia). Po tych zabiegach dok adno modelu A znacz co si poprawia (cho nadal jest gorsza od prognoz CAISO), natomiast modelu B okazuje si na tyle dobr e w roku 2001 jest najlepsza Warty odnotowania jest fakt, e model B ma najmniejszy b d przez prawie ca y rok a do listopada 2001 (rys. 12). Zaskakuj cy jest równie fakt, e oba nasze modele maj stosunkowo ma e b dy podczas zaciemnie w San Francisco (rys. 6-7), podczas gdy prognoza CAISO jest prawie dwa razy gorsza w tym samym czasie. Potwierdza to dodatkowo fakt, i w ci gu pierwszych dwóch miesi cy redni absolutny b d bezwzgl dny modelu B wyniós jedynie 1,23% w porównaniu z 1,71% dla prognozy CAISO w tym samym czasie. Jak ju wspomnieli my, technika ró nicowania zastosowana w modelu A jest bardzo czu a na warto ci zapotrzebowania z ostatnich dni czy tygodni. Mo na to zaobserwowa na rysunkach 6-7, gdzie du y b d prognozy na 1 stycznia negatywnie rzutuje na prognozy z 8 stycznia i 15 stycznia tj. tydzie i dwa tygodnie pó niej. Porównuj c wyniki dla roku 2001 oraz 2002 widzimy, e prognozy wszystkich modeli s lepsze w drugim okresie testowym (tab. 1). O ile jednak prognozy wykonane za pomoc modeli A i B s dok adniejsze jedynie o kilka procent, to prognozy CAISO s a o ponad 25% lepsze. Dlatego te w roku 2002 prognoza CAISO okazuje si bezkonkurencyjna.
Zako czenie Prognozy krótkoterminowe odgrywaj wa na rol w sterowaniu i planowaniu w systemie elektroenergetycznym. Dok adno prognoz zapotrzebowania zmniejsza koszty przez usprawnienie procesu zamówie i rozdzia u. Jednocze nie poprawione zostaje bezpiecze stwo systemu. W niniejszym artykule rozwa ali my dwa podej cia statystyczne do problemu prognoz krótkoterminowych. W obu z nich zapotrzebowanie by o modelowane jako suma dwóch sk adowych -deterministycznej (reprezentuj cej okresowo ) oraz stochastycznej (reprezentuj cej zak ócenia). Ró ni y si one sposobem wydzielenia cz ci sezonowej. Model A stosowa do tego celu ró nicowanie, natomiast model B now technik usuwania sezonowo ci. Oba modele zosta y z powodzeniem zastosowane do rzeczywistych danych. Zosta o przeprowadzone porównanie pomi dzy modelami a oficjaln prognoz niezale nego operatora systemowego z Kalifornii (CAISO). Skuteczno metod przedstawiono poprzez
porównanie rzeczywistego zapotrzebowania z otrzymanymi prognozami krótkoterminowymi. Porównuj c, mo emy zauwa y, e prosty, nie korzystaj cy z informacji o zmiennych zewn trznych model B ma mniejszy redni procentowy b d w roku 2001 ni prognoza CAISO. By mo e jest to spowodowane faktem, i w a nie rok 2001 by nietypowy i obfitowa w ekstremalne" zdarzenia jak zaciemnienia w San Francisco i bankructwo gie dy CalPX. Po okresie destabilizacji, ju od pa dziernika 2001 prognozy CAISO zdecydowanie zyska y na jako ci. Mo e by jednak jeszcze inne wyt umaczenie tego faktu. Otó b dy prognoz CAISO dla lat 1998-2001, czyli okresu funkcjonowania gie dy CalPX, kszta towa y si mniej wi cej na tym samym poziomie (tab. 2). Dopiero po ponownej regulacji systemu, po upadku kalifornijskiego modelu wolnorynkowego, prognozy CAISO istotnie zyska y na dok adno ci. Wydaje si, e polepszenie prognoz wynika ze zmiany charakteru zjawiska Faktycznie, rednie procentowe bezwzgl dne (absolutne) dobowych zmian rzeczywistego zapotrzebowania zmniejszy y si w 2002 roku w stosunku do lat 1998-2001 (tab. 2). Innymi s owy zmniejszy a si zmienno zapotrzebowania Naturalnie, w takim przypadku modele kalibrowane do danych z lat 1999-2001 nie b d dobrze oddawa y charakteru zjawiska w 2002 r. Ponadto mniejsza zmienno powoduje, e wi kszego znaczenia nabieraj czynniki zewn trzne (pogodowe czy systemowe), które w modelach A i B nie s uwzgl dniane. LITERATURA [1] Barndorff-Nielsen O.E. (1977): Exponentially decreasing distributions for the logarithm of particle size, Proc. Roy. Soc. London A 353, 401-419 [2] Borgosz-Koczwara M., Koz owski M., Misiorek A., Piesiewicz T. (2001): Analiza metod prognozowania procesu zapotrzebowania na energi elektryczn. Energetyka 12/2001, 759-764 [3] Brockwell P.J., Davis R.A. (1991): Time Series: Theory and Methods, 2nd Edition, Springer, New York [4] Brockwell P.J., Davis R.A. (1996): Introduction to Time Series and Forecasting, Springer, New York [5] Bunn D. (2000): Forecasting loads and prices in competitive power markets. Proc. IEEE 88 (2), 163-169 [6] Choi, ByoungSeon (1992): ARMA Model Identification, New York, Springer-Verlag, 129-132 [7] Hippert H.S., Pedreira C.E., Souza R.C. (2001): Neural networks for short-term load forecasting: a review and evaluation. IEEE Trans. Power Systems 16 (1), 44-55 [8] Kaminski V. (1997): The challenge of pricing and risk managing electricity derivatives [in:] P. Barber, ed., The US Power Market, Risk Books, London [9] Makridakis S., Wheelwright S. C., Hyndman R. J. (1998) Forecasting - methods and applications, 3rd ed., Wiley, New York [10] Malko J., Weron A. (2001): - Kalifornia - anatomia za mienia Rynek Terminowy 12 (2/01), 70-78 [11] Misiorek A., Piesiewicz T. (2002): Dekompozycja jako istotny etap prognozowania zapotrzebowania na energi elektryczn. Materia y IX Konf. Nauk.-Techn. REE'2002, Kazimierz Dolny, 13-15 maja 2002, tom II, 161-167 [12] Nowicka-Zagrajek J., Weron R. (2002): Modeling electricity loads in California: ARMA models with hyperbolic noise. Signal Processing 82 (12), 1903-1915 [13] Pandit S.M., Wu S.M. (1983): Time Series and System Analysis with Applications, Wiley, New York
[14] Sadownik R., Barbosa E.P. (1999): Short-term forecasting of industrial electricity consumption in Brasil, J. Forecast. 18, 215-224 [15] Smith M. (2000): Modeling and short-term forecasting of New South Wales electricity system load, J. Bus. Econom. Statist. 18, 465-478 [16] Tsay R.S., Tiao G.C. (1984): Consistent Estimates of Autoregressive Parameters and Extended Sample Autocorrelation Function for Stationary and Nonstationary ARMA Models, JASA 79 (385), 84-96 [17] Weron R., Kozlowska B., Nowicka-Zagrajek J. (2001): Modeling electricity loads in California: a continuous-time approach. Physica A 299, 344-350