WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH DO PROGNOZOWANIA CEN NA GIEŁDZIE ENERGII Autor: Katarzyna Halicka ( Rynek Energii nr 1/2010) Słowa kluczowe: giełda energii, prognozowanie cen energii elektrycznej, prognozowanie zapotrzebowania na energię elektryczną, sztuczne sieci neuronowe Streszczenie. Celem niniejszego artykułu jest przedstawienie zastosowania sztucznych sieci neuronowych do prognozowania cen na giełdzie energii elektrycznej. Na wejście skonstruowanego predykatora neuronowego wprowadzono m.in. przeszłe wartości ceny energii i wolumenu obrotu, zmienne określające pogodę, tzn. temperaturę, zachmurzenie, prędkość wiatru oraz zmienne opisujące dzień i godzinę transakcji. Wszystkie te zmienne były mierzone dla każdej godziny doby handlowej. 1. WSTĘP Do budowy modelu prognozującego cenę energii elektrycznej na giełdzie energii wykorzystano sztuczne sieci neuronowe (SSN). Czynników decydujących o wyborze tej metody było kilka. Do najistotniejszych, zdaniem autorki, należy trafność prognoz wyznaczonych za pomocą modeli neuronowych. W [1, 2, 3] prognozowano cenę energii na giełdzie energii wykorzystując modele matematyczno-statystyczne, takie jak ARIMA i GARCH oraz sztuczne sieci neuronowe. Porównując błędy uzyskane za pomocą tych metod zauważono, że prognozy wyznaczone za pomocą SSN były najtrafniejsze. Poza tym, na wejście modelu neuronowego, w przeciwieństwie do klasycznych modeli matematyczno-statystycznych, można wprowadzić kilka zmiennych objaśniających. Wiadomo, że zapotrzebowanie na energię elektryczną i cena energii zależy m.in. od czynników pogodowych. Dlatego też, istotne wydawało się skonstruowanie modelu, który uwzględniałby te zależności. 2. PROGNOZOWANIE CEN NA TOWAROWEJ GIEŁDZIE ENERGII Zadanie prognostyczne, postawione przez autorkę, polegało na skonstruowaniu modelu, za pomocą którego można wyznaczyć cenę energii elektrycznej dla każdej godziny doby handlowej, dzień przed fizyczną dostawą energii. Do budowy modelu prognozującego cenę energii na TGE SA zastosowano sztuczne sieci neuronowe, a właściwie perceptron wielowarstwowy (ang. Multi-Layered Perceptron). Dane, wykorzystywane do budowy modelu, pochodziły z okresu od 01.01.2008 r. do 31.12.2008 r. (8 760 przypadków). Natomiast dane z okresu od 01.01.2009 r. do 31.01.2009 r. (744 przypadków) zostały wykorzystywane do zbadania zdolności prognostycznych utworzonych sieci neuronowych. 2.1. Budowa modelu prognostycznego Początkowo przeprowadzano wstępną analizę danych wejściowych (rys. 1). Na podstawie wizualnej analizy wykresu ceny energii elektrycznej można stwierdzić, że wykazuje on cykliczność dobową i tygodniową. Cena energii zależy od godziny oraz dnia tygodnia, w jakim jest kupowana/sprzedawana.
cena 140 135 130 125 120 115 110 105 100 95 90 85 80 Średnia cena energii w poszczególny ch godzinach doby handlowej 1 3 5 7 9 11 13 15 17 19 21 23 godzina cena Średnia cena energii w poszczególny ch dniach ty godnia i w poszczególny ch godzinach doby handlowej 140 135 130 125 120 115 110 105 100 95 90 85 80 1 3 5 7 9 11 13 15 17 19 21 23 godzina Rys. 1. Średnia cena energii elektrycznej w zależności od dnia tygodnia i godziny transakcji Dokonując analizy graficznej rysunku 1 można wyróżnić trzy profile kształtowania się średniej ceny energii: średnia cena energii elektrycznej w dniach roboczych, sobotę i niedzielę. Dlatego też, na wejście neuronowego modelu prognostycznego wprowadzono zmienną określającą odpowiednio dzień tygodnia (1 dzień roboczy, 2 sobota, 3 niedziela i święta) oraz godzinę transakcji. Skonstruowany przez autorkę model prognostyczny miał na wejściu 7 zmiennych, na wyjściu jedną zmienną (rys. 2). Wszystkie te zmienne były mierzone dla każdej godziny doby handlowej. Dane, dotyczące ceny energii elektrycznej oraz wolumenu obrotów, wykorzystywane do budowy modelu pochodzą ze strony internetowej Towarowej Giełdy Energii SA. Natomiast dane określające pogodę w badanym okresie pochodzą z Instytutu Meteorologii i Gospodarki Wodnej w Warszawie. Dotyczyły one temperatury, prędkości wiatru i zachmurzenia w sześciu wybranych stacjach metrologicznych w Polsce: Poznaniu, Rzeszowie, Suwałkach, Szczecinie, Warszawie i Wrocławiu. cena energii (t) wolumen (t) prędkość wiatru (t) zach. (t) temp. (t) godzina transakcji (t) dzień tygodnia (t) Model SSN cena energii elektrycznej (t+1) Rys. 2. Model prognostyczny
2.2. Wyznaczanie przykładowych prognoz cen energii elektrycznej na giełdzie energii Na podstawie skonstruowanego modelu prognostycznego, projektowano sieci neuronowe typu różniące się liczbą warstw ukrytych. Zbudowane sieci neuronowe poddano ocenie. Ocenę dopasowania modeli neuronowych do danych rzeczywistych przeprowadzono dla całego okresu budowy modeli, tj. od 01.01.2008 r. do 31.12.2008 r. Początkowo skonstruowano sieć składającą się z jednej warstwy ukrytej zawierającej 13 neuronów ( 7:168-13-), a następnie korzystając z podstawowych miar statystycznych zbadano dopasowanie tej sieci do danych rzeczywistych. Otrzymane wyniki umieszczono w tabeli 1. Analizując otrzymane wyniki można zauważyć, że przeciętne odchylenia prognoz cen energii od wartości rzeczywistych wynosi około 14,56 PLN. Stanowi to około 4,61% zmiennej prognozowanej. Można również zauważyć, że nie występuje systematyczne niedoszacowanie bądź przeszacowanie prognozy. Wysoka wartość maxae i maxape świadczy o tym, że zdarzają się błędy znacznie przekraczające wartości przeciętne. W dalszej części badań skonstruowano dwie sieci neuronowe składające się z dwóch warstw ukrytych. Podstawowe parametry obu sieci przedstawiono w tabeli 2. Sieci różniły się miedzy sobą liczbą neuronów w drugiej warstwie ukrytej. Sieć typu 7:168-30-5- miała 30 neuronów w pierwszej warstwie ukrytej i 5 neuronów w drugiej warstwie. Podczas gdy predykator neuronowy typu 7:168-30-6- został zbudowany z 30 neuronów w pierwszej warstwie ukrytej i 6 w warstwie drugiej. Tabela 1 Ocena dopasowania jednowarstwowego modelu do danych rzeczywistych w okresie budowy modelu Miary statystyczne ME (ang. Mean Error) błąd średni MAE (ang. Mean Absolute Error) błąd średni bezwzględny RMSE (ang. Root Mean Square Error) pierwiastek z błędu średniego kwadratowego MAPE (ang. Mean Absolute Percentage Error) średni bezwzględny błąd procentowy MdAPE (ang. Median Absolute Percentage Error) mediana bezwzględnego błędu procentowego maxape (ang. Maximum Absolute Percentage Error) maksymalny błąd procentowy maxae (ang. Maximum Absolute Error) maksymalny błąd bezwzględny 7:168-13- 6,52 PLN 5,46 PLN 14,56 PLN 4,61% 3,11% 66,73% 341,60 PLN
Zmienne wejściowe 7:168-30-5-7:168-30-6- cena energii elektrycznej, wolumen obrotów, prędkość wiatru, zachmurzenie, temperatura, godzina transakcji, dzień tygodnia Zmienne cena energii elektrycznej wyjściowe Liczba wejść 7 7 Liczba wyjść 1 1 Liczba warstw 2 2 ukrytych Liczba neuronów w warstwie wej. 168 168 Liczba neuronów w warstwie ukrytej Liczba neuronów w warstwie wyj. Liczba wartości opóźnionych Horyzont czasowy Funkcja aktywacji I warstwa: 30 I warstwa: 30 II ukryta: 5 II warstwa: 6 1 1 24 24 24 24 I warstwa (wejściowa): liniowa II warstwa (ukryta): hiperboliczna III warstwa(ukryta): hiperboliczna IV warstwa (wyjściowa): logistyczna Metoda uczenia I etap uczenia: metoda wstecznej propagacji błędów II etap: metoda gradientów sprzężonych Tabela 2 Parametry wybranych sieci neuronowych Kolejny etap wyznaczania prognozy cen energii polegał na wytrenowaniu skonstruowanych sieci. Proces uczenia tych sieci przebiegał w dwóch etapach. W pierwszym etapie uczono sieć metodą wstecznej propagacji błędów, w drugim metodą gradientów sprzężonych. Uwzględnione w eksperymentach numerycznych sieci różniły się postacią funkcji aktywacji. W przypadku sieci 7:168-30-5- i 7:168-30-6- w warstwie wejściowej przyjęto liniową
funkcję aktywacji, w warstwach ukrytych hiperboliczną, a w warstwie wyjściowej logistyczną. Zbudowane sieci neuronowe poddano ocenie. Wyniki z obliczeń umieszczono w tabeli 3. Tabela 3 Ocena dopasowania dwuwarstwowych modeli do danych rzeczywistych w okresie budowy modelu Miary statystyczne 7:168-30-5-7:168-30-6- ME błąd średni 2,25 PLN 2,86 PLN MAE błąd średni 2,93 PLN 3,97 PLN bezwzględny RMSE pierwiastek ze błędu średniego 5,95 PLN 7,97 PLN kwadratowego MAPE średni bezwzględny błąd 2,53% 3,42% procentowy MdAPE mediana bezwzględnego błędu procentowego 1,84% 2,45% Na podstawie obliczonych miar statystycznych można zauważyć, że najlepiej dopasowany do danych rzeczywistych jest dwuwarstwowy model zbudowany z wykorzystaniem sieci neuronowej typu 7:168-30-5-. Niewielka wartość błędu średniego (ME) wskazuje, że nie występuje systematyczne przeszacowanie i systematyczne niedoszacowanie prognoz. Dlatego też, do dalszych badań wykorzystywano predykator neuronowy typu: 7:168-30-5- charakteryzujący się najlepszą jakością. 3. ANALIZA I OCENA WYNIKÓW Korzystając z dwuwarstwowego modelu neuronowego zbudowanego na wytrenowanej sieci neuronowej typu: 7:168-30-5- wyznaczono prognozę ceny energii elektrycznej w poszczególnych godzinach stycznia 2009 r. Wartości prognozy ceny energii elektrycznej na giełdzie w arbitralnie wybranych dniach stycznia 2009 r. przedstawiono na rys. 3. Uzyskane wyniki porównano z wartościami rzeczywistymi cen energii elektrycznej w tym okresie, dokonano oceny trafności prognozy (tabela 4).
Prognozowana cena energii elektrycznej w okresie od 10 stycznia do 13 stycznia 2009 r. 140 130 120 110 100 90 80 10-Sty-04 10-Sty-04 10-Sty-04 prognozowane cena [PLN] 10-Sty-04 11-Sty-04 11-Sty-04 11-Sty-04 12-Sty-04 12-Sty-04 12-Sty-04 12-Sty-04 13-Sty-04 13-Sty-04 13-Sty-04 Rys. 3. Prognozowane ceny energii elektrycznej wyznaczone dla arbitralnie wybranych dni stycznia 2009 r. Analizując wyniki przedstawione w tabeli 4 można zauważyć, że prognozowane wartości cen energii elektrycznej na giełdzie energii w styczniu 2009 r. odbiegają od wartości rzeczywistych średnio o 3,74 PLN, stanowi to około 2,80% zmiennej prognozowanej. Ponadto media absolutnych procentowych błędów wynosi 1,79%. Można również zauważyć, że nie występuje systematyczne niedoszacowanie bądź przeszacowanie prognozy, ponieważ wartość błędu średniego (ME) oraz mediany bezwzględnego błędu procentowego (MdAPE) nieznacznie różnią się od zera. Miary statystyczne 7:168-30-5- ME błąd średni 1,85 PLN MAE błąd średni 3,74 PLN bezwzględny RMSE pierwiastek z błędu średniego 9,50PLN kwadratowego MAPE średni bezwzględny błąd 2,80% procentowy MdAPE mediana bezwzględnego błędu 1,79% procentowego maxape maksymalny 29,74% błąd procentowy Tabela 4 Ocena trafności prognozy wyznaczonej w styczniu 2009 r. Otrzymane wyniki (niewielka wartość średniego modułu względnego błędu prognozy, nieznaczące odchylenie wartości rzeczywistej od wartości prognozowanej) dowodzą, że sztuczne sieci neuronowe mogą być użytecznym narzędziem prognozowania, znajdującym zastosowanie w praktyce.
4. PODSUMOWANIE W artykule do wyznaczenia prognozy ceny energii elektrycznej na giełdzie energii wykorzystano sztuczne sieci neuronowe (perceptron wielowarstwowy ). Podczas prac preparacyjnych testowano szereg modeli sieci różniących się liczbą warstw ukrytych i liczbą neuronów w tych warstwach. Ostatecznie do wyznaczenia prognozy ceny energii elektrycznej w miesiącu styczniu 2009 roku wykorzystano ten, który jest najlepiej dopasowany do danych rzeczywistych. Uzyskane prognozy charakteryzowały się wysoką jakością, dowodząc, że sztuczne sieci neuronowe są użytecznym narzędziem prognozowania, mogącym znaleźć praktyczne zastosowanie przez operatorów handlowych przedsiębiorstw obrotu i dystrybucji. Należy podkreślić, że podczas wykorzystania wyuczonego predykatora neuronowego nie jest wymagana specjalistyczna wiedza z dziedziny metod sztucznej inteligencji. Istotny jest również fakt, że w momencie wprowadzenia nowych danych nie należy rozpoczynać całego procesu prognozowania od początku. Podczas budowy modelu nie była konieczna szczegółowa analiza danych dotyczących ceny energii i wolumenu obrotów na giełdzie energii. Aczkolwiek taka analiza może być pomocna przy doborze zmiennych wejściowych do modelu prognostycznego. W przypadku modeli statystycznych przed wyznaczeniem prognozy cen energii konieczne jest przeprowadzenie wstępnej analizy danych. LITERATURA [1] Chodakowska E., Halicka K., Kononiuk A., Nazarko J.: Prognozowanie cen energii elektrycznej na Towarowej Giełdzie Energii SA z wykorzystaniem modeli ARIMA. Technologie informatyczne i prognozowanie w zarządzaniu wybrane zagadnienia, pod red. Kiełtyki L., Nazarko J., Białystok 2005, s. 140-159. [2] Chodakowska E., Halicka K., Kononiuk A., Nazarko J.: Zastosowanie modeli GARCH do prognozowania cen energii elektrycznej. Technologie informatyczne i prognozowanie w zarządzaniu wybrane zagadnienia, pod red. Kiełtyki L., Nazarko J., Białystok 2005, s. 159-172. [3] Chodakowska E., Halicka K., Kononiuk A., Nazarko J.: Zastosowanie sztucznych sieci neuronowych do prognozowania cen energii elektrycznej na Towarowej Giełdzie Energii S.A. Technologie informatyczne i prognozowanie w zarządzaniu wybrane zagadnienia, pod red. Kiełtyki L., Nazarko J., Białystok 2005, s. 235-245. [4] Lichota J.: Artificial Neural Networks Application to Optimization of Heat-Only Boiler Control. Rynek Energii 2009, nr 4. [5] Malko J., Wilczyński A.: Rynki energii elektrycznej i regulacja Komitet Studiów C5. Rynek Energii 2009, nr 2. [6] Szkutnik J., Moroz E.: Procedura efektywnej komunikacji w obrębie spółki dystrybucyjnej. Rynek Energii 2009, nr 1. Artykuł opracowano w ramach pracy statutowej nr S/WZ/1/2009.
APPLICATION OF ARTIFICIAL NEURAL NETWORKS IN FORECASTNG ON ENERGY MARKET Key words: energy market, electric energy prices forecasting, electric energy demand forecasting, artificial neural networks Summary. The aim of the paper is to present application of artificial neural networks in electric energy prices forecasting on energy market. As an input of the constructed predicator past energy prices and turnover volume, variables describing weather that is temperature, cloudiness, speed of wind and variables describing time and date of transaction were introduced. All the variables were measured for each hour of the trade twenty- four hours. In the next step of study adjustment of the model to the real data was assessed. Katarzyna Halicka, dr inż. Jest adiunktem na Wydziale Zarządzania Politechniki Białostockiej, ul. Wiejska 45A, 15-351 Białystok. Zainteresowania naukowe dotyczą przede wszystkim zastosowań metod sztucznej inteligencji w prognozowaniu. Prowadzone badania naukowe obejmują obszar polskiego rynku energii a w szczególności giełdy energii w Polsce. E-mail: k.halicka@pb.edu.pl