UŻYCIE METOD GRUPOWANIA DO PROGNOZOWANIA GENERACJI WIATROWEJ



Podobne dokumenty
WYKORZYSTANIE WYKŁADNIKA HURSTA DO PRZEWIDYWANIA NIESTABILNOŚCI GENERACJI WIATROWEJ

Dopasowywanie modelu do danych

ALGORYTM UZUPEŁNIANIA BRAKUJĄCYCH DANYCH W ZBIORACH REJESTROWANYCH NA STACJACH MONITORINGU POWIETRZA

Aproksymacja funkcji a regresja symboliczna

Szkolenia SAS Cennik i kalendarz 2017

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Inżynieria Rolnicza 5(114)/2009

Z-LOGN Ekonometria Econometrics. Przedmiot wspólny dla kierunku Obowiązkowy polski Semestr IV

Energia i moc krajowego systemu elektroenergetycznego w latach

Szybkość instynktu i rozsądek rozumu$

METODYKA BADAŃ MAŁYCH SIŁOWNI WIATROWYCH

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Z-EKO-184 Ekonometria Econometrics. Ekonomia I stopień Ogólnoakademicki. Studia stacjonarne Wszystkie Katedra Matematyki Dr hab. Artur Maciąg.

Analiza metod prognozowania kursów akcji

Współpraca FDS z arkuszem kalkulacyjnym

Zmienność wiatru w okresie wieloletnim

Doświadczenia w eksploatacji gazomierzy ultradźwiękowych

Wpływ czynników atmosferycznych na zmienność zużycia energii elektrycznej Influence of Weather on the Variability of the Electricity Consumption

INSTYTUT METEOROLOGII I GOSPODARKI WODNEJ PAŃSTWOWY INSTYTUT BADAWCZY Oddział we Wrocławiu. Görlitz

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

LABORATORIUM Z FIZYKI

MODELOWANIE POŁĄCZEŃ TYPU SWORZEŃ OTWÓR ZA POMOCĄ MES BEZ UŻYCIA ANALIZY KONTAKTOWEJ

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

Projekt współfinansowany ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka

Data Mining w doborze parametrów układu testującego urządzenia EAZ 1

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Metody prognozowania produktywności i ich wpływ na wyniki prognozowania. Kamil Beker

Transformacja wiedzy w budowie i eksploatacji maszyn

PRODUKCJA ENERGII ELEKTRYCZNEJ W ELEKTROWNI WIATROWEJ W ZALEŻNOŚCI OD POTENCJAŁU WIATRU NA RÓZNYCH WYSOKOŚCIACH

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

Moduł meteorologiczny w serwisie CRIS

Projekt ElGrid a CO2. Krzysztof Kołodziejczyk Doradca Zarządu ds. sektora Utility

Barometr Finansów Banków (BaFiB) propozycja badania koniunktury w sektorze bankowym

MMB Drives 40 Elektrownie wiatrowe

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

ENERGETYKA WIATROWA W POLSCE

Ekonometryczna analiza popytu na wodę

Generacja źródeł wiatrowych cz.2

Farma elektrowni wiatrowych składa się z zespołu wież, na których umieszczone są turbiny generujące energię elektryczną.

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Kompleksowe podejście do rozwoju systemów ciepłowniczych

ANALIZA WPŁYWU GENERACJI WIATROWEJ NA POZIOM REZERWY MOCY W KRAJOWYM SYSTEMIE ELEKTROENERGETYCZNYM

Efektywne zarządzanie mocą farm wiatrowych Paweł Pijarski, Adam Rzepecki, Michał Wydra 2/16

Modelowanie glikemii w procesie insulinoterapii

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Wpływ wybranych czynników na inwestycje w energetyce wiatrowej

Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego

Customer Attribution Models. czyli o wykorzystaniu machine learning w domu mediowym.

OPRACOWANIE ZAŁOŻEŃ I REALIZACJA LABORATORYJNEGO SYMULATORA DO BADANIA MODUŁU PODPOWIEDZI

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Klasyfikacja publikacji biomedycznych w konkursie JRS 2012 Data Mining Competition - Szkic koncepcji

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Energia odnawialna Prognozowanie ilości generowanej energii elektrycznej przez elektrownie wiatrowe z wykorzystaniem sieci neuronowych

Xway. Inne podejście do lokalizacji GPS obiektów mobilnych i zarządzania flotą

Prognozowanie zanieczyszczeń atmosferycznych przy użyciu sieci neuronowych

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Automatyka i pomiary wielkości fizykochemicznych. Instrukcja do ćwiczenia III. Pomiar natężenia przepływu za pomocą sondy poboru ciśnienia

KARTA INFORMACYJNA PRZEDMIOTU

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

System ienergia -narzędzie wspomagające gospodarkę energetyczną przedsiębiorstw

Dostawa oprogramowania. Nr sprawy: ZP /15

Syenbi BI & Syenbi BI Pro Prezentacja systemu:

Program BEST_RE. Pakiet zawiera następujące skoroszyty: BEST_RE.xls główny skoroszyt symulacji RES_VIEW.xls skoroszyt wizualizacji wyników obliczeń

Z-LOGN1-006 Statystyka Statistics

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

MATEMATYCZNY MODEL PĘTLI HISTEREZY MAGNETYCZNEJ

Elektrotechnika I stopień Ogólno akademicki. Przedmiot kierunkowy. Obowiązkowy Polski VI semestr zimowy

System prognozowania rynków energii

Zastosowanie oprogramowania Proficy (ifix, Historian oraz Plant Applications) w laboratoryjnym stanowisku monitoringu systemów produkcyjnych in-line

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

KIERUNKI ROZWOJU MORSKIEJ ENERGETYKI WIATROWEJ W EUROPIE

Sposoby prezentacji problemów w statystyce

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólnoakademicki / praktyczny)

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Obciążenia nieliniowe w sieciach rozdzielczych i ich skutki

E-E-A-1008-s5 Komputerowa Symulacja Układów Nazwa modułu. Dynamicznych. Elektrotechnika I stopień Ogólno akademicki. Przedmiot kierunkowy

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Instytutu Gospodarki Surowcami Mineralnymi i Energi¹ Polskiej Akademii Nauk

Wprowadzenie do metodologii modelowania systemów informacyjnych. Strategia (1) Strategia (2) Etapy Ŝycia systemu informacyjnego

Informatyka studia stacjonarne pierwszego stopnia

WYZNACZANIE CHARAKTERYSTYK SIŁOWNIKÓW UDAROWYCH Z NASTAWIANĄ OBJĘTOŚCIĄ KOMORY

Wyznaczanie przyspieszenia ziemskiego za pomocą wahadła rewersyjnego (Katera)

APROKSYMACJA POZIOMU IMISJI NA STACJACH MONITORINGU POWIETRZA ZA POMOCĄ AUTONOMICZNYCH MODELI NEURONOWYCH

Sterowanie wielkością zamówienia w Excelu - cz. 3

Optymalizacja ciągła

... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...

3. Modele tendencji czasowej w prognozowaniu

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zdjęcia Elektrowni w Skawinie wykonał Marek Sanok

5. Model sezonowości i autoregresji zmiennej prognozowanej

PRZEWODNIK PO PRZEDMIOCIE

Alternatywne źródła energii. Elektrownie wiatrowe

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

Współzależność poziomów generacji wiatrowej i fotowoltaicznej

Etapy modelowania ekonometrycznego

Transkrypt:

UŻYCIE METOD GRUPOWANIA DO PROGNOZOWANIA GENERACJI WIATROWEJ Autorzy: Tomasz Popławski, Piotr Szeląg, Dariusz Całus, Cezary Głowiński, Łukasz Adamowicz ( Rynek Energii nr 5/2013) Słowa kluczowe: energia wiatrowa, prognozowanie, eksploracja danych, duże zbiory danych Streszczenie. Wzrastająca liczba danych pomiarowych płynąca z farm wiatrowych daje możliwość przygotowania dokładniejszych prognoz. Jednocześnie zaczynają pojawiać się problemy związane z przetworzeniem i wybraniem informacji mających największy wpływ na dokładność predykcji. W artykule opisano wykorzystanie narzędzi mogących przetwarzać duże zbiory danych do selekcji reprezentatywnego zbioru danych i przygotowania na ich podstawie prognozy mocy generowanej przez farmę wiatrową. 1. WSTĘP W ostatnich kilkudziesięciu latach widoczny jest znaczący wzrost znaczenia Odnawialnych Źródeł Energii. Najbardziej dynamiczny przyrost można zauważyć w przypadku energetyki wiatrowej. W 2007 roku łączna moc nominalna elektrowni wiatrowych na świecie wynosiła prawie 94 000 MW. Na koniec 2012 roku wartość ta wzrosła do 282 000 MW. W ciągu pięciu lat sektor energetyki wiatrowej odnotował trzykrotny wzrost zainstalowanej mocy nominalnej. Moc zainstalowana elektrowni wiatrowych w Krajowym Systemie Elektroenergetycznym stanowi 6,8%, jednak ze względu na charakterystykę pracy przekłada się na około 2,5% udział w produkcji energii elektrycznej. Wielkość ta z roku na rok wzrasta. Dynamiczny rozwój energetyki wiatrowej skutkuje powstawaniem nowych metod i narzędzi predykcyjnych przeznaczonych dla elektrowni wiatrowych, charakteryzujących się dużą niestabilnością poziomu generowanej mocy oraz trudnością w jej przewidywaniu. Pomimo kilkudziesięciu lat tworzenia i ulepszania kolejnych narzędzi nie można uznać tego procesu za zakończony [7,8]. Pojawiają się następne problemy wymagające rozwiązania. Jednym z nich, którego znaczenie będzie w przyszłości wzrastać wraz z budową nowych farm wiatrowych jest przyrost danych pomiarowych mogących służyć jako informacje wejściowe do przygotowania prognozy mocy generowanej przez farmę bądź elektrownię wiatrową. Dane przekazywane z elektrowni wiatrowej mogą mieć bardzo małe interwały czasowe (istnieje możliwość otrzymywania odczytów co kilka sekund). System SCADA przekazuje kompleksowe informacje o pracy takiej elektrowni, są to między innymi: prędkość wiatru, gene-

rowana moc, ciśnienie atmosferyczne. Przetwarzanie tak dużej ilości danych staje się zadaniem trudnym i czasochłonnym. Przygotowanie prognozy należy poprzedzić procesem przetworzenia i wyselekcjonowania informacji istotnie wpływających na zwiększenie dokładności prognoz wykonywanych na potrzeby elektrowni wiatrowej. Na potrzeby artykułu wykorzystano i przystosowano narzędzia jednej z czołowych firm, zarówno na rynku Polskim jak i światowym, zajmujących się przygotowaniem i wdrażaniem oprogramowania z zakresu Big Data i Business Intelligence. Spośród jego wielu modułów wykorzystano dwa: Enterprise Miner i Forecast Studio. W dalszej części zostanie opisany proces przygotowania danych oraz wykonania prognozy. 2. PRZYGOTOWANIE DANYCH POMIAROWYCH Większość elektrowni wiatrowych ze względu na położenie i przyłączenie do sieci skupiona jest w farmach wiatrowych. Dla właściciela farmy bardziej istotna jest sumaryczna prognoza mocy generowanej przez farmę wiatrową niż poszczególnych elektrowni wchodzących w jej skład. Dlatego zasadnym jest by najmniejszym obiektem, dla którego przygotowywana będzie prognoza była farma wiatrowa. Autorzy przygotowując prognozę pracy wybranej farmy wiatrowej dysponowali danymi obejmującymi okres czterech miesięcy. Udostępnione odczyty wykonane zostały z piętnastominutowym interwałem czasowym i zawierały dane o: dacie i czasie odczytu, wygenerowanej mocy, prędkości wiatru, liczbie elektrowni gotowych do pracy, liczbie pracujących elektrowni. Szczególnie ostatnia informacja okazała się bardzo istotna. Jej brak wymuszał traktowanie farmy wiatrowej jako jednego obiektu. W rzeczywistości nie wszystkie turbozespoły pracują równocześnie, co przekłada się na wielkość generowanej mocy przy tej samej prędkości wiatru. W tabeli 1 przedstawiono procentowy udział czasu pracy określonej liczby elektrowni wiatrowych badanej farmy w analizowanym okresie składającej się z ośmiu elektrowni wiatrowych o takiej samej mocy nominalnej. Tabela 1 Czas pracy określonej liczby elektrowni wiatrowych Liczba pracujących turbozespołów [%] Czas pracy 0 11,3 1 1,5 2 1,2 3 1,2 4 1,4 5 2,8 6 5,2 7 11,3 8 64,2

Przygotowywanie krzywej mocy indywidualnie w zależności od liczby pracujących obiektów może negatywnie wpływać na dokładność prognoz ze względu na niewielką liczbę dostępnych danych pomiarowych, zwłaszcza jeśli pracuje mniej niż sześć turbozespołów wchodzących w skład farmy wiatrowej. Dlatego zdecydowano się przeprowadzić standaryzację danych poprzez prostą operację polegającą na podzieleniu wielkości generowanej mocy przez liczbę pracujących elektrowni. W wyniku tego działania zredukowano jedną zmienną (liczbę pracujących elektrowni) a uzyskana nowa wartość określa moc generowaną przez jedną elektrownie wiatrową w określonym przedziale czasowym i danej (zmierzonej) prędkości wiatru. Informacja ta została wykorzystana do przygotowania krzywej mocy. Czteromiesięczne obserwacje przełożyły się na około 11,5 tys. rekordów. Do przygotowania prognozy na podstawie informacji z bazy danych o takich rozmiarach można wykorzystać standardowe narzędzia i metody. Należy jednak pamiętać, iż jest to tylko mała próbka informacji o generacji wiatrowej dostępnej w systemie energetycznym dlatego, mając to na uwadze, zdecydowano się wykorzystać narzędzia przygotowane do obsługi dużych zbiorów danych. Pierwotny zbiór został podzielony na część uczącą i testową w stosunku trzy do jednego. W wyniku tego baza do służąca do wykonania aproksymacji liczyła około 8,5 tys. rekordów. Do zredukowania tej wielkości wykorzystano metodę k-średnich, która pozwoliła ograniczyć zbiór danych wejściowych do kilkudziesięciu punktów będących centroidami poszczególnych klas, na które został podzielony pierwotny zbiór. Środki klas, będące parami współrzędnych reprezentujących prędkość wiatru i generowaną moc, zostały w kolejnym etapie aproksymowane. Rys. 1. Podział danych na klastry z zaznaczeniem centroidów

3. POGNOZA MOCY Praca elektrowni wiatrowej charakteryzuje się dużą zmiennością poziomu mocy przez nią generowanej. Wpływ na to ma wiele czynników, najważniejszym z nich jest prędkość wiatru opływającego turbozespół, co uwidacznia P c D 2 v 3 w = pρ, (1) gdzie: P w moc wygenerowana, c p ogólna sprawność przetwarzania energii wiatrowej na mechaniczną, ρ gęstość powietrza, D średnica koła łopatowego, v prędkość wiatru. Prędkość wiatru występuje w trzeciej potędze i producenci elektrowni wiatrowych podają charakterystykę pracy danego obiektu poprzez przedstawienie krzywej mocy, czyli zależności generowanej mocy od prędkości wiatru. Jednym ze sposobów wyznaczenia prognozy jest wykorzystanie tej właśnie charakterystyki. Może ona być jednak przydatna tylko w początkowym etapie pracy elektrowni do momentu uzyskania odpowiednio długiej historii pracy danej elektrowni wiatrowej w określonym miejscu. Krzywa mocy dostarczana przez producenta rożni się od krzywej uzyskiwanej z pomiarów konkretnego już obiektu. Wpływ na to ma wiele czynników, przykładowo: usytuowanie w konkretnej lokalizacji, sąsiedztwo przeszkód naturalnych lub innych elektrowni wiatrowych. Dlatego zasadnym jest tworzenie i okresowa weryfikacja charakterystyk pracujących turbozespołów. Dysponując danymi pomiarowymi (prędkość wiatru, wygenerowana moc) możliwe jest przygotowanie charakterystyki dającej dokładniejsze wyniki prognozy niż użycie krzywej producenta. Problemem pojawiającym się na tym etapie jest dobór odpowiedniej funkcji aproksymującej. Istotne jest to zwłaszcza ze względu na wcześniejszy krok, czyli ograniczenie liczby danych pomiarowych. Znaczne zmniejszenie liczby próbek i w konsekwencji zawężenie obszaru poddawanemu aproksymacji może wpływać negatywnie na niektóre typy funkcji, których błąd dopasowania znacznie się zwiększa po uwzględnieniu całego zakresu pracy elektrowni wiatrowej a nie tylko części, na której wykonywana była aproksymacja. Cechy te posiadają funkcje wielomianowe. Biorąc pod uwagę tę okoliczność zdecydowano wykorzystać funkcję sigmoidalną, którą przedstawia wzór 2 c P ˆ = a( v b) 1+ e (2) ˆ gdzie: Pˆ prognozowana moc, vˆ prognozowana prędkość wiatru a,b,c współczynniki aproksymacji funkcji. Współczynniki funkcji wyznaczane są na podstawie danych umiejscowionych w części uczącej. Następnie, w części testowej, wykonano pseudoprognozę prędkości wiatru. Wyznaczone wartości posłużyły do określenia prognozy mocy generowanej przez farmę wiatrowa zgodnie z wzorem (2).

4. WYKORZYSTANE NARZĘDZIA Obliczenia zostały wykonane przy użyciu oprogramowania SAS Enterprise Guide. Aplikacja ta umożliwia przygotowywanie danych na potrzeby analiz, posiada obszerny zbiór metod statystycznych, pozwala na pełną wizualizację rezultatów za pomocą różnorodnych wykresów graficznych oraz przygotowanie raportów końcowych z uzyskanych rezultatów. Dzięki temu możliwe było wykonanie opisanego procesu z jej użyciem bez potrzeby wykorzystania innych narzędzi. Dodatkową zaletą jest graficzny interfejs użytkownika, który pozwala zaprojektować całą analizę w postaci diagramu procesu, jednocześnie dając dostęp do wszystkich nawet szczegółowych parametrów procedur statystycznych. Dzięki temu możliwe jest szybkie modyfikowanie analiz i wykonywanie wielu iteracji danego eksperymentu obliczeniowego. W ramach niniejszej pracy wykorzystane zostały metody analizy skupień dostępne w ramach procedury proc fastclus oraz metody aproksymacyjne bazujące na regresji nieliniowej na podstawie procedury proc nlin. Pierwsza procedura pozwala wykonywać analizy skupień z wykorzystaniem różnych metod. Na potrzeby artykułu ostateczna analiza została wykonana w oparciu o metodę ward. Kolejna procedura umożliwia aproksymację poprzez dopasowanie parametrów określonego modelu regresji nieliniowej. 5. PRZEPROWADZENIE OBLICZEŃ Analiza danych pomiarowych z systemu SCADA wykazała konieczność wykonania wstępnej filtracji. Wynikało to z faktu braku ciągłości zapisu niektórych parametrów. Możliwości aplikacji Enterprise Guide pozwoliły w sposób intuicyjny na przeprowadzenie tej operacji i uzyskanie danych oczyszczonych. Każdy z elementów procesu, począwszy od wczytania danych poprzez przeprowadzenie filtracji aż do uzyskania jej wyników, przedstawiony graficznie jako osobny składnik procesu, może być indywidualnie modyfikowany. Kolejny etap (jak już wcześniej wspomniano) polegał na podzieleniu danych na część uczącą i testową. Zadanie to sprowadzało się (podobnie jak poprzednie) do wprowadzenia określonych filtrów. Dane testowe zostały poddane analizie skupień. Liczba grup zmieniała się od trzech do dwudziestu. Kreator dostępny w ramach tej funkcji pozwala w łatwy sposób wybrać dane, metodę analizy oraz sposób prezentacji rezultatów Wyniki, w postaci współrzędnych centroidów kolejnych analiz, zostały zapisane w osobnej tabeli. Zostały one wykorzystane w kolejnej fazie obliczeń do wyznaczenia współczynników funkcji sigmoidalnej przedstawionej we wzorze 2. Potrzebna do tego regresja nieliniowa jest obok regresji liniowej, logistycznej i uogólnionych modeli liniowych jednym ze składników dostępnych w ramach tego zadania. Wypełniając kolejne informacje przy pomocy kreatora określono zmienną niezależną, zmienną objaśniającą metodę przeprowadzenia obliczeń oraz punkt startowy i przedziały zmienności współczynników. Problem pojawił się w momencie wprowadzania wzoru funkcji sigmoidalnej gdyż w zbiorze kilkunastu zdefiniowanych modeli nie było takiego, który by dokładnie odpowiadał wymaganiom postawionym przez autorów. Problem został bardzo szybko rozwiązany. Z każdym elementem procesu tworzonym przy pomocy kreatora powiązany jest kod programu. Drobna

modyfikacja jednego z elementów procedury proc nlin pozwoliła uzyskać wymagany model. Do wykonania prognozy poziomu mocy generowanej przez farmę wiatrowa została sporządzona pseudoprognoza polegająca na zaburzeniu rzeczywistych odczytów prędkości wiatru losowymi wartościami. Wielkość zmian wahała się w przedziale od -20% do +20% wartości zmierzonej. Na podstawie prognozy prędkości wiatru oraz wyznaczonych współczynników funkcji możliwe było przygotowanie prognoz mocy. Współczynniki aproksymujące funkcji zostały wyznaczone czterokrotnie. Za każdym razem zastosowane zostały (lub nie) inne metody przetwarzania wstępnego. Celem tego zabiegu było ukazanie wpływu metod grupowania danych na wielkość błędu predykcji mocy. Do przygotowania pierwszej prognozy zostały wykorzystane informacje jedynie oczyszczone z błędów. Drugi sposób zakładał wykonanie standaryzacji danych przed sporządzeniem właściwej prognozy. Wykonanie kolejnych dwóch predykcji zostało poprzedzone przeprowadzeniem grupowania i wyznaczeniem centroidów klastrów danych, wykorzystanych do wcześniejszych eksperymentów (nieprzetworzonych i standaryzowanych). Środki wyznaczonych grup posłużyły jako dane wejściowe do wykonania kolejnych dwóch prognoz. 6. REZULTATY Chcąc ocenić wpływ szczegółowości informacji uzyskiwanych z farm wiatrowych oraz metod mających na celu ich ilościowe ograniczenie przed przygotowaniem właściwej prognozy na jej dokładność dokonano porównania czterech przedstawionych powyżej warianów. Wyniki uwidocznione są w tabeli 2 i 3. Tabela 2 Średni procentowy błąd prognozy (MAPE) grupowanie danych da- standaryzacja nych nie tak nie 53,7 44 tak 54,3 43,5 Różnice w wielkościach wyznaczonych błędów wynikają z zastosowanej metody wyznaczania. W podejściu klasycznym różnica między wartością rzeczywistą a prognozowaną jest przyrównywana do wartości rzeczywistej. W tabeli 3 przedstawiono wielkość błędu odniesioną do wartości nominalnej obiektu. Dzięki temu możliwa jest lepsza ocena zastosowanej metody predykcji i porównania jej z innymi narzędziami [4,5].

Tabela 3 Średni procentowy błąd prognozy (nmape) standaryzacja danych nie tak nie 7,63 7,62 grupowanie danych tak 7,59 7,64 Również z punktu widzenia operatora systemu przesyłowego wyznaczenie wielkości błędu drugą metodą (nmape) jest bardziej użyteczne ponieważ w prosty sposób możliwe jest określenie dokładności prognozy w watach (lub megawatach) a co za tym idzie lepszego zaplanowania poziomu utrzymywanej rezerwy mocy. 7. WNIOSKI Metoda grupowania danych jako element poprzedzający sporządzenie prognozy została zastosowana ze względu na rosnącą liczbę informacji płynących z farm i elektrowni wiatrowych, których przetwarzanie za pomocą klasycznych metod będzie wiązało się z wydatkiem na zakup coraz bardziej wydajnego sprzętu lub zwiększeniem czasu przygotowania prognozy, co może stanowić problem, zwłaszcza w przypadku prognostycznych systemów online. Analizując wyniki przedstawione w tabelach 2 i 3 można stwierdzić, iż w zależności od wybranej metody wyznaczenia błędu i wykorzystania standaryzacji obserwowane są drobne różnice w wartościach błędów wskazujące na zasadność wykorzystania tej metody bądź sugerujące rezygnację z niej. Niemniej różnice w wielkościach wyznaczonych błędów są na tyle małe, że można stwierdzić, iż wykorzystanie metody grupowania danych ma niewielki wpływ na średni błąd otrzymanej prognozy. Czy zatem warto stosować tę metodę? Zdaniem autorów tak, ponieważ dzięki temu można w znaczący sposób ograniczyć ilość danych potrzebnych do przygotowania prognozy poprzez wyznaczenie reprezentatywnego zbioru danych otrzymanych z farmy wiatrowej. Zastosowanie metod grupowania danych może być bardo pomocne zwłaszcza w przypadku systemu prognostycznego przygotowującego prognozy dla dużej liczby obiektów z bardzo małym interwałem czasowym, rzędu kilku minut. LITERATURA [1] Fried L., Sawyer S., Shukla S., Qiao L.: Global wind report - Annual market update. Global Wind Energy Council, 2012. [2] Popławski T., Szeląg P., Dąsal K., Łyp J.: Zastosowanie modeli ARMA do przewidywania mocy i energii pozyskiwanej z wiatru. Polityka Energetyczna. 2002, T.13, z.2, str. 385-400. [3] Popławski T., Dąsal K., Łyp J.: Problematyka prognozowania mocy i energii pozyskiwanych z wiatru. Polityka Energetyczna, 2009, T.12, z.2, str. 511-523.

[4] Giebel G., Landberg L., Kariniotakis R. Brownsword R.: State-of-the-art on methods and software tools for short-term prediction of wind energy production. Proceedings of European Wind Energy Conference, Madryt, 2003. [5] Madsen H., Kariniotakis G., Nielsen H., Nielsen T., Pinson P.: A protocol for standardizing the performance evaluation of short-term wind power prediction models. Proceedings of the 2004 Global Windpower Conference and Exhibition, 2004. [6] Rodziewicz T., Teneta J., Zaremba A., Wacławek M.: Analysis of Solar Energy Resources in Southern Poland for Photovoltaic Applications. Ecological Chemistry and Engineering S., 2013, 20(1), 177-198. [7] Al-Awami A. T., El-Sharkawi M. A.: Statistical characterization of wind power output for a given wind power forecast. Proc. North American Power Symposium, 2009, 1-4. [8] Cassola F., Burlando M.: Wind speed and wind energy forecast through Kalman filtering of Numerical Weather Prediction model output. Applied Energy, 2012,vol. 99, 154-166. THE USE OF GROUPING METHODS FOR FORECASTING WIND GENERATION Key words: wind energy, forecasting, data mining, Big Data Summary. An increasing number of measurement data derived from wind farms make possible to prepare accurate forecasts. At the same time begin to appear problems related to the processing and selecting the information with the greatest impact on accuracy of the prediction. This paper describes the use of tools that can process large data sets for the selection of a representative data set and preparation on the basis of forecasts of power generated by the wind farm. Tomasz Popławski, dr hab. inż. Prof. PCz. pracuje w Instytucie Elektroenergetyki na Wydziale Elektrycznym Politechniki Częstochowskiej. Aktualnie pełni funkcję Prodziekana ds. Studiów Niestacjonarnych Wydziału Elektrycznego. Jest również kierownikiem Zakładu Urządzeń i Gospodarki Elektroenergetycznej. Jego naukowe badania skupiają się na analizach, modelowaniu i prognozowaniu zjawisk związanych z eksploatacją oraz programowaniem rozwoju systemów elektroenergetycznych. poptom@el.pcz.czest.pl Piotr Szeląg, dr inż, Politechnika Częstochowska, Instytut Informatyki, al. Armii Krajowej 17, 42-200 Częstochowa, e-mail: szelag@el.pcz.czest.pl Dariusz Całus, dr inż., Politechnika Częstochowska, Instytut Elektrotechniki Przemysłowej, al. Armii Krajowej 17, 42-200 Częstochowa, e-mail: dc@el.pcz.czest.pl Cezary Głowiński, dr inż., SAS Institute Polska, ul. Gdańska 27/31, 01-633 Warszawa, e-mail: Cezary.Glowinski@sas.com Łukasz Adamowicz, mgr inż., SAS Institute Polska, Energy Sector, ul. Gdańska 27/31, 01-633 Warszawa, e-mail: Lukasz.Adamowicz@sas.com