Regionalizacja biomasy ubocznej i odpadowej w Polsce i Europie

Podobne dokumenty
Magdalena Borzęcka-Walker. Wykorzystanie produktów opartych na biomasie do rozwoju produkcji biopaliw

OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ DLA DANYCH PORZĄDKOWYCH. 1. Wstęp

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Hierarchiczna analiza skupień

Analiza składowych głównych

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Biomasa uboczna z produkcji rolniczej

Ocena możliwości rozwoju upraw wieloletnich na cele energetyczne z uwzględnieniem skutków środowiskowych i bezpieczeostwa żywnościowego Antoni Faber

Agnieszka Nowak Brzezińska

Geoinformacja zasobów biomasy na cele energetyczne

Zasoby biomasy w Polsce

POSSIBILITIES OF USING BIOMASS IN POLAND

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

MOŻLIWOŚCI POZYSKANIA BIOMASY DRZEWNEJ DO CELÓW ENERGETYCZNYCH W SADOWNICTWIE I LEŚNICTWIE

Wykorzystanie biomasy na cele energetyczne w UE i Polsce

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Idea. Algorytm zachłanny Algorytmy hierarchiczne Metoda K-średnich Metoda hierarchiczna, a niehierarchiczna. Analiza skupień

Ocena potencjału biomasy stałej z rolnictwa

Robert Susmaga. Instytut Informatyki ul. Piotrowo 2 Poznań

Regresja i Korelacja

Analiza skupień. Idea

Analiza składowych głównych. Wprowadzenie

UPRAWY ENERGETYCZNE W CENTRALNEJ I WSCHODNIEJ EUROPIE

Elementy statystyki wielowymiarowej

Znaczenie biomasy leśnej w realizacji wymogów pakietu energetycznoklimatycznego

Analiza autokorelacji

Skalowanie wielowymiarowe idea

Budowa pionowa drzewostanu w świetle przestrzennego rozkładu punktów lotniczego skanowania laserowego

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Biogazownie w energetyce

Skrócony opis produktu

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Systemy uczące się Lab 4

Wykorzystanie biomasy stałej w Europie

Analiza skupień. Waldemar Wołyński, Tomasz Górecki. Wydział Matematyki i Informatyki UAM Poznań. 6 marca 2013

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Biogaz i biomasa -energetyczna przyszłość Mazowsza

W1. Wprowadzenie. Statystyka opisowa

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Analiza współzależności dwóch cech I

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

PDF created with FinePrint pdffactory Pro trial version

Metody systemowe i decyzyjne w informatyce

Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

POD- I NADOKREŚLONE UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

METODA SYMPLEKS. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski

KURS FUNKCJE WIELU ZMIENNYCH

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji

ANALIZA STRUKTURY WIEKOWEJ ORAZ PŁCIOWEJ CZŁONKÓW OFE Z WYKORZYSTANIEM METOD TAKSONOMICZNYCH

Prawdopodobieństwo czerwonych = = 0.33

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Prace nad rozporządzeniem określającym zasady zrównoważonego pozyskania biomasy oraz jej dokumentowania na potrzeby systemu wsparcia

Rozkłady wielu zmiennych

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Agnieszka Nowak Brzezińska Wykład III

Statystyka matematyczna i ekonometria

POLITECHNIKA OPOLSKA

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

ODNAWIALNE ŹRÓDŁA ENERGII. Seminarium Biomasa na cele energetyczne założenia i realizacja Warszawa, 3 grudnia 2008 r.

Surowce w gospodarce o obiegu zamkniętym Łukasz Sosnowski, Sekretarz Zespołu ds. Gospodarki o Obiegu Zamkniętym

O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich

Potencjał biomasy nowe kierunki jej wykorzystania

Agnieszka Nowak Brzezińska Wykład III

Marta Dziechciarz Duda SEGMENTACJA RYNKU DÓBR TRWAŁEGO UŻYTKOWANIA NA PODSTAWIE DANYCH NIEMETRYCZNYCH. 1. Wstęp

Socjo-ekonomiczne aspekty polskich inwestycji biomasowych

Prawdopodobieństwo i statystyka

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Układy równań liniowych

STATYSTYKA MATEMATYCZNA

Statystyka w pracy badawczej nauczyciela

WYMAGANIA EDUKACYJNE Rok szkolny 2018/2019

Statystyka i eksploracja danych

STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE

Wykład 10 Skalowanie wielowymiarowe

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Sieci Kohonena Grupowanie

Analiza składowych głównych idea

Badanie normalności rozkładu

Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce

STATYSTYKA I DOŚWIADCZALNICTWO

Instytut Ekonomiki Rolnictwa i Gospodarki Żywnościowej Państwowy Instytut Badawczy

Efektywny rozwój rozproszonej energetyki odnawialnej w połączeniu z konwencjonalną w regionach Biomasa jako podstawowe źródło energii odnawialnej

Metoda reprezentacyjna

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

TRANSFORMACJE I JAKOŚĆ DANYCH

Podstawy grupowania danych w programie RapidMiner Michał Bereta

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

Aproksymacja funkcji a regresja symboliczna

Transkrypt:

Regionalizacja biomasy ubocznej i odpadowej w Polsce i Europie Przemysław Czaban Warsztaty Ocena potencjału biomasy odpadowej i ubocznej oraz skutki środowiskowe produkcji i wykorzystania biomasy IUNG-PIB, 28 maja 2014

Ocena potencjału odpadów z produkcji rolniczej dostępnej dla wytwarzania energii Oryginalne opracowanie zawiera dane dla każdej kategorii odpadu obejmujące obszar UE 27 i Szwajcarię w rozdzielczości NUTS 3 Dane te można przedstawid poglądowo na mapach Jednak jedna mapa może przedstawid tylko jedną kategorię W powyższym przypadku całościowa analiza wymaga pracy z dziesięcioma mapami W celu zredukowania wielowymiarowego zbioru danych do zbioru jednowymiarowego, który dawałby możliwośd łatwiejszej poglądowej oceny danych posłużono się analizą skupieo

W ocenie potencjałów biomasy, populację badanych obiektów tworzą europejskie regiony NUTS 3 (1313 regionów) Każdy z nich jest scharakteryzowany zestawem dziesięciu cech wcześniej obliczonym potencjałem dla każdego z dziesięciu rodzajów biomasy odpadowej o 1.1. Nawozy naturalne o 1.2. Słoma o 1.3. Siano o 1.4. Plantacje wieloletnie o 2.0. Biomasa leśna o 3.1. Biomasa miejska o 3.2. Przydrożna o 4.1. Odpady komunalne o 4.2. Odpady przemysłu spożywczego o 4.3. Odpady przemysłu drzewnego W ten sposób pojawia się dziesięciowymiarowa przestrzeo cech mierzalnych W tej przestrzeni można określid odległośd między obiektami, np. za pomocą metryki euklidesowej

10 map 10-cio wymiarowa przestrzeo danych Trudna do jednoczesnej analizy

Cechy analizy skupieo: Z wyjściowego zbioru danych wydziela jednorodne zbiory danych o podobnej charakterystyce. Jest możliwa do zastosowania bardzo szerokiej klasy danych (przy doborze odpowiedniej metody analizy skupieo). Wystarczy aby dla danych można było określid pewną miarę odległości. Duże trudności w interpretacji (brak jednoznacznej definicji skupienia).

Człowiek jest w stanie w doskonały sposób zrobid analizę skupieo za pomocą wykresu rozrzutu i swojego wzroku Ale tylko w dwóch, ewentualnie trzech wymiarach

1. Pierwszy krok w przeprowadzonej analizie skupieo: Wybór zmiennych, które mają największy potencjał różnicujący Zastosowano metodę HINoV (Heuristic Identification of Noisy Variables) (Carmone F.J., Kara A., Maxwell S.) opierającą się wyliczeniu odpowiedniego wskaźnika dla założonej liczby skupieo i analizie wykresów osypiska

Analizy wykresów osypiska wskazują dośd jednoznacznie, że w następnych krokach należy pominąd zmienne 3, 1 i 2 (siano, biomasę uboczną z produkcji zwierzęcej i słomę) Jednakże uznano, iż zmienna 2 (słoma) jest na tyle ważna z punktu widzenia sumarycznego zasobu biomasy w Europie, że usunięcie jej z dalszych obliczeo bardzo zubożyłoby analizę.

Wybór metody Pierwsze próby: metody aglomeracyjne brak dobrych efektów (skupienia o bardzo nierównomiernej liczebności i słabo od siebie odseparowane); Następne próby: metoda k-średnich lepsze, obiecujące efekty; Metoda k-średnich wymaga podania z góry liczby skupieo Zastosowano algorytmiczne określenie najlepszej liczby klas poprzez sprawdzenie kilku metod postępowania przy jednoczesnym nadzorze eksperckim, aby finalne skupienia oprócz technicznego uproszczenia zbioru danych dawały interpretowalny obraz w sensie badanego zjawiska

Algorytm oparty na indeksie Calioskiego i Harabasza, dany wzorem (Calioski i Harabasz 1974): CH u = tr(b u)/(u 1) tr(w u )/(n u) W powyższym wzorze B u to macierz kowariancji międzyklasowej, zaś W u to macierz kowariancji wewnątrzklasowej, n liczba punktów, zaś u liczba skupieo. Przez tr(a) oznaczono ślad macierzy A. Procedura polega na wyliczeniu indeksu dla wybranego zbioru potencjalnych liczby skupieo i wybraniu takiej liczby skupieo dla której indeks przyjmuje maximum, czyli: u = arg max CH u. u

Algorytm oparty na indeksie Huberta i Levina, dany wzorem (Milligan i Cooper 1985): HL u = D u I w D min, I w D max I w D min gdzie D(u) to suma wszystkich odległości międzyklasowych, I w liczba odległości wewnątrzklasowych, D min (u) najmniejsza odległośd wewnątrzklasowa, zaś D max (u) największa odległośd międzyklasowa. W odróżnieniu od punktu 1 należy wybrad u = arg min u HL u.

Algorytm oparty na indeksie Krzanowskiego i Lai, dany wzorem (Krzanowski i Lai 1985, Tibshirani i in. 2001): KL u = (u 1) 2/m tr(w u 1 ) u 2 m tr(w u ) (u) 2/m tr(w u ) u+1 2 m tr(w u+1 ), gdzie m to liczba zmiennych. Pozostałe symbole jak wyżej. Podobnie jak w punkcie 1, należy wybrać u = arg max KL u. u

Algorytm oparty na indeksie Daviesa i Bouldina dany wzorem (Davies i Bouldin 1979): DB u = 1 u S r = 1 nr p u r=1 max s,r s i P r m j=1 S r +S s d rs,gdzie x ij r z rj q 1 q, zaś m p d rs = z rj z sj, x r ij to j-ta współrzędna i-tego j=1 elemntu klasy r, z rj j-ta współrzędna środka ciężkości r-tej klasy, a P r -zbiór obiektów tejże klasy; q i p to parametry, zazwyczaj przyjmuje się 1 lub 2. W tym punkcie tak jak w przypadku metody Huberta i Levina należy wybrać u = arg min u DB u.

Algorytm oparty na indeksie Hartigana dany wzorem (Hartigan 1975): H u = tr(w u) 1 n u 1. tr(w u+1 ) Dla tego algorytmu optymalną liczbą klas jest najmniejsze u, którego H(u) 10. W wyniku przeprowadzonych testów otrzymano wiele zbyt różniących się przesłanek do wyboru liczby klas skupień (tab. 18).

Algorytm Liczba klas 1 Algorytm oparty na indeksie Calioskiego i Harabasza 3-4 2 Algorytm oparty na indeksie Huberta i Levina 10 3 Algorytm oparty na indeksie Krzanowskiego i Lai 4-10 4 Algorytm oparty na indeksie Daviesa i Bouldina 5 5 Algorytm oparty na indeksie Hartigana >=10

Rozbieżności w sugerowanej przez algorytmy liczbie skupieo wskazują na, między innymi, dwa fakty: trudności interpretacyjne w analizie skupieo; struktura klasowa w badanym zbiorze danych jest słabo wykształcona Zastosowano matematyczny miernik siły struktury klasowej

Miernik siły struktury klasowej, oparty na indeksie Silhouette, dany jest poniższym wzorem: S u = 1 n n i=1 b i a(i) max *a i, b i + gdzie: a i = d ik k *P r \i+, (n r 1) b i = min s r *d i P s +, d i Ps = k P s odpowiednio zbiór obiektów klasy r i s. d ik n s,p r i P s to

Liczba skupieo Indeks Silhouette 1 NA 2 0,24 3 0,29 4 0,33 5 0,33 6 0,34 7 0,27 8 0,28 9 0,29 10 0,27 indeks Silhouette dla liczby klas równej 6 wynosi 0,34, według autorów metody (Kaufmana i Rousseeuwa) świadczy o słabej, ale występującej strukturze klas

Wyniki analizy skupieo przeprowadzonej metodą k-średnich dla liczby skupieo równej 6. Ocena za pomocą dwuwymiarowych wykresów rozrzutu.

Analiza danych za pomocą dwuwymiarowych wykresów rozrzutu Przestrzeo danych jest ośmiowymiarowa (z powodu odrzucenia dwóch zmiennych na etapie analizy HINoV) niemożliwa do oceny wzrokowej przez człowieka. Możliwa jest natomiast wzrokowa analiza dwuwymiarowych płaszczyzn, którymi wyjściowa przestrzeo jest przecinana.

1.2 Słoma 1.4 Plantacje wieloletnie 2.0 Biomasa leśna 3.1 Biomasa miejska 3.2 Przydrożna 4.1 Odpady komunalne 4.2 Odpady przemysłu spożywczego 4.3 Odpady przemysłu drzewnego Ośmiowymiarowa przestrzeo analizy skupieo zwizualizowana dla wszystkich klas w symetrycznej macierzy

1.2 Słoma 1.4 Plantacje wieloletnie 2.0 Biomasa leśna 3.1 Biomasa miejska 3.2 Przydrożna 4.1 Odpady komunalne 4.2 Odpady przemysłu spożywczego 4.3 Odpady przemysłu drzewnego Powiększony obraz przestrzeni analizy skupieo, w których żadna cecha nie odchyla się od średniej o więcej niż 6 odchyleo standardowych.

1.2 Słoma 1.4 Plantacje wieloletnie 2.0 Biomasa leśna 3.1 Biomasa miejska 3.2 Przydrożna 4.1 Odpady komunalne 4.2 Odpady przemysłu spożywczego 4.3 Odpady przemysłu drzewnego Losowo wybrana próba 200 NUTS-3

Wynikowa mapa analizy skupieo skupienie sadowniczo-spożywcze skupienie leśne skupienie pośrednie skupienie supermiejskie skupienie rolnicze skupienie miejskie

Typ biomasy Słoma Uprawy sadownicz e Biomasa leśna Biomasa miejska Biomasa przydrożn a Odpady komunaln e Odpady przem. spoz. Odpady przem. drzew. Zmienna Klasa; b.1.2 b.1.4 b.2.0 b.3.1 b.3.2 b.4.1 b.4.2 b.4.3 1 19,1 (-0,3) 35,3 (3,4) 12,5 (-0,6) 0,2 (-0,4) 1,6 (-0,1) 33,2 (-0,2) 38,0 (2,8) 0,4 (-0,8) 2 20,2 (-0,3) 1,0 (-0,2) 47,0 (1,1) 0,3 (-0,3) 1,4 (-0,2) 20,1 (-0,3) 0,5 (-0,2) 2,6 (1,2) 3 32,6 (0,0) 1,9 (-0,1) 14,4 (-0,5) 0,6 (-0,2) 1,2 (-0,2) 42,4 (-0,1) 1,3 (-0,1) 0,7 (-0,6) 4 3,0 (-0,7) 0,0 (-0,3) 5,5 (-1,0) 9,7 (4,3) 14,1 (5,7) 1682,3 (8,7) 0,0 (-0,2) 0,4 (-0,8) 5 154,1 (2,7) 2,4 (-0,1) 14,0 (-0,5) 0,4 (-0,3) 1,1 (-0,3) 24,8 (-0,2) 4,3 (0,1) 0,6 (-0,6) 6 13,8 (-0,5) 0,6 (-0,3) 10,8 (-0,7) 6,1 (2,5) 5,4 (1,7) 329,5 (1,4) 0,5 (-0,2) 0,6 (-0,6)

Podejście do regionalizacji nakierowane na określenie preferowanego procesu przetwarzania biomasy W ramach projektu BioBoost została określona preferowana kolejnośd surowców dla poszczególnych typów przetwarzania biomasy: Szybka Piroliza Miskant Odpady przemysłu drzewnego Słoma pszeniczna Piroliza katalityczna Drewno bukowe Miskant Słoma pszeniczna Karbonizacja hydrotermalna Organiczne odpady komunalne Odpady browarnicze Wheat straw

Dziękuję za uwagę