Regionalizacja biomasy ubocznej i odpadowej w Polsce i Europie Przemysław Czaban Warsztaty Ocena potencjału biomasy odpadowej i ubocznej oraz skutki środowiskowe produkcji i wykorzystania biomasy IUNG-PIB, 28 maja 2014
Ocena potencjału odpadów z produkcji rolniczej dostępnej dla wytwarzania energii Oryginalne opracowanie zawiera dane dla każdej kategorii odpadu obejmujące obszar UE 27 i Szwajcarię w rozdzielczości NUTS 3 Dane te można przedstawid poglądowo na mapach Jednak jedna mapa może przedstawid tylko jedną kategorię W powyższym przypadku całościowa analiza wymaga pracy z dziesięcioma mapami W celu zredukowania wielowymiarowego zbioru danych do zbioru jednowymiarowego, który dawałby możliwośd łatwiejszej poglądowej oceny danych posłużono się analizą skupieo
W ocenie potencjałów biomasy, populację badanych obiektów tworzą europejskie regiony NUTS 3 (1313 regionów) Każdy z nich jest scharakteryzowany zestawem dziesięciu cech wcześniej obliczonym potencjałem dla każdego z dziesięciu rodzajów biomasy odpadowej o 1.1. Nawozy naturalne o 1.2. Słoma o 1.3. Siano o 1.4. Plantacje wieloletnie o 2.0. Biomasa leśna o 3.1. Biomasa miejska o 3.2. Przydrożna o 4.1. Odpady komunalne o 4.2. Odpady przemysłu spożywczego o 4.3. Odpady przemysłu drzewnego W ten sposób pojawia się dziesięciowymiarowa przestrzeo cech mierzalnych W tej przestrzeni można określid odległośd między obiektami, np. za pomocą metryki euklidesowej
10 map 10-cio wymiarowa przestrzeo danych Trudna do jednoczesnej analizy
Cechy analizy skupieo: Z wyjściowego zbioru danych wydziela jednorodne zbiory danych o podobnej charakterystyce. Jest możliwa do zastosowania bardzo szerokiej klasy danych (przy doborze odpowiedniej metody analizy skupieo). Wystarczy aby dla danych można było określid pewną miarę odległości. Duże trudności w interpretacji (brak jednoznacznej definicji skupienia).
Człowiek jest w stanie w doskonały sposób zrobid analizę skupieo za pomocą wykresu rozrzutu i swojego wzroku Ale tylko w dwóch, ewentualnie trzech wymiarach
1. Pierwszy krok w przeprowadzonej analizie skupieo: Wybór zmiennych, które mają największy potencjał różnicujący Zastosowano metodę HINoV (Heuristic Identification of Noisy Variables) (Carmone F.J., Kara A., Maxwell S.) opierającą się wyliczeniu odpowiedniego wskaźnika dla założonej liczby skupieo i analizie wykresów osypiska
Analizy wykresów osypiska wskazują dośd jednoznacznie, że w następnych krokach należy pominąd zmienne 3, 1 i 2 (siano, biomasę uboczną z produkcji zwierzęcej i słomę) Jednakże uznano, iż zmienna 2 (słoma) jest na tyle ważna z punktu widzenia sumarycznego zasobu biomasy w Europie, że usunięcie jej z dalszych obliczeo bardzo zubożyłoby analizę.
Wybór metody Pierwsze próby: metody aglomeracyjne brak dobrych efektów (skupienia o bardzo nierównomiernej liczebności i słabo od siebie odseparowane); Następne próby: metoda k-średnich lepsze, obiecujące efekty; Metoda k-średnich wymaga podania z góry liczby skupieo Zastosowano algorytmiczne określenie najlepszej liczby klas poprzez sprawdzenie kilku metod postępowania przy jednoczesnym nadzorze eksperckim, aby finalne skupienia oprócz technicznego uproszczenia zbioru danych dawały interpretowalny obraz w sensie badanego zjawiska
Algorytm oparty na indeksie Calioskiego i Harabasza, dany wzorem (Calioski i Harabasz 1974): CH u = tr(b u)/(u 1) tr(w u )/(n u) W powyższym wzorze B u to macierz kowariancji międzyklasowej, zaś W u to macierz kowariancji wewnątrzklasowej, n liczba punktów, zaś u liczba skupieo. Przez tr(a) oznaczono ślad macierzy A. Procedura polega na wyliczeniu indeksu dla wybranego zbioru potencjalnych liczby skupieo i wybraniu takiej liczby skupieo dla której indeks przyjmuje maximum, czyli: u = arg max CH u. u
Algorytm oparty na indeksie Huberta i Levina, dany wzorem (Milligan i Cooper 1985): HL u = D u I w D min, I w D max I w D min gdzie D(u) to suma wszystkich odległości międzyklasowych, I w liczba odległości wewnątrzklasowych, D min (u) najmniejsza odległośd wewnątrzklasowa, zaś D max (u) największa odległośd międzyklasowa. W odróżnieniu od punktu 1 należy wybrad u = arg min u HL u.
Algorytm oparty na indeksie Krzanowskiego i Lai, dany wzorem (Krzanowski i Lai 1985, Tibshirani i in. 2001): KL u = (u 1) 2/m tr(w u 1 ) u 2 m tr(w u ) (u) 2/m tr(w u ) u+1 2 m tr(w u+1 ), gdzie m to liczba zmiennych. Pozostałe symbole jak wyżej. Podobnie jak w punkcie 1, należy wybrać u = arg max KL u. u
Algorytm oparty na indeksie Daviesa i Bouldina dany wzorem (Davies i Bouldin 1979): DB u = 1 u S r = 1 nr p u r=1 max s,r s i P r m j=1 S r +S s d rs,gdzie x ij r z rj q 1 q, zaś m p d rs = z rj z sj, x r ij to j-ta współrzędna i-tego j=1 elemntu klasy r, z rj j-ta współrzędna środka ciężkości r-tej klasy, a P r -zbiór obiektów tejże klasy; q i p to parametry, zazwyczaj przyjmuje się 1 lub 2. W tym punkcie tak jak w przypadku metody Huberta i Levina należy wybrać u = arg min u DB u.
Algorytm oparty na indeksie Hartigana dany wzorem (Hartigan 1975): H u = tr(w u) 1 n u 1. tr(w u+1 ) Dla tego algorytmu optymalną liczbą klas jest najmniejsze u, którego H(u) 10. W wyniku przeprowadzonych testów otrzymano wiele zbyt różniących się przesłanek do wyboru liczby klas skupień (tab. 18).
Algorytm Liczba klas 1 Algorytm oparty na indeksie Calioskiego i Harabasza 3-4 2 Algorytm oparty na indeksie Huberta i Levina 10 3 Algorytm oparty na indeksie Krzanowskiego i Lai 4-10 4 Algorytm oparty na indeksie Daviesa i Bouldina 5 5 Algorytm oparty na indeksie Hartigana >=10
Rozbieżności w sugerowanej przez algorytmy liczbie skupieo wskazują na, między innymi, dwa fakty: trudności interpretacyjne w analizie skupieo; struktura klasowa w badanym zbiorze danych jest słabo wykształcona Zastosowano matematyczny miernik siły struktury klasowej
Miernik siły struktury klasowej, oparty na indeksie Silhouette, dany jest poniższym wzorem: S u = 1 n n i=1 b i a(i) max *a i, b i + gdzie: a i = d ik k *P r \i+, (n r 1) b i = min s r *d i P s +, d i Ps = k P s odpowiednio zbiór obiektów klasy r i s. d ik n s,p r i P s to
Liczba skupieo Indeks Silhouette 1 NA 2 0,24 3 0,29 4 0,33 5 0,33 6 0,34 7 0,27 8 0,28 9 0,29 10 0,27 indeks Silhouette dla liczby klas równej 6 wynosi 0,34, według autorów metody (Kaufmana i Rousseeuwa) świadczy o słabej, ale występującej strukturze klas
Wyniki analizy skupieo przeprowadzonej metodą k-średnich dla liczby skupieo równej 6. Ocena za pomocą dwuwymiarowych wykresów rozrzutu.
Analiza danych za pomocą dwuwymiarowych wykresów rozrzutu Przestrzeo danych jest ośmiowymiarowa (z powodu odrzucenia dwóch zmiennych na etapie analizy HINoV) niemożliwa do oceny wzrokowej przez człowieka. Możliwa jest natomiast wzrokowa analiza dwuwymiarowych płaszczyzn, którymi wyjściowa przestrzeo jest przecinana.
1.2 Słoma 1.4 Plantacje wieloletnie 2.0 Biomasa leśna 3.1 Biomasa miejska 3.2 Przydrożna 4.1 Odpady komunalne 4.2 Odpady przemysłu spożywczego 4.3 Odpady przemysłu drzewnego Ośmiowymiarowa przestrzeo analizy skupieo zwizualizowana dla wszystkich klas w symetrycznej macierzy
1.2 Słoma 1.4 Plantacje wieloletnie 2.0 Biomasa leśna 3.1 Biomasa miejska 3.2 Przydrożna 4.1 Odpady komunalne 4.2 Odpady przemysłu spożywczego 4.3 Odpady przemysłu drzewnego Powiększony obraz przestrzeni analizy skupieo, w których żadna cecha nie odchyla się od średniej o więcej niż 6 odchyleo standardowych.
1.2 Słoma 1.4 Plantacje wieloletnie 2.0 Biomasa leśna 3.1 Biomasa miejska 3.2 Przydrożna 4.1 Odpady komunalne 4.2 Odpady przemysłu spożywczego 4.3 Odpady przemysłu drzewnego Losowo wybrana próba 200 NUTS-3
Wynikowa mapa analizy skupieo skupienie sadowniczo-spożywcze skupienie leśne skupienie pośrednie skupienie supermiejskie skupienie rolnicze skupienie miejskie
Typ biomasy Słoma Uprawy sadownicz e Biomasa leśna Biomasa miejska Biomasa przydrożn a Odpady komunaln e Odpady przem. spoz. Odpady przem. drzew. Zmienna Klasa; b.1.2 b.1.4 b.2.0 b.3.1 b.3.2 b.4.1 b.4.2 b.4.3 1 19,1 (-0,3) 35,3 (3,4) 12,5 (-0,6) 0,2 (-0,4) 1,6 (-0,1) 33,2 (-0,2) 38,0 (2,8) 0,4 (-0,8) 2 20,2 (-0,3) 1,0 (-0,2) 47,0 (1,1) 0,3 (-0,3) 1,4 (-0,2) 20,1 (-0,3) 0,5 (-0,2) 2,6 (1,2) 3 32,6 (0,0) 1,9 (-0,1) 14,4 (-0,5) 0,6 (-0,2) 1,2 (-0,2) 42,4 (-0,1) 1,3 (-0,1) 0,7 (-0,6) 4 3,0 (-0,7) 0,0 (-0,3) 5,5 (-1,0) 9,7 (4,3) 14,1 (5,7) 1682,3 (8,7) 0,0 (-0,2) 0,4 (-0,8) 5 154,1 (2,7) 2,4 (-0,1) 14,0 (-0,5) 0,4 (-0,3) 1,1 (-0,3) 24,8 (-0,2) 4,3 (0,1) 0,6 (-0,6) 6 13,8 (-0,5) 0,6 (-0,3) 10,8 (-0,7) 6,1 (2,5) 5,4 (1,7) 329,5 (1,4) 0,5 (-0,2) 0,6 (-0,6)
Podejście do regionalizacji nakierowane na określenie preferowanego procesu przetwarzania biomasy W ramach projektu BioBoost została określona preferowana kolejnośd surowców dla poszczególnych typów przetwarzania biomasy: Szybka Piroliza Miskant Odpady przemysłu drzewnego Słoma pszeniczna Piroliza katalityczna Drewno bukowe Miskant Słoma pszeniczna Karbonizacja hydrotermalna Organiczne odpady komunalne Odpady browarnicze Wheat straw
Dziękuję za uwagę