Ocena przydatności obrazów hiperspektralnych APEX oraz maszyn wektorów nośnych (SVM) do klasyfikacji roślinności subalpejskiej i alpejskiej Karkonoszy

Podobne dokumenty
Zobrazowania hiperspektralne do badań środowiska podstawowe zagadnienia teoretyczne

KP, Tele i foto, wykład 3 1

PRZESTRZENNE BAZY DANYCH

Podstawy Geomatyki Wykład VI Teledetekcja 2. Remote sensing methods based on multispectral satellite images (passive methods)

FOTOGRAMETRIA I TELEDETEKCJA

Wstępne przetwarzanie danych hiperspektralnych Tatr Wysokich

Kompleksowy monitoring dynamiki drzewostanów Puszczy Białowieskiej z wykorzystaniem danych teledetekcyjnych

Nowe metody badań jakości wód wykorzystujące technikę teledetekcji lotniczej - przykłady zastosowań

TELEDETEKCJA W MIEŚCIE CHARAKTERYSTYKA SPEKTRALNA RÓŻNYCH POKRYĆ DACHÓW, CZYLI ZMIANA FACHU SKRZYPKA NA DACHU

Teledetekcja w inżynierii środowiska

Sylwia A. Nasiłowska , Warszawa

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

ZAŁ. 2 - WARUNKI UDZIAŁU W POSTĘPOWANIU

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Określenie składu gatunkowego Puszczy Białowieskiej z wykorzystaniem danych hiperspektralnych

Menu. Badania temperatury i wilgotności atmosfery

Dane teledetekcyjne. Sławomir Królewicz

Geoinformacja - Interpretacja danych teledetekcyjnych. Ćwiczenie I

Teledetekcja w kartografii geologicznej. wykład I

Bartosz Kulawik Koordynator Projektu Centrum Badań Kosmicznych PAN Zespół Obserwacji Ziemi

Potencjał wysokorozdzielczych zobrazowań Ikonos oraz QuickBird dla generowania ortoobrazów.

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

c) Sprawdź, czy jest włączone narzędzie Image classification. Jeśli nie, to je włącz: Customize Toolbars Image Classification

PL B1. OPEGIEKA SPÓŁKA Z OGRANICZONĄ ODPOWIEDZIALNOŚCIĄ, Elbląg, PL BUP 09/17

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Podstawy przetwarzania obrazów teledetekcyjnych. Format rastrowy

TELEDETEKCJA Z ELEMENTAMI FOTOGRAMETRII WYKŁAD 10

Zróżnicowanie wskaźników teledetekcyjnych i biometrycznych

Analiza spektralna widma gwiezdnego

Analiza składowych głównych. Wprowadzenie

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

Analiza wykonalności dla wskaźnika: zmiany obszarów użytkowanych rolniczo

Charakterystyka danych teledetekcyjnych jako źródeł danych przestrzennych. Sławomir Królewicz

Teledetekcja wsparciem rolnictwa - satelity ws. dane lotnicze. rozwiązaniem?

2. Dane optyczne: LANDSAT, Sentinel- 2.

PODSTAWY BARWY, PIGMENTY CERAMICZNE

Archiwum Fotogrametrii, Kartografii i Teledetekcji Vol. 9,1999, s ISBN

Wybrane zagadnienia w pracy z danymi rastrowymi w ArcGIS Marcin Paź Esri Polska

Spis treści CZĘŚĆ I POZYSKIWANIE ZDJĘĆ, OBRAZÓW I INNYCH DANYCH POCZĄTKOWYCH... 37

Ćwiczenie Nr 11 Fotometria

Oferta produktowa Zakładu Teledetekcji

REMBIOFOR Teledetekcja w leśnictwie precyzyjnym

Zmienne zależne i niezależne

Sentinel Playground. Aplikacja dostępna jest pod adresem internetowym: Ogólne informacje o aplikacji

Przekształcenia punktowe

Klasyfikacja gatunków drzewiastych Karkonoskiego Parku Narodowego z użyciem lotniczych danych hiperspektralnych APEX oraz Support Vector Machines

Analiza wykonalności dla wskaźnika: dostępność obszarów pod zabudowę

Sprawdzenie narzędzi pomiarowych i wyznaczenie niepewności rozszerzonej typu A w pomiarach pośrednich

Widmo promieniowania

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

LABORATORIUM METROLOGII

7. Metody pozyskiwania danych

Geoinformacja Interpretacja danych teledetekcyjnych. XIII. Obliczenie indeksu wegetacji NDVI

Teledetekcja w ochronie środowiska. Wykład 4

Aerotriangulacja. 1. Aerotriangulacja z niezależnych wiązek. 2. Aerotriangulacja z niezależnych modeli

Przygotowała Elżbieta Pastucha na podstawie CityGML OGC Standard for Photogrammetry by Thomas H. Kolbe, Claus Nagel, Alexandra Stadler

Ocena przydatności obrazów hiperspektralnych APEX oraz maszyn wektorów nośnych (SVM) do klasyfikacji roślinności subalpejskiej i alpejskiej Karkonoszy

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Pattern Classification

Laboratorium Optyki Falowej

Teledetekcja w ochronie środowiska. Wykład 1

Analiza głównych składowych- redukcja wymiaru, wykł. 12

SINGLE-IMAGE HIGH-RESOLUTION SATELLITE DATA FOR 3D INFORMATIONEXTRACTION

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

Dane najnowszej misji satelitarnej Sentinel 2 przyszłością dla rolnictwa precyzyjnego w Polsce

Podstawy Geomatyki Wykład X Image Processing I

W polskim prawodawstwie i obowiązujących normach nie istnieją jasno sprecyzowane wymagania dotyczące pomiarów źródeł oświetlenia typu LED.

Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji

Trendy nauki światowej (1)

Agnieszka Nowak Brzezińska

Identyfikacja siedlisk Natura 2000 metodami teledetekcyjnymi na przykładzie torfowisk zasadowych w dolinie Biebrzy

Uniwersytet Warszawski, Wydział Fizyki

Grafika Komputerowa Wykład 5. Potok Renderowania Oświetlenie. mgr inż. Michał Chwesiuk 1/38

Inteligentna analiza danych

Temat Zasady projektowania naziemnego pomiaru fotogrametrycznego. 2. Terenowy rozmiar piksela. 3. Plan pomiaru fotogrametrycznego

Anomalie gradientu pionowego przyspieszenia siły ciężkości jako narzędzie do badania zmian o charakterze hydrologicznym

Koncepcja pomiaru i wyrównania przestrzennych ciągów tachimetrycznych w zastosowaniach geodezji zintegrowanej

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Instytut Badawczy Leśnictwa

Analiza składowych głównych

Kwantowe własności promieniowania, ciało doskonale czarne, zjawisko fotoelektryczne zewnętrzne.

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Spis treści. Wykaz użytych oznaczeń 9. Wstęp 13

GIS w nauce. Poznań Analiza obiektowa (GEOBIA) obrazów teledetekcyjnych pod kątem detekcji przemian środowiska. mgr inż.

SPEKTROMETRIA IRMS. (Isotope Ratio Mass Spectrometry) Pomiar stosunków izotopowych (R) pierwiastków lekkich (H, C, O, N, S)

Agnieszka Nowak Brzezińska Wykład III

SPOTKANIE 2: Wprowadzenie cz. I

Elementy statystyki wielowymiarowej

Temat ćwiczenia: Zasady stereoskopowego widzenia.

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część


Analizy środowiskowe i energetyka odnawialna

MICRON3D skaner do zastosowań specjalnych. MICRON3D scanner for special applications

ANALIZA DOKŁADNOŚCI PODSTAWOWYCH PRODUKTÓW FOTOGRAMETRYCZNYCH UZYSKANYCH Z ZOBRAZOWAŃ POZYSKANYCH TRZYLINIJKOWĄ CYFROWĄ LOTNICZĄ KAMERĄ ADS40

7. Wyznaczanie poziomu ekspozycji

Aplikacje Systemów. Nawigacja inercyjna. Gdańsk, 2016

Analiza korespondencji

ZDALNA REJESTRACJA POWIERZCHNI ZIEMI

Teoria światła i barwy

Transkrypt:

UNIWERSYTET WARSZAWSKI Wydział Geografii i Studiów Regionalnych Adriana Marcinkowska-Ochtyra Ocena przydatności obrazów hiperspektralnych APEX oraz maszyn wektorów nośnych (SVM) do klasyfikacji roślinności subalpejskiej i alpejskiej Karkonoszy Rozprawa doktorska w zakresie nauk o Ziemi dyscyplina geografia Rozprawa doktorska przygotowana pod kierunkiem: dr. hab. Bogdana Zagajewskiego dr Anny Jarocińskiej Warszawa 26

Oświadczenie autora rozprawy: Świadoma odpowiedzialności prawnej oświadczam, że niniejsza praca dyplomowa została napisana przez mnie samodzielnie i nie zawiera treści uzyskanych w sposób niezgodny z obowiązującymi przepisami. Oświadczam również, że przedstawiona praca nie była wcześniej przedmiotem procedur związanych z uzyskaniem doktoratu....... data i podpis autora rozprawy Oświadczenie promotorów rozprawy: Oświadczam, że niniejsza praca została przygotowana pod moim kierunkiem i stwierdzam, że spełnia ona warunki do przedstawienia jej w postępowaniu doktorskim. Tekst rozprawy został sprawdzony w systemie plagiat.pl....... data i podpis promotora rozprawy...... data i podpis promotora rozprawy

słowa kluczowe: APEX, Karkonosze, klasyfikacja, maszyny wektorów nośnych, roślinność subalpejska i alpejska keywords: APEX, Giant Mountains, classification, Support Vector Machines, subalpine and alpine vegetation Abstract Plant species and communities have specific properties, which can be analysed using hyperspectral remote sensing. Large number of narrow, contiguous, spectral bands at high spatial and spectral resolution allows to identify and analyse vegetation communities. The aim of the study was to classify subalpine and alpine vegetation communities based on APEX hyperspectral images using Support Vector Machines (SVM). The study area covers the subalpine and alpine vegetation zone of the Giant Mountains in Poland and Czechia. The APEX data characterized by 288 bands in the wavelength range 38.5-25 nm and the spatial resoultion of 3.2 m were acquired on th September 22 by the DLR Braunschweig (Germany) in the framework of the HyMountEcos (EUFAR) project. APEX data were calibrated radiometrically and corrected geometrically and atmospherically at VITO (Belgium) facilities. After that the dimensionality reduction using three different methods, involving Principal Component Analysis and Minimum Noise Fraction methods and spectral band selection approach, was performed. As reference the vector map of nonforest vegetation distribution at the : scale elaborated by Wojtuń and Żołnierz (22) and field mapping were used. Based on reference vegetation map, 2-cm resolution orthophotomap and terrain validation performed in 23 and 24 using the GPS Trimble GeoXT receiver training and validation patterns were collected. Support Vector Machines were optimised on test areas near Szrenica and Mały Staw using different kernel functions, parameters, training/validation sample sets and different number of classes. Finally, classification was performed on whole area of Giant Mountains above 2 m a.s.l., covering APEX flightline. As a result, post classification maps of 24 classes of subalpine and alpine vegetation were obtained. Validation samples allowed to assess the total, user, producer accuracies, kappa coefficient and error matrix. Overall accuracy for whole Giant Mountain area was 85.5%, kappa was.84, also accuracies for each class of vegetation communities were high 7/24 classes were classified of more than 8% of producer accuracy. The highest accuracies achieved large, homogeneous classes (Carici (rigidae)- Festucetum airoidis, Carici (rigidae)-nardetum, Calamagrostion, Molinia caerulea), the lowest classes represented by smaller training sample sets, less homogeneous and difficult to identify because of the small areas, usually shaded (Adenostyletum alliariae, Salicetum lapponum). The results show that Imaging Spectroscopy and used methods are useful for the classification of the dominant plant communities of mountain areas.

Pracę tę dedykuję dwóm osobom, których (już lub jeszcze) nie ma na tym świecie: mojej Babci, która odeszła na początku tej przygody, oraz mojemu Synkowi, który do mnie dołączy po jej zakończeniu.

Spis treści Wstęp.... Teledetekcja hiperspektralna...5.. Założenia teoretyczne...5.2. Pozyskiwanie i przetwarzanie danych hiperspektralnych...7.2.. Pozyskiwanie obrazów...7.2.2. Korekcja geometryczna i atmosferyczna...2.2.3. Redukcja wymiarowości danych...23.2.3.. Analiza głównych składowych (PCA)...24.2.3.2. Transformacja MNF...25.2.3.3. Wybór kanałów spektralnych...26.3. Airborne Prism EXperiment (APEX)...26 2. Klasyfikacja danych teledetekcyjnych...3 3. Maszyny wektorów nośnych (SVM)...35 4. Wykorzystanie danych hiperspektralnych do klasyfikacji roślinności...42 5. Obszar i obiekt badań...5 5.. Warunki abiotyczne...52 5.2. Roślinność subalpejska i alpejska Karkonoszy...54 6. Metodyka pracy...68 6.. Pozyskanie i przetwarzanie danych hiperspektralnych APEX...69 6... Wstępne przetwarzanie obrazów...7 6..2. Redukcja przestrzeni spektralnej...75 6.2. Klasyfikacja danych hiperspektralnych APEX...77 6.2.. Dane referencyjne...78 6.2.2. Wybór wzorców do klasyfikacji i weryfikacji...79 6.2.3. Klasyfikacja przy użyciu maszyn wektorów nośnych (SVM)...82 6.2.4. Weryfikacja i ocena jakości klasyfikacji...84 7. Wyniki...87 7.. Wyniki optymalizacji i testowania algorytmu klasyfikacji...88 7.2. Wyniki klasyfikacji roślinności wysokogórskiej Karkonoszy...93 8. Przydatność SVM i obrazów hiperspektralnych do klasyfikacji roślinności...3 8.. Dyskusja wyników...3 8.2. Trudności w klasyfikacji zbiorowisk roślinnych...27 8.3. Zalety zastosowanych badań...3 9. Podsumowanie i wnioski...36 Podziękowania...4 Literatura...43 Źródła internetowe...53 Spis rycin...54 Spis tabel...56

Wstęp Ekosystemy górskie są ważnym wskaźnikiem zmian klimatycznych (Körner 995). Roślinność górska zmienia się na niewielkich odległościach od lasów liściastych przez bory szpilkowe, zarośla kosodrzewiny, zbiorowiska murawowe do zbiorowisk o strukturze kępkowej ze znacznym udziałem mszaków i porostów (Kozłowska 28). O występowaniu i rozmieszczeniu górskich zbiorowisk roślinnych decyduje wzniesienie nad poziom morza, ekspozycja, spadki terenu, podłoże, a także stopień rozwoju i wilgotność gleb, długość sezonu wegetacyjnego czy zaleganie pokrywy śnieżnej (Żołnierz, Wojtuń 23, Piękoś-Mirkowa, Mirek 996). W ciepłych okresach granice pięter roślinnych przesuwają się ku wyżej położonym obszarom, powodując ekspansję roślin pionierskich z pięter niższych, natomiast długie, mroźne zimy powodują wymarzanie najwyżej zlokalizowanych płatów, co prowadzi do obniżania się danego piętra roślinności (Sobik i in. 23). Kartowanie roślinności odbywa się najczęściej metodą Brauna-Blanqueta (965) oraz na podstawie fotointerpretacji wielkoskalowych zdjęć lotniczych. Metody te są czasochłonne, wymagają nakładów środków oraz pracy. Tradycyjne badania i monitoring roślinności wysokogórskiej są utrudnione z powodu słabej dostępności terenu, a także krótkiego okresu wegetacyjnego (Urban 25). Teledetekcja (remote sensing), a w szczególności teledetekcja hiperspektralna (Imaging Spectroscopy) 2, dostarcza odpowiednich danych oraz narzędzi, które z powodzeniem są stosowane w analizach środowiskowych, do monitoringu m.in. pokrycia terenu (Pal, Mather 24, Petropoulos i in. 22), typów i stanu upraw rolniczych (Galvão i in. 26, Olesiuk, Zagajewski 28), muraw naturalnych (Möckel i in. 24, Psomas i in. 2) czy lasów (Ghosh i in. 24, Raczko i in. 24). Za pomocą lotniczych i satelitarnych sensorów można rejestrować widmo elektromagnetyczne w zakresie 4-25 nm (zakres widzialny, podczerwień bliska oraz środkowa), 8-5 µm (podczerwień termalna) oraz 3-3 mm (zakres mikrofal, Richards, Jia 25). Fale elektromagnetyczne interferują z molekułami w sposób selektywny tworząc unikatowe charakterystyki spektralne analizowanych obiektów. W przypadku roślinności odzwierciedlają one stan fizjologiczny oraz budowę anatomiczną i morfologiczną poszczególnych gatunków, np. barwniki fotosyntetycznie czynne, struktury komórkowe, zawartość wody, nutrientów, lignin, celulozy w roślinach (Jensen 983). W przypadku złożonych obiektów, których teledetekcja jest nauką o pozyskiwaniu informacji o obiektach z pomiarów wykonanych z dala od obiektów, pozostając bez kontaktu z nimi (Davis i in. 978). 2 pozyskiwanie informacji w setkach kanałów spektralnie ciągłych (Goetz i in. 985), por. rozdział.

wielkość jest mniejsza niż pojedynczy piksel, odbite promieniowanie tworzy miksele 3, które znacząco utrudniają interpretację obrazu, gdyż piksel reprezentuje różne obiekty. W takich sytuacjach na obrazach hiperspektralnych stosuje się metody podpikselowe, które pozwalają ocenić zawartość materiałów składających się na dany piksel np. metoda spektralnego rozmieszania pikseli (Spectral Unmixing, Keshava, Mustard 22). Dzięki mnogości kanałów spektralnych zarejestrowanych w wielu wąskich zakresach promieniowania elektromagnetycznego, obrazy hiperspektralne przyczyniają się do wsparcia tradycyjnego kartowania roślinności poprzez półautomatyczne metody klasyfikacji poszczególnych gatunków, czy zbiorowisk roślinnych (Zhang, Xie 23). Wykorzystanie do tego celu danych wielospektralnych, charakteryzujących się szerokością kanałów spektralnych od 8 do 2 nm (Goetz i in. 985) staje się pewnym ograniczeniem, gdyż cenne informacje dotyczące wartości współczynnika odbicia spektralnego są tracone, ze względu na ich uśrednienie (Kumar i in. 2). Główne problemy badawcze w klasyfikacji obrazów hiperspektralnych polegają na optymalnym przetworzeniu obrazów, doborze statystycznie reprezentowalnych wzorców terenowych oraz optymalizacji metod i parametrów klasyfikacji obrazu. Przed przystąpieniem do analiz obrazu lotniczego należy przeprowadzić szereg procedur korekcyjnych (preprocessing) eliminujących wpływ atmosfery (Schlaepfer i in. 28, Sterckx i in. 26) oraz zniekształcenia geometryczne wynikające z ruchu samolotu podczas rejestracji (Schlaepfer, Richter 22, Vreys i in. 26). W kolejnym etapie pracy niezbędne jest pozyskanie wzorców przestrzennych i spektralnych analizowanych obiektów, np. badania terenowe podczas wykonywania zobrazowania. Na podstawie zgromadzonych wzorców w postaci pikseli treningowych i weryfikacyjnych przeprowadzana jest klasyfikacja obrazu. W przypadku nadzorowanych metod parametrycznych, dla których średnia i odchylenie standardowe w obrębie poligonów są podstawą klasyfikacji, zakłada się, że wartości te odpowiadają rozkładowi normalnemu (Jakomulska 998, Richards, Jia 25). Wprowadza to pewne ograniczenia, gdyż metody te sprawdzają się w przypadku klasyfikacji jednorodnych spektralnie klas, co nie jest gwarantowane przez dane hiperspektralne (Zhang, Xie 23). Klasy o bardziej złożonej charakterystyce spektralnej różnią się od rozkładu normalnego, gdyż wzorce mogą zawierać sygnatury spektralne odpowiadające innym klasom (np. pojedyncze kamienie), doprowadzając do błędów (Olesiuk, Zagajewski 28). Wielu badaczy do ekstrakcji obiektów z obrazów hiperspektralnych używa metod bazujących na pikselach czystych 3 mieszane piksele, czyli piksele zawierające odpowiedź spektralną wielu obiektów zobrazowanych przez dany piksel. 2

spektralnie, za pomocą których klasyfikowano m.in. minerały (Kruse i in. 23, van der Meer 26), obszary zurbanizowane (Hegde i in. 24) czy gatunki roślin (Dehaan i in. 27, Zomer i in. 29). W przypadku zbiorowisk roślinnych, na które składają się grupy pojedynczych gatunków, wymagałoby to pozyskania charakterystyk spektralnych dla każdego z nich i właściwego statystycznie rozmieszaniu wpływu poszczególnych cech spektralnych. Kłóci się to z założeniami metod, których algorytmy bazują na idei istnienia tylko jednej charakterystyki spektralnej reprezentującej daną klasę spektralną analizowanego piksela obrazu (Zhang, Xie 23). Równoległą metodą klasyfikacji jest klasyfikacja obiektowa (object-based classification, OBIA, Blaschke, Strobl 2). Podejście to jest przydatne w przypadku obrazów wysokorozdzielczych przestrzennie (nie wymaga się dużej rozdzielczości spektralnej obrazu), należy jednak przeprowadzić prawidłową segmentację obrazu. Jest to skomplikowane i często wymaga bardziej indywidualnego podejścia, co z punktu widzenia automatyzacji pracy, szczególnie pożądanej w przypadku badań monitoringowych, staje się pewnym ograniczeniem. Mając do dyspozycji dane wysokorozdzielcze zarówno przestrzennie, jak i spektralnie oraz radiometrycznie, do szczegółowych klasyfikacji roślinności z powodzeniem wykorzystywane są metody nieparametryczne, takie jak sztuczne sieci neuronowe (Wang i in. 26, Zagajewski 2) czy metody uczenia maszynowego (Camps-Valls i in. 24, Chan i in. 22), które pozwalają na osiąganie wysokich dokładności. W niniejszej pracy postawione zostały trzy cele: poznawczy, mający za zadanie opracowanie i przetestowanie algorytmu klasyfikacji wysokorozdzielczych hiperspektralnych danych APEX do klasyfikacji roślinności, aplikacyjny, którego efektem jest opracowanie mapy rozkładu dominujących zbiorowisk roślinnych piętra subalpejskiego i alpejskiego Karkonoszy, metodyczny, pozwalający na określenie przydatności lotniczych zobrazowań hiperspektralnych i metody maszyn wektorów nośnych (Support Vector Machines SVM) do klasyfikacji roślinności subalpejskiej i alpejskiej Karkonoszy. Realizacja celów pracy możliwa jest dzięki zastosowaniu licznych procedur związanych z przetwarzaniem i klasyfikacją obrazu, a także analiz poklasyfikacyjnych. Do problemów badawczych pracy należy identyfikacja dominujących zbiorowisk roślinnych na terenie polskich oraz czeskich Karkonoszy (dokonana poprzez wybór reprezentatywnych powierzchni badawczych, możliwych do zidentyfikowania na obrazie) oraz optymalizacja procedur przetwarzania obrazu hiperspektralnego APEX. Jako dane 3

referencyjne do klasyfikacji wykorzystano mapę roślinności nieleśnej (Wojtuń, Żołnierz 22) oraz badania terenowe z trzech kampanii pomiarowych (wrzesień 22, sierpień 23 i 24), podczas których kartowane były dominujące płaty poszczególnych zbiorowisk roślinnych z dokładnością do około 6-8 cm za pomocą odbiornika GPS Trimble GeoXT. Z wyborem powierzchni badawczych związany jest bezpośrednio sposób utworzenia wzorców do klasyfikacji oraz weryfikacji uzyskanych wyników. Klasyfikatory nadzorowane są wrażliwe na zastosowane dane treningowe, a dokładność klasyfikacji może zmieniać się w zależności od zastosowanego zestawu danych (Ghosh i in. 24). Ważny jest więc sposób ich przygotowania tak, aby wyniki były wiarygodne statystycznie. Przygotowanie danych hiperspektralnych do klasyfikacji opiera się na wykonaniu korekcji danych (nadaniu georeferencji obrazom oraz usunięciu z nich wpływu atmosfery). Ważnym elementem jest opracowanie algorytmu wyboru najlepszych jakościowo kanałów zobrazowania hiperspektralnego, przy użyciu metod redukcji przestrzeni spektralnej. Ostatnim z problemów badawczych jest wybór odpowiedniej metody klasyfikacji dostosowanej do charakteru i skali zjawiska, a także procedur poklasyfikacyjnych, prowadzących do uzyskania wyniku w postaci opracowania kartograficznego oraz raportu statystycznej dokładności wydzielonych zbiorowisk roślinnych względem rozpoznania terenowego. Raport ten przedstawiany jest w postaci macierzy błędów ze statystykami dotyczącymi dokładności całkowitej klasyfikacji i współczynnika kappa, mówiącymi o dokładności dopasowania klas dla całego obrazu, oraz dokładności producenta i użytkownika obliczonych dla każdego ze sklasyfikowanych zbiorowisk roślinnych. 4

. Teledetekcja hiperspektralna.. Założenia teoretyczne Spektroskopia definiowana jest jako dział fizyki, zajmujący się badaniem cząsteczek, atomów i jąder atomowych na podstawie analizy widma emitowanego lub pochłanianego przez nie promieniowania elektromagnetycznego (Słownik języka polskiego 996). Obejmuje badanie właściwości obiektów za pomocą informacji zapisanej w poszczególnych długościach fali i interakcji promieniowania elektromagnetycznego z materią (Green i in. 998). Początki spektroskopii związane są z eksperymentami I. Newtona, który w roku 672 ogłosił nową teorię światła i barw (Shapiro 984), przedstawiającą koncepcję rozproszenia światła. Spowodowało to przełom w optyce i badaniach widma, które jako termin (spectrum) zostało również przez niego upowszechnione. Korpuskularna 4 teoria Newtona była stopniowo zastępowana przez teorię falową, prowadzącą do opracowania równań opisujących fale elektromagnetyczne przez J. Maxwella (873). Terminu spektroskopia pierwszy raz użyto pod koniec XIX wieku i wtedy wyodrębniła się ona jako część optyki dotycząca podstaw fizyki atomowej i molekularnej (Born, Wolf 999). W latach 85-859 prowadzone były niezależne badania nad aparatem spektroskopowym, które zaowowcowały wynalezieniem trzech typów spektroskopów przez J. Fraunhofera oraz typu spektroskopu Kirchhoffa i Bunsena (Lockyer 873, Rodzeń 22). Spektroskopia od swego początku była ściśle powiązana z astronomią, w roku 85 Fraunhofer badał widmo Słońca, a następnie Syriusza i innych gwiazd (Heller 978). W widmie Słońca odkrył on czarne prążki, nazwane w późniejszym czasie liniami Fraunhofera. Bunsen i Kirchhoff w roku 859 określili ich naturę, wyjaśniając, że powstają w wyniku pochłaniania przez atmosferę fal świetlnych o pewnej długości. Odkrycie to było początkiem analiz spektralnych, które bazowały na rozpoznaniu, że każdy gazowy pierwiastek chemiczny ma charakterystyczne cechy spektralne (Born, Wolf 999). Metodę analizy widmowej do ustalania składu chemicznego gwiazd wprowadził w 863 r. W. Huggins (Heller 978). Spektroradiometria jest technologią pomiaru mocy promieniowania optycznego w wąskich, ciągłych przedziałach długości fali. Jej ilość wyrażana jest w natężeniu napromienienia (irradiance, najczęściej w Wm -2 nm - ) oraz w luminancji energetycznej, określanej także jako radiancja (radiance, w Wsr - m -2 nm -, Schaepman 29). Iloraz natężenia promieniowania odbitego od obiektu do natężenia napromienienia padającego na obiekt określany jest jako współczynnik odbicia (reflectance). Pomiędzy współczynnikiem 4 korpuskularny fiz. cząsteczkowy, drobinowy (łac. corpusculum ciałko. Słownik języka polskiego 996).

odbicia a długością fali elektromagnetycznej istnieje ścisła zależność, dlatego w teledetekcji powszechnie stosowane jest pojęcie współczynnika odbicia spektralnego (Weidner, Hsia 987). Wartości współczynnika odbicia przybierają wartość od do i w postaci graficznej prezentowane są w funkcji długości fali, tworząc krzywą odbicia spektralnego (spectral curve). Ryc.. Koncepcja spektroskopii obrazowej: spektrum zmierzone dla każdego elementu przestrzennego na obrazie (Green i in. 998) Oryginalną definicję spektrometrii obrazowej (imaging spectrometry), za pomocą której pozyskiwane są obrazy nazywane hiperspektralnymi wprowadzili Goetz, Vane, Solomon i Rock (985), określając ją jako pozyskiwanie obrazów w setkach spektralnie ciągłych kanałów, dla których możliwe jest określenie widma promieniowania każdego piksela. Bardziej szczegółową definicję przytoczyli Schaepman i in. (26) twierdząc, iż spektrometria obrazowa, nazywana także spektroskopią obrazową (imaging spectroscopy), czy obrazowaniem hiperspektralnym (hyperspectral imaging) jest pasywną techniką teledetekcyjną wykorzystywaną do równoczesnego pozyskiwania zarejestrowanych przestrzennie obrazów w wielu ciągłych spektralnie kanałach, mierzoną w jednostkach radiancji ze zdalnie operowanych platform. Początki powstawania spektrometrii obrazowej zakładały pozyskiwanie informacji od do 2 ciągłych kanałów, natomiast w obecnie funkcjonujących sensorach pozyskiwane jest ich ponad 6

4 5. Dzięki danym hiperspektralnym możliwe jest pozyskanie dokładnych charakterystyk spektralnych dla każdego elementu obrazu (piksela, ryc. ). Molekuły i cząsteczki środowiska lądowego, wodnego i atmosferycznego oddziałują z energią słoneczną przez procesy absorpcji, odbicia i rozpraszania, a spektrum pozwala na identyfikację materiałów i obiektów, które nie mogą być zbadane przez sensory wielospektralne (Goetz i in. 985, Green i in. 998). Na podstawie badań właściwości absorpcyjnych różnych materiałów możliwych do zidentyfikowania, za przydatną i wystarczającą w spektroskopii obrazowej uznaje się szerokość kanałów do nm (Hunt 977, Goetz i in, 985)..2. Pozyskiwanie i przetwarzanie danych hiperspektralnych.2.. Pozyskiwanie obrazów Dane teledetekcyjne są pozyskiwane z poziomu satelitarnego, lotniczego i naziemnego. Każdy z tych poziomów ma korzyści i ograniczenia. Systemy satelitarne zapewniają większą ekonomię pozyskania danych, szczególnie, jeśli mają być przeznaczone do długotrałego monitoringu. W przypadku danych satelitarnych naturalnie wyeliminowany jest wpływ ruchu urządzenia w niejednorodnej atmosferze, platformy satelitarne są stabilne, dzięki czemu proces przeprowadzania korekcji geometrycznej przebiega w ich przypadku znacznie szybciej niż na danych lotniczych (Schlaepfer i in. 998). Charakteryzuje je jednak dłuższa droga promieniowania między obiektem a detektorem, niższa rozdzielczość przestrzenna 6 niż w przypadku sensorów lotniczych, jak również niższy stosunek sygnału do szumu (signal to noise ratio, SNR). Z tego powodu lotnicze sensory hiperspektralne są obecnie zdecydowanie bardziej popularne niż satelitarne. Zobrazowania naziemne wykonuje się sporadycznie, służą one najczęściej jako dane weryfikacyjne złożonych spektralnie obiektów. Zatem do szczegółowych analiz, bądź opisu niewielkich obszarów, gdzie wymagana jest wyższa szczegółowość terenowa (na poziomie -4 m rozdzielczości przestrzennej), powszechnie stosuje się dane pozyskane z pułapu lotniczego (Kempeneers 27). Teledetekcja hiperspektralna poziomu lotniczego rozpoczęła swój rozwój od wczesnych lat 97. ubiegłego wieku. Pierwszy hiperspektralny spektrometr nieobrazujący, wykonujący profile spektralne wzdłuż linii lotu, o nazwie GERS (Geophysical Environmental Research Spectroradiometer) opracowany został w 98 r. 7 5 skaner hiperspektralny HySpex rejestruje promieniowanie w 45 kanałach. 6 wyłączając satelity do zadań militarnych. 7 Geophysical Environmental Research Company. 7

Pozyskiwał dane w 64 kanałach spektralnych o szerokości 8,6 nm, w zakresie,96-2,5 µm i służył głównie do analiz geologicznych, w tym kartowania minerałów (Kruse i in. 999). W tym samym roku w Kanadzie 8 zbudowano pierwszy spektrometr obrazujący FLI (Fluorescence Line Imager), rejestrujący obraz w 288 kanałach spektralnie ciągłych w zakresie,4-,8µm, o szerokości 2,6 nm (Rock i in. 988). Służył do kartowania wód i lądów, głównie w celu analiz fluorescencji chlorofilu (Hollinger i in. 987). W latach 984-986 w NASA 9 powstał skaner AIS (Airborne Imaging Spectrometer), obrazujący w 28 kanałach spektralnych w zakresie,2-2,4µm. AIS- rejestrował 32 piksele w linii, a szerokość kanałów wynosiła 9,3 nm, natomiast jego nowsza wersja z roku 986 (AIS-2) rejestrowała 64 piksele, a szerokość kanałów zarejestrowanych w zakresie,8-2,4 µm wynosiła,6 nm (Vane i in. 984). Również w roku 984 w NASA (Goetz i in. 985) zaczęto prace nad nowym typem sensora hiperspektralnego. Powstał spektrometr obrazujący AVIRIS (Airborne Visible/Infra-Red Imaging Spectrometer), który osiągnął operacyjność w roku 987. Obrazy początkowo pozyskiwano w zakresie,4-2,45 µm w 224 kanałach o szerokości nm. Wielkość obrazowanego piksela wahała się, w zależności od rodzaju i wysokości samolotu, na którym instrument był zainstalowany (Porter, Enmark 987). Dane AVIRIS przyczyniły się do rozpowszechnienia teledetekcji hiperspektralnej, początkowo w Stanach Zjednoczonych, a następnie na całym świecie. W spektrometrii obrazowej do przedstawienia relacji pomiędzy zakresem przestrzennym a spektralnym wykorzystywana jest wizualizacja danych w trójwymiarze w postaci tzw. data cube (ryc. 2). Sposób ten tworzy serie warstw obrazu, gdzie każda z nich jest przedstawiona w indywidualnym zakresie długości fali. Obraz widoczny na wierzchu w całości jest trzykanałową kompozycją barw RGB. 8 Department of Fisheries and Oceans. 9 Jet Propulsion Laboratory. złożenie trzech kanałów zarejestrowanych w różnych zakresach spektralnych oraz przyporządkowanie im filtrów barwnych: czerwonego (Red), zielonego (Green) i niebieskiego (Blue). Zrzutowanie na wspólny ekran pozwala na utworzenie obrazu barwnego. 8

Ryc. 2. Wizualizacja danych hiperspektralnych (data cube) ze skanera APEX (Szrenica, Karkonosze Zachodnie). Osie x-y oznaczają wymiar przestrzenny danego kanału, oś z przedstawia wymiar spektralny danych (kompozycja RGB 38 5 6, odpowiadająca kolejno długościom fali: 64 nm, 547 nm, 47 nm). Pozyskiwanie danych hiperspektralnych przeprowadzane jest na różne sposoby, w zależności od technologii wykorzystywanych w sensorach. Najogólniej można je podzielić na sensory typu whiskbroom, pozyskujące serie pojedynczych pikseli, typu pushbroom pozyskujące serie linii, a także typu staring, czy filter wheel, czyli pozyskujące pełnoklatkowe obrazy (Schaepman 29, ryc. 3). Ryc. 3. Schemat przedstawiający trzy główne sposoby pozyskiwania danych: piksele pozyskiwane przez sensory typu whiskbroom, linie pushbroom, obrazy filter wheel systems (Schaepman 29, zmodyfikowane) 9

Najpopularniejszymi sensorami hiperspektralnymi są instrumenty typu whiskbroom oraz pushbroom. Instrumenty typu whiskbroom wykorzystują "zerowymiarowe" pole widzenia (Field of View, FOV), skanując obiekty zarówno wzdłuż kierunku lotu (along track), jak i w poprzek (across track), przez co określane są jako omiatające (Sellar in. 22). Należą do nich m.in. skaner AVIRIS (Green i in. 998) czy DAIS795 (Digital Airborne Imaging Spectrometer, Chang i in. 993). Instrumenty typu pushbroom skanują pole widzenia w jednym wymiarze, w kierunku linii lotu, dlatego określane są jako przepychające, tworząc zeskanowane linie przylegających do siebie, bądź nieznacznie nakładających się pikseli (Sellar in. 22) m.in. CASI (Compact Airborne Spectral Imager, Babey, Anger 989), czy APEX (Airborne Prism EXperiment, Itten i in. 997)..2.2. Korekcja geometryczna i atmosferyczna 2 Dane pozyskiwane z pułapu lotniczego podczas rejestracji ulegają wielu zniekształceniom, spowodowanym brakiem możliwości utrzymania stałej linii lotu. Jest to szczególnie istotne w przypadku skanowania terenu piksel po pikselu, bądź linijka po linijce, co prowadzi do przesunięć fragmentów obrazów. Obrazy te wymagają wykonania różnego rodzaju korekcji, prowadzących do usunięcia zaburzeń sygnału, który dociera do detektora, jak również do wyeliminowania z nich wpływu atmosfery. Korekcja geometryczna może być przeprowadzona w sposób parametryczny oraz nieparametryczny (Roy i in. 997). Podejście nieparametryczne wymaga identyfikacji obiektów na obrazie, z użyciem charakterystycznych terenowych punktów kontrolnych, określanych jako ground control points (GCPs). Zależności przestrzenne pomiędzy odpowiadającymi sobie punktami są uznawane za reprezentatywne dla zniekształceń obrazu i wykorzystuje się je do przeliczania położenia pikseli pomiędzy korygowanym obrazem a mapą, czy innym obrazem. Metodę tę można stosować w odniesieniu do wszystkich rodzajów zniekształceń geometrycznych, jednak wymaga ona zgromadzenia punktów GCP, które jest czasochłonne i może być utrudnione przez niską dokładność pomiarów bądź jednorodność terenu. W takim przypadku szersze możliwości automatyzacji procesu i większą niezależność od danych terenowych daje stosowanie metod parametrycznych, które wymagają informacji dotyczącej geometrii sensora i elementów orientacji zewnętrznej, określających okoliczności pozyskania obrazu. Integrację parametrów pozyskanych z systemów GPS oraz systemów inercyjnych (Inertial Navigation System INS), nazywaną georefencją bezpośrednią (direct georeferencing) elementy liniowe, będące współrzędnymi środka rzutów oraz elementy kątowe, określające położenie osi optycznej skanera względem osi układu odniesienia.

charakteryzuje wysoka dokładnością i rzetelność ze względu na pomiar bezpośredni (Cramer i in. 2). Parametryczną metodą przetwarzania obrazu jest także ortorektyfikacja (parametric orthorectification), prowadząca do przekształcenia obrazu z rzutu środkowego na rzut ortogonalny, przy użyciu informacji dotyczącej rzeźby terenu, pochodzącej z danych wysokościowych, np. Numerycznego Modelu Terenu (Schlaepfer, Richter 22). Na podstawie wymienionych informacji rejestrowany jest każdy piksel obrazu, po czym nadawany jest mu odpowiedni układ współrzędnych i określana jest wielkość piksela wynikowego, a także interpolacja wartości pikseli wynikowych na podstawie jasności pikseli obrazu nieprzekształconego (resampling). Oddziaływanie atmosfery z energią promieniowania padającego oraz odbitego przyczynia się do redukcji ilości tego promieniowania w niektórych zakresach długości fal (Goetz i in. 997). Korekcja atmosferyczna obejmuje grupę procedur prowadzących do usunięcia efektów związanych z obecnością atmosfery na obserwowanym widmie. Charakterystyki spektralne danych nieskorygowanych, wyrażonych w jednostce radiancji mają przebieg krzywej natężenia napromienienia słonecznego (irradiancji) o wartościach malejących w kierunku fal dłuższych, natomiast występują pewne anomalie zakresów związanych z absorpcją i rozpraszaniem promieniowania przez atmosferę, np. 45 nm związek z parą wodną (ryc. 4). Efektem korekcji atmosferycznej jest przekształcenie surowych danych do zapisu w postaci współczynnika odbicia (reflektancji), z wyeliminowanym wpływem atmosfery. Ryc. 4. Krzywe odbicia spektralnego dla roślinności, od lewej: na obrazie APEX zapisanym w jednostce radiancji, od prawej: na obrazie po korekcji atmosferycznej, przeliczone na reflektancję 2 (oprogramowanie ENVI 5.3) 2 kanałom spektralnym zawierającym szum związany z absorpcją przez parę wodną w procesie korekcji przypisano wartość (por. podrozdział 6..). 2

W przypadku obrazów hiperspektralnych korekcja atmosferyczna jest dużo bardziej skomplikowana niż przy danych wielospektralnych (Schowengerdt 26). Przeprowadzenie korekcji atmosferycznej danych hiperspektralnych polega na znalezieniu rozwiązania równania, w wyniku którego otrzymywanych jest co najmniej sześć parametrów: długość fali, współczynnik odbicia od powierzchni i obiektów sąsiadujących, zawartość pary wodnej, zawartość aerozoli, wysokość i nachylenie terenu (Schlaepfer i in. 28). Przyczyną trudności w przeprowadzeniu korekcji jest m.in. znacznie wyższa rozdzielczość spektralna obrazów wąskie kanały pokrywają się z równie wąskimi zakresami absorpcji promieniowania przez cząsteczki atmosfery. Zależnie od konstrukcji sensora, środkowa długość fali poszczególnych kanałów może ulegać przesunięciu spektralnemu, w zależności od warunków, w jakich pozyskiwana jest informacja. Ma to największe znaczenie w przypadku danych pozyskiwanych z pułapu lotniczego. Ponadto, podobnie jak w przypadku korekcji geometrycznej i innych przetworzeń na oryginalnych danych hiperspektralnych, jest to procedura żmudna obliczeniowo, gdyż bierze w niej udział każdy z kanałów obrazu. Metody korekcji atmosferycznej dzielą się na względne oraz bezwzględne (Tempfli i in. 29). Względne najczęściej określane są mianem normalizacji i bazują na informacji zawartej na obrazie (np. Flat Field), bądź wykorzystują pomiary terenowe (np. Empirical Line, Hejmanowska i in. 24), natomiast bezwzględne opierają się na modelowaniu atmosfery i parametrach atmosferycznych oszacowanych lub bezpośrednich z czasu wykonywania zobrazowania (Richter, Schlaepfer 26). W przypadku korekcji danych hiperspektralnych badziej dokładne i wiarygodne są metody bezwzględne, wykorzystujące informacje pozyskane w trakcie nalotu. Korekcje te przeprowadzane są przy użyciu zaawansowanych modeli transferu promieniowania i kodów radiacyjnych, np. MODTRAN (MODerate resolution atmospheric TRANsmission program), na których bazują dedykowane korekcjom programy, np. ATCOR-4 (Richter, Schlaepfer 26). Wykonanie korekcji atmosferycznej jest istotne na obrazach pozyskiwanych dla każdego obszaru, gdyż jej nieprzeprowadzenie może prowadzić m.in. do błędów w analizach ilościowych, utrudnień porównywania radiometrycznych pomiarów naziemnych i pomiarów satelitarnych lub lotniczych, utrudnień przy porównywaniu sygnatur spektralnych, czy do obniżenia dokładności klasyfikacji. Szczególne istotne znaczenie ma korekcja atmosferyczna obrazów pozyskanych dla obszarów górskich, ponieważ w dolinach zalega więcej pary wodnej i gazów niż w wyższych partiach gór przez to charakterystyki spektralne tych samych obiektów w dolinie bądź na szczycie mogą różnić się od siebie. 22

.2.3. Redukcja wymiarowości danych Dane hiperspektralne, cechujące się występowaniem kilkuset kanałów spektralnych (np. APEX 288 kanałów, HySpex 45), pozwalają na bardzo szczegółowe analizy zobrazowanych obszarów. Jednak ta ogromna liczba kanałów i wysoka korelacja danych zapisanych w poszczególnych kanałach często prowadzi do redundancji informacji. Czas wykonywania jakiejkolwiek procedury na danych hiperspektralnych zależny jest od liczby kanałów włączanych do procesu. Im ta liczba jest większa, tym dłuższy czas przeprowadzania algorytmu. Sąsiadujące ze sobą kanały spektralne wykazują często silną korelację, co nie wpływa na zwiększenie dokładności klasyfikacji, a ma duże znaczenie dla czasu oczekiwania na wynik. W kanałach obrazów wielo- i hiperspektralnych, poza informacją spektralną często rejestrowany jest szum, wynikający m.in. z błędów sensora czy zakłóceń związanych z wpływem absorpcji przez parę wodną. Ważnym aspektem pracy z danymi hiperspektralnymi jest zatem redukcja liczby kanałów i wybór najbardziej informacyjnych. W teledetekcji hiperspektralnej wykorzystywanych jest wiele technik redukcji przestrzeni spektralnej, obejmujących zarówno algorytmy nadzorowane, uwzględniające informacje ze zbioru danych treningowych utworzonych do klasyfikacji, jak i nienadzorowane, mające na celu wydobycie istotnych informacji bez uprzedniej znajomości przynależności danego zestawu danych do konkretnej klasy, niezależne od klasyfikatora (Demarchi i in. 24). Powszechnie stosowany podział algorytmów obejmuje metody bazujące na transformacji (transformation based approach), która powoduje przekształcenie danych wielowymiarowych do przestrzeni o mniejszej liczbie wymiarów, redukując zestaw danych i eliminując informację spektralną, a także metody wyboru zmiennych (feature-selection based approach) bazujące na wyborze najważniejszych informacji w postaci kanałów spektralnych z oryginalnego zestawu danych. Liczba wykorzystywanych kanałów spektralnych jest również istotna w kontekście klasyfikacji nadzorowanej i często ma związek z liczbą pikseli treningowych. Tradycyjna klasyfikacja bazująca na parametrach statystycznych powinna wykorzystywać od do razy więcej pikseli treningowych niż liczba kanałów obrazu, w przeciwnym razie dokładność klasyfikacji maleje (Davis i in. 978). Jednak szczególnie w przypadku danych hiperspektralnych zauważalny jest tzw. efekt Hughesa (Hughes phenomena), czy inaczej przekleństwo nadwymiarowości (the curse of dimensionality, Hughes 968), w którym liczba danych terningowych powinna być równa liczbie kanałów, a zwiększanie liczby kanałów nie wpływa na dokładność klasyfikacji lub nawet powoduje jej spadek. Aspekty 23

te powodują trudności w doborze odpowiednich proporcji pomiędzy liczbą kanałów a liczbą pikseli treningowych do klasyfikacji. W pracy zdecydowano się na zastosowanie trzech metod wyboru kanałów, spośród których dwie są oparte na transformacji i służą do kompresji danych (analiza głównych składowych, PCA oraz Minimum Noise Fraction, MNF), jedna natomiast pozwala na wybór kanałów spektralnych najmniej obniżających dokładność, a przyspieszających procedurę klasyfikacji, czyniąc daną metodę aplikacyjną..2.3.. Analiza głównych składowych (PCA) Analiza głównych składowych (Principal Component Analysis, PCA) jest statystyczną metodą liniowej transformacji danych, zapoczątkowaną przez Harolda Hotellinga w 933 r. (Hotelling 933). Polega na wyznaczeniu nowej osi głównej układu współrzędnych wzdłuż największej możliwej wariancji danych, poprzez rzutowanie wartości zmiennych w przestrzeni wielowymiarowej (ryc. 5). Dzięki temu otrzymuje się nowe, nieskorelowane zmienne, nazywane głównymi składowymi (principal components). W przypadku analizy obrazów lotniczych z oryginalnych kanałów spektralnych uzyskuje się nowy zestaw kanałów (składowych głównych), zawierających najwięcej informacji. Ryc. 5. Transformacja danych z kanałów spektralnych na główne składowe (Gao 28, zmodyfikowane) Pierwsza składowa zawiera najwięcej informacji spektralnej, przyjmując najwyższą wartość wariancji. Składowa druga zawiera już mniej informacji, natomiast oś ją reprezentująca położona jest prostopadle do osi pierwszej składowej. Każda z następnych składowych niesie coraz mniej informacji spektralnej, jak również szum, dlatego do analiz wykorzystywane są składowe o największej informacyjności. 24

.2.3.2. Transformacja MNF Transformacja Minimum Noise Fraction (MNF) jest transformacją liniową analizy głównych składowych PCA wykonywaną w celu zwiększenia stosunku sygnału do szumu (Green i in. 988). Na podstawie macierzy kowariancji szumu wykonywana jest jego dekorelacja, a następnie przeprowadzana jest analiza głównych składowych, przy zastosowaniu wybielania szumu 3 (Monk i in. 994). Dzięki transformacji MNF następuje redukcja wymiarów przestrzeni spektralnej i uzyskuje się kanały spektralne uszeregowane od największej do najmniejszej wariancji. Jako pierwsze prezentowane są kanały najmniej skorelowane ze sobą, pozbawione szumów, a następnie kanały pozostałe, zawierające zakłócenia (Hejmanowska, Głowienka 24). Na podstawie macierzy kowariancji obliczana jest zawartość informacji, reprezentowana przez wartości własne (eigenvalues). Liczba kanałów po przeprowadzeniu transformacji MNF jest równa liczbie kanałów obrazu wejściowego, natomiast do dalszych przetworzeń wybierane są kanały wyselekcjonowane na podstawie linii informacyjności generowanej podczas trwania procesu (ryc. 6). Najlepsze jakościowo kanały przyjmują najwyższe wartości własne na osi Y, oś X prezentuje numery nowo utworzonych kanałów, pozbawionych szumów. Odczyt najwyższych wartości własnych dla poszczególnych kanałów MNF poprzez wskazanie wypoziomowania się linii informacyjności pozwala na wybór najbardziej przydatnych kanałów (Zagajewski 2). Ryc. 6. Wykres wartości własnych poszczególnych kanałów zobrazowania APEX w transformacji MNF (oprogramowanie ENVI 5.) 3 noise whitening, proces polegający na przekształceniu zbioru sygnałów w sygnały nieskorelowane, sprowadzając ich macierz kowariancji do postaci jednostkowej. 25

.2.3.3. Wybór kanałów spektralnych W literaturze opisanych jest wiele metod wyboru zmiennych (kanałów) do dalszych analiz. John i in. 994 przedstawiają podział na dwa modele: filter podstawowy, bazujący na selekcji danych przed treningiem na podstawie jak najlepszego rozróżnienia klas, niezależny od używanego klasyfikatora oraz wrapper "opakowany", oparty na ocenie dokładności klasyfikacji na podstawie zestawu danych weryfikacyjnych oraz zależny od klasyfikatora. Wielu badaczy stwierdza większą przydatność metod opakowanych, zaznaczając, że metody te są bardziej kosztowne obliczeniowo (Huang, Wang 26, Sikora, Piramuthu 27, Zhuo i in. 28). Dokonanie oceny dokładności wszystkich kombinacji kanałów obrazów hiperspektralnych jest bardzo czasochłonnym zadaniem, ze względu na setki potencjalnych kanałów do oceny. Metodyka wyboru kanałów w sposób sekwencyjny pozwala zredukować potrzeby obliczeniowe (Reunanen 26). W modelu wrapper rozwijane są dwa podejścia: stopniowego dodawania zmiennych do zbioru pustego (forward selection) oraz stopniowego ich odejmowania od wszystkich zmiennych (backward elimination). Metoda wyboru poprzez dodawanie zmiennych jest bardziej wydajna obliczeniowo, gdyż nie uwzględnia wszystkich zmiennych na początku działania, jednak jej wadą jest fakt, że każde dodanie nowej zmiennej może spowodować dołączenie do zestawu danych zmiennych nieistotnych (Guyon, Elisseeff 23). Metoda wyboru przez iteracyjne odejmowanie zmiennych powodujących obniżenie dokładności klasyfikacji eliminuje ten problem..3. Airborne Prism EXperiment (APEX) Pojawiające się w latach 99. koncepcje sensorów satelitarnych wykorzystujących spektroskopię jako główne podejście do obserwacji zainspirowały przyrodników do budowy nowej generacji spektrometru obrazującego, który byłby optymalnym narzędziem do badania środowiska (Itten i in. 997). Szwajcarsko-belgijski projekt skanera hiperspektralnego APEX (Airborne Prism Experiment) był odpowiedzią na potrzebę Europejskiej Agencji Kosmicznej (ESA) posiadania lotniczego spektrometru mającego pełnić funkcję prekursora w dziedzinie badań kosmicznych PRISM 4. Źródłem finansowania tego przedsięwzięcia był program PRODEX 5, w którym kraje członkowskie ESA opracowywały własne instrumenty (Schaepman i in. 25). 4 Process Research by an Imaging Space Mission. Projekt instrumentu satelitarnego zakładał pozyskiwanie danych w dwóch głównych zakresach długości fali: zakresie widzialnym i podczerwieni krótkofalowej (,45-2,35 µm), jak również w podczerwieni termalnej (8-2,3 µm). Rozdzielczość danych w nadirze miała wynosić 5 metrów (Itten i in. 997). 5 PROgramme de Développement d'expériences scientifiques. 26

APEX jest lotniczym dyspersyjnym spektrometrem typu linijkowego (pushbroom) przeznaczonym do symulacji, kalibracji i walidacji istniejących i planowanych optycznych misji satelitarnych (Meuleman 22, ryc. 7). Ma na celu wykorzystywanie danych do zrozumienia procesów związanych z powietrzem, wodą i ziemią w skali lokalnej i regionalnej we wsparciu zastosowań globalnych (Hueni i in. 29). Dane przetwarzane są w belgijskim instytucie VITO 6, w Central Data Processing Center (CDPC) w Mol, przy wsparciu Processing and Archiving Facility (PAF) 7 oraz laboratorium optycznego Calibration Home Base (CHB) w Niemieckiej Agencji Kosmicznej DLR (Deutsches Zentrum für Luft und Raumfahrt) w Oberpfaffenhofen. Ryc. 7. Skaner APEX w belgijskim VITO 8 Dane techniczne dotyczące sensora przedstawiają się następująco (Meuleman 22): zakres spektralny: 38,5-97,7 nm (Visible-NIR Infrared, VNIR), 94,2-25,5 nm (Short-Wave Infrared, SWIR), liczba kanałów spektralnych: ok. 4 (VNIR), ok. 45 (SWIR), szerokość kanałów:,6-6,3 nm (VNIR), 6,2- nm (SWIR), liczba pikseli w linii:, rozdzielczość przestrzenna:,5-,75m (dla wysokości lotu -35 m), pole widzenia (FOV): 28, chwilowe pole widzenia (IFOV 9 ):,28, 6 Flemish Institute for Technological Research. 7 wszystkie elementy sprzętowe i programowe, a także ich interfejsy wymagane do obsługi przetwarzania obrazów APEX i wszystkich związanych z nimi danych. 8 wszystkie zdjęcia zamieszczone w niniejszej pracy, jeżeli nie podano nazwiska autora, pochodzą z materiałów autorki. 27

rozdzielczość radiometryczna: 6-bit. Rejestrowane dane, w zależności od stopnia ich przetworzenia reprezentują poszczególne poziomy (tab. ). Tab.. Poziomy przetworzeń danych APEX (Schlaepfer i in. 27, Hueni i in. 29) Nazwa poziomu poziom poziom poziom 2 poziom 3 Opis dane surowe pozyskane przez instrument (wyrażone w jednostce digital number, DN) dane skalibrowane radiometrycznie, spektralnie i geometrycznie (wyrażone w jednostce radiancji) dane skorygowane atmosferycznie lub atmosferycznie i topograficznie (wyrażone w jednostce współczynnika odbicia) produkty gotowe do zastosowań Procedurę przetwarzania danych APEX, począwszy od pozyskania surowych danych do danych zapisanych w postaci poziomu 2 prezentuje rycina 8. Ryc. 8. Procedura wstępnego przetwarzania danych APEX (na podstawie: Vreys i in. 24) Kalibracja obrazów APEX przeprowadzana jest na podstawie zestawu danych kalibracyjnych wygenerowanych w Calibration Home Base (CHB). Przeprowadzana jest przed i po każdym sezonie nalotów i generuje dane APEX poziomu (level-, Gege i in. 29). Kalibracja w CHB dzieli się na trzy kategorie: 9 Instantaneous Field of View. 28

a) radiometryczna konwersja surowych danych z sygnału na jednostki fizyczne radiancji, b) spektralna przypisanie środków zakresów długości fali (center wavelength) i rozdzielczości spektralnej każdego elementu detektora, c) geometryczna określenie kątów widzenia i rozdzielczości kątowej każdego elementu detektora. Dwie ostatnie obejmują charakterystykę zniekształceń optycznych typowych dla sensorów typu pushbroom, do których należy efekt "uśmiechu" (smile), spowodowany przesunięciem środka zakresu długości fali, zależny od położenia piksela, czy przesunięcie długości fali (wavelength shift, Sterckx i in. 26). Ze względu na niestabilność spowodowaną wahaniami ciśnienia czy temperatury podczas wykonywania nalotu, analiza przesunięć jest przeprowadzana w oparciu o właściwości absorpcji atmosfery, wykorzystane do przyporządkowania nowych środków kanałów spektralnych dla każdego piksela (Vreys i in. 24). Dalsze procedury przetwarzania danych APEX zależne są od wymaganego przez odbiorcę produktu. Przetwarzanie w postaci korekcji atmosferycznej oraz geometrycznej wymaga wykorzystania danych dodatkowych. W tym celu pozyskiwane są w terenie krzywe odbicia spektralnego przy użyciu terenowego spektrometru hiperspektralnego, służące do weryfikacji jakości korekcji atmosferycznej (Richter, Schlaepfer 22). Obszary, z których są one zbierane, jak również obszary, w których lokalizowane są punkty o znanych współrzędnych do korekcji geometrycznej, powinny być homogeniczne i obejmować przynajmniej 3x3 piksele obrazu. Korekcja atmosferyczna danych APEX oparta jest na kodzie transferu promieniowania MODTRAN4. Do danych wykorzystywanych do korekcji geometrycznej należy także Numeryczny Model Terenu (Digital Terrain Model). Dodatkowym rodzajem korekcji przeprowadzanym w CDPC jest normalizacja topograficzna z wykorzystaniem dwukierunkowego współczynnika odbicia promieniowania (Bidirectional Reflectance Factor, BRDF), eliminująca różnice oświetlenia na stokach (Richter 998). Opis przetworzeń przeprowadzonych na danych wykorzystanych w niniejszej pracy zaprezentowano w podrozdziale 6... 29

2. Klasyfikacja danych teledetekcyjnych Identyfikacja obiektów na danych obrazowych może odbywać się poprzez interpretację wizualną, określaną jako fotointerpretacja. Jest ona przydatna do wyróżniania obiektów o zróżnicowanym odbiciu spektralnym, do ogólnej oceny cech geometrycznych i rozpoznania głównych typów pokrycia terenu (Richards, Jia 25). Wykorzystanie jej na większych obszarach byłoby jednak bardzo czaso- i kosztochłonne. Jest to również metoda subiektywna, zależna od zdolności i możliwości percepcyjnych fotointerpretatora, co przy wykorzystaniu jednorazowo jedynie trzech zakresów spektralnych do utworzenia kompozycji barwnej i wyświetlenia obrazu w pewnym stopniu ogranicza wykorzystanie potencjału wielowymiarowych danych teledetekcyjnych, w tym ich pełnej rozdzielczości spektralnej i radiometrycznej, gdyż oko ludzkie rozróżnia około 6 tonów szarości, a w przypadku danych hiperspektralnych stosowany jest zapis 32-64 tonów szarości (obraz 5-6-bitowy). Słownik języka polskiego (996) definiuje klasyfikację jako podział osób, przedmiotów bądź zjawisk na grupy według określonej zasady. W teledetekcji jest to zautomatyzowany proces ilościowej analizy obrazu cyfrowego, polegający na przyporządkowaniu pikseli do określonych klas. Piksele identyfikowane są na podstawie ich wartości liczbowych zapisanych w kanałach spektralnych obrazu. Obiekty należące do tych samych klas mają zbliżone charakterystyki spektralne, tworząc skupienia w przestrzeni spektralnej (ryc. 9). Ryc. 9. Od lewej: obraz podzielony na 3 klasy pokrycia terenu, pośrodku: charakterystyki spektralne klas, od lewej: charakterystyki spektralne klas w dwuwymiarowej przestrzeni spektralnej (kolorem zielonym oznaczono roślinność, brązowym glebę, niebieskim zbiornik wodny) W zależności od klasyfikowanego elementu na obrazie wyróżnia się dwa rodzaje klasyfikacji: pikselowe (pixel based classification), gdzie każdy piksel klasyfikowany jest oddzielnie oraz obiektowe (object oriented classification, OBIA), w których zamiast

pojedynczych pikseli, bazując na algorytmie segmentacji klasyfikowane są obiekty, które mają charakterystyczną teksturę (Blaschke, Strobl 2). W metodach pikselowych wynik klasyfikacji uzależniony jest od wartości zapisanych w poszczególnych pikselach, natomiast w przypadku metod obiektowych możliwe jest określenie cech dodatkowych, takich jak kształt czy wielkość. W literaturze można spotkać przykłady badań, w których autorzy łączą metody pikselowe z obiektowymi, w celu zwiększenia dokładności klasyfikacji (Zhang, Xie 23, Yu i in. 26, Suchá i in. 26). Główny podział klasyfikacji dokonywany jest na podstawie sposobu przyporządkowania pikseli do danych grup i wyodrębnia metody nienadzorowane (unsupervised) oraz nadzorowane (supervised). Metody nienadzorowane bazują na tworzeniu w sposób iteracyjny klastrów (clusters), w których piksele grupowane są do pewnych kategorii na podstawie podobieństwa spektralnego, bez uprzedniej znajomości terenu czy nazw klas (Gao 28). Są one wykorzystywane do określenia liczby i lokalizacji klas wynikowych, które są następnie identyfikowane przez użytkownika poprzez porównanie z dostępnymi danymi referencyjnymi (Richards, Jia 25). Jednymi z najbardziej popularnych metod klasyfikacji nienadzorowanej są metody ISODATA (Interactive Self-Organising Data Analysis Technique) oraz K-means. Często metody klasyfikacji nienadzorowanej przeprowadzane są jako procedura wstępna do dalszych analiz z użyciem metod klasyfikacji nadzorowanej. W metodach nadzorowanych użytkownik określa liczbę klas, a także ich charakterystyki spektralne, wprowadzając wzorce w postaci pikseli bądź poligonów składających się z pikseli treningowych (training patterns). Wzorce te są opracowywane na podstawie znajomości terenu i powinny być reprezentatywne dla każdej z klas. Techniki rozpoznawania wzorców bazują na funkcji gęstości prawdopodobieństwa związanej z wzorcowymi klasami, które często nie są znane i muszą być oszacowane na podstawie zestawu wzorców treningowych (Swain 972). Jeśli opierają się na ustalonych parametrach statystycznych w obrębie wzorców treningowych i zakładają konkretny rozkład prawdopodobieństwa, to należą do metod parametrycznych (parametric), natomiast jeśli nie ma w nich ustalonych statystyk i sprawdzają się na danych o zróżnicowanych rozkładach, zaliczają się do metod nieparametrycznych (nonparametric). Jednymi z podstawowych parametrycznych metod klasyfikacji są metody: najmniejszej odległości (Minimum Distance), największego prawdopodobieństwa (Maximum Likelihood) czy metoda odległości Mahalanobisa (Mahalanobis Distance, Richards, Jia 25), najczęściej wykorzystywane do analiz obrazów wielospektralnych. 3

Do metod nieparametrycznych należą m.in. sztuczne sieci neuronowe (artificial neural networks) czy metody uczenia maszynowego (machine learning methods), bazujące na rozpoznawaniu wzorców (pattern recognition), które szerzej opisano w rozdziale 3. Istnieją także metody klasyfikacji bazujące na spektralnych charakterystykach obiektów, zapisanych w wielu wąskich zakresach widma elektromagnetycznego, określane jako dedykowane danym hiperspektralnym. Metody te wykorzystują spektra z pojedynczych pikseli do porównywania ich ze spektrami referencyjnymi pozyskanymi w terenie bądź z pikseli czystych spektralnie 2 (endmembers, Boardman, Kruse 994) lub pozwalają ocenić udział materiałów, z których składa się pojedynczy piksel (Aspinall i in. 22). Liczba pikseli treningowych dla każdej z klas w klasyfikacji nadzorowanej zależna jest od ich występowania w przestrzeni (Gao 28). Większe powierzchniowo klasy powinny być reprezentowane przez większą liczbę pikseli, dla klas podrzędnych całkowita liczba pikseli powinna wynosić minimum, a optymalnie od około pikseli na klasę, co gwarantuje przedstawienie zmienności spektralnej w obrębie klasy. Ważne jest także, aby w miarę możliwości piksele treningowe były od siebie niezależne i rozmieszczone równomiernie na obrazie. Liczba pikseli treningowych zależy również od zastosowanego klasyfikatora, a także dostępnych danych. W przypadku metod parametrycznych, np. metody największego prawdopodobieństwa, minimalna liczba pikseli treningowych powinna wynosić N+, gdzie N jest równe liczbie kanałów spektralnych obrazu (Richards, Jia 25). Aby odpowiednio zdefiniować statystyki klas zaplanowanych w klasyfikacji nadzorowanej, przy dużej liczbie zakresów spektralnych należałoby utworzyć więcej wzorców treningowych niż w przypadku klasyfikacji przeprowadzanej na obrazach wielospektralnych (Riedmann, Milton 23). Badania Pala i Mathera (24) prezentują wzrost dokładności klasyfikacji danych hiperspektralnych spowodowany wzrostem liczebności zestawu treningowego, ze do 5 pikseli dla każdej z klas. Badania Zhanga i Xie (23) przedstawiają wpływ redukcji zestawu treningowego ze % na 8%, 6%, 4% oraz 2% na dokładność klasyfikacji, wykazując niewielki spadek dokładności wraz ze spadkiem liczebności zestawów treningowych przy wykorzystaniu metody maszyn wektorów nośnych. Dodatkowo, w pracach Foody'ego i Mathura (26), Waske i in. (2), Camps-Valls'a (24) wykazano, że metoda maszyn wektorów 2 piksele o ekstremalnym położeniu w przestrzeni spektralnej, używane do wzorców klas. Do ich wyszukiwania ze zbioru pikseli obrazu hiperspektralnego obliczany jest wskaźnik czystości piksela Pixel Purity Index (PPI, Boardman, Kruse 994). Mogą to być również charakterystyki spektralne reprezentatywnych obiektów pobrane w terenie lub laboratorium przy użyciu spektrometru. 32

nośnych, zastosowana w niniejszej pracy, pozwala na stosowanie nawet niewielkich zestawów treningowych osiągając wysokie dokładności. Wynik klasyfikacji jest obrazem, którego jakość można ocenić wizualnie, jednak istotna jest także charakterystyka liczbowa prezentująca jego dokładność. Ocena dokładności przeprowadzana jest na podstawie porównania sklasyfikowanego obrazu z danymi uznanymi za bezbłędne, czyli utworzonymi uprzednio wzorcami weryfikacyjnymi określanymi jako próbki (samples). Wzorce te mogą być utworzone z różnych jednostek (sampling units), jak punkty, piksele, poligony, czy regularne obszary o określonej wielkości (Stehman, Czaplewski 998). Wybór jednostki próbkowania jest dowolny, np. dla mapy reprezentowanej przez piksele możliwe jest zastosowanie poligonów, podobnie dla mapy reprezentowanej przez poligony mogą być użyte pojedyncze piksele. Ważny w tym przypadku jest atrybut homogeniczności, zarejestrowany dla danej jednostki. Wzorce do oceny dokładności klasyfikacji mogą być utworzone niezależnie i stanowić oddzielny zbiór danych weryfikacyjnych na podstawie danych pozyskanych w terenie, bądź materiałów dodatkowych, takich jak mapy topograficzne czy ortofotomapy (Richards, Jia 25). Mogą również składać się z pikseli niewykorzystanych do klasyfikacji, powstałych w wyniku podziału całego zbioru danych, który może być wykonany na kilka sposobów w zależności od rozmiarów i charakterystyki. W statystyce do podziałów zbiorów danych wykorzystywane są m.in.: podział systematyczny (systematic sampling), podział losowy (random sampling), proporcjonalny podział losowy (stratified random sampling), ocena krzyżowa (k-fold cross-validation), pojedyncze przykłady weryfikacyjne (leave-one-out cross validation), czy losowanie ze zwracaniem (bootstraping, Kohavi 995). Podział losowy polega na jednorazowym podzieleniu zestawu danych na treningowe i weryfikacyjne, a następnie na wylosowaniu próbek z każdego zestawu. Losowanie próbek może być powtarzane (k-fold random sampling) k razy w obrębie każdego zestawu, dokładność oceniana jest na podstawie średniej uzyskanej z powtórzeń. W przypadku niezrównoważenia klas istotnym elementem podziału danych na zbiór treningowy i weryfikacyjny jest stratyfikacja, która pozwala na porównywalność proporcji klas w obydwu zbiorach. Ocena krzyżowa polega na losowym podziale zestawu na k równych części, gdzie klasyfikator trenowany jest na k- podzbiorach, a testowany na pozostałym zbiorze weryfikacyjnym, wykonując proces n razy. Zbiory treningowe mogą się w tym przypadku pokrywać, natomiast zbiory weryfikacyjne są rozłączne. Metoda leave-one-out jest przypadkiem oceny krzyżowej, 33

w którym każdy kolejny zbiór treningowy powstaje przez usunięcie jednej obserwacji. Losowanie ze zwracaniem pozwala wielokrotnie używać próbki zbioru treningowego, przy czym wylosowany element wraca do zbioru, więc może być wylosowany ponownie. Na podstawie błędnych zaklasyfikowań wszystkich wersji, a następnie ich uśrednienia, uzyskiwany jest błąd klasyfikacji. Nie istnieje określona zasada ustalania proporcji na zestawy treningowe i weryfikacyjne (Koronacki, Ćwik 28). W zależności od tego jakie dane są do dyspozycji, czy klasyfikator ma być lepiej wytrenowany, czy chcemy dokonać bardziej wiarygodnej oceny uzyskanych wyników, zestawy treningowe bądź weryfikacyjne mogą być bardziej liczne. Bardziej liczne zestawy treningowe stosowali m.in. Camps-Valls i in. (24), Fassnacht i in. (24), więcej pikseli weryfikacyjnych niż treningowych stosowali m.in. Gualtieri i Cromp (988), Waske i in. (2), Zagajewski (2). Zestawy treningowe i weryfikacyjne mogą być również podzielone równomiernie (por. Chan i in. 22). Jeżeli dane weryfikacyjne są niezależne od treningowych, proporcje mogą być nierównomierne i przyjmować jednakowe liczebności dla danych weryfikacyjnych (por. Petropoulos i in. 22, Demarchi i in. 24, Ghosh i in. 24, Burai in. 25). Do oceny dokładności przy dużych obszarach lub przy dużej liczbie klas (powyżej 2) sugerowane jest znalezienie minimum 75- pikseli weryfikacyjnych dla każdej z nich (Congalton, 99, Stehman 2). Liczba pikseli dla każdej klasy uzależniona jest również od względnej wagi danej klasy w kontekście całego kartowanego obszaru bądź od zmienności w obrębie każdej z klas. 34

3. Maszyny wektorów nośnych (SVM) Inspiracje dotyczące funkcjonowania układu nerwowego i działania ludzkiego mózgu, a także próba zrozumienia istot inteligentnych, czy poznania samego siebie w aspektach filozoficznych i psychologicznych przyczyniły się do powstania sztucznej inteligencji (artificial intelligence, AI). Definicja sztucznej inteligencji jest trudna ze względu na brak jasnej i precyzyjnej definicji samej inteligencji (Różanowski 27). Po raz pierwszy termin ten został użyty w roku 955 przez J. McCarthy'ego, który określił sztuczną inteligencję jako konstruowanie maszyn, o których działaniu można powiedzieć, że jest podobne do przejawów ludzkiej inteligencji. W roku 943 W. McCulloch i W. Pitts zaproponowali tworzenie inteligencji poprzez architekturę sieci neuronowych (neural networks, McCulloch, Pitts 943), mając dzięki temu znaczny udział w rozwoju cybernetyki. W 95 r. Alan Turing opracował tzw. test Turinga, dzięki któremu możliwe było stwierdzenie, czy program komputerowy jest inteligentny (Łupkowski 2). Do dziedziny sztucznej inteligencji należy uczenie maszynowe (machine learning), które A. Samuel (959), będący twórcą programu do uczenia gry w szachy, określił jako dziedzinę badań, dającą komputerom zdolność do uczenia się, bez bezpośredniego zaprogramowania. Uczenie maszynowe jest dziedziną bardzo szybko rozwijającą się, wykorzystywaną na szeroką skalę w grach, rozpoznawaniu obrazów, filtrowaniu poczty elektronicznej, stawianiu diagnoz, a nawet sterowaniu helikopterem (Tomczak 23). Podstawowy podział algorytmów uczenia maszynowego ze względu na metodę treningu uwzględnia, podobnie jak podstawowy podział metod klasyfikacji, uczenie nadzorowane oraz nienadzorowane. Do uczenia z nadzorem wymagane są dane wejściowe oraz wyjściowe w postaci etykietowanych wzorców przedstawiających pożądane zachowania. Rolą tzw. nauczyciela jest w przypadku metody nadzorowanej dobór reprezentatywnych przykładów, pozwalających programowi na prawidłowe nauczenie się danych zachowań (Selfridge i in. 985). Proces uczenia nadzorowanego ropoczynający się od zgromadzenia danych, poprzez ich przetworzenie, zdefiniowanie zestawu treningowego i wybór algorytmu, a następnie trening i ocenę opartą o zestaw weryfikacyjny przedstawia rycina. Uczenie z nadzorem pozwala na wykonywanie klasyfikacji oraz regresji. 35

Ryc.. Schemat uczenia nadzorowanego (Kotsiantis 27, zmodyfikowane) W przypadku uczenia bez nadzoru zestaw danych składa się jedynie z danych wejściowych i algorytm sam dokonuje ich podziału, co nie gwarantuje optymalnego rozwiązania problemu (Gentleman, Carey 28). Uczenie bez nadzoru wykorzystywane jest w klasteryzacji (clustering) i redukcji wymiarów (dimensionality reduction). Inną alternatywą uczenia maszynowego jest uczenie się ze wzmocnieniem (reinforcement learning), w którym również nauczyciel nie występuje, natomiast algorytm sam odkrywa wzorcowe zachowania poprzez podejmowanie akcji metodą prób i błędów (Szubert 24). Akcje te są nagradzane bądź karane (Tomczak 23). Maszyny wektorów nośnych (Support Vector Machines, SVM) to metoda nieparametryczna wykorzystująca uczenie maszynowe, pozwalająca na rozpoznawanie wzorców w sposób nadzorowany (Vapnik 995, Waske, Benediktsson, 27). Stosowana jest do klasyfikacji bądź regresji. Metoda maszyn wektorów nośnych jest na różne sposoby 36

klasyfikowana w literaturze i często utożsamiana jest z typem jednokierunkowych sieci neuronowych, pomimo innych z matematycznego punktu widzenia zasad jej działania (Duch 25, Osowski 26). Pierwszy algorytm do rozpoznawania wzorców został zaproponowany przez R.A. Fishera w 936 roku (Cortes, Vapnik 995). W roku 962 Frank Rosenblatt odkrył klasyfikator liniowy zwany perceptronem, będący najprostszą formą jednokierunkowych sieci neuronowych. We wczesnych latach 96. opracowana została metoda support vectors w celu konstrukcji hiperpłaszczyzn do rozpoznawania obrazów. W roku 964 Aizerman, Braverman i Rozonoer opracowali geometryczną interpretację jądra w przestrzeni cech (Aizerman i in. 964). O wielkości marginesu hiperpłaszczyzny separującej pisali Duda i Hart (973). W roku 974 Vapnik i Chervonenkis wprowadzili statystyczną teorię uczenia (statistical learning theory). Na początku lat 99. zmodyfikowano metodę SVM na pozwalającą tworzyć funkcje nieliniowe (Boser i in. 992, Cortes, Vapnik 995), a w roku 995 rozszerzono działanie algorytmu na regresję (Vapnik 995). Pierwotnie algorytm SVM używany był do klasyfikacji danych binarnych. Zaproponowano jednak rozwiązania, dzięki którym możliwa była klasyfikacja danych ciągłych, złożonych z wielu klas: tzw. metodę jeden przeciw jednemu (one versus one) lub jeden przeciw wszystkim (one versus all, Linh 24, Benediktsson, Waske 29). Pierwsze podejście polega na utworzeniu wszystkich możliwych kombinacji par klas i uczeniu klasyfikatora dla każdej z nich. W podejściu drugim uczone jest tyle klasyfikatorów, ile klas reprezentuje zbiór danych. Algorytm SVM wykorzystywany jest szeroko do rozpoznawania wzorców, m.in. w rozpoznawaniu mowy, dźwięków, obiektów, ruchów, wykrywaniu twarzy, kategoryzacji tekstów, obrazów czy diagnozowania chorób (Osuna i in. 997, Chu i in. 25, Burges 998, Schüldt i in. 24). Dzięki metodzie SVM możliwe jest określenie, do której z klas przyporządkowany jest zbiór danych wejściowych. Algorytm do separacji klas wykorzystuje hiperpłaszczyznę, która je oddziela wraz z maksymalnym możliwym marginesem. Dane znajdujące się najbliżej hiperpłaszczyzny nazywane są wektorami nośnymi (support vectors) i są najbardziej istotnymi elementami klasyfikacji (Vapnik 995, Hsu i in. 2). Podczas jej przeprowadzania określana jest przynależność każdego punktu do danego zbioru klas. Wynik klasyfikacji jest zależny od szerokości granicy rozdzielającej poszczególne klasy, czyli wspomnianego powyżej marginesu. Im jest on większy, tym mniejszy błąd klasyfikacji. 37

Zadaniem klasyfikatora SVM jest wyznaczenie optymalnej hiperpłaszczyzny rozdzielającej dane separowalne liniowo w przestrzeni, a także dwóch równoległych i znajdujących się w tej samej odległości hiperpłaszczyzn. Zakłada się, że zbiór danych jest złożony z par (x i, y i ), gdzie: i =, x i, y i { ;}. Każdy punkt z danego zbioru ma wartość x i opisującą elementy próby treningowej i y i wskazującą na przynależność do jednej z klas (Chudzian 22, Kmieć 23). Hiperpłaszczyzna H, za pomocą której separowane są poszczególne klasy, definiowana jest wzorem (Cortes, Vapnik 995): w x - b, () gdzie x jest punktem na hiperpłaszczyźnie, w n-wymiarowym wektorem normalnym do hiperpłaszczyzny, a b to odległość od najbliższego punktu na hiperpłaszczyźnie do punktu początkowego. Rycina przedstawia dwa zbiory punktów separowalne liniowo. Wyznaczenie dwóch hiperpłaszczyzn H i H 2 w taki sposób, aby pomiędzy nimi nie znalazły się punkty ze zbioru danych treningowych (uczących), a odległość między nimi (margines) była jak największa, można opisać równaniami (Cortes, Vapnik 995): w x - b -, (2) w x - b, (3) przy założeniu, że: w x i b, jeżeli y i, (4) w x i b -, jeżeli y i -. (5) Ryc.. Hiperpłaszczyzna oraz równoległe hiperpłaszczyzny H i H2 separujące klasy przy zachowaniu maksymalnego marginesu (Hsu i in. 2, zmodyfikowane) 38

Aby zbiór danych mógł być oddzielony za pomocą hiperpłaszczyzny, musi być separowalny liniowo. Dane ze zbioru treningowego mogą być separowalne bądź nieseparowalne liniowo, zatem w drugim przypadku należy doprowadzić je do postaci pierwszej. Jest to możliwe poprzez nieliniowe odwzorowanie punktów do przestrzeni o większej liczbie wymiarów (Gualtieri, Cromp 998): :R H, (6) gdzie H oznacza przestrzeń zmiennych przekształconych (feature space). Kolejno, w nowej przestrzeni cech stosowany jest algorytm SVM, a uzyskana separująca liniowo hiperpłaszczyzna odpowiada nieliniowej powierzchni przestrzeni oryginalnej (ryc. 2). Na tym etapie SVM wymaga obliczenia iloczynów skalarnych punktów znajdujących się w zbiorze treningowym. Ryc. 2. Transformacja danych wejściowych do nowej przestrzeni wielowymiarowej (Liao 25, zmodyfikowane). Aby uniknąć pracy na wielowymiarowej przestrzeni i dużej liczbie punktów stosowany jest tzw. trick jądrowy (kernel trick), dzięki któremu możliwości obliczeniowe zależą od wymiaru przestrzeni oryginalnej (Schölkopf 2, Kmieć 23). Iloczyn skalarny wektorów x i x j w przestrzeni zmiennych przekształconych jest równoważny tzw. funkcji jądrowej (kernel function, Gualtieri, Cromp 998, Kmieć 23): (x i ) (x j ) k x i x j (7) Do powszechnie wykorzystywanych typów funkcji jądrowych zalicza się (Hsu i in. 2): liniowe (linear) k x i x j x i T x j (8) wielomianowe (polynomial) k x i x j ( x T i x j r) d, (9) radialne (Radial Basis Function, ryc. 3) k x i x j exp(- x i -x j ) d, () 39

sigmoidalne (sigmoid) k x i x j tanh( x i T x j r) () gdzie: parametr gamma, d stopień wielomianu, r parametr przesunięcia (bias). Ryc. 3. Separacja klas przy użyciu funkcji radialnej (Murell i in. 2) W przypadku każdej z funkcji jądrowych istnieje możliwość zdefiniowania tzw. parametru C, nazywanego kosztem kary (cost of the penalty), który odpowiada za kontrolę kompromisu pomiędzy błędami w klasyfikacji a wymuszeniem marginesów. Wysokie wartości parametru świadczą o wysokiej karze nakładanej na obserwacje znajdujące się po niewłaściwej stronie hiperpłaszczyzny lub wewnątrz marginesu (Chudzian 22). Niskie wartości parametru są przyczyną niższych dokładności klasyfikacji, czyniąc klasyfikator nieużytecznym (Lin i in. 28). W funcji liniowej definiowany jest tylko parametr kary C, funkcja radialna i sigmoidalna wymagają dodatkowo wprowadzenia parametru przesunięcia (bias), który jest wartością niezerową i mówi o optymalnym dopasowaniu danych treningowych, a także parametru gamma, świadczącego o szerokości funkcji Gaussa. Funkcja wielomianowa, poza wspomnianymi parametrami wymaga również zastosowania stopnia wielomianu. Zastosowanie metody SVM pozwala uzyskać dobre rezultaty, nawet przy użyciu zaszumionych kanałów w obrazach, przy tym nie jest czasochłonne, pomimo wykorzystania znacznej pojemności danych i działa szybciej niż algorytm sztucznych sieci 4

neuronowych (Camps-Valls i in. 24, Dixon, Candade 28). Ponadto, dokładności osiągane przy klasyfikacji SVM są wyższe niż w przypadku sztucznych sieci neuronowych, szczególnie przy większej liczbie klas. Huang i in. (22) dla 3 klas uzyskali wyniki porównywalne (ok. 66% dokładności całkowitej), natomiast dla 7 klas dokładność ogólnie wzrosła, lecz dla metody SVM była wyższa (75,62%). Sluiter i Pebesma (2) dla 5 klas uzyskali wyniki porównywalne (ok. 72%), natomiast dla 5 klas przy użyciu sieci neuronowych nie udało się wyróżnić żadnej z nich, podczas gdy metoda SVM pozwoliła na ich wyróżnienie z dokładnością 4-5%. 4

4. Wykorzystanie danych hiperspektralnych do klasyfikacji roślinności Dane hiperspektralne są szeroko wykorzystywane w analizach roślinności, zarówno do jej identyfikacji, jak również do modelowania, czy określania jej kondycji. Przegląd rozpoczęto od pierwszych klasyfikacji roślinności przeprowadzanych przez badaczy amerykańskich na danych hiperspektralnych przy użyciu stosowanych ówcześnie metod. Następnie skupiono się na klasyfikacjach obszarów roślinnych często poddawanych analizom hiperspektralnym (obszary podmokłe, siedliska Natura 2) w Europie, uwzględniając także klasyfikacje przeprowadzane na danych z poziomu satelitarnego, kolejno przedstawiono wykorzystanie danych hiperspektralnych do klasyfikacji pokrycia terenu oraz samej roślinności przez badaczy polskich. Ostatnim elementem rozdziału jest opis klasyfikacji danych hiperspektralnych z użyciem metody maszyn wektorów nośnych. Jednymi z pierwszych badań w kierunku identyfikacji roślinności na podstawie charakterystyk spektralnych w obszarach górskich były badania Kokaly i in. (23), w których autorzy sklasyfikowali łącznie 6 typów roślinności Parku Narodowego Yellowstone. Wyróżnili 8 typów lasów, w tym pięć klas budowanych przez sosnę wydmową w różnym wieku, lasy z subalpejską sosną, lasy świerkowo/jodłowe i daglezjowe oraz 8 typów roślinności nieleśnej, do której zaliczały się cztery typy roślinności z przewagą bylic, pięć typów zbiorowisk trawiastych, turzycowiska z wierzbami, zarośla wierzbowe, turzycowiska, szuwary pałkowe i dwa mieszane typy mokradeł. Wykorzystali do tego obrazy ze skanera lotniczego AVIRIS, rejestrującego promieniowanie w 224 kanałach spektralnych z zakresu widzialnego, bliskiej oraz średniej podczerwieni, o rozdzielczości przestrzennej 5,4-7,5 m. Osiągnięta dokładność całkowita klasyfikacji dla zbiorowisk leśnych wyniosła 74,% (współczynnik kappa,62). Dane ze skanera AVIRIS były także wykorzystane przez Filippiego i Jensena (26), którzy zidentyfikowali klas typów zróżnicowanej roślinności na Florydzie: murawy napiaskowe, lasy dębowe, bory sosny, gaje cytrusowe, uprawy winorośli, krzewy, zarośla wierzbowe, zbiorowiska trawiaste na bagnach, palmy, zarośla palmowe i dębowe oraz sucha/spalona roślinność. Użyto trzech metod sztucznych sieci neuronowych 2, które porównano do algorytmu bazującego na ekstrakcji obiektów czystych spektralnie Matched Filtering (MF). Uzyskane wyniki dokładności wykazały większą przydatność sieci neuronowych (dokładność całkowita pomiędzy 73,3% a 86,%) niż metody MF (dokładność całkowita 64,6%) do klasyfikacji roślinności. 2 sieci wielowarstwowe ze wsteczną propagacją błedu (multi-layer perceptron MLP), samoorganizujące się sieci Kohonena (self-organizing map SOM) oraz kwantyzacja wektorowa z rozmytym uczeniem (fuzzy learning vector quantization FLVQ). 42

W literaturze dotyczącej klasyfikacji obszarów pokrytych roślinnością nieleśną można znaleźć wiele przykładów analiz obszarów podmokłych. Dane z hiperspektralnego skanera CASI, rejestrujące 288 kanałów spektralnych w zakresie 4- nm, o rozdzielczości przestrzennej 4 metrów wykorzystano do klasyfikacji zbiorowisk roślinnych w południowej części Ontario w Kanadzie (Jollineau, Howarth 28). Składały się na nie cztery klasy skoszonych i nieskoszonych pól, dwa rodzaje upraw, lasy oraz pięć zbiorowisk mokradłowych. Dane zredukowano spektralnie do 64 kanałów przy użyciu transformacji MNF, a następnie przeprowadzono analizę Pixel Purity Index, w celu wyszukania z obrazu pikseli czystych spektralnie. Do klasyfikacji użyto metody Spectral Angle Mapper (SAM), a także parametrycznej metody Maximum Likelihood. Najlepszy wynik uzyskano przy użyciu metody ML, osiągając dokładność całkowitą 92%. Klasyfikacją zróżnicowanych zbiorowisk roślinnych na obszarze słonych bagien Laguny Weneckiej w południowo-wschodnich Włoszech zajęli się Wang i in. (27), proponując metodę Vegetation Community based Neural Networks Classification (VCNNC). Był to rodzaj sieci neuronowej jednokierunkowej, uwzględniającej informacje z pikseli treningowych dotyczących czterech gatunków halofitów, a także odkrytej gleby. Wykorzystane dane również pochodziły z lotniczego skanera CASI, o wielkości piksela,3 m. Określenie udziału procentowego poszczególnych gatunków oraz odkrytej gleby w poligonach użytych do klasyfikacji i weryfikacji pozwoliło na opracowanie warstwy wyjściowej sieci VCNNC. Do porównania wykorzystano także klasyczne sieci neuronowe o identycznej architekturze, różniące się jedynie warstwą wyjściową. Dokładność całkowita sieci bazującej na zbiorowiskach roślinnych (VCNNC) wyniosła 9,58% (współczynnik kappa,87), natomiast dla klasycznych sieci neuronowych 84,7% (kappa,75). Autorzy stwierdzili, że różnica dokładności klasyfikacji związana była ze stopniem wymieszania gatunków: większy stopień ich zróżnicowania powodował większe różnice dokładności klasyfikacji porównywanych metod. Chan i Paelinckx (28) sklasyfikowali 6 ekotopów na obszarze wzgórz nad rzeką Dender we wschodniej Flandrii, w Belgii, w tym sześć kategorii roślinności nieleśnej oraz dziesięć klas leśnych/wysokiej roślinności. Zastosowano hiperspektralne dane HyMap zarejestrowane w 26 kanałach spektralnych z zakresu 4-25 nm, o 4-metrowej rozdzielczości przestrzennej. Do identyfikacji wykorzystano dwie metody bazujące na koncepcji drzew decyzyjnych: Random Forest (RF) oraz Adaptive Boosting (AdaBoost). W odniesieniu do niektórych klas autorzy zaobserwowali problem niepoprawnej separacji, 43

co rozwiązali połączeniem ich. Dokładności całkowite klasyfikacji według obydwu metod były podobne (odpowiednio 68,6% oraz 69,5%). Na podstawie danych hiperspektralnych sklasyfikowano również siedliska Natura 2 na obszarze Kalmthoutse Heide, w Belgii (Delalieux i in. 2). Klasyfikacji poddano siedliska, w podziale na 4 poziomy. Najniższy poziom składał się z 6 klas podstawowych, do których należały: wrzosowiska, łąki, lasy, wydmy, zbiorniki wodne oraz grunty orne, a następnie klasy te były modyfikowane i finalnie uszczegółowione do 27 klas poziomu 4, co było podyktowane zarówno typami siedlisk, jak również ich strukturą i funkcjami decydującymi w ocenie siedliska. Wykorzystane zostały dane ze skanera AHS, rejestrującego 63 kanały spektralne w zakresie od 4 do 25 nm, o rozdzielczości terenowej 2,4 m., natomiast do klasyfikacji użyto liniowej analizy dyskryminacyjnej (Linear Discriminant Analysis, LDA). Dla 6 klas osiągnięto dokładność całkowitą 96% (współczynnik kappa,95), natomiast dla 27 klas uzyskano 84% dokładność klasyfikacji (kappa,79). Jak opisano w podrozdziale.2., w porównaniu do lotniczych sensorów hiperspektralnych, dane z poziomu satelitarnego można pozyskać z niewielu źródeł. Jednym z nich jest skaner CHRIS (Compact High Resolution Imaging Spectrometer) zainstalowany na pokładzie satelity PROBA (The Project for On-Board Autonomy), należący do misji Europejskiej Agencji Kosmicznej, rejestrujący promieniowanie w 9 kanałach z zakresu 45-5 nm 22 o rozdzielczości przestrzennej wynoszącej 8 m (Chan i in. 22). Klasyfikacji na tych danych poddano obszar Natura 2 Kalmthoutse Heide, analizowany we wspomnianej pracy Delalieux i in. (2), w podziale na klas typów siedlisk: wrzosowiska z dominacją wrzosów (Calluna), wrzosowiska z dominacją wrzośców (Erica), wrzosowiska z dominacją trzęślic (Molinia), traworośla, lasy sosnowe, lasy brzozowe i dębowe, odkryte piaski i wydmy z trawami i mchami, zbiorniki wodne pokryte roślinnością, zbiorniki wodne oraz uprawy rolnicze. Do klasyfikacji wykorzystano metody: Support Vector Machines, Random Forest oraz Adaptive Boosting, uzyskując najwyższe dokładności odpowiednio: 6,8%, 57,% oraz 57,5%. Ponieważ głównym celem pracy była klasyfikacja wrzosowisk, skupiono się na wyniku dla nich osiągniętym i stwierdzono, że najlepiej sklasyfikowały się wrzosowiska z dominacją trzęślic (8,7%), następnie wrzosów (44,%), a najgorzej z dominacją wrzośców (37,3%). Źródłem hiperspektralnych danych satelitarnych jest także skaner Hyperion umieszczony na satelicie EO- (Earth Observing- Mission), rejestrujący promieniowanie 22 https://earth.esa.int/web/guest/missions/esa-operational-eo-missions/proba/instruments/chris, stan na dzień 8.5.26. 44

w 22 kanałach z zakresu 4-25 nm 23. Dane z tego sensora o rozdzielczości przestrzennej wynoszącej 3 metrów wykorzystano do klasyfikacji obszaru okolic aglomeracji krakowskiej (Hejmanowska 27). Wyniki porównano z uzyskanymi za pomocą wielospektralnego sensora ALI (Advanced Land Imager), rejestrującego promieniowanie w 9 kanałach spektralnych o identycznej rozdzielczości przestrzennej oraz zbliżonym zakresie spektralnym (433-235 nm 24 ). Klasyfikowanymi obiektami były: woda, roślinność drzewiasta, roślinność trawiasta, grunty odkryte, obszary przemysłowe oraz hałdy. Zarówno w przypadku danych Hyperion, jak i ALI wykorzystano te same wzorce treningowe oraz weryfikacyjne, a z dostępnych kanałów Hyperion wybrano 5 25 odpowiadających zakresom sensora ALI, co pozwoliło na obiektywną ocenę dokładności klasyfikacji opartej na dwóch rodzajach danych. Wykorzystano dwie metody klasyfikacji nienadzorowanej (K-means oraz ISODATA i dwie nadzorowanej (Maximum Likelihood, ML oraz Mahalanobis Distance, MD). Wyższe dokładności całkowite uzyskano dla wybranych kanałów obrazu hiperspektralnego, zarówno w przypadku metod nienadzorowanych (ok. 65% Hyperion, ok. 5% ALI), jak i nadzorowanych (ML Hyperion: 93,3%, ALI: 9,8%; MD Hyperion: 82%, ALI: 78,9%). W Polsce lotnicze dane hiperspektralne wykorzystywane są od początku XXI w. i przy zagadnieniu klasyfikacji służyły do identyfikacji pokrycia terenu, typów roślinności czy zbiorowisk roślinnych. Były to dane ze skanera DAIS 795, rejestrującego promieniowanie w 79 kanałach spektralnych z zakresu 4-26 nm, pozyskane w ramach eksperymentów HySens przez Niemiecką Agencję Kosmiczną z obszarów: Tarnobrzeskiego Zagłębia Siarkowego (Hejmanowska, Głowienka 24), Tatr (Sobczak i in. 25, Zagajewski 2) oraz Beskidu Niskiego (Olesiuk, Zagajewski 28). Trzy linie zobrazowania DAIS 795 ze zlewni Bystrzanki położonej w Beskidzie Niskim pozwoliły na wyróżnienie 6 klas pokrycia terenu: łąki, nieużytki, lasy iglaste, lasy liściaste, zadrzewienia, sady, uprawy buraków, ziemniaków, owsa, ścierniska, grunty zaorane, drogi asfaltowe, drogi polne, tereny zabudowane oraz budynki (Olesiuk, Zagajewski 28). Klasyfikacja wykonana została przy użyciu sztucznych sieci neuronowych z pakietu Stuttgart Neural Networks (SNNs) o strukturze perceptronu wielowarstwowego jednokierunkowego z wykorzystaniem algorytmu wstecznej propagacji błędu. Jako zestawy danych wykorzystano 4 oryginalnych kanałów zobrazowania, a także 23 https://eo.usgs.gov/sensors/hyperion, stan na dzień 8.5.26. 24 https://eo.usgs.gov/sensors/ali, stan na dzień 8.5.26. 25 wybór kanałów podyktowany był faktem, iż wiele kanałów sensora Hyperion posiada zniekształcenia typu smile, co uniemożliwiłoby przeprowadzenie klasyfikacji automatycznej. 45

3 kanałów z transformacji MNF, najwyższe dokładności całkowite klasyfikacji wyniosły odpowiednio 86,% oraz 89,%. Na obszarze wysokogórskim Tatr klasyfikowano zarówno gatunki, jak i zbiorowiska, typy roślinności, a także pokrycie terenu. Sobczak (29) zidentyfikował pięć gatunków roślinności alpejskiej w Dolinie Gąsienicowej kosmatka brunatna (Luzula spadicea), bliźniczka psia trawka (Nardus stricta), sit skucina (Juncus trifidus), trzcinnik owłosiony (Calamagrostis villosa) oraz śmiałek pogięty (Deschampsia flexuosa), wykorzystując cztery algorytmy klasyfikacji, bazujące na charakterystykach spektralnych pobranych w terenie przy użyciu spektrometru: Spectral Angle Mapper, Linear Spectral Unmixing (LSU), Matched Filtering (MF) oraz Mixture Tuned Matched Filtering (MTMF). Najlepsze wyniki osiągnięto przy użyciu metody SAM, a najlepiej dopasowanymi gatunkami były kosmatka brunatna oraz trzcinnik owłosiony (% zgodności z obszarami testowymi). W pracy Sobczaka i in. (25) przy użyciu nadzorowanej parametrycznej metody klasyfikacji Maximum Likelihood (ML) wyróżniono sześć klas pokrycia terenu: zarośla kosodrzewiny, lasy, łąki, skały, jeziora, cienie oraz szlaki turystyczne. Analizę przeprowadzono na dwóch zestawach danych: 5 oryginalnych kanałach DAIS 795, a także 6 pierwszych składowych z transformacji PCA. W tej samej pracy, przy użyciu sztucznych sieci neuronowych tego samego typu jak w klasyfikacji pokrycia terenu zlewni Bystrzanki (pakiet SNNs), zidentyfikowano sześć typów roślinności: zbiorowiska wyleżysk śnieżnych, murawy alpejskie, roślinność młak i torfowisk, łąki, użytki zielone powypasowe, subalpejskie zarośla kosówki, a także skały i jeziora. Klasyfikacje przeprowadzano na różnych kombinacjach danych: różnej liczbie warstw ukrytych (hidden layers) budujących sieć neuronową, a także przyjętych wartościach progowych (od,2 do,6). Przy najlepszym zestawie danych błąd klasyfikacji wahał się pomiędzy 5 a 8%. Szczegółową analizę roślinności na poziomie zbiorowisk tatrzańskich przeprowadził Zagajewski (2), bazując na mapie roślinności rzeczywistej (Kozłowska i in. 26). Wyróżnił na czterech liniach zobrazowania DAIS 795 następujące 42 klasy, na które składały się: pionierskie zbiorowiska roślin zarodnikowych i roślin naczyniowych na wilgotnych piargach, zbiorowiska porostów naskalnych, wilgotne traworośla kosmatkowe, wyleżyska w piętrze alpejskim oraz subalpejskim, murawy subniwalne, murawy alpejskie: typowe, porostowe, na półkach skalnych, torfowcowe, wyleżyskowe, z wierzbą Kitaibela, postać piargowa z sitem skuciną, z turzycą zawsze zieloną, postać subalpejska, na podłożu węglanowym, w kompleksie z wyleżyskami, w kompleksie 46

z traworoślami, kompleks przestrzenny muraw alpejskich na podłożu granitowym i mylonitach, torfowiska przejściowe, wilgotne psiary oraz w kompleksie z ziołoroślami, traworośla trzcinnikowe: postać pionierska, w kompleksie z wilgotnymi murawami, w kompleksie z zaroślami kosodrzewiny i murawami subalpejskimi, ziołorośla, wilgotne murawy w kompleksie z wyleżyskami i ziołoroślami, murawy powypasowe świeże i suche oraz wilgotne, fragmenty silnie zantropogenizowane, wysokogórskie borówczyska bażynowe oraz w kompleksie z zaroślami, zbiorowiska borówki czernicy w kompleksie z zaroślami kosodrzewiny oraz z traworoślami i ziołoroślami, zbiorowiska zaroślowe wierzby śląskiej i malin, zarośla kosodrzewiny na podłożu węglanowym oraz bezwęglanowym, kępy kosodrzewiny na ścianach skalnych, bór górnoreglowy oraz woda. Klasyfikacje przeprowadzane były również na dwóch zestawach danych: 4 oryginalnych kanałach oraz 2 kanałach z transformacji MNF, przy użyciu symulatora sztucznych sieci neuronowych fuzzy ARTMAP. Rezultaty były satysfakcjonujące: najwyższa dokładność całkowita została uzyskana dla 4 oryginalnych kanałów zobrazowania i wyniosła 89,%, najniższa dokładność, dla zestawu składającego się z kanałów MNF, wyniosła 84,4%. Obecnie w Polsce wykorzystanie lotniczych danych hiperspektralnych do klasyfikacji roślinności staje się bardziej popularne, głównie za sprawą firmy MGGP Aero Sp. z o.o., która od roku 25 jest w posiadaniu jednego z najbardziej nowoczesnych skanerów hiperspektralnych HySpex 26, rejestrującego promieniowanie w zakresie 4-25 nm w 45 kanałach spektralnych. Dane te posłużyły m.in. do klasyfikacji 2 gatunków drzew Białegostoku przy użyciu algorytmu Spectral Angle Mapper (Wałęsiak 26), pozwalając na uzyskanie dokładności całkowitej na poziomie 73%. Wykorzystano je także wraz z ortofotomapą oraz produktami pochodzącymi z lotniczego skaningu laserowego do szczegółowych klasyfikacji roślinności wykonywanych na zlecenie parków narodowych (Kopeć i in. 26). W Słowińskim Parku Narodowym sklasyfikowano 47 jednostek roślinności przy użyciu algorytmu Random Forest, osiągając współczynnik kappa równy,76. 36 jednostek roślinności przy użyciu tego samego algorytmu wyróżniono w Biebrzańskim Parku Narodowym, osiągając współczynnik kappa równy,7. Dane HySpex posłużą także do integracji z danymi wysokościowymi z lotniczego skaningu laserowego (Aerial Laser Scanning, ALS) oraz wysokorozdzielczą ortofotomapą, tworząc wspólnie innowacyjną platformę teledetekcyjną służącą do wspierania monitoringu nieleśnych siedlisk przyrodniczych Natura 2 w ramach projektu 26 wyprodukowany przez firmę Norsk Electro Optikk AS w Norwegii. 47

HabitARS 27. Projekt zakłada m.in. identyfikację siedlisk Natura 2 zajmujących 4 obszarów w całej Polsce o łącznej powierzchni około 64 km 2 (Jarocińska i in. 26), a także opracowanie i testowanie nowych metod identyfikacji gatunków roślin naczyniowych stwarzających zagrożenie 28 dla badanych w projekcie siedlisk przyrodniczych Natura 2 (Tokarska-Guzik i in. 26). Zadowalające są wyniki klasyfikacji z połączeniem danych hiperspektralnych z metodą Support Vector Machines. Analizy porównawcze różnych metod klasyfikacji pozwalają ocenić tę metodę jako jedną z najlepszych. Camps-Valls i in. (24) przeprowadzili klasyfikację pięciu klas roślin uprawnych (kukurydza, buraki cukrowe, jęczmień, pszenica, lucerna) oraz odkrytej gleby na danych HyMap w gminie Barrax, w Hiszpanii, co pozwoliło na uzyskanie najlepszej dokładności całkowitej SVM wynoszącej 96,4% 29, podczas gdy w przypadku jednokierunkowych sieci neuronowych było to 94,5%. Wyniki w postaci liczbowej nie różniły się znacznie, natomiast autorzy wykazali, że metoda SVM jest bardziej wydajna od sieci neuronowych, pod względem zarówno stabilności, niezawodności, jak i prostoty, a także prędkości procesu klasyfikacji. Melgani i Bruzzone (24) udowodnili, że zaletą SVM w porównaniu do innych metod jest możliwość prawidłowego rozróżnienia klas, nawet przy nielicznym zestawie danych treningowych. Dwie funkcje jądra SVM: liniowa oraz radialna w porównaniu z dwoma innymi klasyfikatorami: K-nearest neighbors oraz sieciami neuronowymi RBF były przez nich testowane na danych AVIRIS poprzez klasyfikacje 9 klas pokrycia terenu. Wyniki dokładności klasyfikacji przedstawiły SVM jako najlepszy klasyfikator (85,4% dokładności całkowitej dla funkcji liniowej, 92,6% dla funkcji radialnej), jak również najbardziej stabilny pod względem ustawień parametrów algorytmu. Analizę porównawczą różnych metod klasyfikacji, w tym SVM, zaprezentowali także Pal i Mather (24), klasyfikując 9 klas pokrycia terenu, włączając cztery klasy roślinności (uprawa pszenicy, roślinność wodna, winnice, pastwiska, a także zbiornik wodny, słone jezioro, odkryta gleba oraz zabudowa) na danych DAIS 795. Przy użyciu tych samych danych treningowych i weryfikacyjnych w podziale na dwa zestawy danych treningowych ( oraz 5 pikseli) przeprowadzili oni klasyfikację używając dodatkowo metod: drzewa decyzyjnego, sztucznych sieci neuronowych oraz metody Maximum 27 projekt "Innowacyjne podejście wspierające monitoring nieleśnych siedlisk przyrodniczych Natura z wykorzystaniem metod teledetekcyjnych", współfinansowany ze środków Narodowego Centrum Badań i Rozwoju, w ramach programu "Środowisko naturalne, rolnictwo i leśnictwo" BIOSTRATEG/Konkurs II (https://habitars.pl, stan na dzień 7..26). 28 gatunki obce inwazyjne i rodzime ekspansywne. 29 przy użyciu wielomianowej funkcji jądra. 48

Likelihood. Przy obydwu zestawach danych treningowych zaobserwowano najwyższe dokładności całkowite uzyskane metodą SVM, gdzie dla zestawu mniej licznego było to maksymalnie około 94%, bardziej licznego około 98%, najniższe dokładności uzyskano przy użyciu metody drzewa decyzyjnego (odpowiednio około 8% i 88%). Ponadto wykazano, że metoda SVM jest "odporna" na tzw. efekt Hughesa nie powoduje obniżenia dokładności klasyfikacji wraz ze wzrostem liczby wykorzystywanych kanałów. Szczegółowa identyfikacja roślinności obszarów podmokłych na poziomie gatunków (55), jak i zbiorowisk (4) była przeprowadzona na danych HyMap pozyskanych dla obszaru zlewni rzeki Kissimee w południowo-centralnej części Florydy, w Stanach Zjednoczonych (Zhang, Xie 23). Wykorzystano dwie metody uczenia maszynowego SVM oraz RF, dodatkowo łącząc je z metodą klasyfikacji obiektowej. Utworzono dwa zestawy danych oryginalny, złożony ze 9 kanałów spektralnych, a także po transformacji, złożony z 2 kanałów MNF. Ponadto, testowano liczebność zbiorów treningowych do klasyfikacji (2%, 4%, 6% i 8%), oceniając jej dokładność. Dla 4 zbiorowisk roślinnych i pełnego zbioru treningowego w przypadku RF osiągnięto 74% dokładności całkowitej (dane oryginalne) oraz 9% (kanały MNF), dla 55 gatunków było to odpowiednio 36% i 79%. Metoda SVM pozwoliła na uzyskanie 83% dokładności na danych oryginalnych, 89% dla kanałów MNF, natomiast w przypadku gatunków było to odpowiednio 73% i 85%. Redukcja zbiorów treningowych pozwoliła zauważyć większe różnice w przypadku klasyfikacji gatunków i metody RF. Autorzy podsumowali, iż klasyfikacja na poziomie gatunków była bardziej dokładna przy metodzie SVM, natomiast na poziomie zbiorowisk wyniki były porównywalne. Dwadzieścia klas roślinności trawiastej wyróżnili Burai i in. (25) w Parku Narodowym Hortobágy we wschodnich Węgrzech, przy użyciu trzech metod klasyfikacji, w tym SVM. Zidentyfikowali trzy klasy muraw stepowych, trzy klasy muraw alkalicznych (głównie halofitów i gatunków odpornych na stres), cztery klasy wilgotnych łąk, turzycowiska, sześć klas bagien i szuwarów, skoszone łąki, grunty odkryte, a także otwarte powierzchnie błotne znajdujące się na granicach obszarów podmokłych. Wykorzystane zostały dane z sensora AISA EAGLE II o zakresie spektralnym 4- nm w 28 kanałach i wielkości piksela wynoszącej m a do porównania z SVM zastosowano Maximum Likelihood oraz Random Forest. Testowano różne zestawy pikseli treningowych od do 3, w celu wyboru najbardziej optymalnego, zarówno na danych oryginalnych, jak i różnych zestawach składających się z kanałów MNF (od 2 do 5). W zestawach kanałów najwyższe dokładności osiągnięto dla 9 kanałów MNF. W przypadku 3 pikseli 49

w zestawie treningowym autorzy wykazali podobne wyniki klasyfikacji: SVM: 82,6%, RF: 79,4%, ML 8,78%, przy czym zwrócili uwagę, iż zmiana wielkości zestawu treningowego wpłynęła w najmniejszym stopniu na dokładności klasyfikacji w przypadku metody SVM (odpowiednio: 79,6%, 76,6%, 52,6%). Jak wynika z powyższego przeglądu literatury, dane hiperspektralne pozyskiwane z różnych sensorów są z powodzeniem wykorzystywane do klasyfikacji roślinności na różnych poziomach. W niektórych badaniach analizy roślinności są bardziej ogólne, włączając ją do klas pokrycia terenu, w innych klasyfikacje przeprowadzane są na poziomie bardziej szczegółowym siedlisk, zbiorowisk, czy gatunków. Stosowane są różne metody, jednak analizy porównawcze najczęściej wykazują najwyższą dokładność przy użyciu metody maszyn wektorów nośnych. 5

5. Obszar i obiekt badań Obszar badań obejmuje najwyższe partie polskich oraz czeskich Karkonoszy w granicach parków narodowych (ryc. 4). Obszar Karkonoszy znajdujący się ponad granicą lasu odznacza się największą różnorodnością gatunków oraz zbiorowisk roślinnych o wysokogórskim charakterze. Istotnymi czynnikami abiotycznymi, które warunkują tworzenie się zbiorowisk roślinnych są warunki klimatyczne oraz geologiczne (Żołnierz, Wojtuń 23). W rozwoju biotopu ważna jest także rola interakcji międzygatunkowych na danym obszarze (Clements 936). Warunki abiotyczne oraz występowanie poszczególnych zbiorowisk roślinnych Karkonoszy opisano kolejno w podrozdziałach 5.. i 5.2. Ryc. 4. Karkonoski Park Narodowy i Krkonošský Národní Park 3 3 źródła zastosowane do wszystkich podkładów map opublikowanych w niniejszej pracy: Esri, DigitalGlobe, GeoEye, Earthstar Geographics, CNES/Airbus DS, USDA, USGS, AEX, Getmapping, Aerogrid, IGN, IGP, swisstopo i GIS User Community. 5

5.. Warunki abiotyczne Właściwości wysokogórskich zbiorowisk roślinnych są określane przez czynniki siedliskowe, głównie klimatyczne, geologiczne oraz wysokościowe, które wymuszają na roślinach przystosowania do siedlisk (Żołnierz, Wojtuń 23). Zaostrzające się wraz z wysokością warunki klimatyczne powodują występowanie coraz niższej roślinności. Niska roślinność jest mniej podatna na działanie wiatru, zimą chroniona jest przez pokrywę śnieżną przed mrozem. W Karkonoszach wytworzył się lokalny klimat górski z długimi, ostrymi zimami, dużymi wahaniami temperatury i gwałtownymi wiatrami (Sobik i in. 23). Zmiany wymienionych czynników, szczególnie temperatury, wiatru i opadów następują wraz ze wzrostem wysokości nad poziomem morza. W przeważającej części roku Karkonosze znajdują się pod wpływem wilgotnych mas powietrza polarnomorskiego, czego skutkiem są duże zachmurzenie i opady, a także względnie wysokie temperatury w chłodnej połowie roku i względnie niskie w ciepłej części roku. Nad rejon gór napływa również powietrze polarno-kontynentalne, względnie chłodne w zimowej połowie roku i względnie ciepłe w letniej. Zdecydowanie rzadziej Karkonosze znajdują się pod wpływem mas powietrza zwrotnikowego lub arktycznego. Fale mrozów są związane z napływem powietrza polarnomorskiego lub arktycznego, fale upałów towarzyszą masom powietrza zwrotnikowego lub polarno-kontynentalnego. Karkonosze tworzą zwarty blok górski, co przekłada się na dużą prędkość wiatru (szczególnie w partiach grzbietowych), częste występowanie mgieł, intensywność osadów mgielnych i oblodzenia atmosferycznego. Karkonosze są pasmem górskim położonym w północno-wschodniej części Masywu Czeskiego, które wypiętrzyły się w późnym etapie orogenezy alpejskiej, w czasie ery kenozoicznej, głównie od środkowego miocenu po czwartorzęd (Aleksandrowski i in. 23). Po orogenezie alpejskiej nastąpił okres erozji, nasilonej zwłaszcza w czasie zlodowaceń i po ustąpieniu lądolodu. Powstały wówczas kotły polodowcowe o skalistych ścianach, u których podnóży leżą stożki usypowe i napływowe, poniżej moreny denne, czołowe i brzeżne, stawy i jeziora cyrkowe oraz średnie i wysokie torfowiska. Nastąpiło zrównanie powierzchni gór i złagodzenie ich kształtów. Wietrzenie w wysokogórskim klimacie doprowadziło do powstania wieńców gruzowych, kopców darniowych, gruntów strukturalnych, gołoborzy, rynien gruzowych, skałek. Karkonosze są górami o jednolitej i zwartej budowie morfologicznej. Jej południową część tworzą serie skalne ordowickie i sylurskie: zlepieńce, fyllity i zieleńce oraz proterozoiczne: gnejsy, granity rumburskie i łupki łyszczykowe. Natomiast część zachodnia Karkonoszy oraz północne pogórze są 52

zbudowane z granitu waryscyjskiego. Charakterystyczny jest tzw. pluton Karkonoszy, będący ciałem magmowym o składzie granitoidu, powstałego przez schłodzenie wielkich instruzji masy magmowej na znacznej głębokości w skorupie ziemskiej (Słaby, Martin 28). Krystalizacja stopów magmowych plutonu Karkonoszy i procesy metamorficzne doprowadziły do powstania bogactwa gatunków i form mineralnych. W grzbietowych partiach gór panuje szczególny krajobraz prezentujący swoje pokrewieństwo do dwóch regionów, subarktycznego oraz wysokogórskiego, co określane jest mianem "tundry arktyczno-alpejskiej" (Soukupová i in. 995). Dzięki minionemu klimatowi o charakterze peryglacjalnym wierzchowiny Karkonoszy były bezdrzewne w czasie całego Holocenu, a ślady działalności mrozu oraz wiatru pozostawiły po sobie takie formy jak np. grunty strukturalne, powstałe wskutek zamarzania i rozmarzania gleb. Charakter tundry arktyczno-alpejskiej nadany został przez kolejne zlodowacenia i pozostał on widoczny na obszarze znajdującym się powyżej górnej granicy lasu. Obok klimatu, wód powierzchniowych, roślin, zwierząt i działalności człowieka czynnikiem wpływającym na zróżnicowanie gleb na terenie Karkonoszy jest budowa geologiczna. Zróżnicowanie to jest duże, a dominują gleby charakterystyczne dla lasów zajmują ponad połowę powierzchni. Na terenie położonym w strefie wysokości 2-4 m n.p.m. występują gleby bielicowe właściwe, jak również większe powierzchnie stagnobielic torfowych, które przechodzą w gleby organiczne torfowisk subalpejskich (Kabała i in. 23). Także w tej strefie występują tzw. grunty strukturalne z cechami przeobrażeń mrozowych, związane z tundrowym charakterem Karkonoszy. W pobliżu schronisk zlokalizować można niewielkie obszary gleb antropogenicznych i brunatnych. Na najwyższych piętrach, powyżej 4 m n.p.m., na rozległych plejstoceńskich rumowiskach skalnych występują gleby inicjalne rumoszowe oraz bezglebowe gołoborza. Gleby najwyższych pięter wysokościowych Karkonoszy są unikatowe w skali regionalnej, przede wszystkim są to gleby z zachowanymi strukturami peryglacjalnego sortowania mrozowego, a także gleby torfowisk subalpejskich, czy inicjalne rumoszowe. Pokrywa glebowa Karkonoszy nieustannie ulega zmianom związanym z czynnikami środowiskowymi, przede wszystkim klimatem i roślinnością oraz działalnością człowieka. Ważnym elementem środowiska Karkonoszy są także wody, które wpływają na rozwój środowiska abiotycznego oraz biotycznego. Karkonosze stanowią wyniesiony masyw hydrogeologiczny, zbudowany z utworów krystalicznych o rozwiniętych pokrywach zwietrzelinowych (Marszałek, Rysiukiewicz 22). Zasoby wód podziemnych są uzależnione od zdolności gromadzenia wody przez skały, cech klimatycznych, a także 53

istnienia spękań i szczelin w utworach krystalicznych oraz przestrzeni porowych w utworach powierzchniowych. Dzięki silnemu zróżnicowaniu morfologicznemu Karkonoszy występuje w nich znaczna ilość źródeł naturalnych, głównie o charakterze grawitacyjnym. Dominujące są wypływy stokowe, na wierzchowinach grzbietowe oraz podgrzbietowe, natomiast w kotłach polodowcowych źródła karowe, wypływające ze szczelin w skałach, które powodują drenaż stref wodonośnych masywu krystalicznego. Skały krystaliczne są niskoporowate, więc o obecności wód świadczą tutaj spękania i szczeliny, najbardziej wyraźne w górnej części masywu. Wody podziemne Karkonoszy charakteryzuje niski stopień mineralizacji, ph jest zmienne i maleje wraz ze wzrostem wysokości n.p.m. Sieć wód powierzchniowych jest dobrze rozwinięta; północne stoki są odwadniane przez systemy rzeczne Kamiennej i Łomnicy, a południowa granica stanowi europejski dział wodny, oddzielający dorzecza Odry od Łaby. Zasilanie opadowe, długi okres zalegania pokrywy śnieżnej oraz słabe własności retencyjne podłoża krystalicznego są przyczyną wysokich stanów i przepływów w rzekach. Charakterystyczną częścią hydrografii Karkonoszy są zbiorniki wodne w postaci polodowcowych jezior cyrkowych z ostatniego zlodowacenia, np. Mały i Wielki Staw, czy Śnieżne Stawki w dnie Śnieżnych Kotłów w Karkonoszach Zachodnich. Występują też unikatowe pokrywy torfowe. 5.2. Roślinność subalpejska i alpejska Karkonoszy Pierwsze opisy subalpejskich i alpejskich zbiorowisk roślinnych Karkonoszy były wykonane przez niemieckich badaczy Rüstera, Rudolpha, Firbasa i Sigmonda w latach 2. XX w. i dotyczą torfowisk charakterystycznych dla tego obszaru (Żołnierz, Wojtuń 23). W latach powojennych badaniem rozmieszczenia i genezy torfowisk zajmował się S. Tołpa, natomiast czeską część Karkonoszy analizował J. Jenik. Znaczący wkład w fitosocjologię obszaru Karkonoszy i utworzonego na ich terenie parku narodowego wnieśli A. i W. Matuszkiewiczowie (974), którzy na podstawie wykonanych zdjęć fitosocjologicznych opracowali pierwszą Mapę zbiorowisk roślinnych Karkonoskiego Parku Narodowego, wraz z analizą krajobrazu fizycznogeograficznego. W latach 97-986 uzupełniano informacje o zbiorowiskach analizując zdjęcia fitosocjologiczne z różnych części Karkonoszy (Kwiatkowski 27). W roku 977 po raz pierwszy scharakteryzowano roślinność synantropijną (Rostański 977). Syntetyczny opis roślinności wszystkich pięter Karkonoszy opracował J. Fabiszewski (985). W badaniach prowadzonych w latach 9. skupiano się na poznaniu przyczyn i kierunków zmian zbiorowisk wysokogórskich po klęsce ekologicznej w odniesieniu do 54

danych archiwalnych. Szczegółowej analizie poddano: murawy bliźniczkowe (Carici (rigidae)-nardetum, Wojtuń i in. 994, traworośla trzcinnika owłosionego (Crepido- Calamagrostietum villosae, Wojtuń i in. 995), murawy halne w formie alpejskiej i subalpejskiej (Carici (rigidae)-festucetum airoidis, Fabiszewski, Wojtuń 2) oraz borówczyska bażynowe (Empetro-Vaccinietum, Żołnierz, Wojtuń 23). Wykonywano zdjęcia fitosocjologiczne w tych samych obszarach, które kartowane były w latach pięćdziesiątych. Kompozycje gatunków odzwierciedlające właściwości siedlisk pozwoliły zaobserwować zmiany stężenia azotu w glebie (Żołnierz, Wojtuń 23). Badania roślinności Karkonoszy kontynuowane były przez P. Kwiatkowskiego (27), który określił udział i rozmieszczenie poszczególnych gatunków w zbiorowiskach roślinnych. Bardzo ważnym etapem w opracowaniu roślinności tego obszaru była Mapa roślinności rzeczywistej ekosystemów nieleśnych Karkonoskiego Parku Narodowego sporządzona przez B. Wojtunia i L. Żołnierza w 22 r. (ryc. 5, Wojtuń, Żołnierz 22). Była efektem inwentaryzacji terenowej w latach 2-22 i wykorzystania ortofotomapy w skali :5 (Wojtuń i in. 24). Informacje o szacie roślinnej pochodzą z Operatu ochrony ekosystemów nieleśnych Karkonoskiego Parku Narodowego, do którego opracowana została numeryczna mapa roślinności rzeczywistej. Mapa w wersji papierowej wydrukowana została w skali :, osobno dla wschodniej i zachodniej części parku. Autorzy starali się wyznaczać płaty roślinności nie mniejsze niż m 2, z wyjątkami w postaci zbiorowisk cennych pod względem przyrodniczym, należących do kategorii ekosystemów szczególnej troski (Fabiszewski i in. 996). Wydzielenia znajdujące się w elektronicznej bazie danych składają się z dominujących typów roślinności i należących do nich zbiorowisk roślinnych, w podziale na obwody ochronne, oddziały i pododdziały (ryc. 6). Zasięgiem kartowania objęto zbiorowiska znajdujące się powyżej górnej granicy lasu, a także ekosystemy łąkowe i torfowiskowe na pogórzu oraz na obszarach leśnych. Kartowanie zbiorowisk odbywało się na poziomie zespołów, a gdy nie było to możliwe na poziomie związków bądź rzędów. Klasyfikacja syntaksonomiczna odbywała się głównie na podstawie Przewodnika do oznaczania zbiorowisk roślinnych Polski (Matuszkiewicz 2), w przypadku zbiorowisk roślinnych na torfowiskach bazowano na pracach E. Hadača i J. Váni z lat 967-968 (Wojtuń i in. 24). Koncepcję opracowania mapy zbiorowisk roślinnych czeskiej części parku narodowego (Krkonošský národní park, KRNAP) przedstawił Štursa (2), powołując się na badania A. i W. Matuszkiewiczów z Polski, jednak mapa w postaci graficznej nie została opublikowana. 55

Ryc. 5. Mapa zbiorowisk nieleśnych Karkonoskiego Parku Narodowego (na podstawie: Wojtuń, Żołnierz 22) 56

Ryc. 6. Fragment tabeli atrybutów warstwy zawierającej informacje o typach i zbiorowiskach roślinnych Karkonoszy (na podstawie: Wojtuń, Żołnierz 22) Zbiorowiska roślinne Karkonoszy odznaczają się szczególną specyfiką, m.in. dzięki występowaniu zespołów endemicznych i subendemicznych (Kwiatkowski 27). Na terenie Karkonoskiego Parku Narodowego znajduje się 48 zbiorowisk roślinnych, należących do 3 typów roślinności (tab. 2, Wojtuń, Żołnierz 22). Większość z nich występuje powyżej górnej granicy lasu, zaliczają się do nich również ekosystemy łąkowe i torfowiskowe na pogórzu, a także zbiorowiska występujące w obszarze pięter leśnych. Tab. 2. Typy i zbiorowiska roślinne Karkonoskiego Parku Narodowego (na podstawie: Wojtuń, Żołnierz 22) Typ roślin Zbiorowisko roślinne Chinofilne porosty naskalne Roślinność skał i piargów Murawy Chinofobne porosty naskalne Kompleks zbiorowisk żyły bazaltowej** Wczesne stadia sukcesji*** Zespół zmienki górskiej** Murawy bliźniczkowe Murawy halne (forma alpejska) Murawy halne (forma subalpejska) Murawy śmiałka pogiętego** Zbiorowiska ubogich muraw*

Roślinność źródlisk i wyleżysk śnieżnych Roślinność młak i torfowisk Traworośla Subalpejskie zarośla liściaste Ziołorośla wysokogórskie Zbiorowiska krzewinkowe Roślinność łąkowa i pastwiskowa Odłogi Zbiorowiska źródlisk niewapiennych Zespół czosnku syberyjskiego** Kosodrzewina na torfie*** Szuwar turzycy dzióbkowatej* Szuwar turzycy pospolitej* Zbiorowiska torfowisk przejściowych Zbiorowiska torfowisk wysokich Traworośle trzcinnika leśnego** Traworośle trzcinnika owłosionego Zbiorowisko śmiałka darniowego Zbiorowisko trzęślicy modrej Traworośla wysokogórskie Zarośla czeremchy i jarzębiny Zarośla wierzby lapońskiej Ziołorośle miłosny górskiej Ziołorośle paprociowe Borówczysko bażynowe Borówczysko czernicowe Wrzosowisko wysokogórskie Antropogeniczne zbiorowiska*** Zbiorowiska wilgotnych łąk* Zbiorowiska łąk świeżych** Zbiorowisko ostrożenia dwubarwnego* Zbiorowisko kostrzewy czerwonej i mietlicy pospolitej* Zbiorowiska wiązówki błotnej i tojeści pospolitej* Zespół sitowia leśnego* Zbiorowiska chwastów pól uprawnych* 58 Roślinność ruderalna Zarośla kosodrzewiny Nitrofilne zbiorowiska bylin i pnączy* Nitrofilne zbiorowiska dużych bylin*** Nitrofilne zbiorowiska ruderalne Zbiorowisko goryszu miarza** Zbiorowisko podagrycznika* Zbiorowisko pokrzywy zwyczajnej*** Zbiorowisko z dominacją malin* Zespół szczawiu alpejskiego** Sudeckie zarośla kosówki Świerczyny górnoreglowe Lasy Lasy dolnoreglowe* * zbiorowiska niebędące przedmiotem badań ze względu na występowanie poza zasięgiem opracowania. ** zbiorowiska niebędące przedmiotem badań ze względu na występowanie na niewielkich poligonach lub w cieniu innych obiektów. *** zbiorowiska wyeliminowane z analizy ze względu na zastąpienie ich przez inne zbiorowiska, zaobserwowane podczas inwentaryzacji terenowej lub wyłączone ze względu na podobieństwo spektralne do innych klas (opis poszczególnych przypadków znajduje się w podrozdziale 6.2.2.).

Najbardziej rozprzestrzenionym zbiorowiskiem piętra subalpejskiego są zarośla kosodrzewiny (Pinetum mugo sudeticum 3 ), pokrywające około 82 ha w granicach Karkonoskiego Parku Narodowego (Żołnierz, Wojtuń 23). Na fizjonomię zbiorowiska składa się dominujący gatunek kosodrzewina Pinus mugo. Gatunkami charakterystycznymi są jarząb górski Sorbus aucuparia subsp. glabrata i wierzba śląska Salix silesiaca oraz rozproszone niskie świerki. Z dużą częstotliwością występują borówka czarna Vaccinium myrtillus i brusznica V. vitis-idaea, wrzos Calluna vulgaris, goryczka trojeściowa Gentiana asclepiadea oraz trzcinnik owłosiony Calamagrostis villosa, bliźniczka psia trawka Nardus stricta i śmiałek pogięty Deschampsia flexuosa. Zarośla czeremchy i jarzębiny (Pado-Sorbetum) zdominowane są przez górski podgatunek jarzębiny Sorbus aucuparia subsp. glabrata, której towarzyszy czeremcha skalna Padus petraea, brzoza karpacka Betula pubescens subsp. carpatica, wiciokrzew czarny Lonicera nigra i porzeczka skalna Ribes petraeum (Żołnierz, Wojtuń 23). W bogatym runie występuje miłosna górska Adenostyles alliariae, a także między innymi tojad sudecki Aconitum plicatum subsp. plicatum, świerząbek orzęsiony Chaerophyllum hirsutum, czy trzcinnik owłosiony Calamagrostis villosa. Endemiczne, a zarazem reliktowe są zarośla wierzby lapońskiej (Salicetum lapponum, ryc. 7), występujące prawie wyłącznie we wschodniej części Karkonoszy 32. Dominująca jest w nich pozostała z okresu zlodowaceń wierzba lapońska (Salix lapponum) o jasnoszarej barwie liści, objęta w Polsce ścisłą ochroną gatunkową (Zarzycki, Kaźmierczakowa 2). Miejscami towarzyszy jej wierzba śląska Salix silesiaca oraz jarząb górski Sorbus aucuparia, runo tworzą trawy (trzcinnik owłosiony Calamagrostis villosa oraz śmiałek darniowy Deschampsia caespitosa), a także gatunki ziołoroślowe (Żołnierz, Wojtuń 23). Zbiorowisko występuje w górnych partiach kotłów polodowcowych oraz poza ich krawędziami, także w miejscach źródliskowych. 3 nazewnictwo syntaksonów przyjęte za W. Matuszkiewiczem (28). 32 pozostałe stanowiska na Polesiu Lubelskim oraz na Mazurach. 59

Ryc. 7. Zarośla wierzby lapońskiej na południu Małego Stawu Ziołorośle paprociowe Athyrietum distentifolii charakteryzuje dominacja jednego gatunku wietlicy alpejskiej Athyrium distentifolium (Żołnierz, Wojtuń 23). W jego niższych warstwach, w znacznie mniejszym udziale występują m.in. szczaw górski Rumex alpestris, szczawik zajęczy Oxalis acetosella, ciemiężyca zielona Veratrum lobelianum, czy trzcinnik owłosiony Calamagrostis villosa. Występują najczęściej w rynnach potoków, żlebach, źródliskach, obrzeżach wyleżysk śnieżnych itp. Od roku 2 w polskiej części Karkonoszy obserwuje się ich zamieranie 33, co nie zostało odkryte jeszcze w żadnym innym obszarze górskim czy północnym, w którym to zbiorowisko występuje (Dunajski 26). Dotychczas nie zauważono odnawiania się wietlicy alpejskiej w tych obszarach. Do typu ziołorośli wysokogórskich należy także ziołorośle miłosny górskiej Adenostyletum alliariae, w którym gatunkiem charakterystycznym jest wspomniany Adenostyles alliariae z m.in. modrzykiem górskim Cicerbita alpina, tojadem sudeckim Aconitum plicatum, kozłkiem bzowym Valeriana sambucifolia, szczawiem górskim Rumex alpestris czy śmiałkiem darniowym Deschampsia caespitosa (Żołnierz, Wojtuń 23). Głównie występuje w obrębie kotłów polodowcowych o wystawie północnej (Pawłowski 967), zajmując obszary pod Małym Śnieżnym Kotłem i w Kotle Wielkiego Stawu. Na silnie nachylonych zboczach, narażonych na schodzenie lawin, jak również na zawietrznych stokach kotłów polodowcowych z długo utrzymującą się pokrywą śnieżną występują zbiorowiska traworośli wysokogórskich (Przewoźnik 25, Żołnierz i in. 22). 33 zamieranie wywołane jest prawdopodobnie przez chrząszcza należącego do ryjkowców, który jest nośnikiem patogenu mikrobiologicznego lub nicieni. Zagadnienie to wymaga dokładniejszych badań. 6

Najczęstszy typ traworośli występujący w piętrze subalpejskim jest zdominowany przez panujący gatunek trzcinnika owłosionego Calamagrostis villosa zbiorowisko Crepido- Calamgrostietum villosae. Gatunkami współwystępującymi są m.in. śmiałek pogięty Deschampsia flexuosa, kosmatka gajowa Luzula luzuloides, rdest wężownik Polygonum bistorta czy borówka czarna Vaccinum myrtillus, często tworzy kompleksy z innymi zbiorowiskami subalpejskimi. Zbiorowisko znacznie wykracza poza zakres wysokościowy piętra subalpejskiego, zastępując wylesione powierzchnie świerczyn górnoreglowych, można je także spotkać na wysokości około 5 m n.p.m. Charakterystycznymi zbiorowiskami dla obszarów wysokogórskich są borówczyska. W Karkonoszach przeważają borówczyska czernicowe Vaccinium myrtillus z dominacją borówki czarnej (Żołnierz, Wojtuń 23, ryc. 8). Gatunkiem stale towarzyszącym jest trzcinnik owłosiony Calamgrostis villosa, często współwystępują także śmiałek pogięty Deschampsia flexuosa, borówka brusznica Vaccinium vitis-idaea, bliźniczka psia trawka Nardus stricta, czy siódmaczek leśny Trientalis europaea. Zbiorowisko pokrywa rozległe obszary na stokach oraz nieckach kotłów polodowcowych. Płaty borówczysk często występują w kompleksach z innymi zbiorowiskami subalpejskimi, np. traworoślami trzcinnika owłosionego, czy murawami bliźniczkowymi. Ryc. 8. Borówczysko czernicowe Zbiorowiskiem krzewinkowym o znacznie mniejszym udziale powierzchniowym jest borówczysko bażynowe Empetro-Vaccinietum, w którego skład wchodzą m.in. borówka brusznica vitis-idaea, bażyna czarna Empetrum nigrum i borówka czarna Vaccinium myrtillus (Żołnierz, Wojtuń 23). Jako gatunki towarzyszące występują trawy, m.in. trzcinnik owłosiony Calamagrostis villosa, czy śmiałek pogięty Deschampsia 6

flexuosa. W znacznej części płatów obserwuje się zanik niektórych gatunków charakterystycznych, jak bażyna, a wzrost udziału traw. Zbiorowisko zajmuje miejsca wyeksponowane, w tym krawędzie kotłów. Murawy bliźniczkowe Carici (rigidae)-nardetum (ryc. 9) składają się głównie z gatunku bliźniczki psiej trawki Nardus stricta, obok której gatunkami charakterystycznymi są m.in. kosmatka sudecka Luzula sudetica, turzyca tęga Carex bigelowii subsp. rigida, widłak alpejski Disphasiastrum alpinum, śmiałek pogięty Deschampsia flexuosa, czy wrzos zwyczajny Calluna vulgaris (Żołnierz, Wojtuń 23). Porastają zrównania wierzchowinowe i w głównej mierze mają charakter antropogeniczny, występują także w kompleksach z m.in. zaroślami kosodrzewiny czy borówczyskami czernicowymi. Od ponad 5 lat obserwuje się wkraczanie 34 trzęślicy modrej Molinia caerulea w obszary występowania muraw bliźniczkowych, szczególnie po czeskiej stronie Karkonoszy (Hejcman i in. 2). Ryc. 9. Murawy bliźniczkowe (fot. B. Zagajewski) Murawy halne Carici (rigidae)-festucetum airoidis są to niskie murawy, które ze względu na bogactwo gatunków podzielone zostały na dwie formy wysokościowe: alpejską i subalpejską (Matuszkiewicz, Matuszkiewicz 974). Nie mają własnych gatunków charakterystycznych, ale zastępują je gatunki charakterystyczne wyższych jednostek systematycznych m.in. kostrzewa niska Festuca airoides, sit skucina Juncus trifidus, jastrzębiec alpejski Hieracium alpinum agg., porost Cladonia uncialis oraz mech Racomitrium lanuginosum (Żołnierz, Wojtuń 23). Gatunkiem wyróżniającym jest turzyca tęga Carex bigelowii. Forma alpejska (ryc. 2) jest bogatsza i wyróżnia ją 34 w II połowie XX w. zaniechano koszenia łąk, m.in. z trzęślicą modrą, które było przeprowadzane raz do roku, pod koniec lipca. 62

obecność situ skuciny Juncus trifidus oraz porostów, jak m.in. Alectoria ochroleuca, Flavocentraria nivalis czy Thamnolia vermicularis. Uboższą formę subalpejską charakteryzuje współwystępowanie obok muraw kostrzewy niskiej alpejskich wrzosowisk ze związku Loiseleurio procumbentis-vaccinion, tworzących niewielkie płaty zdominiowane przez wrzos zwyczajny Calluna vulgaris, borówki Vaccinium myrtillus i Vaccinium vitis-idaea, trawy i porosty. Murawy występują na rumowiskach, w piętrze alpejskim powyżej 45 m n.p.m. oraz częściowo subalpejskim w obszarach narażonych na działanie silnych wiatrów. Forma alpejska obejmuje płaty na wschodnich stokach partii podszczytowych Śnieżki i fragmencie Czarnego Grzbietu; subalpejska porasta zachodnie stoki Śnieżki, szczytowe partie Smogorni, obszar Wielkiego Szyszaka i zrównania nad Śnieżnymi Kotłami. W wielu miejscach ulegają wydeptywaniu przez turystów. Ryc. 2. Murawy halne, forma alpejska (Karkonosze Wschodnie) Duże obszary Karkonoszy zajmuje roślinność skał i piargów. Jako najbogatszą określa się roślinność naskalną żyły bazaltowej w Małym Śnieżnym Kotle, którą tworzą zespoły naskalne, takie jak zespół paprotnicy kruchej Cystopteridetum fragilis, zespół paprotki zwyczajnej Asplenio-Polypodietum, czy zespoły paprociowe rozrzutki i zanokcicy północnej Sileno rupestris-asplenietum septentrionalis (Kwiatkowski 27, Żołnierz, Wojtuń 23). Największe obszary zajmują zbiorowiska porostów epilitycznych, a czynnikiem, który warunkuje ich zróżnicowanie jest pokrywa śnieżna (Żołnierz i in. 22). Wyróżniane są zbiorowiska chinofilne ("śniegolubne") ze związku Rhizocarpion alpicolae oraz chinofobne (unikające śniegu) ze związku Umbilicarion cylindricae. Na pierwszych z nich, przez miesiące zimowe zalega śnieg, po którego ustąpieniu widoczna 63

jest barwna mozaika na rumowiskach skalnych, np. żóltawozielona barwa dzięki porostom z rodzaju Rhizocarpon (ryc. 2). Nieprzykryte śniegiem zbiorowiska chinofobne nadają ścianom skalnym barwę ciemnoszarą. Ryc. 2. Chinofilne porosty naskalne na Szrenicy (Karkonosze Zachodnie) Stosunkowo niewielkie, rozproszone obszary pokrywają zbiorowiska źródlisk i wyleżysk śnieżnych. Wydzielony przez Matuszkiewicza (2) związek Cardamino- Montion obejmuje roślinność źródlisk, która występuje na siedliskach niewapiennych, o odczynie lekko kwaśnym lub obojętnym. Do niego należy występujący tylko w Karkonoszach endemiczny i jednocześnie będący reliktem glacjalnym gatunek gnidosza sudeckiego (Pedicularis sudetica, Štursová, Kociánová 996). Zespół czosnku syberyjskiego Allietum sibirici występuje razem z pierwiosnką maleńką Primula minima, wierzbownicą zwieszoną Epilobium nutans i mchem Blindia acuta, a gatunkami towarzyszącymi są m.in. niebielistka trwała Swertia perennis, wełnianeczka alpejska Baeothyrum alpinum, świerząbek orzęsiony Chaerophyllum hirsutum, śmiałek darniowy Deschampsia caespitosa i trzęślica modra Molinia caerulea, licznie reprezentowane są też mszaki (Żołnierz, Wojtuń 23). Zbiorowisko występuje w pobliżu wysięków i młak, na zboczach kotłów polodowcowych. Gleby mają odczyn zbliżony do obojętnego. Piętro subalpejskie Karkonoszy charakteryzuje obecność specyficznych dla tego obszaru torfowisk górskich, określanych jako subalpejsko-subarktyczne, ze względu na podobieństwo cech do torfowisk północnoeuropejskich (Potocka, Vanék 24). Występują na wierzchowinie, powyżej górnej granicy lasu i zajmują powierzchnię około 7 ha (Żołnierz, Wojtuń 23). Ze względu na typ gospodarki wodnej torfowiska można podzielić na wysokie i przejściowe. Torfowiska wysokie w Karkonoszach (ryc. 22) zasilane są głównie wodami opadowymi, dodatkowo wodami wysiękowymi ze szczelin 64

skalnych, czy wodami spływu powierzchniowego. Ich roślinność zdominowana jest przez mchy torfowce, byliny z rodziny turzycowatych, np. wełnianeczka darniowa, krzewinki z rodziny wrzosowatych, np. wrzos zwyczajny Calluna vulgaris, czy żurawina błotna Oxycoccus palustris. Torfowiska przejściowe także są zasilane wodami opadowymi, ale również mineralnymi wodami gruntowymi, wodami ze źródeł, źródlisk, wysięków oraz powierzchniowymi. Najczęściej występująca roślinność to turzyca pospolita Carex nigra, turzyca dzióbkowata Carex rostrata, wełnianka wąskolistna Eriophorum angustifolium, torfowiec kończysty Sphagnum fallax, czy płonnik pospolity Polytrichum commune. Polskie oraz czeskie torfowiska karkonoskie o powierzchni 4 ha zostały objęte wspólną formą ochrony o znaczeniu międzynarodowym i wpisane na światową listę obszarów objętych Konwencją Ramsarską, tworząc Transgraniczny Obszar Wodnobłotny Ramsar 35. Ryc. 22. Torfowisko wysokie polskiej i czeskiej części Karkonoszy Zachodnich w otoczeniu kosodrzewiny i pojedynczych świerków Do nieleśnej roślinności Karkonoszy zaliczają się także zbiorowiska łąkowe w postaci hal, które są reliktem dawnej gospodarki pasterskiej prowadzonej od XVII do końca XIX w. (Żołnierz i in. 22). Od tego czasu skład gatunkowy oraz ich struktura uległy znacznym przekształceniom, jednak w dalszym ciągu stanowią ostoje różnorodności biologicznej, a ponadto mają istotną wartość kulturową jako pamiątka po tradycyjnej gospodarce w obszarach górskich. Ekosystemy łąkowe wytworzyły się głównie w piętrze pogórza i regla dolnego, w reglu górnym na halach dominują wysokogórskie zbiorowiska 35 https://rsis.ramsar.org/ris/566, stan na dzień 28.7.26. 65

traworośli i ziołorośli, murawy bliźniczkowe oraz torfowiska przejściowe. Na poszczególne łąki, polany czy hale składają się najczęściej różne typy roślinności. Obszarom związanym z ruchem turystycznym towarzyszy roślinność synantropijna, m.in. okolice schronisk są miejscem występowania nitrofilnych bylin (Żołnierz i in. 22, ryc. 23). W obszarach regla górnego, w których kilkadziesiąt lat temu zaniechano pasterstwa, zauważalne są jego pozostałości w postaci dużych obszarów ziołorośli szczawiu alpejskiego, produkujących latem duże ilości biomasy. Szczególnie są one wyraźne na Hali Szrenickiej oraz na hali Pod Łabskim Szczytem, jednak ich zasięg zaczyna się rozrastać na zbiorowiska półnaturalne i naturalne (Przewoźnik 25). Ryc. 23. Nitrofilne zbiorowiska dużych bylin (okolice Schroniska Samotnia, Karkonosze Wschodnie) Roślinność Karkonoszy pomimo jej ścisłej ochrony narażona jest na pewne zagrożenia, spowodowane czynnikami antropogenicznymi, biotycznymi i abiotycznymi. W latach osiemdziesiątych i dziewięćdziesiątych XX w. nastąpiło zamieranie roślinności, spowodowane znacznym pogarszaniem się jej stanu, które obserwowano już od lat sześćdziesiątych. Powodem klęski ekologicznej była m.in. wielowiekowa gospodarka leśna, rozwój gradacji szkodników, silne wiatry, w znacznej mierze skażenie powietrza napływającego znad obszarów przemysłowych i wysoki opad związków azotu (Danielewicz i in. 23, Żołnierz, Wojtuń 23), a także zakwaszenie gleby (Jadczyk 999). Powietrze nad Karkonoszami było zanieczyszczone przede wszystkim kwasem siarkowym powstającym podczas utleniania i uwadniania w atmosferze dwutlenku siarki. 66

Aby wstrzymać ten proces na początku lat 9. ograniczona została emisja związków siarki i azotu z elektrowni w Bogatyni, a także w Czechach oraz Niemczech (Przewoźnik 25). Zakwaszenie gleby zostało spowodowane kwaśnymi opadami, które powodowały wypłukiwanie zasadowych składników odżywczych, zaburzenie równowagi jonowej, przechodzenie substancji toksycznych do postaci łatwiej przyswajalnych dla organizmów. Gleby Karkonoszy są ubogie w bakterie wskutek niskiego ph a częste, silne wiatry również wpływały niekorzystnie na roślinność górską, ograniczając jej rozwój i zwiększając predyspozycję chorobową. Badania właściwości siedlisk Karkonoszy (Wojtuń i in. 997) wykazały wysokie zawartości azotu w glebach płatów zbiorowisk, które zmieniły skład gatunkowy w wyniku wysokiego opadu związków azotu oraz silnego tempa mineralizacji i nitryfikacji gleb największa ich intensywność zaobserwowana była w murawach bliźniczkowych, najniższa na borówczyskach bażynowych. Zagrożeniem dla roślinności Karkonoskiej jest także letnia i zimowa turystyka masowa, z którą związana jest infrastruktura. Warunki życia roślin są zaburzane przez budowę ścieżek, wyciągów, nartostrad, czy schronisk, która prowadzi do fragmentacji siedlisk uniemożliwiającej migracje gatunków. W obszarach znacznego wpływu człowieka obserwowana jest synantropizacja roślinności, umożliwiająca wkraczanie gatunków inwazyjnych, wypierających roślinność naturalną (Przewoźnik 25). Aby przywrócić naturalność zdegradowanym siedliskom w parkach prowadzone są zabiegi ochronne, a stan roślinności jest kontrolowany roślinność synantropijna jest usuwana, a niektóre szlaki są czasowo zamykane, aby ograniczyć ruch turystyczny. 67

6. Metodyka pracy W niniejszym rozdziale prezentuje się główne etapy postępowania badawczego, zastosowanego do klasyfikacji zbiorowisk roślinnych Karkonoszy na podstawie pozyskanych i przetworzonych danych hiperspektralnych APEX. Przed pierwszymi przetworzeniami wybrano w terenie homogeniczne obszary, na których w trakcie wykonywania zobrazowania przeprowadzono pomiary spektrometryczne hiperspektralnym spektrometrem ASD FieldSpec 3 oraz spektrometrem słonecznym Microtops w celu pozyskania cech spektralnych poligonów kalibracyjnych do korekcji obrazów. Następnie dane APEX przetworzono poprzez wykonanie kalibracji oraz korekcji geometrycznej i atmosferycznej. Procedury te zostały wykonane w belgijskiej siedzibie VITO przez operatora skanera APEX. Posiadając skorygowane dane rozpoczęto testowanie algorytmu klasyfikacji przy użyciu metody maszyn wektorów nośnych Support Vector Machines (SVM), na jednym z obszarów testowych (okolice Małego Stawu). Bazując na mapie roślinności nieleśnej autorstwa Wojtunia i Żołnierza (22) oraz ortofotomapie, a także zobrazowaniu APEX przygotowano wzorce do klasyfikacji i weryfikacji obrazu składające się z różnych zestawów pikseli treningowych oraz weryfikacyjnych. W celu przyspieszenia procesu klasyfikacji i wyboru danych weryfikacyjnych do badań terenowych wykorzystano trzy algorytmy kompresji danych. Po optymalizacji parametrów klasyfikacji odbyła się zasadnicza część klasyfikacji, która objęła swym zasięgiem całą linię zobrazowania APEX pokrywającą zarówno wschodnią, jak i zachodnią część Karkonoszy, gdzie występowały zbiorowiska roślinności subalpejskiej i alpejskiej. Uzyskane wyniki były weryfikowane w terenie. Procedura weryfikacji polegała na wgraniu wyników klasyfikacji do odbiornika GPS Trimble GeoXT, a następnie podczas terenowej marszruty sprawdzaniu zgodności wydzieleń ze stanem rzeczywistym. Badania terenowe objęły obszary wschodniej i zachodniej części Karkonoskiego Parku Narodowego, najbardziej zróżnicowane pod względem występowania zbiorowisk roślinnych. Przeprowadziła je autorka pracy wraz z: prof. Bronisławem Wojtuniem 36, mgr Lidią Przewoźnik 37, mgr Magdaleną Stanek 38 oraz dr. hab. Bogdanem Zagajewskim. 36 Uniwersytet Wrocławski, Wydział Nauk Biologicznych, Katedra Ekologii, Biogeochemii i Ochrony Środowiska, Pracownia Ekosystemów Górskich i Polarnych. 37 Karkonoski Park Narodowy. 38 Karkonoski Park Narodowy. 68

6.. Pozyskanie i przetwarzanie danych hiperspektralnych APEX Dane ze skanera APEX zostały pozyskane dla obszaru polskich oraz czeskich Karkonoszy września 22 roku w ramach projektu HyMountEcos Hyperspectral Remote Sensing for Mountain Ecosystem, dofinansowanego przez European Facility For Airborne Research Transnational Access (EUFAR TA). W projekcie jako odbiorca danych uczestniczyły Uniwersytet Warszawski oraz Uniwersytet Karola w Pradze, natomiast nalot realizowany był przez Niemiecką Agencję Kosmiczną (DLR) i belgijski instytut VITO. Zobrazowanie terenu polskich i czeskich Karkonoszy wykonano z samolotu Dornier Do- 288, lecącego na dwóch wysokościach: 575 oraz 665 metrów. W godzinach :35-4 :3 pozyskano 5 pasów zobrazowań (ryc. 24). Równocześnie z nalotem wykonane zostały pomiary spektrometryczne w terenie na powierzchniach jasnych i ciemnych spektralnie (ryc. 25) o względnie jednolitym odbiciu spektralnym, jak np. zbiorniki wodne, powierzchnie asfaltowe czy betonowe, jak również homogeniczne gatunkowo łąki. Pozyskano je przy użyciu spektrometru ASD FieldSpec 3, rejestrującego promieniowanie elektromagnetyczne w zakresie 35-25 nm. Ryc. 24. 5 linii zobrazowania APEX nad polskimi i czeskimi Karkonoszami (na podstawie: Google Earth) 69

Ryc. 25. Spektrometryczny pomiar kalibracyjny Przetwarzanie i korekcje danych nastąpiło w belgijskim instytucie VITO, będącym właścicielem skanera APEX. 6... Wstępne przetwarzanie obrazów 7 W pierwszym etapie przeprowadzonym w Mol, belgijskiej siedzibie VITO, otrzymano dane w postaci poziomu (tab., podrozdział.3.), były one poddane kalibracji radiometrycznej. Błędy kalibracyjne 39 obrazów APEX skorygowano za pomocą współczynników wzmocnienia sygnału (gain coefficient), obliczonych na podstawie charakterystyk spektralnych powierzchni kalibracyjnych (Vreys i in. 24). W kolejnym etapie, po dostarczeniu do operatora danych dodatkowych w postaci danych spektrometrycznych, a także wysokościowych, otrzymano obrazy przetworzone do poziomu 2 (tab., podrozdział.3). Korekcja geometryczna obrazów wykonana została w module C++ opracowanym przez VITO. Bazowała na georeferencji bezpośredniej i wykonano ją na podstawie pomiarów GPS/IMU 4 sensora, a także Numerycznego Modelu Terenu oraz Numerycznego Modelu Pokrycia Terenu (Digital Surface Model 4 ). Obydwa modele opracowane zostały na podstawie danych z lotniczego skaningu 39 pierwsze kanały z zakresu promieniowania niebieskiego oraz część zakresu SWIR (ok. 2 nm oraz koniec zakresu). 4 wykorzystanie techniki GPS wraz z pomiarami inercjalnymi (Intertial Measurement Unit) do wyznaczania elementów orientacji zewnętrznej. 4 do dalszych analiz przeprowadzanych na danych poziomu 2 wybrano dane przetworzone przy użyciu Numerycznego Modelu Pokrycia Terenu, który zapewniał wyższą dokładność uzyskanych wyników, niż Numeryczny Model Terenu.

laserowego z roku 27, otrzymanych z Karkonoskiego Parku Narodowego 42. Obrazy końcowe zarejestrowano do układu UTM (Universal Transverse Mercator) opartego na elipsoidzie WGS84 (World Geodetic System '84). Korekcję atmosferyczną danych przeprowadzono w Central Data Processing Center (CDPC), bazując na kodzie transferu promieniowania MODTRAN4, z wykorzystaniem algorytmów zaprezentowanych w pracach de Haan i in. (99) oraz de Haan i Kokke (996), a także parametrów atmosferycznych 43 pozyskanych z poziomu naziemnego w trakcie nalotu, przy użyciu fotometru słonecznego Microtops. Do korekcji uwzględniono środek zakresu długości fali dla każdej kolumny pikseli podczas lotu (Stercxs i in. 26). Elementem przetworzeń była także eliminacja nakładających się na siebie kanałów z tego samego zakresu spektralnego, co jest wynikiem pokrywania się części spektrum z zakresu VNIR i SWIR obrazu APEX. Spektra zostały wygładzone i przepróbkowane (resampled) do długości fali, jakie uzyskuje się podczas kalibracji w laboratorium optycznym Calibration Home Base. Korekcja topograficzna obrazów finalnie nie została przeprowadzona, gdyż na podstawie dostarczonych oraz przetworzonych w VITO danych (m.in. wysokościowych) w wyniku prób ich skorygowania powstawały artefakty i niespójności w obliczanym współczynniku korekcyjnym, który jest jedną ze składowych korekcji topograficznej. Przy jego wyliczaniu nie udało się uzyskać satysfakcjonujących rezultatów, odstąpiono więc od jej wykonania na danych w postaci produktu końcowego. Dostarczone przez VITO dane zapisane były w formacie ENVI (pliki *.img oraz *.hdr). Do każdego z plików wygenerowane zostały także obrazy poglądowe (quicklooks), pomocne do wizualizacji czy prezentacji obrazów. Po pozyskaniu przetworzonych linii zobrazowania należało wybrać te, które swym zasięgiem odpowiadają lokalizacji nieleśnych zbiorowisk roślinnych Karkonoszy. Analizując występowanie zbiorowisk na mapie referencyjnej prof. Wojtunia i Żołnierza wybrano fragmenty zobrazowania obejmujące większość pokrywającego się obszaru. Do wstępnych klasyfikacji wybrano cztery obszary testowe: dwa z okolic Szrenicy w Karkonoszach Zachodnich oraz dwa obszary okolic Małego Stawu w Karkonoszach Wschodnich (ryc. 26). 42 skaning wykonany był z gęstością 4 punktów na m 2, przez spółkę Geomar S.A., na zlecenie KPN. Rozdzielczość przestrzenna produktu końcowego wynosiła m. 43 grubości optyczne aerozoli (AOT) dla długości fali: 38, 5, 675, 87, 2 nm, a także wykładnik Angstroma z zależności grubości optycznej do długości fali. 7

Ryc. 26. Obszary testowe na tle zbiorowisk nieleśnych i leśnych KPN Ze względu na fakt, że wybrane obrazy APEX były przetworzone zarówno do poziomu, jak i poziomu 2, a obszary, które klasyfikowano cechowały się różną liczbą wydzieleń zbiorowisk na mapach wynikowych (w dwóch klasyfikowano nie tylko roślinność subalpejską i alpejską, ale także zbiorowiska leśne), obszary te nazwano kolejno: Szrenica, Szrenica2, MałyStaw i MałyStaw2 (tab. 3) Wszystkie obszary sklasyfikowano przy użyciu metody maszyn wektorów nośnych, początkowo na jej domyślnie ustawionych parametrach, wybierając zestawy pikseli treningowych i weryfikacyjnych w postaci całych utworzonych poligonów wskazujących zasięgi zbiorowisk roślinnych (Marcinkowska i in. 24a, 24b). Do dalszego testowania algorytmu klasyfikacji wybrano jeden z obszarów testowych MałyStaw2, ponieważ obraz ten był poddany wszystkim korekcjom, a więc najwierniej przedstawiał stan rzeczywisty, jak również charakteryzowało go największe zróżnicowanie klas zbiorowisk roślinnych. Tab. 3. Obszary testowe i ich charakterystyki Nazwa obszaru Poziom przetworzeń danych APEX Liczba klas Szrenica* 5 Szrenica2 2 6 MałyStaw* 3 MałyStaw2 2 24 * obszary klasyfikacji zbiorowisk nieleśnych i leśnych 72

Poszczególne klasy, które były wyróżniane na czterech obszarach testowych zaprezentowano w tabeli 4. Tab. 4. Zbiorowiska klasyfikowane na poszczególnych obszarach testowych L. p. Klasa Obszar testowy chinofilne porosty naskalne Szrenica, Szrenica2, MałyStaw, MałyStaw2 2 chinofobne porosty naskalne Szrenica, Szrenica2, MałyStaw, MałyStaw2 3 wczesne stadia sukcesji MałyStaw, MałyStaw2 4 kosodrzewina na torfie MałyStaw 5 zbiorowiska torfowisk przejściowych Szrenica, Szrenica2, MałyStaw, MałyStaw2 6 zbiorowiska torfowisk wysokich Szrenica2, MałyStaw, MałyStaw2 7 traworośla wysokogórskie Szrenica, Szrenica2 8 traworośle trzcinnika owłosionego Szrenica2, MałyStaw, MałyStaw2 9 zarośla czeremchy i jarzębiny MałyStaw, MałyStaw2 zarośla wierzby lapońskiej MałyStaw, MałyStaw2 ziołorośle miłosny górskiej MałyStaw, MałyStaw2 2 ziołorośle paprociowe Szrenica, Szrenica2, MałyStaw, MałyStaw2 3 zbiorowisko trzęślicy modrej Szrenica2, MałyStaw, MałyStaw2 4 zbiorowisko śmiałka darniowego Szrenica, Szrenica2, MałyStaw, MałyStaw2 5 murawy bliźniczkowe Szrenica, Szrenica2, MałyStaw, MałyStaw2 6 murawy śmiałka pogiętego MałyStaw 7 borówczysko bażynowe Szrenica, Szrenica2, MałyStaw, MałyStaw2 8 borówczysko czernicowe Szrenica, Szrenica2, MałyStaw, MałyStaw2 9 wrzosowisko wysokogórskie MałyStaw, MałyStaw2 2 zbiorowiska antropogeniczne MałyStaw 2 sudeckie zarośla kosówki Szrenica, Szrenica2, MałyStaw, MałyStaw2 22 świerczyny górnoreglowe Szrenica2, MałyStaw2 23 nitrofilne zbiorowiska ruderalne Szrenica, Szrenica2, MałyStaw, MałyStaw2 24 zbiorowisko goryszu miarza MałyStaw, MałyStaw2 25 zbiorowisko pokrzywy zwyczajnej MałyStaw, MałyStaw2 26 zespół szczawiu alpejskiego Szrenica2 27 stawy, jeziora MałyStaw, MałyStaw2 28 acydofilna buczyna górska (podz. typowy) Szrenica, MałyStaw, 29 dolnoreglowy bór świerkowo-jodłowy (postać typowa) Szrenica, MałyStaw 3 górnoreglowa świerczyna sudecka (podział paprociowy) Szrenica 3 górnoreglowa świerczyna sudecka (podział typowy) Szrenica, MałyStaw 32 obszary bez roślinności Szrenica, Szrenica2, MałyStaw, MałyStaw2 73

Po optymalizacji procedury klasyfikacji finalne opracowanie wykonano na całej linii zobrazowania, która swym zasięgiem odpowiadała lokalizacji roślinności subalpejskiej i alpejskiej Karkonoszy polskiej i czeskiej części parku i obejmowała 59x246 pikseli APEX. Obszar ten nazwano Karkonosze. Ponieważ czeska część parku nie posiada opracowanej mapy zbiorowisk roślinnych, dokonano klasyfikacji na całym obszarze położonym powyżej 2 m n.p.m, na podstawie danych referencyjnych pozyskanych z polskiej części parku. Obszar wyselekcjonowano na podstawie Numerycznych Modeli Terenu pozyskanych z obydwu parków narodowych (ryc. 27). Ryc. 27. Zasięg opracowania wyznaczony przez zasięg linii zobrazowania APEX oraz wysokość n.p.m. Na badanym obszarze występują duże deniwelacje, np. kotły polodowcowe (Mały Staw w Karkonoszach Wschodnich czy Śnieżne Kotły w Karkonoszach Zachodnich. Dostarczone przez VITO dane APEX zostały przetworzone finalnie do poziomu 2, jednak nie została na nich przeprowadzona korekcja topograficzna, dlatego zdecydowano się na maskowanie cieni topograficznych, aby uniknąć błędu wystąpienia klasy najbardziej zbliżonej spektralnie do obszaru zacienionego. Dzięki temu możliwe było uzyskanie bardziej rzeczywistej prezentacji terenu na mapie wynikowej. Maska cieni utworzona została na podstawie wartości odbicia spektralnego odczytanych z kanału 4 (946 nm), w którym cienie znacznie się różnicowały. Maskę zbudowano w oprogramowaniu ENVI 5. przy użyciu narzędzia Build Mask, a następnie nałożono na obraz hiperspektralny APEX, wykorzystując narzędzie Apply Mask (ryc. 28). 74

Ryc. 28. Cienie topograficzne (Śnieżne Kotły w Karkonoszach Zachodnich), od lewej: obraz APEX w kompozycji RGB 38 5 5 (64 nm, 547 nm, 46 nm), od prawej: kanał 4 (946 nm, oprogramowanie ENVI 5.) Wizualna analiza wszystkich kanałów zobrazowania APEX przyczyniła się do usunięcia kanałów związanych z absorpcją promieniowania przez parę wodną (zakresy: 335-422 i 759-954 nm, ryc. 29). Zawarta w atmosferze para wodna powoduje zaszumienie kanałów, dlatego stają się one nieprzydatne do analizy właściwości spektralnych obiektów na zobrazowanym terenie. Po ich usunięciu, 252 kanały spektralne zostały wykorzystane do dalszych analiz. Ryc. 29. Krzywe odbicia spektralnego wody (kolor czerwony) oraz roślinności (kolor zielony) na danych APEX po korekcji atmosferycznej (oprogramowanie ENVI 5.). Znacznie wyższe wartości prezentują zakresy związane z absorpcją promieniowania przez parę wodną. 6..2. Redukcja przestrzeni spektralnej Redukcja przestrzeni spektralnej została oparta na dwóch podejściach: transformacji oraz wyborze kanałów spektralnych. Wykorzystano dwie metody transformacji PCA oraz MNF, dostępne w narzędziach oprogramowania ENVI, natomiast wybór kanałów bazujący na modelu opakowanym (wrapper), polegający na odejmowaniu kolejnych kanałów i wyborze najmniej obniżających dokładność klasyfikacji, został przeprowadzony przy użyciu języka programowania IDL. 75

Przeprowadzenie transformacji PCA polegało na wyborze macierzy kowariancji do obliczenia głównych składowych, a następnie określeniu sposobu wyboru najmniej skorelowanych ze sobą kanałów i typu danych wyjściowych. Kanały o najwyższych wartościach własnych (eigenvalues) były brane pod uwagę w dalszej analizie. W niniejszej pracy, na podstawie odczytu wartości własnych kanałów obrazu APEX, jako najbardziej informacyjne wybrano 4 kanałów PCA. Transformacja MNF w ENVI wymagała oszacowania szumów na podstawie statystyk obrazu, dlatego utworzone zostały dwa osobne pliki statystyk: szumu (MNF noise statistics) oraz kanałów MNF (MNF statistics). Podczas transformacji obliczona została średnia dla każdego kanału obrazu oryginalnego oraz utworzone zostały macierze kowariancji i korelacji szumów. Kanały o wysokich wartościach własnych (wyższych niż ) zawierały informację, natomiast kanały o wartościach zbliżonych do zera zawierały szum. Do dalszych analiz wybrano 3 kanałów MNF, co zostało odczytane z krzywej informacyjności, w momencie jej wypoziomowania się (por. podrozdział.2.3.2., ryc. 6). Informacyjność kanałów spektralnych APEX analizowano poprzez odejmowanie zmiennych w rozumieniu kanałów (backward elimination), przeprowadzając 288 klasyfikacji wykorzystujących metodę SVM obszaru testowego okolic Małego Stawu, na którym uprzednio wyznaczono poligony do klasyfikacji i weryfikacji. Podczas każdej klasyfikacji odejmowano jeden kanał z obrazu, aby ocenić, jak zmienia się dokładność całkowita, współczynnik kappa oraz dokładność producenta dla wybranej losowo spośród wszystkich klasy (borówczysko bażynowe) przy braku określonego kanału. Analizy przeprowadzano na dwóch zestawach danych: % wszystkich pikseli wykorzystywanych podczas weryfikacji klasyfikacji i 75% pikseli wylosowanych z utworzonych poligonów weryfikacyjnych. Drugi zestaw został utworzony w celu uniknięcia subiektywizmu i uwiarygodnienia statystycznego danych. Starano się wyselekcjonować kanały najmniej obniżające dokładność w zestawach % i 75% pikseli. Kolejno, wybrano kanały powtarzające się w obydwu zestawach i na nich wykonano klasyfikację obrazu. Wybrano dwa zestawy powtarzających się kanałów, liczące odpowiednio 7 i 8 kanałów 44 (ryc. 3). 44 liczba kanałów wybrana na podstawie najmniejszych różnic pomiędzy wartościami dokładności na oryginalnych oraz zredukowanych o jeden kanał obrazach. Lista powtarzających się kanałów w zestawie % i 75% pikseli weryfikacyjnych: 6 (952 nm), 4 (946 nm), 4 (267 nm), 278 (2385 nm), 3 (533 nm), 2 (578 nm), 27 (64 nm), 37 (637 nm), 38 (64 nm), 39 (643 nm), 4 (645 nm), 42 (65 nm), 27 (4 nm), 5 (374 nm), 22 (834 nm), 2 (899 nm), 27 (954 nm), 279 (239 nm), 4 (45 nm), 5 (46 nm), 6 (47 nm), 7 (48 nm), 8 (49 nm), 9 (499 nm), (59 nm), (58 nm), 7 (558 nm), 8 (564 nm), 9 (569 nm), 2 (574 nm), 22 (582 nm), 23 (586 nm), 26 (599 nm), 28 (68 nm), 29 (63 nm), 3 (68 nm), 32 (624 nm), 33 (627 nm), 36 (634 nm), 4 (648 nm), 46 (663 nm), 47 (666 nm), 57 (699 nm), 76

6 4 3 27 38 4 27 22 277 4 6 8 7 9 22 26 29 32 36 46 57 82 84 93 7 3 3 32 34 39 5 67 69 8 % spadku dokładności 2,34 2,32 2,3 2,28 2,26 2,24 2,22 2,2 2,8 2,6 2,4 numer kanału Ryc. 3. Spadek dokładności całkowitej klasyfikacji wywołany brakiem określonego kanału. Kolorem czerwonym oznaczono 8 pierwszych kanałów, tworzący zestaw kanałów do klasyfikacji, kolorem niebieskim oznaczono 52 pozostałe kanały, które wspólnie z zestawem utworzyły zestaw złożony z 7 wybranych kanałów. 6.2. Klasyfikacja danych hiperspektralnych APEX Schemat postępowania przedstawiający kolejne kroki pracy składał się z dwóch równoległych elementów: pozyskania danych do klasyfikacji oraz przetwarzania obrazu hiperspektralnego (ryc. 3). Jako dane w części a rozumiany był materiał referencyjny do opracowania wzorców do klasyfikacji i weryfikacji w postaci mapy roślinności nieleśnej Wojtunia i Żołnierza z 22, jak również informacje pozyskane podczas badań terenowych. Dodatkowo, w celu odróżnienia wizualnego poszczególnych klas zbiorowisk roślinnych wykorzystana została ortofotomapa o wyższej rozdzielczości przestrzennej. Przetwarzanie skalibrowanego obrazu APEX rozpoczęto od korekcji geometrycznej oraz atmosferycznej i te procesy zostały wykonane w VITO. Wymaskowano też głębokie cienie na obrazie. Na podstawie wybranych obszarów testowych starano się dobrać optymalną liczbę kanałów spektralnych, parametry klasyfikacji SVM (funkcje jądrowe, parametry poszczególnych funkcji), a także liczbę klas oraz pikseli użytych do opracowania finalnego, a następnie przeprowadzono właściwą klasyfikację na całym analizowanym obszarze. 8 (8 nm), 82 (85 nm), 83 (8 nm), 84 (86 nm), 9 (85 nm), 93 (868 nm), (923 nm), 7 (96 nm), 2 (3 nm), 3 (2 nm), 29 (6 nm), 3 (74 nm), 3 (8 nm), 32 (89 nm), 33 (99 nm), 34 (29 nm), 38 (247 nm), 39 (257 nm), 4 (276 nm), 5 (364 nm), 66 (57 nm), 67 (526 nm), 68 (535 nm), 69 (545 nm), 74 (59 nm), 8 (654 nm), 96 (784 nm). 77

W dalszym etapie dokonano analiz poklasyfikacyjnych, w rozumieniu utworzenia macierzy błędów oraz obliczenia poszczególnych dokładności, opisanych w rozdziale 2. Ostatnim etapem było przedstawienie wyników, w postaci mapy rozkładu zbiorowisk roślinnych Karkonoszy oraz zestawu dokładności klasyfikacji. Ryc. 3. Schemat postępowania podczas klasyfikacji obrazów hiperspektralnych APEX 6.2.. Dane referencyjne Bardzo ważnym materiałem referencyjnym do wykonania klasyfikacji była mapa roślinności nieleśnej autorstwa Wojtunia i Żołnierza z roku 22, opisana w podrozdziale 5.2. Mapa w wersji wektorowej została nałożona na obraz hiperspektralny APEX i na podstawie analizy różnych kompozycji barwnych zobrazowania oraz przebiegu granic wydzieleń wyznaczono płaty roślinności, składające się na wzorce do klasyfikacji. Ponadto, pomocniczo wykorzystano ortofotomapę o rozdzielczości przestrzennej 2 cm, która dzięki większej niż w przypadku obrazu APEX szczegółowości terenowej, pozwoliła na precyzyjną identyfikację trudniej wyznaczalnych granic zbiorowisk. 78

Wstępne klasyfikacje na obszarach testowych okolic Szrenicy i Małego Stawu przeprowadzane były na podstawie wymienionych materiałów. Istotnym elementem dającym możliwość oceny wiarygodności uzyskanych w procesie klasyfikacji wyników była weryfikacja terenowa. Nalot nad Karkonosze z użyciem skanera APEX wykonano września, zatem ważne było aby badania terenowe wykonane były w zbliżonym czasie, ze względu na podobieństwo fazy rozwoju wegetacyjnego roślinności. Weryfikacja terenowa była wykonana dwukrotnie, w dniach 2-3.8.23 oraz 3-3.8.24. Pierwszy termin dotyczył weryfikacji wstępnych wyników dla obszarów testowych Szrenicy i Małego Stawu, uzyskanych na podstawie samej informacji pochodzącej z mapy roślinności nieleśnej Wojtunia i Żołnierza (22), różnych kompozycji barwnych zobrazowania APEX oraz ortofotomapy. Mapy będące wynikami wstępnych analiz załadowano do odbiornika GPS Trimble GeoXT i podczas terenowej marszruty określano dokładność wyników klasyfikacji w terenie. Oznaczano zbiorowiska, które klasyfikowały się poprawnie, jak również obszary sklasyfikowane błędnie. Każdy poligon badawczy miał określone współrzędne GPS, był też opatrzony zdjęciem w celu łatwiejszej identyfikacji w procesie późniejszego opracowania kameralnego. W połączeniu z informacją z mapy wektorowej dotyczącej zbiorowisk nieleśnych Wojtunia i Żołnierza oraz ortofotomapy, poligony wyznaczone w terenie posłużyły jako wzorce do weryfikacji kolejnych klasyfikacji, pozwalając tym samym na zwiększenie ich dokładności. W roku 24 odbyła się ostateczna weryfikacja terenowa, podczas której skupiano się przede wszystkim na miejscach jeszcze niezinwentaryzowanych oraz tych, do których podczas poprzednich kampanii pomiarowych nie udało się dotrzeć. Weryfikacja objęła okolice Szrenicy, w odróżnieniu od poprzedniego roku głównie zachodnie jej części, oraz rejon Małego Stawu, ze szczególnym uwzględnieniem zbiorowisk problematycznych, znajdujących się na południowym obszarze jeziora, które podczas pierwszych klasyfikacji klasyfikowały się niepoprawnie. Łącznie zgromadzono 82 zidentyfikowanych płatów roślinności zapisanych w formacie wektorowym *.shp (shapefile). 6.2.2. Wybór wzorców do klasyfikacji i weryfikacji Proces przygotowywania wzorców rozpoczęto od utworzenia niezależnych poligonów treningowych oraz testowych w formacie *.roi (Region of Interest), które wyznaczane były w oprogramowaniu ENVI 5.. W przypadku większości zbiorowisk było możliwe utworzenie poligonów składających się z powyżej pikseli, natomiast dla zbiorowisk zajmujących niewielkie powierzchnie, jak np. ziołorośle miłosny górskiej było 79

to zaledwie kilkanaście pikseli treningowych. Zdecydowano się utworzyć różne zestawy danych treningowych i weryfikacyjnych przy użyciu wybranych metod próbkowania, aby porównać wyniki. Charakterystykę zestawów danych zawiera tabela 5. Tab. 5. Charakterystyka zestawów danych utworzonych dla analizowanych obszarów (t dane treningowe, w dane weryfikacyjne) zestaw kanałów Obszar testowy MałyStaw2 Obszar główny Karkonosze 252 oryginalne kanały spektralne 252 oryginalne kanały spektralne 3 MNF 4 PCA 4 PCA 8 i 7 kanałów spektralnych całe poligony t i w całe poligony t i w metoda jednorazowy podział losowy w jednorazowy podział losowy* t i w próbkowania - -krotny podział losowy t i w * stała oraz zmienna liczba pikseli treningowych - Obszar testowy Małego Stawu klasyfikowano przy użyciu całych utworzonych poligonów treningowych oraz weryfikacyjnych, a także wykorzystując metodę losowania 75% i % próbek z zestawu danych i weryfikacyjnych i takie zestawy wykorzystane były do klasyfikacji zarówno obrazu oryginalnego, jak i po przeprowadzeniu trzech metod redukcji spektralnej. W wyniku testowania algorytmu klasyfikacji zaobserowowano możliwości łączenia ze sobą niektórych klas, np. ze względu na podobieństwo spektralne i fizjonomiczne klasy nitrofilnych zbiorowisk dużych bylin, a także zbiorowiska pokrzywy zwyczajnej, po konsultacji fitosocjologicznej piksele je reprezentujące zostały zagregowane do jednej wspólnej klasy o nazwie nitrofilne zbiorowiska ruderalne i taką klasę reprezentowały dla całego obszaru Karkonosze. Podobnie, sudeckie zarośla kosówki i kosodrzewina na torfie ze względu na podobieństwo spektralne i różnice jedynie we właściwościach podłoża, zostały zagregowane do jednej, większej klasy (sudeckie zarośla kosówki). Obszary bez roślinności oraz wczesne stadia sukcesji zostały również połączone w jedną klasę (o nazwie obszary bez roślinności) ze względu na zbliżone odbicie spektralne, które skutkowało często ich myleniem i występowaniem błędnych pikseli reprezentujących wczesne stadia sukcesji na obszarach np. wokół stawów lub na szlakach. Zrezygnowano także z wydzielania klasy zbiorowisk antropogenicznych, w których miejscu faktycznie znajdowały się większe obszary zbiorowiska śmiałka darniowego. Podjęto również decyzję o wyłączeniu z opracowania końcowego niektórych klas obejmujących niewielkie obszary (np. klasa zbiorowisko goryszu miarza obejmowała 8

łącznie na całym obrazie niecałe 2 pikseli, podobnie klasa murawy śmiałka pogiętego, która była znacznie przeszacowywana). Na obszarze głównym Karkonosze wzięto pod uwagę tylko te klasy, które uznano za reprezentatywne na podstawie poprzednich klasyfikacji obszarów testowych. W tym przypadku również zastosowano próbkowanie przy użyciu całych poligonów (ryc. 32) oraz losowanie spośród pikseli w ich obrębie, proporcjonalne do wielkości klas. W losowaniu zastosowano dwa podejścia, w pierwszym dla klas najbardziej licznych wylosowano po 2 pikseli treningowych, przy 4 pikselach weryfikacyjnych, klasy mniej liczne liczyły odpowiednio mniej próbek (tab. 6). W tym przypadku losowanie wykonywano jednorazowo, jak również zastosowano metodę iteracyjną, polegającą na losowaniu - krotnym, dzięki któremu uzyskano wyników dokładności klasyfikacji, co pozwoliło na większe zobiektywizowanie wyników. W drugim podejściu podjęto próbę sprawdzenia dokładności klasyfikacji w zależności od liczebności zestawu treningowego, więc zastosowano zmienną liczbę pikseli treningowych poprzez ich losowanie, rozpoczynając od 5, przez, 2 do 3 dla każdej z klas, dla których było to możliwe (3 klas). Liczba pikseli weryfikacyjnych dla tego podejścia była niezmienna i wynosiła 4 próbek. Ryc. 32. Od lewej: poligony treningowe, od prawej: poligony weryfikacyjne (kanał : 43 nm, oprogramowanie ENVI 5.3) 8

Tab. 6. Liczba pikseli wykorzystanych do klasyfikacji oraz weryfikacji przy wykorzystaniu metody proporcjonalnego losowania pikseli (stratified random sampling) L. p. Klasa Piksele treningowe Wylosowane piksele treningowe Piksele weryfikacyjne Wylosowane piksele weryfikacyjne chinofilne porosty naskalne 582 2 6 4 2 chinofobne porosty naskalne 7 5 34 3 3 murawy halne (forma subalpejska) 267 2 389 3 4 murawy halne (forma alpejska) 6 235 2 5 zbiorowiska źródlisk niewapiennych 3 3 62 6 6 zbiorowiska torfowisk przejściowych 236 2 53 4 7 zbiorowiska torfowisk wysokich 345 2 59 4 8 traworośla wysokogórskie 33 2 593 4 9 traworośle trzcinnika owłosionego 456 2 668 4 zarośla czeremchy i jarzębiny 93 2 44 4 zarośla wierzby lapońskiej 58 5 2 ziołorośle miłosny górskiej 2 25 2 3 ziołorośle paprociowe 53 2 8 4 4 zbiorowisko trzęślicy modrej 347 2 525 4 5 zbiorowisko śmiałka darniowego 496 2 5 4 6 murawy bliźniczkowe 546 2 79 4 7 borówczysko bażynowe 59 5 322 3 8 borówczysko czernicowe 668 2 35 4 9 wrzosowisko wysokogórskie 67 5 28 2 sudeckie zarośla kosówki 2463 2 55 4 2 świerczyny górnoreglowe 2 22 4 22 nitrofilne zbiorowiska ruderalne 39 3 8 6 23 stawy, jeziora 524 2 76 4 24 obszary bez roślinności 239 2 47 4 Utworzone wzorce do klasyfikacji w postaci plików *.roi posłużyły do przeprowadzenia klasyfikacji przy użyciu metody maszyn wektorów nośnych (SVM). 6.2.3. Klasyfikacja przy użyciu maszyn wektorów nośnych (SVM) Do klasyfikacji wykorzystany został algorytm SVM, który jest zaimplementowany w narzędziach do klasyfikacji nadzorowanej w oprogramowaniu ENVI, a także w pakiecie e7 oprogramowania R. Do jej wykonania wymagane było utworzenie wzorców do 82

klasyfikacji w formacie *.roi lub *.shp, co zostało opisane w podrozdziale 5.3.. Utworzone wzorce posłużyły jako zbiór danych treningowych i na ich podstawie sklasyfikowano obraz. Na etapie wyboru obrazu możliwy był wybór kanałów spektralnych, na których wykonana została klasyfikacja. W podrozdziale 6..2 opisano metody redukcji przestrzeni spektralnej, które zastosowano na obszarze testowym obrazu APEX, i na podstawie których wybrano różne zestawy kanałów do klasyfikacji. Były to kolejno: 4 kanałów PCA, 3 kanałów MNF, 8 i 7 kanałów z analizy informacyjności, a także 252 oryginalne kanały APEX. Po wyborze zestawu kanałów wskazano wszystkie utworzone klasy, a następnie wybrano odpowiednie opcje SVM, uwzględniając typ funkcji jądrowej i związane z nią parametry. Zdecydowano się na przetestowanie czterech funkcji jądrowych, aby wybrać tę, która daje najlepsze rezultaty. Parametr kary C, wymagany dla wszystkich funkcji jądrowych, był dobrany na podstawie sprawdzenia dokładności klasyfikacji obszaru MałyStaw2, przy zastosowaniu różnych jego wartości, rozpoczynając od,, poprzez dziesięciokrotne zwiększanie tej wartości, kolejno:,, oraz. Funkcja wielomianowa wymagała dopasowania stopnia wielomianu, który, bazując na pracy Shah i in. (23) wykazującej spadek dokładności klasyfikacji wraz ze wzrostem stopnia wielomianu, potwierdzonymi badaniami w niniejszej pracy 45, pozostał jako wartość 2. Wartość przesunięcia (bias) funkcji wielomianowej oraz sigmoidalnej została ustawiona jako, co jest wartością domyślną, uznaną za optymalną 46. Parametr gamma, wymagany dla funkcji radialnej oraz sigmoidalnej, również poddawany był testowaniu różnych wartości, sprawdzając dokładności klasyfikacji na danych oryginalnych oraz danych po jednym ze sposobów redukcji spektralnej (transformacja PCA). Dla każdego z dwóch zestawów kanałów testowano wartości:, wartość odpowiadającą liczbie kanałów oraz odwrotność liczby kanałów, która była wartością domyślną. Dla 252 oryginalnych kanałów APEX parametr ten określony został jako,4, dla kanałów MNF,33, dla 4 kanałów PCA,25. We wszystkich funkcjach zastosowano te same wartości poszczególnych parametrów, w celu ich porównania. Jak opisano w podrozdziale 6.2.2., dla obszaru głównego Karkonosze zastosowano dodatkową metodę próbkowania polegającą na -krotnym losowaniu pikseli treningowych i weryfikacyjnych, której przeprowadzenie możliwe jest w programie R. Możliwe było również przeprowadzenie całego procesu klasyfikacji przy użyciu maszyn 45 testowano trzy stopnie wielomianu: 2, 3 oraz 4, wykazując spadek dokładności klasyfikacji odopowiednio o,9 oraz,4% dokładności. 46 http://www.harrisgeospatial.com/docs/supportvectormachine.html, stan na dzień 8.6.26. 83

wektorów nośnych w tym programie, wykorzystując pakiet e7. Podział próbek był pierwszym etapem przygotowawczym do klasyfikacji, następnie dokonano doboru parametrów decydując się odgórnie na wybór jednej z funkcji jądrowych SVM. Melgani i Bruzzone (24) sugerują stosowanie a priori funkcji radialnej, która m.in. powoduje mniej trudności obliczeniowych i należy dopasować jedynie szerokość Gaussa, za którą odpowiada parametr gamma, ma ponadto bardziej praktyczne zastosowanie od np. funkcji sigmoidalnej. Z podobnych powodów wybór tej funkcji odgórnie zaleca również Meyer (2). Ponieważ klasyfikacja danych na próbkach wylosowanych -krotnie wykonana została jako osobna procedura na danych po transformacji PCA, zdecydowano się zastosować radialną funkcję jądra, ze względu na fakt, iż dokładność klasyfikacji dla danych z obszaru testowego MałyStaw2 po transformacji PCA była najwyższa dla tej właśnie funkcji. Dodatkowym warunkiem wyboru była możliwość dopasowania parametru gamma do wymaganego we wszystkich funkcjach parametru kary C w sposób automatyczny przy użyciu siatki wyszukiwania (grid search), co określane jest jako tuning parametrów. Uzyskano wartości parametrów: gamma równą, oraz C równą 9. 6.2.4. Weryfikacja i ocena jakości klasyfikacji Do weryfikacji uzyskanych wyników dla zestawów danych opracowanych w oprogramowaniu ENVI wykorzystano niezależne od danych treningowych poligony składające się z pikseli weryfikacyjnych zapisane w plikach *.roi, z których dokonywano losowania. W oprogramowaniu R przygotowane wzorce zapisane w plikach *.roi w programie ENVI należało wyeksportować do plików ASCII 47, a następnie w programie R przeprowadzono -krotne losowanie próbek z puli dostępnych pikseli treningowych i weryfikacyjnych (przygotowanie wzorców weryfikacyjnych opisano w podrozdz. 6.2.2.). Ocena ilościowa dokonana została na podstawie macierzy błędów (error matrix), wyrażającej, w jaki sposób zostały zaklasyfikowane piksele z zestawu danych treningowych w odniesieniu do pikseli z zestawu danych weryfikacyjnych (Congalton 99). W kolumnach macierzy zestawiane są próbki weryfikacyjne, natomiast wiersze reprezentują klasy uzyskane w wyniku klasyfikacji. Wartości liczbowe znajdujące się na przekątnej macierzy, odpowiadające właściwym klasom, oznaczają piksele sklasyfikowane poprawnie. Na podstawie utworzonej w ten sposób macierzy błędów możliwe było 47 ASCII (American Standard Code for Information Interchange) amerykański standard kodowania na potrzeby wymiany informacji, który obejmuje małe i wielkie litery, cyfry i znaki przestankowe oraz niedrukowalne znaki sterujące (Gaździcki 23). 84

obliczenie charakterystyk liczbowych, określających dokładności dla całego obrazu, jak również dla poszczególnych klas. Dokładność całkowitą (overall accuracy, A ov ) obliczono przez podzielenie liczby pikseli sklasyfikowanych poprawnie (x ii ) przez całkowitą liczbę pikseli (N) w macierzy: ov r i x ii N Dokładność dla poszczególnych klas została określona poprzez obliczenie dokładności użytkownika oraz producenta, a także błędu przeszacowania i niedoszacowania 48. Dokładność użytkownika (user accuracy, A u ) oznaczała liczbę pikseli poprawnie zaklasyfikowanych do danej klasy (x ii ), podzieloną przez liczbę pikseli w klasie według klasyfikacji (x i_klas ): (2) u x ii x i klas (3) Dokładność producenta (producer accuracy, A p ) obliczono poprzez podzielenie liczby pikseli zaklasyfikowanych do klasy poprawnie (x ii ) przez łączną liczbę pikseli w klasie wzorcowej (x i_wer ): p x ii x i wer (4) Dodatkową miarą był współczynnik kappa (κ, Cohen 96), który wykorzystuje wszystkie informacje zawarte w macierzy błędów do przypadkowego przydzielenia klas. Na tej podstawie definiowana jest proporcjonalna redukcja błędów powstałych w wyniku klasyfikacji w stosunku do błędów klasyfikacji przeprowadzonej przypadkowo. Współczynnik kappa informuje więc o tym, o ile wykonana klasyfikacja jest lepsza od klasyfikacji przypadkowej (Stehman 996, Zagajewski 2). Przyjmuje on wartości od do, wyższe wartości oznaczają przeprowadzenie lepszej klasyfikacji, wartość świadczy o poprawnej identyfikacji wszystkich klas, natomiast wzrost wartości w komórkach macierzy znajdujących się poza przekątną oznacza spadek wartości współczynnika (Tso, Mather 29). Współczynnik kappa (κ) określany jest wzorem: κ N r x r i ii i x i x i N 2 r i x i x i gdzie: r liczba kolumn (i wierszy) w macierzy błędów, x ii suma wartości z komórek przekątnych macierzy, x i, x i sumy pikseli w kolumnach i wierszach, (5) 48 na podstawie macierzy błędów możliwe jest także obliczenie błędów: przeszacowania (comission) określającego, jak często dana klasa znajduje się w innych wzorcach weryfikacyjnych, oraz niedoszacowania (omission) przedstawiającego, jaka część pikseli każdego wzorca weryfikacyjnego została błędnie zaklasyfikowana do innej klasy (Congalton 99). W niniejszej pracy skupiono się na dokładnościach użytkownika i producenta dla każdej z klas. 85

N liczba obserwacji (liczba pikseli we wszystkich klasach wzorców weryfikacyjnych, Tso, Mather 29). Na podstawie porównania każdego z wyników klasyfikacji w postaci obrazów z pikselami weryfikacyjnymi, zarówno dla obszaru testowego MałyStaw2, jak i głównego obszaru Karkonosze opracowane zostały macierze błędów, reprezentujące wyniki klasyfikacji w wierszach oraz dane weryfikacyjne w kolumnach macierzy. Bazując na zawartych w nich wartościach liczbowych obliczono dokładności całkowite i współczynniki kappa, a także dokładności użytkownika oraz producenta dla poszczególnych klas zbiorowisk roślinnych (tab. 7-). Wartości zestawiono w tabelach w celu ich porównania. Ponadto, dokonano oceny wizualnej obrazów uzyskanych w wyniku klasyfikacji, porównując je z materiałami referencyjnymi. 86

7. Wyniki Dzięki klasyfikacji obszarów testowych, jak również całej linii zobrazowania APEX uzyskano wyniki w postaci obrazów, a także zestawów statystyk dla klas. Dokładności uzyskane dla wstępnych klasyfikacji wykonanych na wszystkich obszarach testowych zestawiono w tabeli 7. Klasyfikacje wszystkich obszarów testowych przeprowadzono przy użyciu liniowej funkcji jądra SVM, przy parametrze kary C równym, a także dla wszystkich oryginalnych kanałów APEX. Mapy uzyskane w wyniku klasyfikacji obszaru Szrenicy zaprezentowano w publikacjach autorki (Marcinkowska i in. 24a, 24b), gdzie szczegółowo opisano uzyskane wyniki. Tab. 7. Dokładności klasyfikacji analizowanych obszarów Obszar Liczba klas Dokładność całkowita (%) Współczynnik kappa Szrenica* 5 79,3,77 Szrenica2** 6 75,36,73 MałyStaw* 3 79,99,79 MałyStaw2** 24 82,69,8 * dane poziomu ** dane skorygowane (poziom 2) Ogółem, dokładności całkowite klasyfikacji oscylowały wokół 8%, najniższą osiągnięto dla obszaru Szrenica2 (75,36%), przy współczynniku kappa,73, natomiast najwyższą dla obszaru MałyStaw2 (82,69%); współczynnik kappa,8. Na każdym z obszarów klasyfikowana była różna liczba zbiorowisk roślinnych, w dwóch przypadkach (obszary Szrenica i MałyStaw) identyfikacji poddano także zbiorowiska leśne poniżej piętra subalpejskiego. Na podstawie interpretacji wyników uznano, że zbiorowiska te różnią się znacznie od roślinności nieleśnej pod względem fizjonomii oraz samego sposobu pozyskiwania dla nich danych treningowych i weryfikacyjnych, i powinny być traktowane jako odrębny przedmiot badań. W dalszej części pracy zrezygnowano w ich wydzielania, pozostając jedynie przy świerczynach górnoreglowych, które fragmentarycznie wkraczały na badany obszar. Istotny w interpretacji był także poziom przetworzeń danych APEX. Obrazy przetworzone do poziomu 2, które otrzymano w dalszym etapie prac, pozbawione były wpływu atmosfery, co pozwoliło ocenić wyniki jako bardziej wiarygodne. Zależność tę zaobserwowano przeprowadzając niezależną próbę porównania wyników na obrazach poziomu oraz 2, przy jednakowej liczbie klas 87

i wykorzystanych jednakowych wzorcach do klasyfikacji i weryfikacji 49. Przedstawione wstępne wyniki klasyfikacji były niejako wprowadzeniem do szczegółowych analiz opisanych w podrozdziałach 7..-7.2. 7.. Wyniki optymalizacji i testowania algorytmu klasyfikacji Obszar testowy okolic Małego Stawu obejmujący 24 klasy zbiorowisk roślinnych poddano klasyfikacjom uwzględniając wszystkie cztery funkcje jądra SVM i zmienność ich parametrów, a także na danych wejściowych o różnej liczbie kanałów i różnym sposobie próbkowania. Rycina 33 przedstawia wyniki uzyskane dla fragmentu obszaru sklasyfikowanego przy użyciu całych poligonów, natomiast tabela 8 prezentuje dokładności całkowite klasyfikacji według funkcji jądra, uzyskane dla danych oryginalnych, dla których początkowo ustawiono domyślne parametry każdej z funkcji 5. A B C D Ryc. 33. Wyniki klasyfikacji uzyskane dla fragmentu obszaru testowego MałyStaw2,A: dla funkcji liniowej, B: dla funkcji wielomianowej, C: dla funkcji radialnej, D: dla funkcji sigmoidalnej (oprogramowanie ENVI 5.2) 49 dokładność całkowita danych poziomu wyniosła 7,%, współczynnik kappa,68, dla obrazu poziomu 2 78,62% oraz,77. Na ogół dokładność klasyfikacji po wykonaniu korekcji atmosferycznej obrazów wzrosła, na przykład: klasa ziołorośle miłosny górskiej, na danych poziomu niesklasyfikowana w ogóle (% dokładności użytkownika oraz producenta), po wykonaniu korekcji przy użyciu NMT możliwe było jej nieznaczne wyekstrahowanie (23,% dokładność producenta, 2,% użytkownika). Znaczny wzrost dokładności zaobserwowano także w przypadku klas: traworośla wysokogórskie (o 5,3% dokładności producenta oraz 5,3% dokł. użytkownika), zbiorowiska źródlisk niewapiennych (o 8,8% dokł. producenta, o 24% dokł. użytkownika), czy zbiorowiska śmiałka darniowego (aż o 6,8% dokładności producenta oraz o 24,9% dokładności użytkownika). W dużym stopniu udało się także poprawić dokładność problematycznej w klasyfikacji klasy zarośla wierzby lapońskiej, której dokładność producenta wzrosła o około 26%, natomiast dokładność użytkownika o 3%. Klasyfikacje przeprowadzono w ramach projektu realizowanego dzięki stypendium Fundacji im. Anny Pasek, przyznanemu autorce pracy na rok akademicki 23/24. 5 parametr C równy, parametr gamma równy odwrotności liczby kanałów. 88

Ocena wizualna pozwala zauważyć niewielkie różnice zajmowanych przez daną klasę obszarów. Najwyraźniej od pozostałych wyników odróżnia się wynik uzyskany dla funkcji sigmoidalnej, znacznie przeszacowując klasę zaznaczoną na kolor bordowy, oznaczającą sudeckie zarośla kosówki. Większe różnice dla wszystkich funkcji zauważalne są w tabeli z dokładnościami uzyskanymi dla oryginalnych kanałów APEX. Tab. 8. Dokładności klasyfikacji według typu funkcji jądrowej i metody próbkowania uzyskane dla 252 oryginalnych kanałów APEX Funkcja jądra SVM Dokładność całkowita (%) całe poligony Dokładność całkowita (%) wylosowane próbki liniowa (linear) 82,69 74,35 radialna funkcja bazowa (RBF) 72,82 73,57 wielomianowa (polynomial) 72,77 73,57 sigmoidalna (sigmoid) 59,69 7,78 Najlepsza dokładność całkowitą ogółem osiągnięto dla funkcji liniowej przy użyciu całych poligonów do klasyfikacji (82,69%), o ponad 8% niższą dla tej samej funkcji przy zastosowaniu pikseli wylosowanych (74,35%). W klasyfikacji przeprowadzonej na całych poligonach drugą z funkcji jądra, pod względem dokładności była funkcja radialna, dla której dokładność była niższa o niemal %, a zbliżony do niej wynik osiągnięto dla funkcji wielomianowej. Dla zastosowanych pikseli wylosowanych różnica pomiędzy funkcją liniową była niewielka i zarówno dla funkcji radialnej, jak i wielomianowej wynik był identyczny (73,57%). Najniższą dokładność odnotowano dla funkcji sigmoidalnej, dla której wykorzystano całe poligony (23% mniej w stosunku do funkcji liniowej). Dla niej również osiągnięto najniższy wynik podczas losowania pikseli, natomiast dokładność względem funkcji liniowej była w tym przypadku niższa jedynie o niecałe 3%. Wynik klasyfikacji uzyskany dla obszaru testowego MałyStaw2 przy użyciu wylosowanych próbek metodą proporcjonalnego podziału, a także funkcji liniowej na 252 oryginalnych kanałach APEX prezentuje rycina 34 5. 5 mapa w tym podrozdziale zaprezentowana jest jedynie w celach poglądowych, szczegółowy opis dokładności uzyskanych dla klas przedstawiony został w innej publikacji autorki (Marcinkowska-Ochtyra i in. 26). 89

Ryc. 34a) Fragment mapy roślinności nieleśnej (Wojtuń, Żołnierz 22), b) wynik klasyfikacji obszaru MałyStaw2. murawy bliźniczkowe, 2 borówczysko bażynowe, 3 sudeckie zarośla kosówki, 4 kosodrzewina na torfie, 5 traworośla wysokogórskie, 6 traworośle trzcinnika owłosionego, 7 zarośla czeremchy i jarzębiny, 8 zarośla wierzby lapońskiej, 9 ziołorośle paprociowe, ziołorośle miłosny górskiej, zbiorowiska torfowisk przejściowych, 2 zbiorowiska torfowisk wysokich, 3 zbiorowiska źródlisk niewapiennych, 4 nitrofilne zbiorowiska dużych bylin, 5 świerczyny górnoreglowe, 6 chinofilne porosty naskalne, 7 chinofobne porosty naskalne, 8 borówczysko czernicowe, 9 wrzosowisko wysokogórskie, 2 zbiorowisko trzęślicy modrej, 2 zbiorowiska antropogeniczne, 22 murawy śmiałka pogiętego, 23 zbiorowisko śmiałka darniowego, 24 zbiorowisko goryszu miarza, 25 zbiorowisko pokrzywy zwyczajnej, 26 wczesne stadia sukcesji, 27 obszary bez roślinności, 28 stawy, jeziora, 29 obszary wymaskowane (Marcinkowska-Ochtyra i in. 26). 9 Interpretacja wizualna mapy wynikowej potwierdza wyniki pochodzące z oceny dokładności. Uzyskana w procesie klasyfikacji mapa zbiorowisk roślinnych jest zbliżona do mapy referencyjnej Wojtunia i Żołnierza, jednak należy zwrócić uwagę na jej aktualność (rok 22), a także uwzględnić aktualność informacji pozyskanych w terenie w latach 23-24. Zasięgi niektórych zbiorowisk nie uległy znacznym zmianom względem roku 22, natomiast część z nich nie była możliwa do zidentyfikowania, bądź zmieniła swe położenie. Z racji że najwyższy wynik uzyskano dla funkcji liniowej SVM, analizę wpływu zredukowanych zestawów danych na dokładność klasyfikacji przeprowadzono przy użyciu tej funkcji, stosując jej parametry wykorzystane w poprzednim kroku. W tabeli 9 zaprezentowano uzyskane dokładności klasyfikacji dla różnych utworzonych zestawów danych wejściowych po redukcji spektralnej. Dodatkowo, aby przedstawić znaczenie przeprowadzenia redukcji (co opisano w podrozdziale.2.3.), w ostatniej kolumnie dodano informację o rozmiarze pliku wynikowego, podaną w megabajtach.

dokładność klasyfikacji (%) Tab. 9. Dokładności klasyfikacji dla różnych zestawów kanałów APEX Liczba kanałów Dokładność całkowita (%) Współczynnik kappa Rozmiar pliku (MB) 252 kanały 82,69,83 465, 4 kanałów PCA 8,4,79 64,6 3 kanałów MNF 8,76,79 48,4 7 kanałów* 76,68,74 3, 8 kanałów* 68,4,65 3,7 * kanały uzyskane z analizy informacyjności przeprowadzonej metodą backward elimination Najwyższą dokładność całkowitą wraz ze współczynnikiem kappa osiągnięto dla oryginalnych 252 kanałów (82,69%,,83), następnie dla 4 kanałów PCA (8,4%,,79), najniższą wartość dokładności przyjął zaś obraz złożony z 8 kanałów z analizy informacyjności (68,4%,,65). Zauważono, że znaczna redukcja wielkości obrazu, jak w przypadku metody PCA (ponad 7 razy mniejszy objętościowo obraz) spowodowała spadek dokładności o niecałe 2%, co pozwoliło stwierdzić dużą przydatność metod redukcji przestrzeni spektralnej, zwiększając operacyjność procesu klasyfikacji. Analizę wrażliwości dokładności klasyfikacji wywołanej zmiennym parametrem kary C dla każdej z funkcji jądrowych SVM na dwóch zestawach danych przedstawiono na rycinach 35 i 36. 9 85 8 75 7 65 6 55 5 45 4, parametr C Funkcja jądra: liniowa radialna wielomianowa sigmoidalna Ryc. 35. Dokładności całkowite klasyfikacji 252 oryginalnych kanałów APEX w zależności od zmiennego parametru C dla czterech funkcji jądra SVM 9

dokładność klasyfikacji (%) 9 85 8 75 7 65 6 Funkcja jądra: liniowa radialna wielomianowa sigmoidalna 55 5, parametr C Ryc. 36. Dokładności całkowite klasyfikacji 4 kanałów z transformacji PCA w zależności od zmiennego parametru C dla czterech funkcji jądra SVM W przypadku zarówno kanałów oryginalnych, jak i kanałów z analizy głównych składowych, zauważa się ogólny wzrost dokładności klasyfikacji wraz ze wzrostem wartości parametru kary C. Jedynie dla funkcji liniowej w zestawie 4 kanałów PCA przy najwyższej wartości parametru () nastąpił spadek o % względem wartości niższej (). Dla tego zestawu najwyższa dokładność wystąpiła dla funkcji radialnej (8,7%), następnie dla funkcji wielomianowej (8%). Przebieg tych funkcji jest podobny na obydwu wykresach. Ponadto, w przypadku trzech funkcji poza liniową, dla danych zredukowanych zauważalne są wyższe wartości dokładności klasyfikacji niż dla danych oryginalnych, a największe różnice obserwowane są przy niższych wartościach parametru C (,). Wyniki korygowano także wizualnie, oceniając poprawność przyporządkowanych klas. Dla funkcji radialnej, dla której wymagane jest również wprowadzenie parametru gamma 52, został on przetestowany na dwóch zestawach danych: orginalnych oraz po transformacji PCA. Do obydwu zestawów zastosowano wartości parametru odpowiadające: liczbie wykorzystanych kanałów, odwrotności liczby wykorzystanych kanałów oraz wartości. Dopasowanie parametru przeprowadzono przy dającym w poprzedniej analizie najlepsze wyniki dokładności parametrze kary C () 53. Wyniki dokładności prezentuje tabela. 52 parametr gamma jest również wymagany dla funkcji sigmoidalnej, jednak ze względu na najniższe wyniki dokładności osiągane przy użyciu tej funkcji analizę wpływu parametru na jej dokładność pominięto. 53 dokładność uzyskana przy zastosowaniu parametru C równego oraz była niższa. 92

Tab.. Dokładności klasyfikacji 252 oryginalnych kanałów oraz 4 kanałów PCA, w zależności od wartości parametru gamma Dokładność klasyfikacji (%) dla radialnej funkcji bazowej Wartość parametru gamma 54 252 oryginalne kanały 4 kanałów PCA,4/,25 78,24 8,7 78,24 8,7 252/4 75, 8,7 Zmiana parametru gamma nie wpłynęła znacząco na dokładności całkowite klasyfikacji. Wartość parametru będąca odwrotnością liczby kanałów dla obrazu oryginalnego dała identyczne wyniki, jak wartość (78,24%). Spadek o około 3% nastąpił przy zwiększeniu parametru do wartości równej 252 wykorzystanych kanałów. W przypadku 4 kanałów PCA zauważyć można jeszcze mniejsze różnice pomiędzy dokładnościami uzyskanymi dla trzech wartości parametru Gamma, o zaledwie,% niższą dokładność uzyskano dla wartości równej 4, natomiast identyczne wartości uzyskano dla parametru równego oraz,25 (8,7%). 7.2. Wyniki klasyfikacji roślinności wysokogórskiej Karkonoszy Przy użyciu metody maszyn wektorów nośnych całej linii zobrazowania APEX pokrywającej najwyższe pasmo Karkonoszy uzyskano wyniki w postaci map roślinności subalpejskiej i alpejskiej. Opracowanie kartograficzne wyników wykonano w programie ArcGIS.3. Przy użyciu narzędzia Data Driven Pages dokonano podziału mapy na 8 arkuszy. Obraz poklasyfikacyjny poddano ponadto generalizacji, w celu dostosowania do skali mapy :5. Granice poszczególnych wydzieleń zbiorowisk roślinnych zostały wygładzone z użyciem funkcji Majority analysis, która pozwala na usunięcie pojedynczych pikseli leżących w obrębie większych klas, dzięki wyborze tzw. okna przeszukującego, w obrębie którego usuwane są pojedyncze piksele i zastępowane taką klasą, jaka występuje w większości pikseli w oknie (zastosowano okno 5x5 pikseli). Ponadto, aby wyeliminować piksele mniejsze bądź równe zadanej wielkości wykorzystuje się funkcję Aggregation (w tym przypadku zadano wartość 25 pikseli). Dzięki tej procedurze poszczególne klasy zostają zgeneralizowane (ryc. 37). 54 przy parametrze C równym. 93

Ryc. 37. Od lewej: wynik oryginalny, przedstawiający przypisane klasy dla każdego piksela osobno, od prawej: obraz po użyciu funkcji Majority Analysis oraz Aggregation (obrazy przed nałożeniem barw odpowiadającym poszczególnym klasom. Oprogramowanie ENVI 5.3) Tabela zawiera wyniki dokładności klasyfikacji uzyskane dla obszaru Karkonosze dla dwóch zestawów danych: oryginalnych oraz 4 kanałów PCA, w zależności od funkcji jądra SVM, dającej najlepsze wyniki. Najwyższą dokładność całkowitą (85,49%) uzyskano dla 4 kanałów PCA przy zastosowaniu funkcji radialnej 55. Dokładność całkowita dla funkcji liniowej i kanałów oryginalnych była o ponad 8% niższa (77%) 56. Ryciny 38-45 prezentują wyniki uzyskane dla danych po transformacji PCA. Tab.. Dokładności klasyfikacji obszaru Karkonosze Zestaw danych Funkcja jądra SVM Dokładność całkowita (%) Współczynnik kappa 4 kanałów PCA radialna 85,49,84 255 oryginalnych kanałów liniowa 77,,76 55 najwyższy wynik uzyskany dzięki -krotnemu losowaniu pikseli treningowych i weryfikacyjnych. Wartość mediany dla wszystkich wyników wyniosła 84,62% dokładności całkowitej, współczynnik kappa,84. 56 wynik uzyskany podczas jednorazowego losowania pikseli treningowych i weryfikacyjnych. 94

Ryc. 38. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz

Ryc. 39. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 2

Ryc. 4. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 3 97

Ryc. 4. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 4 98

Ryc. 42. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 5 99

Ryc. 43. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 6

Ryc. 44. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 7

Ryc. 45. Mapa roślinności subalpejskiej i alpejskiej Karkonoszy będąca wynikiem klasyfikacji 4 kanałów PCA zobrazowania APEX, arkusz 8 2

W tabeli 2 zaprezentowano macierz błędów dla najlepszego pod względem dokładności całkowitej wyniku klasyfikacji przeprowadzonej poprzez -krotne losowanie pikseli, na obrazie z 4 kanałów PCA, wyrażoną w procentach. W kolejnych wierszach macierzy zestawiono wyniki przeprowadzonej klasyfikacji, natomiast kolumny przedstawiają piksele weryfikacyjne. Wartości liczbowe znajdujące się na przekątnej macierzy, odpowiadające właściwym klasom, oznaczają piksele sklasyfikowane poprawnie. Pozostałe wartości niezerowe wewnątrz macierzy prezentują wartości procentowe błędnie sklasyfikowanych pikseli, które zostały przypisane do innych klas. Tab. 2. Macierz błędów, wyrażona w procentach, klasyfikacji 4 kanałów zobrazowania APEX po transformacji PCA #24 2 3 94 #23 99 #22 2 3 3 8 #2 4 2 86 9 #2 25 3 2 2 52 2 5 #9 5 4 3 3 4 2 3 4 9 5 #8 2 2 7 2 2 6 2 74 2 #7 94 #6 5 4 4 8 4 2 #5 5 8 5 #4 5 7 3 2 4 5 8 7 #3 87 2 2 3 4 #2 9 83 # 2 9 2 # 78 3 2 2 8 #9 93 2 #8 3 9 2 #7 2 76 6 3 4 2 2 #6 3 83 2 2 #5 99 #4 92 #3 94 3 #2 4 79 2 2 # 9 3 6 Klasa # #2 #3 #4 #5 #6 #7 #8 #9 # # #2 #3 #4 #5 #6 #7 #8 #9 #2 #2 #22 #23 #24 łącznie

dokładność (%) # chinofilne porosty naskalne, #2 chinofobne porosty naskalne, #3 murawy bliźniczkowe, #4 murawy halne (forma alpejska), #5 murawy halne (forma subalpejska), #6 zbiorowiska źródlisk niewapiennych, #7 zbiorowiska torfowisk przejściowych, #8 zbiorowiska torfowisk wysokich, #9 traworośla wysokogórskie, # traworośle trzcinnika owłosionego, # zbiorowisko trzęślicy modrej, #2 zbiorowisko śmiałka darniowego, #3 zarośla czeremchy i jarzębiny, #4 zarośla wierzby lapońskiej, #5 ziołorośle miłosny górskiej, #6 ziołorośle paprociowe, #7 borówczysko bażynowe, #8 borówczysko czernicowe, #9 wrzosowisko wysokogórskie, #2 nitrofilne zbiorowiska ruderalne, #2 sudeckie zarośla kosówki, #22 świerczyny górnoreglowe, #23 stawy, jeziora, #24 obszary bez roślinności Na rycinie 46 zestawiono dokładności użytkownika i producenta uzyskane dla najlepszego wyniku klasyfikacji 24 klas zbiorowisk roślinnych Karkonoszy. Ogółem, dokładności dla większości klas były wysokie, 7 na 24 klasy wyróżniono z dokładnością producenta wyższą od 8%, 2 na 24 klasy zidentyfikowano z wyższą o także 8% dokładnością użytkownika. 9 8 7 6 5 4 3 2 DP DU klasy roślinności subalpejskiej i alpejskiej Ryc. 46. Dokładności producenta i użytkownika dla klas, wyrażone w procentach (DP dokładność producenta, DU dokładność użytkownika) Najwyższe dokładności osiągnięto dla muraw halnych w formie alpejskiej (99% dokładności producenta i 99,5% dokładności użytkownika), następnie dla klasy stawy, 4

jeziora (odpowiednio 99% oraz %), jak również muraw bliźniczkowych (94,3% i 92,4%). Zbiorniki wodne są wyraźnie odróżnialne od roślinności i innych obiektów terenowych, ze względu na niemal całkowite pochłanianie promieniowania przez wodę w zakresie podczerwieni bliskiej oraz średniej, zatem wynik ten był dosyć oczywisty, a ponieważ głównym przedmiotem badań są zbiorowiska roślinne skupiono się na analizie wyników uzyskanych dla zbiorowisk. Zbiorowisko muraw halnych pojawiło się na obszarze Karkonosze w okolicy Śnieżki i zostało poprawnie zaklasyfikowane głównie dzięki dominacji w nim gatunku sit skucina, który we wrześniu, kiedy wykonany został nalot skanerem APEX, przyjął barwę rudą, odróżniając się znacznie od otaczających innych gatunków (por. ryc. 2, rozdział 5.2.). Murawy bliźniczkowe obejmują homogeniczne, rozległe obszary i również są zdominowane przez jeden gatunek bliźniczki psiej trawki, odróżniając się od roślinności najczęściej je otaczającej, jak sudeckie zarośla kosówki czy borówczyska czernicowe, znacznie wyższym od roślinności odbiciem promieniowania w zakresie widzialnym. Wysokie wyniki dokładności zaobserwowano w odniesieniu do pozostałych dużych, homogenicznych zbiorowisk, dla których możliwe było zgromadzenie reprezentatywnej liczby pikseli treningowych i weryfikacyjnych (2/4), jak traworośla wysokogórskie, murawy halne w formie subalpejskiej, zbiorowisko trzęślicy modrej, czy chinofilne porosty naskalne (powyżej 9% dokładności producenta, ryc. 47). Ryc. 47. Chinofilne porosty naskalne: od lewej: fragment obrazu poklasyfikacyjnego, od prawej: obraz APEX (kompozycja RGB 38 5 6: 64 nm, 547 nm, 47 nm), kolorem fioletowym na wyniku wyróżniono analizowaną klasę (oprogramowanie ENVI 5.) Borówczysko bażynowe, zróżnicowane pod względem gatunkowym, wykazało dosyć wyraźnie wyróżniającą się charakterystykę spektralną (ryc. 48) i również osiągnięto dla niego satysfakcjonujące dokładności (producenta 94% i użytkownika 9,4%). 5

Ryc. 48. Borówczysko bażynowe, od lewej: obraz APEX (kompozycja RGB 38 5 6: 64 nm, 547 nm, 47 nm) z nałożoną mapą wektorową roślinności nieleśnej, od prawej: obraz APEX (kompozycja RGB 92 4 5: 862 nm, 648 nm, 547 nm), czerwonym prostokątem oznaczono występowanie zbiorowiska (oprogramowanie ENVI 5.3) Poprawnie wyszczególnione zostały także zbiorowiska unikalne dla Karkonoszy, a zarazem wyróżniające się spektralnie spośród jednorodnych obszarów, tj. torfowiska wysokie (9,3% dokładności producenta, 89% dokładności użytkownika). Obszary występowania torfowisk przejściowych, które zaklasyfikowały się na niższym poziomie dokładności (odpowiednio 76,3% i 87,4%) zidentyfikowano w terenie jako współwystępujące ze zbiorowiskami śmiałka darniowego i trzcinnika owłosionego, które na nie wkraczały było to przyczyną nieco mniejszej odróżnialności tej klasy niż torfowisk wysokich, których występowanie było bardziej jednoznaczne. Traworośla trzcinnika owłosionego, dla których dokładność producenta wyniosła 77,8%, przy dokładności użytkownika równej 69,9%, mylone były głównie ze zbiorowiskami śmiałka darniowego ze względu na podobieństwo spektralne, jak również z borówczyskami czernicowymi, ze względu na występowanie zbiorowiska w niewielkich, rozproszonych płatach, przez co najczęściej tworzyło z nimi kompleksy (ryc. 49). Dokładności dla borówczysk czernicowych były niższe (73,5% dokładności producenta, 73,7% dokładności użytkownika) z tego samego powodu głównie mylone były z traworoślami, w mniejszym stopniu z ziołoroślami paprociowymi, wkraczając w obszary dawniejszego występowania paproci, dla których obserwuje się dynamiczne zamieranie. 6

Ryc. 49. Traworośla trzcinnika owłosionego współwystępujące z borówczyskami czernicowymi (fot. B. Zagajewski) Ziołorośle paprociowe, pomimo zaobserwowanego zjawiska zamierania i trudności w identyfikacji na zobrazowaniu APEX, dzięki inwentaryzacji terenowej w latach 23 i 24 i wyznaczeniu jego obecnych zasięgów, osiągnęło dokładności odpowiednio: 8% i 8,2%. Świerczyny górnoreglowe (dokładność producenta 79,8%, użytkownika 84%), nienależące de facto do zbiorowisk nieleśnych i na mapie wektorowej Wojtunia i Żołnierza (22) znajdujące się jedynie przy granicach terenów nieleśnych i obejmujące pojedyncze drzewa lub obszary niewielkich skupisk drzew, ze względu na podobieństwo spektralne były w większości przypadków mylone z sudeckimi zaroślami kosówki (dokładności odpowiednio: 86%, 73,8%, ryc. 5). Ryc. 5. Pojedyncze świerki w otoczeniu kosodrzewiny (okolice Małego Stawu, Karkonosze Wschodnie, fot. B. Zagajewski) 7

Klasa nitrofilne zbiorowiska ruderalne, nielicznie reprezentowana przez piksele treningowe (3) i weryfikacyjne (6) osiągnęła niższą dokładność producenta (5,7%), wynikającą ze zmienności tej klasy, gdyż roślinność antropogeniczna ulega dynamicznym zmianom i jej obecny zasięg nie pokrywał się całkowicie ze stanem z roku 22 i wyznaczenie odpowiednich wzorców nie było łatwe. Najczęściej mylona była z traworoślami trzcinnika owłosionego. Dopasowanie pikseli względem wszystkich pikseli zaklasyfikowanych do tej klasy było jednak wysokie (dokładność użytkownika równa 88,6%), dzięki niższemu odbiciu spektralnemu tej klasy w zakresie promieniowania czerwonego, jak również znacznie wyższemu odbiciu w zakresie bliskiej podczerwieni, odznaczała się ona wyraźnie od otaczającego zbiorowiska śmiałka darniowego, czy terenów bez roślinności (ryc. 5). Ryc. 5. Krzywe odbicia spektralnego (kolor zielony nitrofilne zbiorowiska dużych bylin, kolor niebieski zbiorowisko śmiałka darniowego, kolor czerwony obszary bez roślinności, oprogramowanie ENVI 5.3) Stosunkowo niską wartość dokładności producenta zaobserowano także dla zbiorowiska wrzosowisk wysokogórskich (5%), które było reprezentowane przez podobny do zarośli wierzby lapońskiej zestaw pikseli do treningu i weryfikacji (5/), co w porównaniu do klas, dla których możliwe było zgromadzenie ich w proporcji 2/4 było to zbyt mało, aby osiągnąć satysfakcjonujące rezultaty. Było ono najczęściej mylone z borówczyskami czernicowymi, ze względu na ich współwystępowanie w niewielkich płatach (ryc. 52) z ziołoroślami paprociowymi, jak również murawami halnymi w formie subalpejskiej, które, jak zaobserwowano w terenie i opisano w podrozdziale 5.2., są głównie zdominowane przez wrzos. 8

Ryc. 52. Wrzosowiska wysokogórskie współwystępujące z borówczyskami czernicowymi Najgorzej sklasyfikowanymi zbiorowiskami były zarośla wierzby lapońskiej (dokładność producenta 4%, użytkownika 54,7%). Zostały one przeszacowane i w 2% znalazły się w miejscach występowania zarośli czeremchy i jarzębiny. Odnalezienie reprezentatywnych próbek dla tej klasy w terenie było dosyć trudne, gdyż często zarośla zajmują obszary nie większe niż 3 metry, a część z nich występuje na stromych, zacienionych stokach. Ponadto, klasa ta była reprezentowana przez mniej liczny zestaw pikseli treningowych (5) i weryfikacyjnych (). Aby przedstawić zróżnicowanie w obrębie poszczególnych klas, dokładności dla nich zaprezentowano w postaci wykresów pudełkowych, przedstawiających zakresy wartości przyjmowanych przez każdą z klas podczas -krotnego powtarzania algorytmu (ryc. 53-54). Grubszą linią oznaczono watości mediany, liniami cieńszymi pierwszy i trzeci kwartyl, zamykające pudełka, od których odchodzą wąsy dochodzące do wartości maksymalnych i minimalnych przyjmowanych przez dokładności dla poszczególnych klas. 9

Ryc. 53. Dokładności producenta dla poszczególnych klas uzyskane podczas -krotnego losowania pikseli Dokładności producenta dla większości klas (9/24) przedstawiają niewielkie zróżnicowanie w ich obrębie (poniżej 5% różnicy dokładności pomiędzy wartością najniższą a najwyższą), co świadczy o dobrze dobranych dla nich wzorcach do treningu i weryfikacji, jak również o możliwości ich prawidłowego sklasyfikowania. Wartości mediany w 23 z 24 przypadków były wyższe od 5%, co również jest wynikiem satysfakcjonującym. Największe zróżnicowanie w obrębie klasy reprezentuje klasa ziołorośli miłosny górskiej, która w najlepszym wyniku klasyfikacji osiągnęła dokładność producenta równą 8%, natomiast najniższa zaobserwowana dla niej wartość to zaledwie 25%. Taki wynik osiągnięto prawdopodobnie ze względu na zbyt małą próbę powstałą dzięki losowaniu pikseli treningowych i weryfikacyjnych (odpowiednio: i 2). Klasa ta była najczęściej mylona z klasą o porównywalnie szerokim rozkładzie dokładności zbiorowisk źródlisk niewapiennych, również nielicznie reprezentowaną (stosunek pikseli treningowych do weryfikacyjnych wynosił 3:6) i trudną do identyfikacji ze względu na liniowy przebieg i występowanie na stromych zboczach kotłów polodowcowych w pobliżu wysięków wód. Ponadto, duże zróżnicowanie wartości (powyżej 2% różnicy dokładności pomiędzy wartością najniższą a najwyższą) zaobserwowano dla trzech klas, dla których w najlepszym wyniku według dokładności całkowitej, dokładności producenta były najniższe: zarośli wierzby lapońskiej (najniższa wartość 5%, najwyższa 5%), wrzosowisk wysokogórskich (od 42% do 67%) oraz nitrofilnych zbiorowisk ruderalnych

(od 55% 57 do 93%). Przy tak zróżnicowanej dokładności w danej klasie lepszą miarą wyniku od wyniku najwyższego jest wartość mediany, która dla ziołorośli miłosny górskiej wyniosła 55%, dla zbiorowisk źródlisk niewapiennych 74%, zarośli wierzby lapońskiej 58%, wrzosowisk wysokogórskich 56% i dla nitrofilnych zbiorowisk ruderalnych 76%. Ryc. 54. Dokładności użytkownika dla poszczególnych klas uzyskane podczas -krotnego losowania pikseli Dokładności użytkownika (ryc. 54) przedstawiają wartości mediany dla klas utrzymujące się na wyższym poziomie niż dokładności producenta, dla 23/24 z klas wyniosły powyżej 7%. Większość klas reprezentuje wysoki poziom zgodności uzyskanych wyników, zróżnicowanie w obrębie poszczególnych zbiorowisk roślinnych jest niewielkie (poniżej 5% różnicy między wartością minimalną a maksymalną). Zauważalny jest wyższy poziom rozproszenia dla tych samych klas, które opisano analizując rozkłady dokładności producenta. Najszerszy rozkład zaobserwowano dla klasy ziołorośli miłosny górskiej (od 44% do %), następnie dla zarośli wierzby lapońskiej oraz zbiorowisk źródlisk niewapiennych, które były najczęściej mylone ze sobą (około 3% różnicy pomiędzy wartościami najniższymi i najwyższymi), dla wrzosowisk wysokogórskich (od 64% do 89% dokładności) i nitrofilnych zbiorowisk ruderalnych (od 82% do 97%). Również w tym przypadku wartości mediany bardziej oddawały 57 najniższa wartość dla tej klasy (5,7%) była wartością ekstremalną, znajdującą się poza rozkładem.

dokładność całkowita (%) dokładności użytkownika dla tych klas (ziołorośle miłosny górskiej 74%, zbiorowiska źródlisk niewapiennych 77%, zarośla wierzby lapońskiej 54%, wrzosowisko wysokogórskie 76% i nitrofilne zbiorowiska ruderalne 9%). Analiza wpływu liczebności zestawu treningowego na dokładność klasyfikacji przeprowadzona dla obrazu z transformacji PCA (4 kanałów) dla całej linii zobrazowania APEX (ryc. 55) wykazała wzrost dokładności całkowitej klasyfikacji wraz ze wzrostem liczebności zestawu treningowego, uzyskany dla 3 klas. 82 8 78 76 74 72 7 5 2 3 liczba pikseli treningowych Ryc. 55. Wzrost dokładności klasyfikacji spowodowany zwiększeniem liczebności pikseli treningowych Dla zestawu składającego się z 5 pikseli treningowych w każdej z klas dokładność całkowita klasyfikacji wyniosła 73,5%, przy współczynniku kappa równym,7, dla pikseli treningowych było to odpowiednio 77,3% i,75, dla 2 pikseli 79,4% i,78, natomiast dla 3 pikseli dokładność całkowita osiągnęła wartość 8,%, kappa,78. Wyniki te pozwalają stwierdzić, że bardziej liczne próbki treningowe pozwoliły na uzyskanie wyższych dokładności. Chcąc jednak zachować bardziej reprezentatywną liczbę pikseli treningowych wybrano tylko te zbiorowiska, dla których możliwe było zgromadzenie ich w liczbie 3. 2

8. Przydatność SVM i obrazów hiperspektralnych do klasyfikacji roślinności Uzyskane wyniki pozwalają na ocenę przydatności danych hiperspektralnych APEX i metody SVM do rozróżniania wybranych subalpejskich i alpejskich zbiorowisk roślinnych. Strefowość roślinności nie pozwala na bezpośrednie odniesienie wyników uzyskanych w niniejszej pracy do literatury, gdyż zbiorowiska roślinne Karkonoszy są w dużym stopniu unikalne, szczególnie jeśli zestawi się to z krajami, gdzie techniki hiperspektralne są powszechnie stosowane (USA, Australia, Belgia, Holandia, Niemcy, kraje Skandynawii). W naszej części Europy wykorzystanie teledetekcji hiperspektralnej do klasyfikacji roślinności, w tym górskiej, jest nadal dość rzadkie. W Polsce firma MGGP Aero w ubiegłym roku (25) kupiła pierwszy skaner hiperspektralny HySpex i w swoich badaniach koncentruje się na obszarach nizinnych i wyżynnych (projekt HabitARS), czy badaniach leśnych (Instytut Badawczy Leśnictwa, IBL). W Czechach firma CzechGlobe także rozpoczyna swoje doświadczenia ze skanerem AISA, ale większość opracowań dotyczących danych hiperspektralnych koncentruje się na obszarach zdegradowanych i górniczych (Kopačková 26), czy leśnych (Park Narodowy Szumawa, Hanuš i in. 28). W literaturze można znaleźć podobne przykłady zastosowań danych hiperspektralnych oraz zaawansowanych algorytmów klasyfikacji, ale opracowania dotyczą zbiorowisk nie występujących w Polsce. W podrozdziałach 8..-8.3. porównano uzyskane w pracy wyniki z wynikami uzyskiwanymi przez innych badaczy, ponadto przedstawiono trudności napotkane podczas pracy, jak również omówiono jej zalety. 8.. Dyskusja wyników W pierwszej części dyskusji skupiono się na analizie porównawczej własnych wyników klasyfikacji przeprowadzanych na różnych poziomach roślinności oraz przy użyciu różnych metod klasyfikacji, bardziej szczegółowo porównano wyniki klasyfikacji górskich zbiorowisk roślinnych w Karkonoszach i w Tatrach. Następnie zestawiono wyniki klasyfikacji uzyskanych z danych hiperspektralnych APEX. Porównano wyniki klasyfikacji uzyskane metodą maszyn wektorów nośnych oraz różnych funkcji jądra SVM w połączeniu z metodami redukcji przestrzeni spektralnej, jak również porównano wyniki dokładności klasyfikacji uzyskane przez różnych autorów przy redukcji zestawów treningowych. Porównano wyniki klasyfikacji roślinności Karkonoszy uzyskane przez czeskich badaczy na wielospektralnych danych satelitarnych do wyników uzyskanych na danych hiperspektralnych wykorzystanych w niniejszej pracy. 3

Zbiorowiska roślinności górskiej Tatr, najbardziej zbliżone pod względem fizjonomicznym do analizowanych w niniejszej pracy klasyfikowane były przez Zagajewskiego (2) przy użyciu sztucznych sieci neuronowych i obrazów DAIS 795. Osiągnięta dokładność całkowita dla Tatr była wyższa niż w niniejszej pracy (89,%), jednak dokładności poszczególnych klas uzyskane dla najlepszego wyniku klasyfikacji 58 były porównywalne (tab. 3). Dokładność producenta powyżej 9% uzyskano m.in. dla klas: murawy alpejskie typowe, wysokogórskie borówczyska bażynowe, zarośla kosodrzewiny, torfowiska przejściowe oraz wody. Odpowiadające im klasy muraw halnych w formie alpejskiej, borówczysk bażynowych, czy stawów i jezior klasyfikowane w niniejszej pracy również osiągnęły dokładności producenta powyżej 9%. Pozostałe odpowiadające im klasy (sudeckie zarośla kosówki i zbiorowiska torfowisk przejściowych) zaklasyfikowały się na nieco niższym poziomie dokładności producenta odpowiednio: 86% i 76,3%. Dla muraw halnych w formie subalpejskiej sklasyfikowanych w Karkonoszach osiągnięto nieco wyższe dokładności niż dla muraw alpejskich w postaci subalpejskich w Tatrach (o około % wyższa dokładność producenta i o 6,5% użytkownika). Niektóre z bardziej ogólnych klas wyróżnianych w Tatrach miały swoje odpowiedniki w postaci większej liczby zbiorowisk wydzielonych w Karkonoszach (np. ziołorośla ziołorośla paprociowe, ziołorośla miłosny górskiej; zbiorowiska porostów naskalnych chinofilne i chinofobne porosty naskalne). Potwierdzeniem wyników uzyskanych dla Karkonoszy są także najgorzej klasyfikujące się zbiorowiska w Tatrach w odniesieniu do klasy zbiorowiska zaroślowe wierzby śląskiej i malin uzyskano 44,7% dokładności użytkownika, przy dokładności producenta 88,5%, zaś dla nieco innej, ale podobnej fizjonomicznie klasy zarośli wierzby lapońskiej w Karkonoszach osiągnięto najniższą dokładność użytkownika 54,7% i jeszcze niższą dokładność producenta 4%. Podobnie, klasy traworośli trzcinnikowych w Tatrach oraz traworośli trzcinnika owłosionego w Karkonoszach osiągnęły niższe względem pozostałych klas dokładności użytkownika (odpowiednio 74,8% i 69,9%). Dla zbiorowisk borówki czernicy w kompleksie z traworoślami i ziołoroślami w Tatrach uzyskano dokładność producenta równą 72,%, dokładność użytkownika 78,%; w Karkonoszach dla borówczyska czernicowego, które również najczęściej współwystępowało z traworoślami odpowiednio 73,5% i 73,7%, zatem bardzo zbliżone. Klasy zbiorowisk roślinnych Karkonoszy w niniejszej pracy nie zakładały występowania zbiorowisk w kompleksach, zatem nie było 58 wyniki uzyskane dla 4 oryginalnych kanałów obrazu DAIS 795. 4

problemu z identyfikacją tego typu zbiorowisk, jednak można było zauważyć mieszanie się klas, które tworzyły mniejsze płaty. Tab. 3. Dokładności klasyfikacji wybranych, zbliżonych fizjonomicznie górskich zbiorowisk roślinnych klasyfikowanych w Karkonoszach oraz Tatrach Zbiorowiska roślinne Karkonoszy Zbiorowiska roślinne Tatr klasa dokładność producenta (%) dokładność użytkownika (%) klasa dokładność producenta (%) dokładność użytkownika (%) murawy halne (f. alpejska) 99, 99,5 murawy alpejskie typowe 9,2 8,9 stawy, jeziora 99,, wody 97,6 98,4 sudeckie zarośla kosówki ziołorośle paprociowe ziołorośle miłosny górskiej 86, 73,8 8, 8,2 8, 94, zarośla kosodrzewiny na podłożu bezwęglanowym 93,9 94,8 ziołorośla 85,5 75,9 murawy halne (f. subalpejska) 92, 93,2 murawa alpejska postać subalpejska 82,3 86,7 zbiorowiska torfowisk przejściowych 76,3 87,4 torfowisko przejściowe 96,8 84, borówczysko bażynowe chinofilne porosty naskalne chinofobne porosty naskalne 94, 9,4 9, 95,5 79,3 85,9 wysokogórskie borówczyska bażynowe zbiorowiska porostów naskalnych 96,2 67,5 8,5 76,9 borówczysko czernicowe traworośle trzcinnika owłosionego zarośla wierzby lapońskiej 73,5 73,7 77,8 69,9 4, 54,7 zbiorowiska borówki czernicy z w kompleksie z traworoślami i ziołoroślami traworośla trzcinnikowe zbiorowiska zaroślowe wierzby śląskiej i malin 72, 78, 8,8 74,8 88,5 44,7 W niniejszej pracy zastosowano dane APEX o wielkości piksela 3,2 m. Zespół Ghosha (24), klasyfikując gatunki drzew na lotniczych danych HyMap o rozdzielczości 4 oraz 8 m, a także dane satelitarne Hyperion o rozdzielczości 3 m wykazał największą przydatność danych o rozdzielczości 8-metrowej. Wyjaśnili to kompromisem pomiędzy 5

nadmierną generalizacją i spektralnym rozmieszaniem w 3-metrowym pikselu, kontrastującym z wysokim zróżnicowaniem spektralnym gatunków w pikselu 4-metrowym. Generalnie różnice pomiędzy najlepszym wynikiem osiągniętym dla danych 4- i 8-metrowych były niewielkie (około 96% dokładności dla obydwu zestawów danych). Przy porównywaniu wyników klasyfikacji należy uwzględnić typ roślinności, gdyż gatunki drzew cechują się odmienną fizjonomią niż zbiorowiska roślinne, jednak wniosek dotyczący rozdzielczości przestrzennej ma swoje odzwierciedlenie w analizie roślinności subalpejskiej i alpejskiej Karkonoszy. Jego potwierdzeniem są badania przeprowadzone przez autorkę pracy na symulowanych danych satelitarnych EnMAP (por. podrozdział 8.3). Charakteryzuje je 3-metrowa rozdzielczość przestrzenna, dlatego niemożliwe byłoby sklasyfikowanie na nich często niewielkich czy bardziej złożonych zbiorowisk roślinnych. Klasyfikacji poddano więc większe jednostki typy roślinności i dla nich osiągnięto dokładność całkowitą 78,3%, czyli o 2,4% mniej w porównaniu z klasyfikacją tych samych jednostek na danych APEX (9,7%). Wrzosowiska były jedną z klas najgorzej klasyfikujących się w niniejszej pracy (5% dokładności producenta). Były one przedmiotem badań także na obszarach siedlisk Natura 2 w Belgii (Delalieux i in. 2), gdzie dla 6 klas bardziej ogólnych uzyskano dokładność równą 96%, a dla 26 klas szczegółowych 84%, zatem uzyskane przez autorów wyniki były satysfakcjonujące. Potwierdzeniem wyniku uzyskanego w niniejszej pracy są wyniki klasyfikacji wrzosowisk tego samego obszaru Natura 2 trzema metodami zespołu Chan i in. (22): najwyższą dokładność dała metoda SVM (6,8%). Ponadto, najwyższe dokładności osiągnięto dla wrzosowisk z dominacją trzęślic (Molinia 8%), dużo niższe były dokładności dla wrzosowisk z dominacją wrzosów (Calluna 44%), co również potwierdzają wyniki dokładności uzyskane dla klas zbiorowiska trzęślicy modrej (9%) oraz wrzosowisk wysokogórskich (5%), uzyskane w niniejszej pracy. Inne przykłady podobnych danych i metod są szeroko stosowane, ale w zdecydowanej większości dotyczą one innych typów roślinnności. Wspólnym elementem jest ogromna rozdzielczość spektralna oraz metody uczenia maszynowego (w tym sztucznych sieci neuronowych), liczba klas jest zmienna i zależy od specyfiki analizowanego terenu (od 5 do 42, tab. 4). 6

Tab. 4. Porównanie dokładności klasyfikacji roślinności na danych hiperspektralnych Autor, rok Kokaly i in. 23 Camps-Valls i in. 24 Filippi, Jensen 26 Sensor Liczba kanałów Liczba klas AVIRIS 224 6 HyMap 26 6 AVIRIS 224 Wang i in. 27 CASI 288 5 Chan, Paelinckx 28 Olesiuk, Zagajewski 28 Zagajewski 2 Delalieux i in. 2 Chan i in. 22 Zhang, Xie 23 Ghosh i in. 24 Marcinkowska- Ochtyra i in. 26 Obiekt badań typy roślinności rośliny uprawne typy roślinności zbiorowiska roślinne HyMap 26 6 ekotopy DAIS 795 DAIS 795 AHS 63 CHRIS/ PROBA HyMap 26 HyMap 26 Hyperion 22 APEX 288 79 6 79 42 9 pokrycie terenu zbiorowiska roślinne 6 siedliska Natura 27 2 4 55 6 24 EnMAP 242 9 9 siedliska Natura 2 zbiorowiska roślinne gatunki roślinności gatunki drzew zbiorowiska roślinne typy roślinności typy roślinności Metoda klasyfikacji Dokładność całkowita (%) Spectral Feature Analysis 74, Support Vector Machine 96,4 Neural Networks 94,5 Matched Filtering 64,6 Neural Networks 86, Vegetation Community based Neural Network 9,6 Neural Network 84, Random Forest 68,6 Adaptive Boosting 69,5 Neural Networks (SNNs) 89, Neural Networks (fuzzy ARTMAP) 89, Linear Discriminant Analysis 96, Linear Discriminant Analysis 84, Support Vector Machine 6,8 Random Forest 57, Adaptive Boosting 57,5 Support Vector Machine+OBIA 89, Random Forest+OBIA 9, Support Vector Machine+OBIA 85, Random Forest+OBIA 79, Support Vector Machine 96, Random Forest 96, Support Vector Machine 93, Random Forest 93, Support Vector Machine Support Vector Machine 74,4 9,7 78,3 Marcinkowska- Ochtyra 26 59 APEX 288 24 zbiorowiska roślinne Support Vector Machine 85,4 59 w każdej z tabel zawierającej nazwiska w tym podrozdziale podkreślono badania własne, omówione w ramach niniejszej pracy. 7

Nieznaczną część publikacji poświęconych klasyfikacji roślinności stanowią klasyfikacje roślinności górskiej, która jest trudnym do identyfikacji obiektem badań ze względu na swoje przystosowania do wysokiego położenia. W pracy Kokaly i in. (23) wyróżniono 6 typów roślinności górskiej Parku Narodowego Yellowstone, w tym 8 typów roślinności nieleśnej, bazując na charakterystykach spektralnych (Spectral Feature Analysis) na danych AVIRIS osiągnięto dokładność 74,%, czyli nieco mniej niż w prezentowanych tu badaniach. Porównywalną do wykorzystanych w niniejszej pracy liczbę klas (6), dla obszarów wyżynnych wyróżniali Chan i Paelinckx (28) w Belgii (wzgórza nad rzeką Dender we wschodniej Flandrii) oraz Olesiuk i Zagajewski (28) w Polsce (Beskid Niski), przy użyciu metod uczenia maszynowego i sztucznych sieci neuronowych, osiągając dokładności odpowiednio około 7% i około 9%. Wyższe dokładności osiągano w odniesieniu do klas roślinności leśnej, co potwierdza, iż są one bardziej jednorodne od zróżnicowanej mozaiki roślinności nieleśnej, analizowanej w niniejszej pracy. Algorytmy maszyn wektorów nośnych oraz sztucznych sieci neuronowych do klasyfikacji mniejszej liczby klas (6) roślin uprawnych zastosowane w pracy Camps-Valls i in. (24), pozwoliły na osiągnięcie o około 2% wyższej dokładności dzięki metodzie SVM, wybranej do analizy przedstawionej w pracy. Ponadto, autorzy wykazali, że przy użyciu SVM możliwa jest identyfikacja klas nawet na zaszumionych kanałach, co potwierdzają wysokie dokładności klasyfikacji uzyskane dla wszystkich 252 kanałów spektralnych APEX. Sztuczne sieci neuronowe, pod względem działania algorytmu bardziej zbliżone do maszyn wektorów nośnych zastosowanych w pracy, dały lepsze wyniki klasyfikacji w porównaniu do metody bazującej na charakterystykach spektralnych Matched Filtering. Wykazali to Filippi i Jensen (26) w klasyfikacji typów roślinności, uzyskując wyższą o ponad 2% dokładność całkowitą dla sztucznych sieci. Wang i in. (27) w klasyfikacji zbiorowisk roślinnych przy użyciu sztucznych sieci neuronowych uzyskali wynik dokładności całkowitej klasyfikacji porównywalny do uzyskanego w niniejszej pracy (84,%), natomiast jeszcze wyższy wynik (9,6%) osiągnęli modyfikując jednokierunkową sieć neuronową przez dodanie informacji o udziale poszczególnych gatunków i odkrytej gleby. Potwierdza to duże znaczenie sieci neuronowych w klasyfikacji roślinności na poziomie zbiorowisk roślinnych, szczególnie, jeśli metoda jest ukierunkowana na analizę roślinności. Klasyfikacja danych hiperspektralnych APEX zakładała wyróżnienie roślinności górskiej na poziomie zbiorowisk roślinnych, które to jednostki, o odmiennej specyfice 8

(roślinność terenów podmokłych) analizowali także Zhang i Xie (23) w liczbie 4, dodatkowo klasyfikując 55 gatunków znajdujących się w ich obrębie. Wykorzystano do tego celu dwa algorytmy uczenia maszynowego: SVM i RF, do utworzenia wzorców treningowych stosując dodatkowo algorytm klasyfikacji obiektowej. Analiza porównawcza wyników klasyfikacji uzyskanych dla różnych poziomów klas wykazała, że klasyfikacja zbiorowisk roślinnych daje lepsze rezultaty, niż bardziej szczegółowa klasyfikacja na poziomie gatunków. Wyniki uzyskane dwiema metodami są porównywalne, co potwierdzają niepublikowane badania autorki pracy. Zastosowano w nich metodę Random Forest do klasyfikacji roślinności subalpejskiej i alpejskiej Karkonoszy, gdzie dokładność całkowita dla niej wyniosła 84,9%, podczas gdy dla tej samej liczby klas dla metody SVM było to 84,6%. Metodami SVM i RF posłużyli się także Ghosh i in. (24) w klasyfikacji gatunków drzew również nie stwierdzono różnic uzyskanych dokładności. Jak wspomniano w podrozdziale.3., obrazy hiperspektralne ze skanera APEX opisano w literaturze raczej pod kątem ich przetworzeń wstępnych; są stosunkowo nowymi danymi, dlatego niewiele przeprowadzono na nich analiz tematycznych, szczególnie klasyfikacji (tab. 5). Klasyfikacje zbiorowisk roślinnych Karkonoszy przeprowadzane w ramach testów do niniejszej pracy pozwoliły na osiągnięcie dokładności około 75% i około 79% przy użyciu metody SVM (Marcinkowska i in. 24a, 24b, Marcinkowska- Ochtyra i in. 26). Tę samą metodę, wraz z trzema innymi (Random Forest, AdaBoost i Neural Networks) zastosował Demarchi i in. (24) do klasyfikacji 22 klas pokrycia terenu w Brukseli. Użycie danych APEX w połączeniu z metodą SVM przyniosło osiągnięcie najwyższej dokładności (82,9%), co jest potwierdzeniem słuszności wyboru tej metody do klasyfikacji zbiorowisk roślinnych przeprowadzonej w niniejszej pracy. Klasyfikacje mniejszej liczby klas, której przedmiotem były gatunki drzew, przeprowadzone były na danych APEX przez Raczko i in. (25) oraz Tagliabue i in. (26). W pierwszej pracy również zastosowano metodę SVM dla obszaru Karkonoszy, osiągając wynik 78,7%, natomiast w drugiej wykorzystano metodę Maximum Likelihood dla lasów w okolicy Miluzy we Francji, również dającą satysfakcjonujący wynik 74,4%. Dane APEX zostały także wykorzystane do identyfikacji pokryć dachowych w mieście Karpacz, przy użyciu metody Spectral Angle Mapper dokładność wyniosła 95% (Krówczyńska i in. 25). Dane pozyskane w ramach projektu HyMountEcos posłużyły także do klasyfikacji 9 typów roślinności Karkonoszy Wschodnich, z bardzo wysoką dokładnością całkowitą 9,7% (Marcinkowska-Ochtyra i in. 26). W badaniach prezentowanych w niniejszej pracy, w których zastosowano dane APEX do klasyfikacji 24 9

zbiorowisk roślinnych na terenie całych Karkonoszy pokrywających się z linią zobrazowania, uzyskano dokładność 85,4%. Była to największa liczba klas wydzielanych na tego rodzaju danych, również ich zróżnicowanie było największe, gdyż charakterystyki spektralne większości elementów pokrycia terenu, gatunków drzew czy bardziej ogólnych typów roślinności są bardziej jednorodne, zatem uzyskane dokładności można uznać za satysfakcjonujące. Dokładności uzyskane w klasyfikacjach wszystkich autorów są wyższe od 7%, co pozwala na stwierdzenie, że dane hiperspektralne APEX mogą być z powodzeniem wykorzystywane do zróżnicowanych analiz. Tab. 5. Przeprowadzone klasyfikacje na danych APEX, wraz z dokładnościami całkowitymi Autor, rok Liczba klas Obiekt badań Obszar nalotu APEX Data zobrazowania Metoda klasyfikacji Dokładność całkowita (%) Marcinkowska i in. 24a Marcinkowska i in. 24b Demarchi i in. 24 Raczko i in. 25 Krówczyńska i in. 25 Tagliabue i in. 26 Marcinkowska- Ochtyra i in. 26 Marcinkowska- Ochtyra 26 6 5 22 5 2 5 9 24 24 *obszar testowy MałyStaw2 ** obszar Karkonosze zbiorowiska roślinne zbiorowiska roślinne pokrycie terenu gatunki drzew pokrycia dachowe gatunki drzew typy roślinności zbiorowiska roślinne* zbiorowiska roślinne** Karkonosze (Polska/ Czechy) Karkonosze (Polska/ Czechy) Bruksela (Belgia) Karkonosze (Polska/ Czechy) Karkonosze (Polska/ Czechy) Forêt de Hardt (Francja) Karkonosze (Polska/ Czechy) Karkonosze (Polska/ Czechy).9.22.9.22 Support Vector Machine Support Vector Machine 75,4 79, Support Vector Machine 82,9 24.9.2 Random Forest 74,.9.22.9.22 7.6.23 4.9.23.9.22.9.22 AdaBoost 78,5 Neural Networks 78,8 Support Vector Machine Spectral Angle Mapper Maximum Likelihood Support Vector Machine Support Vector Machine 78,7 95, 74,4 9,7 74,4 85,4 W literaturze najczęściej spotyka się stosowanie radialnej funkcji jądra SVM (Foody, Mathur 24, Chan i in. 22, Lin i in. 28). We własnych badaniach zauważono, że dała ona najlepsze rezultaty w połączeniu z danymi po transformacji PCA, a przy danych oryginalnych zajęła ona drugie miejsce w klasyfikacji zbiorowisk 2

roślinnych. Zdarzają się sytuacje, kiedy funkcja ta nie przynosi najlepszych rezultatów; kiedy liczba zmiennych jest bardzo duża może nie być potrzeby transformowania przestrzeni do jeszcze większej liczby wymiarów i bardziej odpowiednie staje się użycie funkcji liniowej (Hsu i in. 2). Potwierdza to najlepsze zestawienie danych oryginalnych z tą funkcją, wykazane w niniejszej pracy. W przypadku klasyfikacji obszaru testowego MałyStaw2 najwyższa dokładność całkowita klasyfikacji osiągnięta została dla tej funkcji w połączeniu z zestawem 252 kanałów spektralnych obrazu APEX. Podobną sytuację prezentują wyniki autorstwa Demarchi i in. (24), gdzie szczegółowa klasyfikacja obszaru miejskiego (22 klasy) pozwoliła na uzyskanie najlepszego wyniku dla 26 oryginalnych kanałów APEX w połączeniu z funkcją liniową SVM. Najniższą dokładność klasyfikacji zbiorowisk roślinnych Karkonoszy przyniosło użycie funkcji sigmoidalnej; potwierdzają to badania Shah i in. (23), którzy dokonali porównania czterech funkcji oceniając dokładności całkowite klasyfikacji uzyskane na danych AVIRIS dla czterech klas roślinności: na najniższym poziomie znalazła się funkcja sigmoidalna (93,% 6 ), na najwyższym natomiast funkcje wielomianowa (97,2%) oraz radialna (97,%). Funkcja sigmoidalna dała najniższą dokładność dla danych zarówno oryginalnych, jak i po redukcji przestrzeni spektralnej, co także potwierdzają badania Shah i in. (23). Użycie danych hiperspektralnych czyni możliwym wydobywanie nawet niewielkich różnic pomiędzy podobnymi spektralnie klasami, co jest niemożliwe przy użyciu danych wielospektralnych o szerszych zakresach lub mniejszej liczbie kanałów. Niektóre klasy zbiorowisk roślinnych różnicują się bardziej w zakresie bliskiej podczerwieni, inne różnią się znacząco w zakresie podczerwieni średniej. Z tego powodu dane składające się z wielu kanałów spektralnych dają większe możliwości różnicowania klas, szczególnie jeśli przedmiotem badań jest mozaika różnych gatunków tworząca zróżnicowane zbiorowisko roślinne. Wyniki uzyskiwane na danych po redukcji przestrzeni spektralnej danych hiperspektralnych są zatem dyskusyjne, nawet przy zastosowaniu tej samej metody (tab. 6). W niniejszej pracy wyniki dokładności uzyskane na danych zredukowanych spektralnie były zależne od zastosowanej funkcji jądra SVM: funkcja liniowa dała najlepsze wyniki w połączeniu z danymi oryginalnymi, natomiast dane przetransformowane przy użyciu dającej najlepsze rezultaty analizy głównych składowych dawały wyższe dokładności dla fukcji radialnej, ponadto, wyniki te były w tym przypadku mniej zróżnicowane pomiędzy funkcjami. Pal i Mather (26) nie wykazali zależności od zastosowanej funkcji jądra SVM, zauważyli jednak niższe wyniki dokładności dla 9 klas 6 dokładności osiągnięte dla oryginalnych 85 kanałów. 2

pokrycia terenu na danych przekształconych przy użyciu transformacji MNF (88,2%), porównując je do danych oryginalnych (96,8%). Wykorzystanie oryginalnych kanałów dało również wyższe wyniki w klasyfikacji gatunków drzew na danych satelitarnych Hyperion (Ghosh i in. 24), gdzie w porównaniu z kanałami z transformacji MNF wynik był o niemal 2% wyższy. Porównanie trzech zestawów danych do klasyfikacji 22 zróżnicowanych klas obszaru miejskiego na danych APEX przedstawił Demarchi i in. (24), również wykazując największą przydatność zestawu złożonego ze wszystkich kanałów APEX (82,9%) w porównaniu z dwoma nienadzorowanymi metodami redukcji przestrzeni spektralnej (Autoassociative Neural Network 74,3%, BandClust 82,7%). Zależność tę potwierdziły wyniki prezentowanych tu badań obszaru MałyStaw2, gdzie porównując wyniki uzyskane dla zbliżonej liczby klas, po zastosowaniu kanałów oryginalnych i trzech metod redukcji przestrzeni spektralnej, najwyższą dokładność osiągnięto przy użyciu 252 kanałów zobrazowania (82,7%). Metody transformacji wykazały nieco niższe dokładności (PCA 8,%, MNF 8,8%), najniższą dokładność uzyskano przy wybranych kanałach spektralnych najmniej obniżających dokładność (metodzie opakowanej: 76,7% dla 7 kanałów). Zhang i Xie (23) w klasyfikacji zbiorowisk i gatunków roślinnych zaobserwowali sytuację odwrotną: obrazy złożone z kanałów po transformacji MNF przyniosły lepsze wyniki (89% dokładności dla zbiorowisk oraz 85% dla gatunków) w stosunku do danych oryginalnych (odpowiednio: 83% i 73%). Również w pracach Ghosh i in. (24) i Fassnachta i in. (24) klasyfikacje gatunków drzew okazały się być bardziej dokładne na danych z transformacji MNF (odpowiednio: 96% i 9%, dla danych oryginalnych 93% i 8%), w pracy Fassnachta na drugim miejscu znalazł się wynik uzyskany dzięki metodzie opakowanej (82%). Nieco ponad 9% wyższą dokładność dla danych przetransformowanych MNF uzyskali także Burai i in. (25) w klasyfikacji 2 gatunków roślinności zielnej. Dla całego obszaru Karkonosze analizowanego w niniejszej pracy dokładność całkowita wyniosła 85,5% z danych po transformacji PCA, dla 252 oryginalnych kanałów 77%. W przypadku doboru odpowiednich wzorców treningowych i ich modyfikacji w trakcie testowania klasyfikatora istotny był czas przetwarzania danych, który dla wszystkich kanałów zobrazowania APEX był bardzo długi. Poprzez redukcję przestrzeni spektralnej i ograniczenie rozmiaru pliku wynikowego można było go znacznie skrócić; przyspieszyło to proces klasyfikacji i uczyniło metodę bardziej optymalną do dalszych zastosowań. 22

Tab. 6. Dokładności klasyfikacji SVM dla oryginalnych oraz zredukowanych kanałów spektralnych obrazów hiperspektralnych Autor, rok Sensor Liczb a klas Obiekt badań Dokładność całkowita (%) Dane oryginalne Dane zredukowane Pal, Mather 26 DAIS 795 9 pokrycie terenu 96,8 88,2* 4 zbiorowiska roślinne 83, 89,* Zhang, Xie 23 HyMap 55 gatunki roślinności 73, 85,* HyMap 93, 96,* Ghosh i in. 24 6 gatunki drzew Hyperion 93, 74,* Fassnacht i in. 24 AISA EAGLE 7 gatunki drzew 8, 9,*, 82**** Demarchi i in. 24 APEX 22 pokrycie terenu 82,9 74,3***, 82,7*** Burai i in. 25 AISA EAGLE II 2 gatunki roślinności 72,9 82,* Marcinkowska- Ochtyra 26 APEX 24 Marcinkowska- Ochtyra 26 APEX 24 * transformacja MNF ** transformacja PCA *** metody nienadzorowane (unsupervised) **** metody opakowane (wrapper) zbiorowiska roślinne (MałyStaw2) zbiorowiska roślinne (Karkonosze) 82,7 8,8*, 8,**, 76,7**** 77, 85,49** Wyszukiwanie kombinacji parametrów funkcji SVM, które wymagają dwóch równolegle stosowanych parametrów, pozwoliło na taki ich dobór, aby osiągnąć optymalne dokładności. Dobór parametrów w oprogramowaniu ENVI polegał na dopasowywaniu empirycznie każdego zestawu danych, a następnie na tworzeniu macierzy błędów prezentującej uzyskany wynik. Jest to dosyć czasochłonna procedura, wliczając czas przeprowadzenia samej klasyfikacji na wybranych parametrach, a następnie dopasowywanie poszczególnych klas wynikowych do klas referencyjnych w postaci zestawu pikseli weryfikacyjnych. W sposób podobny do opisanego w niniejszej pracy dopasowywali parametry Ustuner i in. (25), tworząc ich kombinacje dla wszystkich funkcji jądrowych SVM dostępnych w narzędziach programu ENVI. Hsu i in. (2) sugerują wykorzystanie siatki wyszukiwania, automatycznie tworzonej na podstawie zestawu danych wejściowych, zatem pomija się procedurę sprawdzania dokładności każdej kombinacji. W niniejszej pracy siatka wyszukiwania wykorzystana została w oprogramowaniu R do dopasowania optymalnej kombinacji parametrów C i gamma funkcji radialnej dla całego obszaru Karkonoszy na obrazie składającym się z 4 kanałów PCA. Parametry te dopasowano do danych wejściowych różniących się od danych testowanych na obszarze MałyStaw2 wielkością obszaru oraz liczbą klas. Siatka wyszukiwania tworzona jest także w oprogramowaniu dedykowanym do przetwarzania 23

danych hiperspektralnych EnMAP-Box 6, integrowalnym z oprogramowaniem ENVI użytym w niniejszej pracy; dobór parametrów w ten sposób zastosowali Burai i in. (25). Prezentowana tu analiza wrażliwości klasyfikacji na zestaw danych treningowych wykazująca wzrost dokładności klasyfikacji wraz ze wzrostem liczebności zestawu treningowego potwierdzona została badaniami w czterech pracach, w których zastosowano do klasyfikacji metodę SVM, w porównaniu z innymi metodami (tab. 7). Badania Pala i Mathera (26) prezentują dokładność całkowitą uzyskaną dla, 2, 25, 3, 35 oraz 4 pikseli treningowych dla każdej z 9 klas pokrycia terenu na danych DAIS 795, przy użyciu czterech metod klasyfikacji, w tym SVM, która dała najwyższe dokładności w każdym zestawie. Można dzięki nim zaobserwować tendencję wzrostu dokładności wszystkich metod klasyfikacji, przy tym dla metody SVM różnica była najmniejsza (2,9% wzrostu dla zestawu składającego się z 4 pikseli, względem zestawu złożonego ze pikseli treningowych). Dla porównania, parametryczna metoda Maximum Likelihood wykazała wzrost dokładności względem tych zestawów o,2%, w przypadku sztucznych sieci neuronowych oraz drzewa decyzyjnego różnice te wyniosły około 7%. Zależność ta została także wykazana w badaniach Waske i in. (2), którzy zaobserwowali wrażliwość klasyfikatorów SVM oraz RF na wielkość zestawu danych treningowych (25, 5, i 2 pikseli) dotyczących obszaru otaczającego wulkan Hekla na Islandii na danych AVIRIS, gdzie 22 klasy obejmujące głównie pola lawowe były bardziej homogeniczne niż klasy roślinności, analizowane w niniejszej pracy. Autorzy wykazali niższą o % dokładność dla metody SVM w przypadku zestawu najmniej licznego (25 pikseli). Jednak po wykorzystaniu kolejnych zestawów składających się z 5, oraz 2 pikseli dokładności dla metody SVM były wyższe niż dla RF (odpowiednio: 9,2%, 94,8%, 96,9%). Ogółem, względem najniższej liczebności, dla metody SVM dokładność wzrosła o 4,7%, natomiast dla metody RF o 9,4%. Wspomniane dwie metody zastosowano do porównania wpływu liczebności zestawów treningowych na dokładności klasyfikacji 4 zbiorowisk roślinnych oraz gatunków roślinności obszarów podmokłych na danych HyMap przez Zhanga i Xie (23), którzy testowali zestawy składające się z 2%, 4%, 6% i 8% pikseli treningowych. Dokładności całkowite w przypadku SVM dla zbiorowisk wzrosły z 77% do 93%, w przypadku RF z 79% do 92%, natomiast w klasyfikacji gatunków metodą SVM dokładności wzrosły z 6% do 87%, RF z 6% do 6 skrzynka narzędziowa opracowana w roku 2 przez Uniwersytet Humboldta w Berlinie w porozumieniu z GFZ w Poczdamie (van der Linden i in. 25). Umożliwia m.in. klasyfikację i regresję danych obrazowych, integrację z naziemnymi pomiarami spektrometrycznymi, ma odrębne moduły do konkretnych zastosowań, np. analiz geologicznych (EnMAP Geological Mapper (EnGeoMAP), hydrologicznych (EnMAP Water Mapper (EnWaterMAP), czy glebowych (EnMAP Soil Mapper (EnSoMAP)). 24

85%. Badania Burai i in. (25), w których autorzy wykorzystali dwie z powyższych metod, a także Maximum Likelihood, również potwierdziły tę tendencję. W klasyfikacji 2 gatunków roślinności zielnej na danych AISA wykorzystali zestawy składające się z, 5, 2, 25 i 3 pikseli i dokładności dla metody SVM wzrosły z 79,6% przy pikselach treningowych dla każdej z klas, do 82,% przy 3 pikselach. Dla metody RF wzrost ten był równie niewielki, z 76,6% do 79,%, natomiast nawiększą różnicę odnotowano dla metody ML niemal 3%. We wszystkich powyższych badaniach występuje wzrost dokładności klasyfikacji wraz ze zwiększeniem się zestawu treningowego, jednak w każdym przypadku najwyższe dokładności osiągnięte są z użyciem metody SVM. W niniejszej pracy dokładności tej metody sprawdzano dla liczebności 5,, 2 oraz 3 pikseli treningowych dla 24 klas zbiorowisk roślinnych i w stosunku do najmniej licznego zestawu wzrosły one o niemal 7% przy 3 pikselach. Tab. 7. Dokładności klasyfikacji uzyskane przy zastosowaniu różnych liczebności zestawów treningowych i różnych metod klasyfikacji danych hiperspektralnych Autor, rok Sensor Liczba klas Metoda Dokładność całkowita (%) Pal, Mather 26 Waske i in. 2 Zhang, Xie 23 Burai i in. 25 Marcinkowska- Ochtyra 26 DAIS 795 9 AVIRIS 22 HyMap AISA EAGLE 4 55 2 liczebność pikseli treningowych: 2 3 4 Support Vector Machine 93,6 95, 96,3 96,5 Decision Tree 8,2 85,3 87,2 88, Neural Networks 88,4 93, 93,9 95, Maximum Likelihood 85,8 85,8 95, 96, liczebność pikseli treningowych: 25 5 2 Support Vector Machine 82,2 9,2 94,8 96,9 Random Forest 83,3 88, 9,5 92,7 liczebność pikseli treningowych: 2% 4% 6% 8% Support Vector Machine 77, 89, 86, 93, Random Forest 79, 88, 9, 92, Support Vector Machine 6, 75, 8, 87, Random Forest 6, 73, 82, 85, liczebność pikseli treningowych: 3 Support Vector Machine 79,6 82, Random Forest 76,6 79, Maximum Likelihood 52,6 8,8 liczebność pikseli treningowych: 5 2 3 APEX 24 Support Vector Machine 73,5 77,3 79,4 8, Klasyfikację roślinności subalpejskiej i alpejskiej przeprowadzoną w niniejszej pracy można także porównać do klasyfikacji czeskiej części Karkonoszy na wielospektralnych obrazach lotniczych i satelitarnych, były to jednak analizy klas 25

o mniejszej szczegółowości, a także o węższym zasięgu przestrzennym. Na podstawie czterokanałowych obrazów lotniczych zarejestrowanych w zakresie widzialnym i bliskiej podczerwieni o rozdzielczości m Müllerová (25) wyróżniła siedem klas roślinności: zarośla kosodrzewiny, murawy, traworośla i ziołorośla, roślinność przy szlakach, drogi, zbiorniki wodne oraz obszary podmokłe. Przy użyciu metody klasyfikacji nadzorowanej Maximum Likelihood sklasyfikowano je wszystkie, sześć klas zidentyfikowano metodą nienadzorowaną ISODATA, porównując wyniki z danymi terenowymi osiągnięto dokładności całkowite wynoszące odpowiednio: 8,% oraz 6,6%. Klasyfikacja nadzorowana okazała się być bardziej dokładna od nienadzorowanej, która tworzyła mieszane klasy i nie wyszczególniła ich wszystkich (brak roślinności przy szlakach). W klasyfikacji nadzorowanej także występowały jednak pewne błędy, polegające na mieszaniu się roślinności składającej się ze zbliżonych kompozycji gatunków, jak roślinność przy szlakach oraz traworośla i ziołorośla. Zwrócono uwagę, że duże zróżnicowanie spektralne roślinności i niska rozdzielczość spektralna obrazów powodowała mieszanie się klas, co w przypadku wielu zbiorowisk zostało rozwiązane poprzez użycie danych o wysokiej rozdzielczości spektralnej wykorzystanych w niniejszej pracy. Identyfikację roślinności położonej powyżej górnej granicy lasu fragmentu Karkonoskiego Parku Narodowego po czeskiej stronie przeprowadziły Suchá i in. (26). Na wielospektralnych danych satelitarnych Landsat-8 62 o rozdzielczości przestrzennej 3 m oraz na danych WorldView-2 63 (WV-2) o rozdzielczości 2 m, a także lotniczej ortofotomapie o rozdzielczości 2,5 cm wyróżniono roślinność na poziomie zgeneralizowanym 9 klas (tereny antropogeniczne, lasy świerkowe, zarośla kosodrzewiny gęstej oraz rzadkiej, murawy alpejskie z dominacją bliźniczki psiej trawki, traworośla i subalpejska roślinność krzewinkowa, wrzosowiska alpejskie, obszary podmokłe oraz zbiorniki wodne), a także na poziomie bardziej szczegółowym 2 klas 64. Do danych satelitarnych wykorzystano klasyfikację nadzorowaną Maximum Likelihood, algorytm SVM oraz Neural Nets (NN), dodatkowo na danych WV-2 oraz na ortofotomapie zastosowano klasyfikację obiektową w połączeniu z metodą SVM. W przypadku ortofotomapy i obrazu WV-2 najlepsze wyniki dokładności osiągnięto dla 9 klas przy wykorzystaniu metod obiektowej i SVM (odpowiednio: 83,6% i 68,4%; dla 2 klas 62 kanałów spektralnych, z których 9 w zakresie widzialnym oraz podczerwieni bliskiej, średniej i termalnej. 63 8 kanałów spektralnych z zakresu widzialnego oraz bliskiej podczerwieni. 64 2 klasy muraw alpejskich, 3 klasy muraw subalpejskich, klasy zarośli kosodrzewiny gęstej i rzadkiej połączone w jedną klasę. Bardziej szczegółowa klasyfikacja przeprowadzona została na ortofotomapie i obrazie WorldView-2. 26

szczegółowych: 72,%, 66,5%). Dla obrazu Landsata najwyższą dokładność osiągnięto przy użyciu metody Maximum Likelihood (78,3%). Wyniki wykazały przydatność wielospektralnych danych o niższej rozdzielczości przestrzennej do ogólnej identyfikacji dominującego pokrycia terenu obszaru powyżej górnej granicy lasu, natomiast do analiz roślinności na poziomie bardziej szczegółowym powinny być wykorzystywane dane o wyższej rozdzielczości przestrzennej. Potwierdzeniem tych wniosków są badania autorki i in. (26) klasyfikacja typów roślinności Karkonoszy na symulowanych danych EnMAP oraz zbiorowisk roślinnych na danych APEX. Jak zaprezentowano w powyższym zestawieniu, klasyfikacje roślinności przy użyciu danych hiperspektralnych i metody maszyn wektorów nośnych lub często innych metod uczenia maszynowego czy sieci neuronowych, są dosyć szeroko wykorzystywane i uzyskiwane dzięki nim dokładności są porównywalne z wynikami uzyskanymi w niniejszej pracy. Często stosowaną metodą klasyfikacji, współwystępującą z metodą SVM jest Random Forest, która daje równie wysokie dokładności. Stosowanie metod redukcji przestrzeni spektralnej, najczęściej w zestawieniu z danymi hiperspektralnymi transformacji MNF, jest popularnym zagadnieniem, dającym różne rezultaty w zależności od zastosowanych danych i metod. Różni badacze podejmują próby sprawdzenia wpływu zastosowania różnych liczebności pikseli treningowych na dokładności klasyfikacji i osiągają efekty podobne jak podczas testów dotyczących klas zbiorowisk roślinnych Karkonoszy wzrost dokładności klasyfikacji spowodowany wzrostem liczebności zestawu treningowego. W niniejszym przeglądzie dodano także zestawienie klasyfikacji przeprowadzonych na danych APEX, które pozwoliło na pokazanie wyników klasyfikacji nie tylko roślinności, ale też innych obiektów, wciąż jednak pozostawiając wyniki porównywalnymi z uzyskanymi przez autorkę. Porównując wyniki własnych badań do przedstawionych powyżej można stwierdzić, że zastosowanie wysokorozdzielczych spektralnie obrazów APEX o wielkości piksela 3,2 m do klasyfikacji dużej liczby zbiorowisk roślinnych obszarów nieleśnych wraz z dającą wysokie wyniki dokładności metodą maszyn wektorów nośnych było właściwe i uzasadnione. 8.2. Trudności w klasyfikacji zbiorowisk roślinnych Metodyczne problemy kartowania roślinności górskiej wynikają m.in. ze specyfiki samej szaty roślinnej gór, która często jest zróżnicowaną przestrzennie mozaiką drobnopowierzchniowych zbiorowisk roślinnych (Kozłowska 999). Podczas identyfikacji zbiorowisk roślinnych Karkonoszy napotkano ten problem wielokrotnie, dobrym przykładem są okolice Małego Stawu, gdzie zbiorowiska są szczególnie rozdrobnione 27

i często informacja zgromadzona w terenie była zbyt szczegółowa, aby móc przełożyć ją na informację zawartą w pikselu o wielkości 3,2 m. Ponadto, część zbiorowisk występujących na referencyjnej mapie roślinności nieleśnej odgórnie została wyeliminowana na etapie samego przygotowywania wzorców, ze względu na zbyt wąski zasięg występowania (zespół czosnku syberyjskiego, traworośle trzcinnika leśnego) lub podczas testowania klasyfikatora, kiedy okazywało się, że dane zbiorowisko jest znacznie przeszacowane względem stanu faktycznego (murawy śmiałka pogiętego) lub obejmowało zbyt mało pikseli i próba nie była reprezentatywna (zbiorowisko goryszu miarza). Niniejsza praca zakładała wykorzystanie do identyfikacji algorytmu maszyn wektorów nośnych, które lepiej sprawdziły się w tym przypadku dla zbiorowisk o większych powierzchniach, natomiast do wykrycia zbiorowisk niewielkich, homogenicznych zajmujących pojedyncze płaty, czy zbiorowisk występujących w kompleksach złożonych z mniejszych płatów, można byłoby zastosować metody bazujące na pikselach czystych spektralnie (np. Spectral Angle Mapper) lub podpikselowe (np. Spectral Unmixing), uprzednio gromadząc dla nich charakterystyki spektralne. Problemem związanym ze specyfiką obszarów górskich, które są poddawane kartowaniu, są cienie topograficzne występujące na rejestrowanych obrazach. Dane APEX nie zostały skorygowane topograficznie, dlatego należało nałożyć na nie maskę cieni, która wyłączała pokryte nią obszary z analizy, w przeciwnym wypadku błędnie sklasyfikowanoby wydzielenia. Opracowanie maski polegało na doborze odpowiedniego progu wartości reflektancji przyjmowanych przez piksele reprezentujące cienie, zatem do tego obszaru zaliczyły się także piksele reprezentowane przez obiekty zbliżone do nich spektralnie. W ten sposób pod maską cieni znalazły się również pojedyncze piksele reprezentowane przez cienie rzucane przez świerczyny górnoreglowe, występujące na obszarze powyżej 2 m n.p.m. raczej pojedynczo lub w rozproszeniu. Podobna sytuacja wystąpiła w przypadku klasy chinofobne porosty naskalne, którą charakteryzuje występowanie cieni rzucanych przez skały, na których nie zalega śnieg, same także wyróżniają się ciemną barwą część pikseli w ich obrębie została wymaskowana. Dokładności klasyfikacji mogłyby zostać zwiększone, gdyby klasyfikację przeprowadzono na danych APEX skorygowanych topograficznie część zróżnicowanych zbiorowisk mogłaby zostać wyekstrahowana z obszaru Śnieżnych Kotłów, czy Małego Stawu. Obszary wyłączone z analiz, poza wspomnianymi kotłami polodowcowymi, znajdują się głównie na północnym stoku Śnieżki, gdzie pod maską występują jedynie porosty naskalne oraz zarośla kosodrzewiny z niewielkim udziałem świerczyn górnoreglowych. 28

W obszarach o dużych deniwelacjach analiza bardziej wysokorozdzielczych przestrzennie materiałów, np. ortofotomap, również nie przyniosłaby informacji o lokalizacji zbiorowisk, gdyż na nich cienie także byłyby widoczne. W takich przypadkach jedyną wiarygodną informacją, która mogłaby być wsparta hiperspektralnymi danymi z pułapu lotniczego, w których uwzględniona zostałaby topografia terenu, jest informacja pozyskana w terenie. Należy jednak zwrócić uwagę, że większość zbiorowisk udało się zaklasyfikować z wysokimi (powyżej 8%) dokładnościami i ocena wizualna map wynikowych również pozwala potwierdzić ten wniosek. Brak korekcji topograficznej nie spowodował błędów w wynikach, poza wyłączeniem części obszaru z analiz. Istotne natomiast było przeprowadzenie korekcji atmosferycznej danych, która spowodowała znaczne polepszenie dokładności dla pięciu klas zbiorowisk roślinnych, w tym jednej niewykrywalnej na danych nieskorygowanych (ziołorośle miłosny górskiej, por. podrozdział 7.). Wyeliminowanie wpływu atmosfery z danych poziomu było zatem ważnym elementem przetworzeń, bez którego wyniki klasyfikacji byłyby znacznie gorsze. Macierze błędów ukazały często mylone ze sobą klasy. Część z nich już na etapie testowania została wyeliminowana, ze względu na podobieństwo spektralne do innych klas, np. sudeckie zarośla kosówki i kosodrzewina na torfie różnią się jedynie właściwościami podłoża, a z pułapu samolotu nie jest możliwe wychwycenie różnic pomiędzy nimi zostały one połączone w jedną klasę (sudeckie zarośla kosówki). Poza odmienną strukturą, która częściowo znalazła się pod maską cieni, spektralnie podobne są także świerczyny górnoreglowe oraz kosodrzewina, które mieszały się ze sobą. W rozróżnieniu tych dwóch klas pomocne mogłoby okazać się użycie danych z lotniczego skaningu laserowego, które pozwoliłyby zróżnicować te zbiorowiska pod względem wysokości. Dało się zauważyć także mieszanie się klas współwystępujących, jak np. borówczyska czernicowe z wrzosowiskami, czy z traworoślami trzcinnika owłosionego. Trudność z identyfikacją zbiorowisk powodowała także różna aktualność wykorzystywanych danych. Mapa referencyjna roślinności nieleśnej (Wojtuń, Żołnierz 22) jest materiałem starszym o dziesięć lat od obrazu APEX. Największym zmianom w takim czasie uległa roślinność ruderalna, która należy do najbardziej dynamicznych i ma związek z działalnością człowieka. Zbiorowisko goryszu miarza zidentyfikowane na mapie roślinności nieleśnej podczas inwentaryzacji terenowej w roku 23 zajmowało niewielkie płaty, mniejsze od połowy wielkości piksela APEX. W roku 24 nie było możliwe wykrycie już nawet pojedynczych osobników. Aktualność dotyczy także zbiorowiska ziołorośle paprociowe, które na mapie z roku 22 zajmuje kilka większych płatów, 29

głównie w okolicach Szrenicy oraz Łabskiego Kotła, w mniejszym stopniu Małego Stawu. Od roku 2 w polskiej części Karkonoszy obserwuje się zamieranie paproci i wkraczanie na ich obszary zbiorowisk murawowych czy zaroślowych (Dunajski 26). Wstępne klasyfikacje bez weryfikacji terenowej pozwoliły zauważyć błędy w wynikach uzyskanych dla tej klasy spowodowane tym zjawiskiem (dokładność użytkownika,24%, producenta 3,23%, Marcinkowska i in. 24), w momencie ówczesnej klasyfikacji jeszcze nie poznanym. Dopiero weryfikacja terenowa w latach 23 i 24 pozwoliła zaobserwować zanik zbiorowiska w miejscach jego potencjalnego występowania (ryc. 56). Ryc. 56. Ziołorośla paprociowe, od lewej: obraz APEX (kompozycja RGB 38 5 6: 64 nm, 547 nm, 47 nm), pośrodku: obraz poklasyfikacyjny, od prawej: mapa roślinności nieleśnej Wojtunia i Żołnierza z roku 22. Kolorem czerwonym oznaczono zasięg występowania ziołorośli według mapy referencyjnej, natomiast barwa zgniłozielona na wyniku wskazuje na poprawne sklasyfikowanie pikseli do tej klasy (na podstawie: Marcinkowska i in. 24a). Podsumowując, należy zwrócić uwagę na specyfikę obiektu badań poddawanego klasyfikacji górskich zbiorowisk roślinnych. Dzięki charakterystycznym właściwościom spektralnym możliwe jest prawidłowe wyróżnianie większości zbiorowisk, jednak zbiorowiska znajdujące się w cieniach będą stanowiły utrudnienie dla klasyfikatora, szczególnie jeśli będą obejmowały niewielkie obszary, gdyż nie będzie możliwe zgromadzenie dla nich reprezentatywnych danych treningowych i weryfikacyjnych. Również zbiorowiska współwystępujące, tworzące kompleksy, są trudne do rozróżnienia zwłaszcza jeśli są zbliżone do siebie spektralnie. Wykorzystanie danych bez przeprowadzonej korekcji atmosferycznej może spowodować pogorszenie wyników, gdyż charakterystyki spektralne tych samych klas znajdujących się na różnych wysokościach prawdopodobnie będą bardziej zróżnicowane. W odniesieniu do obiektów, które ulegają dynamicznym zmianom bez uwzględnienia stanu aktualnego na czas wykonania zobrazowania wyniki mogą okazać się błędne. 3

8.3. Zalety zastosowanych badań Przeprowadzone klasyfikacje posłużyły do obiektywnej oceny możliwości zastosowania danych APEX i maszyn wektorów nośnych (SVM) do identyfikacji roślinności. Dane APEX są stosunkowo nowymi danymi i większość prac, jakie wykonano na nich do tej pory dotyczyła modyfikacji i opisów parametrów sensora oraz korekcji atmosferycznej, natomiast niewiele opracowano na ich podstawie analiz tematycznych. Niniejsza praca przedstawia algorytm szczegółowej klasyfikacji, której przedmiotem są liczne górskie zbiorowiska roślinne, co również nie jest częste w literaturze dotyczącej klasyfikacji. Algorytm obejmuje przetwarzanie danych od ich pozyskania, poprzez wstępne przetworzenia i transformacje do uzyskania efektu końcowego mapy rozkładu zbiorowisk roślinnych Karkonoszy, jak również raportu zawierającego dokładności sklasyfikowanych zbiorowisk, na podstawie którego możliwe jest wysnucie wniosków dotyczących identyfikowalności poszczególnych klas na podstawie dostępnych danych. Zastosowano różne zestawy pikseli treningowych i weryfikacyjnych z zamiarem określenia dokładności przy różnych kombinacjach. W pracach dotyczących klasyfikacji główny nacisk kładziony jest na zastosowane metody oraz uzyskane wyniki, przeważnie stosowane jest jedno wybrane podejście do wyboru próbek. Zestawienie różnych wyników uzyskanych dzięki wyborowi całych utworzonych poligonów, a także pikseli z nich wylosowanych na różne sposoby, pozwala na bardziej obiektywną ocenę wyników. Dzięki kilkakrotnemu losowaniu możliwe było uzyskanie -krotnie wyników dla poszczególnych klas, co wskazywało na trafność wylosowanych pikseli w przypadku zbiorowisk, dla których przyjmowane wartości były do siebie zbliżone. Metoda maszyn wektorów nośnych wykorzystana w pracy pozwoliła na identyfikację większości klas na wysokim poziomie dokładności, niezależnie od zastosowanej metody próbkowania wyniki dokładności uzyskane dla poszczególnych klas wykazywały podobne tendencje. Szczegółowy dobór parametrów poszczególnych funkcji jądra SVM pozwolił wyselekcjonować optymalny algorytm, dopasowany do danych wejściowych. Zastosowanie metody SVM w połączeniu z danymi hiperspektralnymi APEX, zawierającymi wiele zaszumionych kanałów, pozwoliło na wydobycie z nich jak największej ilości informacji; można to zauważyć po najwyższym wyniku klasyfikacji osiągniętym dla kanałów oryginalnych. Tradycyjne klasyfikatory nie byłyby w stanie poprawnie zidentyfikować klas na obrazie APEX, co ma związek w opisanym w podrozdziale.2.3. efektem Hughesa, jednak metoda SVM jest "odporna" na to 3

zjawisko i możliwe jest wykorzystanie bardzo wielu kanałów spektralnych obrazu hiperspektralnego do analizy (Gualtieri, Cromp 998). Istotnym elementem jest materiał referencyjny w postaci mapy roślinności nieleśnej Wojtunia i Żołnierza (22), która wskazuje, jakich zbiorowisk roślinnych należy się spodziewać na analizowanym obszarze. Znaczna część zbiorowisk nie zmieniła istotnie swych zasięgów względem roku 22 i dane zawarte na mapie są aktualne. Część zbiorowisk, które uległy zmianom na przestrzeni dziesięciu lat należało poddać weryfikacji terenowej w okresie fenologicznym zbliżonym do daty wykonania zobrazowania (od końca sierpnia do początku września), co pozwoliło na zarejestrowanie faktycznie występujących w danym momencie zbiorowisk przy użyciu odbiornika GPS. Bez danych referencyjnych nie byłoby możliwe wyróżnienie tylu klas zbiorowisk roślinnych z tak wysokimi dokładnościami. Uzyskana w procesie klasyfikacji mapa może być istotnym materiałem wspierającym prace botaniczne, wskazując w sposób obiektywny zidentyfikowane zbiorowiska roślinne na całym analizowanym terenie. Może ona także posłużyć do aktualizacji istniejących map oraz opracowywania map obszarów dotąd nie poznanych. Dla czeskiej części parku narodowego w Karkonoszach nie opracowano tak szczegółowej mapy na poziomie zbiorowisk roślinnych, zatem materiał uzyskany w wyniku klasyfikacji przeprowadzonej na podstawie danych z części polskiej może być cennym źródłem informacji o zbiorowiskach roślinnych występujących w Czechach. Jeśli chodzi o przydatność danych, ważny okazał się termin wykonania zobrazowania. We wrześniu roślinność zaczyna się przebarwiać, co pozwala ją bardzo dobrze różnicować. Np. należący do zbiorowiska muraw alpejskich sit skucina późnym latem przyjmuje rudawą barwę, co odróżnia go od pozostałych gatunków murawowych odmienną charakterystyką spektralną. Wykorzystanie do identyfikacji obrazu zarejestrowanego wiosną lub latem mogłoby nie pozwolić na jednoznaczne wyróżnienie cech spektralnych zbiorowisk zbliżonych do siebie spektralnie w fazie optimum wegetacji. Przedstawiony w niniejszej pracy algorytm klasyfikacji danych hiperspektralnych APEX wykorzystano do klasyfikacji typów roślinności Karkonoskiego Parku Narodowego na symulowanych hiperspektralnych danych satelitarnych EnMAP (The Environmental Mapping and Analysis Program 65, Marcinkowska-Ochtyra i in. 26). Dane te pochodzą z niemieckiej satelitarnej misji hiperspektralnej do monitoringu środowiska w skali 65 EnMAP jest sensorem typu pushbroom, którego zakres spektralny mieści się w przedziale od 42 do nm (VNIR) i 9-245 (SWIR), rozdzielczość przestrzenna obrazów wynosi 3 m, a czas rewizyty planowany jest na 4 dni (Guanter i in. 25). 32

globalnej, która planowana jest na rok 28 66 ; dane mają być udostępniane nieodpłatnie użytkownikom niekomercyjnym. W celu wsparcia misji, rozwoju instrumentu, a także przyszłego rozwoju algorytmów niemiecki instytut GFZ (The German Research Centre for Geosciences) w Poczdamie generuje realistyczne obrazy misji, zgodne z jej parametrami technicznymi. Wykonywane jest to poprzez symulację danych na podstawie wartości odbicia spektralnego innych danych hiperspektralnych przy użyciu narzędzia end-to-end simulation (EeTeS, SEGL I IN. 22). Na podstawie linii zobrazowania APEX dla obszaru Karkonoszy zasymulowany został obraz EnMAP (ryc. 57). A B Ryc. 57. A obraz APEX (kompozycja RGB 38 5 6: 64 nm, 547 nm, 47 nm), B symulowany obraz EnMAP (kompozycja RGB 22 64 2: 22 nm, 793 nm, 479 nm. Oprogramowanie ENVI 5.3) Zakres spektralny danych EnMAP jest zbliżony do zakresu obrazów APEX, natomiast rozdzielczość przestrzenna jest dużo niższa (3 m), przez to klasyfikacja często niewielkich powierzchniowo zbiorowisk roślinnych byłaby niemożliwa. Klasyfikacji poddano więc większe jednostki roślinności subalpejskiej i alpejskiej, czyli typy roślinności, w których skład wchodziły analizowane zbiorowiska, zaczerpnięte z mapy roślinności nieleśnej Karkonoszy (Wojtuń, Żołnierz 2). Były to kolejno: traworośla, murawy, subalpejskie zarośla liściaste, zbiorowiska krzewinkowe, roślinność młak 66 https://enmap.org, stan na dzień 27.4.26. 33

i torfowisk, zarośla kosodrzewiny, roślinność skał i piargów oraz lasy, a także obszary bez roślinności. Zredukowano przestrzeń spektralną obrazu EnMAP poprzez usunięcie kanałów związanych z absorpcją przez parę wodną (zakresy: 335-422 nm), na podstawie kanału 83 (944 nm) wykonana została maska cieni oraz wód. Poligony do klasyfikacji i weryfikacji zostały odpowiednio zagregowane i powiększone, aby obejmowały przynajmniej połowę wielkości piksela EnMAP. Do klasyfikacji wykorzystano parametry SVM oraz liczebność kanałów dające najbardziej satysfakcjonujące wyniki dla klasyfikacji zbiorowisk roślinnych na danych APEX, zastosowane w niniejszej pracy. Ponadto, w celu porównania wykonano również klasyfikację typów roślinności na danych APEX (ryc. 58). Ryc. 58. Wyniki klasyfikacji typów roślinności na danych APEX (a) i EnMAP (b) ( traworośla, 2 subalpejskie zarośla liściaste, 3 zarośla kosodrzewiny, 4 las, 5 murawy, 6 zbiorowiska krzewinkowe, 7 roślinność skał i piargów, 8 roślinność młak i torfowisk, 9 obszary bez roślinności, obszary wymaskowane, Marcinkowska-Ochtyra i in. 26) 34 Dokładność całkowita klasyfikacji dla danych APEX wyniosła 9,72% (współczynnik kappa,85), natomiast dla symulowanych danych EnMAP 78,25% (kappa,74). Wielkość piksela EnMAP nie pozwoliła na wyróżnienie dwóch klas