Operat losowania powierzchni próbnych dla inwentaryzacji łosia w RDLP Lublin w lutym 2015



Podobne dokumenty
Jak policzyć łosie w Polsce? Sugestie pod rozwagę

Trudności i ograniczenia w analizie danych uzyskanych metodą pędzeń próbnych

Inwentaryzacja zasobów drzewnych w IV rewizji urządzania lasu

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Testy nieparametryczne

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Udostępnianie informacji o środowisku: wyniki badania

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Matematyka dyskretna. Andrzej Łachwa, UJ, /10

Wydział Matematyki. Testy zgodności. Wykład 03

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

WYKŁAD 5 TEORIA ESTYMACJI II

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Narzędzia geomatyczne w monitoringu zwierząt

Arkusz inwentaryzacji zwierzyny przeprowadzonej

SUM Edukacja Techniczno Informatyczna Języki i Systemy Programowania. Wykład 3. dr Artur Bartoszewski - WYKŁAD: Języki i Systemy Programowania,

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Pobieranie prób i rozkład z próby

Niestandardowa tabela częstości

Estymacja punktowa i przedziałowa

Zastosowanie Excela w matematyce

Testowanie modeli predykcyjnych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza korespondencji

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Zarządzanie populacjami zwierząt łownych na terenie RDLP w Gdańsku. Roman Wasilewski, Marek Kowalewski RDLP w Gdańsku

Wykrywalność ptaków: metody szacowania i czynniki na nią wpływające

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

ALGORYTM RANDOM FOREST

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 3 Hipotezy statystyczne

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Populacja dzika a problem szkód wyrządzanych w uprawach rolnych woj. pomorskiego. Marek Kowalewski RDLP w Gdańsku

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Ćwiczenia Skopiować do swojego folderu plik cwiczenia-kl.ii.xls, a następnie zmienić jego nazwę na imię i nazwisko ucznia

Metody badań terenowych i zebrane dane

LABORATORIUM 6 ESTYMACJA cz. 2

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Teledetekcyjna metoda oceny liczebności dużych ssaków kopytnych. Henryk Okarma Instytut Ochrony Przyrody PAN Antoni Łabaj SmallGIS Kraków

Tworzenie szablonów użytkownika

Warsztat: Randomizacja w programie Excel

Zadania ze statystyki cz.8. Zadanie 1.

System imed24 Instrukcja Moduł Analizy i raporty

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY

Metoda Karnaugh. B A BC A

Badanie zależności skala nominalna

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka w pracy badawczej nauczyciela

Statystyka matematyczna i ekonometria

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zakład Urządzania Lasu. Taksacja inwentaryzacja zapasu

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Rodzaje badań statystycznych

Zagrożenia drzewostanów bukowych młodszych klas wieku powodowanych przez jeleniowate na przykładzie nadleśnictwa Polanów. Sękocin Stary,

Analiza wariancji. dr Janusz Górczyński

Szczegółowy opis badania - badanie CAPI na ogólnopolskiej próbie stowarzyszeń i fundacji

zdarzenie losowe - zdarzenie którego przebiegu czy wyniku nie da się przewidzieć na pewno.

POLITECHNIKA OPOLSKA

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Wnioskowanie bayesowskie

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Biostatystyka, # 3 /Weterynaria I/

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Metody Obliczeniowe w Nauce i Technice

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

Sterowanie wielkością zamówienia w Excelu - cz. 3

Przykład 1. (A. Łomnicki)

Ćwiczenia z arytmetyki komputera Budowa adresu IP

Zajęcia wprowadzające W-1 termin I temat: Sposób zapisu wyników pomiarów

Budowa pionowa drzewostanu w świetle przestrzennego rozkładu punktów lotniczego skanowania laserowego

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Statystyka matematyczna dla leśników

Konsekwencje przyrodnicze, gospodarcze i społeczne wysokich stanów zwierzyny. Jakub Borkowski, Patryk Kaczyński

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Rachunek prawdopodobieństwa

Konkursy w województwie podkarpackim w roku szkolnym 2009/2010

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Transkrypt:

Operat losowania powierzchni próbnych dla inwentaryzacji łosia w RDLP Lublin w lutym 2015 Wskazówki techniczne do realizacji prac Przemysław Chylarecki Muzeum i Instytut Zoologii PAN; Fundacja Greenmind Operat losowania i losowanie Należy zdefiniować (najlepiej w oparciu o siatkę kwadratów 1x1 km narzuconą na obszar RDLP Lublin, bo to ułatwi dalsze analizy) 3 warstwy (rozłączne obszary w granicach RDLP) uzgodnione w protokole ze spotkania 04.02.2015. Warstwy te tworzyły: A. nadleśnictwa (12), w których w 2012 i 2013 wykonano pędzenia łosia; B. nadleśnictwa, w których wtedy szacowano liczebność łosia w oparciu o całoroczne obserwacje; w tej warstwie do operatu losowania włączane mają być tylko kwadraty 1x1 km w całości zajęte przez lasy (państwowe lub prywatne); C. nadleśnictwa "za Sanem". Dla każdej warstwy (z osobna) należy wykonać poniższe czynności. 1. Należy sporządzić pełną listę bloków sąsiadujących oddziałów/wydzieleń, stanowiących potencjalne powierzchnie próbne. Lista ta nazywa sie operatem losowania (lub ramką losowania). Dla potrzeb dalszych objaśnień przyjmujemy, ze liczy ona wierszy (=potencjalnych powierzchni próbnych). 2. Bloki sąsiadujących oddziałów będące potencjalnymi powierzchniami próbnymi powinny mieć wielkość zbliżoną do 100 hektarów 3. Dla każdej potencjalnej powierzchni próbnej należy ustalić faktyczną jej wielkość oraz dalsze atrybuty - np. procent powierzchni leśnej, strukturę gatunków panujących oraz strukturę klas wieku. Te atrybuty będą niezbędne na etapie analitycznym. 4. Jako półprodukt potrzebny w dalszych pracach należy wyliczyć faktyczną średnią wielkość powierzchni próbnych ( ) w operacie losowania. 5. Należy ustalić docelową liczbę powierzchni koniecznych do wykonania liczeń w danej warstwie. W tym celu należy zsumować powierzchnie wszystkich wydzieleń stanowiących operat losowania ( ), ustalić 10% tej wielkości ( ), a następnie uzyskać docelową liczbę powierzchni próbnych ( ) poprzez: 1

Dla warstw B i C należy przyjąć 5% łącznej wielkości operatu losowania. 6. Należy wylosować 110% wartości (czyli: ), co pozwoli na ewentualne usunięcie z próby powierzchni, które są niemożliwe do pędzenia w terenie. 7. Losowanie należy zrealizować w układzie, w którym poszczególne potencjalne powierzchnie próbne stanowić będą wiersze tabeli, a atrybuty tej powierzchni (jej identyfikator, faktyczna wielkość, atrybuty wieku i składu gatunkowego) będą kolumnami tejże tabeli lub będą powiązane relacyjnie z jej identyfikatorem. 8. Losowanie w tabeli można przeprowadzić w środowisku Excela, w środowisku GIS lub w środowisku R. Sprowadza się ono do losowego wyboru wierszy spośród wszystkich wierszy. w środowisku R użyteczna jest funkcja sample(), w Excelu z użyciem funkcji LOS() lub RANDBETWEEN(), w GIS służą do tego predefiniowane panele w menu. Np. w QGIS jest to "losowy wybór" (=losowanie proste) oraz "losowy wybór w podzbiorach" (=losowanie proste warstwowe). 9. Po wylosowaniu wierszy należy przejrzeć ręcznie (lub automatycznie w GIS) wylosowane powierzchnie i oflagować powierzchnie położone bliżej siebie niż 1 km. 10. W parach powierzchni zlokalizowanych bliżej niż 1 km należy odrzucić powierzchnię położoną bardziej na północ; przy jednakowych wartościach położenia na północ odrzucić tę bardziej na wschód (reguły odrzucania przykładowe). 11. Należy odrzucić powierzchnie ewidentnie niemożliwe do pędzenia - przecięte dużą rzeką, drogą wojewódzką, z dużą liczbą upraw grodzonych itd. Liczba odrzuconych powierzchni nie powinna być zbyt duża, tak by zachować do pędzeń zakładane powierzchni. Jeśli będzie ich nieznacznie mniej lub nieznacznie więcej niż - nic się nie stanie. Uwaga. Powyższy schemat zakłada, że należy zdefiniować w GIS wszystkie potencjalne powierzchnie próbne, zaznaczając przyległe oddziały lub wydzielenia dbając przy tym, by ich powierzchnia wynosiła ok. 100 ha. Jest to bardzo duża praca, niemożliwa do zautomatyzowania. Można ją znacznie uprościć stosując trick opisany poniżej. Na całą warstwę (lub lepiej na całą RDLP Lublin) należy narzucić siatkę kwadratów 1x1 km (=100 ha) służącą efektywnie jako maska operatu losowania. Kwadraty należy oznaczyć jednoznacznym identyfikatorem (najlepiej unikatowo powiązanym z nadleśnictwem i numerem oddziału pokrywającym się z kwadratem, np. nr-em oddziału którego lewy dolny narożnik znajduje się (a) wewnątrz kwadratu, (b) najbliżej lewego dolnego rogu kwadratu maski). Atrybuty z punktu 3 wyliczyć dla kwadratów 1x1 km. Losowanie przeprowadzić na tabeli kwadratów 1x1 km. Dopiero po losowaniu i wyłącznie dla wylosowanych kwadratów przeprowadzić operację odwzorowania każdego wylosowanego kwadratu na wzorzec realnie istniejących oddziałów i wydzieleń maksymalnie (choć nie perfekcyjnie) pokrywających się z danym kwadratem. W ten sposób wyznaczyć realne powierzchnie próbne (mioty) do pędzeń. Ustalić atrybuty z punktu 3 dla każdego faktycznie zdefiniowanego wydzielenia (powierzchni próbnej). Przeprowadzić pędzenia na tak wyznaczonych powierzchniach próbnych. 2

Pędzenia na powierzchniach próbnych Kluczowe znaczenie ma uzgodnienie z wykonawcami liczenia wszelkich sytuacji spornych zaraz po wykonaniu pędzenia. Odpowiednie poprawki są wprowadzane do protokołów. Najlepiej by protokoły liczeń były osobne dla każdego miotu i zbierane były przez kierownika prac po każdym miocie. Analiza danych Wyniki liczeń w miotach muszą być wpisywane do tabeli, która służyła od losowania i w której są zapisane atrybuty powierzchni próbnej. Liczba łosi w danej warstwie nie powinna być obliczana jako średnie zagęszczenie na powierzchnię próbną razy liczba powierzchni próbnych w warstwie. Taki wynik będzie bardzo nieprecyzyjny i będzie ignorował dostępną informację pozwalającą znacząco uściślić oceny całkowite. W szczególności - informację o tym, jakie atrybuty powierzchni próbnej decydują o tym że łosia nie stwierdzono versus łoś został stwierdzony w pędzeniu. W dalszej kolejności można też wykorzystać atrybuty powierzchni do ustalenia czynników wpływających na liczbę łosi w miotach, gdzie były one stwierdzone. Takie modelowanie liczebności łosi jako funkcji atrybutów powierzchni musi jednak być przeprowadzone z użyciem modeli uwzględniających szczególne właściwości uzyskanych danych. Liczebności uzyskane dla poszczególnych powierzchni nie będą miały rozkładu normalnego (Gaussa). Jak wszystkie wyniki zliczeń (tzw. count data) powinny mieć rozkład zbliżony do rozkładu Poissona. jednak biorąc pod uwagę niewielkie zagęszczenia łosia, jego skupiskowość oraz relatywnie nieduże powierzchnie próbne, można się też spodziewać, że dane będą charakteryzować się nadmiarową zmiennością w stosunku do danych zgodnych z rozkładem Poissona. W szczególności można oczekiwać, że dane będą zawierały dużo ("za dużo" jak na rozkład Poissona) wartości zerowych. Do takich danych stosuje się specjalne modele, które osobno szacują: (a) prawdopodobieństwo stwierdzenia zera łosi na powierzchni próbnej (jako zmienną dwumianową) oraz (b) liczebność łosi na powierzchniach, na których go stwierdzono (jako zmienną o rozkładzie Poissona, NB lub podobnym). Takie podejście stosował ongiś prof. A. Tomek do wyliczeń zagęszczeń jeleniowatych (nazywając te dwa składniki modelu "funkcją zewnętrzną" i "funkcją wewnętrzną"). Obecnie tego typu modele są rutynowo stosowane w zaawansowanej statystyce ekologicznej jako modele typu "zero-inflated" lub "zero-added" W sumie zatem należy spróbować dopasować do danych szereg różnych klas modeli różniących się zakładaną strukturą błędu, np.: Poisson (PO) quasi Poisson negative binomial (NB) Poisson-inverse gaussian (PIG) zero-inflated negative binomial (ZINB) zero-inflated Poisson (ZIPO) zero-added negative binomial (ZANB) zero-added Poisson (ZAPO) zero-inflated Poisson inverse gaussian (ZIPIG) 3

Po ustaleniu najlepszej struktury błędu należy dopasować predyktory (atrybuty powierzchni) dające najlepsze dopasowanie modelu z wybranej wcześniej klasy. Modele powinny obok predyktorów zawierać również - zawsze - faktyczną wielkość powierzchni próbnej jako tzw. offset. Przykładowy model - zdefiniowany w środowisku R - może wyglądać tak: model1 <- glm (liczba.losi ~ powierzchnia.sosny.3klasa + powierzchnia.wszystkich.1klasa + offset(log(wielkosc.powierzchni)), family=poisson, data=tabela.dane.zliczen) gdzie: powierzchnia.sosny.3klasa, powierzchnia.wszystkich.1klasa to przykładowe atrybuty powierzchni użyte jako predyktory w modelu, Wybór modelu najlepiej dopasowanego do danych (chodzi zarówno o klasę modelu = strukturę błędu, jak i wybór predyktorów) powinien nastąpić z użyciem kryterium AIC (lub AICc). Modele te powinny być dopasowane w środowisku R z użyciem bibliotek pscl i gamlss Po wyborze najlepszego modelu należy użyć go do przewidywania wartości liczebności łosi w każdym kwadracie operatu losowania, z użyciem generycznej funkcji predict(). Następnie należy podsumować wartości przewidywane modelem dla każdego kwadratu w operacie losowania. W ten sposób uzyskamy oszacowanie łącznej liczebności łosi w całym operacie losowania danej warstwy (tj. w kwadratach). Bedzie to oszacowanie uwzględniające zróżnicowane wartości predyktorów w konkretnych kwadratach. Takie oszacowania uzyskane dla każdego kwadratu w operacie mogą być wykorzystane do sumowania w mniejszych wydzieleniach - np. w skali obwodów łowieckich, nadleśnictw czy OHZ. Kluczowe znaczenie ma tu wcześniejsze znalezienie wśród atrybutów powierzchni próbnych dobrych predyktorów, które pozwolą z dużym sukcesem (=precyzyjnie) przewidywać liczebność łosi - zarówno w skali całej warstwy, jak i w skali pojedynczego obwodu. Jeśli nie uda się znaleźć dobrych predyktorów, to wyniki będą mało precyzyjne. Logistyka Wykonanie operatu losowania i przeprowadzenie samego losowanie wymaga udziału fachowca z dobrą znajomością programów GIS. Przeprowadzenie samego losowania (w GIS lub w Excel lub w środowisku R) powinno odbyć się w obecności Zespołu. Należy również doprowadzić do tego, by lokalizacja wylosowanych powierzchni została pokazana na mapie. Wykonanie analizy uzyskanych danych wymaga udziału fachowca z dobrą znajomością środowiska R i bibliotek plsc oraz gamlss w tymże środowisku. Oferuję nieodpłatną pomoc w analizie danych. Przy dobrze przygotowanych danych wejściowych (tabela z wynikami liczeń i atrybutami powierzchni) mogę ją wykonać w kilka godzin w Lublinie w obecności Zespołu (ekran komputera rzutowany na ścianę). Ewentualne 4

wcześniejsze udostępnienie danych pozwoli mi napisać skrypt analizy zawczasu i skrócić sesję analizy i prezentacji wyników. Literatura (do analizy danych) Hilbe J.M. 2014. Modeling Count Data. Cambridge Univ. Press. Zeileis A., Kleiber C,.Jackman S. 2007. Regression Models for Count Data in R. Research Report Series / Department of Statistics and Mathematics, 53. Department of Statistics and Mathematics, WU Vienna University of Economics and Business, Vienna. Zuur A.F., Hilbe J.M., Ieno E.N. 2013. A Beginner's Guide to GLM and GLMM with R. Highland Statistics, Newburgh. Zuur A.F., Ieno E.N., Walker N.J., Saveliev A.A., Smith G.M. 2009. Mixed Effects Models and Extensions in Ecology with R. Springer, New York. 5