PROBABILISTYCZNE MODELE ZJAWISK PRZESTRZENNYCH W ROLNICTWIE

Podobne dokumenty
MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH

PODSTAWOWE ZASADY MODELOWANIA PROCESU PRODUKCJI ROLNICZEJ

NIEPEWNOŚĆ W REPREZENTACJI ZJAWISK PRZESTRZENNYCH

MODELOWANIE PROCESU EKSPLOATACJI OBIEKTÓW TECHNICZNYCH ZA POMOCĄ DYNAMICZNYCH SIECI BAYESOWSKICH

MODELOWANIE PROBLEMÓW DECYZYJNYCH W INTEGROWANYM SYSTEMIE PRODUKCJI ROLNICZEJ

KONCEPCJA ANKIETOWEGO POMIARU KULTURY BEZPIECZEŃSTWA PRACY

Systemy uczące się wykład 2

Etapy modelowania ekonometrycznego

NIEPEWNOŚĆ DANYCH PRZESTRZENNYCH W SYSTEMACH INFORMACJI GEOGRAFICZNEJ (GIS)

IDENTYFIKACJA ATRYBUTÓW JAKO ETAP MODELOWANIA ERGONOMICZNEJ OCENY STANOWISK PRACY

Matematyka Stosowana na Politechnice Wrocławskiej. Komitet Matematyki PAN, luty 2017 r.

Modelowanie ryzyka w transporcie

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

WPŁYW TECHNICZNEGO UZBROJENIA PROCESU PRACY NA NADWYŻKĘ BEZPOŚREDNIĄ W GOSPODARSTWACH RODZINNYCH

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

WPŁYW TEMPERATURY W POMIESZCZENIACH POMOCNICZYCH NA BILANS CIEPŁA W BUDYNKACH DLA BYDŁA

Propensity Score Matching

MODELOWANIE SYNTEZY DZIAŁAŃ OCHRONNYCH W ROLNICZYM PROCESIE PRODUKCYJNYM

Aproksymacja funkcji a regresja symboliczna

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

DOPASOWYWANIE KRZYWYCH

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

Systemy uczące się wykład 1

KOMPUTEROWE WSPOMAGANIE CHEMICZNEJ OCHRONY ROŚLIN PRZY POMOCY PROGRAMU HERBICYD-2

Metody Prognozowania

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

STATYSTYKA MATEMATYCZNA

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

ANALIZA OBCIĄŻEŃ JEDNOSTEK NAPĘDOWYCH DLA PRZESTRZENNYCH RUCHÓW AGROROBOTA

KOMPUTEROWY MODEL UKŁADU STEROWANIA MIKROKLIMATEM W PRZECHOWALNI JABŁEK

ZASTOSOWANIE APLIKACJI KOMPUTEROWEJ TRACE DO OCENY IDENTYFIKACJI OBIEKTÓW RUCHOMYCH

5. WNIOSKOWANIE PSYCHOMETRYCZNE

STOCHASTYCZNY MODEL BEZPIECZEŃSTWA OBIEKTU W PROCESIE EKSPLOATACJI

Wnioskowanie bayesowskie

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

MODELOWANIE SYSTEMU OCENY WARUNKÓW PRACY OPERATORÓW STEROWNI

Systemy ekspertowe - wiedza niepewna

KONCEPCJA METODYKI OCENY SIEWU ROZPROSZONEGO

Prawdopodobieństwo czerwonych = = 0.33

Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4

ANALIZA WŁAŚCIWOŚCI FILTRU PARAMETRYCZNEGO I RZĘDU

Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

Metody numeryczne. Sformułowanie zagadnienia interpolacji

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

Informatyka I stopień (I stopień / II stopień) ogólno akademicki (ogólno akademicki / praktyczny) podstawowy (podstawowy / kierunkowy / inny HES)

WYBÓR PUNKTÓW POMIAROWYCH

ANALIZA WYDAJNOŚCI PRODUKCYJNEJ RODZINNEGO GOSPODARSTWA ROLNEGO PRZY POMOCY SIECI NEURONOWEJ

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

LISTA KURSÓW PLANOWANYCH DO URUCHOMIENIA W SEMESTRZE ZIMOWYM 2015/2016

ODWZOROWANIE RZECZYWISTOŚCI

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

Opis efektów kształcenia dla programu kształcenia (kierunkowe efekty kształcenia) WIEDZA. rozumie cywilizacyjne znaczenie matematyki i jej zastosowań

SYMULACJA RYZYKA CZASOWO-KOSZTOWEGO PRZEDSIĘWZIĘĆ NA TLE METODY PERT/COST

Załącznik nr 8. do Studium Wykonalności projektu Sieć Szerokopasmowa Polski Wschodniej województwo podkarpackie

ZASTOSOWANIE MIKROPROCESOROWEGO REJESTRATORA DO POMIARU TEMPERATURY W PIECU KONWEKCYJNO-PAROWYM

Interpolacja i modelowanie krzywych 2D i 3D

EFEKTY UCZENIA SIĘ DLA KIERUNKU INŻYNIERIA DANYCH W ODNIESIENIU DO EFEKTÓW UCZENIA SIĘ PRK POZIOM 6

Modelowanie niezawodności prostych struktur sprzętowych

Agnieszka Nowak Brzezińska Wykład III

Analiza danych. TEMATYKA PRZEDMIOTU

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zintegrowany proces podejmowania decyzji w zakresie bezpieczeństwa instalacji procesowych

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

Sposoby opisu i modelowania zakłóceń kanałowych

ZASTOSOWANIE SPLOTU FUNKCJI DO OPISU WŁASNOŚCI NIEZAWODNOŚCIOWYCH UKŁADÓW Z REZERWOWANIEM

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

KIERUNKOWE EFEKTY KSZTAŁCENIA

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

InŜynieria Rolnicza 14/2005. Streszczenie

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych

ODWZOROWANIE PRZEBIEGU PULSACJI METODAMI SZTUCZNEJ INTELIGENCJI

WYNIKI BADAŃ WARTOŚCIOWANIA PROCESU OBSŁUGI TECHNICZNEJ CIĄGNIKÓW ROLNICZYCH O RÓŻNYM POZIOMIE WYKORZYSTANIA

Szacowanie ryzyka z wykorzystaniem zmiennej losowej o pramatkach rozmytych w oparciu o język BPFPRAL

INTERPOLACJA I APROKSYMACJA FUNKCJI

ZAGADNIENIE METODY OCENY DOKŁADNOŚCI CYFROWYCH MODELI TERENU W ASPEKCIE IMPLEMENTACJI EUROPEJSKIEJ DYREKTYWY INSPIRE

LABORATORIUM Z FIZYKI

POISSONOWSKA APROKSYMACJA W SYSTEMACH NIEZAWODNOŚCIOWYCH

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

SYSTEM OCENY RYZYKA W PROCESIE PRODUKCJI WYROBU MEDYCZNEGO

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Zmienność wiatru w okresie wieloletnim

PRZESTRZENNY MODEL PRZENOŚNIKA TAŚMOWEGO MASY FORMIERSKIEJ

Koncepcja pomiaru i wyrównania przestrzennych ciągów tachimetrycznych w zastosowaniach geodezji zintegrowanej

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

Matematyka. Wzornictwo Przemysłowe I stopień ogólno akademicki studia stacjonarne wszystkie specjalności Katedra Matematyki dr Monika Skóra

Newton vs. Lagrange - kto lepszy?

Przedmiot statystyki. Graficzne przedstawienie danych.

ROZKŁAD POPRZECZNY CIECZY DLA ROZPYLACZY SYNGENTA POTATO NOZZLE

Uczenie sieci neuronowych i bayesowskich

Biostatystyka, # 3 /Weterynaria I/

Transkrypt:

Inżynieria Rolnicza 5(114)/2009 PROBABILISTYCZNE MODELE ZJAWISK PRZESTRZENNYCH W ROLNICTWIE Andrzej Marciniak Katedra Podstaw Techniki, Uniwersytet Przyrodniczy w Lublinie Streszczenie. Niepewność, zarówno stochastyczna jak i epistemiczna, obecna w modelach zjawisk czaso-przestrzennych w rolnictwie uzasadnia zastosowanie metod probabilistycznych predykcji, wyjaśnianiu i aproksymacji obiektów przestrzennych. Z metodologicznego, obliczeniowego i inferencyjnego punktu widzenia odpowiednią technologią modelowania są tu sieci bayesowskie traktowane jako systemy reprezentacji wiedzy. W takim ujęciu modelowanie sprowadza się do translacji wiedzy z języka naturalnego na formalny i wykonywalny język sieci bayerowskich. Logiczną spójność i efektywność takiego rozumienia procesu modelowania pokazano na przykładzie budowy modelu aproksymacji i predykcji plonu pszenicy. Słowa kluczowe: systemy informacji przestrzennej (GIS), probabilistyczna predykcja i interpolacja obiektów przestrzennych, sieci bayesowskie Wstęp Już w latach 80-tych ubiegłego wieku rozważany był problem: czy obiekty biologiczne uczestniczące w rolniczych procesach produkcyjnych należy traktować indywidualnie czy też statystycznie. W latach 90-tych popularna stała się zasada speaking soil/plant/animal approach interpretowana jako potrzeba dostarczenia glebie, roślinom, zwierzętom tego czego potrzebują, wtedy kiedy potrzebują i w niezbędnej ilości (site specific treatment). Mniej więcej w tym samym czasie udostępniona została technologia globalnego pozycjonowania obiektów oraz pasywnego i aktywnego skanowania powierzchni Ziemi w różnych wymiarach przestrzeni informacyjnej. Technologie te zostały systemowo zintegrowane pod postacią GIS. Rolnictwo było jedną z pierwszych dziedzin zastosowań GIS. Jest tak dlatego, że obiekty uczestniczące w rolniczych procesach produkcyjnych charakteryzują się znaczną rozległością czasoprzestrzenną. Ilość informacji, ich precyzja w tym dokładna lokalizacja w czasie i przestrzeni uzyskiwana w systemach GIS sprawiły że zasada speaking plant approach stała się praktycznie wykonywalna pod postacią technologii rolnictwa precyzyjnego. Pozyskiwanie danych empirycznych dla systemów GIS i ich przetwarzanie jest kosztowne i dlatego stosuje się tu podejście statystyczne obejmujące próbkowanie, interpolację i aproksymację [Moller, Waagepetersen 2003]. Klasyczne metody próbkowania i interpolacji opracowane jeszcze w epoce przed GIS-owskiej mają charakter deterministyczny. Próbkowanie badanych obiektów i ich charakterystyk czasowo-przestrzennych odbywa się 193

Andrzej Marciniak zazwyczaj we wcześniej zaplanowanych, a zatem zdeterminowanych punktach pomiarowych. Finalnym produktem ma tu być mapa mierzonej charakterystyki. Wymaga to interpolacji pomiędzy punktami pomiarowymi, w węzach interpolacyjnych. W efekcie powstaje ciągła (być może z punktami nieciągłości) mapa mierzonej wielkości, na której nie ma rozróżnienia pomiędzy miejscami w których dokonano pomiaru a miejscami w których dokonano interpolacji. W miejscach takich mamy często do czynienia z praktycznie istotną niepewnością epistemiczną. Probabilistyczne modelowanie obiektów i zjawisk przestrzennych Celem referatu jest propozycja zastosowania probabilistycznego podejścia do problemu interpolacji i predykcji (aproksymacji) obiektów przestrzennych. Przyrodnicze, zwłaszcza biologiczne obiekty przestrzenne charakteryzują się kognitywną nieokreślonością zarówno co do ich granic zewnętrznych jak i wewnętrznego zróżnicowania charakterystyk przestrzennych i jako takie mogą być modelem matematycznej abstrakcji jaką są pola losowe [Dalang, Dozzi, Russo 2002]. Formalne podejście do modelowania pól losowych oparte jest na teorii stochastycznych równań różniczkowych cząstkowych. Jednak ze względu na wymóg obliczalności i jednoczesnej dokładności modeli ( lepsze przybliżone obliczenia na dokładnych modelach niż dokładne obliczenia na modelach przybliżonych ) proponuje się tu zastosowanie technologii sieci bayesowskich, [Gelman (i in.) 2003]. Język sieci bayesowskich charakteryzuje się dużą ekspresywnością i opartymi na logice mechanizmami wnioskowania, umożliwiającymi bogate i logicznie spójne wyjaśnianie zaobserwowanych faktów w kategoriach przyczynowo-skutkowych oraz przewidywanie logicznych konsekwencji różnych założeń modelowych. Ekspresywność języka i możliwość maszynowego uczenia na przykładach ma ważne znaczenie metodologiczne budowanie modeli staje się procesem translacji wiedzy wyrażonej w języku naturalnym na język formalny i wykonywalny, procesem poszerzonym o automatyczne wykrywanie prawidłowości (zależności) w danych empirycznych i ich modelowanie. Przykład Wartości interpolowane nie mogą być traktowane jako obciążone tą samą dozą niepewności co wartości zmierzone. Niepewność ta nawet wzrasta jeżeli wartości w punktach pomiarowych też są niepewne. Dlatego należy założyć, że wartość mierzonej wielkości w punkcie interpolacji może być co najwyżej znana z dokładnością do rozkładu prawdopodobieństwa (być może o bardzo małej wariancji). Na rysunku 1 przedstawiono sieć bayesowską reprezentującą problem interpolacji badanej wielkości w punkcie (i, j) w oparciu o znajomość rozkładu wartości pomiaru w sąsiednich punktach przy założeniu, że dokładna wartość w węzłach pomiarowych jest znana z dokładnością do rozkładu prawdopodobieństwa. Przykład wykonano w środowisku BayesiaLab - zaawansowanym systemie budowania modeli probabilistycznych w oparciu o procesy maszynowego uczenia na przykładach empirycznych i automatycznej inferencji [Bayesia (on-line) 2009]. 194

Probabilistyczne modele zjawisk... W prawej części okna (rys. 1) przedstawiono rozkłady prawdopodobieństwa nad zbiorem wartości zmiennych w węzłach pomiarowych i w konsekwencji w węźle interpolowanym. Rys. 1. Fig. 1. Wynik interpolacji plonu w węźle X ij jeżeli jego wysokość w branych pod uwagę węzłach sąsiednich jest znana z dokładnością do rozkładu prawdopodobieństwa Result X ij of yield interpolation in node (i, j) when yield in neighbouring nodes is known with accuracy to probability distribution Na rysunku 2 przedstawiono sytuację, w której wartości zmierzone, znane są dokładnie a pomimo tego, zgodnie z przewidywaniami, wartość w węźle interpolacyjnym jest zmienną losową ale o znacznie mniejszej wariancji. Sieci przedstawione na rysunkach 1 i 2 można określić jako interpolatory bayesowskie. Odpowiednikiem klasycznego modelu aproksymacyjnego jest sieć bayesowska przedstawiona na rysunku 3. Sieć tę można określić jako predyktor bayesowski. Służy ona do predykcji (podstawowy rodzaj wnioskowania bayesowskiego) wartości aproksymowanej wielkości zgodnie ze znanymi relacjami przyczynowo-skutkowymi. Inny rodzaj wnioskowania bayesowskiego od skutków do przyczyn, pokazano na rysunku 5. W tym przypadku zadajemy wysokość plonu i pytamy o lokalizację (z dokładnością do rozkładu prawdopodobieństwa) i inne atrybuty fragmentów pola o takim plonie. 195

Andrzej Marciniak Rys. 2. Fig. 2. Wynik interpolacji plonu w węźle X ij jeżeli jego wysokość w branych pod uwagę węzłach sąsiednich jest dokładnie znana Result X ij of yield interpolation in node (i, j) when yield in neighbouring nodes is exactly known Wejściem tej sieci są współrzędne punktu a wyjściem w tym przypadku predykcja plonu. Sieć ta ma warstwę pośrednią którą są zmienne reprezentujące czynniki mające udokumentowany związek przyczynowo skutkowy ze zmienną wynikową. Istotnym problemem jest wyznaczenie warunkowego rozkładu prawdopodobieństwa nad tymi zmiennymi. Problem rozwiązano w ten sposób, że wartości tych zmiennych dla danego pola i dla danego punktu na tym polu są wynikami klasyfikacji deterministycznego lub probabilistycznego klasyfikatora uczonego na przykładach. Ekspozycja, np. jest węzłem sieci ściśle deterministycznym natomiast klasa bonitacji jest węzłem reprezentującym klasyfikator bayesowski. Węzeł inne oznacza zmienną, której wartość true reprezentuje czynniki plonotwórcze natomiast wartość false czynniki niesprzyjające. Dodanie tego węzła ma związek z interpretacją prawdopodobieństwa bayesowskiego jako miary niepewności, której wartość aktualizowana jest poprzez fakty potwierdzające lub zaprzeczające. Warunkowy rozkład prawdopodobieństwa nad zmienną Plon otrzymywany jest bezpośrednio w procesie uczenia na danych empirycznych lub zadawany formułą reprezentującą w adekwatny sposób integrację informacji z węzłów poprzedzających. 196

Probabilistyczne modele zjawisk... Rys. 3. Fig. 3. Wynik predykcji plonu z dokładnością do rozkładu prawdopodobieństwa w nieokreślonym miejscu pola Result of yield prediction with accuracy to probability distribution, without specification of site coordinates Rys. 4. Fig. 4. Wynik predykcji plonu z dokładnością do rozkładu prawdopodobieństwa w określonym miejscu o współrzędnych x,y,z Result of yield prediction in site with exactly specified coordinates 197

Andrzej Marciniak Rys. 5. Fig. 5. Odpowiedź na pytanie o miejsca na polu, w których przewidywany plon przyjmie wartość z przedziału 7-8 t ha -1 The answer to the question about the places on the field where predicted yield is in the range of 7-8 t ha -1 Podsumowanie Poszerzona analiza źródeł i natury niepewności w systemach informacji przestrzennej jest dobrym uzasadnieniem zastosowania probabilistycznego podejścia do problemu interpolacji i predykcji (aproksymacji) obiektów przestrzennych. Z metodologicznego, obliczeniowego i inferencyjnego punktu widzenia proponuje się tu wykorzystanie technologii bayesowskich sieci probabilistycznych. Skuteczność tej technologii pokazano na przykładzie bayesowskiego interpolatora i predyktora plonu. Bibliografia Dalang R., Dozzi M., Russo F. (ed.). 2002. Seminar on Stochastic Analysis, Random Fields and Applications IV. Centro Stefano Franscini. Ascona. Brikhäuser (Progress in Probability) Gelman A. i in. 2003. Bayesian Data Analysis. Chapman & Hall/CRC. Moller J., Waagepetersen R. P. 2003. A Statistical Inference and Simulation for Spatial Point Processes. Monographs on Statistics and Applied Probability. Chapman & Hall/CRC Bayesia (on-line) 2009. BayesiaLab - Bayesian network software. http://www.bayesia.com/ 198

Probabilistyczne modele zjawisk... PROBABILISTIC MODELS OF SPATIAL PHENOMENA IN AGRICULTURE Abstract. Uncertainty, both stochastic and epistemic, occurring in models of space-time phenomena in agriculture justifies application of probabilistic methods in predication, clarifying and approximation of spatial objects. From methodological, computational and inferential point of view, in this case proper modelling technologies include Bayesian networks treated as knowledge representation systems. From this perspective modelling comes down to translation of knowledge from natural language to formal and executable language of Bayesian networks. Logical coherence and effectiveness of this definition of modelling process is shown on the example of building a model of wheat crop approximation and prediction. Key words: GIS, probabilistic prediction and approximation of spatial objects, Bayesian networks Adres do korespondencji: Marciniak Andrzej; e-mail: Andrzej.Marciniak@up.lublin.pl Katedra Podstaw Techniki Uniwersytet Przyrodniczy w Lublinie ul. Doświadczalna 50A 20-280 Lublin 199