SZTUCZNE SIECI NEURONOWE W MODELOWANIU PROCESÓW Z OGRANICZONYM ZBIOREM DANYCH W INŻYNIERII ROLNICZEJ

Podobne dokumenty
WYZNACZANIE WARTOŚCI PODSTAWOWYCH PARAMETRÓW TECHNICZNYCH NOWOCZESNYCH KOMBAJNÓW ZBOŻOWYCH PRZY UŻYCIU SSN

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Widzenie komputerowe

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

PROGNOZOWANIE OSIADAŃ POWIERZCHNI TERENU PRZY UŻYCIU SIECI NEURONOWYCH**

ZASTOSOWANIE SIECI NEURONOWYCH DO OPTYMALIZACJI WARUNKÓW OBRÓBKI CIEPLNEJ STOPÓW Mg-Al

ZASTOSOWANIE AUTORSKIEJ METODY WYZNACZANIA WARTOŚCI PARAMETRÓW NOWOCZESNYCH SYSTEMÓW TECHNICZNYCH DO PŁUGÓW I OPRYSKIWACZY POLOWYCH

Projekt Sieci neuronowe

Streszczenie. Słowa kluczowe: modele neuronowe, parametry ciągników rolniczych

Sieci neuronowe w Statistica

Wstęp do sieci neuronowych, wykład 6 Wsteczna propagacja błędu - cz. 3

Sztuczne Sieci Neuronowe. Wiktor Tracz Katedra Urządzania Lasu, Geomatyki i Ekonomiki Leśnictwa, Wydział Leśny SGGW

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Testowanie modeli predykcyjnych

Zastosowania sieci neuronowych

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

DEKOMPOZYCJA HIERARCHICZNEJ STRUKTURY SZTUCZNEJ SIECI NEURONOWEJ I ALGORYTM KOORDYNACJI

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Uczenie sieci typu MLP

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Wykład wprowadzający

Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4

Analiza składowych głównych. Wprowadzenie

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

PORÓWNANIE ALGORYTMÓW OPTYMALIZACJI GLOBALNEJ W MODELOWANIU ODWROTNYM PROCESÓW SUSZENIA PRODUKTÓW ROLNICZYCH

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Aproksymacja funkcji a regresja symboliczna

... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych.

Wprowadzenie do teorii prognozowania

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

OCENA EFEKTYWNOŚCI NEURONOWEGO PROGNOZOWANIA W OPARCIU O WYBRANE METODY NA PRZYKŁADZIE DYSTRYBUCJI PRODUKTÓW ROLNICZYCH

8. Neuron z ciągłą funkcją aktywacji.

CHARAKTERYSTYKA I ZASTOSOWANIA ALGORYTMÓW OPTYMALIZACJI ROZMYTEJ. E. ZIÓŁKOWSKI 1 Wydział Odlewnictwa AGH, ul. Reymonta 23, Kraków

Dokumentacja Końcowa

MODELOWANIE PROCESÓW PRZETWÓRCZYCH Z UŻYCIEM SZTUCZNYCH SIECI NEURONOWYCH

Emergentne właściwości. sztucznych sieci neuronowych

Streszczenie. Słowa kluczowe: towary paczkowane, statystyczna analiza procesu SPC

ZASTOSOWANIE SZTUCZNYCH SIECI NEURONOWYCH DO OCENY ZDOLNOŚCI KREDYTOWYCH ROLNIKÓW KLIENTÓW FIRMY LEASINGOWEJ

Literatura. Sztuczne sieci neuronowe. Przepływ informacji w systemie nerwowym. Budowa i działanie mózgu

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

3. Modele tendencji czasowej w prognozowaniu

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

WYKŁAD 9 METODY ZMIENNEJ METRYKI

Ekonometria i prognozowanie Econometrics and prediction

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Agnieszka Nowak Brzezińska Wykład III

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

5. Model sezonowości i autoregresji zmiennej prognozowanej

Temat: Sieci neuronowe oraz technologia CUDA

METODA PROGNOZOWANIA SZEREGÓW CZASOWYCH PRZY UŻYCIU SZTUCZNYCH SIECI NEURONOWYCH

Sieci neuronowe jako sposób na optymalizacje podejmowanych decyzji. Tomasz Karczyoski Wydział W-08 IZ

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Przedmiot statystyki. Graficzne przedstawienie danych.

SIECI RBF (RADIAL BASIS FUNCTIONS)

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

WPŁYW KOMPRESJI BARW NA DZIAŁANIE NEURONOWEGO MODELU IDENTYFIKACYJNEGO

Przykładowe funkcje przejścia używane przy budowie sztucznych neuronów

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

PRZEWODNIK PO PRZEDMIOCIE

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

Dopasowywanie modelu do danych

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SIEĆ NEURONOWA JAKO NARZĘDZIE APROKSYMACJI I KLASYFIKACJI DANYCH. Jakub Karbowski Gimnazjum nr 17 w Krakowie

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Inżynieria Rolnicza 5(114)/2009

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311

PRZETWARZANIE GRAFICZNYCH DANYCH EMPIRYCZNYCH DLA POTRZEB EDUKACJI SZTUCZNYCH SIECI NEURONOWYCH, MODELUJĄCYCH WYBRANE ZAGADNIENIA INŻYNIERII ROLNICZEJ

wiedzy Sieci neuronowe (c.d.)

Inżynieria Rolnicza 5(114)/2009

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

INTERPOLACJA I APROKSYMACJA FUNKCJI

Algorytmy sztucznej inteligencji

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Analiza współzależności zjawisk

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

ALGORYTM UZUPEŁNIANIA BRAKUJĄCYCH DANYCH W ZBIORACH REJESTROWANYCH NA STACJACH MONITORINGU POWIETRZA

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR ANALIZA WŁASNOŚCI OPCJI SUPERSHARE

Ekonometria. Regresja liniowa, dobór postaci analitycznej, transformacja liniowa. Paweł Cibis 24 marca 2007

Optymalizacja ciągła

KRÓTKOTERMINOWE PROGNOZOWANIE ZAPOTRZEBOWANIA NA ENERGIĘ ELEKTRYCZNĄ ODBIORCÓW WIEJSKICH PRZY WYKORZYSTANIU MODELI MAMDANIEGO

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

Transkrypt:

Inżynieria Rolnicza /005 Jędrzej Trajer Katedra Podstaw Inżynierii Szkoła Główna Gospodarstwa Wiejskiego w Warszawie SZTUCZNE SIECI NEURONOWE W MODELOWANIU PROCESÓW Z OGRANICZONYM ZBIOREM DANYCH W INŻYNIERII ROLNICZEJ Streszczenie Celem pracy jest przedstawienie metody neuronowego modelowania procesów z ograniczonym zbiorem danych. W przykładzie wykorzystano bazę danych zmian cen przechowywanej marchwi. Podano koncepcję budowy modelu neuronowego, który pomimo ograniczonego zbioru danych posiadać może zadowalające własności uogólniające, w sensie rozszerzenia zasięgu jego stosowalności poza zbiór uczący. Słowa kluczowe: sztuczne sieci neuronowe, modelowanie, przechowalnictwo Wprowadzenie Znaczące zainteresowanie w zakresie wykorzystania sztucznych sieci neuronowych wynika z ich charakterystycznych właściwości. Posiadają zdolności aproksymacji dowolnego nieliniowego odwzorowania z zadaną dokładnością, jak również charakteryzują się zdolnościami do uogólniania zdobytej podczas uczenia wiedzy w zakresie modelowanego systemu. W literaturze nie zawsze dostatecznie dużo miejsca poświęca się uwagę tworzeniu neuronowych modeli dla mało licznych zbiorów uczących, dla których niejednokrotnie budowane sieci nie spełniają własności uogólniających. Jakość utworzonego modelu zależy bowiem zarówno od właściwego doboru struktury sieci, przeprowadzenia skutecznego uczenia, jak i liczności użytego zbioru danych w procesie uczenia. Tworzenie modeli neuronowych nie jest zadaniem łatwym, wymaga żmudnych badań i doświadczenia. Wynika to z trudności, jakie stwarza formalna analiza tego efektywnego narzędzia. Przedstawiane w literaturze wytyczne realizacji sieci odnoszą się bądź do wybranych przypadków, bądź są często zbyt ogólne. Poniżej, na przykładzie prognozy cen marchwi, przedstawiono wpływ zbioru danych na charakterystykę tworzonych 173

Jędrzej Trajer modeli. Znajomość występujących zależności decyduje o skuteczności budowy modeli, ułatwia postępowanie i prowadzi do szybkiego znalezienia efektywnych rozwiązań. Metodyka tworzenia modeli z ograniczonym zbiorem danych Modele neuronowe zalicza się do modeli indukcyjnych, które wykorzystuje się w celu rozwiązania problemów związanych z dużą złożonością modelowanego systemu i trudnościami w opisie jego dynamiki, w oparciu o uznane prawa teorii. Przydatność modelu określają miary jakości, opisujące zdolność do aproksymacji zbioru danych uczących i zdolność do uogólnień, to znaczy prawidłowego wyznaczenia wartości danych nie uczestniczących w procesie uczenia (zbiór testowy). Na zdolności te ma wpływ zarówno struktura sieci, jak i zbiór danych. Zdolności sieci neuronowych do aproksymacji określa twierdzenie Hecht- -Nielsena: Każda funkcja ciągła może być aproksymowana z dowolnie dużą dokładnością przez sieć neuronową posiadającą n neuronów w warstwie wejściowej, (n+1) neuronów w warstwie ukrytej o odpowiednio dobranych nieliniowych funkcjach aktywacji i jednym neuronie w warstwie wyjściowej o funkcji przejścia. Natomiast zdolność sieci do uogólnień określa miara VCdim (Vapnika- -Chervonenkisa), zdefiniowana jako liczebność zbioru danych uczących, które mogą zostać bezbłędnie odtworzone we wszystkich możliwych konfiguracjach dla danej topologii sieci. Nie istnieje prosty związek między architekturą sieci wielowarstwowej a miarą VCdim, w literaturze [Hush i in. 1993] podaje się oszacowanie jej granic, w formie następującej zależności: K N VC dim N w ( 1+ log Nn ), (1) gdzie: N, K, N n odpowiednio liczba neuronów w warstwie wejściowej, ukrytej i całkowita ich liczba w sieci, N w całkowita liczba wag w sieci, [ ] część całkowita. Dolna granica przedziału jest w przybliżeniu równa liczbie wag łączących warstwę wejściową z warstwą ukrytą, natomiast górna jest większa od dwukrotnej liczby wszystkich wag sieci. Nawet szacunkowe przyjęcie tej miary umożliwia ocenę przydatności zbioru danych w stosunku do wybranej topologii sieci. Wytyczne, oparte na badaniach, przedstawiane przez różnych badaczy [Vapnik 1998, Hush i in. 1993] wskazują, że: 174

Sztuczne sieci neuronowe... liczebność próbek uczących, zapewniających dobre zdolności uogólniające sieci, powinna kształtować się w zakresie od dziesięcio- do dwudziestokrotności miary VCdim. W zagadnieniach charakteryzujących się małą nieliniowością dopuszcza się też mniej liczne zbiory, jednak o liczności przypadków nie mniejszej od liczby wszystkich połączeń w sieci. Jak widać, wybór topologii sieci, tzn. jej stopnia złożoności, wymaga kompromisu, jakiego należy dokonać w zastosowanej liczbie neuronów, tak aby model odznaczał się równocześnie dobrymi zdolnościami do aproksymacji i do generalizacji. Kluczowym jest tu, przede wszystkim, określenie liczby neuronów w warstwie ukrytej. Dobrym oszacowaniem, opartym na teorii Kołomogorowa, jest liczba neuronów ukrytych K będąca średnią geometryczną liczby wejść N i wyjść M sieci: K = NM () Najczęściej przyjmuje się taką liczbę neuronów ukrytych, a następnie przeprowadza się ich redukcję do osiągnięcia jak najlepszych miar jakości sieci. W przypadku mało licznych zbiorów danych, postępowanie lepiej zacząć od jak najmniejszej ich liczby i stopniowo ją zwiększać. Osobny problem stanowi wymiar zbioru danych, który determinuje liczbę neuronów w warstwie wejściowej. Redukcja wymiaru przestrzeni danych prowadzi także do uproszczenia architektury sieci. Celem metod redukcji jest zastąpienie pierwotnego zestawu zmiennych nowym, o zmniejszonej liczbie zmiennych wejściowych. Sieci posiadające niewielkie rozmiary mają istotne zalety, do których zaliczyć należy: zwiększoną szybkość uczenia, mniejszą wymaganą liczność zbiorów danych i większe zdolności generalizujące przy niezmienionych rozmiarach zbiorów danych. Skuteczność uczenia zależy od właściwego wyboru zbioru walidacyjnego. Przy ograniczonym zbiorze danych jego liczność jak i wybór nie jest bez znaczenia. Wytyczne co do liczebności tego zbioru, które podawane są w literaturze nie dają dobrych rezultatów uczenia ze względu na ich zbyt duży rozmiar. Dobre wyniki można już uzyskać przy liczności tego zbioru10-15% zbioru uczącego, pod warunkiem odpowiedniego doboru tych przypadków. Wybór ten każdorazowo można oceniać poprzez sprawdzenie statystyk regresyjnych odpowiadającej temu przypadkowi sieci liniowej. Do oceny własności uogólniających modelu lepiej jest wybrać zbiór testowy ciągu kolejnych danych (nie biorących udział w uczeniu sieci), dla których obliczamy globalny błąd względny niż sprawdzać statystyki regresyjne danych testowych wybranych przypadkowo. Globalny błąd względny modelu opisuje zależność: 175

Jędrzej Trajer ( n yi di ) i= 1 δ ( D) =, (3) gl n yi i= 1 gdzie: y i d i n wartości zadane danych wyjściowych, wartości wyznaczone za pomocą sieci, liczba danych. Do oceny prognoz stosuje się także współczynnik I Theila [Duch i in. 000], który informuje także o przyczynach rozbieżności pomiędzy wartościami otrzymanymi za pomocą sieci d i a zadanymi y i : Wartość jego jest równa kwadratowi globalnego błędu względnego. Składniki: I 1, I, I 3 tego współczynnika opisują odpowiednio - obciążenie prognozy, błąd spowodowany niedostateczną elastycznością prognozy oraz błąd związany z niedostateczną zgodnością kierunku zmian prognozy z wyznaczaną wartością. Miara ta może jeszcze lepiej charakteryzować własności uogólniające modelu. Przykłady wpływu topologii sieci na jakość modelu Ilustrację wpływu ograniczonego zbioru danych na charakterystykę neuronowego modelu przedstawiono na przykładzie prognozowania miesięcznych cen detalicznych marchwi. Zbiór ten składał się z 78 przypadków danych, który dla potrzeb uczenia i weryfikacji sieci podzielono na trzy podzbiory: uczący, walidacyjny i testowy. Otrzymane wartości błędów, pomiędzy zadaną zmienną wyjściową a pochodzącą z modelu, wskazują na jego zdolności aproksymujące (zbiór uczący) i uogólniające (zbiór testowy). Przebadano trzy neuronowe modele szeregów czasowych o następujących topologiach sieci (odpowiednio: liczba neuronów w warstwach wejściowej, ukrytej, wyjściowej): 6-3-1 model M, 6--1 model P i 6-1-1 model D. Ilustrację wpływu liczby neuronów w warstwie ukrytej na zdolności uogólniające sieci neuronowej pokazano na rysunku 1. Wykresy te uzyskane na zbiorze testowym, świadczą o najlepszych własnościach uogólniających modelu z optymalnie dobraną liczbą neuronów ukrytych, model P. Właściwości aproksymujące modeli ocenionow oparciu o statystyki regresyjne tych modeli, tabela 1. Przyjęto, że średnia M.B. - wartość średnia z modułów błędów (zadanych i obliczonego), iloraz O.S. - iloraz odchylenia standardowego błędów i odchylenia standardowego (dla bardzo dobrego modelu osiąga wartość poniżej 0,1), korelacja - współczynnik korelacji Pearsona, liczony pomiędzy zadanymi i obliczonymi wartościami zmiennej objaśnianej. 176

Sztuczne sieci neuronowe... dane eksperymentalne wyniki z modelu M wyniki z modelu P wyniki z modelu D cena, zł/kg aproksymacja danych eksperymentalnych aproksymacja wyników z modeli czas, miesiące Rys. 1. Fig. 1. Dane eksperymentalne i wyniki z poszczególnych modeli (M), (P) i (D) Experimental data and results of different models (M), (P) and (D) Tabela 1. Podstawowe statystyki regresyjne poszczególnych modeli szeregu czasowego Table 1. Basic statistics of particular models of time series Miara Zbiór uczący Zbiór walidacyjny jakości D M P D M P Śre. M.B. 0,165 0,0981 0,0897 0,169 0,1116 0,1399 Ilor. O.S. 0,5181 0,341 0,97 0,5198 0,318 0,377 Korel. 0,8560 0,9461 0,9549 0,8791 0,956 0,9503 Przedstawione miary jakości wskazują, że odpowiadające sobie zbliżone wartości poszczególnych statystyk świadczą o reprezentatywności wyboru zbioru walidacyjnego i poprawności przeprowadzenia procesu uczenia. Iloraz O.S. powinien być mniejszy od jedności, dla bardzo dobrych modeli jest z przedziału od 0 do 0,1. Uzyskane miary świadczą o dobrych własnościach aproksymujących modelu rozbudowanego, model M i i modelu z właściwie dobraną liczbą neuronów w warstwie ukrytej, model P, a tylko dostatecznych modelu o topologii zbyt uproszczonej, model D. Ocenę własności uogólniających modeli stanowi wartość globalnego błędu modelu, jaki oblicza się dla danych nie biorących w procesie 177

Jędrzej Trajer tworzenia sieci. Przedstawiono tu jako bardziej reprezentatywny wskaźnik oceny wartości składowe współczynnik I Theila [Duch 000], tabela. Składnikami tego współczynnika są: I = I1 + I I 3 (4) + odpowiednio reprezentujące: obciążenie prognozy, błąd spowodowany niedostateczną elastycznością prognozy oraz błąd związany z niedostateczną zgodnością kierunku zmian prognozy z kierunkiem zmian wartości prognozowanej. W tabeli podano także wyniki dla modelu opartego na głównych składowych (wybrane zmienne wejściowe) o topologii 4--1. Przedstawione wyniki wskazują na dużo lepsze własności modelu głównych składowych niż szeregu czasowego, wartość całkowita współczynnika Theila jest dużo mniejsza dla tego modelu. Wynika to z dwóch powodów: po pierwsze uzyskano strukturalnie prostszy model, a po drugie istnieją o wiele większe jakościowe możliwości opisu dynamiki badanego procesu. Model ten posiada przez to lepsze własności uogólniające w zakresie modelowanego systemu, na co wskazuje mały błąd spowodowany przez składnik I charakteryzujący elastyczność prognozy. Dużą zaletą strukturalnie uproszczonego modelu jest możliwość modelowania zjawisk w oparciu o mniejsze zbiory danych, co jest szczególnie cenne w przypadku procesu przechowywania. Charakteryzuje się on bowiem dużą złożonością, a przy tym małą powtarzalnością warunków, w jakich jest przeprowadzany. Tabela. Procentowy udział poszczególnych składowych we współczynniku jakości Theila dla modelu szeregu czasowego i głównych składowych z właściwą liczbą neuronów w warstwie ukrytej Table. Percentage share of individual components of Theil quality index for the model of time series and main components with proper number of neurons in hidden layer Jakość modelu Szereg czasowy Główne Składowe Podsumowanie I 1 I % % % 100% 0,00436 7,8 0,04836 86,6 0,00311 5,6 0,05583 0,0010 78,4 0,00006 3,7 0,0008 17,9 0,00154 Wybór struktury modelu jest jednym z głównych problemów w badaniach i zastosowaniach sieci neuronowych. Przy ich wyborze najczęściej stosuje się metodę prób i błędów lub korzysta z różnego rodzaju przesłanek, a nawet wygenerowuje I 3 I 178

Sztuczne sieci neuronowe... się je automatycznie. Postępowanie takie może być nieefektywne, zwłaszcza jeśli dysponuje się, do tworzenia modeli, mało licznymi zbiorami danych. W takich przypadkach, poszukiwanie adekwatnej struktury można zawęzić poprzez oszacowanie maksymalnej możliwej liczby neuronów w warstwie ukrytej, na podstawie miary VCdim. Oszacowanie to, w fazie analizy wstępnej dla wybranego zbioru danych, umożliwia również zmniejszenie struktury sieci poprzez redukcję wymiaru głównych składowych (zmienne wejściowe), ograniczając w ten sposób przestrzeń poszukiwań. Na skuteczność uczenia i jakość modelu ma też wpływ odpowiedni wybór zbioru walidacyjnego. Ocenę modelu i jego własności uogólniających najlepiej jest dokonać obliczając błąd względny odpowiednio wybranych danych testowych lub dla prognoz współczynnik Theila. Bibliografia Heht-Nielsen R. 1991. Neurocomputing. Addison Wesley, Amsterdam. Hush D., Horne B. 1993. Progress in supervised neural networks. IEEE Signal Processing Magazine, January 93. Osowski S. 1996. Sieci neuronowe w ujęciu algorytmicznym. Wydawnictwo Naukowo Techniczne, Warszawa. Praca zbiorowa (red. Duch W., Korbicz J., Rutkowski L., Tadeusiewicz R.) 000. Sieci neuronowe. Biocybernetyka i Inżynieria Biomedyczna, tom 6. Akademicka Oficyna Wydawnicza Exit, Warszawa. Tadeusiewicz R. 1998. Elementarne wprowadzenie do techniki sieci neuronowych z przykładowymi programami. Akademicka Oficyna Wydawnicza PLJ, Warszawa. Vapnik V. 1998. Statical learning theory. John Wiley and Sons, New York. 179

Jędrzej Trajer NEURAL NETWORKS IN MODELING AGRICULTURAL ENGINEERING PROCESSES WITH LIMITED DATE FILE Summary In this paper the analysis of the neural modeling of the agricultural engineering process was presented. The problems of effectiveness and quality neural networks in these processes was discussed. Key words: artificial neural networks, modeling, agricultural engineering processes 180