THE NEURAL NETWORKS OF THE TYPE MLP AND RBF AS CLASSIFYING TOOLS IN PICTURE ANALYSIS



Podobne dokumenty
PRZETWARZANIE GRAFICZNYCH DANYCH EMPIRYCZNYCH DLA POTRZEB EDUKACJI SZTUCZNYCH SIECI NEURONOWYCH, MODELUJĄCYCH WYBRANE ZAGADNIENIA INŻYNIERII ROLNICZEJ

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

KLASYFIKACJA TEKSTUR ZA POMOCĄ SVM MASZYNY WEKTORÓW WSPIERAJĄCYCH

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

NEURONAL IDENTIFICATION OF THE CHOSEN CEREAL PESTS ON THE BASIS OF INFORMATION CONTAINED IN THE FORM OF TWO-DIMENSIONAL PICTURES

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

ALGORYTM ROZPOZNAWANIA OBRAZÓW MATERIAŁÓW BIOLOGICZNYCH

EXPECTATION CROPS OF CHOSEN AGRICULTURAL FETUSES WITH THE HELP OF NEURAL MODEL BY TIME SERIES

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

Pattern Classification

Streszczenie. Słowa kluczowe: modele neuronowe, parametry ciągników rolniczych

WPŁYW KOMPRESJI BARW NA DZIAŁANIE NEURONOWEGO MODELU IDENTYFIKACYJNEGO

InŜynieria Rolnicza 14/2005. Streszczenie

KONWERSJA OBRAZÓW CYFROWYCH DO POSTACI ZBIORÓW UCZĄCYCH DLA POTRZEB MODELOWANIA NEURONOWEGO

NEURAL NETWORK ) FANN jest biblioteką implementującą SSN, którą moŝna wykorzystać. w C, C++, PHP, Pythonie, Delphi a nawet w środowisku. Mathematica.

Systemy uczące się Lab 4

WPŁYW LICZBY ZMIENNYCH NA JAKOŚĆ DZIAŁANIA NEURONOWEGO MODELU DO IDENTYFIKACJI MECHANICZNYCH USZKODZEŃ ZIARNIAKÓW KUKURYDZY

Przetwarzanie obrazu

Przetwarzanie obrazów rastrowych macierzą konwolucji

Systemy liczenia. 333= 3*100+3*10+3*1

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 6 Modelowanie przypadków uŝycia i czynności. Materiały dla studentów

PROGRAM WSPOMAGAJĄCY OCENĘ INWESTYCJI MECHANIZACYJNYCH DOZEM 2

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

Programowanie komputerów

NEURAL IDENTIFICATION OF SELECTED KINDS OF INSECTS BASED ON COMPUTER TECHNOLOGY FOR THE IMAGES ANALYSIS

EKSPLOATACJA SYSTEMÓW TECHNICZNYCH - LAB. Wprowadzenie do zajęć

Metody systemowe i decyzyjne w informatyce

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

WYZNACZANIE WARTOŚCI PODSTAWOWYCH PARAMETRÓW TECHNICZNYCH NOWOCZESNYCH KOMBAJNÓW ZBOŻOWYCH PRZY UŻYCIU SSN

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Obliczenia inteligentne Zadanie 4

Sztuczne Sieci Neuronowe. Wiktor Tracz Katedra Urządzania Lasu, Geomatyki i Ekonomiki Leśnictwa, Wydział Leśny SGGW

Podstawy Sztucznej Inteligencji (PSZT)

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 5 Ćwiczenia w narzędziu CASE diagram przypadków uŝycia. Materiały dla nauczyciela

SYSTEM MONITOROWANIA DECYZYJNEGO STANU OBIEKTÓW TECHNICZNYCH

Wstęp do sieci neuronowych laboratorium 01 Organizacja zajęć. Perceptron prosty

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

dr inż. Piotr Odya dr inż. Piotr Suchomski

Programowanie obiektowe. Literatura: Autor: dr inŝ. Zofia Kruczkiewicz

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Sieci neuronowe w Statistica

WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48

Przepływy danych. Oracle Designer: Modelowanie przepływów danych. Diagramy przepływów danych (1) Diagramy przepływów danych (2)

MATLAB Neural Network Toolbox przegląd

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

PRZEWODNIK PO PRZEDMIOCIE

Zastosowania sieci neuronowych

Sztuczne sieci neuronowe (SNN)

Instrukcja automatycznego tworzenia pozycji towarowych SAD na podstawie danych wczytywanych z plików zewnętrznych (XLS).

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 4 Ćwiczenia w narzędziu CASE diagram czynności. Materiały dla studenta

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

PROGNOZOWANIE OSIADAŃ POWIERZCHNI TERENU PRZY UŻYCIU SIECI NEURONOWYCH**

WYKORZYSTANIE ALGORYTMÓW ROZPOZNAWANIA OBRAZU W BADANIACH NAUKOWYCH NA PRZYKŁADZIE PROGRAMU ZIEMNIAK-99

Przetwarzanie obrazu

Laboratorium przedmiotu Technika Cyfrowa

Spis treści. spis treści wygenerowany automatycznie

ZACHODNIOPOMORSKI UNIWERSYTET TECHNOLOGICZNY W SZCZECINIE

SIECI RBF (RADIAL BASIS FUNCTIONS)

Prof. Stanisław Jankowski

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

Programowanie obiektowe zastosowanie języka Java SE

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 2 Ćwiczenia w narzędziu CASE diagram klas. Materiały dla nauczyciela

ZASTOSOWANIE AUTORSKIEJ METODY WYZNACZANIA WARTOŚCI PARAMETRÓW NOWOCZESNYCH SYSTEMÓW TECHNICZNYCH DO PŁUGÓW I OPRYSKIWACZY POLOWYCH

Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów

KOMPUTEROWE WSPOMAGANIE DOBORU OŚWIETLENIA NA STANOWISKACH PRACY

Analiza obrazu. wykład 3. Marek Jan Kasprowicz Uniwersytet Rolniczy 2009

Projekt Sieci neuronowe

PRZEWODNIK PO PRZEDMIOCIE

PROJEKT INTERFEJSU UśYTKOWNIKA PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU>

USING A PROBABILISTIC NEURAL NETWORK AND THE NEAREST NEIGHBOUR METHOD TO IDENTIFY SHIP RADIOSTATIONS

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

INTERAKTYWNY SYSTEM EDUKACYJNY WSPOMAGAJĄCY PROCES PROJEKTOWANIA ORAZ EKSPLOATACJI SZTUCZNYCH SIECI NEURONOWYCH W ROLNICTWIE

Optymalizacja systemów

Narzędzia informatyczne wspierające przedsięwzięcia e-commerce

NEURAL IMAGE DATA COMPRESSION IN THE PROCESS OF IDENTIFICATION OF SELECTED AGRICULTURAL OBJECTS

Instrukcja realizacji ćwiczenia

Komunikator internetowy w C#

Przykładowe funkcje przejścia używane przy budowie sztucznych neuronów

Lista zagadnień kierunkowych pomocniczych w przygotowaniu do egzaminu dyplomowego magisterskiego Kierunek: Mechatronika

Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.

Rozdział 1 Sztuczne sieci neuronowe. Materiały do zajęć dydaktycznych - na podstawie dokumentacji programu Matlab opracował Dariusz Grzesiak

Widzenie komputerowe (computer vision)

ANALIZA WYDAJNOŚCI PRODUKCYJNEJ RODZINNEGO GOSPODARSTWA ROLNEGO PRZY POMOCY SIECI NEURONOWEJ

Wykaz tematów prac inżynierskich dla studentów studiów stacjonarnych kierunku Informatyka i agroinżynieria w roku akademickim 2014/2015

PRZEWODNIK PO PRZEDMIOCIE

PROGRAMOWALNE STEROWNIKI LOGICZNE

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

9.5 Rozliczanie zaopatrzenia w przedmioty ortopedyczne i środki pomocnicze

Programowanie obiektowe

PRZEWODNIK PO PRZEDMIOCIE

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

Techniki uczenia maszynowego nazwa przedmiotu SYLABUS

Spis treści. Lekcja 1: PowerPoint informacje podstawowe 1. Lekcja 2: Podstawy pracy z prezentacjami 36. Umiejętności do zdobycia w tej lekcji 36

Zapisywanie algorytmów w języku programowania

Transkrypt:

Piotr BONIECKI Akademia Rolnicza w Poznaniu Instytut InŜynierii Rolniczej THE NEURAL NETWORKS OF THE TYPE MLP AND RBF AS CLASSIFYING TOOLS IN PICTURE ANALYSIS Summary The neuronal identification of pictorial data, with special emphasis on both quantitative & qualitative analysis, is more frequently utilized to gain & deepen the empirical data knowledge. Extraction & then classification of selected picture features, enables one to create computer tools in order to identify these objects presented as, for example, digital pictures. In relationship from this, it seems to be purposeful the search of the modern methods helping educational process in the range of construction as well as exploitation of neuronal models in context of their utilization in picture analysis process. The additional aim of the work was the comparison of neural network of the type MLP and RBF for indication of the optimum classification tool. SIECI NEURONOWE TYPU MLP ORAZ RBF JAKO NARZĘDZIA KLASYFIKACYJNE W ANALIZIE OBRAZU Streszczenie Neuronowa identyfikacja danych obrazowych, ze szczególnym naciskiem na analizę ilościową oraz jakościową, coraz częściej wykorzystywana jest do pozyskiwania oraz zgłębiania wiedzy zawartej w danych empirycznych. Ekstrakcja, a następnie klasyfikacja wybranych cech obrazu, pozawala na wytworzenie informatycznych narzędzi do identyfikacji wybranych obiektów, prezentowanych np. w postaci obrazu cyfrowego. W związku z tym, celowym wydaje się być poszukiwanie nowoczesnych metod wspomagających proces edukacyjny w zakresie konstrukcji oraz eksploatacji modeli neuronowych w kontekście ich wykorzystania w procesie analizy obrazu. Dodatkowym celem pracy było porównanie jakości sieci MLP oraz RBF mające na względzie wskazanie optymalnego instrumentu klasyfikacyjnego. Wprowadzenie Rozpoznawanie obrazu oparte na technikach klasyfikacyjnych, to jedna z dziedzin informatycznych, w której sieci neuronowe znajdują szerokie zastosowanie. Obserwowany ostatnio szybki rozwój programów typu OCR (Optical Character Recognition), czyli aplikacji do rozpoznawania znaków (równieŝ pisanych ręcznie) jest moŝliwy głównie sztucznych oparciu o zastosowanie sztucznych sieci neuronowych. Dzięki m.in. zdolności do samouczenia się, sztuczne sieci neuronowe stały się w tej dziedzinie narzędziem wiodącym. Rozpoznawanie obrazu przy uŝyciu modeli neuronowych znalazło zastosowanie w wielu dziedzinach. RównieŜ w rolnictwie jest ono coraz częściej wykorzystywane, m.in. do identyfikacji szkodników, uszkodzeń ziaren czy chorób roślin. W pracy badano moŝliwości wykorzystania sieci neuronowych typu RBF (Radial Basis Function) oraz MLP (MultiLayer Perceptrons), jako narzędzi klasyfikacyjnych do analizy obrazu prezentowanego sieci w postaci dwu wymiarowej mapy binarnej (obraz czarno-biały). Analizie poddano zbiór cyfr arabskich napisanych róŝnego rodzaju czcionkami przy uŝyciu wytworzonej uprzednio aplikacji do rozpoznawania cyfr. Dla poprawnego nauczenia właściwej topologii sieci neuronowej, konieczne było wykorzystanie odpowiedniej rozdzielczości matrycy, a co za tym idzie wygenerowanie (w postaci wektorów uczących) duŝej ilości danych wejściowych. W celu usprawnienia tego procesu uŝyto jako narzędzia pomocniczego wytworzonego programu Czcionka, dzięki któremu moŝliwa była konwersja obrazów roŝnych czcionek w formie bitmapy na ciągi cyfrowe oraz zapisanie ich jako plik tekstowy, akceptowalny w procesie uczenia przez symulator sztucznych sieci neuronowych, zaimplementowany w pakiecie STATISTICA v.7.1. Celem pracy było wytworzenie oraz testowanie, zgodnie ze standardami inŝynierii oprogramowania, interaktywnej aplikacji komputerowej Rozpoznawanie cyfr, wspomagającej proces edukacyjny w zakresie konstrukcji oraz eksploatacji podstawowych topologii sztucznych sieci neuronowych w aspekcie uŝycia ich jako narzędzi identyfikacyjnych. Wytworzony edukacyjny system informatyczny ma przybliŝyć wybrane zagadnienia z zakresu sieci typu perceptron i sieci radialnej oraz praktycznie prezentować zasadę działania tych sieci. Wiadomości podstawowe Obraz cyfrowy w ujęciu analizy komputerowej to dwuwymiarowa tablica, w której zawierają się wartości poszczególnych elementów obrazu (punkty i piksele). Najprostszym przypadkiem jest obraz binarny, gdzie piksele mogę przyjmować dwie wartości: 0 lub 1. Rozpatrując obraz kodowany w stopniach szarości, wartości te odpowiednio się zwiększają w zakresie narzuconym przez długość słowa maszynowego, np. w przypadku kodowania za pomocą 8 bitów zakres wynosi od 1 do 256. Jeśli chodzi natomiast o obraz kolorowy, sposób reprezentacji punktu (piksela) odnosi się na ogół do trzech składowych: czerwonej, zielonej i niebieskiej (w przypadku modelu koloru RGB). W analizie obrazu cyfrowego wyróŝnić moŝna trzy rodzaje zagadnień: polepszenie jakości, segmentacja oraz rozpoznanie obiektów. Zazwyczaj występują one w trzech etapach, zachowując podaną wyŝej chronologię. 34

P o l e p s z e n i e j a k ości obrazu cyfrow e g o Do polepszenie jakości obrazu cyfrowego słuŝą róŝnego rodzaju techniki filtracyjne. Ich Zasada ich działania oparta jest na tzw. operacji konwolucji, będącej w istocie operacją kontekstową, która uwzględnia sąsiedztwo danego punktu obrazu. Polega to na tym, Ŝe przyjmując pewną wartość sąsiedztwa, definiuje się jego kształt ( najczęściej jest to kwadrat, np. 33, 55 lub uogólniając: nn pikseli). Dla przykładowego sąsiedztwa 33 (rys. 1.) operacja konwolucji przebiega w następujący sposób: a) okno o rozmiarze 3 3 jest przemieszczane po obrazie cyfrowym (źródłowym), b) aktualny piksel centralny i jego sąsiedztwo jest przekształcane według zadanej reguły filtracji algorytmicznie lub przez sieć neuronową, c) nowa wartość piksela wpisywana jest w odpowiednie miejsce obrazu wyjściowego (x). S e g m e n t a c j a o b r a z u Segmentacja obrazu jest etapem analizy, polegającym na wydzieleniu fragmentów składających się na obraz, które w następnej kolejności będą odrębnie poddane rozpoznaniu. Jeśli rozpatrywane są sceny statyczne, wówczas najpopularniejszą techniką segmentacji jest binaryzacja, ewoluująca od prostego progowania, w stronę złoŝonych algorytmów wielo i zmiennoprogowych. Inne stosowane metody to: detekcja i łączenie krawędzi obiektów z analizą powstałych linii i konturów. Obrazy w których istotne są tekstury, analizowane są specjalnie do tego celu tworzonymi metodami, bazującymi na analizie statystycznej podobszarów (okien) obrazu [2]. R o z p o z n a n i e o b i e k t ó w Obiekty wydzielone w poprzednich dwóch etapach, poddawane są w następnej kolejności rozpoznaniu. Jest to ostatni krok w procesie komputerowego widzenia. Operacja ta, moŝe być realizowana w dwojaki sposób. Pierwszym rozwiązaniem jest bezpośrednie porównanie ze wzorcem. Częściej jednak, stosuje się porównanie na podstawie cech, które zostały określone na etapie segmentacji. Podsumowując naleŝy zauwaŝyć, Ŝe w zadaniu rozpoznawania dąŝy się do określenia przynaleŝności rozmaitego typu obiektów do wyselekcjonowanych wcześniej klas. Rozpoznawanie to realizowane jest w sytuacji braku informacji a priori na temat reguł przynaleŝności obiektów do poszczególnych klas. Jedyna informacja, moŝliwa do wykorzystania przez algorytm lub maszynę rozpoznającą jest zawarta w ciągu uczącym, złoŝonym z obiektów, dla których znana jest prawidłowa klasyfikacja. Brak apriorycznej wiedzy oznacza to, Ŝe maszyna uczy się rozpoznawania na podstawie przedstawionych jej przykładów [4]. Ogólnie analiza obrazu składa się z dwóch podstawowych etapów: - wytypowanie oraz pomiar cech określających obiekt, - analiza tych cech. Jednym z podstawowych problemów jest właściwy wybór cech reprezentatywnych, na postawie których realizowany będzie proces klasyfikacji. MoŜliwości doboru tych cech, są ograniczone praktycznie tylko wyobraźnią twórców metod poszukiwania. Przykładem moŝe być zagadnienie rozpoznawania cyfr. Rozmieszczenie punktów informatywnych (skrzyŝowań, rozgałęzień i zakończeń linii), topologia zamkniętych i otwartych konturów - to tylko niektóre cechy, jakie moŝna uŝyć w tym przypadku. WaŜne jest przy tym, aby propozycje ich doboru pochodziły od specjalistów, tzn. ludzi będących ekspertami w danej dziedzinie. Przy rozpoznawaniu np. wad serca naleŝy skorzystać z wiedzy kardiologa. Niepowodzenia w analizie obrazu, szeroko opisywane w literaturze, były najczęściej spowodowane brakiem potrzebnego specjalisty. Techniki klasyfikacyjne Przez pojęcie klasyfikacji rozumie się dzielenie dowolnego zbioru elementów na grupy, do których zalicza się elementy róŝniące się, ale podobne tj. mające własności wyróŝniające daną grupę. Zbiór elementów naleŝących do jednej grupy nazywany jest klasą, a kaŝdy element klasy - obiektem. Elementy klasy mogą róŝnić się między sobą, z wyjątkiem tych własności, na których opiera się proces klasyfikacji. W zaleŝności od rodzaju dostępnej informacji w ramach klasyfikacji moŝna wyodrębnić dwa zagadnienia: 1. klasyfikację wzorcową gdy struktura kategorii jest znana, czyli dysponuję się charakterystyką klas, z których pochodzą obiekty. W technikach neuronowych zagadnienie to nazywane jest uczeniem (lub rozpoznawaniem) z nauczycielem lub teŝ pod nadzorem, 2. klasyfikację bezwzorcową, określaną teŝ jako taksonomia albo analiza skupień (klasteryzacja). W technikach neuronowych znaną równieŝ jako uczenie (lub rozpoznawanie) bez nauczyciela. Wykorzystanie sieci neuronowych w procesie analizy obrazu Badania wykazują, Ŝe sieci neuronowe są bardziej wydajnym narzędziem klasyfikacyjnym, niŝ, powszechnie stosowane, tradycyjne metody dyskryminacyjne. W związku z powyŝszym, rozpoznawanie obrazów to jedna z dziedzin informatycznych, w której sztuczne sieci neuronowe znajdują coraz szersze zastosowanie. Jednym z potwierdzeń powyŝszego jest obserwowany dynamiczny rozwój programów typu OCR (Optical Character Recognition), który jest moŝliwy głównie dzięki zastosowaniu sztucznych sieci neuronowych. Rozpoznawanie obrazów przy uŝyciu sieci neuronowych znalazło zastosowanie w wielu dziedzinach. W dostępnej literaturze moŝna znaleźć wiele informacji, dotyczących wykorzystania sieci neuronowych do analizy obrazu, począwszy od identyfikacji pojedynczych znaków kończąc na analizie skomplikowanych obrazów kolorowych oraz rozpoznawaniu róŝnego typu złoŝonych obiektów. Warto zauwaŝyć, Ŝe równieŝ w rolnictwie neuronowe techniki identyfikacyjne są coraz częściej wykorzystywane m.in. do identyfikacji szkodników, uszkodzeń ziaren czy chorób roślin [6]. Rozpoznawanie obrazów jest najstarszym z zastosowań sieci neuronowych. W zagadnieniu rozpoznawania obrazu wyróŝnia się szczególnie dwa procesy: wyodrębnianie obiektów i ich identyfikację. Wyodrębnianie obiektów polega na ich wykryciu na analizowanym obrazie. Wykonuje się przy tym kilka działań takich jak: wykrywanie krawędzi, wyznaczanie konturów, ocenę powierzchni. W realizacji tych zadań wygrywają sieci neuronowe w szczególności dzięki ich zdolności do funkcjonowania w warunkach zakłóceń. W odróŝnieniu od pozostałych (tradycyjnych) algo- 35

Rys. 1. Zasada realizacji operacji konwolucji (Mirkut Zb., Tadeusiewicz R. 2000) Fig. 1. Principle of realization of convolution operation (Mirkut Zb., Tadeusiewicz R. 2000) rytmów analizy obrazów sieci neuronowe nie potrzebują wstępnej filtracji ("odszumiania") obrazów. Identyfikacja obiektów polega na wskazaniu do której klasy obiektów naleŝy obiekt. Klasyfikacja moŝe mieć róŝny poziom szczegółowości ograniczony jedynie przez właściwości zastosowanej sieci. W oparciu o dane literaturowe wiadomo, Ŝe sieci neuronowe jednowarstwowe moŝna nauczyć bezbłędnego rozpoznawania znaków drukowanych (Bishop C., 1995). Przy ich nauczaniu kaŝda klasa reprezentowana jest przez jeden obraz i dzięki temu klasy są liniowo separowane, co w sposób zasadniczy ułatwia rozwiązanie problemu. Gdy jednak w czasie nauki sieci klasa jest reprezentowana przez kilka wzorcowych obrazów znaków, co ma miejsce np. przy róŝnych krojach pisma lub przy prezentowaniu sieci obrazów zakłóconych, klasy mogą nie być liniowo separowane i konieczne staje się uŝycie sieci warstwowych. W związku z tym zdecydowano się na badanie reprezentatywnych topologii sieci neuronowych typu RBF i MLP, jako narzędzi klasyfikacyjnych do analizy obrazu na przykładzie procesu identyfikacji cyfr arabskich występujących w postaci róŝnych formatów graficznych. Rys. 2. Konwertowanie bitmapy do postaci binarnej w postaci wektora uczącego za pomocą aplikacji Czcionka Fig. 2. The converting the bitmap to binary map in the form of teaching vector with the help of the application "Type Budowa modelu neuronowego W procesie tworzenia modelu neuronowego do identyfikacji cyfr, kluczowym zadaniem było zbudowanie właściwej struktury zbioru uczącego. Do jego wygenerowania uŝyto programu wytworzonego Czcionka. Dzięki tej aplikacji, moŝna zamienić obraz dowolnej czcionki na postać binarną, która następnie zostaje zwrócona w postaci gotowego ciągu uczącego, akceptowalnego przez symulator SNN, zawarty w pakiecie STATISTICA v.7.1. Zakładka font2txt (rys. 2.) umoŝliwia nam przekonwertowanie na postać cyfrową wszystkich rodzajów czcionek dostępnych w pakiecie Microsoft Office. Wygenerowano obrazy cyfr od 0 do 9 w 29 róŝnych czcionkach, co dało 290 przypadków uczących. Do analizy uŝyto tablicy 30 30, co w efekcie generuje ciąg uczący o 900 elementach. Topologie sieci wygenerowanych za pomocą w.w. symulatora przedstawiają się następująco: Optymalna sieć MLP składała się z 3 warstw: - warstwa wejściowa liczba neuronów 929 funkcja aktywacji liniowa, - warstwa ukryta liczba neuronów 102 funkcja aktywacji hiperboliczna, - warstwa wyjściowa liczba neuronów 10 funkcja aktywacji softmax. Rys. 3. Fragment wektora uczącego w postaci pliku.txt Fig. 3. The fragment of teaching vector in the form of.txt file gdzie: A oznacza numer jednej z 29 uŝytych czcionek, B oznacza cyfrę, którą dany ciąg reprezentuje (zmienna wyjściowa). Rys. 4. Topologia otrzymanej sieci typu MLP Fig. 4. Topology of received neural network of the type MLP 36

Optymalna sieć RBF składała się z 3 warstw: - warstwa wejściowa liczba neuronów 929 funkcja aktywacji liniowa, - warstwa ukryta liczba neuronów 45 funkcja aktywacji wykładnicza, - warstwa wyjściowa liczba neuronów 10 funkcja aktywacji liniowa. Rys. 5. Topologia otrzymanej sieci typu RBF Fig. 5. Topology of received neural network of the type RBF Opis systemu informatycznego Rozpoznawanie cyfr Wstępną fazą budowy systemu informatycznego było określenie wymagań stawianych projektowanej aplikacji. Postawione zostały określone cele, zaproponowany został zakres oraz zaprezentowano ramowy opis systemu informatycznego Rozpoznawanie cyfr. W fazie projektowania, korzystając z pomocy programu Posejdon for UML, wykonane zostały podstawowe diagramy mające na celu wizualizację implementacji systemu. Spośród wielu dostępnych narzędzi programistycznych wybrany został Borland C++ Builder v.6.0. Kod symulujący działanie sieci neuronowych został wygenerowany z wykorzystaniem modułu Generator kodu zaimplementowanego w komercyjnym pakiecie STATISTICA v.7.1. Otrzymany kod w języku C został poddany drobnym zmianom adaptacyjnym, w celu lepszego dostosowania go do środowiska programistycznego Borland C++ Builder v.6. Wytworzony następnie system informatyczny Rozpoznawanie cyfr opiera się na tym kodzie i stanowi jądro wytworzonej aplikacji. Rys. 6. Diagram przypadków uŝycia systemu informatycznego Rozpoznawanie cyfr Fig. 6. The case diagram of using of the computer system Rozpoznawanie cyfr 37

Rys. 7. Diagram klas systemu informatycznego Rozpoznawanie cyfr Fig. 7. The class diagram of the computer system Rozpoznawanie cyfr System posiada prosty i intuicyjny interfejs umoŝliwiający uŝytkownikowi szybkie zapoznanie się z moŝliwościami aplikacji. Pozwala takŝe na dokonywanie klasyfikacji przy uŝyciu sieci nauczonych za pomocą róŝnych algorytmów lub metod. Aby system działał bezproblemowo, potrzebne są: komputer klasy PC z systemem operacyjnym Windows, pamięć operacyjna: co najmniej 64MB, rozdzielczość ekranu: co najmniej 800600 pikseli. Uwagi końcowe Rys. 8. Wygląd okna głównego programu Rozpoznawanie cyfr Fig. 8. Main window of computer system Rozpoznawanie cyfr Aplikacja została przetestowana zarówno dla wygenerowanego kodu jak równieŝ po utworzeniu poszczególnych jej modułów. W y m a g a n i a n i e f u n k c j o n a l n e Pozytywne wyniki uczenia sieci typu MLP oraz RBF, jakie uzyskano w programie STATISTICA v.7.1. pokazały, Ŝe wspomniane typy sieci sprawdzają się jako narzędzia klasyfikacyjne do analizy obrazów binarnych. Zarówno w przypadku sieci RBF jak i MLP otrzymano niewielkie błędy uczenia, co w efekcie przełoŝyło się na poprawną identyfikacje prezentowanych sieci obrazów cyfr w postaci binarnej. Dlatego teŝ, w wytworzonym systemie informatycznym Rozpoznawanie cyfr, wykorzystano w celach porównawczych oba typy sieci, Wyniki działania aplikacji potwierdziły rezultaty uzyskane w procesie uczenia sieci. Prezentowane systemowi informatycznemu dane wejściowe (w postaci ciągu binarnego), zostały poprawnie rozpoznane jako konkretne cyfry, zarówno przy wykorzystaniu sieci perceptronowej typu MLP jak i sieci radialnej typu RBF. Aplikacja Rozpoznawanie cyfr jest przyjaznym uŝytkownikowi systemem edukacyjnym wspomagającym procesy poznawcze z zakresu budowy oraz eksploatacji najpopularniejszych topologii sztucznych sieci neuronowych. 38

Literatura [1] Tadeusiewicz R., Flasiński M. (1991). Rozpoznawanie obrazów: Wydawnictwo Naukowe PWN, Warszawa. [2] Mirkut Zb., Tadeusiewicz R. (2000). Sieci neuronowe tom 6: Akademicka Witryna Wydawnicza EXIT, Warszawa. [3] Boniecki P. (2004). Sieci neuronowe typu MLP oraz RGB jako komplementarne modele aproksymacyjne w procesie predykcji plonu pszenŝyta: Journal of Research and Applications in Agricultural Engineering, Poznań, (1 2004), Vol. 49(1), str. 28-33. [4] Kohorda P., Tadeusiewicz R. (1999). Komputerowa analiza i przetwarzanie obrazów:drukarnia Narodowa, Kraków. [5] Tadeusiewicz R., (1993). Sieci neuronowe: Akademicka Oficyna Wydawnicza, Warszawa. [6] Boniecki P., Piekarska-Boniecka H. (2004). The SOFM Neural Network in the Process of Identification of Selected Orchard Pests: Journal of Research and Applications in Agricultural Engineering,Vol 49(4), p. 5-10, Poznań. [7] Bishop C., (1995). Neural Networks for Pattern Recognition: Oxford University Press. 39