SEGMENTACJA. Formalnie w wyniku procesu segmentacji następuje podzielenie pikseli obrazu na kilka rozdzielnych klas. 1-1

Podobne dokumenty
Reprezentacja i analiza obszarów

Reprezentacja i analiza obszarów

WYKŁAD 12. Analiza obrazu Wyznaczanie parametrów ruchu obiektów

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

WYBRANE ZAGADNIENIA WIDZENIA MASZYNOWEGO

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Przetwarzanie obrazów rastrowych macierzą konwolucji

Diagnostyka obrazowa

Agnieszka Nowak Brzezińska Wykład III

Elementy modelowania matematycznego

Agnieszka Nowak Brzezińska

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 9 AiR III

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

SEGMENTACJA OBRAZU Wprowadzenie

Hierarchiczna analiza skupień

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Proste metody przetwarzania obrazu

Agnieszka Nowak Brzezińska Wykład III

str 1 WYMAGANIA EDUKACYJNE ( ) - matematyka - poziom podstawowy Dariusz Drabczyk

Optymalizacja ciągła

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Analiza obrazów. Segmentacja i indeksacja obiektów

Diagnostyka obrazowa

PLANIMETRIA CZYLI GEOMETRIA PŁASZCZYZNY CZ. 1

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Wymagania edukacyjne z matematyki

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Przetwarzanie obrazów wykład 7. Adam Wojciechowski

Metody systemowe i decyzyjne w informatyce

Przetwarzanie obrazu

Podstawy programowanie systemów wizyjnych InSight firmy Cognex. Środowisku InSight Explorer / Spreadshee

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III

0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do

Elementy statystyki wielowymiarowej

Segmentacja przez detekcje brzegów

Grafika komputerowa. Dla DSI II

SZTUCZNA INTELIGENCJA

Wektory, układ współrzędnych

W poszukiwaniu sensu w świecie widzialnym

Analiza obrazów - sprawozdanie nr 3

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

KADD Minimalizacja funkcji

Obraz jako funkcja Przekształcenia geometryczne

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Inteligentna analiza danych

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Dział I FUNKCJE TRYGONOMETRYCZNE

Wymagania programowe z matematyki na poszczególne oceny w klasie III A i III B LP. Kryteria oceny

Aproksymacja funkcji a regresja symboliczna

STEREOMETRIA CZYLI GEOMETRIA W 3 WYMIARACH

PRZETWARZANIE SYGNAŁÓW

Pattern Classification

Filtracja obrazu operacje kontekstowe

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Jeśli X jest przestrzenią o nieskończonej liczbie elementów:

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 10 AiR III

Prawdopodobieństwo czerwonych = = 0.33

Analiza składowych głównych. Wprowadzenie

POLITECHNIKA OPOLSKA

Kształcenie w zakresie podstawowym. Klasa 3

Filtracja obrazu operacje kontekstowe

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Zastosowanie stereowizji do śledzenia trajektorii obiektów w przestrzeni 3D

Inspiracje kognitywne w procesie analizy pozycji szachowej

Akwizycja obrazów. Zagadnienia wstępne

W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora.

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Niepewności pomiarów

Z52: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania, zagadnienie brzegowe.

Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Laboratorium Optyki Falowej

Grafika Komputerowa Wykład 4. Synteza grafiki 3D. mgr inż. Michał Chwesiuk 1/30

Analiza danych. TEMATYKA PRZEDMIOTU

Zbigniew JERZAK Adam KOTLIŃSKI. Studenci kierunku Informatyka na Politechnice Śląskiej w Gliwicach

Wymagania kl. 3. Zakres podstawowy i rozszerzony

Przedmiotowe zasady oceniania i wymagania edukacyjne z matematyki dla klasy drugiej gimnazjum

Animowana grafika 3D. Opracowanie: J. Kęsik.

WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY TRZECIEJ NA ROK SZKOLNY 2011/2012 DO PROGRAMU MATEMATYKA Z PLUSEM

Segmentacja obrazów cyfrowych z zastosowaniem teorii grafów - wstęp. autor: Łukasz Chlebda

WYKŁAD 13 ANALIZA I ROZPOZNANIE OBRAZU. Konstrukcja wektora cech z użyciem współczynników kształtu

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA I INDEKSOWANIE MULTIMEDIÓW (AIM)

POB Odpowiedzi na pytania

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Wprowadzenie do analizy korelacji i regresji

Przekształcenia punktowe

GEOMETRIA ELEMENTARNA

Sztuczna inteligencja : Algorytm KNN

PDF created with FinePrint pdffactory Pro trial version

Analiza obrazu. wykład 4. Marek Jan Kasprowicz Uniwersytet Rolniczy 2009

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Transkrypt:

SEGMENTACJA Celem segmentacji jest takie przetworzenie danych zawartych w obrazie, aby uzyskać taki jego podział, który pomoże w rozpoznaniu obiektów w nim zawartych i interpretacji. Ogólnie rzecz ujmując obraz jest pewnym rozkładem intensywności reprezentującym kilka obiektów bądź klas obiektów (obrazy wielo-odcieniowe), a w przypadku obrazów binarnych zestawem kilku rozdzielnych jednolitych elementów i tła. Segmentacja służy, do uproszczenia opisu obrazu poprzez zmniejszenie nadmiarowej informacji, grupowanie pikseli o zbliżonych intensywnościach lub łączenie pikseli opisujących poszczególne elementy. Formalnie w wyniku procesu segmentacji następuje podzielenie pikseli obrazu na kilka rozdzielnych klas. 1-1

Kryteria klasyfikacji pikseli Klasyfikacja pikseli może być przeprowadzona ze względu na jedno z wielu kryteriów, z czego do najważniejszych należą: - klasyfikacja przestrzenna (kryterium: lokalizacja piksela), - klasyfikacja czasowa ( kryteruin zmiana intensywności w czasie/ruch obiektów), - klasyfikacja spektralna (kryterium: barwa/ zawartość RGB piksela), - klasyfikacja statystyczna (kryterium parametr statystyczny rozkładu jasności w otoczeniu piksela; segmentacja tekstur). 1-2

Segmentacja, a rozpoznanie obiektów Segmentacja obrazu pomaga wydzielić w obrazie obiekty, którym w wyniku analizy obiektów (pomiar- wyznaczenie współczynników kształtu/ liczenie transformat/ liczenie współczynników momentowych i in.) zostaną nadane im cechy, zgodnie z którymi następuje przypisanie obiektów do odpowiednich klas. Podstawowe grupy segmentacji: - segmentację obszarową (od najprostszego progowania obrazu skończywszy na segmentacji statystycznej tekstur), - segmentację krawędziową. 1-3

Segmentacja obszarowa Procedury segmentacji obszarowej klasyfikują piksele obrazu do oczekiwanej przez użytkownika liczby obszarów/ klastrów. Do wyszukania pożądanych progów odcięcia wykorzystuje się: podejście statystyczne lub analizę histogramu. Segmentacja przez progowanie: Obiekty znajdujące się na obrazie o pozornie tej samej barwie, w rzeczywistości opisane są przez pewien zbiór intensywności tworzący charakterystyczne piki na histogramie. Celem segmentacji przez progowanie jest zdefiniowanie granicznych wartości intensywności, które pozwolą oddzielić składowe elementy obrazu (tu:obraz dwumodalny) 1-4

Metoda analizy dyskryminacyjnej (M. Otsu) Metoda ta pozwala wyznaczyć próg odcięcia T korzystając z podziału pikseli obrazu na dwie klasy: obiekt i tło. W takim układzie histogram traktuje się jako zazębiające się dwa rozkłady normalne odpowiadające tłu i obiektowi. Dla progu T ustalane jest położenie w zależności od wartości średnich μ 1 μ 2 i odchyleń standardowych rozkładów prawdopodobieństw tła i obiektu. Próg odcięcia przypada w miejscu max. wartości wariancji międzyklasowej Rozwiązanie dla histogramów bimodalnych o różnych szerokościach pików 1-5

Metody intensywnościowe - iteracyjne Metody intensywnościowe do analizy wykorzystują jedynie histogram obrazu oraz informację o liczbie klas, do których piksele obrazu powinny zostać zakwalifikowane. Progi mogą być wyznaczane przez użytkownika lub automatycznie poprzez analizę histogram obrazu i wyszukanie doliny pomiędzy sąsiednimi pikami. Szybka analiza, ale możliwa zła klasyfikacja przy lokalnych minimach. Rozwiązanie METODA ITERACYJNA Szacuje się w nim początkowe położenie progu T. Dla zadanej lokalizacji obliczane są średnie intensywności tła i obiektu T tło i T obiekt, a na ich podstawie wyznacza się tymczasowy próg oraz T tło i T obiekt będące wartościami wejściowymi do kolejnej iteracji. Proces trwa do momentu ustabilizowania się położenia progu. 1-6

Metoda wieloboku Niedogodnością tego rozwiązania jest fakt dołączenia pikseli obrazu nieprzynależących do danej klasy. Ostrzejsze kryterium klasyfikacji można uzyskać poprzez modyfikację poprzedniego rozwiązania. Konstruowany jest wielobok, którego wierzchołki są opisane przez najwyższy punkt rozpatrywanego piku, minimalną intensywność występującą w histogramie oraz, miejsce, dla którego odległość od poprowadzonej prostej A-B jest największa. Kryterium przypisania pikseli do danej klasy jest wówczas najostrzejsze. 1-7

Podejście statystyczne Spełnienie przez obraz jednego z dwóch możliwych założeń: - istnienia w obrazie określonej liczby klas i określeniu stopnia przynależności poszczególnych pikseli obrazu do jednej z nich -założeniu nieznanej (nieograniczonej) liczby klas ustalanej w trakcie procesu segmentacji, który polega na łączeniu pikseli o podobnych, szeroko rozumianych właściwościach. Klasyfikacja pikseli obrazów do poszczególnych klas może odbywać się: -na drodze statystycznej, - na podstawie analizy położenia pikseli (na płaszczyźnie lub w rozumieniu intensywnościowym) wokół wartości średnich (w literaturze funkcjonuje to jako algorytm K-Means). Obie metody zakładają istnienie zbioru k zawierającego m klas K={K 1,.,K m}. Proces klasyfikacji pikseli odbywa się iteracyjnie, aż do momentu ustabilizowania założonych parametrów. W przypadku rozwiązania statystycznego parametrem tym jest wyznacznik prawdopodobieństwa przynależności piksela bieżącego do klasy K i, natomiast dla algorytmu K-Means minimalizacja globalnego parametru rozmieszczenia pikseli/intensywności wokół wartości średnich. 1-8

Metoda statystyczna- znana liczba klas W podejściu statystycznym wstępnego rozdysponowania pikseli do założonych klas, dokonuje się na podstawie oszacowanych granic przedziałów. Stopień przynależności pikseli t k, i do klas jest modyfikowany w kolejnych iteracjach na podstawie zależności: funkcja zgodności uwzględniająca stopnie przynależności do poszczególnych klas sąsiednich pikseli. Klasyfikacja piksela q do wybranej klasy opiera się na wyznaczeniu probabilistycznej funkcji przyporządkowującej opisanej równaniem Bayes a: r- numer iteracji 1-9

Przykład metoda statystyczna Poniżej zaprezentowano obraz komórki krwi z wyróżnionymi tłem, cytoplazmą i jądrem. Gęstości prawdopodobieństw poszczególnych klas zostały wyznaczone na podstawie histogramu obrazu wejściowego. Klasyfikowanie pikseli do podanych kategorii odbywa się na podstawie wyżej wymienionej procedury. 1-10

Algorytm K- Means Algorytm K-Means polega na iteracyjnym grupowaniu pikseli wokół obliczonych wartości średnich. 1. po powierzchni rozrzucane są punkty wejściowe stanowiące zalążki klastrów - środki ciężkości. 2. Piksele przypisywane są do określonego klastra na podstawie kryterium minimalnej odległości rozpatrywanego punktu od zalążka obszaru. 3. Pogrupowane piksele stanowią zbiory pozwalające wyznaczyć położenie środka ciężkości klastra. 4. Procedura ta jest powtarzana iteracyjnie do momentu ustabilizowania globalnego stopnia przynależności na minimalnym poziomie. Procedura segmentacji obrazów o niezdefiniowanej z góry liczbie elementów wymaga wstępnego wyboru punktów bazowych, wokół których następuje rozrost obszarów. Konieczne jest w tym przypadku określenie kryteriów przynależności pikseli do danego klastra. Powszechnie stosowane jest kryterium intensywnościowe, określające stopień jednolitości obszaru: 1-11

Segmentacja nieznana liczba klas Segmentacja przy nieznanej liczbie klas wymaga wstępnego wyboru pkt. bazowych, wokół których następuje rozrost obszarów. Konieczne jest określenie kryteriów przynależności pikseli do danego klastra. Powszechnie stosowane jest kryterium intensywnościowe, określające stopień jednolitości obszaru. Jeżeli rozpatrywany piksel obrazu nie spełnia wymagań wówczas jest uważany za zalążek nowego obszaru i stanowi punkt wyjścia do dalszej klasyfikacji. Ścieżka analizowania sąsiedztwa piksela jest zależna od założonego na wstępie stopnia spójnośc. Wynik segmentacji obrazu realizowany za pomocą 4-ro spójności i 8-mio spójności może być różny. 1-12

Segmentacja nieznana liczba klas Często segmentację z wykorzystaniem 4- i 8- spójności przeprowadza się dwuetapowo: - segmentacja wstępna z wykorzystaniem 4-ro spójności, - segmentacja końcowa z wykorzystaniem 8-mio spójności. Wynik może zależeć od punktu początkowego przeprowadzanej segmentacji 1-13

Segmentacja z nieznaną liczbą klas: Algorytm fagocytowy Rodzina algorytmów hierarchicznych tzn. składających się z kilku faz przetwarzania. Ostatnim, alternatywnym krokiem w tej metodzie, jest łączenie obszarów o zbliżonych właściwościach intensywnościowych, tak by finalny efekt segmentacji spełniał oczekiwania użytkownika. Łączenie obszarów - algorytm fagocytowy. Uwzględnia on stopień podobieństwa rozpatrywanych obszarów pod kątem liczby sąsiadujących pikseli, pomiędzy którymi różnica jasności nie przekracza progu T: P1,P2 pola rozpatrywanych obszarów L T -długość części granicy pomiędzy obszarami, na której różnica intensywności nie przekracza założonego progu T 1-14

Transformacja Watershed Do tej kategorii można zaliczyć też transformację " Watersheed". Wymaga ona umieszczenia na obrazie znaczników w sposób automatyczny lub narzucony przez użytkownika. Znaczniki te odpowiadają lokalnym minimalnym intensywnościom. Nie każdy obraz wejściowy daje się w ten sposób przeanalizować. Kluczową sprawą jest wstępne przetwarzanie tworzące w obszarach jednolitych lokalne minima przechodzące w narastające zbocza w pobliżu krawędzi. Do tego celu stosuje się filtry krawędziowe lub wyznacza mapę gradientu morfologicznego. 1-15

Watershed Segmentację można obrazowo opisać jako zalewanie wodą zbiornika. Dno zbiornika wyznaczane jest przez obrys przekroju gradientu morfologicznego. Poziom wody podnosząc się zalewa wszystkie sektory aż do momentu połączenia się sąsiednich zbiorników. W takim miejscu stawiana jest zapora i dla danego miejsca algorytm zatrzymuje się. Efektem przetwarzania są punkty rozłożone wzdłuż wierzchołków odpowiadającym granicom pomiędzy sąsiednimi sektorami. Wyznaczanie segmentów może opierać się na analizie jednego z sektorów i monitorowaniu punktów "przelewania" z sąsiednimi obszarami. 1-16

Segmentacja konturowa Możliwe jest także tworzenie filtrów wykrywających krawędzie z wykorzystaniem podstawowej wiedzy ze statystyki matematycznej. Maski mogą posiadać rozmiary zależne od wymagań stawianych przez użytkownika. Niezależnie od wymiaru tablicy w otoczeniu piksela, dla zadanej liczby pikseli obliczana jest wartość średnia oraz odchylenie standardowe : gdzie: σ - odchylenie standardowe μ -wartość średnia n - liczba poziomów intensywności p n(n) - prawdopodobieństwo występowania intensywności n 1-17

Metoda korelacyjna Segmentacja obszarów należących do krawędzi może również być wspomagana przez techniki korelacyjne związane z dopasowywaniem pewnego wzorca. W tym przypadku zakłada się istnienie pewnego kształtu krawędzi np. łuk, linia prosta o sprecyzowanej jasności. Oba obrazy - wzorzec i obraz oryginalny są splatane i wyznaczana jest korelacja w każdym punkcie. 1-18

TEKSTURY Klasyczne podejście do segmentacji obrazów opisane w poprzednich rozdziałach nie zdaje egzaminu, jeśli odniesie się do obrazów złożonych struktur intensywnościowych. Niejednolite obszary, składające się z powtarzalnego przestrzennie zestawu intensywności są nazywane teksturami. 1-19

Tekstury Istnieje kilka podstawowych metod służących do analizy tekstur: - statystyczne - dopasowanie wzorca - wykorzystujące współczynniki momentowe Analiza pól tekstur wymaga uwzględnienia nie tylko intensywności w każdym z pikseli obrazu, ale także w ich sąsiedztwie. Rozmiar uwzględnianego w trakcie przetwarzania otoczenia piksela jest zależny od częstotliwości zmian w obrębie tekstury, a jego orientacja od przestrzennego charakteru tekstury. 1-20

Tekstury metody statystyczne 1. Wykorzystanie statystyki pierwszego rzędu. W tym przypadku brana jest pod uwagę wartość wariancji oraz średniej intensywności w otoczeniu piksela. Wygodnie jest stosować to rozwiązanie w przypadku rozpoznawania tekstur o drobnej ziarnistości na tle jednolitych powierzchni. 2. Wykorzystanie statystki drugiego rzędu. W tym celu, dla zadanej wielkości pod-obrazu, konstruuje się tak zwaną "macierz współ-pojawień": 1-21

Tekstury Współczynniki macierzy informują ile razy w sąsiedztwie, określonym przez odległość d i kąt t, występują punkty o intensywnościach i,j. Powstała w ten sposób macierz tworzy dwuwymiarowy rozkład prawdopodobieństwa. Na podstawie macierzy wyznaczane mogą być jej wielkości charakterystyczne. Noszą one nazwę współczynników Haralick'a. Poniżej zaprezentowano wybrane parametry "macierzy współ-pojawień": energia macierzy bezwładność macierzy lokalna jednorodność macierzy 1-22

Tekstury operatory bazowe Znając strukturę tekstury można zbudować tzw. operatory bazowe, definiujące wyidealizowaną jej formę i rozkład intensywności. Maska jest przykładana do analizowanego obrazu, a następnie sprawdza się stopień korelacji. Obszary nie spełniające kryterium przynależności, definiowanego przez stopień korelacji, nie są kwalifikowane do danego obszaru. 1-23

Rozpoznanie obrazu W większości komputerowych systemów wizyjnych segmentacja jest ostatnim etapem przetwarzania obrazów (obiektów w obrazie). Kolejne operacje są związane procesem analizy obrazu lub/i z identyfikacją treści obserwowanych obrazów. W wyniku segmentacji otrzymuje się obszary lub kontury odpowiadające występującym w obrazie obiektom. Następnie zakłada się, że w analizowanych obrazach znajdują się jedynie obiekty określonych rodzajów i próbuje się klasyfikować/rozpoznawać wydzielone segmenty. Rozpoznanie polega na przypisaniu każdego segmentu do określonej klasy, tzn. uznaje się, że dany segment wyobraża obiekt należący do tej klasy. W celu umożliwienia sklasyfikowania każdego elementu zwykle dopuszcza się też klasę "obiekty niezdefiniowane", gdyż pewne segmenty w wyniku np. nieprawidłowego wydzielenia lub należenia do tła mogą nie reprezentować żadnego obiektu. Zazwyczaj do identyfikacji obrazów stosuje się metody wykorzystujące pojęcie przestrzeni cech. 1-24

Przestrzen cech Przestrzenią cech nazywana jest pewna n-wymiarowa przestrzeń, w którą odwzorowane są rozważane obiekty, które opisane są przez pewien zbiór n-cech X = {x1,...,xn}. Cechami mogą być najróżniejsze własności, ale wartość ich dla każdego obiektu musi być pojedynczą liczbą (rzeczywistą lub całkowitą). Jeżeli 'obiektem' będzie np. próbka krwi to cechami mogą być: liczba leukocytów, erytrocytów, poziom hemoglobiny, itd. W przypadku dwuwymiarowych obiektów geometrycznych obserwowanych przez system wizyjny, cechami mogą być: powierzchnia, obwód, liczba otworów, lub stosunek tych wielkości itd. W teorii nie prowadzi się rozważań nad naturą obiektów i cech, ale zakłada się, że cechy są tak wybrane, by obiekt mógł zostać sklasyfikowany na podstawie jego wartości cech. Dla danego obiektu q można określić zbiór jego wartości cech zwany wektorem cech: 1-25

Wektor cech Wektor cech jest rezultatem odwzorowania obiektu w n-wymiarową przestrzeń cech (każdy wymiar tej przestrzeni jest, zatem związany z jedną cechą). Niech w rozważanym problemie występuje m klas obiektów K 1,...K m. Ponieważ identyfikacja obiektu jest realizowana na podstawie jego wektora cech, więc w przestrzeni cech powinno istnieć m tzw. obszarów decyzyjnych O 1,...,O m przypisanych poszczególnym klasom i tak dobranych, żeby na podstawie przynależności wektora x(q) do obszaru Oi można było wnioskować o przynależności obiektu p do klasy Ki. przykład: Rozważane są dwie cechy: x 1-"wysokość obiektu", x 2-"szerokość obiektu', oraz dwie klasy obiektów: K 1-obiekty stojące, K 2-obiekty leżące. Obiekt uznany jest za wysokość "stojący", gdy jego wysokość jest większa od szerokości szerokość 1-26

Obszary decyzyjne Często zdarza się, że ten sam wektor cech opisuje obiekty z różnych klas, wtedy przynależność do danej klasy ocenia się na podstawie prawdopodobieństwa przynależności obiektu do reprezentowanego przez dany wektor cech do klasy K j i klasyfikuje się obiekt do tej klasy, dla której to prawdopodobieństwo jest największe. W efekcie oznacza to zdefiniowanie w przestrzeni cech obszarów decyzyjnych. W celu właściwej identyfikacji obiektów i odpowiedniego zakwalifikowania ich do określonych właściwych dla danego zadania technicznego klas najważniejszym problemem staje się dobór odpowiedniej przestrzeni cech. Przede wszystkim zależy wybrać cechy najistotniejsze dla sklasyfikowania obiektów. Do tego jednak potrzebna jest znajomość różnych rodzajów cech i ich właściwości. 1-27

Barwa, Cechy obiektów cechy statystyczne otoczeń (tekstury), cechy topologiczne - analiza wklęsłości, spójności figur, cechy geometryczne -współczynniki kształtu - momenty geometryczne, cechy wynikające ze zmian w czasie 1-28

Wektor cech obrazów barwnych Obrazy barwne gwarantują możliwość opisu cech obiektów na podstawie barwnej klasyfikacji pikseli. Obrazy szaroodcieniowe operują pojęciem jasności i w trakcie konwersji obrazów RGB do postaci 8-mio bitowej pewne zestawy barw, mimo zupełnie odmiennego charakteru, są reprezentowane przez tę samą wartość np. punkt o intensywności zielonej barwy 150, w obrazie szaroodcieniowym będzie identyczny, co punkt niebieski z tą samej wartości. Dysponując sześcianem barw RGB można stworzyć trójwymiarowy model obrazu wejściowego. Model ten odniesiony do dowolnego obrazu barwnego pozwala określić położenie w przestrzeni RGB poszczególnych jego elementów i wybrać optymalny próg odcięcia dla trzech składowych, czerwonej, zielone i niebieskiej. 1-29

Cechy topologiczne Cechy topologiczne (spójność, wklęsłość, wypukłość) szczególnie użyteczne w przypadku analizy obrazów biomedycznych, gdyż występujące tam obiekty wykazują znaczne zróżnicowanie kształtów i/lub spójności, a właśnie za pomocą pojęć topologicznych można opisać właściwości wspólne dla całej klasy obiektów. Na przykład liczba jąder komórkowych to typowa cecha topologiczna (liczba Eulera). Może ona być wykryta poprzez określenie liczby otworów w obszarach komórki. Analizę przeprowadza się po binaryzacji obrazu z odpowiednim progiem odcięcia. Cechy topologiczne są niezależne od położenia obiektu względem układu współrzędnych, co może być ich zaletą, ale dotyczą zbyt ogólnych własności obiektów i dlatego są mało praktyczne do celów przemysłowych. Jedną z cech topologicznych jest liczba Eulera - E, którą określają odpowiednie wzory inne dla obrazów po segmentacji obszarowej i segmentacji konturowej. 1-30

Cechy topologiczne liczba Eulera po segmentacji obszarowej E = C - H gdzie: C - liczba spójnych składników obiektu H - liczba otworów po segmentacji obszarowej E = V - S + F gdzie: V - liczba wierzchołków H - liczba krawędzi F - liczba wypełnionych ścian E =1-2 = -1 E = 5-7+1 = -1 E =3-5 =-2 E =2-1 = 1 E = 7-7+1 = 1 1-31

Cechy geometryczne Cechy geometryczne dotyczą głównie opisu figur obrazów binarnych. Mogą być one wyrażone przez: - współczynniki kształtu, -współczynniki momentowe. Cechy geometryczne mogą być wyznaczane zarówno w płaszczyźnie samego obrazu, jak i jego reprezentacji widmowej (w płaszczyźnie częstości przestrzennych. W tym drugim przypadku mówimy o cechach zwanych deskryptorami fourierowskimi. 1-32

Współczynniki kształtu Współczynniki kształtu Wyróżnia się następujące parametry służące do opisu geometrii obiektów: a) pole powierzchni, którego pomiar sprowadza się do zliczenia pikseli należących do interesującego nas obszaru. Cecha ta jest czuła na błędy wynikłe z niewłaściwej binaryzacji, jednak z drugiej strony jest nieczuła na przesunięcie i obrót obiektu w polu widzenia. b) obwód, czyli długość brzegu obiektu. Pomiar tej cechy jest dość trudny z uwagi na konieczność przybliżania ciągłej linii dyskretną kombinacją punktów obrazu. W praktyce wykorzystuje się następujące sposoby pomiaru obwodu gdzie: L - obwód obiektu, S - pole powierzchni obiektu 1-33

Współczynniki kształtu c) zwartość (popularny współczynnik opisu kształtu niezależny od liniowych transformacji-skali, rotacji ) opisywana jest wzorem: gdzie: L - obwód obiektu, S - pole pow. obiektu c) centryczność jest to stosunek długości maksymalnej cięciwy A obiektu do maksymalnej długości cięciwy B prostopadłej do A (Rys.5.23): Centryczność można także obliczyć za pomocą momentów w następujący sposób: gdzie: S - pole powierzchni obiektu, μ20, μ02, μ11 - momenty geometryczne 1-34

Współczynniki kształtu d) smukłość, jest stosunkiem długości boków prostokąta granicznego opisanego na obiekcie, tzn. takiego którego pole jest minimalne. Zatem smukłość wykorzystując parametry a,b możemy wyrazić wzorem: Kryterium tego nie stosuje się do obiektów o kształtach zbliżonych do okręgu Wtedy smukłość liczymy jako stosunek pola powierzchni obiektu do kwadratu jego szerokości d: e) prostokątność, jako stosunek pola powierzchni obiektu (S) do pola powierzchni prostokąta opisanego na tym obiekcie, którego pole jest minimalne. 1-35

Współczynniki kształtu f) długość rzutów, gdy figura jest wypukła wystarczy jeden rzut, gdy jest wklęsła-tworzymy kilka rzutów cząstkowych składających się na rzut rozwinięty. g) średnice Fereta - wymiary obiektu wyrażające jego rozpiętość w poziomie i w pionie (współrzędne skrajnych punktów cząstki) 1-36

Współczynniki kształtu h) kierunek, jest to kierunek dłuższego z boków minimalnego prostokąta granicznego. Jeżeli momenty bezwładności pierwszego i drugiego rzędu są znane to kierunek można wyrazić wzorem: Wyliczanie kierunku ma sens jedynie dla obiektów smukłych. Smukłość i prostokątność są niezależne od transformacji liniowych: przesunięcia, obrotu i skalowania. Kierunek zaś jest zależny jedynie od obrotu. i) inne współczynniki kształtu: Współczynniki cyrkularności gdzie: L - obwód obiektu, S - pole powierzchni obiektu Współczynnik Malinowskiej 1-37

Współczynniki kształtu Obliczenia powyższych współczynników trwają stosunkowo krótko, ale odznaczają się niezbyt dokładną klasyfikacją. Gdy szybkość działania nie jest najważniejsza, a istotna jest dokładność opisu obiektów za pośrednictwem ich cech stosuje się następujące współczynniki: współczynnik Blaira-Blissa współczynnik Danielssona współczynnik Haralick'a współczynnik M 2 1-38

Współczynniki kształtu, a momentowe Dla każdej klasy obiektów oczekiwanych w obrazie należy drogą doświadczalną sprawdzić czy przyjęte współczynniki kształtu w wystarczający sposób różnicują analizowane obiekty. Problemy ze współczynnikami kształtu: - czułe na duże zmiany skali, -czułe na dyskretyzację, - bardzo czułe na zniekształcenia związane z konfiguracją układu detekcji (perspektywa), -zróżnicowana czułość na zmiany proporcji figur. Własności figur mogą być także opisane zależnościami momentowymi. Momenty obliczane według zależności: gdzie: f(x,y) - intensywność w pikselu (x,y), A - analizowany obszar, p,q = 0,...,n 1-39

Współczynniki momentowe W procesie charakteryzowania figur przydatne są zwłaszcza momenty pierwszego i drugiego rzędu. Momenty pierwszego rzędu określają położenie środka ciężkości a momenty drugiego rzędu (p=0,q=2 lub p=2,q=0) są miarą bezwładności danego obiektu. W przypadku rozważań geometrycznych można jeszcze wprowadzić pojęcie momentu konturowego wyznaczanego wzdłuż kontura L: Momenty centralne: μ pq, C pq tworzą cechy niezmiennicze względem przesunięcia. Za pomocą: μ pq, C pq oraz μ 00, c 00 można skonstruować cechy niezależne względem: przesunięcia, obrotu i zmiany skali: 1-40

Współczynniki momentowe Niezmienniki momentowe są cechami o fundamentalnym znaczeniu przy rozpoznawaniu obiektów płaskich, bo umożliwiają rozpoznanie obiektów przy ich różnej lokalizacji w polu widzenia (w tym ruchome obiekty) oraz przy różnych powiększeniach układu (także ruchy kamer w górę i w dół). Istnieją także wyrażenia momentowe używające momentów obszarowych, które są niezmiennicze względem dowolnego nieosobliwego przekształcenia liniowego, dzięki czemu kamera może być dowolnie umieszczona względem obserwowanych obiektów płaskich. Metody momentowe (momenty konturowe) mogą też znaleźć zastosowanie do identyfikacji obiektów nie w pełni widocznych. Istota takiej identyfikacji polega na badaniu zmian, jakim ulegają momenty konturowe w miarę stopniowego przesłaniania obiektu. Przy wyborze cech uwzględnić należy zarówno rozdzielające własności poszczególnych cech, jak też ich obliczeniową złożoność (ilość obliczeń niezbędnych do wyznaczenia ich wartości) oraz inne praktyczne uwarunkowania. 1-41

System rozpoznawania obrazów Opisane metody klasyfikacji obiektów znajdują praktyczne zastosowanie w systemach widzenia maszynowego. Systemy te są obecne w wielu gałęziach szeroko pojętego przemysłu od branży spożywczej po zbrojeniową oraz w różnorodnych zastosowaniach multimedialnych (tworzenie filmów animowanych, śledzenie obiektów i ich zamiana na inne.). Wykorzystanie urządzeń optycznych wraz z odpowiednim oprogramowaniem rozpoznawania obrazu w znacznym stopniu usprawnia proces kontroli końcowej czy pozwala na bieżąco kontrolować stan zestawianych na taśmie produkcyjnej urządzeń. 1-42

Operacje rozpoznania obrazu System rozpoznawania obrazu można zaprojektować w formie ustalonego szablonu decyzyjnego lub jako system uczący się na podstawie uaktualnianych opisów cech. Faza uczenia polega na optymalizowaniu zestawu sklasyfikowanych wektorów cech i na ich podstawie modyfikacji postaci funkcji rozdzielającej. Poza etapem uczenia działanie algorytmów identyfikacji obrazów przebiega analogicznie. Składają się na niego trzy podstawowe operacje: 1. Przypisanie obiektom q wektorów cech w przestrzeni n-wymiarowej 2. Obliczenie wartości funkcji przynależności. Jest ona miarą stopnia dopasowania obiektu opisanego wektorem do klasy i. W przypadku niejednoznacznej klasyfikacji obiektu, analizuje się prawdopodobieństwo przynależności do danej klasy: gdzie: - rozkład gęstości prawdopodobieństwa dla wektora cech w obrębie klasy K i - prawdopodobieństwo pojawienia się obiektów z klasy K i 1-43

Operacje rozpoznania obrazu 3. Proces podejmowania decyzji, czyli przyporządkowywanie obiektu q opisanego wektorem cech do klasy i, dla której wartość funkcji przynależności jest maksymalna. W przypadku przestrzeni charakteryzowanej przez dwie klasy obiektów, podjęcie decyzji o zakwalifikowaniu do jednej z nich odbywa się na zasadzie określenia stopnia przynależności,czyli prawdopodobieństwa, z jakim dany obiekt należy do jednej z klas K 1 lub K 2. 1-44

Przykład Do zilustrowania powyższego schematu postępowania może posłużyć problem rozpoznawania i kwalifikowania płytek okrągłych i eliptycznych. Po etapie binaryzacji i segmentacji, w obrazie pozostały elementy, których intensywność spełnia założone kryteria Następnie dla wszystkich obiektów obrazu wyznaczana jest przestrzeń cech (tu: jednowymiarowa). W odniesieniu do analizowanego problemu, sposób ten pozwoli odrzucić obiekty, których kształt nie odpowiada założonych kryteriów (zostaną odrzucone wszystkie obiekty "kanciaste"). Po wstępnym rozpoznaniu następuje etap klasyfikacji właściwej. Pozostałe w obrazie elementy są analizowane pod kątem relacji dwóch osi symetrii. W przypadku kół lub figur im bliskich, stosunek dwóch prostopadłych średnic jest bliski jedności. Natomiast figury eliptyczne mają iloraz znacznie wyższy. Na rysunku zaprezentowano (kolorem czerwonym - obiekty "okrągłe", czarnym "eliptyczne") efekt rozpoznania na zasadzie rozkładu prawdopodobieństw z środkowego. 1-45

Analiza semantyczna (zrozumienie) Analiza semantyczna może być wykonywana (na pewnym poziomie) poprzez operacje realizowane z wykorzystaniem sieci neuronowych, logiki rozmytej i algorytmów genetycznych. Próby realizacji systemów, które dawałyby możliwość właściwej interpretacji sceny i podejmowania na tej podstawie skomplikowanych decyzji są równocześnie próbami zakodowania w algorytmy procesów myślenia i kojarzenia, jakie zachodzą w naszym mózgu. Obecnie wiele ośrodków naukowych pracuje nad tymi metodami, również pod kątem ich aplikacji w systemach sztucznej inteligencji i wirtualnej rzeczywistości. 1-46