Analiza obrazu komputerowego wykład 6 Marek Jan Kasprowicz Uniwersytet Rolniczy 2009 Slajdy przygotowane na podstawie książki Komputerowa analiza obrazu R.Tadeusiewicz, P. Korohoda, oraz materiałów ze strony internetowej t www.uci.agh.edu.pl/uczelnia/tad/przetwarzanie_obrazow_medycznych/3a-fourier.ppt autorstwa R.Tadeusiewicza
Filtracja obrazów w dziedzinie Fouriera
Filtracja w dziedzinie F-obrazu. Filtr cyfrowy przeznaczony do filtracji obrazów można zinterpretować jako F-obraz, a filtrację jako mnożenie punktowe dwóch F-obrazów - jednego, pochodzącego od filtrowanego obrazu, i drugiego, będącego filtrem. Dla przykładu weźmy obraz kwadrat, który wraz z odpowiadającym mu F-obrazem przedstawiono na rysunku: a) b) Wykres amplitudy F-obrazu, który został ł wykorzystany jako filtr dolnoprzepustowy Przyjmuje wartości 0 i 1. Tzw. okno o częstotliwości. ośc Faza jest wszędzie równa zero. a) b) Obraz kwadrat oraz jego wykres otrzymany po filtracji filtrem na rysunku wyżej.
Filtracja w dziedzinie F-obrazu. Wartości otrzymanej w dziedzinie pierwotnej funkcji wykraczają poza zakres 0-255 i przed prezentacją w postaci poziomów szarości wartości przekraczające dopuszczalny zakres musiały zostać odpowiednio ograniczone. Charakterystyczną cechą idealnych filtrów - określonych w postaci F-pikseli o wartościach 0 i 1 - jest powstanie w obrazie otrzymanym po filtracji oscylacji. Obraz wraz z wykresem odtworzony z części rzeczywistej powstałej w dziedzinie pierwotnej po filtracji obrazu kwadrat filtrem podobnym do ale z przesuniętym obszarem wypełnionym jedynkami.
Filtracja obrazu w dziedzinie F. Obraz wraz z wykresem odtworzony z części urojonej powstałej w dziedzinie pierwotnej po filtracji obrazu kwadrat filtrem podobnym do ale z przesuniętym oknem częstotliwościowym. Rysunek a) powstał po dodaniu stałej 128 do wartości funkcji przedstawionej na wykresie b). a) b)
Przykłady. Filtracja dolnoprzepustowa obrazu Lena : a) F-obraz filtru, b) amplituda F-obrazu Lena po filtracji, c) faza F-obrazu Lena po filtracji, d) obraz po filtracji otrzymany w dziedzinie pierwotnej. a) b) c) d)
Przykłady. Filtracja dolnoprzepustowa obrazu dwa_kwadraty : a) amplituda F-obrazu po filtracji, b) obraz w dziedzinie d i i pierwotnej otrzymany po filtracji. a) b)
Przykłady. Filtracja górnoprzepustowa obrazu Lena : a) amplituda F-obrazu b po filtracji, b) obraz w dziedzinie pierwotnej otrzymany po filtracji (oraz po dodaniu stałej 128). Filtracja górnoprzepustowa obrazu dwa_kwadraty kwadraty : a) amplituda F-obrazu po filtracji, b) obraz w dziedzinie pierwotnej otrzymany po filtracji (oraz po dodaniu stałej 128). Filtr górnoprzepustowy p otrzymamy y gdy w F-obrazie filtru dolnoprzepustowego p zamienimy zera na jedynki a jedynki na zera
Filtry kierunkowe (poziome). Filtracja obrazu Lena z wyróżnionym kierunkiem poziomym: a) amplituda F-obrazu po filtracji dolnoprzepustowej, b) odtworzony obraz po filtracji dolnoprzepustowej, c) odtworzony obraz po komplementarnej filtracji górnoprzepustowej (oraz dodaniu stałej 128). a) b) c) Filtracja obrazu dwa_kwadraty z wyróżnionym kierunkiem poziomym: a) amplituda F-obrazu po filtracji dolnoprzepustowej, b) odtworzony obraz po filtracji dolnoprzepustowej, c) odtworzony obraz po komplementarnej filtracji górnoprzepustowej (oraz dodaniu stałej 128). a) b) c)
Filtry kierunkowe (pionowe). Filtracja obrazu Lena z wyróżnionym kierunkiem pionowym: a) amplituda F-obrazu po filtracji dolnoprzepustowej, b) odtworzony obraz po filtracji dolnoprzepustowej, c) odtworzony obraz po komplementarnej filtracji górnoprzepustowej (oraz dodaniu stałej 128). a) b) c) Filtracja obrazu dwa_kwadraty z wyróżnionym kierunkiem pionowym: a) amplituda F-obrazu po filtracji dolnoprzepustowej, b) odtworzony obraz po filtracji dolnoprzepustowej, c) odtworzony obraz po komplementarnej filtracji górnoprzepustowej (oraz dodaniu stałej 128). a) b) c)
Inne filtry (filtr pasmowy). Filtracja zero-jedynkowa nie musi być dolno- lub górnoprzepustowa. Można wybrać dowolny fragment dwuwymiarowej dziedziny F, jako obszar jedynek lub zer filtru, pamiętając jedynie o zachowaniu odpowiednich symetrii. F-obraz przykładowego filtru pasmowego (po pomnożeniu przez 255). Wynik filtracji obrazu Lena i dwa_kwadraty : a) filtrem pasmowym, b) filtrem komplementarnym do pasmowego. a) b)
Inne filtry (podpasmowe). Zestaw filtrów do rozkładu obrazu cyfrowego na trzy podpasma: a) filtr dolnoprzepustowy, b) filtr eksponujący krawędzie ukośne, c) filtr powstały jako uzupełnienie filtrów a) i b). A) B) C) Rozkład obrazu Lena i dwa_kwadraty na trzy pod obrazy w oparciu o filtry podpasmowe: a) obraz oryginalny, b) obraz otrzymany po filtracji filtrem z A, c) obraz otrzymany po filtracji filtrem B (plus stała 128), d) obraz otrzymany po filtracji filtrem C (plus stała 128). a) b) c) d) a) b) c) d)
Niezerowa faza filtru. W przetwarzaniu sygnałów jednowymiarowych, a w szczególności sygnałów ciągłych znany jest warunek liniowości fazy. Na kilku przykładach pokażemy teraz, że w przypadku obrazów faza powinna być nie tylko jak najbardziej zbliżona do liniowej ale wręcz jak najbardziej zerowa. Należy pamiętać, że przesunięcie obrazu nawet o jeden, czy dwa piksele może w istotny sposób zmienić jego wygląd - część pikseli znajdzie się poza ramką obrazu i te wysunięte z jednej strony ramki piksele w wyniku cyklicznego przesunięcia wsuną się do obrazu z drugiej strony. Przykładowo, to, co było z lewej strony obrazu znajdzie się po prawej, a to co było na górze obrazu będzie po przesunięciu w jego dole - zwykle niezbyt pożądany efekt. Idealna liniowa faza filtru posiadającego amplitudę wszędzie równą 1 jest przedstawiona na rysunku. Fazę tę wyznaczono tak, by płaszczyzna jej wykresu przechodziła w punkcie składowej stałej przez wartość zero oraz by nachylenie tej płaszczyzny wyznaczone w kierunku wiersza wynosiło: Δϕ Δk i= const a kolumny: = 2 Δ N Δi ϕ k = const = 2 M
Niezerowa faza filtru. Obraz Szach o rozmiarach 32x32 piksele oraz jego wykres. Obraz otrzymany po filtracji filtrem jedynkowym o fazie z w postaci poziomów szarości oraz w postaci wykresu funkcji.
Niezerowa faza filtru. Wykres fazy filtru jedynkowego o nachyleniach kierunkowych według wzorów: Δϕ Δk i= const = 10 Δ ϕ N Δi k = const π = 4 M P iż k d t i b t filt ji filt j d k f i Poniższy rysunek przedstawia obraz otrzymany po filtracji filtrem jedynkowym o fazie takiej jak wyżej w postaci poziomów szarości i w postaci wykresu funkcji.
Niezerowa faza filtru. Wykres fazy filtru jedynkowego o nachyleniach h kierunkowych k według wzorów przy obu współczynnikach równych 1. : Δϕ Δk i= const = k ϕ 2 π Δϕ i ϕ 2 π gdzie k ϕ oraz i ϕ to dowolne liczby = N Δi M całkowite, dodatnie lub ujemne. k = const Poniższy rysunek przedstawia obraz otrzymany po filtracji filtrem jedynkowym o fazie takiej jjak wyżej w postaci poziomów szarości i w postaci wykresu funkcji.
Odpowiedz impulsowa filtru. Dość istotną t rolę w problematyce filtracji odgrywa pojęcie odpowiedzi d i impulsowej filtru. Jak wskazuje nazwa, jest to wynik otrzymany po filtracji danym filtrem danych wejściowych będących impulsem jednostkowym. Przykład obrazu cyfrowego, o rozmiarach 6x6 pikseli, będącego impulsem jednostkowym. Opis filtru w postaci odpowiedzi impulsowej jest przydatny do przeprowadzania filtracji bezpośrednio w dziedzinie obrazu bez przechodzenia do dziedziny F. Dwuwymiarowy obraz okresowy i dwa sposoby wyboru jednego reprezentacyjnego okresu.
Odpowiedz impulsowa filtru. Jeden okres obrazu okresowego: a) odpowiadający pierwotnemu obrazowi cyfrowemu, b) po przesunięciu okresu reprezentacyjnego tak, by lewy górny narożnik obrazu pierwotnego znalazł się w centrum nowego obrazu. a) b) Odpowiedź impulsowa filtru dolnoprzepustowego z rysunku : a) po wyznaczeniu odwrotnej transformacji Foriera z F-obrazu filtru, b) po przesunięciu lewego, górnego narożnika do centrum, przy wykorzystaniu okresowości obrazu. a) b)
Odpowiedz impulsowa filtru. Obcięcie pola odpowiedzi impulsowej z b) do obszaru 5x5 pikseli: a) wykres odpowiedzi impulsowej po redukcji pola, b) amplituda F-obrazu filtru wynikająca z redukcji pola odpowiedzi impulsowej. c) faza F-obrazu filtru po zredukowaniu pola odpowiedzi impuslowej, d) część rzeczywista F-obrazu filtru opisanego amplitudą ą b) i fazą ą c). a) b) c) d)
Filtracja splotowa
Filtracja splotowa. Przykład odpowiedzi impulsowej filtru i maski do wyznaczania splotu. Filtr ( ) zdefiniowany za pomocą odpowiedzi impulsowej zawierającej jedynki w centralnym polu 5x5 pikseli, podzielone przez skalującą wartość 25: a) wykres odpowiedzi impulsowej, b) część rzeczywista F-obrazu filtru. a) b)
Filtracja splotowa. Obraz 32x32 piksele do ilustracji filtracji dolnoprzepustowej filtrem uśredniającym: a) w postaci odcieni szarości, b) w postaci wykresu. a1) b1) Obraz z rysunku a1) po filtracji filtrem : a) w postaci odcieni szarości, b) w postaci wykresu. a) b)
Filtracja splotowa. Obraz oryginalny do ilustracji okresowości filtracji w dziedzinie F: a) w postaci odcieni szarości, b) w postaci wykresu. a) b) Obraz z wcześniejszego resunku otrzymany po filtracji filtrem uśredniającym przeprowadzonej w dziedzinie częstotliwości (równoważnej splotowi kołowemu, czyli okresowemu): a) w postaci poziomów szarości, b) w postaci wykresu. a) b) Obraz Lena po powiększeniu i pola obrazu za pomocą powielenia wartości pikseli z brzegu obrazu, w celu umożliwienia wyznaczenia wyniku filtracji za pomocą maski w pobliżu brzegu obrazu.
F-obrazy wybranych filtrów splotowych. Uśredniający filtr dolnoprzepustowy: a) maska filtru, b) część rzeczywista F-obrazu. a) b) Wykresy F-obrazu maski uśredniającej: a) amplituda, b) faza. a) b)
F-obrazy wybranych filtrów splotowych. Filtr gradientu Sobela eksponujący krawędzie poziome: a) maska filtru, b) część urojona F-obrazu filtru. a) b) Wykresy F-obrazu maski Sobela: a) amplituda, b) faza. a) b)
F-obrazy wybranych filtrów splotowych. Filtracja obrazu Lena o rozdzielczości 64x64 za pomocą filtru gradient Sobela: a) obraz oryginalny, b) obraz po filtracji maską z założeniem powielenia pikseli brzegowych obrazu, c) obraz po filtracji za pomocą splotu kołowego, d) negatyw modułu różnicy obrazów b) i c). a) b) c) d)
F-obrazy wybranych filtrów splotowych. Maska Prewitta do wyznaczania gradientu: a) zawartość maski, b) wykres części urojonej opisującej F-obraz dla filtru odpowiadającego masce. a) b) F-obraz filtru dla maski Prewitta: a) wykres amplitudy, b) wykres fazy. a) b)
F-obrazy wybranych filtrów splotowych. Maska realizująca Laplasjan w oparciu o sąsiedztwo 4-punktowe i jej F-obraz: a) zawartość maski, b) wykres amplitudy opisujący w sposób kompletny F-obraz filtru odpowiadającego masce. a) b) Maska realizująca Laplasjan w oparciu o sąsiedztwo 8-punktowe i jej F-obraz: a) zawartość maski, b) wykres amplitudy opisujący w sposób kompletny F-obraz filtru odpowiadającego masce. a) b)
F-obrazy wybranych filtrów splotowych. Maska gradientu Robertsa i jej F-obraz: a) zawartość maski, b) wykres amplitudy F-obrazu filtru odpowiadającego masce, c) wykres fazy F-obrazu filtru odpowiadającego masce. a) b) c) F-obraz filtru odpowiadającego masce gradientu kierunkowoego: a) zawartość maski, b) wykres amplitudy, c) wykres fazy. a) b) c)
Rozplatanie, czyli filtracja odwrotna. Obraz oryginalny. Amplituda filtru modelującego zniekształcenia. Amplituda odtwarzającego filtru odwrotnego do filtru zniekształcającego Obraz zniekształcony tym filtrem. Obraz odtworzony z obrazu zniekształconego.
Filtry morfologiczne
Podstawowym pojęciem przekształceń morfologicznych jest tzw. element strukturalny obrazu. Jest to pewien wycinek obrazu (pewien podzbiór elementów) z wyróżnionym jednym punktem punktem centralnym. Najczęściej stosowanym elementem strukturalnym jest koło o promieniu jednostkowym.
Ogólny algorytm przekształcenia morfologicznego: element strukturalny jest przemieszczany po całym obrazie i dla każdego punktu obrazu dokonywane jest porównanie punktów obrazu i elementu strukturalnego, przy założeniu, że badany punkt obrazu jest punktem centralnym elementu strukturalnego w każdym punkcie obrazu następuje sprawdzenie, czy rzeczywista konfiguracja pikseli obrazu w otoczeniu tego punktu jest zgodna z wzorcowym elementem strukturalnym w przypadku wykrycia zgodności wzorca pikseli obrazu i szablonu elementu strukturalnego następuje wykonanie pewnej operacji na badanym punkcie
Erozja
Aby zdefiniować operację erozji zakłada się, że istnieje nieregularny obszar X i koło B o promieniu r, które będzie elementem strukturalnym. Jako punkt środkowy elementu strukturalnego przyjmuje się środek koła B. Wówczas erozję figury X elementem B można zdefiniować na dwa sposoby: figura zerodowana to zbiór wszystkich środków kół opromieniur,którewcałości zawarte są we wnętrzu obszaru X koło B przetacza sięę po wewnętrzneję stronie brzegu figury, a kolejne położenia środka koła B wyznaczają brzeg figury zerodowanej Erozję można także zdefiniować jako tzw. filtr minimalny, tzn. taki operator, w którym każdemu punktowi przypisuje się minimum z wartości jego sąsiadów.
Definicja I Zakładamy, że obraz wyjściowy zawiera pewien obszar (figurę) X, wyróżniający się pewną charakterystyczną cechą (np. odróżniającą się od tła jasnością). Figura X po wykonaniu operacji erozji (często określana krótko jako figura zerodowana) to zbiór punktów centralnych wszystkich elementów strukturalnych, które w całości mieszczą się we wnętrzu obszaru X. Miarą stopnia erozji jest wielkość elementu strukturalnego. Im większy rozmiar elementu strukturalnego - tym większa część brzegu podlegającej erozji figury zostaje usunięta. Definicja II Erozję można traktować jako filtr minimalny. Dzięki temu pojęcie erozji można rozszerzyć na obrazy posiadające wiele stopni szarości, a nawet kolorowe. W przypadku obrazu posiadającego wiele poziomów jasności operację erozji wygodnie zapisać jest jako: L'( m, n) = m i min, n i B( m, n) ( L( m gdzie: L(m,n) - jasność punktu o współrzędnych (m,n); B(m, n) - element strukturalny z punktem centralnym o współrzędnych (m,n). i, n i ))
Przykładową operacje erozji można wykonać posługując się elementem strukturalnym przedstawionym poniżej: 1 1 1 1 1 1 1 1 1 Element strukturalny dla erozji
Efektem operacji erozji jest usunięcie ę małych obiektów oraz nieistotnych szczegółów dużych obiektów
Efektem operacji erozji jest usunięcie ę małych obiektów oraz nieistotnych szczegółów dużych obiektów
Efekt erozji silnie zależy od obiektu strukturalnego, którym erozja jest wykonywana y Obraz komórek poddanych operacji erozji z pomocą elementu strukturalnego o postaci dużego kwadratu (po lewej) i małego krzyża (po prawej)
Obraz przed erozją Obraz po 1-kr. erozji Obraz po 2-kr. erozji Obraz po 3-kr. erozji Obraz po 4-kr. erozji Obraz po 5-kr. erozji
obraz oryginalny erozja 3 x 3 erozja 5 x 5
Erozję możemy również interpretować jako filtr minimalny, co ukazuje poniższy schemat. Z lewej strony umieszczony jest obraz wyjściowy, natomiast z prawej obraz po erozji. 88758835 8 8 8 5 33333333 3 3 3 3 3 3 3 5 3 3 5 8 3 3 4 53588555 5 8 5 5 5 3 3 3 3 3 3 3 3 33333333 3 3 3 3 3 3 3 5 5 8 8 5 5 5 5 33558877 3 5 8 7 3 3 3 5 5 5 5 5 32225555 2 2 5 5 5 7 7 2 7 8 8 5 7 75578777 5 7 7 7 7 3 2 3 2 5 5 7 5 52223335 2 2 3 3 5 5 5 3 3 3 3 5 8 5 3 3 3 3 3 3 5
Erozja obrazu barwnego
Dylatacja
Dylatacja jest to przekształcenie odwrotne do erozji. Aby zdefiniować operację dylatacji zakłada się, że istnieje nieregularny obszar (figura) na obrazie X i koło B o promieniu r, które będzie elementem strukturalnym. Wówczas dylatację figury X elementem B można zdefiniować na trzy sposoby: figura po dylatacji jest zbiorem środków wszystkich kół B, dla których choć jeden punkt pokrywa się z jakimkolwiek punktem figury wyjściowej koło B przetacza się po zewnętrznej stronie brzegu figury. Kolejne położenia środka koła B wyznaczają brzeg figury po dylatacji analogicznie jak w przypadku erozji, dylatację można zdefiniować jako filtr maksymalny
Operacje dylatacji można wykonać posługując się elementem strukturalnym przedstawionym poniżej: x x x x 0 x x x x Element strukturalny dla dylatacji
Dylatacja powoduje, że niewielkie dziury optyczne na obrazie zostają wypełnione, a także wygładzają się niewielkie zagłębienia konturu obiektów
Definicja I Zakładamy, że obraz wyjściowy zawiera obszar X wyróżniający się pewną charakterystyczną cechą (np. jasnością). Figura przekształcona przez dylatację to zbiór punktów centralnych wszystkich elementów strukturalnych, których którykolwiek punkt mieści się we wnętrzu obszaru X. Miarą dylatacji jest wielkość elementu strukturalnego. Definicja II Dylatację można traktować jako filtr maksymalny. Rozpatrywane otoczenie lokalne l punktu jest odpowiednikiem d iki elementu strukturalnego. Dzięki temu pojęcie dylatacji można rozszerzyć na obrazy posiadające wiele stopni szarości, a nawet kolorowe. W przypadku obrazu posiadającego wiele poziomów jasności operację dylatacji wygodnie zapisać jako: L'( mn, ) = max ( L( m, n)) m i, n i Bmn (, ) gdzie: di L(m,n) - jasność punktu o współrzędnych (m,n); B(m, n) - element strukturalny z punktem centralnym o współrzędnych (m,n). i i
Efekt dylatacji silnie zależy od obiektu strukturalnego, którym dylatacja jest wykonywana y Obraz komórek poddanych operacji dylatacji z pomocą elementu strukturalnego o postaci dużego ż kwadratu (po lewej) i małego ł krzyża ż (po prawej)
Obraz przed dylatacją Obraz po 1-kr. dylatacji Obraz po 2-kr. dylatacji Obraz po 3-kr. dylatacji Obraz po 4-kr. dylatacji Obraz po 5-kr. dylatacji
obraz oryginalny dylatacja 3 x 3 dylatacja 5 x 5
Analogicznie dylatację możemy interpretować jako filtr maksymalny, co ukazuje poniższy schemat. Tak jak poprzednio z lewej strony umieszczony jest obraz wyjściowy, natomiast z prawej obraz po dylatacji. 88758835 8 8 8 5 88888884 8 8 8 8 8 8 5 3 3 5 8 3 3 4 53588555 5 8 5 5 5 8 8 8 8 8 8 8 5 58888855 8 8 8 8 5 5 5 5 8 8 5 5 5 5 33558877 3 5 8 7 5 8 8 8 8 8 8 7 78888887 8 8 8 8 8 7 7 7 2 7 8 8 5 7 75578777 5 7 7 7 7 7 7 7 8 8 8 8 7 77788888 7 7 8 8 8 8 5 5 3 3 3 3 5 8 7 7 7 8 8 8 8 7
Dylatacja obrazu barwnego
Operacja dylatacji pozwala wyznaczać kontury figur na obrazie kontur (X) = XOR [ X, dylatacja (X) ] kontur taki wygląda lepiej, gdy obraz X poda się przed dylatacją filtracji medianowej