POB Odpowiedzi na pytania 1.) Na czym polega próbkowanie a na czym kwantyzacja w procesie akwizycji obrazu, jakiemu rodzajowi rozdzielczości odpowiada próbkowanie a jakiemu kwantyzacja Próbkowanie inaczej dyskretyzacja przestrzenna, czyli konwersja obrazu ciągłego do komponentów dyskretnych, podział obrazu na określoną liczbę próbek o określonym poziomie szarości lub intensywności koloru. Odpowiada rozdzielczości przestrzennej, która określa stopień rozróżnialności detali lepsza, im większa wartość N. Kwantyzacja inaczej dyskretyzacja amplitudowa, czyli redukcja poziomu szarości do wartości dyskretnej całkowitej, z przedziału <L min, L max >. Odpowiada rozdzielczości poziomów szarości lepsza, im większa wartość M. 2.) Podać strukturę siatki dyskretnej, rodzaje sąsiedztwa, podać przykład spełnienia zasady dualizmu węzeł oczko. Siatka dyskretna to wzorzec według którego dokonywana jest dyskretyzacja przestrzenna obrazu, posiada linie, oczka i węzły. Najczęściej stosowana jest siatka prostokątna, gdzie oczko siatki jest kwadratem. Rodzaje sąsiedztwa: 8-spójne, 4-spójne. Zasada dualizmu węzeł-oczko polega na tym, że zachowane zostają zasady sąsiedztwa np. 8-spójnego zarówno dla węzłów, jak i dla oczek. Jest ona spełniona dla siatki prostokątnej. 3.) Podać przykład paradoksu spójności oraz sposób jego uniknięcia. Paradoks spójności polega na tym, że istnieje niejednoznaczność, jeśli chodzi o określenie czy piksel należy do obiektu czy do tła. Powstaje w przypadku, gdy zarówno dla obiektów jak i tła jest przypisany ten sam rodzaj sąsiedztwa. 4.) W jaki sposób zmiana w wyglądzie obrazu (np. z niejednolitego rozkładu poziomów jasności na jednolity rozkład poziomów jasności ) wpływa na wygląd jego histogramu. Zmiana w wyglądzie obrazu może sprawić, że histogram stanie się bardziej spłaszczony (jednolity na niejednolity) lub bardziej ostry, postrzępiony (z niejednolitego na jednolity). 5.) Na czym polega korekcja sumacyjna a na czym korekcja iloczynowa zniekształceń radiometrycznych w obrazie. Korekcja sumacyjna dotyczy jednorodnego jasnego obrazu odniesienia. Tworzony jest obraz P KORA gdzie każdy element jest różnicą odpowiadającego pola jasnego obrazu odniesienia i ciemnego obrazu odniesienia. Korekcja iloczynowa odbywa się w dwóch etapach. Najpierw liczona jest tablica współczynników korekcji jako iloraz maksymalnej wartości uzyskanej przy korekcji sumacyjnej i wartości danego pola uzyskanej w korekcji sumacyjnej. Następnie liczona jest wartość piksela obrazu wynikowego od obrazu pierwotnego odejmowane są wartości ciemnego obrazu odniesienia i jest to mnożone przez odpowiedni współczynnik korekcji. 1
6.) Podać uporządkowaną strukturę podziału operacji na obrazach na podstawowe grupy i podgrupy (jednopunktowe, sąsiedztwa, liniowe, nieliniowe, arytmetyczne, logiczne itd.) Jednopunktowe Sąsiedztwa: Jednoargumentowe Wygładzanie Operacja identyczności Liniowe Operacja odwrotności (negacji) Konwolucja Operacja progowania (binaryzacji) Nieliniowe Operacja odwrotnego progowania Logiczna Operacje progowania przedziałami Medianowa Operacje progowania z zachowaniem poziomów szarości Wyostrzanie Operacja rozciągania Gradientowe Operacja redukcji poziomów szarości Laplasjan Wieloargumentowe Dodawanie Odejmowanie Mnożenie Logiczne (AND, OR, XOR) 7.) Na przykładowym obrazie podać dwa sposoby zastosowania tablicy LUT: a) w przedstawieniu histogramu, b) w przedstawieniu uniwersalnego operatora punktowego. LUT jako histogram indeksy tablicy to wartości kolejnych poziomów szarości, elementy tablicy to liczba pikseli o zadanym poziomie szarości. LUT jako UOP indeksy tablicy to wartości kolejnych poziomów jasności obrazu, elementy tablicy to odpowiednie poziomy jasności pikseli obrazu wynikowego. 8.) Przeprowadzić operacje logiczne AND, OR, XOR na dwóch obrazach [p] i [q] o parametrach M=16, Lmin= 0 na przykładzie pikseli: p(2,2)=5, q(2,2)= 8 5 AND 8 = 0101 AND 1000 = 0000 = 0 5 OR 8 = 0101 OR 1000 = 1101 = 13 5 XOR 8 = 0101 XOR 1000 = 1101 = 13 AND 0 0 0 0 1 0 1 0 0 1 1 1 OR 0 0 0 0 1 1 1 0 1 1 1 1 XOR 0 0 0 0 1 1 1 0 1 1 1 0 9.) Na przykładowym fragmencie obrazu pokazać, w jaki sposób obliczana jest wartość piksla w trakcie realizacji operacji medianowej a) dla otoczenia 3x3, b) dla otoczenia 5x5. Dla otoczenia 3x3 brane jest po uwagę 8 pikseli otaczających piksel (razem 9), a dla otoczenia 5x5 24 piksele otaczające piksel (razem 25). Dla wygładzania medianowego są one sortowane rosnąco i wybierana jest mediana z posortowanego ciągu. 2
10.) Na przykładowym fragmencie obrazu pokazać, w jaki sposób obliczana jest wartość piksla w trakcie realizacji operacji liniowej (konwolucyjnej) wygładzania dla otoczenia 3x3 przy wartościach współczynnika maski K=1/9 i K=1/10. Dla otoczenia 3x3 brane jest po uwagę 8 pikseli otaczających piksel (razem 9). Dla operacji linowej są one sumowane, a następnie mnożone przez K. Daje to wartość piksela wynikowego. 11.) Podać 5 przykładowych metod operacji na pikslach wchodzących w skład skrajnych kolumn i wierszy tablic reprezentujących obrazy pierwotne (w trakcie wykonywania operacji sąsiedztwa w otoczeniu 3x3). 1. Pozostawić wartości pikseli bez zmian. 2. Wartości pikseli pozostawić jako nieokreślone. 3. Nadać pikselom wartości arbitralnie zadane przez operatora. 4. Zdublować górny, dolny wiersz oraz prawą, lewą kolumnę. 5. Wykorzystać tylko piksele z istniejącego sąsiedztwa. 12.) Na przykładowym fragmencie obrazu pokazać - z wykorzystaniem linii profilu - podstawową różnicę pomiędzy operacją wyostrzania opartą na gradiencie a operacją wyostrzania opartą na laplasjanie. Gradient jest wrażliwy na intensywność zmiany i jest używany tylko do detekcji krawędzi. Laplasjan podaje dodatkową informację o położeniu piksela względem krawędzi (po jasnej czy ciemnej stronie). 13.) W przypadku których operacji sąsiedztwa może zaistnieć potrzeba skalowania tablic obrazów wynikowych? Podać 3 metody skalowania. W przypadku wyostrzania (laplasjanu, gradientu) może zaistnieć potrzeba skalowania tablic obrazów wynikowych. 1. Metoda równomierna 2. Metoda trójwartościowa 3. Metoda obcinająca 14.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji erozji z wykorzystaniem elementu strukturalnego w postaci a) kwadratu, b) rombu. Erozja dla kwadratu wybór najmniejszej wartości z sąsiedztwa 8-spójnego i wstawienie wartości na środek. Erozja dla rombu wybór najmniejszej wartości z sąsiedztwa 4-spójnego i wstawienie wartości na środek. 3
15.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji dylatacji z wykorzystaniem elementu strukturalnego w postaci a)kwadratu, b) rombu. Dylatacja dla kwadratu wybór największej wartości z sąsiedztwa 8-spójnego i wstawienie wartości na środek. Dylatacja dla rombu wybór największej wartości z sąsiedztwa 4-spójnego i wstawienie wartości na środek. 16.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji otwarcia z wykorzystaniem elementu strukturalnego w postaci kwadratu. Otwarcie: najpierw erozja, potem dylatacja (kwadrat sąsiedztwo 8-spójne). 17.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji zamknięcia z wykorzystaniem elementu strukturalnego w postaci rombu. Zamknięcie: najpierw dylatacja, potem erozja (romb sąsiedztwo 4-spójne). 18.) Naszkicować przykładową krzywą ciągłą i zrealizować jej dyskretyzację według schematu Freemana a następnie podać jej zapis w postaci kodu łańcuchowego o stałej długości. Schemat dyskretyzacji Freemana: 001 001 000 010 001 000 000 010 000 19.) Podać definicję metryki pamiętając o jej 3 podstawowych własnościach. 20.) Podać 3 sposoby przeglądu obrazu a następnie przedstawić przykładowy obraz o parametrach N=4, M=4, Lmin=0 w postaci a) tablicy, b) wektora stosując jeden z 3 sposobów przeglądu obrazu. 1. Linia po linii (wiersz po wierszu) 1-szy sposób (maszyna do pisania) 2. Linia po linii (wiersz po wierszu) 2-gi sposób (wężykiem) 3. Według krzywej Hilberta rzędu k. 4
21.) Przedstawić 2 różniące się między sobą obrazy o parametrach N1=4, N2=2, M=4, Lmin=0 w postaci tablic a następnie wektorów stosując jeden ze znanych sposobów przeglądu obrazu. Wyznaczyć różnicę pomiędzy tymi obrazami z zastosowaniem metryki ulicznej (Manhattan). 22.) Podać zależność na stopień kompresji obrazu; podać definicję kompresji bezstratnej w kategoriach wartości metryki odniesionej do obrazu pierwotnego i wynikowego (zrekonstruowanego). 23.) Podać zależność na stopień kompresji obrazu; podać definicję kompresji stratnej w kategoriach wartości metryki odniesionej do obrazu pierwotnego i wynikowego (zrekonstruowanego). 5
24.) Które ze współczynników kształtu (W1, W2, W3, W9, W7, W8) są niezmiennicze względem skali (wielkości obiektu) i dlaczego? W3 i W9 są niezmiennicze względem skali, co wynika ze wzoru oraz W7 i W8. 25.) Pokazać na przykładzie, na czym polega główna zaleta metody 3 najbliższych sąsiadów 3- NN w porównaniu z metodą jednego najbliższego sąsiada 1-NN. Przy metodzie 1-NN jest brany pod uwagę tylko 1 najbliższy sąsiad, a przy 3-NN aż trzech, przy czym większość decyduje, w związku z czym 3-NN jest mniej podatny na błędy. 26.) Podać przykładowy sposób ukrycia informacji a) obrazowej b) tekstowej w obrazie. Informacja obrazowa jest ukrywana na najmniej znaczącym bicie obrazu, dla tekstowej do zapisu jednego znaku potrzeba dwóch pikseli. Stosuje się przy tym operacje jednopunktowe progowanie, reedukację poziomów szarości, rozciąganie, UOP, arytmetyczne i logiczne. 6