Analiza obrazu komputerowego wykład 1 Marek Jan Kasprowicz Uniwersytet Rolniczy 2009
Plan wykładu Wprowadzenie pojęcie obrazu cyfrowego i analogowego Geometryczne przekształcenia obrazu Przekształcenia punktowe Kontekstowa filtracja obrazu filtry liniowe i nieliniowe Transformacje Fouriera Przekształcenia morfologiczne Analiza obrazu
Literatura i programy komputerowe Komputerowa analiza i przetwarzanie obrazu R. Tadeusiewicz, i P. Korohoda, 1997 r. (niektóre przykłady pokazane w trakcie wykładu będą pochodzić z powyższej książki) http://winntbg.bg.agh.edu.pl/skrypty2/0098/ Image Tool http://ddsdx.uthscsa.edu/dig/itdesc.html thscsa /dig/itdesc html Imlab http://imlab.sourceforge.net/download.html ImageJ http://rsb.info.nih.gov/ij/ ih /ij/ Origin 8.0 program komercyjny Photoshop h CS2 program komercyjny Motic 2.0 program komercyjny
Przykładowe zastosowania analizy obrazu
Zastosowanie: obrazy satelitarne, meteorologia
Zastosowanie: medycyna tomografia komputerowa mikroskopia Obrazy 3D
Zastosowanie: kryminalistyka analiza pisma porównywanie portretów pamięciowych porównywanie linii papilarnych http://www.warminsko-mazurska.policja.gov.pl/lk/index.php?id_category=570
Zastosowanie: astronomia http://www.aik.magazyn.pl/ pl/
Podstawowe pojęcia
Przebieg procesu widzenia 1. Recepcja (akwizycja obrazu) 2. Przetwarzanie obrazu (filtracja wstępna, eliminacja zakłóceń, kompresja obrazu, eksponowanie ważnych ż cech, itp.) 3. Analiza obrazu (wydobycie y cech opisujących obraz) 4. Rozpoznanie obrazu i jego interpretacja
Schemat naturalnego przetwarzania obrazu
Schemat automatycznego widzenia
sygnał analogowy - sygnał, który może przyjmować dowolną wartość z ciągłego przedziału nieskończonego lub ograniczonego zakresem zmienności). Jego wartości mogą zostać określone w każdej chwili czasu dzięki funkcji matematycznej opisującej dany sygnał. Przeciwieństwem sygnału analogowego jest sygnał skwantowany sygnał cyfrowy - to sygnał, którego dziedzina i zbiór wartości są dyskretne. Jego odpowiednikiem o ciągłej dziedzinie i ciągłym zbiorze wartości jest sygnał analogowy. Znaczenie tego terminu może odnosić się do: - wielkości fizycznej, która z natury jest dyskretna (np. liczba błysków lampy w ciągu godziny) - wielkości pierwotnie ciągłej i analogowej, która została spróbkowana i skwantowana a a (np. sygnał na wyjściu komparatora aoanapięcia akontrolującego o pewien e proces w określonych chwilach) -każdej reprezentacji jednego z powyższych, w tym (najczęściej) w postaci ciągu liczb zapisanych w pamięci ę maszyny y cyfrowej (np. plik komputerowy typu WAV).
Obraz rzut przestrzeni trójwymiarowej na fragment płaszczyzny ł (2D) obraz analogowy obraz cyfrowy
Dyskretyzacja obrazu: ograniczenie i zdolności ś rozpoznawania szczegółów ograniczenie ilości możliwych do rozróżnienia stanów elementu (kolorów) analizowanie obrazu płaskiego zamiast przestrzennego analizowanie obrazu statycznego zamiast dynamicznego nego
Rozmieszczenie cyfrowych elementów obrazów Siatka heksagonalna siatka kwadratowa
Rozdzielczość obrazu jeden z parametrów trybu wyświetlania, parametr określający liczbę pikseli obrazu wyświetlanych na ekranie w bieżącym trybie pracy monitora komputerowego, telewizora a także każdego innego wyświetlacza, którego obraz budowany jest z pikseli. Rozdzielczość wyraża się w postaci liczby pikseli w poziomie i i w pionie. i Pojęcie rozdzielczości ś i używa ż się także w znaczeniu ilości ś i pikseli na cal. Wyrażana jest wtedy w jednostka ppi pixels per inch (monitory) lub dpi dots per inch (drukarki)
Obraz jako funkcja
256x256 128x128 64x64 32x32 16x16 8x8
pomniejszony z 256x256 do 32x32 i z powrotem powiększony NN BC powiększony z 256x256 do 4096x4096 i z powrotem pomniejszony NN BC
Interpolacja metodą "najbliższego sąsiada", ang. nearest neighbor - przy powiększaniu i odbywa się wierne kopiowanie i najbliższego piksela. W przypadku skalowania innego niż o wielokrotność 100% jest to statystyczne kopiowanie niektórych pikseli. Przy pomniejszaniu jest to mechaniczne pomijanie niektórych pikseli. Metoda najprostsza i wymagająca od komputera najmniejszej mocy obliczeniowej. Jest to interpolacja rzadko stosowana, ponieważ w przypadku dużych powiększeń wyraźnie widać grupy identycznych pikseli, a granice pomiędzy pikselami są wyraźne, ostre, nie rozmyte. Metoda dobra przy obrabianiu zrzutów z ekranu monitora, np. okien dialogowych, przycisków. Można jej także użyć do najbardziej kontrastowych obrazów, oraz obrazów o motywach wyraźnie ułożonych na siatce. Reguły nie ma. Decyzję należy podjąć drogą eksperymentu - wszystko zależy od oczekiwanych rezultatów. Jest to jedyna interpolacja nie powodująca rozmycia kształtów owo rozmycie jest jednak najczęściej potrzebne dla zachowania naturalnego wyglądu obrazu.
Interpolacja liniowa szczególny przypadek interpolacji za pomocą funkcji liniowej. Jeśli x określa wartość z przedziału x 0 < x < x 1,a y 0 = f(x 0 ) i y 1 = f(x 1 ) tablicę wartości danej funkcji, oraz h = x 1 x 0 odstęp pomiędzy argumentami, wówczas liniową interpolację wartości L(x) funkcji f otrzymujemy jako: Interpolacja dwusześcienna - metoda, ta uwzględnia kolor od wszystkich ośmiu ś pikseli sąsiadujących z pikselem interpolowanym. Daje ona najlepsze rezultaty, łagodne krawędzie i przyjemny (naturalny) dla oka kolor i kształt obrazka po transformacji. Jest to domyślna opcja w większości programów graficznych.
obraz oryginalny 16x16 powiększony ę 32x32 BC powiększony 32x32 NN powiększony 32x32 BL
obraz oryginalny 16x16 powiększony ę 24x24 BC powiększony 24x24 NN powiększony 24x24 BL
pomniejszony 8x8 BC obraz oryginalny 16x16 pomniejszony 8x8 NN pomniejszony 8x8 BL
Reprezentacja koloru Każdy z elementów dyskretnej reprezentacji obrazu może przyjmować tylko jeden z pośród ograniczonej ilości stanów. Ilość ta popularnie zwana ilością kolorów, może być także w komputerowej reprezentacji obrazu interpretowana t jako ilość bitów przeznaczonych na zapamiętanie stanu jednego elementu (bpp bits per pixel). Najpopularniejsze formaty binarny 1b bpp 2k kolory monochromatyczny 8 bpp 256 stopni szarości kolorowy 24 lub 32 bpp 17 milionów odcieni kolorów
kolorowy monochromatyczny y binarny
Kolorowy 256 64 16 8 4 2