Algorytmy graficzne. Metody binaryzacji obrazów



Podobne dokumenty
Wykład 6. Analiza kształtu histogramu jasności: Ridler, 1978 Otsu, 1979 Lloyd, 1985 Kittler, 1986 Yani, 1994 Yawahar, 1997 PROGOWANIE

Metrologia Techniczna

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 6 AiR III

WYKŁAD nr Ekstrema funkcji jednej zmiennej o ciągłych pochodnych. xˆ ( ) 0

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Operacje przetwarzania obrazów monochromatycznych

Modelowanie i Analiza Danych Przestrzennych

Zbigniew Sołtys - Komputerowa Analiza Obrazu Mikroskopowego 2016 część 7

ANALIZA I INDEKSOWANIE MULTIMEDIÓW (AIM)

O nauczaniu oceny niepewności standardowej

Diagnostyka obrazowa

Diagnostyka obrazowa

UNIWESRYTET EKONOMICZNY WE WROCŁAWIU HOSSA ProCAPITAL WYCENA OPCJI. Sebastian Gajęcki WYDZIAŁ NAUK EKONOMICZNYCH

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

5. Analiza dyskryminacyjna: FLD, LDA, QDA

U L T R A ZAKŁAD BADAŃ MATERIAŁÓW

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Analiza obrazów. Segmentacja i indeksacja obiektów

3. Macierze i Układy Równań Liniowych

Mechanika kwantowa ćwiczenia, 2007/2008, Zestaw II

POB Odpowiedzi na pytania

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Analiza obrazów - sprawozdanie nr 2

Implementacja filtru Canny ego

Przetwarzanie obrazów wykład 2

Programowanie celowe #1

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

WYKŁAD 3. Przykłady zmian w obrazie po zastosowaniu Uniwersalnego Operatora Punktowego

Proste metody przetwarzania obrazu

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III

ROZDZIAŁ 5. Renty życiowe

Metody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1

METODA OCENY PSR PIESZYCH NA OSYGNALIZOWANYCH PRZEJŚCIACH POZIOMYCH

Kolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w

TEORETYCZNE PODSTAWY INFORMATYKI

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Raport. Bartosz Paprzycki UMK 2009/2010

Przetwarzanie obrazów wykład 4

Operator rozciągania. Obliczyć obraz q i jego histogram dla p 1 =4, p 2 =8; Operator redukcji poziomów szarości

Akademia Górniczo - Hutnicza im. Stanisława Staszica w Krakowie. Projekt. z przedmiotu Analiza i Przetwarzanie Obrazów

Ważny przykład oscylator harmoniczny

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

Animowana grafika 3D. Opracowanie: J. Kęsik.

Podstawy Informatyki Wykład V

Detekcja twarzy w obrazie

Obraz jako funkcja Przekształcenia geometryczne

POPRAWIANIE JAKOŚCI OBRAZU W DZIEDZINIE PRZESTRZENNEJ (spatial image enhancement)

Teoretyczne podstawy informatyki

Analiza obrazu. wykład 3. Marek Jan Kasprowicz Uniwersytet Rolniczy 2009

9. OBRAZY i FILTRY BINARNE 9.1 Erozja, dylatacja, zamykanie, otwieranie

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

dr inż. Piotr Odya dr inż. Piotr Suchomski

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Rekonstrukcja obrazu (Image restoration)

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Metody systemowe i decyzyjne w informatyce

Efektywne wyszukiwanie wzorców w systemach automatycznej generacji sygnatur ataków sieciowych

Detekcja punktów zainteresowania

1. Podstawowe pojęcia w wymianie ciepła

Komputerowe obrazowanie medyczne

Marcin Wilczewski Politechnika Gdańska, 2013/14

Diagnostyka obrazowa

stopie szaro ci piksela ( x, y)

Formaty obrazów rastrowych biblioteki PBM

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 8. Filtracja uśredniająca i statystyczna.

5. Rozwiązywanie układów równań liniowych

1 Układy równań liniowych

Przekształcenia punktowe

Hierarchiczna analiza skupień

Rozwiązywanie równań różniczkowych

Relacje Kramersa Kroniga

Analiza obrazów - sprawozdanie nr 3

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 3 AiR III

Segmentacja obrazów cyfrowych z zastosowaniem teorii grafów - wstęp. autor: Łukasz Chlebda

9. Podstawowe narzędzia matematyczne analiz przestrzennych

Wykład z modelowania matematycznego. Zagadnienie transportowe.

Wykład 1. Andrzej Leśniak KGIS, GGiOŚ AGH. Cele. Zaprezentowanie praktycznego podejścia do analizy danych (szczególnie danych środowiskowych)

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

D. Miszczyńska, M.Miszczyński KBO UŁ 1 GRY KONFLIKTOWE GRY 2-OSOBOWE O SUMIE WYPŁAT ZERO

Segmentacja przez detekcje brzegów

Histogram obrazu, modyfikacje histogramu

Zadania z badań operacyjnych Przygotowanie do kolokwium pisemnego

Przetwarzanie obrazu

WYKŁAD 3 WYPEŁNIANIE OBSZARÓW. Plan wykładu: 1. Wypełnianie wieloboku

INSTYTUT ENERGOELEKTRYKI POLITECHNIKI WROCŁAWSKIEJ Raport serii SPRAWOZDANIA Nr

Zbigniew JERZAK Adam KOTLIŃSKI. Studenci kierunku Informatyka na Politechnice Śląskiej w Gliwicach

CECHY BIOMETRYCZNE: ODCISK PALCA

Wstęp do metod numerycznych Eliminacja Gaussa Równania macierzowe. P. F. Góra

Filtracja liniowa (metody konwolucyjne, tzn. uwzględniające pewne otoczenie przetwarzanego piksla):

ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1)

Algebra liniowa. Macierze i układy równań liniowych

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

SEGMENTACJA OBRAZU Wprowadzenie

Przekształcenia punktowe i geometryczne

Pole temperatury - niestacjonarne (temperatura zależy od położenia elementu ciała oraz czasu) (1.1) (1.2a)

x 2 = a RÓWNANIA KWADRATOWE 1. Wprowadzenie do równań kwadratowych 2. Proste równania kwadratowe Równanie kwadratowe typu:

MODELE MATEMATYCZNE W UBEZPIECZENIACH WYKŁAD 5: RENTY ŻYCIOWE

Transkrypt:

Algorytmy graficzne Metoy binaryzacji obrazów

Progowanie i binaryzacja Binaryzacja jest procesem konwersji obrazów kolorowych lub monochromatycznych (w ocieniach szarości) o obrazu wupoziomowego (binarnego). Przeprowazenie binaryzacji na obrazie znacząco reukuje ilość zawartej w nim informacji. Najczęściej realizowana jest przez progowanie (thresholing), polegające na ustaleniu wartości progowej (threshol), poniżej której piksele obrazu klasyfikowane są jako piksele obiektu, natomiast pozostałe piksele klasyfikowane są jako piksele tła (nie-obiekt): gzie f oraz g są opowienio obrazem oryginalnym i przetworzonym. W zależności o specyfiki obrazu pikselom obiektu/ów naaje się wartość minimalną, pikselom tła wartość maksymalną (la obrazów 8 bitowych, opowienio: 0 oraz 255). Uogólnieniem metoy progowania z pojeynczym progiem (binaryzacja) jest wieloprogowanie (multithresholing), w przypaku którego ustala się większą liczbę progów, pozwalając tym samym na wyzielenie większej liczby klas obiektów w obrazie. Binaryzacja jest stosowana wszęzie tam, gzie słuszne jest założenie o istnieniu wóch klasach obiektów w obrazie. Binaryzacja jest powszechnie wykorzystywana jako etap wstępny procesu analizy okumentów (ocument image unerstaning, ocument image analysis), np. rozpoznawanie tekstu (OCR), pisma oręcznego, cyfryzacja map. Efekt binaryzacji wpływa na ostateczny wynik złożonego procesu analizy. Reukcja ilości informacji przeprowazona na etapie binaryzacji obniża złożoność algorytmów rozpoznawania i tym samym zmniejsza złożoność czasową całego procesu analizy okumentu. Celem binaryzacji jest reukcja informacji zbęnej i pozostawienie informacji istotnej z punktu wizenia alszego przetwarzania. Stanowi najprostszą metoę segmentacji obrazu, czyli poziału obrazu na rozłączne regiony charakteryzujące się jenoronością wartości pikseli lub innej branej po uwagę cechy: 2

Binaryzacja Iea binaryzacji opiera się na założeniu, że wa moy histogramu reprezentują wie rozzielne klasy: obiekty oraz tło. W ogólności takie założenie nie musi być prawziwe. W zależności o sposobu ustalenia progu metoy progowania można zielić na metoy z progiem globalnym, lokalnym oraz metoy hybryowe. Progowanie globalne polega na wyznaczeniu na postawie analizy obrazu jenego progu globalnego. W przypaku progowania lokalnego, próg ustalany jest la każego piksela obrazu niezależnie na postawie analizy jego otoczenia (sąsieztwa, kontekstu). W ogólności każą metoę progowania globalnego można zastosować w wersji quasi-lokalnej przez pozielenie obrazu na poobrazy (bloki o ustalonym rozmiarze) i zastosowanie progowania globalnego o każego bloku niezależnie. Zaletą rozwiązania jest prostota (koncepcyjnie). Waą większa złożoność czasowa. T progowanie globalne T 1 T 2 progowanie lokalne T 3 T 4 3

Progowanie globalne (1) a c b Zaletą progowania globalnego jest jego szybkość (operacja punktowa). Progowanie lokalne jest wolniejsze, ponieważ wymaga wykonywania obliczeń w otoczeniu każego piksela obrazu (operacja kontekstowa). Nie istnieje uniwersalna metoa binaryzacji ająca obre rezultaty niezależnie o specyfiki przetwarzanych okumentów. W ogólności metoy progowania globalnego nie naają się o binaryzacji okumentów nieopowieniej jakości. Przyczyną błęów binaryzacji mogą być: nierównomierne oświetlenie okumentu prze jego pozyskaniem, stosowanie urzązeń niskiej jakości, zabruzenia, zagięcia lub przesączenia atramentu pomięzy stronami, niejenolite tło tekstu (np. naruki firmowe, logo, faktura papieru - tekstura), niejenolita grubość kreski w przypaku pisma oręcznego, zbyt mały kontrast, etc. W ogólności, progowanie globalne aje zaowalające rezultaty w przypaku gy obiekty różnych klas zajmują rozłączne obszary histogramu e f g h Rys. 1. Przykła progowania globalnego. (a) obraz oryginalny, (b) obraz zbinaryzowany z progiem T=210. Obrazy (c), (e) oraz (g) stanowią przykła sytuacji w której stosowanie progowania globalnego zwykle nie przynosi pożąanych rezultatów. W tym przypaku problemem jest niejenorone tło oraz refleksy o błyszczącej powierzchni. 4

Progowanie globalne (2) a 200 150 100 50 b 250 200 150 100 50 50 100 150 200 250 300 350 100 200 300 400 c 250 200 150 100 50 250 200 150 100 50 50 100 150 200 250 300 50 100 150 200 250 300 350 Rys. 1. Progowanie globalne. (a), (c) przykłaowe obrazy cyfrowe, (b), () przekrój wartości pikseli w wierszu, opowienio 70 oraz 200 (zaznaczone kolorem czerwonym na oryginalnych obrazach). 5

Progowanie globalne (3) a b c Rys. 1. Problem wyboru progu globalnego. (a) obraz oryginalny; (b), (c) i () przestawiają,opowienio, obraz po binaryzacji z progiem T=100, T=150 oraz T=170. 6

Progowanie wymagające wiezy a priori p-tile thresholing jest to metoa wykorzystywana o binaryzacji okumentów tekstowych, która wykorzystuję wiezę a priori o procentowym pokryciu strony przez tekst. Wieząc, że p% analizowanego obrazu stanowi czarny tekst na białym tle progiem T jest ta wartość, która zieli histogram na wie części: pierwszą zawierającą w przybliżeniu p% pikseli obrazu oraz rugą część, która zawiera pozostałą część pikseli. Próg może być łatwo ustalony na postawie ystrybuanty histogramu. Progowanie z błęem minimalnym. Progowanie tego typu otyczy przypaków, gy a priori znane są rozkłay funkcji gęstości prawopoobieństwa zarówno pikseli tła, jak i obiektów: p ob oraz p b. W takim przypaku, gy rozkłay zachozą na siebie binaryzacja jest obarczona błęem niezależnie o wartości progu. Zaaniem jest obranie takiej wartości progu by wprowazony błą klasyfikacji (binaryzacji) był minimalny. Można zauważyć, że błą wynikający z błęnej klasyfikacji tła jako obiektu jest równy: poczas gy błą wynikający z klasyfikacji obiektów jako tła: Sumarycznie aje to błą: Wyznaczając pochoną E(t) oraz przyrównując ją o zera otrzymuje się równanie na błą minimalny (poniższe równanie jest prawziwe niezależnie o rozkłaów początkowych): W powyższych równaniach parametr θ jest równy części obrazu jaką zajmuje obiekt. 7

Progowanie wymagające wiezy a priori - ilustracja a b c Rys. 1. Przykła binaryzacji z progiem optymalnym (t*=74). (a) obraz oryginalny, (b) obraz po binaryzacji, (c) histogram obrazu oryginalnego z nałożoną krzywą gaussowską aproksymującą rozkła pikseli obiektu (śrenia i wariancja wynoszą opowienio 50 oraz 56.25); () histogram obrazu oryginalnego z usuniętymi wartościami aproksymowanym przez pierwszy gaussian wraz z krzywą gaussowską reprezentującą piksele tła (śrenia i wariancja: 117, 49). Optymalna wartość progu została w tym przypaku wyznaczona na postawie równania poanego na poprzeniej stronie. Przykła pochozi z: M. Petrou, P. Bosogianni, Image Processing. The funamentals, Wiley an Sons, 1999. 8

Progowanie iteracyjne Riler, Calvar (1978) Metoa iteracyjnego ustalenia progu globalnego nie wymaga apriorycznej wiezy na temat rozmiaru i położenia obiektów na scenie. Algorytm: 1. Oszacuj początkową wartość progu, np. przyjmij, że tło stanowią cztery narożne piksele obrazu; pozostałe piksele stanowią piksele obiektu. Przy takim założeniu wyznacz śrenią jasność tła μ B oraz śrenią jasność obiektu μ Ob. Za wartość progową przyjmij: 2. W n-tej iteracji wyznacz wartość śrenią la klasy tła oraz klasy obiektu, przy czym poziału na klasy okonaj la progu wyznaczonego w poprzeniej iteracji algorytmu 3. Wyznacz nową wartość progu: 4. Gy T (n+1) =T (n) zatrzymaj algorytm. W przeciwnym wypaku przejź o punktu 2. Wartość początkową progu można zaać na wiele sposobów, np. jako śrenią intensywność obrazu. Początkowa wartość progu wpływa na liczbę iteracji po których wartość progu stabilizuje się. 9

Progowanie iteracyjne ilustracja T=157.572 a b c T=142.229 T=129.313 T=120.194 T=116.972 e f Rys. 1. Progowanie iteracyjne. (a) obraz oryginalny; (b)-(f) obrazy la progów w kolejnych iteracjach algorytmu. Rysunki przestawiają wyniki la 1,2,3,4 oraz 6 iteracji. Iteracja 5 nie została przestawiona. 10

Metoa Otsu (1979) Metoa Otsu stanowi przykła progowania optymalnego, w którym znaleziona wartość progu jest optymalna w sensie optymalizacji zaanej funkcji kryterialnej. W tym przypaku funkcją kryterialną jest wariancja wewnątrzklasowa (minimalizacja) lub wariancja mięzyklasowa (maksymalizacja). 0.01 0.008 0.006 0.004 piksele obiektu piksele tła Niech any jest obraz o L poziomach jasności, [0,L-1]. Wybrany arbitralnie próg t zieli obraz na wie klasy: klasę obiektu (ob) oraz klasę tła (b). Prawopoobieństwa (wartości znormalizowanego histogramu) obu klas ane są równaniami: 0.002 t 50 100 150 200 250 Wartości śrenie, opowienio klasy obiektu oraz klasy tła są równe: Cechą metoy Otsu jest opis statystyczny obu klas przez wie różne funkcje prawopoobieństwa: rozkła klasy obiektu oraz rozkła klasy tła. Obraz z wyzielonymi niezależnymi klasami można scharakteryzować poprzez wartości śrenie oraz wariancje w poszczególnych klasach: Wariancje: Na tym etapie histogram obrazu wejściowego jest scharakteryzowany przez wie pary wielkości: wartość śrenią i wariancję la klasy obiektu oraz wartość śrenią i wariancję la klasy tła. Jest to równoważne estymowaniu rozkłau poziomów jasności w obrazie przez wa rozkłay normalne o opowienich parametrach (śrenia i wariancja). Globalnymi eskryptorami obrazu jest śrenia globalna oraz wariancja globalna, równe opowienio: 11

Metoa Otsu (2) Wariancję globalną można równoważnie zapisać w postaci sumy wariancji wewnątrzklasowej σ W (Within-class variance) oraz wariancji mięzyklasowej σ B (Between-class variance): Wariancja globalna w ramach jenego obrazu jest wielkością stałą, niezależną o przyjętego progu. Próg wpływa natomiast na wartości wariancji wewnątrz- oraz mięzyklasowej, których suma aje wariancję globalną. Minimalizacja wariancji wewnątrzklasowej jest równoważna maksymalizacji wariancji mięzyklasowej. Jako funkcję kryterialną przyjmuje się zwykle wariancję mięzyklasową, która wymaga mniejszego nakłau obliczeniowego (zależy jeynie o momentów statystycznych pierwszego rzęu): Maksymalna wartość wariancji mięzyklasowej opowiaa optymalnej separacji wóch klas w obrazie. Próg, który okonuje takiej separacji jest progiem optymalnym t*. Algorytm Otsu: Wyznacz wartość wariancji mięzyklasowej la każej wartości progowej, t Progiem optymalnym t* jest wartość t la której wariancja mięzyklasowa osiąga wartość maksymalną 12

Metoa Otsu - ilustracja a b Metoa Otsu osiąga obre rezultaty la obrazów o histogramach bimoalnych, gzie możliwa jest reprezentacja histogramu przez wa zachozące na siebie rozkłay normalne. c 0.02 0.015 0.01 0.005 50 100 150 200 250 σ 2 B 0.8 0.6 0.4 0.2 50 100 150 200 250 t Rys. 1. Binaryzacja metoą Otsu. Rysunek (a) obraz oryginalny; (b) obraz zbinaryzowany; (c) histogram obrazu oryginalnego; () wariancja mięzyklasowa w zależności o wartości progu. W tym przypaku znaleziona optymalna wartość progu wynosi t*=114. Rozkła poziomów jasności w obrazie oryginalnym został sprowazony o wóch rozkłaów normalnych o śrenich opowienio 46 (klasa obiektu) oraz 182 (klasa tła). Wartości śrenie zostały zaznaczone na rysunku (c). 13

Metoa Otsu - ilustracja a b c c 8000 6000 4000 σ 2 B 0.6 0.5 0.4 0.3 Rys. 1. Binaryzacja metoą Otsu. Rysunek (a) obraz oryginalny; (b) obraz zbinaryzowany. Znaleziona wartość progu jest równa t*=131. Rysunek (c) histogram obrazu oryginalnego; () wariancja mięzyklasowa w zależności o wartości progu. 2000 0.2 50 100 150 200 250 0.1 50 100 150 200 250 t 14

Metoa Otsu - moyfikacja a b Rys. 1. Binaryzacja Otsu. (a) progowanie globalne, próg=131; (b) wynik progowania po pozieleniu obrazu oryginalnego na pięć poobrazów i zastosowania algorytmu Otsu o każego z nich niezależnie. Progi la poobrazów wynoszą: 110, 91, 115, 99, 110. Sposób poziału na poobrazy nie został przestawiony. 15

Metoy entropijne Metoa Puna Najprostszą metoą wykorzystującą entropię jako kryterium wyboru progu (metoa optymalna) jest metoa maksymalizacji entropii w obrazie po binaryzacji (metoa Puna). W takim przypaku, przyjęcie progu o wartości t okonuje poziału obrazu na wie klasy: klasę obiektu oraz klasę tła, których prawopoobieństwa wynoszą opowienio: Kryterium wyboru progu jest entropia obrazu po binaryzacji. Piksele obrazu po binaryzacji należą o jenej z wóch klas. Entropia jest ana wówczas równaniem: i wartość maksymalną przyjmuje la p ob p b 0.5. Omawiana metoa jako próg przyjmuje tę wartość jasności w obrazie la której prawopoobieństwa klas w obrazie są w przybliżeniu równe sobie i wynoszą 0.5 niezależnie o rzeczywistego uziału obiektu w obrazie. Taka metoa może być zastosowana gy obiekt zajmuje w przybliżeniu 50% powierzchni obrazu. W ogólności aje kiepski wynik binaryzacji. t=160 t=211 0.8 0.6 0.015 t=160 0.4 0.2 0.01 0 1 0.005 t=211 0.5 0.4 0.3 64 128 192 256 Optymalną wartością progu w przypaku opisywanej metoy jest wartość zieląca histogram na wie równieprawopoobne klasy. Spośró wóch przykłaowych wartości progu, t=160 oraz t=211, metoa wybierze wartość t=211. 0.2 0.1 0 1 16

Metoa entropijna Puna - ilustracja a b t=160 t=211 0.015 0.01 0.005 50 100 150 200 250 c Rys. 1. Prosta binaryzacja entropijna (metoa Puna). (a) obraz oryginalny; (b) histogram obrazu oryginalnego; (c) wynik biinaryzacji Puna (próg t=211); () wynik binaryzacji inną metoą (próg t=160). Zgonie z metoą Puna, na rysunku (c) połowa pikseli posiaa wartość 0, a ruga połowa wartość 255. 17

Metoy entropijne Kapur, Sahoo, Wong (1985) Metoa Kapura, Sahoo i Wonga opisuje wyzielone klasy niezależnymi rozkłaami prawopoobieństwa (rozkłay nie zachozą na siebie, tak jak w metozie Otsu). Maksymalizacja entropii jest interpretowana jako wskaźnik użej zawartości informacyjnej obrazu po progowaniu. Obiekt oraz tło opisane są rozkłaami prawopoobieństw: obiekt: tło: gzie: Entropie obu rozkłaów ane są równaniami Optymalną wartością progu jest wartość maksymalizująca entropię całkowitą (sumaryczną): 18

Metoa entropijna Kapura - ilustracja a b c H 12 10 8 6 4 2 50 100 150 200 250 t Rys. 1. Binaryzacja entropijna. (a) obraz oryginalny; (b) obraz zbinaryzowany zgonie z metoą Kapura; (c) funkcja kryterialna. Krzywą czerwoną zaznaczono entropię sumaryczną, krzywą zieloną entropię tła, krzywą czarną - entropię obiektów. () la porównania wynik binaryzacji Puna. 19

Metoa entropijna Kapura. Uwaga Poobnie jak metoa Otsu, metoa Kapura przypisuje klasom powstałym przez zefiniowanie progu opowiaające im prawopoobieństwa. W szczególności suma prawopoobieństw zarzeń w obu klasach niezależnie musi sumować się o 1. t=160 0.015 0.01 0.005 0.015 50 100 150 200 250 0.01 próg t=160 0.005 0.025 t=160 50 100 150 200 250 0.02 0.015 0.01 0.005 50 100 150 200 250 20

Macierz przejść (co-occurrence matrix) Jeną z wa meto otychczas opisanych jest fakt, że wartość progu ustalana jest jeynie na postawie analizy histogramu obrazu bez uwzglęnienia korelacji przestrzennych pomięzy pikselami. W szczególności oznacza to, że progi wyznaczone la różnych obrazów posiaających taki sam histogram są ientyczne. Jenym ze sposobów uwzglęnienia informacji o rozkłazie przestrzennym pikseli jest wykorzystanie macierzy przejść W (co-occurrence matrix). Dla obrazu o wymiarach MxN elementy w ij macierzy przejść W określone są równaniem: gzie Po unormowaniu elementy macierzowe macierzy unormowanej można interpretować jako prawopoobieństwa przejść pomięzy określonymi poziomami jasności w obrazie. Macierz przejść jest macierzą kwaratową LxL, gzie L jest liczbą wartości, jakie może przyjmować pojeynczy piksel obrazu. a i0 0 1 0y 1 0 1 0 j 0 0 1 0 z k0 0 0 1{ b J 10 5 6 2 N Rys. 1. Macierz przejść. (a) fragment obrazu binarnego oraz (b) opowiaająca mu macierz przejść. Dla obrazów ośmiobitowych macierz przejść jest macierzą kwaratową 256x256. 21

Macierz przejść. Przykła a b c 250 250 200 150 100 50 2500 2000 1500 1000 500 50 100 150 200 250 200 150 100 50 1500 1250 1000 750 500 250 50 100 150 200 250 0 0 50 100 150 200 250 0 0 50 100 150 200 250 Rys. 1. (a), (b) wa przykłaowe obrazy cyfrowe. Rysunki (c) oraz () przestawiają opowiaające im macierze przejść oraz histogramy jenowymiarowe. 22

Metoa entropii lokalnej Wyznaczony próg t la obrazu monochromatycznego (w ocieniach szarości) zieli histogram jenowymiarowy na wie klasy: klasę obiektu oraz klasę tła. Ten sam próg okonuje poziału macierzy przejść na cztery kwaranty: A, B, C oraz D (zgonie z rysunkiem poniżej). Przyjmując, że obiektem zainteresowania jest ruk (małe wartości pikseli) można założyć, że kwarant A opisuje przejścia w klasie obiektu, natomiast kwarant D przejścia w klasie tła. Oba kwaranty opisują zatem przejścia wewnątrzklasowe (w oróżnieniu o kwarantów B oraz C). A C B D Prawopoobieństwa wystąpienia przejścia w ramach poszczególnych kwarantów można opisać równaniami: Metoa entropii lokalnych koncentruje się na kwarantach A oraz D, z którymi można skojarzyć niezależne rozkłay prawopoobieństwa oraz entropię: Entropią lokalną jest suma entropii przejść pomięzy poziomami obiektu (kwarant A) oraz poziomami tła (kwarant D): Natomiast optymalną wartością progu, wartość maksymalizująca tak zefiniowaną entropię: 23

Metoa entropii lokalnej. Przykła a c b Rys. 1. (a), (c) obrazy poawane binaryzacji, (b), () wynik binaryzacji metoą entropii lokalnej. 24

Progowanie z histerezą a b c 2500 2000 1500 1000 500 50 100 150 200 250 Histereza zależność zmiany parametrów (charakteryzujących stan ukłau lub jego właściwości), wywołanej zmianami czynników zewnętrznych, o historii ukłau, tzn. o stanów poprzezających any stan. Progowanie z histerezą stosuje się w przypakach, gy klasy pikseli w histogramie nie są wyraźnie rozseparowane, np. gy granice obiektu w obrazie są rozmazane, niewyraźne. W takim przypaku efiniuje się wa progi: lewy oraz prawy. Wartości leżące poniżej progu lewego efiniują część główną obiektu (jąro obiektu, har core), wartości leżące powyżej progu prawego wyznaczają klasę tła Wartości powyżej progu lewego i poniżej progu prawego są klasyfikowane jako reprezentujące obiekt po warunkiem, że piksel przyjmujący taką wartość sąsiauje w obrazie z pikselem należącym o jąra obiektu. Rys. 1. Przykła progowania z histerezą. Rysunki (a) i (b) obraz oryginalny oraz jego histogram; (c) wynik binaryzacji metoą Otsu (znaleziony próg optymalny t*=86); () wynik progowania z histerezą. 25

a White, Rohrer (1983) b Metoa White a i Rohrer a jest prostą metoą progowania lokalnego, w której wartość progu ustalana jest niezależnie la każego piksela obrazu na postawie wartości śreniej w otoczeniu anego piksela: c gzie B oraz f są opowienio obrazem po binaryzacji oraz obrazem wejściowym, μ jest śrenią z wartości pikseli w kwaratowym oknie, którego śrokiem jest piksel aktualnie analizowany, k jest parametrem. Sugerowaną wartością k jest k=2. e 200 150 Metoa opiera się na założeniu, że piksele znaków (tekst) przyjmują w obrazie wartości użo mniejsze niż piksele otoczenia. Problemem metoy jest truność oboru wartości parametru k opowieniej la szerokiej klasy okumentów. Metoa nie zapewnia opowieniego stopnia aaptacji progu o lokalnej charakterystyki obrazu. Rozmiar okna powinien być obrany zależnie o rozmiaru obiektów zainteresowania w obrazie. 100 50 50 100 150 200 Rys. 1. Binaryzacja metoą White a i Rohrera. (a) obraz oryginalny polegający binaryzacji; rysunki (b) i (c) przestawiają obrazy po binaryzacji z oknem 15x15 oraz współczynnikiem k równym opowienio k=1.0 oraz k=1.2; obraz () efekt binaryzacji z oknem 3x3, k=1.2 (efekt zbyt małego okna); rysunek (e) przekrój przez wiersz 21 obrazu oryginalnego (czerwony) oraz wartości progu la k=1.0 (zielony) i k=1.2 (niebieski). 26

White, Rohrer (1983) ix x xy j x 0 x z kx x x{ i150 150 150 y j 150 140 150 z k150 150 150 { k=1.0 k>1.06 ix x xy j x 255 x z kx x x{ Rys. 1. Przykła binaryzacji hipotetycznego obrazu 3x3 metoą White a-rohrer a la różnych wartości parametru k. 27

White, Rohrer (1983), k=1.0, okno 15x15 28

White, Rohrer (1983), k=1.2, okno 23x23 29

White, Rohrer (1983) k=2.0, okno 23x23 30

Bernsen (1986) Metoa J. Bernsena a: Jena z najprostszych meto progowania lokalnego, która jenocześnie w wielu wypakach jest wystarczająco efektywna. Wartość progu ustalana jest niezależnie la każego piksela obrazu na postawie wartości minimalnej oraz maksymalnej w ustalonym otoczeniu piksela: gzie I min oraz I max są opowienio wartością minimalną i maksymalną w otoczeniu piksela. Jako otoczenie przyjmuje się najczęściej kwaratowe okno o nieparzystym rozmiarze, którego śrokiem jest aktualnie przetwarzany piksel. W przypaku, gy kontrast w obrębie okna jest mniejszy o ustalonego parametru przynależności przetwarzanego piksela o określonej klasy nie ustala się nie na postawie progu T(i,j), ale na postawie wybranego eksperymentalnie progu globalnego, T g. Wielkość okna powinna być obrana eksperymentalnie w zależności o wielkości obiektów w obrazie polegającym progowaniu. 31

Bernsen (1986) a b c Rys. 1. Przykła binaryzacji obrazu tekstu przy wykorzystaniu algorytmu Bernsena. (a) obraz oryginalny; (b), (c), () obrazy po binaryzacji z oknem 15x15 pikseli, ustaloną arbitralnie wartością progu globalnego T g =100 oraz wartością epsilon równą opowienio: 10, 30, 50. W przypaku (b) oraz (c) wartości epsilon są zbyt małe, ając zbyt małą tolerancję zmienności tła. 32

Niblack (1986) a b Metoa W. Niblack a: Jest przykłaem metoy progowania lokalnego. Próg ustalany jest niezależnie la każego piksela obrazu na postawie znajomości śreniej oraz ochylenia stanarowego (wariancji) wartości pikseli z jego otoczenia. Jako otoczenie przyjmuje się najczęściej kwaratowe okno o nieparzystym rozmiarze, którego śrokiem jest piksel aktualnie rozpatrywany. Wartość progu ana jest równaniem: c gzie μ i σ są opowienio wartością śrenią oraz ochyleniem stanarowym wyznaczonym la bloku, natomiast k jest parametrem progowania; k<0. Efektywność binaryzacji z progiem ustalanym w powyższy sposób zależy o rozmiaru okna oraz parametru k. Okno zbyt małe powouje silną wrażliwość na zakłócenia lub niejenoroności w obrazie, co jest szczególnie wioczne w obszarach tła (bez obecności tekstu). Okno zbyt uże powouje niszczenie krawęzi obiektów. Problem ten pojawia się też w przypaku innych meto wykorzystujących śrenią w bloku o ustalenia wartości progu. Problem niejenoroności tła można rozwiązać oejmowania tła (backgroun subtraction). wykorzystując metoę Co się zieje w przypaku, gy wszystkie piksele anego bloku posiaają ientyczną wartość? e Rys. 1. Przykła progowania lokalnego metoą Niblack a. (a) obraz oryginalny; rysunki (b)- () stanowią obrazy zbinaryzowane z oknem kwaratowym opowienio 5x5, 15x15, 41x41 oraz parametrem k=-0.5 (ientyczny la wszystkich przypaków); rysunek (e) efekt binaryzacji z oknem 15x15 oraz k=-1.5 33

Sauvola, Pietikainen (2000) a Metoa progowania Sauvola i Pietikainena jest uważana obecnie za jeną z najlepszych meto binaryzacji obrazów. Wartość progu ustalana jest na postawie śreniej oraz ochylenia stanarowego wartości pikseli w bloku bezpośrenio otaczającym analizowany piksel: b c gzie T(i,j) jest wartością progu la piksela o współrzęnych (i,j), μ(i,j) oraz σ(i,j) są opowienio śrenią oraz ochyleniem stanarowym w otoczeniu piksela (i,j), k>0 jest parametrem zależnym o problemu natomiast R opowiaa maksymalnej wartości ochylenia stanarowego jaka może się pojawić w obrazie (la obrazów o wartościach pikseli [0,255], przyjmuje wartość R=128. W obszarze użego kontrastu metoa zachowuje się barzo poobnie o metoy Niblacka. Różnica pojawia się la obszarów o małym kontraście, tzn. σ<<r, la których następuje wyraźnie obniżenie progu w stosunku o śreniej. Metoa nie naaje się o binaryzacji obrazów w których nie jest spełnione założenie zgonie z którym piksele tekstu przyjmują skrajnie niskie wartości, natomiast piksele tła wartości wysokie. 250 200 150 100 50 e Rys. 1. Binaryzacja metoą Sauvola i Pietikainena. Rysunek (a) obraz oryginalny, rysunki (b)-() wynika binaryzacji z oknem 15x15 oraz wartością parametru k równą, opowienio: 0.2, 0.3, 0.5. Rysunek (e) wartości pikseli w wierszu 125 obrazu oryginalnego (czerwony) wraz z wartościami progu wyznaczonymi metoą Niblacka (niebieski) oraz Sauvola i Pietikainena (zielony). 34 100 200 300 400

Sauvola, Pietikainen vs. Niblack 300 a b c 300 300 250 250 250 200 200 200 150 150 150 100 100 100 50 50 50 50 100 150 200 250 50 100 150 200 250 50 100 150 200 250 200 150 100 50 50 100 150 200 250 Rys. 1. Binaryzacja metoami Niblacka (b) oraz Sauvoli i Pietikainena (c). W obu przypakach okno ma rozmiar 21x21 pikseli. Parametr k przyjmuje wartość k=-0.5 la metoy Niblacka oraz k=+0.5 w przypaku rugiego z algorytmów. Rysunek () przekrój przez wiersz 76 obrazu oryginalnego (czerwony) oraz wartości progu w metozie Niblacka (niebieski) i Sauvoli i Pietikainena (zielony). 35