Filtracja obrazu. Piotr Dalka

Podobne dokumenty
PRAKTYKA PRZETWARZANIA OBRAZU W PROGRAMIE MATLAB

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Przetwarzanie obrazów

Ćwiczenie nr 2 Zbiory rozmyte logika rozmyta Rozmywanie, wnioskowanie, baza reguł, wyostrzanie

PODSTAWY DZIAŁANIA UKŁADÓW CYFROWYCH

ROZWIĄZANIA ZADAŃ Zestaw P3 Odpowiedzi do zadań zamkniętych

Geometria Wykreślna Wykład 3

STA T T A YSTYKA Korelacja

Operacje kontekstowe (filtry)

PRZETWORNIK NAPIĘCIE - CZĘSTOTLIWOŚĆ W UKŁADZIE ILORAZOWYM

Bogusław Jackowski GRAFIKA DYSKRETNA BACHOTEK 1998

KONKURSY MATEMATYCZNE. Treść zadań

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

Podejmowanie decyzji. Piotr Wachowiak

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

W. Guzicki Zadanie 23 z Informatora Maturalnego poziom rozszerzony 1

Odpowiedzi i schematy oceniania Arkusz 23 Zadania zamknięte. Wskazówki do rozwiązania. Iloczyn dwóch liczb ujemnych jest liczbą dodatnią, zatem

MATEMATYKA 9. INSTYTUT MEDICUS Kurs przygotowawczy do matury i rekrutacji na studia medyczne Rok 2017/2018 FUNKCJE WYKŁADNICZE, LOGARYTMY

Zagadnienia transportowe

PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

TEST WIADOMOŚCI: Równania i układy równań

Zakres pomiaru (Ω) Rozdzielczość (Ω) Dokładność pomiaru

Zadania z parametrem

Statystyki opisowe. Marcin Zajenkowski. Marcin Zajenkowski () Statystyki opisowe 1 / 57

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie arkusza kalkulacyjnego EXCEL do rozwiązywania układów równań liniowych metodą wyznacznikową

KARTY PRACY UCZNIA. Twierdzenie Pitagorasa i jego zastosowanie. samodzielnej pracy ucznia. Zawarte w nich treści są ułożone w taki sposób,

Matematyka:Matematyka I - ćwiczenia/granice funkcji

Pomiary napięć i prądów w obwodach prądu stałego

ANALIZA OBRAZU Analiza obrazu poprawy jako ci obrazu, restauracji obrazów kodowania obrazów

EGZAMIN MATURALNY Z MATEMATYKI MAJ 2011 POZIOM ROZSZERZONY. Czas pracy: 180 minut. Liczba punktów do uzyskania: 50 WPISUJE ZDAJĄCY

RZUTOWANIE AKSONOMETRYCZNE

Harmonogramowanie projektów Zarządzanie czasem

Stypendia USOS Stan na semestr zimowy 2013/14

RAPORT z diagnozy Matematyka na starcie

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

Filtracja obrazów w dziedzinie Fouriera

Zadanie I. 2. Gdzie w przestrzeni usytuowane są punkty (w której ćwiartce leży dany punkt):

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

Elementy cyfrowe i układy logiczne

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

WOJEWÓDZKI KONKURS MATEMATYCZNY DLA SZKÓŁ PODSTAWOWYCH W ROKU SZKOLNYM 2012/2013

K P K P R K P R D K P R D W

Trenuj przed sprawdzianem! Matematyka Test 4

Cyfrowe metody przetwarzania obrazu- część 2

LABORATORIUM PODSTAW TELEKOMUNIKACJI

I. LOGICZNE STRUKTURY DRZEWIASTE

Podstawa prawna: Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych (t. j. Dz. U. z 2000r. Nr 54, poz. 654 ze zm.

Kurs wyrównawczy dla kandydatów i studentów UTP

Intellect. Business Intelligence. Biblioteka dokumentów Podręcznik. Business Intelligence od 2Intellect.com Sp. z o.o.

Efektywność nauczania w Gimnazjum w Lutyni

Wały napędowe półosie napędowe przeguby wałów i półosi

Tekst ozdobny i akapitowy

Gruntowy wymiennik ciepła PROVENT- GEO

RAPORT Z 1 BADANIA POZIOMU SATYSFAKCJI KLIENTÓW URZĘDU MIEJSKIEGO W KOLUSZKACH

ALGORYTMY I STRUKTURY DANYCH

ETAP I KONKURSU MATEMATYCZNEGO CONTINUUM

WYRAŻENIA REGULARNE I JĘZYK AWK

Algorytmy graficzne. Podstawy kompresji danych fragment wykładu. Marcin Wilczewski

Korzy ci z du ej pojemno ci pami ci akwizycji w nowoczesnych oscyloskopach

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Wiedza niepewna i wnioskowanie (c.d.)

Bazy danych. Andrzej Łachwa, UJ, /15

Automatyka. Etymologicznie automatyka pochodzi od grec.

Temat: Co to jest optymalizacja? Maksymalizacja objętości naczynia prostopadłościennego za pomocą arkusza kalkulacyjngo.

ZAPYTANIE OFERTOWE. Nazwa zamówienia: Wykonanie usług geodezyjnych podziały nieruchomości

Bioinformatyka Laboratorium, 30h. Michał Bereta

Wyklad 1. Analiza danych za pomocą pakietu SAS. Obiekty i zmienne. Rodzaje zmiennych

Pomiary geofizyczne w otworach

P R O C E D U R Y - ZASADY

Programowanie obrabiarek CNC. Nr H8

Uwarunkowania międzysystemowej kompatybilności elektromagnetycznej standardu IEEE a

Instrukcja obsługi Czujnik refleksyjny O5PG

1. Rozwiązać układ równań { x 2 = 2y 1

Cyfrowe modele powierzchni terenu: przykłady nie tylko z Ziemi

KASA EDUKACYJNA INSTRUKCJA. WARIANT I - dla dzieci młodszych

Filtracja obrazu operacje kontekstowe

Kalkulacyjny układ kosztów

ZASADY REKRUTACJI DO PUBLICZNYCH PRZEDSZKOLI I ODDZIAŁÓW PRZEDSZKOLNYCH W SZKOŁACH PODSTAWOWYCH

2.Prawo zachowania masy

Załącznik nr 2 Testy logiczne służące sprawdzeniu jakości danych uczestników projektów współfinansowanych z EFS

Łączność na polu walki (problem przydziału częstotliwości UKF)

Projekt uchwały do punktu 4 porządku obrad:

Podstawowe działania w rachunku macierzowym

10 RUCH JEDNOSTAJNY PO OKRĘGU

PODSTAWY METROLOGII ĆWICZENIE 4 PRZETWORNIKI AC/CA Międzywydziałowa Szkoła Inżynierii Biomedycznej 2009/2010 SEMESTR 3

7. REZONANS W OBWODACH ELEKTRYCZNYCH

SPRAWDZIANY Z MATEMATYKI

Technologie Informacyjne

Modelowanie obiektów 3D

Estymacja przedziałowa

14P2 POWTÓRKA FIKCYJNY EGZAMIN MATURALNYZ FIZYKI I ASTRONOMII - II POZIOM PODSTAWOWY

Szanowni Rodzice. Niniejsze zasady nie obejmują przedszkoli i szkół podstawowych prowadzonych przez inne podmioty niż Gmina Olsztyn.

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 6, strona 1. Format JPEG

MATERIAŁY DIAGNOSTYCZNE Z MATEMATYKI

Regulamin Projektów Ogólnopolskich i Komitetów Stowarzyszenia ESN Polska

Regulamin rekrutacji do Szkoły Policealnej i do Liceum Ogólnokształcącego dla dorosłych przy ZSR w Grzybnie w roku szkolnym 2016/2017

Transkrypt:

Filtracja obrazu Piotr Dalka

Plan wykładu Przetwarzanie obrazu Wygładzanie obrazu Przekształcenia wykorzystujące pochodne Wykrywanie krawędzi Poprawa jakości obrazów tekstu

Wygładzanie obrazu Stosowane jako wstępny etap analizy obrazu w celu usunięcia zakłóceń Wygładzanie realizowane jest za pomocą filtracji: liniowej filtr jednorodny filtr trójkątny filtr gaussowski nieliniowej filtr medianowy filtr Kuwahary

Filtracja 2D Filtracja 2D przestrzenne przekształcenie obrazu, w którym wartość każdego piksela obrazu wyjściowego jest obliczana na podstawie wartości pikseli w sąsiedztwie odpowiadającego mu piksela w obrazie wejściowym

Filtry liniowe Filtracja liniowa wartość piksela wyjściowego jest liniową kombinacją wartości pikseli w sąsiedztwie piksela wejściowego Filtracja liniowa obliczana jako splot obrazu wejściowego z odpowiednim jądrem Wartość piksela (2,4): 1 8 + 8 1 + 15 6 + 7 3 + 14 5 + 16 7 + 13 4 + 20 9 + 22 2 = 585

Filtr jednorodny Wartość każdego piksela jest wyznaczana jako średnia wartość w jego najbliższym otoczeniu Wagi każdego piksela są identyczne i znormalizowane

Filtr trójkątny Wartość każdego piksela jest wyznaczana jako ważona średnia wartość pikseli w jego najbliższym otoczeniu Powstaje jako splot dwóch filtrów jednorodnych Jego wagi są znormalizowane

Filtr gaussowski Parametrami filtru są wartości funkcji Gaussa Filtr 2D można traktować jako splot dwóch identycznych filtrów 1D (w płaszczyźnie pionowej i poziomej) Przykładowe współczynniki filtru gaussowskiego 5x5 dla s = 1.0

Filtr uśredniający a filtr gaussowski Charakterystyka częstotliwościowa filtru uśredniającego (jednorodnego) oraz filtru gaussowskiego Filtr gaussowski charakteryzuje się monotonicznie malejącą odpowiedzią impulsową (w funkcji częstotliwości) przez co wprowadza znacznie mniejsze zniekształcenia w obrazie, szczególnie na krawędziach obiektów

Filtry nieliniowe Filtr medianowy wartością wyjściową dla każdego piksela jest mediana wartości pikseli w jego sąsiedztwie Filtr Kuwahary wartością wyjściową jest średnia wartość tego z czterech regionów, który charakteryzuje się najmniejszą wariancją Filtry nieliniowe w minimalnym stopniu zniekształcają kształty obiektów (zachowują krawędzie)

Przykładowe wyniki wygładzania

Plan wykładu Przetwarzanie obrazu Wygładzanie obrazu Przekształcenia wykorzystujące pochodne Wykrywanie krawędzi Poprawa jakości obrazów tekstu

Pochodna obrazu Z matematycznego punktu widzenia, obliczenie takiej pochodnej nie jest możliwe (obraz to dyskretna funkcja współrzędnych przestrzennych będących liczbami całkowitymi) Algorytmy obliczania pochodnej stanowią jedynie przybliżenie rzeczywistej pochodnej

Pochodna obrazu Pochodna jest obliczana dla osi poziomej x, pionowej y lub w dowolnym innym kierunku q : W wyniku obliczania pochodnej wzmocnieniu ulegają składowe wysokoczęstotliwościowe obrazu. Dlatego obliczaniu pochodnej zwykle towarzyszy jednoczesne jego wygładzanie

Pochodna obrazu Gradient pochodna pierwszego rzędu: filtr podstawowy filtr Prewitta filtr Sobela gradient z filtrowaniem gaussowskim Laplasjan pochodna drugiego rzędu filtr podstawowy laplasjan laplasjan z filtrowaniem gaussowskim

Gradient (pierwsza pochodna) Filtr podstawowy Filtr Prewitta obliczana jest pochodna w jednym kierunku i jednocześnie dokonywane jest wygładzanie filtrem jednorodnym w drugim kierunku

Gradient (pierwsza pochodna) Filtr Sobela - obliczana jest pochodna w jednym kierunku i jednocześnie dokonywane jest wygładzanie filtrem trójkątnym w drugim kierunku: Gradient z wygładzaniem gaussowskim obliczana jest pochodna z jednoczesnym zastosowaniem filtru gaussowskiego

Gradient (pierwsza pochodna) Gradient wzdłuż osi poziomej Filtr podstawowy Filtr Sobela Z wygładzaniem gaussowskim

Laplasjan (druga pochodna) Filtr podstawowy Laplasjan suma drugich pochodnych obrazu w obu kierunkach

Laplasjan (druga pochodna) Gradient drugiego stopnia z wygładzaniem gaussowskim analogicznie jak dla pierwszej pochodnej Przykładowe wyniki: Laplasjan Z wygładzaniem Gaussowskim

Plan wykładu Przetwarzanie obrazu Wygładzanie obrazu Obliczenie gradientu Wykrywanie krawędzi Poprawa jakości obrazów tekstu

Wykrywanie krawędzi Znalezienie krawędzi w obrazie oznacza przekształcenie obrazu kolorowego lub w odcieniach szarości na obraz binarny, w którym wartości niezerowe odpowiadają krawędziom w obrazie oryginalnym. Oczekuje się, że znalezione krawędzie będą ciągłe i domknięte. Metody wykrywania krawędzi: bazujące bezpośrednio na gradiencie bazujące na analizie przejść przez zero detektor Canny a

Wykrywanie krawędzi bazujące na gradiencie Obliczany jest gradient obrazu, a następnie obraz jest konwertowany na binarny wg obliczonego progu; wartości gradientu powyżej progu traktowane są jako krawędzie obiektu. Próg może być zadany z góry lub wyznaczony na podstawie analizy histogramu, np.

Wykrywanie krawędzi bazujące na gradiencie Metoda jest skuteczna tylko w przypadku wysokokontrastowych obrazów Przykładowy wynik detekcji krawędzi z wykorzystaniem gradientu opartego o filtr Sobela.

Wykrywanie krawędzi bazujące na analizie przejść przez zero Zwykle wykorzystują laplasjan obrazu zmienia on znak w miejscu występowania krawędzi

Wykrywanie krawędzi bazujące na analizie przejść przez zero Przykładowe wyniki algorytmów wykorzystujących analizę przejść przez zero

Detektor krawędzi Canny a Powszechnie stosowany w algorytmach przetwarzania obrazu Nazywany optymalnym detektorem krawędzi Opracowany w taki sposób, aby spełniał trzy warunki: wysoka skuteczność dokładna lokalizacja zminimalizowana szansa uzyskania zduplikowanych krawędzi

Detektor krawędzi Canny a Etapy: 1. Wygładzanie obrazu 2. Wyznaczanie gradientu 3. Tłumienie pikseli nie będących lokalnym maksimum, uwzględniając kierunek gradientu 4. Konwersja obrazu na binarny przy wykorzystaniu dwóch progów i histerezy

Detektor krawędzi Canny a 1. Wygładzanie obrazu Zwykle stosowane jest filtr gaussowski w celu usunięcia szumu i zakłóceń

Detektor krawędzi Canny a 2. Wyznaczanie gradientu Obliczana jest pierwsza pochodna obrazu w osi poziomej G x i pionowej G y (operator Prewitta, Sobela itp.) Dla każdego piksela wyznaczany jest łączny gradient G oraz kierunek gradientu Q:

Detektor krawędzi Canny a 3. Tłumienie pikseli nie będących lokalnym maksimum Każdy kierunek gradientu Q jest zaokrąglany do jednej z czterech wartości (0, 90, 45 i 135) oznaczających cztery możliwe kierunki sąsiedztwa pikseli w obrazie

Detektor krawędzi Canny a 3. Tłumienie pikseli nie będących lokalnym maksimum Dla każdego piksela: gradient G jest zerowany, jeśli jego wartość nie jest maksymalna w porównaniu z gradientami dwóch sąsiednich pikseli leżących na osi prostopadłej do kierunku gradientu

Detektor krawędzi Canny a 4. Konwersja obrazu na binarny Nie jest możliwe wyznaczenie jednej wartości progu na wartość gradientu, która pozwoli dokładnie odseparować krawędzie Stosuje się histerezę i dwa progi T 1 i T 2, T 1 < T 2 na wartość gradientu Piksele o wartości gradientu większej niż T 2 są od razu oznaczane jako krawędź Zaczynając od tych pikseli, krawędzie są śledzone (rysowane) wzdłuż kierunku gradientu tak długo, dopóki wartość gradientu znajduje się powyżej progu T 1

Detektor krawędzi Canny a Algorytm charakteryzuje się dwoma grupami parametrów: dotyczących wygładzania im silniejsze wygładzanie, tym lepsze usuwanie szumu ale jednocześnie większe niebezpieczeństwo nieznalezienia cienkich krawędzi. dotyczących śledzenia krawędzi: progi T 1 i T 2

Poprawa jakości obrazów tekstu Piotr Dalka, Piotr Szczuko

Cel przetwarzania Poprawa jakości obrazów tekstu, np. uzyskanych z kamer cyfrowych w celu rozpoznania algorytmem OCR. JPEG FTPS HTTPS Serwer Filtracja OCR Serwer SMS Text Filtracja Superresolution OCR TTS

Praktyczne przykłady uzyskiwanych obrazów

Filtracja nieliniowa obrazu

OCR: Przetwarzanie wstępne Binaryzacja progowa: Degradacja obrazu w stopniu niedopuszczalnym Alternatywa: lokalne progowanie lokalne adaptacyjne wyrównywanie histogramu poprawia kontrastu

Lokalne adaptacyjne wyrównywanie histogramu

Przykład obrazu Propozycja postępowania: pozostawić tylko elementy wyróżniające się z tła usunąć stałe i wolnozmienne elementy obrazu (gradient tła)

Algorytm wyostrzający Filtracja dolnoprzepustowa uśrednianie: I m 1 k k k x, y I x i y j o, 2 i 0 j 0 Standardowy algorytm wyostrzający: I x, y I x, y A I x, y I x y p o o m, I o obraz oryginalny I m obraz uśredniony, k*k rozmiar maski filtru, np. 3x3 I p obraz przetworzony A współczynnik wyostrzenia

Filtracja wyostrzająca Pasy Macha

Zmodyfikowany algorytm wyostrzający Różnica między pikselem a tłem: I x, y 255 I x, y I x y p m o, Uśredniony obraz - tło Oryginał I m 1 k k k x, y I x i y j o, 2 i 0 j 0 Rozmiar maski k =?

Zmodyfikowany algorytm wyostrzający Maska optymalna Maska zbyt mała

Zmodyfikowany algorytm wyostrzający Rozmiar maski filtru k, jest równy średniej wysokości znaku w obrazie. Estymacja wysokości znaku: Wynik rzutowania obrazu na oś pionową pozbawiany jest trendu liniowego i binaryzowany. Średnia długość ciągu następujących po sobie wartości 0 przyjmowana jest za poszukiwaną wysokość znaku.

Algorytm przetwarzania a) obraz oryginalny b) obraz przefiltrowany c) różnica a-b a) b) c)

Zmodyfikowany algorytm wyostrzający Korekcja jasności krzywą gamma: I I p (x, y) obraz korygowany I c (x, y) obraz po korekcji funkcja korygującą c x, y I x, y p, parametr kształtu krzywej x, x D / x max x D max Rodzina krzywych gamma czynnik normalizujący zmienność funkcji do zakresu <0, D>. Dla obrazów 8-bitowych D=255

Algorytm przetwarzania a) obraz oryginalny b) obraz przefiltrowany c) różnica a-b d) korekcja gamma a) b) c) d)

Zmodyfikowany algorytm wyostrzający Zwykła filtracja medianowa usuwa szum, jednak pozostawia wyraźnie widoczne artefakty kompresji a) b) c) a) fragment obrazu oryginalnego, b) wynik działania algorytmu uwydatnienie artefaktów c) wynik filtracji medianowej

Zmodyfikowany algorytm wyostrzający Filtracja nieliniowa - redukcja szumu i artefaktów kompresji: 1. jeżeli łącznie mniej niż N pikseli przykrytych maską ma jasność mniejszą od progowej, to piksel środkowy uznawany jest za piksel szumowy i wynikiem filtracji jest piksel biały 2. jeżeli łącznie N lub więcej pikseli przykrytych maską ma jasność mniejszą od progowej, to piksel uznawany jest za piksel znaku i wynikiem filtracji jest piksel o jasności piksela środkowego Przykład dla N=2

Zmodyfikowany algorytm wyostrzający a) b) a) fragment obrazu oryginalnego, b) wynik działania algorytmu uwydatnienie artefaktów Przykład filtracji nieliniowej w proponowanym algorytmie usunięcie artefaktów: oryginał N=3 N=2

Algorytm przetwarzania a) obraz oryginalny b) obraz przefiltrowany c) różnica a-b d) korekcja gamma e) filtracja nieliniowa a) b) c) d) e)

Skuteczność Oprogramowanie OCR: ABBYY FineReader 7.0 Professional Edition

Skuteczność rozpoznania znaków Obraz ciemny, jednolicie oświetlony Oryginał 98,9% Wyrównanie histogramu 91,6% Adaptacyjne wyrównanie histogramu 97,1% Korekcja kontrastu 98,9% Proponowany algorytm 99,6%

Skuteczność rozpoznania znaków Obraz ciemny, gradient tła Oryginał 21,4% Wyrównywanie histogramu 68% Adaptacyjne wyrównywanie histogramu 62,4% Korekcja kontrastu 83% Proponowany algorytm 95,9%

Skuteczność rozpoznania znaków Obraz bardzo ciemny, częściowo nieostry Oryginał 0% Wyrównywanie histogramu 82% Adaptacyjne wyrównywanie histogramu 62,2% Korekcja kontrastu 91,9% Proponowany algorytm 94,6%

OCR 1. Wykrywanie linii tekstu 2. Segmentacja tekstu 3. Rozpoznawanie znaków normalizacja rozmiaru porównanie z wzorcem i/lub analiza rzutów

Superresolution a) Oryginał hi-res; b) powiększony obraz o niskiej rozdzielczości; c-i) obrazy zrekonstruowane na podstawie 1,2,4,5,8,12,16 obrazów o niskiej rozdzielczości

Superresolution - Algorytm Irani & Peleg f - poszukiwany obraz wysokiej rozdzielczości poddany: T k - transformacji 2D z f do g k h rozmywaniu odpowiednim filtrem s k przepróbkowaniu (zmianie rozdzielczości) zaszumiony: k - szumem addytywnym daje w rezultacie: g k - k-ty przechwycony obraz Zadanie algorytmu: znaleźć operacje, które z f wyznaczają g i wykonać działanie odwrotne M. Irani, S. Peleg, "Motion Analysis for Image Enhancement: Resolution, Occlusion, and Transparency

Inne problemy Wang Q., Xia T., Li L., Tan C. Document image enhancement using directional wavelet Proc of IEEE CVPR, 2003