Zastosowanie kołowej transformaty Hougha w zadaniu zliczania monet

Podobne dokumenty
Cyfrowe przetwarzanie obrazów i sygnałów Wykład 9 AiR III

Implementacja filtru Canny ego

Przetwarzanie obrazu

ODLEGŁOŚĆ NA PŁASZCZYŹNIE - SPRAWDZIAN

zna wybrane modele kolorów i metody transformacji między nimi zna podstawowe techniki filtracji liniowej, nieliniowej dla obrazów cyfrowych

WYKŁAD 7. Obraz z wykrytymi krawędziami: gdzie 1 - wartość konturu, 0 - wartość tła.

PRZEWODNIK PO PRZEDMIOCIE

Szacowanie wartości monet na obrazach.

Przetwarzanie obrazu

Repetytorium z matematyki ćwiczenia

Zadania do samodzielnego rozwiązania zestaw 11

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Co to jest wektor? Jest to obiekt posiadający: moduł (długość), kierunek wraz ze zwrotem.

ALGEBRA Z GEOMETRIĄ ANALITYCZNĄ zadania z odpowiedziami

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Segmentacja przez detekcje brzegów

Filtracja nieliniowa obrazu

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Dane obrazowe. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Algorytmy Laplacian of Gaussian i Canny ego detekcji krawędzi w procesie analizy satelitarnych obrazów procesów atmosferycznych.

PRZEWODNIK PO PRZEDMIOCIE

Algebra z geometrią analityczną zadania z odpowiedziami

Filtracja obrazu operacje kontekstowe

ALGEBRA LINIOWA Z ELEMENTAMI GEOMETRII ANALITYCZNEJ. 1. Ciała

Prosta i płaszczyzna w przestrzeni

ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II

Geometria w R 3. Iloczyn skalarny wektorów

PRZEWODNIK PO PRZEDMIOCIE

FUNKCJA LINIOWA. Zadanie 1. (1 pkt) Na rysunku przedstawiony jest fragment wykresu pewnej funkcji liniowej y = ax + b.

, h(x) = sin(2x) w przedziale [ 2π, 2π].

Odległośc w układzie współrzędnych. Środek odcinka.

Grafika komputerowa Wykład 4 Geometria przestrzenna

Algebra z geometrią analityczną zadania z odpowiedziami

UZUPEŁNIA ZDAJĄCY miejsce na naklejkę

CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera)

Zakres na egzaminy poprawkowe w r. szk. 2013/14 /nauczyciel M.Tatar/

GRAFIKA KOMPUTEROWA. Plan wykładu. 1. Początki grafiki komputerowej. 2. Grafika komputerowa a dziedziny pokrewne. 3. Omówienie programu przedmiotu

Dwie proste mogą być względem siebie prostopadłe, równoległe albo przecinać się pod kątem innym niż prosty..

DEFINICJE: Punkt, prosta, płaszczyzna i przestrzeń są pojęciami pierwotnymi przyjmowanymi bez definicji,

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

KLUCZ PUNKTOWANIA ODPOWIEDZI

Segmentacja obrazu. Segmentacja obrazu

? 14. Dana jest funkcja. Naszkicuj jej wykres. Dla jakich argumentów funkcja przyjmuje wartości dodatnie? 15. Dana jest funkcja f x 2 a x

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III

AUTOMATYCZNE ROZPOZNAWANIE PUNKTÓW KONTROLNYCH GŁOWY SŁUŻĄCYCH DO 3D MODELOWANIA JEJ ANATOMII I DYNAMIKI

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych

maska 1 maska 2 maska 3 ogólnie

Filtracja obrazu operacje kontekstowe

Lista nr 1 - Liczby zespolone

Automatyka i Robotyka II stopień ogólno akademicki

Komunikacja Człowiek-Komputer

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

Matura próbna 2014 z matematyki-poziom podstawowy

Przekształcenia całkowe. Wykład 1

Transformata Fouriera i analiza spektralna

1 Funkcje dwóch zmiennych podstawowe pojęcia

TO TRZEBA ROZWIĄZAĆ-(I MNÓSTWO INNYCH )

KLUCZ PUNKTOWANIA ODPOWIEDZI

Funkcją sinus kąta α nazywamy stosunek przyprostokątnej leżącej naprzeciw kąta α do przeciwprostokątnej w trójkącie prostokątnym, i opisujemy jako:

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

EGZAMIN MATURALNY Z MATEMATYKI POZIOM PODSTAWOWY 5 MAJA Godzina rozpoczęcia: 9:00. Czas pracy: 170 minut. Liczba punktów do uzyskania: 50

Aerotriangulacja. 1. Aerotriangulacja z niezależnych wiązek. 2. Aerotriangulacja z niezależnych modeli

Grafika komputerowa Wykład 8 Modelowanie obiektów graficznych cz. II

Wykrywanie twarzy ludzkich na kolorowych obrazach ze złożonym tłem

Obraz jako funkcja Przekształcenia geometryczne

Orientacja zewnętrzna pojedynczego zdjęcia

Krzywe stożkowe Lekcja II: Okrąg i jego opis w różnych układach współrzędnych

Rozdział 2. Krzywe stożkowe. 2.1 Elipsa. Krzywe stożkowe są zadane ogólnym równaniem kwadratowym na płaszczyźnie

KARTA PRZEDMIOTU. W5/1;W16/1 W5 Zna podstawowe metody przetwarzania wstępnego EP WM K_W9/3; obrazów barwnych.

Zad. 3: Układ równań liniowych

Matematyka licea ogólnokształcące, technika

Funkcja liniowa -zadania. Funkcja liniowa jest to funkcja postaci y = ax + b dla x R gdzie a, b R oraz

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

2 cos α 4. 2 h) g) tgx. i) ctgx

E-I2G-2008-s1. Informatyka II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)

Kolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w

Interpolacja. Marcin Orchel. Drugi przypadek szczególny to interpolacja trygonometryczna

ALGEBRA z GEOMETRIA, ANALITYCZNA,

Laboratorium Cyfrowego Przetwarzania Obrazów

Arkusz 6. Elementy geometrii analitycznej w przestrzeni

PRZETWARZANIE SYGNAŁÓW

PLAN WYNIKOWY DLA KLASY DRUGIEJ POZIOM PODSTAWOWY I ROZSZERZONY. I. Proste na płaszczyźnie (15 godz.)

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

3. PŁASKI STAN NAPRĘŻENIA I ODKSZTAŁCENIA

Uwaga! Upadek! Opis zadania konkursowego

Funkcja liniowa i prosta podsumowanie

PRÓBNA MATURA ZADANIA PRZYKŁADOWE

Definicja i własności wartości bezwzględnej.

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Przetwarzanie obrazów rastrowych macierzą konwolucji

A,B M! v V ; A + v = B, (1.3) AB = v. (1.4)

Kalibracja kamery. Kalibracja kamery

Blok III: Funkcje elementarne. e) y = 1 3 x. f) y = x. g) y = 2x. h) y = 3x. c) y = 3x + 2. d) y = x 3. c) y = x. d) y = x.

PRÓBNA MATURA ZADANIA PRZYKŁADOWE

na postać kanoniczną, podaj współrzędne wierzchołka paraboli i określ czy jej ramiona są skierowane w górę czy w dół.

Laboratorium Przetwarzania Sygnałów

Transkrypt:

Zbigniew GOMÓŁKA Uniwersytet Rzeszowski, Polska Ewa ŻESŁAWSKA Wyższa Szkoła Informatyki i Zarządzania w Rzeszowie, Polska Zastosowanie kołowej transformaty Hougha w zadaniu zliczania monet Transformata Hougha Transformata Hougha (Hough Transform HT) wykorzystywana jest w wielu dziedzinach nauki. Założeniem HT było wyznaczenie zbioru parametrów, które opisują szukane wzorce, a następnie zastosowanie HT do określających wzorce parametrów. Problem rozpoznawania złożonych wzorców został sprowadzony do przeszukiwania przestrzeni parametrów w celu odnalezienia lokalnych maksimów obrazu. Liniowa transformata Hougha jest najprostszym przypadkiem transformaty wykrywającej linie proste. W przestrzeni obrazu opisuje ją równanie prostej k: 264 y = ax+ b, (1) na której znajdują się dwa wyróżnione punkty: ( x, y ) i (, y ) 1 1 2 2 Wykorzystując zależność: i y i można przedstawić proste dla każdego punktu znajdującego się na prostej w przestrzeni parametrów A, B. Uwzględniając zależności (2), punktom prostej ( x, y ) 1 1 i ( x ) odpowiadają dwie proste w prze-, y 2 2 strzeni parametrów AB, które przecinają się w punkcie (A 0, B 0 ). Natomiast linia jest reprezentowana przez n punktów, które nie muszą leżeć dokładnie na tej prostej. Wykorzystując równanie (2), w przestrzeni parametrów AB będzie n prostych zdefiniowanych przez te punkty, które mogą się x. B = x A +, (2) Rys. 1. Wykres zależności (1) z parametrami opisującymi prostą przecinać w n ( n 1)/ 2 punktach, wówczas należy wybrać taki punkt, który będzie reprezentować prostą z największą liczbą punktów współliniowych na obrazie oryginalnym.

Wobec tego sin ϕ jest stosunkiem prostej leżącej naprzeciw kąta φ do przeciwprostokątnej: r sin ϕ = r = b sin ϕ, (3) b a współczynnik kierunkowy prostej przyjmuje następującą postać: o cosϕ a = tgα, tgα = tg( 90 + ϕ ) = ctg( ϕ), (4) sinϕ co pozwala uzyskać równanie prostej w postaci normalnej: r = x i cosϕ + y sinϕ, (5) gdzie: i = 1, 2,, n (n liczba transformowanych punktów), współrzędnymi punktu, ϕ, r parametry zmienne. i x, y są danymi Uwzględniając powyższe, prostej k będzie odpowiadał jeden punkt na płaszczyźnie parametrów ϕ, r. W wyniku tego równanie (5) wyznacza relację pomiędzy krzywą w przestrzeni parametrów a punktem na obrazie w przypadku, gdy ϕ, r są reprezentowane jako zmienne, a współrzędne x, y jako wartości dane. Punktowi w obrazie odpowiada sinusoida w przestrzeni parametrów. Dyskretna przestrzeń Hougha jest traktowana jako dwuwymiarowa tablica akumulatorów. Według algorytmu Dudy i Harta wyodrębnianie linii prostej, wykorzystując równanie (5), odbywa się dla każdego punktu ( y ) i i ϕ, r, wyznaczając wartość r dla ϕ ( 0, 2π ). x, w przestrzeni parametrów Kołowa transformata Hougha Kołowa transformata Hougha jest oparta na identycznej procedurze jak liniowa transformata Hougha z taką różnicą, że punkt okręgu na płaszczyźnie ( x, y) jest transformowany do 3-wymiarowej tablicy parametrów. Przyjmując równanie okręgu: r ( x a) 2 + ( y ) 2 =, (6) 2 b gdzie: a, b współrzędne środka okręgu, x, y współrzędne krawędzi okręgu, r promień okręgu. Parametryczne równanie okręgu przyjmie postać: x = a + r cos y = b + r sin ( ϕ ), ϕ ( 0, 2π ) ( ϕ ) =. (7) Powyższe zależności (6) i (7) zostały wykorzystane w części symulacyjnej niniejszego artykułu w zadaniu rozpoznawania monet oraz rysowania wykrytych okręgów wzdłuż linii konturowych poszczególnych monet. 265

Zastosowanie kołowej transformaty Hougha w procesie rozpoznawania monet Zakładając, że we współrzędnych obrazowych x, y znajduje się okrąg (znane są punkty jego krawędzi), wówczas każdemu punktowi krawędzi okręgu będzie odpowiadał jeden okrąg w przestrzeni parametrów a, b. Przestrzeń parametrów a, b będzie kumulacją okręgów obrazu źródłowego dla danego promienia r (rys. 2). Najistotniejszym parametrem podczas rozpoznawania okręgu jest jego promień. Decyduje on o wielkości kreślonych okręgów w przestrzeni parametrów a, b. Gdy promień jest mniejszy lub większy od prawidłowego promienia okręgu, narysowane w przestrzeni parametrów a, b okręgi nigdy nie przetną się w jednym punkcie. Prawidłowo dobrany promień spowoduje, że narysowane okręgi będą przecinały się w jednym punkcie, który oznaczał będzie środek okręgu znajdującego się we współrzędnych obrazu. Rys. 2. a) okrąg znajdujący się na płaszczyźnie parametrów x, y, b) transformacja w przestrzeni a, b W przypadku wersji kołowej transformaty dyskretna przestrzeń parametrów [a b r] jest macierzą 3-wymiarową. Detekcja okręgów w obrazie źródłowym sprowadza się do przeszukiwania największej liczby przecięć okręgów. Na rys. 2b przedstawiono przykładową 3-wymiarową dyskretną przestrzeń Hougha. Algorytm zliczania monet w obrazie z wykorzystaniem 3-wymiarowej dyskretnej przestrzeni Hougha W celu zapewnienia stabilizacji wyników zastosowano filtr dolnoprzepustowy Gaussa. Następnie wykonano segmentację przez progowanie według zależności: 266 g ( x y) ( x, y) T I( x, y) ( x, y) T I( x, y) 1 dla I T, =, (8) 0 dla I T gdzie: T=(0,1) próg segmentacji, I(x, y) wartość punktu w obrazie źródłowym, g binarny obraz wyjściowy.

W kolejnym kroku dla każdego punktu ( x, y ) i i nalężącego do krawędzi okręgu wyznaczono okręgi dla danego promienia r j w przestrzeni parametrów według następującej zależności: r ( x a) 2 + ( y ) 2 =, (9) 2 b i i i gdzie: i = 1, 2,, N oraz N liczba transformowanych punktów. Rozpoznawanymi obiektami są monety Narodowego Banku Polskiego, dla których tworzona jest tablica akumulatorowa, gdzie 3-wymiar jest liczbą wszystkich elementów wektora r (liczba pozycji 9), a w rezultacie wyznacza liczbę kształtów rozpoznawanych monet. Poniżej zamieszczono przykładowe wyniki przedstawiające tablice akumulatorowe (w których poszukiwane jest maksimum) Hougha w przestrzeni 3-wymiarowej dla monety o wartości 1gr. Rys. 3. Tablice akumulatorowe dla monety 1gr: a) 60 px, b) 72 px, c) 83 px Wstępna obserwacja potwierdza, że kołowa transformata Hougha może być skutecznym narzędziem do zliczania monet w obrazach. Zastosowana segmentacja ma kluczowy wpływ na skuteczność etapu rozpoznawania. Dlatego w części eksperymentalnej zastosowano konwersję obrazu źródłowego (RGB) do przestrzeni barw HSV. Wykorzystano jedynie składową V, co ogranicza problem nierównomiernego oświetlenia sceny, gdyż dla różnego natężenia oświetlenia wyniki segmentacji obrazu są niejednolite, a przy próbie precyzyjnego dobrania promienia do monety zwracane są różne wartości promieni. Przyjmując rozdzielczość rejestrowanego strumienia 2338 x 1700 px, uzyskano dokładność detekcji pozwalającą na poprawną identyfikację wszystkich analizowanych monet. Ponadto, na etapie wstępnych pomiarów zaobserwowano, że przeszukiwanie tablicy akumulatorowej dla większych rozdzielczości wektora kolejnych promieni poszczególnych monet jest kluczowym utrudnieniem w stosowaniu tej transformaty w czasie rzeczywistym (zarejestrowane czasy to 12 15 s). Rozpoznawanie i zliczanie monet w strumieniu wideo zostało zrealizowane w wersji współbieżnej poprzez kadrowanie monet znajdujących się w poszczególnych ramkach, po czym dla każdej z nich została wykonana transformata Hougha i przeprowadzone zostało przeszukiwanie tablicy akumulatorowej. 267

Aplikacja do rozpoznawania i zliczania monet w obrazie Wykorzystując środowisko MATLAB oraz kołową wersję transformaty Hougha, opracowano aplikację rozpoznającą i zliczającą monety NBP w obrazie statycznym lub w strumieniu wideo. Przeprowadzono obserwacje histogramów dla obrazów w paletach HSV i RGB, dla różnych rozdzielczości kamery i różnych parametrów segmentacji obrazu, detekcji krawędzi i filtracji wygładzającej. W programie została zaprojektowana również opcja pozwalająca na kalibrowanie planu monet oraz w przypadku podniesienia ramienia statywu podtrzymującego kamerę kalibrowanie promieni monet. Zaprojektowany program automatycznie sprawdza dostępność w systemie kamer, pozwalając na przeprowadzenie obliczeń na obrazie statycznym bądź strumieniu wideo po odpowiednim przełączeniu ustawień programu. Po załadowaniu pliku graficznego lub klatki obrazu z kamery do programu możliwe jest wyświetlenie ich histogramu zarówno dla obrazu RGB, jak i HSV. Rys. 4. Wyniki segmentacji i detekcji: a) konturów monet oraz b) wynik działania kołowej wersji transformaty Hougha W wersji eksperymentalnej wprowadzono moduł kalibracji, który pozwala na dobór ustawień stanowiska oraz dobór promieni monet opcja dostępna jest jedynie dla obrazów przechwyconych z kamery. Przeprowadzono szereg testów zaprojektowanej aplikacji, których wyniki przedstawiono na rys. 4. 268 Rys. 5. Kadrowanie sceny oraz kalibracja modułu detekcji monet

Na rys. 5 zamieszczono proces kadrowania sceny oraz kalibracji stanowiska dla obrazu przechwyconego ze strumienia wideo. Podsumowanie Kołowa transformata Hougha jest skutecznym narzędziem w zadaniu rozpoznawania obrazów nawet przy obecności wysokiego poziomu szumi w obrazie związanego np. ze zmieniającymi się warunkami oświetlenia sceny determinującymi skuteczność detekcji krawędzi okręgów. Podczas prób rozpoznania monet na obrazie statycznym, gdy panują zawsze takie same warunki oświetleniowe, np. obraz skanowany, stwierdzono, że transformata bezbłędnie radzi sobie z zadaniem zliczania monet. Monety NBP są zbliżonej wielkości, tzn. 1 gr jest zbliżonej wielkości do 10 gr, 2 gr do 20 gr, 5 gr do 50 gr i 1 zł do 5 zł, co sprawia, że w warunkach zaburzeń oświetlenia spada skuteczność algorytmu zliczania monet. Zapewne wprowadzenie w dalszych wersjach dodatkowego modułu rozpoznającego teksturę poszczególnych monet (awers i rewers) wpłynęłoby stabilizująco na pracę całej aplikacji. Literatura Chmielewski L. (2005): Specification of the Evidence Accumulation-Based Line Detection Algorithm. In Computer Recognition Systems: Proc. Int. Conf. Computer Recognition Systems CORES, Advances in Soft Computing series vol. 30. Cohen M.X. (2014): Analyzing Neural Time Series Data. Theory and Practice, Massachusetts Institute of Technology. Gomółka Z., Twaróg B., Bartman J., Kwiatkowski B. (2011): Improvement of Image Processing by Using Homogeneous Neural Networks with Fractional Derivatives Theorem, AIMS, Discrete and Continuous Dynamical Systems. Klepacz M. (2012): Kołowa transformata Hougha w zadaniu zliczania monet, praca inżynierska. Scharcanski J. (2014): Signal and Image Processing for Biometrics, Springer Verlag. Streszczenie W artykule przedstawiono zagadnienia zastosowania transformaty Hougha w procesie rozpoznawania i zliczania monet Narodowego Banku Polskiego. Wykorzystując środowisko MATLAB oraz zagadnienia dotyczące cyfrowego przetwarzania obrazów i kołową transformatę Hougha, zaprojektowano aplikację do rozpoznania i zliczania monet dla obrazów statycznych oraz przechwyconych ze strumienia wideo. Słowa kluczowe: transformata Hougha, segmentacja, algorytm zliczania monet w obrazie, cyfrowe przetwarzanie obrazów. 269

Implementation of Hough Transform in the Task of Coins Counting Abstract Paper deals with the implementation of circular Hough transform for automated coins counting with the use MATLAB environment. Keywords: circular Hough transform, coins detection and counting, digital image processing. 270