ROZPOZNAWANIE TABLIC REJESTRACYJNYCH POJAZDÓW NA OBRAZACH STATYCZNYCH

Podobne dokumenty
Akademia Górniczo - Hutnicza im. Stanisława Staszica w Krakowie. Projekt. z przedmiotu Analiza i Przetwarzanie Obrazów

Implementacja filtru Canny ego

rozpoznawania odcisków palców

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Algorytmy Laplacian of Gaussian i Canny ego detekcji krawędzi w procesie analizy satelitarnych obrazów procesów atmosferycznych.

Odciski palców ekstrakcja cech

Wyższa Szkoła Informatyki Stosowanej i Zarządzania

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Detekcja punktów zainteresowania

CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu

Filtracja obrazu operacje kontekstowe

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Proste metody przetwarzania obrazu

Podstawy programowanie systemów wizyjnych InSight firmy Cognex. Środowisku InSight Explorer / Spreadshee

AUTOMATYCZNE ROZPOZNAWANIE PUNKTÓW KONTROLNYCH GŁOWY SŁUŻĄCYCH DO 3D MODELOWANIA JEJ ANATOMII I DYNAMIKI

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Analiza obrazów. Segmentacja i indeksacja obiektów

Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów

Detekcja twarzy w obrazie

Rozpoznawanie Twarzy i Systemy Biometryczne

Analiza i przetwarzanie obrazo w

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Ćwiczenie 6. Transformacje skali szarości obrazów

Ćwiczenia z grafiki komputerowej 5 FILTRY. Miłosz Michalski. Institute of Physics Nicolaus Copernicus University. Październik 2015

Cyfrowe Przetwarzanie Obrazów i Sygnałów

Detekcja kodów kreskowych w obrazach za pomocą filtrów gradientowych i transformacji morfologicznych

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Segmentacja obrazów cyfrowych z zastosowaniem teorii grafów - wstęp. autor: Łukasz Chlebda

ALGORYTMY PRZETWARZANIA OBRAZÓW Projekt. Aplikacja przetwarzająca obrazy z możliwością eksportu i importu do programu MS Excel.

Analiza obrazów - sprawozdanie nr 2

Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki.

dr inż. Tomasz Krzeszowski

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Wyższa Szkoła Informatyki Stosowanej i Zarządzania

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

CECHY BIOMETRYCZNE: ODCISK PALCA

Zbigniew Sołtys - Komputerowa Analiza Obrazu Mikroskopowego 2016 część 7

Diagnostyka obrazowa

W tym celu korzystam z programu do grafiki wektorowej Inkscape 0.46.

Raport. Bartosz Paprzycki UMK 2009/2010

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

POBR Projekt. 1 Cel projektu. 2 Realizacja. 3 Zastosowany algorytm. Celem projektu było rozpoznanie logo firmy Sun Microsystems.

Filtracja obrazu operacje kontekstowe

Cyfrowe Przetwarzanie Obrazów i Sygnałów

Analiza i przetwarzanie obrazów

Przetwarzanie obrazu

Diagnostyka obrazowa

Polcode Code Contest PHP-10.09

Analiza obrazów - sprawozdanie nr 3

Elementy modelowania matematycznego

Przetwarzanie obrazów rastrowych macierzą konwolucji

POPRAWIANIE JAKOŚCI OBRAZU W DZIEDZINIE PRZESTRZENNEJ (spatial image enhancement)

Szacowanie wartości monet na obrazach.

Segmentacja przez detekcje brzegów

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 8. Filtracja uśredniająca i statystyczna.

Filtracja liniowa (metody konwolucyjne, tzn. uwzględniające pewne otoczenie przetwarzanego piksla):

Gimp Grafika rastrowa (konwersatorium)

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

Przewodnik użytkownika (instrukcja) AutoMagicTest

Komputerowe przetwarzanie obrazu Laboratorium 5

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Projekt rejestratora obiektów trójwymiarowych na bazie frezarki CNC. The project of the scanner for three-dimensional objects based on the CNC

WYKORZYSTANIE ALGORYTMÓW ROZPOZNAWANIA OBRAZU W BADANIACH NAUKOWYCH NA PRZYKŁADZIE PROGRAMU ZIEMNIAK-99

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. dr inż. Adam Piórkowski. Jakub Osiadacz Marcin Wróbel

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 10 AiR III

Przetwarzanie obrazu

Zastosowanie Informatyki w Medycynie

Pattern Classification

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

1- Touch Laser Photo

KATEDRA MECHANIKI I PODSTAW KONSTRUKCJI MASZYN. Instrukcja do ćwiczeń laboratoryjnych z elementów analizy obrazów

Przetwarzanie obrazów wykład 4

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

AUTOMATYCZNA AKTUALIZACJA BAZY DANYCH O BUDYNKACH W OPARCIU O WYSOKOROZDZIELCZĄ ORTOFOTOMAPĘ SATELITARNĄ

POB Odpowiedzi na pytania

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

Grafika komputerowa. Zajęcia IX

Wykład 8. Testowanie w JEE 5.0 (1) Autor: Zofia Kruczkiewicz. Zofia Kruczkiewicz

Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP

Wizja maszynowa w robotyce i automatyzacji Kod przedmiotu

Wykrywanie twarzy ludzkich na kolorowych obrazach ze złożonym tłem

Analiza i Przetwarzanie Obrazów

dr inż. Jarosław Forenc

Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Obliczenia iteracyjne

BADANIA SYMULACYJNE PROCESU HAMOWANIA SAMOCHODU OSOBOWEGO W PROGRAMIE PC-CRASH

Przekształcenia kontekstowe. Filtry nieliniowe Typowy przykład usuwania zakłóceń z obrazu

Przekształcenia punktowe

Adrian Horzyk

Aerotriangulacja. 1. Aerotriangulacja z niezależnych wiązek. 2. Aerotriangulacja z niezależnych modeli

Przetwarzanie obrazów wykład 2

Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa).

Procesy ETL. 10maja2009. Paweł Szołtysek

Transkrypt:

Radosław KAMIŃSKI, Irena BUŁATOWA ROZPOZNAWANIE TABLIC REJESTRACYJNYCH POJAZDÓW NA OBRAZACH STATYCZNYCH W artykule omówione zostały algorytmy detekcji i rozpoznawania tablic rejestracyjnych pojazdów na obrazach statycznych. Algorytmy te odgrywają kluczową rolę w systemach automatycznego rozpoznawania tablic rejestracyjnych stosowanych w ramach inteligentnych systemów transportowych, które w znacznym stopniu przyczyniają się do poprawy bezpieczeństwa na drogach. Przedstawione zostały modyfikacje znanych algorytmów lokalizacji tablic rejestracyjnych na zdjęciach pojazdów. Przeprowadzone badania zaproponowanych algorytmów pokazały, że modyfikacje wprowadzone na etapie lokalizacji tablicy rejestracyjnej, obejmujące między innymi wstępne przetwarzanie obrazu oraz selekcję i weryfikację regionów kandydujących, zwiększają efektywność algorytmów automatycznego rozpoznawania tablic. WSTĘP Systemy automatycznego rozpoznawania tablic rejestracyjnych (ARTR) stosowane są w ramach funkcjonowania inteligentnych systemów transportowych (ang. Intelligent Transportation Systems). Ich głównym zadaniem jest zwiększenie efektywności transportu drogowego oraz poprawa bezpieczeństwa. Systemy automatycznego rozpoznawania tablic rejestracyjnych na co dzień wykorzystywane są do wykrywania wykroczeń drogowych. Możliwość identyfikacji przejeżdżającego pojazdu w czasie rzeczywistym jest podstawą do działania odcinkowego pomiaru prędkości. Rozpoznawanie tablic wykorzystywane jest też w systemach wykrywających wjazd na skrzyżowanie na czerwonym świetle, nieprawidłowe wyprzedzanie czy przekroczenie ciągłych linii. Systemy ARTR pomagają także wykrywać skradzione lub poszukiwane pojazdy lub zbierać statystyki drogowe. Kolejną możliwością zastosowania ARTR jest ograniczenie dostępu do pewnych obszarów (np. zamkniętych osiedli mieszkaniowych), identyfikacja pojazdów w systemach parkingowych oraz elektronicznych systemach poboru opłat wdrażanych na autostradach i drogach ekspresowych. 1. ROZPOZNAWANIE TABLIC REJESTRACYJNYCH Proces rozpoznawania tablic rejestracyjnych składa się z trzech występujących po sobie etapów: 1. Lokalizacja tablicy rejestracyjnej. 2. Segmentacja znaków. 3. Rozpoznawanie znaków. Lokalizacja tablicy rejestracyjnej jest najważniejszym, a zarazem najtrudniejszym elementem całego procesu. Tablica może znajdować się w dowolnym miejscu na obrazie wejściowym, warunki oświetleniowe obrazu mogą się różnić, a jego tło zawiera często obiekty charakteryzujące się dużą liczbą szczegółów. Powyższe czynniki sprzyjają powstawaniu błędów podczas lokalizacji tablicy, które mogą uniemożliwić późniejszą segmentację i prawidłowe rozpoznanie znaków. W obecnie stosowanych algorytmach wykrywania tablic wyznaczenie pozycji tablicy możliwe jest dzięki zastosowaniu technik takich jak operacje morfologiczne, wykrywanie krawędzi, progowanie adaptacyjne czy kwantyzacja wektorowa [5, 13]. Algorytm lokalizacji tablic wykorzystujący wykrywanie krawędzi [4,6,7] zlicza liczbę zmian jasności w każdym wierszu obrazu, a następnie wybiera sąsiadujące ze sobą wiersze charakteryzujące się największą liczbą zmian. Do wykrywania krawędzi stosuje się filtry środkowoprzepustowe. W kolejnym kroku algorytm wykonywany jest na kolumnach, co umożliwia wyznaczenie pionowych granic tablicy rejestracyjnej. Algorytm może wykryć wiele obszarów jako prawdopodobne miejsce występowania tablicy, w takich przypadkach ostatecznego wyboru położenia tablicy dokonuje się łącząc obszary położone blisko siebie oraz stosując analizę rozmiarów i proporcji wykrytych obszarów [4]. Metoda lokalizacji oparta na operacjach morfologicznych [15,18] korzysta z otwarcia i zamknięcia morfologicznego z użyciem różnych elementów strukturalnych w celu eliminacji jak największej liczby obszarów niezawierających tablicy oraz uwydatnienia obszarów, w których tablica może wystąpić. Algorytm składa się z trzech kroków: ekstrakcja tablicy, wybór regionów kandydujących oraz walidacja obszaru tablicy. Procedura ekstrakcji tablicy rozpoczyna się od przedstawienia obrazu wejściowego w skali szarości. Następnie wykonywana jest pierwsza operacja otwarcia morfologicznego z element strukturalnym w postaci macierzy o wymiarach 4x30 wypełnionej jedynkami. Kolejnym krokiem jest obliczenie różnicy obrazów w celu uwydatnienia obszaru tablicy: od obrazu w skali szarości odejmowany jest obraz otrzymany po zastosowaniu operacji otwarcia. Nowo powstały obraz należy poddać binaryzacji. Ostateczna lokalizacja tablicy rejestracyjnej możliwa jest po przeprowadzeniu selekcji regionów kandydujących oraz walidacji znalezionych obszarów. Lokalizacja tablicy rejestracyjnej na obrazie może zostać przeprowadzona z wykorzystaniem algorytmu progowania adaptacyjnego [1]. Głównym założeniem tej metody jest znalezienie odpowiedniego progu, przy którym obraz po binaryzacji będzie zawierać dane tablicy rejestracyjnej, a jego tło składać się będzie w większości z jednolitych białych lub czarnych obszarów. Z uwagi na różne warunki oświetleniowe obrazów wejściowych, próg binaryzacji nie może mieć stałej wartości algorytm poszukuje jej w kolejnych iteracjach. Algorytm do poprawnego działania wymaga wstępnego określenia niektórych parametrów przetwarzanego obrazu wejściowego są to wymiary obrazu, minimalna i maksymalna szerokość tablicy na obrazie oraz minimalna i maksymalna wysokość tablicy [1]. 242 AUTOBUSY 12/2016

Kolejnym krokiem wykonywanym w celu rozpoznania tablicy rejestracyjnej jest segmentacja znaków. Etap ten polega na wyodrębnieniu poszczególnych znaków tablicy znajdujących się na wyznaczonym wcześniej obszarze obrazu. Segmentację znaków można przeprowadzić wykorzystując np. poziomy rzut jasności [11]. Innym podejściem może być też zastosowanie metody elementów połączonych (ang. connected components) lub analizy skupień (ang. clustering analysis method) [3, 12, 17]. Niepoprawnie wykonana segmentacja znaków (np. dwa znaki połączone w jeden lub jeden znak rozbity na kilka części) spowoduje, że wykryte znaki nie zostaną później poprawnie rozpoznane [8]. Ostatnim etapem wchodzącym w skład procesu rozpoznawania tablic rejestracyjnych jest rozpoznawanie znaków. Do realizacji tego zadania wykorzystuje się najczęściej algorytmy OCR (Optical Character Recognition). Zastosowanie znajdują tu również sztuczne sieci neuronowe [2], które charakteryzują się wysoką szybkością działania, możliwością przetwarzania równoległego oraz posiadają zdolność uogólniania. Nieco rzadziej przeprowadza się identyfikację znaków tablicy z wykorzystaniem informacji o ich budowie na podstawie cech charakterystycznych znaku (np. liczba punktów przecięć znaku w pionie i poziomie, ilość miejsc styczności znaku z granicami badanego obszaru czy odległości znaku od krawędzi obszaru) podejmowana jest decyzja o jednoznacznej klasyfikacji litery lub cyfry [9,10,14,16]. 2. ALGORYTMY DETEKCJI TABLIC REJESTRACYJNYCH 2.1. Lokalizacja tablicy za pomocą analizy krawędzi Pierwszy z zaproponowanych algorytmów lokalizacji tablicy rejestracyjnej wykorzystuje metodę wykrywania i analizowania krawędzi występujących na obrazie. W porównaniu do algorytmu oryginalnego [4], zmodyfikowano proces wstępnego przetwarzania obrazu oraz zaproponowano nowy sposób wyznaczania pionowych granic tablicy. Detekcję krawędzi przeprowadzono z wykorzystaniem operatora Canny ego. Schemat blokowy algorytmu lokalizacji tablicy przedstawiono na Rys.1. stawał się nieczytelny. W porównaniu z oryginalną wersją algorytmu, do etapu przetwarzania wstępnego wprowadzono dwa dodatkowe przekształcenia obrazu. Pierwszym z nich jest zastosowanie filtra medianowego z maską o wymiarach 3 na 3. Operacja ta ma na celu usunięcie z obrazu wszelkich zakłóceń w postaci szumów. Dodatkową zaletą tego filtra jest fakt, że nie powoduje on utraty informacji o krawędziach obiektów. Bitmapa uzyskana w wyniku filtracji poddawana jest też procedurze wyrównania histogramu. Etap ten wprowadzono w celu poprawy kontrastu obrazu. Ostatni krok procesu przetwarzania to transformacja obrazu z modelu RGB do skali szarości. Zastosowanie filtracji medianowej oraz wyrównania histogramu spowodowało, że obszar zawierający tablicę rejestracyjną jest bardzo dobrze widoczny, a szumy i inne zakłócenia zostały usunięte. Przed przystąpieniem do lokalizacji tablicy rejestracyjnej należy wykryć krawędzie znajdujące się na obrazie. W tym celu zastosować można np. operator Sobel a lub detektor Canny ego [5]. Operator Sobel a oblicza splot macierzy obrazu wejściowego z macierzą kierunkową o wymiarach 3 na 3. Operator Canny ego to złożony algorytm, którego celem jest wykonanie optymalnej detekcji krawędzi, tak że wszystkie zlokalizowane krawędzie leżą jak najbliżej krawędzi rzeczywistych, każda krawędź oznaczona jest tylko raz, a zakłócenia obrazu nie mają wpływu na powstawanie fałszywych krawędzi. Zastosowanie operatorów Sobel a i Canny ego porównano na Rys. 2. Widać wyraźnie, że metoda Sobel a wykrywa większą liczbę krawędzi. Są one jednak dość grube i jasne, dodatkowo występują też w miejscach należących do tła obrazu, co może źle wpływać na późniejszą lokalizację tablicy rejestracyjnej. Przy zastosowaniu operatora Canny ego część krawędzi została pominięta, natomiast krawędzie w miejscu występowania tablicy są bardzo dobrze widoczne dlatego też właśnie ta metoda została zaimplementowana w algorytmie lokalizacji tablicy. Rys. 2. Porównanie operatorów detekcji krawędzi Sobel a (po lewej) i Canny ego (po prawej) Rys. 1. Schemat blokowy algorytmu lokalizacji tablicy Przed przystąpieniem do wykonania głównej części algorytmu, obraz wejściowy musi zostać poddany procesowi przetwarzania wstępnego. Zdjęcie pojazdu w formacie JPEG wczytywane jest do pamięci w postaci mapy bitowej, a następnie zmniejszane do wymiaru 768 na 288 pikseli. Wartości te zostały dobrane eksperymentalnie. Duże wymiary obrazu powodowały znaczne wydłużenie czasu wykonywanych na nim operacji, natomiast obraz zbyt mały Określenie granic tablicy rejestracyjnej możliwe jest, dzięki analizie wykrytych krawędzi. Na początku przeprowadzana jest detekcja poziomych granic tablicy. Na tym etapie algorytm ma za zadanie wyznaczyć wszystkie obszary, które mogą zawierać tablicę rejestracyjną. Szczegółowy schemat tej procedury przedstawiono na Rys. 3. Algorytm rozpoczyna się od obliczenia zmian jasności w każdym wierszu obrazu. Wynik tej operacji przechowywany jest w tablicy o rozmiarze równym liczbie wierszy obrazu. Bardzo duże wartości pojawiające się w pojedynczych wierszach tablicy mogą świadczyć o występowaniu długich krawędzi poziomych. Aby wyeliminować tę sytuację, wartości w wektorze poddawane są działaniu filtra medianowego (analizowany jest aktualny wiersz wraz z dwoma otaczającymi sąsiadami, następnie z tych wartości wybierana jest mediana). Procedura obliczenia górnej i dolnej granicy tablicy rejestracyjnej przebiega w następujący sposób: 1. Algorytm wyszukuje wiersz o największej liczbie zmian jasności pikseli. Indeks wiersza oraz znaleziona wartość maksymalna zapisywane są do zmiennych maxindex i max. Jeżeli jest to pierwsza iteracja, wartość maksymalna max zapisywana jest dodatkowo w zmiennej stopmax. 12/2016 AUTOBUSY 243

2. Algorytm analizuje wiersze położone poniżej oraz powyżej wiersza o indeksie maxindex. Jeżeli liczba zmian jasności pikseli spadnie poniżej 45% wartości max, indeks aktualnie przetwarzanego wiersza traktowany jest jako górna lub dolna granica tablicy rejestracyjnej. 3. Algorytm sprawdza, czy wysokość znalezionego obszaru mieści się w ustalonym przedziale. Region spełniający ten warunek traktowany jest jako prawdopodobna lokalizacja tablicy. 4. Algorytm powraca do kroku pierwszego. Jeżeli liczba zmian jasności w znalezionym wierszu jest mniejsza od 25% wartości stopmax, algorytm kończy działanie. Rys. 4. Algorytm lokalizacji tablicy za pomocą operacji morfologicznych Przed przystąpieniem do detekcji tablicy rejestracyjnej, obraz wejściowy należy przetworzyć. Zdjęcie w formacie JPEG wczytywane jest do mapy bitowej, a następnie zmniejszane do wymiarów 768 na 288 pikseli. Tak powstały obraz transformowany jest do skali szarości (Rys. 5a). Właściwy algorytm rozpoczyna się od wykonania operacji otwarcia morfologicznego, której zadaniem jest usunięcie szumów i wygładzenie obrazu. Bardzo ważny jest odpowiedni wybór elementu strukturalnego. Rozmiar elementu dobrano eksperymentalnie najlepsze wyniki uzyskano stosując prostokąt o wymiarach 4 na 25 (Rys. 5b). Rys. 3. Procedura lokalizacji górnej i dolnej granicy tablicy rejestracyjnej Procedurę lokalizacji pionowych granic tablicy rejestracyjnej należy przeprowadzić na każdym ze znalezionych obszarów kandydujących. Oryginalny algorytm [4] określa granice na podstawie spadku liczby zmian jasności w analizowanej kolumnie obrazu poniżej pewnego progu. W niektórych przypadkach, w miejscach występowania przerw między znakami tablicy, wartość ta była bliska zeru. Sytuacja ta powodowała błędne działanie algorytmu, polegające na obcięciu części znaków. W celu rozwiązania tego problemu zaproponowano własne podejście, które określa granice tablicy za pomocą wartości średniej obliczonej na podstawie zmian jasności w aktualnie analizowanej kolumnie oraz jej sąsiadach. Liczba analizowanych sąsiadów jest parametrem algorytmu i może ulec zmianie w zależności od rozmiarów przetwarzanego obrazu. Uzyskane wartości zmian jasności poddawane są filtracji medianowej i analizowane są średnie wartości w kolumnach sąsiadujących. Ostatecznie sprawdzane jest, czy szerokość wyznaczonego obszaru oraz stosunek jego szerokości do wysokości mieszczą się w przedziałach właściwych dla tablicy rejestracyjnej. 2.2. Lokalizacja tablic za pomocą operacji morfologicznych Drugi algorytm lokalizacji tablicy wykrywa numery rejestracyjne za pomocą przekształceń morfologicznych wykonywanych na obrazie [18]. Schemat działania tej metody przedstawiono na Rys. 4. W algorytmie zmodyfikowano używane elementy strukturalne, zmieniono sposób progowania obrazu oraz zaproponowano nowe kryterium ostatecznego wyboru pozycji tablicy. Rys. 5. Przekształcenia obrazu w poszczególnych etapach algorytmu Kolejny krok to obliczenie różnicy obrazów (od obrazu w skali szarości odejmowany jest obraz otrzymany w wyniku operacji otwarcia Rys. 5c) oraz przeprowadzenie progowania (Rys. 5d). W oryginalnym algorytmie [18] autor przedstawił metodę obliczania odpowiedniego progu. Sposób ten okazał się jednak źródłem problemów w przypadku niektórych obrazów testowych wyznaczony próg był zbyt niski, co skutkowało utratą części informacji zawartej w tablicy rejestracyjnej. Po przetestowaniu kilku metod progowania 244 AUTOBUSY 12/2016

(stała wartość progu, metoda iteracyjna, metoda Otsu) binaryzację obrazu przeprowadzono za pomocą algorytmu Otsu, dzięki któremu uzyskano najlepsze rezultaty. Obraz otrzymany po binaryzacji może zawierać niechciane informacje (np. fragmenty obiektów tła), które należy usunąć. W tym celu wykonywane są dwa dodatkowe przekształcenia otwarcie oraz zamknięcie (Rys. 5e i Rys. 5f). Do ich przeprowadzenia wykorzystano elementy strukturalne o wymiarach 5 na 5 oraz 5 na 15. Rozmiary elementów dobierano metodą prób i błędów. Niewłaściwe wymiary powodowały obcięcie obszaru tablicy lub jego rozszerzenie na sąsiednie obiekty, co uniemożliwiało określenie prawidłowej pozycji tablicy. Białe obszary widoczne na Rys. 5f to potencjalne miejsca występowania tablicy rejestracyjnej. Prawidłową pozycję tablicy wyznacza obszar spełniający odpowiednie kryteria musi być to prostokąt, którego wymiary oraz stosunek długości do szerokości mieszczą się w określonym przedziale. Podczas wykonywania algorytmu na obrazach o złożonym tle, zawierającym dużą liczbę krawędzi, może zdarzyć się, że więcej niż jeden prostokąt spełnia wymagane kryteria. Zaproponowane rozwiązanie tego problemu wykorzystuje fakt, że tablica rejestracyjna występuje najczęściej na środku dolnej części obrazu. Region o najmniejszej odległości od środka i dolnej krawędzi obrazu traktowany jest jako właściwa lokalizacja tablicy rejestracyjnej. Na podstawie współrzędnych wybranego regionu, tablica rejestracyjna wycinana jest z obrazu źródłowego. 3. SEGMENTACJA I ROZPOZNAWANIE ZNAKÓW Obszar tablicy rejestracyjnej, wyznaczony za pomocą jednego z zaimplementowanych algorytmów lokalizacji, należy poddać rozpoznawaniu. Proces ten rozpoczyna się od segmentacji znaków, która ma na celu określenie granic poszczególnych znaków tworzących tablicę oraz odrzucenie wszystkich niepożądanych elementów (np. fragmentów ramki montażowej tablicy). Metodę ekstrakcji i rozpoznawania znaków opracowano z wykorzystaniem algorytmu komponentów połączonych [3,12,17] oraz biblioteki Tesseract OCR. W celu zwiększenia dokładności rozpoznawana, wprowadzono dodatkowy etap skalowania znaków. Schemat wdrożonego rozwiązania przedstawia Rys. 6. Rys. 6. Proces segmentacji i rozpoznawania znaków Współrzędne tablicy wyznaczone w procesie lokalizacji wykorzystywane są do wycięcia obszaru tablicy z obrazu źródłowego. Otrzymana bitmapa transformowana jest z modelu RGB do skali szarości oraz poddawana binaryzacji. Do przeprowadzenia tej operacji wybrano algorytm Otsu. Kolejny krok procesu segmentacji polega na wyszukiwaniu grup pikseli tworzących poszczególne znaki tablicy. Połączenie pikseli analizowane jest w sąsiedztwie ośmiospójnym. Oprócz numerów rejestracyjnych, na tablicy widoczne mogą być np. śruby, naklejka legalizacyjna czy fragmenty ramki montażowej. Aby odrzucić takie obszary, algorytm sprawdza każdą grupę pikseli pod kątem następujących kryteriów: minimalna i maksymalna szerokość znaku, minimalna i maksymalna wysokość znaku, stosunek wysokości do szerokości znaku. Dopuszczalne wartości dobiera się w zależności od rozmiarów przetwarzanego obrazu. Rozpoznawanie poszczególnych znaków zrealizowano z wykorzystaniem biblioteki Tesseract OCR 3.04. Jest to wydajny silnik OCR udostępniany na licencji open source, który umożliwia rozpoznawanie całych tekstów lub pojedynczych znaków zawartych w plikach graficznych. W niektórych przypadkach, bitmapy o zbyt małych wymiarach powodowały błędne działanie algorytmu. W celu rozwiązania tego problemu wprowadzono dodatkowy etap skalowania znaków. Każdy z obrazów otrzymanych w procesie segmentacji skalowany jest do wymiarów 15 na 30 pikseli, a następnie nakładany na biały prostokąt o wymiarach 25 na 40 pikseli. Tak przygotowane bitmapy analizowane są przez algorytm OCR. Zaproponowane rozwiązanie pozwoliło zwiększyć dokładność rozpoznawania i zapobiec powstawaniu błędów. 4. WYNIKI BADAŃ ZAIMPLEMENTOWANYCH ALGORYTMÓW Badania zaimplementowanych algorytmów lokalizacji i rozpoznawania tablic przeprowadzono z wykorzystaniem stworzonej aplikacji testowej. Program uruchomiono na komputerze przenośnym MSI GE600 o następującej specyfikacji sprzętowej: dwurdzeniowy procesor Intel Core i5 460M (2.53 GHz, 3MB cache), pamięć RAM 2 x 2GB DDR3, karta graficzna ATI Radeon HD5730 / 1GB DDR3. Aplikacja pracowała pod kontrolą systemu Microsoft Windows 8.1 w wersji 64-bitowej z zainstalowanymi bibliotekami.net Framework 4.6.1. Zbiór zdjęć stanowiących dane wejściowe wykonano za pomocą aparatu cyfrowego wbudowanego w smartfon Huawei P8 Lite. Rozdzielczość wykonanych fotografii wynosiła 4160 na 2336 pikseli (10 Mpx). Obrazy podzielono na dwie kategorii: zdjęcia z prostym tłem oraz zdjęcia ze złożonym tłem, zawierającym dużą liczbę krawędzi. Do badań wybrano algorytm wykorzystujący wykrywanie krawędzi w wersji oryginalnej [4] oraz jego zmodyfikowaną wersję, a także zmodyfikowany algorytm bazujący na operacjach morfologicznych. Tablicę rejestracyjną traktowano jako w pełni rozpoznaną, jeżeli każdy z wykonywanych etapów (lokalizacja, segmentacja, rozpoznawanie znaków) zakończył się i zwrócił prawidłowe rezultaty. Lokalizację tablicy zaliczano do poprawnych tylko wtedy, gdy wyznaczony obszar obejmował całą tablicę rejestracyjną, bez dodatkowych elementów otoczenia. Etapy segmentacji i rozpoznawania znaków uznawano za pomyślnie zakończone, gdy wszystkie znaki zostały prawidłowo wyodrębnione i rozpoznane. Ponieważ w procesie automatycznego rozpoznawania tablic najbardziej czasochłonnym etapem jest jej detekcja na obrazie wejściowym, zmierzono i porównano czasy pracy każdego z badanych algorytmów lokalizacji tablicy rejestracyjnej. Pierwszą grupę badanych obrazów stanowiły pojazdy sfotografowane z bliskiej odległości w korzystnych warunkach oświetleniowych. Zdjęcia wykonano w taki sposób, aby tło zawierało jak najmniejszą ilość obiektów, które po przetworzeniu obrazu powodują 12/2016 AUTOBUSY 245

powstawanie krawędzi. Wyniki badań algorytmów dla zdjęć z prostym tłem przedstawiono w Tab. 1. Tab. 1. Wyniki rozpoznawania tablic na zdjęciach z prostym tłem Algorytm Liczba zdjęć Tablice rozpoznanznanych tablic Procent rozpo- algorytm oryginalny 20 15 75% 20 20 100% Operacje morfologiczne, 20 20 100% Stosując oryginalny algorytm wykorzystujący wykrywanie krawędzi w pełni poprawnie udało się rozpoznać 15 tablic, co stanowi 75% wszystkich badanych obrazów. Zmodyfikowany algorytm analizy krawędzi pozwolił poprawnie wykryć i rozpoznać tablicę rejestracyjną na każdym z analizowanych obrazów wejściowych. Dzięki zastosowaniu filtracji, wyrównaniu histogramu oraz wprowadzeniu nowego sposobu wykrywania pionowych granic tablicy, zmodyfikowany algorytm poradził sobie znacznie lepiej niż jego oryginalna wersja. Podobnie dobrze poradził sobie algorytm z wykorzystaniem operacji morfologicznych, na wszystkich obrazach poprawnie wykryto i rozpoznano tablicę rejestracyjną. Bardzo ważnym czynnikiem wpływającym na działanie badanego algorytmu są rozmiary zastosowanych elementów strukturalnych. W danej grupie obrazów 100% poprawności wyników uzyskano po pierwszym uruchomieniu algorytmu początkowo dobrane domyślne rozmiary elementów nie wymagały modyfikacji. Czasy lokalizacji tablicy za pomocą badanych algorytmów przedstawia Rys. 7. Średni czas przetwarzania dla algorytmu wykrywania krawędzi bez modyfikacji wynosił 0,430s. Algorytm zmodyfikowany pracował średnio o 0.037s dłużej. Średni czas pracy algorytmu opartego na operacjach morfologicznych to 0.307s. Był to najszybszy z badanych algorytmów, ponieważ wykonuje stałą liczbę operacji, niezależnie od obrazu wejściowego. Czas pracy algorytmu mieścił się w przedziale od 0.28s do 0.35s. Czasy wykonywania pozostałych dwóch algorytmów są bardzo zróżnicowane. Powodem tej sytuacji jest różna liczba krawędzi występujących na badanych obrazach, których analizowanie wpływa na czas działania algorytmów. Tab. 2. Wyniki rozpoznawania tablic na zdjęciach ze złożonym tłem Algorytm Liczba zdjęć Tablice rozpoznanznanych tablic Procent rozpo- algorytm oryginalny 20 7 35% 20 18 90% Operacje morfologiczne, 20 19 95% Działanie oryginalnego algorytmu wykrywania krawędzi było w większości przypadków nieprawidłowe. W pełni poprawnie rozpoznano zaledwie 7 tablic rejestracyjnych, co stanowi 35% badanych obrazów. Podczas analizy wyników poszczególnych etapów algorytmu można dostrzec, że najbardziej problematycznym krokiem było wyszukanie obszaru tablicy na obrazie wejściowym. Sytuacja ta spowodowana jest występowaniem bardzo dużej liczby dodatkowych krawędzi generowanych przez elementy otoczenia. Zmodyfikowany algorytmu wykrywania krawędzi sprawdził się zdecydowanie lepiej. Tablicę rejestracyjną rozpoznano w pełni poprawnie w 18 przypadkach, co stanowi 90% wszystkich badanych obrazów wejściowych. Wprowadzenie modyfikacji do oryginalnej wersji algorytmu pozwoliło znacznie zwiększyć skuteczność jego działania. Poprzez zastosowanie filtracji udało się zniwelować wpływ dodatkowych krawędzi obiektów tła na lokalizację tablicy, co zaowocowało większą liczbą prawidłowych wyników. Algorytm z wykorzystaniem operacji morfologicznych w pełni poprawnie rozpoznał 19 tablic, co stanowi 95% wszystkich badanych obrazów, przy czym detekcja tablic odbyła się prawidłowo dla wszystkich obrazów, a jedyny błąd powstał na etapie rozpoznawania znaków. Ponieważ badany algorytm nie stosuje operatorów detekcji krawędzi, a jego działanie opiera się o przekształcenia morfologiczne, wszystkie obiekty tła powodujące występowanie dużej liczby krawędzi nie mają wpływu na ostateczny wynik. Rys. 8. Czas lokalizacji tablicy na obrazach ze złożonym tłem Rys. 7. Czas lokalizacji tablicy na obrazach z prostym tłem Do drugiej grupy badanych obrazów wybrano zdjęcia pojazdów na złożonym tle, które po zastosowaniu filtra Canny ego powoduje powstawanie dużej liczby krawędzi. Wyniki badań algorytmów dla zdjęć ze złożonym tłem przedstawiono w Tab. 2. Czasy lokalizacji tablicy na obrazach ze złożonym tłem przedstawia Rys. 8. Najszybszym działaniem charakteryzował się algorytm wykorzystujący operacje morfologiczne, którego średni czas wykonywania wynosił 0,311s. Wolniej działały algorytmy opierające się na metodzie wykrywania krawędzi (niezmodyfikowany oraz wersja po modyfikacjach). Ich średni czas wykonywania to odpowiednio 0,490s i 0,552s. W porównaniu z poprzednio badaną grupą obrazów, wszystkie algorytmy pracowały nieco wolniej. W przypadku algorytmów bazujących na wykrywaniu krawędzi, na wykresie widać miejsca, w których czas przetwarzania znacząco odbiegał od średniej. Wahania te spowodowane są bardzo dużą liczbą krawędzi występujących na części analizowanych obrazów. Czasy otrzymy- 246 AUTOBUSY 12/2016

wane za pomocą algorytmu opartego na operacjach morfologicznych są do siebie zbliżone. PODSUMOWANIE Detekcja tablic na zdjęciach pojazdów jest bardzo ważnym, a jednocześnie bardzo trudnym etapem w procesie automatycznego rozpoznawania tablic rejestracyjnych. Zaproponowane zostały modyfikacje oryginalnych algorytmów detekcji tablic rejestracyjnych, które polegały na odpowiednim wstępnym przetwarzaniu obrazu (filtracja, wyrównanie histogramu), zmodyfikowanym sposobie wykrywania granic pionowych i poziomych, odpowiednim doborze elementów strukturalnych i metody progowania oraz selekcji i weryfikacji obszarów kandydujących. Wyniki przeprowadzonych badań pokazały, że zaproponowane modyfikacje pozwoliły zwiększyć skuteczność rozpoznawania tablic rejestracyjnych, zwłaszcza na obrazach o złożonym tle, charakteryzującym się dużą ilością szczegółów. Wykrywanie tablic rejestracyjnych na obrazach o złożonym tle najlepiej jest przeprowadzać za pomocą zmodyfikowanego algorytmu wykorzystującego operacje morfologiczne. Podejście to charakteryzowało się 95% skutecznością rozpoznawania oraz najkrótszym czasem przetwarzania obrazów. Dobre wyniki uzyskano również za pomocą zmodyfikowanego algorytmu wykrywania krawędzi (90% poprawności rozpoznawania), jednak był on nieco wolniejszy. BIBLIOGRAFIA 1. Cao G., Chen J., Jiang J., An adaptive approach to vehicle license plate localization, Industrial Electronics Society, 2003, p. 1786-1791. 2. Carata S.V., Neagoe V.E. A Pulse-Coupled Neural Network Approach for Image Segmentation and Its Pattern Recognition Application, International Conference on Communications (COMM), 2016, p. 61-64. 3. Di Stefano L., Bulgarelli A., A simple and efficient connected components labeling algorithm, Image Analysis and Processing, 1999, p. 322-327. 4. Enyedi B., Fazekas K., Konyha L., Real time number plate localization algorithms. Journal of electrical engineering, 2006, T. 57, z. 2, p. 69-77. 5. Farajian N., Rahimi M., Algorithms for license plate detection: A survey, Technology, Communication and Knowledge, 2014, p. 1-8. 6. Ha P. S., Shakeri M., License Plate Automatic Recognition based on Edge Detection, International Conference on Artifical Intelligence and Robotics, 2016, p. 170-174. 7. Lakshmanan B., Sheng W., Lui M., Zhang S. Locating License Tags Using Edges, The 6 th Annual IEEE International Conference on Cyber Technology in Automation, Control and Intelligent Systems, 2016, p. 188-193. 8. Martinsky O., Algorithmic and mathematical principles of automatic number plate recognition systems, Brno, 2007. 9. Mikłasz M., Kawka G., Zastosowania systemów ARTR, Zeszyty Naukowe Zachodniopomorskiej Szkoły Biznesu Firma i Rynek, 2013, s. 31-39. 10. Mikłasz M., Nowosielski A., Kawka G., Specjalizowany system ARTR kontroli ruchu drogowego, Pomiary, Automatyka, Kontrola, 2009, T. 55, z. 8, s. 612-614. 11. Półrolniczak E., Metoda aktywnych konturów w segmentacji znaków na tablicach rejestracyjnych, Pomiary, Automatyka, Kontrola, 2012, T. 58, z. 2, s. 176-179. 12. Rong L., A run-based algorithm for identifying connected components in binary images, 2010 IEEE International Conference on Software Engineering and Service Sciences, Beijing, 2010, p. 137-141. 13. Roomi S., Anitha M., Bhargavi R., Accurate license plate localization, Computer, Communication and Electrical Technology, 2011, p. 92-97. 14. Szymczyk T., Metoda dopasowania wzorców w rozpoznawaniu obrazów ograniczenia, problemy i modyfikacje metody, Automatyka 2008, T. 12, z. 2, s. 449-462. 15. Ukani N., Mehta H. An Accurate Method for License Plate Localization using Morphological Operations and Edge Processing, International Workshop on Image and Signal Processing, 2010, p. 2488-2491. 16. Wang J., Zhou W., Xue J., Liu X., The research and realization of vehicle license plate character segmentation and recognition technology, International Conference on Wavelet Analysis and Pattern Recognition, 2010, p. 101-104. 17. Wenke H., Kolodzey S., Vornberger O., A Work-Optimal Parallel Connected-Component Labeling Algorithm for 2D-Image-Data using Pre-Contouring, International Workshop on Image Processing, 2014, p. 154-161. 18. Zhai X., Benssali F., Ramalingam S., License plate localisation based on morphological operations, Control Automation Robotics & Vision, 2010, p. 1128-1132. License plate recognition based on static images Automatic license plate recognition (ALPR) is a type of technology that allows computer systems to detect and recognize the vehicle s license number from a digital picture. ALPR helps to increase the safety and efficiency of the road transport. In this paper, the most popular algorithms for license plate localization and recognition were presented. Some modifications of selected algorithms in order to improve the efficiency of recognition were proposed. The changes were related to image pre-processing and verification of candidate regions. Modified algorithms were compared with the original version of the edge detection based algorithm. The results of research proved that custom modifications affect algorithms to improve the efficiency of recognition. Autorzy: inż. Radosław Kamiński Politechnika Białostocka, Wydział Informatyki dr inż. Irena Bułatowa Politechnika Białostocka, Wydział Informatyki 12/2016 AUTOBUSY 247