Wpływ modelu barw oraz metody binaryzacji na skuteczność rozpoznawania numerów tablic rejestracyjnych

Podobne dokumenty
Rozpoznawanie numerów tablic rejestracyjnych pojazdów z wykorzystaniem deskryptora HOG dla obrazów zaszumionych poddanych binaryzacji

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

Widzenie komputerowe (computer vision)

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Krzysztof OKARMA 1 Przemysław MAZUREK 1

Odporne rozpoznawanie kodów QR na opakowaniach produktów

Laboratorium Cyfrowego Przetwarzania Obrazów

Pattern Classification

Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Wizyjny algorytm wyznaczania obszarów zainteresowania zrealizowany w oparciu o zredukowaną ilość przechowywanej informacji

TRANSCOMP XIV INTERNATIONAL CONFERENCE COMPUTER SYSTEMS AIDED SCIENCE, INDUSTRY AND TRANSPORT

Wykrywanie twarzy ludzkich na kolorowych obrazach ze złożonym tłem

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Przetwarzanie obrazów wykład 4

Dwufazowy system monitorowania obiektów. Karina Murawko, Michał Wiśniewski

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Przekształcenia punktowe

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

Wizja maszynowa w robotyce i automatyzacji Kod przedmiotu

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

Inteligentna analiza danych

Diagnostyka obrazowa

Implementacja filtru Canny ego

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

Detekcja punktów zainteresowania

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

ROZPOZNAWANIE TABLIC REJESTRACYJNYCH POJAZDÓW NA OBRAZACH STATYCZNYCH

Zastosowanie stereowizji do śledzenia trajektorii obiektów w przestrzeni 3D

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Komputerowe przetwarzanie obrazu Laboratorium 5

Marcin Wilczewski Politechnika Gdańska, 2013/14

10. Redukcja wymiaru - metoda PCA

AUTOMATYCZNE ROZPOZNAWANIE PUNKTÓW KONTROLNYCH GŁOWY SŁUŻĄCYCH DO 3D MODELOWANIA JEJ ANATOMII I DYNAMIKI

Przetwarzanie obrazów Grafika komputerowa. dr inż. Marcin Wilczewski 2016/2017

Odciski palców ekstrakcja cech

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Segmentacja przez detekcje brzegów

Elementy analizy obrazu. W04

PL B1. WOJSKOWY INSTYTUT MEDYCYNY LOTNICZEJ, Warszawa, PL BUP 26/13

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

KATEDRA MECHANIKI I PODSTAW KONSTRUKCJI MASZYN. Instrukcja do ćwiczeń laboratoryjnych z elementów analizy obrazów

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

KARTA PRZEDMIOTU. W5/1;W16/1 W5 Zna podstawowe metody przetwarzania wstępnego EP WM K_W9/3; obrazów barwnych.

Rok akademicki: 2017/2018 Kod: RIA s Punkty ECTS: 2. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Diagnostyka obrazowa

zna wybrane modele kolorów i metody transformacji między nimi zna podstawowe techniki filtracji liniowej, nieliniowej dla obrazów cyfrowych

Adam Korzeniewski p Katedra Systemów Multimedialnych

POB Odpowiedzi na pytania

OKREŚLANIE WSPÓŁRZĘDNYCH KĄTOWYCH CELU PRZY UŻYCIU GŁOWICY WIZYJNEJ RAKIETY

RACJONALIZACJA PROCESU EKSPLOATACYJNEGO SYSTEMÓW MONITORINGU WIZYJNEGO STOSOWANYCH NA PRZEJAZDACH KOLEJOWYCH

Automatyka i Robotyka II stopień ogólno akademicki

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Filtracja obrazu operacje kontekstowe

System rozpoznawania cyfr oparty na histogramie zorientowanych gradientów

PRZYROSTOWA METODA WYZNACZANIA ZAPOTRZEBOWANIA NA WOLNE MIEJSCA NA PARKINGACH PRZY AUTOSTRADZIE

Akademia Górniczo - Hutnicza im. Stanisława Staszica w Krakowie. Projekt. z przedmiotu Analiza i Przetwarzanie Obrazów

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

Systemy uczące się Lab 4

Michał Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (3)

Wyższa Szkoła Informatyki Stosowanej i Zarządzania

Przetwarzanie obrazów wykład 7. Adam Wojciechowski

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Rozszerzony konspekt przedmiotu Inteligentne maszyny i systemy

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Przetwarzanie obrazów rastrowych macierzą konwolucji

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Prof. Stanisław Jankowski

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Filtracja obrazu operacje kontekstowe

Akademia Górniczo-Hutnicza

Zastosowanie kołowej transformaty Hougha w zadaniu zliczania monet

Akwizycja obrazów HDR

ALGORYTMY PRZETWARZANIA OBRAZÓW Projekt. Aplikacja przetwarzająca obrazy z możliwością eksportu i importu do programu MS Excel.

Akademia Górniczo-Hutnicza

Raport. Bartosz Paprzycki UMK 2009/2010

Arkadiusz Łapiński ETI V gr.9.4. Sieć neuronowa w inteligentnym pojeździe, Tribolite

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Kalibracja kamery. Kalibracja kamery

Zbigniew Sołtys - Komputerowa Analiza Obrazu Mikroskopowego 2016 część 7

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania

Akwizycja obrazów HDR

CECHY BIOMETRYCZNE: ODCISK PALCA

Efekty kształcenia dla kierunku studiów INFORMATYKA, Absolwent studiów I stopnia kierunku Informatyka WIEDZA

Automatyczna klasyfikacja zespołów QRS

SYSTEMY AUTOMATYKI I STEROWANIA W SŁUŻBIE EFEKTYWNOŚCI ENERGETYCZNEJ BUDYNKÓW

XIII International PhD Workshop OWD 2011, October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

PRZEWODNIK PO PRZEDMIOCIE

Laboratorium Cyfrowego Przetwarzania Obrazów

Interpretacja gestów dłoni w sekwencji obrazów cyfrowych. autor: Karol Czapnik opiekun: prof. dr hab. Włodzimierz Kasprzak

Detekcja kodów kreskowych w obrazach za pomocą filtrów gradientowych i transformacji morfologicznych

Cyfrowe Przetwarzanie Obrazów. Karol Czapnik

Diagnostyka obrazowa

System wizyjny OMRON Xpectia FZx

Przetwarzanie obrazu

Transkrypt:

OKARMA Krzysztof 1 Wpływ modelu barw oraz metody binaryzacji na skuteczność rozpoznawania numerów tablic rejestracyjnych WSTĘP Algorytmy przetwarzania i analizy obrazów stają się coraz powszechniej używanym narzędziem w wielu pokrewnych dziedzinach nauki i techniki. Dzięki ich zastosowaniu w ostatnich kilkunastu latach dokonał się dynamiczny rozwój wielu gałęzi takich dyscyplin jak m.in. automatyka, robotyka, mechatronika, inżynieria biomedyczna, a także transport. Coraz częstsze wykorzystanie informacji obrazowej pochodzącej z kamer stoi u podstaw rozwoju nie tylko Inteligentnych Systemów Transportowych (ITS) [5], ale także przyczynia się do tworzenia inteligentnych autonomicznych pojazdów, systemów wspomagania kierowcy (ang. driver assistance), czy też robotów mobilnych wykorzystywanych także w magazynowaniu i logistyce. Przykładem mogą być roboty śledzące linie stosowane w dużych magazynach i centrach logistycznych na świecie. Warto zauważyć, iż w wielu zastosowaniach związanych z dyscyplinami nieco mniej związanymi z szeroko pojętą informatyką stosowaną, wykorzystywane są jedynie najbardziej popularne algorytmy przetwarzania obrazów dostępne w ramach ogólnodostępnych platform obliczeniowych (np. Scilab lub Octave) lub komercyjnych środowiskach (MATLAB, LabVIEW) oraz innych aplikacjach. Często jednakże okazuje się, iż możliwości metod analizy obrazów nie są w pełni wykorzystywane np. ze względu na stosowanie domyślnych parametrów lub brak znajomości algorytmów przetwarzania obrazów przez specjalistów z innych dziedzin niezwiązanych bezpośrednio z przetwarzaniem sygnałów i obrazów (np. medycyna, mechanika czy też transport). Z tego względu rośnie znaczenie interdyscyplinarności stwarzającej możliwość doskonalenia istniejących rozwiązań, np. w zakresie ITS, bez konieczności modernizacji sprzętu, a jedynie dzięki zastosowaniu lepszych metod przetwarzania i analizy danych. Doskonałym przykładem wpływu zastosowanych metod przetwarzania obrazów na końcowy wynik pracy systemu może być rozpoznawanie numerów rejestracyjnych pojazdów, którego wynik jest silnie uzależniony od zastosowanych algorytmów wstępnego przetwarzania obrazów. Ze względu na stosunkowo niską cenę i dużą dostępność, można uznać iż powszechnie stosowane w Inteligentnych Systemach Transportowych są kamery kolorowe, jednakże nie zawsze są to kamery autonomiczne umożliwiające szybką ekstrakcję wybranych cech obrazu lub jego fragmentów do dalszej analizy. Ze względu na fakt, iż w wielu rozwiązaniach przesyłany jest cały obraz pozyskany z kamery, z konieczności w postaci skompresowanej, może to wpływać negatywnie na czytelność tablicy rejestracyjnej. Dotyczyć to może zwłaszcza systemów monitoringu miejskiego czy też parkingowego, dla których przy stosunkowo niskiej rozdzielczości obrazu jego fragment reprezentujący tablicę rejestracyjną może być niewielki. W niniejszym artykule przeanalizowany został wpływ konwersji modelu barw oraz wykorzystanej metody binaryzacji na wynik rozpoznawania numerów rejestracyjnych z wykorzystaniem typowego prostego mechanizmu bazującego na określeniu korelacji znaku ze wzorcem binarnym. Ponieważ ze względu na założenie porównania obrazów binarnych istnieje wiele możliwości uzyskania takowego na podstawie obrazu kolorowego przekształconego do skali szarości, celowe jest także zbadanie wpływu metody określania progu binaryzacji dla różnych modeli barw na wyniki klasyfikacji znaków. 1 Zachodniopomorski Uniwersytet Technologiczny w Szczecinie, Wydział Elektryczny, Katedra Przetwarzania Sygnałów i Inżynierii Multimedialnej; 70-313 Szczecin, ul. Gen. Władysława Sikorskiego 37; Tel: +48 91 449-53-13, Fax: +48 91 449-53-47; E-mail: okarma@zut.edu.pl 4796

1. METODY ROZPOZNAWANIA NUMERÓW TABLIC REJESTRACYJNYCH Systemy automatycznego rozpoznawania numerów tablic rejestracyjnych powinny charakteryzować się odpornością na zmienne warunki oświetleniowe spowodowane m.in. przez warunki atmosferyczne, jak również umożliwiać poprawne rozpoznawanie znaków przy założeniu obecności zakłóceń wynikających np. z częściowego zabrudzenia tablicy. W niektórych systemach, przykładowo przy bramkach wjazdowych na parkingi, można założyć, iż położenie tablicy rejestracyjnej pojazdu względem kamery jest dość dokładnie określone, przy czym często kamera skierowana jest wprost na tablicę, co znacząco ułatwia rozpoznawanie znaków. W systemach służących do monitorowania ruchu pojazdów zadanie to jest jednakże o tyle trudniejsze, iż pojazdy znajdujące się w ruchu mogą znajdować się w różnych położeniach, co wpływa na kąt pomiędzy powierzchnią tablicy a osią optyczną kamery. Utrudnieniem dla zadania rozpoznawania znaków może być zarówno rozmycie obrazu związane z ruchem pojazdu (ang. motion blur), mogące mieć znaczenie przy słabym oświetleniu, jak też zniekształcenie znaków wynikające z rzutowania perspektywicznego obrazu tablicy rejestracyjnej obserwowanej pod stosunkowo niewielkim kątem. 1.1. Etapy procesu automatycznego rozpoznawania numerów rejestracyjnych Typowy proces rozpoznawania numerów tablic rejestracyjnych składa się z kilku zasadniczych etapów [3,9]. Biorąc pod uwagę ilość danych zawartą w pojedynczym kolorowym obrazie pozyskanym z kamery, ze względu na efektywność rozpoznawania znaków, konieczne jest wykonanie operacji wstępnego przetwarzania obrazu (ang. pre-processing), dzięki czemu całkowity czas potrzebny na rozpoznanie numeru tablicy rejestracyjnej we współczesnych systemach rzadko przekracza 50 ms [1]. Zasadniczy element stanowi detekcja położenia tablicy rejestracyjnej wraz z najbliższym otoczeniem (ang. Region of Interest ROI), która często jest wykonywana na podstawie analizy ruchu obiektów na podstawie zmiany położenia dla kolejnych klatek sekwencji wideo. Wykorzystywane są w tym celu m.in. techniki estymacji i usuwania tła [4,7,10]. W wyniku wyznaczenia obszaru ROI uzyskiwany jest fragment obrazu przedstawiający przód lub tył pojazdu lub też jego fragment stanowiący najbliższe otoczenie tablicy rejestracyjnej (np. fragment maski, zderzaka, atrapy chłodnicy). Jak wykazano w publikacji [6] obecność dodatkowych elementów na obrazie z sąsiedztwa tablicy rejestracyjnej może wpłynąć pozytywnie na wynik działania niektórych metod przetwarzania obrazu służących do poprawy czytelności znaków np. technik superrozdzielczości. Kolejnym etapem przetwarzania wstępnego jest detekcja tablicy rejestracyjnej, co może być utrudnione w przypadku obserwacji pojazdu przy bocznej lokalizacji kamery. W takim przypadku w wyniku rzutowania perspektywicznego krawędzie tablicy rejestracyjnej nie są równoległe do krawędzi obrazu. Przy założeniu obserwacji pojazdu zbliżającego się lub oddalającego zgodnie z kierunkiem osi optycznej kamery można z kolei przyjąć, iż krawędzie tablicy rejestracyjnej będą w przybliżeniu równoległe do krawędzi obrazu. W takiej sytuacji jednym z prostych algorytmów detekcji tablicy rejestracyjnej na obrazie może być połączenie filtracji krawędziowej z analizą histogramu jasności rzutowanego obrazu (ang. projection histogram) dla każdego wiersza oraz każdej kolumny (histogram poziomy oraz pionowy). Analiza histogramu pionowego może być również wykorzystana do segmentacji znaków, czyli dalszego podziału obszaru tablicy rejestracyjnej na fragmenty reprezentujące poszczególne znaki [2,13]. Operacje te mogą być wykonywane zarówno dla obrazów kolorowych, jak również, co ma zazwyczaj miejsce, dla obrazów w skali szarości. Ostatnim etapem przetwarzania wstępnego obrazu przez dokonaniem właściwego rozpoznawania poszczególnych znaków jest binaryzacja obrazu, która może być wykonywana na kilka sposobów. Najprostszym podejściem jest wykonanie binaryzacji globalnej z użyciem stałej wartości progowej, jednak w takim przypadku wynik binaryzacji w istotny sposób zależy od warunków oświetleniowych oraz zawartości obrazu uwarunkowanej np. liczbą i kolorem widocznych pojazdów. Z tego względu binaryzacja dokonywana jest zwykle wyłącznie dla fragmentu obrazu uzyskanego w wyniku detekcji tablicy rejestracyjnej na obrazie [12]. Po binaryzacji obrazu następuje proces rozpoznawania znaków, który może być wykonywany za pomocą analizy dyskryminacyjnej lub metod sztucznej inteligencji, w szczególności sztucznych sieci 4797

neuronowych, lub też na podstawie analizy korelacji z wzorcami. Wykorzystane mogą być różne klasyfikatory np. maszyny wektorów nośnych (ang. Support Vector Machines SVM), klasyfikatory bayesowskie, metoda najbliższych sąsiadów (ang. Nearest Neighbours) lub też metody redukcji wymiaru wektora cech. W niniejszej publikacji zastosowane zostało podejście bazujące na analizie korelacji znaków ze znanymi wzorcami binarnymi. 1.2. Binaryzacja obrazu Wśród algorytmów wyznaczania wartości progowej (ang. threshold) dla binaryzacji obrazu przydatnych w metodach rozpoznawania numerów tablic rejestracyjnych, a także rozpoznawania pisma (OCR), wyróżnić warto dwa klasyczne podejścia o stosunkowo niewielkiej złożoności obliczeniowej. Najbardziej znanymi metodami binaryzacji są podejścia bazujące na analizie histogramów zaproponowane przez Nobuyuki Otsu [8] oraz w publikacji J. Sauvoli i M. Pietikäinena [11]. Pierwsza z metod zakłada wybór progu binaryzacji w taki sposób, aby zmaksymalizować wariancję między dwiema uzyskanymi klasami punktów przyporządkowanych wartościom 0 oraz 1, co odpowiada minimalizacji wariancji wewnątrzklasowej. Metoda ta może być efektywnie zaimplementowana w sposób rekurencyjny, co przyczynia się do jej dużej popularności. Drugie podejście oparte jest na lokalnej wariancji obrazu. Wyznaczany próg binaryzacji uzależniony jest od zakresu dynamicznego odchylenia standardowego oraz lokalnej wartości średniej, co zapewnia możliwość adaptacyjnej zmiany progu w zależności od lokalnych warunków oświetleniowych lub jasności tła. Ma to szczególne znaczenie dla rozpoznawania tekstu w historycznych częściowo zniszczonych dokumentach. W przypadku rozpoznawania numerów tablic rejestracyjnych metoda ta może okazać się przydatna w sytuacjach, w których na tablicy rejestracyjnej widoczne są lokalne rozbłyski odbitego światła. 1.3. Konwersja obrazu do skali szarości Oba te podejścia, podobnie jak inne metody o większej złożoności obliczeniowej, wymagają zastosowania obrazu źródłowego w skali szarości. Konwersja obrazu kolorowego na skalę szarości nie jest jednak zagadnieniem jednoznacznym, ponieważ dla różnych modeli barw składnik luminancyjny określający jasność obrazu może być wyznaczany na różne sposoby. Typowym podejściem jest przyjęcie współczynników wagowych używanych w telewizyjnych modelach barw YUV oraz YIQ stosowanych w systemach PAL oraz NTSC. Konwersja obrazu RGB do skali szarości odbywa się wówczas zgodnie z zależnością: Y 0.299 R 0.587 G 0. 114 B (1) Z kolei w modelu HSV, w którym kolor określany jest za pomocą składowej Hue opisanej na okręgu stanowiącego podstawę stożka, nasycenia (Saturation) określającego odległość danego koloru od skali szarości oraz jasności (Value) stanowiącej wysokość stożka, wartość jasności (Value) wyznaczana jest jako średnia arytmetyczna z wartości trzech składowych RGB. Jeszcze inną definicję jasności przyjęto w percepcyjnie równomiernym modelu CIE LAB, w którym w celu wyznaczenia składowej L należy dokonać liniowej konwersji modelu RGB na model CIE XYZ, a następnie nieliniowego mapowania składowych XYZ do przestrzeni CIE LAB. Obrazy w skali szarości uzyskiwane w wyniku konwersji naturalnych obrazów kolorowych, zwłaszcza dla zmiennych warunków oświetleniowych, stanowiące dane wejściowe dla binaryzacji prowadzić mogą do wyznaczenia różnych wartości progu binaryzacji, co ma z kolei wpływ na dokładność rozpoznawania poszczególnych znaków. 2. WERYFIKACJA ZNACZENIA MODELU BARW I SPOSOBU PROGOWANIA W celu weryfikacji wpływu modelu barw na wyniki binaryzacji przeprowadzono szereg eksperymentów obliczeniowych z wykorzystaniem obrazów kolorowych, także poddanych stratnej kompresji. Przyjęto, iż konwersja obrazu kolorowego do skali szarości odbywa się zgodnie ze 4798

sposobami wyznaczania wartości Y (dla modeli YUV oraz YIQ), V dla modelu HSV oraz L dla modelu CIE LAB. Tak uzyskane obrazy poddano następnie binaryzacji metodami Otsu oraz Sauvoli, a także przyjmując domyślną wartość progu równą połowie zakresu dynamicznego jasności. Wszystkie obliczenia przeprowadzono po wstępnym przetworzeniu obrazu w celu wyznaczenia obszaru zainteresowania (ROI). Ponieważ przyjęto konieczność widoczności całej tablicy rejestracyjnej na obrazie, w przypadku obrazów rejestrowanych z bocznego położenia kamery spowodowało to powiększenie obrazu o fragmenty jej sąsiedztwa tablica jest wówczas zlokalizowana ukośnie, co dodatkowo utrudnia poprawne rozpoznanie niektórych znaków. 2.1. Ilustracja uzyskanych wyników przetwarzania wstępnego obrazów Przykładowe obrazy kolorowe wraz z efektami konwersji do skali szarości przedstawiono na rysunku 1. Najlepiej widoczna różnica ma miejsce dla ostatniego obrazu dla składowej V, gdzie zauważalna jest wyraźnie jaśniejsza listwa pod tablicą rejestracyjną aniżeli dla składowych Y oraz L. Rys. 1. Przykładowe obrazy tablic rejestracyjnych (powiększone) oraz efekty ich konwersji do skali szarości z użyciem różnych modeli barw Rys. 2. Przykładowe (powiększone) wyniki binaryzacji z progiem 0.5 dla obrazów w skali szarości uzyskanych z użyciem różnych modeli barw W efekcie zastosowania do tak uzyskanych obrazów trzech różnych metod binaryzacji uzyskano obrazy binarne przedstawione na rysunkach 2 4. Analizując widoczne na nich wyniki binaryzacji łatwo zauważyć różnice wynikające z zastosowania poszczególnych metod wyznaczania wartości 4799

progowej. Ze względu na stosunkowo małą grubość linii oraz ich małą ciągłość przy zastosowaniu metody Sauvoli w celu poprawienia dokładności rozpoznawania znaków przydatne wydaje się zastosowanie dodatkowych operacji morfologicznych (np. zamknięcia lub dylatacji, czy też bardziej złożonych przekształceń). Dla pełniejszej ilustracji wpływu modelu barw na uzyskane wyniki w tabeli 1 przedstawione zostały wartości progu binaryzacji wyznaczone metodą Otsu dla poszczególnych obrazów z wykorzystaniem różnych sposobów konwersji obrazu do skali szarości. Warto w tym miejscu zwrócić uwagę na fakt, iż ocena jakości tych obrazów i związanej z nią ich przydatności do rozpoznawania kształtu znaków wymagałaby znajomości prawidłowych wyników binaryzacji (tzw. ground truth ), co stanowić może poważny problem w rzeczywistych aplikacjach. Bazy takich par obrazów są co prawda dostępne, jednak zawierają głównie obrazy przedstawiające mniej lub bardziej zniszczone dokumenty zarówno z pismem odręcznym jak też maszynowym. W przypadku tego rodzaju dokumentów zniekształcenia mogą być dość łatwo spreparowane, przez co jako ground truth służyć może plik referencyjny pozbawiony zniekształceń poddany binaryzacji. Rys. 3. Przykładowe (powiększone) wyniki binaryzacji metodą Otsu dla obrazów w skali szarości uzyskanych z użyciem różnych modeli barw Rys. 4. Przykładowe (powiększone) wyniki binaryzacji metodą Sauvoli dla obrazów w skali szarości uzyskanych z użyciem różnych modeli barw 4800

Tab. 1. Znormalizowane wartości progu binaryzacji wyznaczone metodą Otsu na podstawie obrazów w skali szarości uzyskanych dla różnych modeli barw Obraz Próg dla Y Próg dla V Próg dla L GD 04543 0,5647 0,5804 0,5882 PN 28190 0,5824 0,5980 0,5902 RA 04186 0,5373 0,5490 0,5451 SM 32534 0,3098 0,3451 0,3216 2.2. Weryfikacja wyników rozpoznawania znaków Biorąc pod uwagę zaprezentowane wyniki wyznaczania progu binaryzacji metodą Otsu, jak również efekty binaryzacji obrazu wynikające z zastosowania różnych metod konwersji do skali szarości oraz późniejszej binaryzacji, łatwo zauważyć wpływ obu tych etapów przetwarzania obrazu na uzyskane obrazy binarne o różnej czytelności znaków. Ponieważ dla tego rodzaju obrazów możliwe jest zastosowanie różnych metod klasyfikacji znaków, w celu ilustracji znaczenia rozważanych metod przetwarzania wstępnego obrazu, wykorzystana została stosunkowo prosta metoda rozpoznawania znaków alfanumerycznych oparta na analizie wartości współczynników korelacji fragmentów obrazu reprezentujących poszczególne znaki z wzorcami binarnymi. Jak można zauważyć na podstawie wyników klasyfikacji przedstawionych w tabeli 2, przyjęte metody przetwarzania wstępnego mają również wpływ na poprawność wzajemnej separacji poszczególnych znaków na obrazie binarnym. Jak łatwo zaobserwować, ma to szczególne znaczenie przy binaryzacji obrazu metodą Sauvoli. Najlepsze wyniki uzyskano dla składowej V z modelu HSV, co jest widoczne w szczególności przy zastosowaniu progu 0.5 oraz metody Sauvoli dla ostatniego obrazu, na którym tablica zlokalizowana jest ukośnie względem kamery. Ze względu na uproszczoną metodę klasyfikacji we wszystkich wynikach można zauważyć błędy typowe dla systemów rozpoznawania numerów rejestracyjnych wynikające z dużego wzajemnego podobieństwa par znaków np. B oraz 8, 5 oraz S, czy też M oraz H (utrudniającego prawidłową klasyfikację zwłaszcza przy ukośnym położeniu tablicy na obrazie). Wartości współczynników korelacji uzyskane przy użyciu rozważanych metod konwersji oraz binaryzacji dla przykładowej tablicy (SM32534) przedstawiono na rysunkach 5 7, na których zielonym wypełnieniem oznaczono korelacje dla prawidłowo rozpoznanych znaków, szarym ukośnym deseniem korelacje dla znaków rozpoznanych nieprawidłowo, lecz szczególnie trudnych do klasyfikacji dla ukośnie zlokalizowanej tablicy (S zamiast 5 oraz H zamiast M). Wartości korelacji dla błędnie rozpoznanych znaków oznaczono jasnoczerwonym gradientem. Tab. 2. Efekty rozpoznawania numerów tablic rejestracyjnych dla różnych metod konwersji do skali szarości oraz binaryzacji obrazów Metoda binaryzacji Próg 0.5 Otsu Sauvola Obraz Y V L Y V L Y V L GD04543 G0DD4S4J G0DD4S4J GD0D4S4J G0DD454J G0DD454J G0DD454J G00DD4S43 G00DD4S43 G0DD4S43 PN28190 PN28H1PO PN28H1PO PN2HBPO PN2H81PO PN2F81PO PN2M81PO PN2M81PO PN2M81PO PN2H8PO RA04186 RA4D4285 RA4D4285 RA9D4I85 RA4D4285 RA9D4285 RA4D4285 RAIPD0KL85 RAI7D0KL85 RAI70DK6185 SM32534 SHA32S3 SH32S34 SHA32S34 SH32S34 SH32S34 SH32S34 S1H932S3P4 SH32S34 S1NH932S3P4 Rys. 5. Wartości współczynników korelacji dla tablicy SM32534 uzyskane dla poszczególnych znaków przy użyciu binaryzacji z progiem 0.5 oraz różnych modeli barw 4801

Rys. 6. Wartości współczynników korelacji dla tablicy SM32534 uzyskane dla poszczególnych znaków przy użyciu binaryzacji metodą Otsu oraz różnych modeli barw Rys. 7. Wartości współczynników korelacji dla tablicy SM32534 uzyskane dla poszczególnych znaków przy użyciu binaryzacji metodą Sauvoli oraz różnych modeli barw WNIOSKI Wyniki przeprowadzonych badań eksperymentalnych potwierdzają niebagatelne znaczenie metod wstępnego przetwarzania obrazów pozyskanych z kamer, w szczególności kolorowych, na wyniki dalszej analizy obrazów binarnych na przykładzie rozpoznawania numerów rejestracyjnych pojazdów. Warto zauważyć, iż porównując wyniki uzyskiwane dla tych samych obrazów można dojść do wniosku, iż niewłaściwy sposób konwersji i binaryzacji obrazu może uniemożliwić skuteczne automatyczne rozpoznanie numeru rejestracyjnego, podczas gdy zmiana sposobu konwersji obrazu kolorowego do skali szarości, jak też dobór odpowiedniej metody binaryzacji obrazu, pozwolić może na znaczącą poprawę skuteczności rozpoznawania znaków. Jest to szczególnie istotne w systemach, które są obsługiwane przez osoby niezaznajomione ze specyfiką przetwarzania obrazów, co stanowi naturalną konsekwencję upowszechniania dostępu do coraz bardziej specjalizowanych narzędzi informatycznych stosowanych w różnych dziedzinach współczesnej techniki. Streszczenie W artykule przeanalizowano znaczenie konwersji modeli barw obrazów przedstawiających tablice rejestracyjne pojazdów ze względu na proces rozpoznawania ich numerów rejestracyjnych. Biorąc pod uwagę fakt, iż wiele istniejących komercyjnych systemów wykorzystywanych do monitorowania ruchu pojazdów w Inteligentnych Systemach Transportowych funkcjonuje prawidłowo przy określonych założeniach dotyczących parametrów kamer, jak również warunków oświetleniowych, skupiono się na rozwiązaniach o niskiej mocy obliczeniowej, w których rozpoznawanie znaków odbywa się zazwyczaj dla obrazów binarnych. Określenie stopnia podobieństwa lub korelacji poszczególnych znaków do binarnego wzorca jest rozwiązaniem typowym, także w aplikacjach OCR, jednakże wynik klasyfikacji jest silnie uzależniony od wyniku binaryzacji obrazu. Binaryzacja, zwłaszcza w obecności zakłóceń, w szczególności dla obrazów kolorowych, nie jest zadaniem jednoznacznym, zarówno ze względu na różne metody wyznaczania wartości progu binaryzacji, jak również sposoby uprzedniej konwersji obrazu kolorowego do skali szarości. Przestawione w artykule wyniki eksperymentalne uzyskane dla kilku popularnych modeli barw oraz metod binaryzacji potwierdzają możliwości poprawy skuteczności rozpoznawania numerów rejestracyjnych pojazdów, w odniesieniu do typowo stosowanych metod, zwłaszcza dla obrazów kolorowych niskiej rozdzielczości poddanych stratnej kompresji lub zawierających zakłócenia wpływające na wynik binaryzacji. 4802

Influence of the color model and method of binarization on the recognition accuracy of register plate numbers Abstract In this paper the importance of the color model conversion for images representing the vehicles register plates is analyzed in view of the recognition process of their numbers. Considering the fact that many existing commercial systems used for traffic monitoring in Intelligent Transport Systems operate properly under certain assumptions related to the camera parameters, as well as lighting conditions, the paper is focused on low computational power solutions, in which the character recognition is usually performed using the binary images. Calculation of the degree of similarity or correlation of individual characters to the binary pattern is a typical solution, also in the OCR applications, however, the result of classification is highly dependent on the result of image binarization. Binarization, especially in the presence of distortions, especially for color images, may be ambiguous, both because of the different methods of determining the binarization threshold value, as well as prior conversion of color images to grayscale. Experimental results presented in the article obtained for several popular color models and methods of binarization confirm the possibility of improving the efficiency of vehicle registration numbers recognition in comparison to conventionally used methods, especially for low resolution color images subjected to lossy compression or containing distortions affecting binarization result. BIBLIOGRAFIA 1. Anagnostopoulos Ch., Anagnostopoulos I., Psoroulas I., Loumos V., Kayafas E., License Plate Recognition From Still Images and Video Sequences: A Survey, IEEE Transactions on Intelligent Transportation Systems, vol. 9 no. 3, September 2008, pp. 377 391. 2. Caner H., Gecim H., Alkar A., Efficient Embedded Neural-Network-Based License Plate Recognition System. IEEE Transactions on Vehicular Technology, vol. 57 no. 5, September 2008, pp. 2675 2683. 3. Gilly D., Raimond K., A Survey on License Plate Recognition Systems. International Journal of Computer Applications, vol. 61 no. 6, January 2013, pp. 34 40. 4. Mazurek P., Okarma K., Background Suppression for Video Vehicle Tracking Systems with Moving Cameras Using Camera Motion Estimation. Telematics in the Transport Environment (TST 2012), Communications in Computer and Information Science vol. 329, Springer Berlin Heidelberg 2012, pp. 372 379. 5. Mikulski J., Using Telematics in Transport. Transport Systems Telematics (TST 2010), Communications in Computer and Information Science vol. 104, Springer Berlin Heidelberg 2010, pp. 175 182. 6. Okarma K., Mazurek P.: Wykorzystanie otoczenia tablicy rejestracyjnej w procesie pasowania obrazów w algorytmach superrozdzielczości. Logistyka 2010 nr 6, str. 2521 2528. 7. Okarma K., Mazurek P., Zmodyfikowana hybrydowa metoda nieliniowej estymacji tła dla wizyjnych systemów śledzenia ruchu pojazdów. Logistyka 2012 nr 3, str. 1747 1752. 8. Otsu N., A Threshold Selection Method from Gray-Level Histograms, IEEE Transactions on Systems, Man and Cybernetics, vol. 9 no. 1, January 1979, pp. 62 66. 9. Patel Ch., Shah D., Patel A., Automatic Number Plate Recognition System (ANPR): A Survey. International Journal of Computer Applications, vol. 69 no. 9, May 2013, pp. 21 33. 10. Piccardi M., Background Subtraction Techniques: A Review. Proceedings of IEEE International Conference on Systems, Man and Cybernetics, vol. 4, October 2004, pp. 3099 3104. 11. Sauvola J., Pietikäinen M., Adaptive Document Image Binarization. Pattern Recognition, vol. 33 no. 2, February 2000, pp. 225 236. 12. Shapiro V., Gluhchev G., Dimov D., Towards a Multinational Car License Plate Recognition System. Machine Vision and Applications, vol. 17 no. 3, Springer Berlin Heidelberg, August 2006, pp. 173 183. 13. Wen Y., Lu Y., Yan J., Zhou Z., von Deneen K., Shi P., An Algorithm for License Plate Recognition Applied to Intelligent Transportation System. IEEE Transactions on Intelligent Transportation Systems, vol. 12 no. 3, September 2011, pp. 830 845. 4803