Problematyka przetwarzania obrazu przesyłki pocztowej w procesach logistycznych opracowywania przesyłek

Podobne dokumenty
KRYTERIA SPRAWNOŚCI POCZTOWYCH SYSTEMÓW TECHNICZNYCH W ZAKRESIE ROZDZIAŁU PRZESYŁEK

Procesy usprawniające w systemach klasyfikacji i sortowania przesyłek pocztowych

PROBLEMY IDENTYFIKACJI DANYCH ADRESOWYCH W AUTOMATYCZNYM PROCESIE SORTOWANIA PRZESYŁEK

1) Nadawanie przesyłek pocztowych i kurierskich przez jednostki organizacyjne Uniwersytetu Ekonomicznego w Katowicach

Pattern Classification

Poprawne adresowanie przesyłek listowych PORADNIK

Analiza problemów rozpoznawania przesyłki pocztowej w systemach logistycznych 2

Skanery serii i5000. Informacje o kodach separujących. A-61801_pl

Identyfikacja obrazu opłaty pocztowej w systemach logistycznych poczty

Więcej arkuszy znajdziesz na stronie: arkusze.pl

Wizja maszynowa w robotyce i automatyzacji Kod przedmiotu

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

O przetwarzaniu danych. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

OPIS PRZEDMIOTU ZAMÓWIENIA

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Przetwarzanie obrazu

budowa i zasady użycia logo Fundacji Orange

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Instrukcja dla autorów monografii

SPECYFIKACJA PHARMA KODU

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

KATEGORIA OBSZAR WIEDZY

SZCZEGÓŁOWE WARUNKI TECHNICZNE ELEMENTÓW PAKIETU DLA REALIZACJI ZAMÓWIENIA

Problematyka rozpoznawania obrazu opłaty pocztowej w systemach logistycznych poczty

10. Redukcja wymiaru - metoda PCA

a. Wersja podstawowa pozioma

Instrukcje dla zawodników

budowa i zasady użycia znaku Fundacji

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Księga znaku Bundeslogo

KARTA PRZEDMIOTU. W5/1;W16/1 W5 Zna podstawowe metody przetwarzania wstępnego EP WM K_W9/3; obrazów barwnych.

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

Współczesna problematyka klasyfikacji Informatyki

Sylabus Moduł 2: Przetwarzanie tekstów

Przetwarzanie obrazu

Opis przedmiotu zamówienia Wykonywanie usług obejmujących podstawowe czynności eksploatacyjne.

Obraz jako funkcja Przekształcenia geometryczne

ZARZĄDZENIE NR 33/2012 STAROSTY LUBIŃSKIEGO. z dnia 6 kwietnia 2012 r. w sprawie obiegu korespondencji i wysyłania pism

Temat: Zadania Sowy Mądrej Głowy. Cele ogólne:

ADAPTACYJNA METODA UCZENIA MASZYNOWEGO W SYSTEMACH KLASYFIKACJI I SORTOWANIA PRZESYŁEK POCZTOWYCH

Szczegółowy opis przedmiotu zamówienia

Załącznik nr 4. Znak sprawy: EAD/260/1/2017 OPIS PRZEDMIOTU ZAMÓWIENIA

Analiza obrazów - sprawozdanie nr 2

Księga znaku Prywatna chmura dla prawników

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Realizowany w roku akademickim 2016/2017

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

OPIS PRZEDMIOTU ZAMÓWIENIA (OPZ)

Diagnostyka obrazowa

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

LOGO UNIWERSYTETU ZIELONOGÓRSKIEGO KSIĄŻKA TOŻSAMOŚCI ZNAKU

Widzenie komputerowe (computer vision)

Uchwała Nr 129/2016 Zarządu Poczty Polskiej S.A. z dnia 20 października 2016 roku

Dane obrazowe. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Detekcja punktów zainteresowania

1. WIADOMOŚCI WPROWADZAJĄCE DO PROJ. I GR. INŻ.

DECYZJE. (Tekst mający znaczenie dla EOG)

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

KATEDRA MECHANIKI I PODSTAW KONSTRUKCJI MASZYN. Instrukcja do ćwiczeń laboratoryjnych z elementów analizy obrazów

E-I2G-2008-s1. Informatyka II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)

Implementacja filtru Canny ego

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

skutecznie skraca czas potrzebny na przygotowanie korespondencji wchodzącej i wychodzącej

Znak wersja podstawowa

Szczegółowy opis przedmiotu zamówienia

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 5.0

1.2 Logo Sonel podstawowe załoŝenia

Obowiązuje od 1 grudnia 2014 r.

Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki.

Sterownik. zasady obsługi. moduł programu Madar 7

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

EDYCJA TEKSTU MS WORDPAD

Reprezentacja i analiza obszarów

Etykieta logistyczna GS1 Etykieta logistyczna jednostki logistycznej Jednostka logistyczna SSCC Serial Shipping Container Code

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Szczegółowy opis przedmiotu zamówienia

Szczegółowy opis przedmiotu zamówienia

Logiczny model komputera i działanie procesora. Część 1.

GRUPA EXPERTUS KSIĘGA ZNAKU EXPERTUS

Bartosz Bazyluk SYNTEZA GRAFIKI 3D Grafika realistyczna i czasu rzeczywistego. Pojęcie sceny i kamery. Grafika Komputerowa, Informatyka, I Rok

UCHWAŁA PAŃSTWOWEJ KOMISJI WYBORCZEJ z dnia 17 sierpnia 2011 r.

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 9 AiR III

PODSTAWOWA KSIĘGA ZNAKU

BZP/91/DLA/2015. Załącznik nr 5 do umowy

Odciski palców ekstrakcja cech

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

TYTUŁ PRACY 18 pkt, bold

OPIS PRZEDMIOTU ZAMÓWIENIA

Uwagi na temat formatowania tekstu referatów konferencji PLOUG

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III

Przetwarzanie obrazów rastrowych macierzą konwolucji

Automatyzacja testowania oprogramowania. Automatyzacja testowania oprogramowania 1/36

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Budowa i zasada działania skanera

Opis efektów kształcenia dla modułu zajęć

M I Ń S K M A Z OW I E C K I

Treść zapytań oraz wyjaśnienie dotyczące zapisów. Ogłoszenia o zamówieniu

Transkrypt:

WIATR Roman 1 MICIAK Mirosław 1 Problematyka przetwarzania obrazu przesyłki pocztowej w procesach logistycznych opracowywania przesyłek WSTĘP Rozpoznawanie i przetwarzanie obrazów jest powszechnie wykorzystywane w technice komputerowej do identyfikacji dokumentów w urzędach i instytucjach użyteczności publicznej. Kierunki rozwoju systemów rozpoznawania uwzględniają możliwości rozpoznawania pisma jak również umożliwiają ograniczenie ilości przechowywanych danych. Obecnie największe zastosowanie systemy optycznego rozpoznawania pisma znajdują w przedsiębiorstwach spedycyjnych oraz pocztowych. Obecnie pojawiają się możliwości zastosowania systemów przetwarzania obrazów do rozpoznawania znaków w procesach sortowania przesyłek pocztowych na podstawie adresu bez wpisanego kodu pocztowego. W artykule przedstawiono proces opracowywania przesyłek w logistycznych systemach pocztowych oraz metody przetwarzania obrazu przesyłki pocztowej w celu zautomatyzowania procesu odczytu adresu. 1. PROCESY OBSŁUGI PRZESYŁEK W POCZTOWYCH SYSTEMACH LOGISTYCZNYCH Przesyłka pocztowa jest to ładunek jednostkowy opatrzony adresem, przyjęty przez operatora pocztowego w celu przemieszczenia i doręczenia adresatowi. Zgodnie z tą definicją przesyłka pocztowa może być formą łączności polegającej na zdalnym przekazywaniu dokumentów lub przedmiotów przy użyciu środków transportu lądowego, wodnego, powietrznego lub elektronicznego. W procesie przemieszczania, przesyłania przesyłek od nadawcy do adresata występują następujące zasadnicze fazy (Rysunek 1). Rys. 1. Fazy przepływu przesyłek od fazy nadania do fazy doręczenia W procesie technologicznym przesyłania przesyłek listowych istotne znaczenie ma jakość tego procesu, którego miarą jest czas przebiegu przesyłki od nadawcy do adresata. Na podstawie analizy powyższych faz ze względu na długość czasu przebiegu przesyłek, można stwierdzić, że najbardziej czasochłonne są dwa etapy: przemieszczanie przesyłek między węzłami rozdzielczymi, segregacja przesyłek w węzłach rozdzielczych. 1 Uniwersytet Technologiczno - Przyrodniczy w Bydgoszczy, Wydział Telekomunikacji. Informatyki i Elektrotechniki, Zakład Systemów Teleinformatycznych; 85-225 Bydgoszcz; ul. Kordeckiego 20. Tel.: + 48 52 340-81-14, 340-81-15, E-mail: [roman.wiatr, miroslaw.miciak]@utp.edu.pl 1447

W całym procesie pocztowym wiodącą rolę pełnią Węzły Ekspedycyjno Rozdzielcze (WER) [18], ponieważ opracowują one większość przepływających w systemie pocztowym przesyłek. W węzłach zbiegają się strumienie przesyłek pochodzących niemalże ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER są one rejestrowane w systemie teleinformatycznym. Dokonuje się tego na stanowiskach recepcyjnych, przy użyciu skanerów kodów kreskowych, które umieszczane są na opakowaniach zbiorczych, a także na niektórych rodzajach przesyłek. Dzięki temu fizycznemu strumieniowi ładunków przepływającemu w sieci logistycznej, generowane są informacje o tych ładunkach, a także o ich zawartości, co stanowi jednocześnie podstawę dla funkcjonowania systemu śledzenia przesyłek, a także bazę danych dla działań analitycznych, sprawozdawczych i reklamacyjnych. Podstawowe elementy składowe WER to: zintegrowany system teleinformatyczny, kompleksowy system transportu wewnętrznego, wielofunkcyjne maszyny sortownicze do rozdziału listów o rozmiarach standardowych (ekonomicznych, priorytetowych, ekonomicznych i in.), listów niestandardowych (flatów), paczek, urządzenia wspomagające proces pocztowy jak systemy komunikacji i lokalizacji środków transportu, system śledzenia przesyłek. Ze względu na pracochłonność procesu, terminy czasowe dostarczania przesyłek najwięcej uwagi wymaga proces sortowania przesyłek listowych. Maszyny do automatycznego opracowywania przesyłek listowych są ustawione jako niezależne segmenty: maszyna rozdzielająca i licująco stemplująca CFC, zintegrowana maszyna czytająca z wideokodowaniem IRV, maszyna do rozdziału szczegółowego FSM, Z punktu widzenia automatyzacji procesu sortowania najbardziej istotnym elementem składowym maszyny zintegrowana maszyna czytająca z wideokodowaniem IRV. Stosowane obecnie rozwiązania w systemach automatycznego opracowywania (sortowania) przesyłek pocztowych wykorzystują mechanizmy OCR (Optical Character Recognition). Moduł OCR jest kluczowym elementem procesu odpowiedzialnym za rozpoznawanie danych z pola adresowego, rozpoznawanie kodów paskowych i sprawdzenie poprawności opłaty pocztowej. Typowy system sortowania stosowany w Węzłach Ekspedycyjno - Rozdzielczych (Rysunek 2) składa się z modułu akwizycyjnego, modułu wideokodowania oraz części rozpoznającej pismo. Moduł akwizycji wysyła obraz przesyłki do segmentu OCR. Jeżeli system OCR jest w stanie rozpoznać dane (technologia ta zapewnia około 50% skuteczność dla wszystkich przesyłek), to automatycznie odsyła je do systemu. W przypadku gdy odczyt danych nie jest możliwy, to obraz przesyłki trafia do modułu wideokodowania, gdzie operator odczytuje dane i wpisuje je do systemu [4]. Główne problemy przedstawionego rozwiązania: duża liczba przesyłek opracowanych ręcznie 300000-500000 (na 1,5 do 2mln wszystkich przesyłek opracowywanych dziennie), ręczny rozdział przesyłek poleconych. Każda ma numer, musi być policzona i sprawdzona, w ciągu doby opracowanych i liczonych jest od 250 000 do 380 000 listów poleconych, sortowane są tylko przesyłki standardowe, typowe, ze znaczkiem w prawym górnym rogu, adresem wpisanym w odpowiedniej kolejności: imię, nazwisko, ulica, kod pocztowy i miasto (bez podkreśleń), często zdarzają się jednak listy nietypowe (za grube, okrągłe), ale też niestarannie i nieczytelnie zaadresowane, ze złym kodem lub w ogóle bez niego. Typowy system sortowania składa się w zasadzie z trzech faz wspomaganych fazą wideokodowania (w przypadku gdy system nie jest w stanie odczytać adresu) (Rysunek 2). 1448

Rys.2. Schemat blokowy systemu sortowania przesyłek pocztowych Prowadzone są prace w celu podniesienia skuteczności modułu OCR w dziedzinie odczytywania pisma ręcznego. Pomimo, iż uzyskano zadowalające rezultaty z rozpoznawaniem pisma maszynowego, to pismo ręczne jest nadal trudne do interpretacji. Biorąc pod uwagę fakt, że przesyłki opisane ręcznie stanowią 30% całości przesyłek ważne jest, aby zapewnić lepsze wykorzystanie możliwości segmentu rozpoznającego pismo ręczne. W związku z powyższym dokonano analizy problemów związanych z funkcjonowaniem modułu optycznego rozpoznawania znaków w systemach pocztowych i wskazano szereg problemów, do których można zaliczyć: zniekształcenia procesu akwizycji, niejednolite tło, zmiany oświetlenia, szumy, obrót, zmiana skali, uszkodzone znaki z brakującymi elementami, przekreślenia itp. 2. PARAMETRY ADRESOWANIA PRZESYŁEK ZE WZGLĘDU NA SKUTECZNOŚĆ ICH ROZPOZNANIA Wymagania dotyczące przesyłki listowej, bloku adresowego oraz dostosowanie znaczków pocztowych zostały ściśle sprecyzowane i uregulowane w obowiązujących przepisach pocztowych. Przepisowy format przesyłki listowej dostosowanej do automatycznego rozdziału to: długość: 138-240mm, wysokość: 88-165mm, grubość: 0,16-5mm, masa maksymalna: 50g. Wymagania bloku adresowego są następujące: pomiędzy poszczególnymi wierszami bloku adresowego nie należy pozostawiać odstępów, początki wierszy w bloku adresowym winny leżeć w jednej linii, nie należy używać podkreśleń, PNA (pocztowy numer adresowy) i nazwę miejscowości należy umieścić w ostatnim wierszu, PNA należy wpisywać we właściwe, wstępnie nadrukowane okienka, wiersze adresu nie mogą przebiegać ukośnie, w przypadku stosowania kopert z okienkami, adres musi być w całości widoczny w okienku. 1449

Rys. 3. Wzór strony czołowej listu nadającego się do sortowania maszynowego Ponadto podane są zalecenia, na które należy zwrócić uwagę podczas adresowania przesyłek: adres pisz czytelnym pismem, kod i miejscowość pisz drukowanymi, prostymi, oddzielnymi literami, nie podkreślaj adresu lub jego części, pierwsze litery poszczególnych linii adresu muszą tworzyć jedną kolumnę, poniżej kodu i nazwy miejscowości nie umieszczaj żadnych napisów, rysunków czy naklejek, używaj niebieskiego lub czarnego tuszu, nie pisz adresu kolorem czerwonym (i jego pochodnymi), gdyż maszyny nie odczytają adresu w tym kolorze, należy unikać drukarek igłowych (nanoszone przez nie znaki są nieczytelne dla maszyny sortującej korespondencję), wysokość czcionki użytej przy adresowaniu nie powinna być mniejsza niż 2,5mm i nie większa niż 4,7mm, logo, napisy reklamowe, znaki drukarskie, itp. powinny być umieszczone z lewej strony bloku adresowego. Kod pocztowy PNA (pocztowy numer adresowy) jest to ciąg cyfr (rzadziej liter i cyfr) dodawany do adresu, mający ułatwiać sortowanie przesyłek. Format i zasady umieszczania kodów pocztowych są różne w różnych krajach. W Polsce system kodów pocztowych wprowadzono 1 stycznia 1973 na mocy rozporządzenia nr 89 Ministerstwa Łączności z 17 listopada 1972. Kody pocztowe mają format dd-ddd, gdzie d oznacza cyfrę, i umieszcza się je z lewej strony nazwy miejscowości, w której znajduje się pocztowy urząd oddawczy. Pierwsza cyfra określa okręg pocztowy, druga strefę kodową, która wskazuje część okręgu którym jest określony obszar położony wzdłuż linii komunikacyjnych lub miasto wojewódzkie, trzecia to sektor kodowy obejmująca obszar podległy rozdzielni sektorowej, a w dziewiętnastu największych miastach umowne części miast. Czwarta i piąta wskazują placówkę pocztową i jej obszar działania lub jednostkę doręczeniową. Automatyczne rozpoznawanie kodów pocztowych jest kluczowym elementem systemu sortowania, bowiem od niego zależy skuteczność całego systemu. Obecna technologia rozpoznawania kodów opiera się na systemach ICR, które jest odmianą systemów OCR wykorzystywanych w procesie przetwarzania danych z dokumentów typu formularze. 3. METODY LOKALIZACJI DANYCH TELEADRESOWYCH W praktyce spotyka się sposoby adresowania znacznie odbiegającą od ww. zaleceń (Rysunek 4). 1450

Rys. 4. Różne przykłady adresowania przesyłek pocztowych W celu odnalezienia danych teleadresowych na przesyłce pocztowej należy oddzielić elementy zawierające tekst od elementów grafiki, ponieważ na przesyłce bardzo często znajdują się inne obiekty takie jak pieczęci, znaczki, reklamy, logo firmy, itp. Powszechnie w tym celu stosuje się algorytmy morfologiczne [14], algorytmy oparte na izolowaniu znaków na podstawie cech izotropowych [16], algorytmy bazujące na analizie tła [15], profilu rzutowania [9], czy algorytmy oparte na rozpoznawaniu znaków w izolowanych obiektach [2]. Działanie zaproponowanego algorytmu oparte jest na badaniu kolejnych fragmentów obrazu przesyłki, gdzie uzyskiwane są dwie wielkości: liczba punktów obiektu (1) oraz liczba zmian z 0 na 1 oraz z 1 na 0. Obie wielkości są mnożone, obszar, dla którego pomiar osiągnął wartość maksymalną jest klasyfikowany jako obszar, w którym znajduje się tekst [6]. Dodatkowo stosuje się moduł decyzyjny, który pozwoli określić obszary gdzie znajdują się dane adresata [12,13]. Kolejnym etapem przetwarzania obrazu danych teleadresowych jest usunięcie kąta przekosu [7]. Do określenia jego wartości możemy wykorzystać metodę bazującą na poziomym profilu rzutowania oraz rozkładzie Winger-Ville [6]. Poziomy profil rzutowania dla obrazu teksu (danych adresowych) charakteryzuje się większymi wartościami szczytowymi oraz posiada większą dynamikę zmian, niż poziomy profil tego samego tekstu umieszczonego pod kątem. Następnym krokiem jest segmentacja obrazu na linie. W tym celu wykorzystuje się uzyskany w poprzednim kroku poziomy profil rzutowania i jeżeli linie są od siebie dostatecznie odseparowane, to histogram przedstawia dobrze oddzielone wartości szczytowe oraz minima [11]. Analizując różne rodzaje pisma ręcznego można zauważyć, że większość znaków pisanych ręcznie jest pochylona w prawo bądź w lewo. Związku z czym, przed operacją segmentacji powinna zostać przeprowadzona korekcja nachylenia znaków. Sporządzany jest w tym celu poziomy profil rzutowania, który dla wyrazów nie nachylonych charakteryzuje się tym, że występują w min większe przerwy między znakami (minima), natomiast w wyrazach pochylonych, znaki zakrywają przerwy i histogram jest bardziej płynny. Podobnie jak w przypadku określenia kąta przekosu zaproponowano algorytm, który umożliwi korekcją kąta pochyłu znaków w oparciu o histogram z największą liczbą minimów [6]. Wyrazy pisane ręczne zazwyczaj są rozdzielone i w celu segmentacji również stosuje się poziomy profil rzutowania obrazu linii tekstu. Wyznaczone minima histogramu stanowią granicę podziału wyrazów. W piśmie ręcznym przerwy miedzy słowami są zazwyczaj dłuższe niż średnia szerokość znaku, więc może to być dobre kryterium dla określenia granicy wyrazów. Estymacja szerokości znaku realizowana jest przez określenie wysokości wyrazu i należy ją przeprowadzić dla każdej linii tekstu, ponieważ często rozmiar znaków pisanych ulega zmianie w trakcie pisania. Podobnie realizowany jest podział na znaki kodu pocztowego, gdzie kryterium podziału stanowi również wysokość linii. W rezultacie otrzymujemy obrazy znaków odpowiadające poszczególnym cyfrom kodu pocztowego. 1451

4. PROBLEMATYKA PRZETWARZANIA OBRAZÓW Problematyka przetwarzania obrazów swoim zasięgiem obejmuje zagadnienia związane z dyskretną reprezentacją obrazu, kodowaniem, lokalizacją obiektów, rozpoznawaniem, klasyfikacją czy transmisją w sieci telekomunikacyjnej. Procesy związane z rozpoznawaniem obrazu przedstawiono na rysunku 5. Rys. 5. Schemat procesu rozpoznawania obrazów Obraz w postaci cyfrowej poddawany jest przetwarzaniu wstępnemu. Następnie realizowany jest proces ekstrakcji cech charakterystycznych, które są reprezentacją obiektów obrazu. Otrzymane wielkości są selekcjonowane i kodowane dla potrzeb systemu (np. obrazowej bazy danych) i stanowią wektor cech. Zatem w procesie rozpoznawania można wyróżnić etap pozyskiwania i selekcji cech (nazywany też ekstrakcją cech) oraz etap klasyfikacji obiektu do konkretnej klasy. W przypadku obrazu można zdefiniować go, jako zbiór pewnych charakterystycznych właściwości (cech). Cechy można przedstawić zazwyczaj w wielowymiarowym układzie współrzędnych. Obiekty obrazu reprezentowane są przez n cech. Cechy te tworzą n wymiarową przestrzeń cech, w której każda współrzędna reprezentuje odpowiednią cechę. Selekcja cech jest istotnym elementem systemu, stosowana jest w celu znalezienia reprezentacji danych w przestrzeni o mniejszej liczbie wymiarów, w której dane należące do poszczególnych klas będą lepiej separowalne. Niezbędnym elementem tego etapu jest segmentacja obrazu [5] (ang. image segmentation), która umożliwia podział obrazu na regiony homogeniczne pod względem pewnej własności (np. intensywność, kolor, tekstura). Wybrane metody segmentacji są z powodzeniem stosowane w systemach optycznego rozpoznawania znaków [17]. Istnieje bliski związek pomiędzy omówionym zadaniem rozpoznawania obrazów a zagadnieniem rozpoznawania pisma. W związku z czym, rozwiązania opracowane dla identyfikacji obrazów mogą być przynajmniej w części adaptowane dla celów rozpoznawania pisma ręcznego czy maszynowego. Prace nad problemem rozpoznawania pisma trwają od wielu lat, czego efektem jest wysoka skuteczność systemów odczytujących pismo maszynowe (przekracza poziom 98%). Niemniej jednak w dalszym ciągu prowadzi się prace nad efektywnością rozwiązań przetwarzających pismo, w szczególności uwzględniając jego ręczną odmianę. W aplikacjach pojawiają się trudności związane z technicznymi aspektami procesu akwizycji tekstu. Duże znaczenie mają zakłócenia w postaci różnego rodzaju szumów powstających w samym procesie akwizycji oraz zniekształcenia znajdujące się bezpośrednio na nośniku zawierającym tekst. Zastosowanie odpowiednich filtrów wpływa na podniesienie jakości pracy systemu, lecz generuje większe zapotrzebowania na moc obliczeniową danego rozwiązania. Doskonałym przykładem są tutaj specyficzne warunki pracy systemów pocztowych, gdzie ze względu na dużą różnorodność przesyłek i sposobów adresowania pojawiają się wymienione problemy, co w rezultacie prowadzi do zmniejszenia wydajności Węzłów Ekspedycyjno - Rozdzielczych w zakresie ilości opracowywanych przesyłek. Zasadniczy wpływ na powstawanie błędów ma: rodzaj nośnika na którym jest wykonywane pismo (materiał, gramatura, struktura itp.), kolorowe tło lub zawierające teksturę, 1452

rodzaj i kolor środka piśmienniczego (atrament, długopis, druk igłowy itp.), nierówność oświetlenia w procesie akwizycji, plamy, pożółknięcia papieru, przekreślenia i inne lokalne zaburzenia tła, rozmycie krawędzi znaków (np. słaba jakość druku). Algorytmy segmentacji i rozpoznawania zaimplementowane w systemach OCR nie są w stanie prawidłowo oszacować kształtu znaków, jeśli rozdzielczość obrazu otrzymana w procesie akwizycji nie jest wystarczająca duża. Np. dla dokumentów drukowanych czcionką (10 lub 12 pt.) zwykle minimalna rozdzielczość gwarantująca prawidłową pracę wynosi 300 DPI. Niedostateczna rozdzielczość może wystąpić w przypadku, gdy obraz jest pozyskiwany z kamery analogowej lub aparatu cyfrowego ze znacznej odległości. Na rozdzielczość obrazu ma również wpływ format kodowania obrazu, np. ograniczona głębia koloru lub ograniczona liczba odcieni szarości może spowodować błędy binaryzacji. Zapis obrazu z użyciem kompresji stratnej może powodować błędy w rozpoznawaniu kształtu znaków, ponieważ algorytmy kompresji stratnej powodują np. rozmycie krawędzi. Osobna grupę zniekształceń pojawiających się w etapie pozyskiwania obrazu tekstu są zniekształcenia geometryczne. O ile liniowe przypadki deformacji takie jak obrót czy przesunięcie są możliwe do wyeliminowana, to problem pojawia się już przy tzw. perspektywie zbieżnej - czyli wtedy kiedy obiektyw nie jest ustawiony prostopadle do powierzchni. Duże zniekształcenia geometryczne mogą całkowicie uniemożliwić rozpoznawanie tekstu, np. efekt spowodowany zbytnim wygięciem powierzchni podczas akwizycji obrazu przesyłki lub odczytywaniem adresu umieszczonego na wielkogabarytowej przesyłce. W zależności od przeznaczenia danego systemu rozpoznawania pisma eliminacja odpowiednich zniekształceń geometrycznych staje się ważnym zadaniem opracowywanego rozwiązania. Architektura systemów rozpoznawania pisma dla celów pocztowych, podobnie jak w przypadku rozpoznawania obrazów oparta jest głównie o klasyfikatory, które umożliwiają określenie przynależności badanego znaku do właściwej klasy. Możliwe jest to w oparciu o zbiór pewnych własności znaków otrzymanych w etapie pozyskiwania i selekcji cech. W idealnym przypadku zbiór parametrów opisujących znak powinien zawierać tylko niezbędne atrybuty umożliwiające poprawne przydzielenie znaku do określonej klasy. Najważniejsze typy cech pisma mogą być zgrupowane następująco [10] (Rysunek 6): Rys. 6. Podział metod rozpoznawania znaków ze względu na rodzaj wydzielanych cech Cechy strukturalne - opisujące geometryczne i topologiczne własności lokalnych i globalnych cech danego obiektu. Do cech strukturalnych wykorzystywanych w metodach rozpoznawania znaków można zaliczyć m.in. :współczynnik proporcji wysokości i szerokości znaku, liczbę punktów przecięcia w znaku, czy też liczbę pętli i rozgałęzień danego znaku. Metody bazujące na tych atrybutach charakteryzują się małą wrażliwością na zmiany charakteru pisma lub kroju czcionki oraz możliwością jednoczesnego stosowania kombinacji wielu parametrów, co pozytywnie wpływa na skuteczność tego typu rozwiązań [3]. Cechy statystyczne - opierają się głównie na badaniu wielkości związanych z rozmieszczeniem poszczególnych punktów należących do badanego znaku. Do tej grupy cech można zaliczyć dane otrzymane w wyniku analizy statystycznej obrazu. Przykładami cech mogą być wyniki operacji podziału obrazu na odpowiednie obszary (ang. zoning) [1] i wyznaczenie min. takich parametrów jak: koncentracja punktów danego obiektu, kierunek krawędzi, histogram, rzut (np. poziomy lub pionowy profil rzutowania), czy też liczba zmian tło-obiekt. 1453

Cechy globalne - techniki pozyskiwania cech bazujące na stosowaniu różnego rodzaju transformat pozwalają na redukcję przestrzeni cech i umożliwiają osiągnięcie niezmienności względem przesunięcia, zmiany skali i obrotu. Do grupy przekształceń wykorzystywanych w opracowaniach dotyczących rozpoznawania pisma można zaliczyć: transformatę Fouriera, DWT,Radona, momenty centralne i Zernike, czy też kod łańcuchowy. Analiza szeregu publikacji dotyczących tematyki przetwarzania obrazów i rozpoznawania znaków w szczególności dla celów pocztowych pozwala na stwierdzenie iż metody rozpoznawania znaków w ogólności bazują na informacji o kształcie. Zatem można je podzielić na: Metody konturowe - są łatwe w implementacji ale bardzo wrażliwe na zakłócenia. W większości bazują na doskonale znanej transformacie Fouriera. Niestety w przypadku niektórych zastosowań w obrazach występują duże zniekształcenia (szumy, bardzo zróżnicowane tło szare, białe, jasno brązowe, bardzo różny kolor znaków, znaki z dobrze widocznymi fragmentami itp.) dlatego skuteczność tej metody jest niewielka. Metody obszarowe wykorzystujące w procesie rozpoznawania znaków najczęściej różnego rodzaju momenty. Wymagają one binaryzacji, normalizacji i dużego nakładu obliczeniowego. Są również bardziej odporne na zakłócenia obrazu. WNIOSKI Problematyka przetwarzania obrazów swoim zakresem obejmuje zagadnienia związane z dyskretną reprezentacją obrazu, kodowaniem, lokalizacją obiektów, rozpoznawaniem, klasyfikacją czy transmisją w sieci telekomunikacyjnej. W aplikacjach pocztowych pojawiają się trudności związane z technicznymi aspektami procesu akwizycji adresu przesyłki. Zasadniczy wpływ na powstawanie trudności ma: rodzaj nośnika na którym jest wykonywane pismo (materiał, gramatura, struktura itp.), kolorowe tło lub zawierające teksturę, rodzaj i kolor środka piśmienniczego (atrament, długopis, druk igłowy itp.), nierówność oświetlenia w procesie akwizycji, plamy, pożółknięcia papieru, przekreślenia i inne lokalne zaburzenia tła, rozmycie krawędzi znaków (np. słaba jakość druku). Architektura systemów rozpoznawania pisma dla celów pocztowych, podobnie jak w przypadku rozpoznawania obrazów oparta jest głównie o klasyfikatory, które umożliwiają określenie przynależności badanego znaku do właściwej klasy. Głównym ograniczeniem opisanych technik jest konieczność stosowania dodatkowych operacji przetwarzania wstępnego takich jak normalizacja. Do tej grupy należą: zmiana zakresu jaskrawości, zmiana skali, zmiana orientacji, przesunięcia, szkieletyzacji, ścieniania. Przedstawione w pracy problemy wskazują na konieczność posługiwania się metodami ekstrakcji cech i klasyfikacji, które są niewrażliwe na zniekształcenia obrazu przesyłki pocztowej. W dalszych pracach zostaną przedstawione propozycje metody klasyfikacji przesyłek pocztowych na podstawie cech uzyskanych z przestrzeni parametrycznej. Szczególna uwaga zostanie zwrócona na metody związane z zastosowaniem transformaty Radona. Streszczenie Rozpoznawanie i przetwarzanie obrazów jest powszechnie wykorzystywane w technice komputerowej do identyfikacji dokumentów w urzędach i instytucjach użyteczności publicznej. Obecnie pojawiają się możliwości zastosowania systemów przetwarzania obrazów do rozpoznawania znaków w procesach sortowania przesyłek pocztowych na podstawie adresu bez wpisanego kodu pocztowego. W procesie przesyłania przesyłek od nadawcy do adresata oraz ich sortowania wiodącą rolę pełnią Węzły Ekspedycyjno - Rozdzielcze (WER). W WER-ach zainstalowane są wielofunkcyjne zautomatyzowane maszyny sortownicze do rozdziału przesyłek listowych. Z punktu widzenia automatyzacji procesu sortowania najbardziej istotnym elementem składowym maszyny zintegrowana maszyna czytająca stronę adresowa przesyłki z wideokodowaniem. Stosowane obecnie rozwiązania w systemach automatycznego opracowywania (sortowania) przesyłek pocztowych wykorzystują mechanizmy OCR (Optical Character Recognition). W artykule przedstawiono problematykę przetwarzania obrazu przesyłki pocztowej w celu zautomatyzowania procesu odczytu adresu. 1454

The postal image processing problems in logistics tasks Abstract The image recognition is widely used in computer technology to documents identification in public offices. Currently, there are new possibilities to use image processing systems for character recognition in postal processing on basis of address area (postal code). The nodes of forwarding and distribution plays important role in postal processing. There are the multifunction sorting machines of mailpieces distribution. The most important unit of these systems is module to reading addresses data from mail pieces and videocoding module. Current technology uses OCR (Optical Character Recognition) mechanisms. In this paper we presented main problems of image processing to automate reading of data address from post mails. BIBLIOGRAFIA 1. Aires S. B. K., Freitas C. O. A., Perceptual Zoning for Handwritten Character Recognition. 12th Conference of the International Graphonomics Society, Włochy 2005. 2. Bourbakis N., Methodology for document processing: separating text from images. Engineering Applications of Artificial Intelligence, Vol. 14, 2001. 3. Gonzales R.C., Woods R.E., Digital Image Processing. Addison-Wesley Publishing Company, Boston 1992. 4. Ishikura T., Adachi T., Video Coding technology for postal automation system: Special issue on postal automation technology. NEC research and development 40, Tokyo, s. 176-180, 1999. 5. Jain A. K., Murty M. N., Flynn P. J., Data Clustering: A Review. ACM Computing Surveys, Vol. 31, 1999. 6. Kavallieratou E., Fakotakis N., Kokkinakis G., An unconstrained handwriting recognition system. International Journal on Document Analysis and Recognition, vol. 4, nr 4, Springer-Verlag, Heidelberg 2004. 7. Kavallieratou E., Fakotakis N., Kokkinakis G., New Algorithms for Skewing Correction and Slant Removal on Word-Level, Electronics. Circuits and Systems, Vol. 2, Cypr 1999. 8. Kavallieratou E., N. Fakotakis N., Kokkinakis G., Skew angle estimation in document processing using Cohen's class distributions. Pattern Recognition Letters, Vol. 20, Elsevier, Holland 1999. 9. Khedekar S., Ramanaprasad V., Setlur S., V. Govindaraju V., Text - Image Separation in Devanagari Documents. Document Analysis and Recognition, Edinburgh 2003. 10. Khorsheed M. S., Off-line Arabic character recognition: A review. Pattern analysis and applications, Vol. 5, pp. 31-45. Springer 2002. 11. Marti U., Bunke H., Line Segmentation and Word Recognition in a System for General Writer Independent Handwriting Recognition. Sixth International Conference on Document Analysis and Recognition, USA 2001. 12. Maszewski M., M.Miciak M., Rozpoznawanie danych teleadresowych z wykorzystaniem współczynników Fouriera i zespolonej dyskretnej transformacji falkowej opartej na projekcji. Techniki Przetwarzania Obrazu, Serock 2006. 13. Miciak M., Marchewka M., The recognition of Postal Code Using Fourier Transform Method. XII Konferencja Sieci i Systemy Informatyczne, Łódź 2004. 14. Muge F., Automatic Feature Extraction and Recognition for Digital access of Books of the Renaissance, Lecture Notes in Computer Science, Vol. 1923, Springer-Verlag, Heidelberg 2000. 15. Parodi P., Fontana R., Efficient and flexible text extraction from document pages. International Journal on Document Analysis and Recognition, Vol. 2, Springer-Verlag, Heidelberg 1999. 16. Parodi P., Piccioli G., An efficient pre-processing of mixed-content document images for OCR systems. Proceedings of the 13th International Conference on Pattern Recognition, vol. 3, Wiedeń 1996. 17. Pavlidis T., Grafika i przetwarzanie obrazów. WNT, Warszawa 1987. 18. Wiatr R., Rawłuszko J., On the problems of logistics network project in the Polish Post, VI Th International Scientific Conference POSTPOINT` 2005`,Żylina (Słowacja), 28-30.09, 2005. 1455