Procesy usprawniające w systemach klasyfikacji i sortowania przesyłek pocztowych



Podobne dokumenty
ADAPTACYJNA METODA UCZENIA MASZYNOWEGO W SYSTEMACH KLASYFIKACJI I SORTOWANIA PRZESYŁEK POCZTOWYCH

KRYTERIA SPRAWNOŚCI POCZTOWYCH SYSTEMÓW TECHNICZNYCH W ZAKRESIE ROZDZIAŁU PRZESYŁEK

PROBLEMY IDENTYFIKACJI DANYCH ADRESOWYCH W AUTOMATYCZNYM PROCESIE SORTOWANIA PRZESYŁEK

Poprawne adresowanie przesyłek listowych PORADNIK

Problematyka przetwarzania obrazu przesyłki pocztowej w procesach logistycznych opracowywania przesyłek

Więcej arkuszy znajdziesz na stronie: arkusze.pl

1) Nadawanie przesyłek pocztowych i kurierskich przez jednostki organizacyjne Uniwersytetu Ekonomicznego w Katowicach

skutecznie skraca czas potrzebny na przygotowanie korespondencji wchodzącej i wychodzącej

1.2 Logo Sonel podstawowe załoŝenia

Spis treści. spis treści wygenerowany automatycznie

Uchwała Nr 129/2016 Zarządu Poczty Polskiej S.A. z dnia 20 października 2016 roku

Pattern Classification

Opis przedmiotu zamówienia Wykonywanie usług obejmujących podstawowe czynności eksploatacyjne.

Widzenie komputerowe (computer vision)

Podstawy obsługi aplikacji Generator Wniosków Płatniczych

Obowiązuje od 1 grudnia 2014 r.

Program do obsługi ubezpieczeń minifort

OPIS PRZEDMIOTU ZAMÓWIENIA

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem.

Wprowadzenie (17) Część I. Makra w Excelu - podstawy (23)

POWSZECHNE USŁUGI POCZTOWE

EKSPLOATACJA SYSTEMÓW TECHNICZNYCH - LAB. Wprowadzenie do zajęć

Instrukcja dla autorów monografii

Numer ogłoszenia : ; data zamieszczenia :

Załącznik nr 13 do umowy agencyjnej ZASADY OBSŁUGI KLIENTÓW UMOWNYCH W AGENCJACH POCZTOWYCH

ZARZĄDZENIE NR 33/2012 STAROSTY LUBIŃSKIEGO. z dnia 6 kwietnia 2012 r. w sprawie obiegu korespondencji i wysyłania pism

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

OPIS PRZEDMIOTU ZAMÓWIENIA

Obowiązuje od 1 kwietnia 2014 r. Regulamin świadczenia usługi niepocztowej Mailing profilowany w obrocie krajowym

Podstawowe informacje o obsłudze pliku z uprawnieniami licencja.txt

USŁUGI POCZTOWE DIRECT MAIL KORESPONDENCJA MASOWA KOLPORTAŻ

1. Zaczynamy! (9) 2. Edycja dokumentów (33)

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

SZKOLENIA I STUDIA PODYPLOMOWE DOFINANSOWANE Z EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO

TYTUŁ PRACY 18 pkt, bold

WSPOMAGAJĄCY ZARZĄDZANIE DROGAMI

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2017 CZĘŚĆ PISEMNA

Regulamin świadczenia usługi pocztowej niepowszechnej przesyłka firmowa w obrocie krajowym. Rozdział I Postanowienia ogólne

Spis treści OPIS PLIKU W FORMACIE CSV Z DANYMI PPE LUB EP 1

SZCZEGÓŁOWE WARUNKI TECHNICZNE ELEMENTÓW PAKIETU DLA REALIZACJI ZAMÓWIENIA

Zał. Nr 3 do Zarządzenia Nr 61/0809. Instrukcja działania Referatu Pocztowego

Identyfikacja obrazu opłaty pocztowej w systemach logistycznych poczty

Umowa nr. 5. Strony zobowiązują się do zachowania tajemnicy pocztowej zgodnie z art. 41 ustawy z dnia 23 listopada 2012 r. Prawo pocztowe.

Konfiguracja aplikacji pakietu SAWA do obsługi numerów nadawczych firmy Polska Grupa Pocztowa S.A.

MS Word Długi dokument. Praca z długim dokumentem. Kinga Sorkowska

10. Redukcja wymiaru - metoda PCA

SYSTEM MONITOROWANIA DECYZYJNEGO STANU OBIEKTÓW TECHNICZNYCH

Załącznik nr 4. Znak sprawy: EAD/260/1/2017 OPIS PRZEDMIOTU ZAMÓWIENIA

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 201 CZĘŚĆ PISEMNA

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA

Etykieta logistyczna GS1 Etykieta logistyczna jednostki logistycznej Jednostka logistyczna SSCC Serial Shipping Container Code

Obowiązuje od 1 grudnia 2014 r.

Regulamin. świadczenia usługi pocztowej niepowszechnej przesyłka aglomeracja w obrocie krajowym. Rozdział I Postanowienia ogólne

Spotkania z wiedzą webinarium

Zalecenia projektowe i montaŝowe dotyczące ekranowania. Wykład Podstawy projektowania A.Korcala

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

WPROWADZANIE ZLECEŃ POPRZEZ STRONĘ INSTRUKCJA UŻYTKOWNIKA

Instrukcja oznakowania przedsięwzięć dofinansowywanych ze środków Narodowego Funduszu Ochrony Środowiska i Gospodarki Wodnej.

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla administratora systemu Warszawa 2007

Sterownik. zasady obsługi. moduł programu Madar 7

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PISEMNA

DECYZJE. (Tekst mający znaczenie dla EOG)

Formularz MS Word. 1. Projektowanie formularza. 2. Formularze do wypełniania w programie Word

System do rekrutacji nowej generacji

Etykieta logistyczna GS1

1. WIADOMOŚCI WPROWADZAJĄCE DO PROJ. I GR. INŻ.

Szczegółowy opis przedmiotu zamówienia

Obowiązuje od dnia 1 listopada 2016 roku

Świadczenie usług pocztowych w obrocie krajowym i zagranicznym na rzecz Urzędu Gminy

2017/2018 WGGiOS AGH. LibreOffice Base

Skanery serii i5000. Informacje o kodach separujących. A-61801_pl

CRM VISION Instalacja i uŝytkowanie rozszerzenia do programu Mozilla Thunderbird

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Problematyka rozpoznawania obrazu opłaty pocztowej w systemach logistycznych poczty

Logiczny model komputera i działanie procesora. Część 1.

INSTRUKCJA INWENTARYZACJI

ZAPYTANIE OFERTOWE. 3) Miejsce dostarczania przesyłek pocztowych: Ośrodek Rozwoju Edukacji w Warszawie, Al. Ujazdowskie 28 oraz ul.

Kompletacja (picking) prof. PŁ dr hab. inż. Andrzej Szymonik Łódź 2014/2015

Instrukcja użytkownika. Aplikacja dla Comarch ERP XL

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Opracował Jan T. Biernat

WYTYCZNE DOTYCZĄCE PROMOCJI

Program automatycznej obsługi sklepu i supermarketu

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Jawor: Świadczenie usług pocztowych Numer ogłoszenia: ; data zamieszczenia: OGŁOSZENIE O UDZIELENIU ZAMÓWIENIA - Usługi

A Zadanie

SPECYFIKACJA PHARMA KODU

MDW. (Moduł Dystrybucji Wysyłek) (Moduł Magento) v Strona 1 z 11

INSTRUKCJA WDROŻENIA FUNKCJONALNOŚCI NADRUKU AUTOMATYCZNEGO NUMERU NADAWCZEGO

Program dla praktyki lekarskiej. Instrukcja zmian wersji 2.4

Obowiązuje od 5 września 2018 r. Regulamin świadczenia usługi niepocztowej Mailing profilowany w obrocie krajowym

Dostęp do poczty przez www czyli Kerio Webmail Poradnik

Program do obsługi ubezpieczeń minifort

Instrukcja użytkownika. Aplikacja dla Comarch Optima

ZGOK.ZAM/04/17 Załącznik nr 1 SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

Import zleceń / Integracja klienta K-Ex

KURIER BY CTI. Instrukcja do programu DATA Informatycznej Zygmunt Wilder w Gliwicach WERSJA mgr Katarzyna Wilder DLA DPD

1. Przypisy, indeks i spisy.

Podstawy tworzenie prezentacji multimedialnej w programie. MS Power Point

Transkrypt:

WIATR Roman 1 MICIAK Mirosław 1 BONIECKI Rafał 1 Procesy usprawniające w systemach klasyfikacji i sortowania przesyłek pocztowych sortowanie przesyłek, uczenie maszynowe, zbiory przybliŝone Streszczenie W artykule przedstawiono metodę adaptacyjnego uczenia maszynowego do rozpoznawania i przetwarzania obrazów w procesach automatycznego opracowywania przesyłek pocztowych. Ze względu na proces automatycznego rozpoznawania adresu, najistotniejszym segmentem linii do automatycznego opracowywania przesyłek pocztowych jest zintegrowana maszyna czytająca z wideokodowaniem. W maszynie czytającej za pomocą modułu optycznego następuje rozpoznawanie znaków, gdzie w sposób automatyczny dokonuje się odczyt adresu przesyłki. Mała sprawność tego modułu podnosi koszty i zmniejsza przepustowość całego systemu opracowania przesyłek. Zaproponowano metodę bazującą na wydzielaniu cech znaków na podstawie analizy z wykorzystaniem zbiorów przybliŝonych. Dla kaŝdej z klas rozpoznawanych obiektów tworzone są reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworzą wzorcową bazę danych. Natomiast dane z procesu wideokodowania pozwalają na aktualizację bazy wzorców poszczególnych klas znaków. THE PROCESSES OF MACHINE LEARNING FOR CLASSIFICATION AND MAILSORTING SYSTEMS Abstract In this article we presented the method of adaptive learning for image processing and recognition for the postal applications. Due to the automatic postal address recognition, the most important element of the automatic sorting and processing post mails is integrated optical character recognition module with videocoding system. This solution can read the addresses data using optical character recognition module. Low efficiency of this module raises costs and reduces the throughput of the mail sorting system. The proposed method based on the character features derived from the rough sets analysis. For each classes of recognized objects (characters) are created the decision rules and distributions of the parameters that form the database. Whereas data from the videocoding process allow to update the database patterns of particular classes of characters. 1. WSTĘP Zadaniem systemu logistycznego Poczty Polskiej jest gromadzenie, segregacja, przemieszczanie, oraz doręczanie przesyłek pocztowych od nadawcy do adresata. W procesie logistycznym wiodącą rolę pełnią Węzły Ekspedycyjno - Rozdzielcze (WER) [7], w których opracowywana jest większość przepływających w systemie pocztowym przesyłek. Od szybkości ich opracowywania w węźle zaleŝy w duŝej mierze jakość tego procesu, którego miarą jest czas przebiegu przesyłki od nadawcy do adresata. Ze względu na pracochłonność procesu oraz standardy czasowe dostarczania przesyłek najwięcej uwagi wymaga proces sortowania przesyłek listowych. Z tego względu w Poczcie Polskiej od dwudziestu lat trwa proces wyposaŝania węzłów w linie do automatycznego opracowywania przesyłek listowych. Istotnym segmentem linii jest moduł optycznego rozpoznawania znaków (ang. OCR - Optical Character Recognition), gdzie następuje automatyczny odczyt adresu. Podstawowym problemem związanym z automatycznym sortowaniem przesyłek pocztowych jest znaczący wpływ sprawności modułu OCR na efektywność pracy systemu. W przypadku duŝej ilość przesyłek adresowanych odręcznym pismem, sprawność automatycznego odczytu przy uŝyciu modułu OCR znacząco spada. Dynamiczny rozwój technik przetwarzania obrazów pozwala na wprowadzenie rozwiązań umoŝliwiających podniesienie skuteczności automatycznego odczytu adresu. 2. PROCESY OPRACOWYWANIA PRZESYŁEK POCZTOWYCH W procesie przesyłania przesyłek pocztowych od nadawcy do adresata występują następujące zasadnicze fazy: gromadzenie, segregacja wstępna, przemieszczanie, segregacja, doręczanie. W tym procesie technologicznym istotne znaczenie ma jakość tego procesu, którego miarą jest czas przebiegu przesyłki od nadawcy do adresata [7]. MoŜna w nim wyróŝnić dwie zasadnicze fazy: transport przesyłek i ich opracowywanie. Na podstawie analizy powyŝszych faz ze względu na czas ich trwania moŝna stwierdzić, Ŝe najbardziej czasochłonne są dwa etapy: 1 Uniwersytet Technologiczno - Przyrodniczy w Bydgoszczy, Wydział Telekomunikacji i Elektrotechniki, Zakład InŜynierii Oprogramowania; 85-225 Bydgoszcz; ul. Kordeckiego 20.Tel.: + 48 52 340-81-14, 340-81-15, E-mail: [rafal.boniecki, roman.wiatr, mirosław.miciak]@utp.edu.pl 2415

przewóz przesyłek między węzłami rozdzielczymi, opracowywanie przesyłek w węzłach rozdzielczych. W całym procesie technologicznym wiodącą rolę pełnią Węzły Ekspedycyjno - Rozdzielcze (WER), poniewaŝ opracowują one większość przepływających w systemie pocztowym przesyłek. W węzłach zbiegają się strumienie przesyłek pochodzących niemalŝe ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER są one rejestrowane w systemie teleinformatycznym. Dokonuje się tego na stanowiskach recepcyjnych, przy uŝyciu skanerów kodów kreskowych, które umieszczane są na opakowaniach zbiorczych, a takŝe na niektórych rodzajach przesyłek. Dzięki temu fizycznemu strumieniowi ładunków przepływającemu w sieci logistycznej, generowane są informacje o tych ładunkach, a takŝe o ich zawartości, co stanowi jednocześnie podstawę dla funkcjonowania systemu śledzenia przesyłek, a takŝe bazę danych dla działań analitycznych, sprawozdawczych i reklamacyjnych [2]. Podstawowe elementy składowe WER to: zintegrowany system teleinformatyczny, kompleksowy system transportu wewnętrznego, wielofunkcyjne maszyny sortownicze do rozdziału listów o rozmiarach standardowych (ekonomicznych, priorytetowych, ekonomicznych i in.), listów niestandardowych (flatów), paczek, urządzenia wspomagające proces pocztowy jak system komunikacji i lokalizacji środków transportu, system śledzenia przesyłek. Ze względu na pracochłonność procesu, terminy czasowe dostarczania przesyłek najwięcej uwagi wymaga proces sortowania przesyłek listowych. Maszyny jako elementy składowe linii do automatycznego opracowywania przesyłek listowych są ustawione jako niezaleŝne segmenty: maszyna rozdzielająca i licująco stemplująca CFC, zintegrowana maszyna czytająca z wideokodowaniem IRV, maszyna do rozdziału szczegółowego FSM, maszyna do rozdziału przesyłek typu flat FSS. 3. ROZDZIAŁ PRZESYŁEK LISTOWYCH W WĘZŁACH EKSPEDYCYJNO ROZDZIELCZYCH (WER) Mechanizacja i automatyzacja procesów technologicznych to środki, jakie administracje pocztowe na świecie z powodzeniem zastosowało w celu usprawnienia procesów sortowania, a przede wszystkim dla zapewnienia terminowości przebiegu przesyłek. Poczta Polska proces ten rozpoczęła w 1992 r. Do chwili obecnej automatyczne rozdzielnie listowe pracują w następujących węzłach: Warszawa, Katowice, Poznań, Kraków oraz Łódź. Wszystkie te węzły są wyposaŝone w maszyny dostarczane przez niemiecką firmę Siemens Electrocom z wyjątkiem węzła w Warszawie, który wyposaŝono w linię do rozdziału przesyłek listowych firmy japońskiej Nippon Electric Company (NEC). Proces opracowywania listów w WER-ach moŝna podzielić na dwa etapy. W pierwszym następuje wstępna selekcja na przesyłki standardowe nadające się do sortowania maszynowego oraz przesyłki o nietypowych kształtach i rozmiarach przeznaczonych do opracowania ręcznego. Typowe przesyłki stemplowane są w maszynie CFC, gdzie na podstawie odblasku farby fluorescencyjnej i perforacji znaczka naklejonego na liście sprawdzane jest czy opłata została uiszczona. Umieszczenie odcisku datownika kończy pierwszy etap. W dalszej kolejności w maszynie czytającej z wideokodowaniem IRV, system za pomocą modułu optycznego rozpoznawania znaków (ang. OCR - Optical Character Recognition) automatycznie odczytuje adres. Rząd poziomych, pomarańczowych kresek w dolnej części listu lub pocztówki to efekt odczytania kodu pocztowego i nazwy miejscowości. Nanosi je, po elektronicznym przetworzeniu, drukarka natryskowa. Nadrukowany kod kreskowy posłuŝy następnym modułom LSM (ang. Letter Sorting Machine) i FSM (ang. Flat Sorting Machine) do końcowego (szczegółowego) rozdzielenia przesyłek. Posortują one i pogrupują korespondencję do wybranych obszarów, np. rejonów doręczeń i pocztowych urzędów oddawczych. W przypadku kiedy OCR nie moŝe sobie poradzić z odczytaniem danych adresowych, obraz przesyłki trafia do sekcji VCD (ang. Video Coding Desk). Jest to zespół stanowisk, wspomagających odczyt automatyczny, gdzie na ekranach monitorów pojawiają się strony adresowe przesyłek pocztowych. Operatorzy wpisują kody pocztowe, a w przypadku rozdziału przesyłek dla niektórych miast - nazwę ulicy i numer. Całość tworzy tzw. wideokodowanie (ang. Video Coding System) [5]. Podstawowe problemy związane z automatycznym sortowaniem przesyłek pocztowych to: znaczący wpływ sprawności modułu OCR na efektywność pracy systemu. W przypadku duŝej ilość przesyłek adresowanych odręcznym pismem, sprawność automatycznego odczytu przy uŝyciu modułu OCR znacząco spada. 4. PARAMETRY TECHNICZNO EKSPLOATACYJNE MASZYN DO AUTOMATYCZNEGO OPRACOWYWANIA PRZESYŁEK LISTOWYCH Maszyny do automatycznego opracowywania są ustawione jako niezaleŝne moduły. Parametry technologiczne poszczególnych modułów są następujące (parametry podano przykładowo dla maszyn firmy NEC, dla maszyn firmy Siemens zasadniczo się nie róŝnią): a) maszyna rozdziału wstępnego (IRV): prędkość przetwarzania 40 000 szt./h (max 45 000 szt./h), 2416

poziom odczytu adresu maszynowego 80% lub więcej, współczynnik błędu odczytu adresu maszynowego 0,5 % lub mniej, poziom odczytu adresu odręcznego, gdy kod PNA (Pocztowy Numer Adresowy) jest umieszczony w kratkach kodowych 83% lub więcej, poziom odczytu adresu odręcznego bez kodu PNA w kratkach kodowych 40 % lub więcej współczynnik błędu adresu odręcznego 1 % lub mniej, współczynnik odczytu rozszerzonego kodu kreskowego 98,3 % lub więcej, pojemność pamięci zeskanowanych obrazów przesyłek 240 tys. obrazów przesyłek. b) maszyny do rozdziału szczegółowego (FSM): prędkość przetwarzania 40 000 szt./h (max 45 000 szt./h), programy sortujące do - 100, liczba zasobników - 360 (8 drukarek etykiet), wskaźnik odczytu kodu - 98,3 % dla kodu 5-cyfr, wskaźnik błędnego sortowania 0,5% lub mniej, wskaźnik błędów odrzutów 0,2% 5. PARAMETRY ADRESOWANIA PRZESYŁEK ZE WZGLĘDU NA SKUTECZNOŚĆ ICH ROZPOZNAWANIA Wymagania dotyczące przesyłki listowej, bloku adresowego oraz dostosowanie znaczków pocztowych zostały ściśle sprecyzowane i uregulowane w obowiązujących przepisach pocztowych. Przepisowy format przesyłki listowej dostosowanej do automatycznego rozdziału to: długość: 138-240 mm, wysokość: 88-165 mm, grubość: 0,16-5 mm, masa maksymalna: 50 g. Wymagania bloku adresowego są następujące: pomiędzy poszczególnymi wierszami bloku adresowego nie naleŝy pozostawiać odstępów, początki wierszy w bloku adresowym winny leŝeć w jednej linii, nie naleŝy uŝywać podkreśleń, PNA i nazwę miejscowości naleŝy umieścić w ostatnim wierszu, PNA naleŝy wpisywać we właściwe, wstępnie nadrukowane okienka, wiersze adresu nie mogą przebiegać ukośnie, w przypadku stosowania kopert z okienkami, adres musi być w całości widoczny w okienku. Ponadto podane są zalecenia, na które naleŝy zwrócić uwagę podczas adresowania przesyłek: adres naleŝy pisać czytelnym pismem, kod i miejscowość drukowanymi, prostymi, oddzielnymi literami, nie naleŝy podkreślać adresu lub jego części, pierwsze litery poszczególnych linii adresu muszą tworzyć jedną kolumnę, poniŝej kodu i nazwy miejscowości nie naleŝy umieszczać Ŝadnych napisów, rysunków czy naklejek, powinno się stosować niebieski lub czarny tusz, nie naleŝy pisać adresu kolorem czerwonym (i jego pochodnymi), gdyŝ maszyny nie odczytają adresu w tym kolorze, naleŝy unikać drukarek igłowych (nanoszone przez nie znaki są słabo czytelne dla maszyny sortującej korespondencję), wysokość czcionki uŝytej przy adresowaniu nie powinna być mniejsza niŝ 2,5 mm i nie większa niŝ 4,7 mm, logo, napisy reklamowe, znaki drukarskie, itp. powinny być umieszczone z lewej strony bloku adresowego. Kod pocztowy (pocztowy numer adresowy) jest to ciąg cyfr (rzadziej liter i cyfr) dodawany do adresu, mający ułatwiać sortowanie przesyłek. Format i zasady umieszczania kodów pocztowych są róŝne w róŝnych krajach. W Polsce system kodów pocztowych (Pocztowe Numery Adresowe - PNA) wprowadzono 1 stycznia 1973 na mocy rozporządzenia nr 89 Ministerstwa Łączności z 17 listopada 1972. Kody pocztowe mają format dd-ddd, gdzie d oznacza cyfrę, i umieszcza się je z lewej strony nazwy miejscowości, w której znajduje się pocztowy urząd oddawczy. Automatyczne rozpoznawanie kodów pocztowych jest kluczowym elementem systemu sortowania, bowiem od niego zaleŝy skuteczność całego systemu. Obecna technologia rozpoznawania kodów opiera się na systemach ICR, które jest odmianą systemów OCR wykorzystywanych w procesie przetwarzania danych z dokumentów typu formularze. Metody rozpoznawania znaku oparte są zwykle na technologiach sieci neuronowych przy wsparciu tablic walidacji, które podwyŝszają poziom rozpoznania pola. W spotykanych rozwiązaniach skuteczność rozpoznawania kodów pocztowych wynosi 40-90% [1,3,4,6,8,9]. Główne problemy związane z rozpoznawaniem kodów pocztowych to dobór algorytmów lokalizacji pola adresowego, stosowanie eliminacji zniekształceń etapu akwizycji np. filtracji, proces segmentacji znaków, wybór metody rozpoznawania kodu pocztowego, stosowanie tablic walidacyjnych. 6. KLASYFIKACJA STANU PRZESYŁKI ZE WZGLĘDU NA PROCES ODCZYTU ADRESU W zintegrowanej maszynie czytającej IRV z modułem OCR i z wideokodowaniem odbywa się automatycznie czytanie adresu przesyłki listowej. WyróŜnia się dwa stany przeczytania adresu przesyłki listowej: w przypadku automatycznego odczytania adresu za pomocą modułu OCR, drukarka natryskowa po elektronicznym przetworzeniu nadrukowuje pasek kodu kreskowego w postaci rzędu poziomych, pomarańczowych kresek w dolnej 2417

części listu lub pocztówki. Nadrukowany kod kreskowy posłuŝy następnym modułom LSM i FSM do końcowego (szczegółowego) rozdzielenia przesyłek, jeŝeli automatyczny odczyt adresu przesyłki przez moduł OCR nie powiedzie się, wówczas jest ona kodowana ręcznie na stanowisku wideokodowania. Z przedstawionej klasyfikacji stanu przesyłki wynika, Ŝe moduł OCR jest kluczowym elementem procesu i jest odpowiedzialny za rozpoznawanie danych z pola adresowego. Niska sprawność tego modułu podnosi koszty i zmniejsza przepustowość całego systemu opracowania przesyłek. Dynamiczny rozwój technik przetwarzania obrazów pozwala na wprowadzenie rozwiązań umoŝliwiających podniesienie skuteczności automatycznego systemu pocztowego w związku z tym zaproponowano zastosowanie modułu rozpoznającego znaki uwzględniającego aktualizację bazy danych dla poszczególnych klas obiektów przez wybór cech z wykorzystaniem zbiorów przybliŝonych (ang. rough set). Cechy obiektu (np. obrazu znaku) mogą być uzyskiwane z wykorzystaniem transformaty Trace [10,11] a następnie z wykorzystaniem zbiorów przybliŝonych przeprowadza się analizę wszystkich znanych przypadków (znaków) występujących w obrębie danej klasy, które pozwolą wyszczególnić tylko informacje niezbędne do dyskryminacji znaków. Na rys. 1 przedstawiono schemat blokowy zaproponowanej metody. Obraz znaku Filtracja 1.Uwzględnienie właściwości Transformaty Radona 2.Niezmienność względem zmiany skali 3.Niezmienność względem przesunięcia 4.Niezmienność względem obrotu Zbiory przybliŝone (Rough Set) Transformata Radona Normalizacja Funkcjonały diametralne (Diametric functionals) Funkcjonały cyrkularne (Circus functionals) Redukty (Reducts) Informacja o istotnych parametrach Reguły (Rules) Rozkład (Decompsition) Informacja dla celów klasyfikacji Rys.1. Schemat zaproponowanej metody (opracowanie własne) Zaproponowana metoda bazuje na wydzielaniu cech znaku na podstawie analizy z wykorzystaniem zbiorów przybliŝonych. Podstawowe działania na zbiorach przybliŝonych są takie same, jak działania na zbiorach klasycznych, lecz, dodatkowo wprowadza się kilka nowych pojęć, które nie są uŝywane w przypadku zbiorów klasycznych, mianowicie: Relacja nierozróŝnialności: Dla kaŝdego podzbioru cech B A IND( B) = 2 {( x, y) U : a( x) = a( y) } a B (1) Relację nierozróŝnialności elementów x i y zapisujemy w postaci xind(b)y (x jest w relacji nierozróŝnialności z y w zbiorze cech B), oznacza ona, Ŝe elementy x oraz y mają te same wartości podzbioru cech B, innymi słowy ze względu na zbiór cech B, elementów x i y nie da się między sobą rozróŝnić. Dolne przybliŝenie zbioru X w przestrzeni aproksymacji (S): 2418

{ x U :[ x] X } S( X ) (2) = IND( B) jest to największy podzbiór w S zawarty w X, Górne przybliŝenie zbioru X w przestrzeni aproksymacji (S): Brzeg zbioru przybliŝonego: { x U :[ x] 0} S( X ) = B) X Bnd( X ) S( X ) S( X ) IND ( (3) = (4) Powstaje zatem moŝliwość zdefiniowania zbioru w oparciu o jego przybliŝenie dolne i górne. Dla kaŝdej z klas rozpoznawanych obiektów tworzone są reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworzą wzorcową bazę danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane są w grupach wszystkich klas. Największa liczba wystąpień wskazuje na klasę badanego obiektu (znaku). Szczegółowy schemat metody z wykorzystaniem analizy za pomocą zbiorów przybliŝonych przedstawiono na rysunku 2. Uczenie Baza danych Zbiór uczący (osobny dla kaŝdej klasy znaków) Dane obiektu (znaku nieznanego) C 1 C 2 C c Redukty (Reducts) Baza reduktów Dla kaŝdej z klas obiektów C 1 C 2 C c C 1 C 2 C c C 1 C 2 C c R 1 R 2 R r R 1 R 2 R r R 1 R 2 R r R 1 R 2 R r Reguły (Rules) Rozkład (Decompsition) Baza reguł i rozkładów dla kaŝdej z klas obiektów obiekt/nie obiekt obiekt/nie obiekt obiekt/nie obiekt Blok decyzyjny Klasa obiektu Rys.2. Schemat zaproponowanej metody (opracowanie własne). W przypadku zastosowań pocztowych zestawy uczące poszczególnych klas uzupełniane są przez wzorce z wideokodowania i ponowne wydzielenie zbiorów reduktów i rozkładów dla poszczególnych klas obiektów. Zaproponowana metoda bazuje na wydzielaniu cech znaku na podstawie analizy z wykorzystaniem zbiorów przybliŝonych, dzięki temu pojawia się moŝliwość zdefiniowania zbioru cech w oparciu o przybliŝenie dolne i górne. Dla kaŝdej z klas rozpoznawanych obiektów tworzone są reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworzą wzorcową bazę danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane są w grupach wszystkich klas. Zastosowane zbiorów przybliŝonych pozwala na poszukiwanie ukrytych zaleŝności pomiędzy danymi i podejmowanie decyzji w sytuacji istnienia niepełnych lub częściowo sprzecznych danych. 2419

7. WNIOSKI W referacie przedstawiono proces uczenia maszynowego do rozpoznawania i przetwarzania obrazów podczas automatycznego opracowywania przesyłek pocztowych. Przesyłka pocztowa jest to ładunek jednostkowy opatrzony adresem, przyjęty przez operatora pocztowego w celu przemieszczenia i doręczenia adresatowi. W całym procesie pocztowym przemieszczania przesyłek od nadawcy do adresata wiodącą rolę pełnią Węzły Ekspedycyjno - Rozdzielcze (WER), gdzie zbiegają się strumienie przesyłek pochodzących niemalŝe ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER są one rejestrowane w systemie teleinformatycznym. Dokonuje się tego na stanowiskach recepcyjnych, przy uŝyciu skanerów kodów kreskowych. Ze względu na pracochłonność procesu, standardy czasowe dostarczania przesyłek najwięcej uwagi wymaga proces sortowania przesyłek listowych. Po ich przyjęciu do WER odbywa się proces sortowania przesyłek na liniach do automatycznego rozdziału na poszczególne kierunki adresowe. Linie do automatycznego rozdziału zestawione są z maszyn ustawione jako niezaleŝne segmenty. Ze względu na proces automatycznego rozpoznawania adresu, najistotniejszy segmentem linii jest zintegrowana maszyna czytająca z wideokodowaniem IRV. W maszynie czytającej z wideokodowaniem IRV, system za pomocą modułu OCR (ang. OCR - Optical Character Recognition) automatycznie odczytuje adres. W przypadku, kiedy OCR nie moŝe sobie poradzić z odczytaniem danych adresowych, obraz przesyłki trafia do sekcji VCD (ang. Video Coding Desk). Jest to zespół stanowisk, wspomagających odczyt automatyczny, gdzie na ekranach monitorów pojawiają się strony adresowe przesyłek pocztowych. Z przedstawionej klasyfikacji stanu przesyłki wynika, Ŝe moduł OCR jest kluczowym elementem procesu i jest odpowiedzialny za rozpoznawanie danych z pola adresowego. Niska sprawność tego modułu podnosi koszty i zmniejsza przepustowość całego systemu opracowania przesyłek. Zaproponowana metoda bazuje na wydzielaniu cech znaku z wykorzystaniem transformaty Trace [10,11] a następnie z wykorzystaniem zbiorów przybliŝonych przeprowadza się analizę wszystkich znanych znaków występujących w obrębie danej klasy, które pozwolą wyszczególnić tylko informacje niezbędne do dyskryminacji znaków. Dla kaŝdej z klas rozpoznawanych obiektów tworzone są reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworzą wzorcową bazę danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane są w grupach wszystkich klas. 8. BIBLIOGRAFIA [1] Bouchaffra D., Govindaraju V., Srihari S.: Recognition of strings using nonstationary Markovian models: an application in ZIP code recognition. IEEE Computer Society Conference on Computer Vision and Pattern Recognition 2, s. 2174-2183, 1999. [2] Chaberek M.: Makro- i mikroekonomiczne aspekty wsparcia logistycznego. Wydawnictwo Uniwersytetu Gdańskiego, 2002. [3] Filatov A., Volgunin A.: Handwritten ZIP code recognition. ICDAR 4, s. 766-770, 1997. [4] Forella G.: Word perfect, Postal Technology. UKIP Media & Events Ltd. UK 2000. [5] Ishikura T., Adachi T.: Video Coding technology for postal automation system: Special issue on postal automation technology. NEC research and development 40, Tokyo, s. 176-180, 1999. [6] Maszewski M., Miciak M.: Rozpoznawanie danych teleadresowych z wykorzystaniem współczynników Fouriera i zespolonej dyskretnej transformacji falkowej opartej na projekcji, Techniki Przetwarzania Obrazu. s. 381-386, 2006. [7] Wiatr R., Rawłuszko J.: On the problems of logistics network project in the Polish Post, Materiały VI Th International Scientific Conference POSTPOINT` 2005`, śylina (Słowacja), 28-30.09, 2005. [8] Miciak M., Marchewka M.: The recognition of postal code using Fourier transform method, XII Konferencja Sieci i Systemy Informatyczne, Łódź, s. 461-468, 2004. [9] Mitsu Y., Tatsuro S., Isao Y.: A recognition system for Japanese Zip code using Arc features, IEICE Transactions on Information and Systems. s. 810-816, 1994. [10] Bok-Suk Shin.: Effective feature extraction by trace transform for insect footprint recognition, Bio-Inspired Computing: Theories and Applications 2008, s. 97-102. [11] Petrou M., Piroddi R., Talebpour A.: Texture recognition from sparsely and irregularly sampled data, Computer Vision and Image Understanding archive, 2006, s. 95-104. 2420