ADAPTACYJNA METODA UCZENIA MASZYNOWEGO W SYSTEMACH KLASYFIKACJI I SORTOWANIA PRZESYŁEK POCZTOWYCH



Podobne dokumenty
Procesy usprawniające w systemach klasyfikacji i sortowania przesyłek pocztowych

PROBLEMY IDENTYFIKACJI DANYCH ADRESOWYCH W AUTOMATYCZNYM PROCESIE SORTOWANIA PRZESYŁEK

KRYTERIA SPRAWNOŚCI POCZTOWYCH SYSTEMÓW TECHNICZNYCH W ZAKRESIE ROZDZIAŁU PRZESYŁEK

Procedura weryfikacji badania czasu przebiegu 1 paczek pocztowych

Zagospodarowanie magazynu

1 Przedmiot Umowy 1. Przedmiotem umowy jest sukcesywna dostawa: publikacji książkowych i nutowych wydanych przez. (dalej zwanych: Publikacjami).

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM

REJESTRATOR RES800 INSTRUKCJA OBSŁUGI

GENERALNY INSPEKTOR OCHRONY DANYCH OSOBOWYCH

1. Podstawy budowania wyra e regularnych (Regex)

DEKLARACJA O WYSOKO CI OPŁATY ZA GOSPODAROWANIE ODPADAMI KOMUNALNYMI

Kategorie inwestycyjne poprowadzenia ruchu rowerowego

INSTRUKCJA BHP PRZY RECZNYCH PRACACH TRANSPORTOWYCH DLA PRACOWNIKÓW KUCHENKI ODDZIAŁOWEJ.

Istotne Postanowienia Umowy

ZAPYTANIE OFERTOWE. Nazwa zamówienia: Wykonanie usług geodezyjnych podziały nieruchomości

Harmonogramowanie projektów Zarządzanie czasem

EGZAMIN POTWIERDZAJ CY KWALIFIKACJE W ZAWODZIE Rok 2014 CZ PRAKTYCZNA

Załącznik nr 1 do SIWZ

EGZAMIN MATURALNY Z MATEMATYKI

Aneks nr 8 z dnia r. do Regulaminu Świadczenia Krajowych Usług Przewozu Drogowego Przesyłek Towarowych przez Raben Polska sp. z o.o.

Jak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach.

MUP.PK.III.SG /08 Lublin, dnia r.

DZIENNIK URZĘDOWY WOJEWÓDZTWA ŁÓDZKIEGO

OIGD 89/2013 Kraków, 8 lipca 2013 r. Pani/Pan Prezes Członkowie Ogólnopolskiej Izby Gospodarczej Drogownictwa

BEZPIECZE STWO SYSTEMU CZŁOWIEK-POJAZD-OTOCZENIE (C-P-O) W RUCHU DROGOWYM

Promocja i identyfikacja wizualna projektów współfinansowanych ze środków Europejskiego Funduszu Społecznego

DBA-2/240-60/2013 Warszawa, 6 listopada 2013 r.

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

HiTiN Sp. z o. o. Przekaźnik kontroli temperatury RTT 4/2 DTR Katowice, ul. Szopienicka 62 C tel/fax.: + 48 (32)

PAKOWARKA PRÓŻNIOWA VAC-10 DT, VAC-20 DT, VAC-20 DT L, VAC-20 DT L 2A VAC-40 DT, VAC-63 DT, VAC-100 DT

SERI A 93 S E RI A 93 O FLUSH GRID WITHOUT EDGE TAB

Lekcja 173, 174. Temat: Silniki indukcyjne i pierścieniowe.

Uchwała Nr XXVII/543/13 Sejmiku Województwa Warmińsko-Mazurskiego z dnia 29 maja 2013 r.

Poprawne adresowanie przesyłek listowych PORADNIK

PRZEPISY KLASYFIKACJI I BUDOWY STATKÓW MORSKICH

Tekst ozdobny i akapitowy

Wniosek o ustalenie warunków zabudowy

PROJEKTOWANIE SYSTEMÓW LOGISTYCZNYCH PROJEKT SYSTEMY LOGISTYCZNE PODSTAWY TEORETYCZNE

Kilka zasad o których warto trzeba pamiętać

Warszawa, dnia 28 sierpnia 2012 r. Poz. 966 ROZPORZĄDZENIE MINISTRA TRANSPORTU, BUDOWNICTWA I GOSPODARKI MORSKIEJ 1) z dnia 14 sierpnia 2012 r.

Generalny Dyrektor Ochrony rodowiska. Art.32 ust. 1. Art. 35 ust. 5. Art. 38. Art. 26. Art 27 ust. 3. Art. 27a

Systemy mikroprocesorowe - projekt

W Regulaminie dokonuje się następujących zmian:

Podstawa prawna: Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych (t. j. Dz. U. z 2000r. Nr 54, poz. 654 ze zm.

Załącznik nr 7 DO UMOWY NR. O ŚWIADCZENIE USŁUG DYSTRYBUCJI PALIWA GAZOWEGO UMOWA O WZAJEMNYM POWIERZENIU PRZETWARZANIA DANYCH OSOBOWYCH

Type ETO2 Controller for ice and snow melting

Projekt z dnia 2 listopada 2015 r. z dnia r.

do 30 sekund włącznie zawierają informację Projekt/materiał dofinasowany z Unii Europejskiej

Wzór Umowy na świadczenie usług pocztowych

Warunki Oferty PrOmOcyjnej usługi z ulgą

EGZAMIN MATURALNY Z MATEMATYKI

Umowa - wzór. Zawarta w dniu roku w Świątkach pomiędzy :

Instrukcja. sporządzania rocznych sprawozdań Rb-WSa i Rb-WSb o wydatkach strukturalnych

KONKURS NA NAJLEPSZE LOGO

WordPad. Czyli mój pierwszy edytor tekstu

System Informatyczny CELAB. Przygotowanie programu do pracy - Ewidencja Czasu Pracy

2.Prawo zachowania masy

STANDARDY OZNAKOWANIA I NUMERACJI OBIEKTÓW ENERGETYCZNYCH

DANE UCZESTNIKÓW PROJEKTÓW (PRACOWNIKÓW INSTYTUCJI), KTÓRZY OTRZYMUJĄ WSPARCIE W RAMACH EFS

FORUM ZWIĄZKÓW ZAWODOWYCH

PROJEKT TECHNICZNY INSTALACJA KLIMATYZACJI POMIESZCZEŃ BIUROWYCH

NACZYNIE WZBIORCZE INSTRUKCJA OBSŁUGI INSTRUKCJA INSTALOWANIA

Uchwała z dnia 20 października 2011 r., III CZP 53/11

USTAWA. z dnia 26 czerwca 1974 r. Kodeks pracy. 1) (tekst jednolity)

ZASADY REPRODUKCJI SYMBOLI GRAFICZNYCH PRZEDMOWA

Strona Wersja zatwierdzona przez BŚ Wersja nowa 26 Dodano następujący pkt.: Usunięto zapis pokazany w sąsiedniej kolumnie

Od redakcji. Symbolem oznaczono zadania wykraczające poza zakres materiału omówionego w podręczniku Fizyka z plusem cz. 2.

D TYMCZASOWE NAWIERZCHNIE Z ELEMENTÓW PREFABRYKOWANYCH

ST SPECYFIKACJA TECHNICZNA ROBOTY GEODEZYJNE. Specyfikacje techniczne ST Roboty geodezyjne

Instrukcja obsługi. Sterownik ścienny KJR10B/DP

DO WSZYSTKICH UCZESTNIKÓW POSTĘPOWANIA PRZETARGOWEGO DZ/271/148/2013

Urządzenie do odprowadzania spalin

ZAMAWIAJĄCY. Regionalna Organizacja Turystyczna Województwa Świętokrzyskiego SPECYFIKACJA ISTOTNYCH WARUNKÓW ZAMÓWIENIA (DALEJ SIWZ )

OŚWIETLENIE PRZESZKLONEJ KLATKI SCHODOWEJ

Warsztat naukowca a problem formatu informacji bibliograficznej generowanej przez systemy informacyjne. Remigiusz Sapa IINiB UJ

Warszawa, dnia 11 marca 2016 r. Poz. 327 ROZPORZĄDZENIE. z dnia 7 marca 2016 r.

Regulamin Konkursu Chemicznego Młody All-Chemik.

Użytkowanie elektronicznego dziennika UONET PLUS.

Ojcowski Park Narodowy

UMOWA PORĘCZENIA NR [***]

C5 - D4EB0FP0 - Informacje ogólne : Poduszki powietrzne INFORMACJE OGÓLNE : PODUSZKI POWIETRZNE



Komunikacja w sieci Industrial Ethernet z wykorzystaniem Protokołu S7 oraz funkcji PUT/GET

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

warsztató OMNM ar n medk oafał ptaszewskii mgr goanna tieczorekjmowiertowskai mgr Agnieszka jarkiewicz

EGZAMIN MATURALNY Z J ZYKA ROSYJSKIEGO

Objaśnienia do Wieloletniej Prognozy Finansowej na lata

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

Polska-Lublin: Usługi sprzątania 2016/S Ogłoszenie o udzieleniu zamówienia. Usługi

Instrukcja sporządzania skonsolidowanego bilansu Miasta Konina

Zarządzanie Zasobami by CTI. Instrukcja

REGULAMIN przeprowadzania okresowych ocen pracowniczych w Urzędzie Miasta Mława ROZDZIAŁ I

Spis treści. 1. Znak Konstrukcja symbolu Budowa znaku Kolorystyka wersja podstawowa Kolorystyka wersja czarno-biała...

PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

UMOWA Nr SGZOZ/.. /2013 na udzielanie świadczeń zdrowotnych w zakresie wykonywania badań laboratoryjnych

MUZEUM NARODOWYM W POZNANIU,

Instrukcja Obsługi STRONA PODMIOTOWA BIP

JAK POPRAWNIE NAPISAĆ PODANIE? PORADNIK

Transkrypt:

ADAPTACYJNA METODA UCZENIA MASZYNOWEGO W SYSTEMACH KLASYFIKACJI I SORTOWANIA PRZESYŁEK POCZTOWYCH MIROSŁAW MICIAK, ROMAN WIATR, RAFAŁ BONIECKI Streszczenie W artykule przedstawiono metod adaptacyjnego uczenia maszynowego do rozpoznawania i przetwarzania obrazów w procesach automatycznego opracowywania przesyłek pocztowych. Ze wzgl du na proces automatycznego rozpoznawania adresu, najistotniejszy segmentem linii jest zintegrowana maszyna czytaj ca z wideokodowaniem za pomoc modułu optycznego rozpoznawania znaków automatycznie odczytuje adres przesyłki. Mała sprawno tego modułu podnosi koszty i zmniejsza przepustowo całego systemu opracowania przesyłek. Zaproponowano metod bazuj c na wydzielaniu cech znaków na podstawie analizy z wykorzystaniem zbiorów przybli onych. Natomiast dane z procesu wideokodowania pozwalaj na aktualizacj bazy wzorców poszczególnych klas znaków. Słowa kluczowe: sortowanie przesyłek, uczenie maszynowe, zbiory przybli one 1. Wprowadzenie Systemy rozpoznawania obrazów s aktualnie bardzo dynamicznym obszarem działalno ci badawczej. Rozpoznawanie i przetwarzanie obrazów jest powszechnie wykorzystywane w technice komputerowej do identyfikacji dokumentów w urz dach i instytucjach u yteczno ci publicznej. Kierunki rozwoju systemów rozpoznawania uwzgl dniaj mo liwo ci rozpoznawania pisma jak równie umo liwiaj ograniczenie ilo ci przechowywanych danych. Obecnie najwi kszymi odbiorcami systemów optycznego rozpoznawania pisma s instytucje pocztowe. Pojawiaj si mo liwo ci zastosowania systemów automatycznego rozpoznawania znaków do sortowania przesyłek na podstawie adresu bez wpisanego kodu pocztowego. 2. Procesy przesyłania przesyłek w pocztowych systemach transportowych Przesyłka pocztowa jest to ładunek jednostkowy opatrzony adresem, przyj ty przez operatora pocztowego w celu przemieszczenia i dor czenia adresatowi. Zgodnie z t definicj przesyłka pocztowa mo e by form ł czno ci polegaj cej na zdalnym przekazywaniu dokumentów lub przedmiotów przy u yciu rodków transportu l dowego, wodnego, powietrznego lub elektronicznego.

Studies & Proceedings of Polish Association for Knowledge Management Nr 47, 2011 185 W procesie przemieszczania, przesyłania przesyłek od nadawcy do adresata wyst puj nast puj ce zasadnicze fazy: gromadzenie, segregacja wst pna, przemieszczanie, segregacja, dor czanie. W procesie technologicznym przesyłania przesyłek listowych istotne znaczenie ma jako tego procesu, którego miar jest czas przebiegu przesyłki od nadawcy do adresata. W procesie przesyłania przesyłek mo na wyró ni dwie zasadnicze fazy: transport przesyłek i ich opracowywanie. Na podstawie analizy powy szych faz ze wzgl du na długo czasu przebiegu przesyłek, mo na stwierdzi, e najbardziej czasochłonne s dwa etapy: przewóz przesyłek mi dzy w złami rozdzielczymi, opracowywanie przesyłek w w złach rozdzielczych. W całym procesie pocztowym [7] wiod c rol pełni W zły Ekspedycyjno Rozdzielcze (WER), poniewa opracowuj one wi kszo przepływaj cych w systemie pocztowym przesyłek. W w złach zbiegaj si strumienie przesyłek pochodz cych niemal e ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER s one rejestrowane w systemie teleinformatycznym. Dokonuje si tego na stanowiskach recepcyjnych, przy u yciu skanerów kodów kreskowych, które umieszczane s na opakowaniach zbiorczych, a tak e na niektórych rodzajach przesyłek. Dzi ki temu fizycznemu strumieniowi ładunków przepływaj cemu w sieci logistycznej, generowane s informacje o tych ładunkach, a tak e o ich zawarto ci, co stanowi jednocze nie podstaw dla funkcjonowania systemu ledzenia przesyłek, a tak e baz danych dla działa analitycznych, sprawozdawczych i reklamacyjnych [2]. Podstawowe elementy składowe WER to: zintegrowany system teleinformatyczny, kompleksowy system transportu wewn trznego, wielofunkcyjne maszyny sortownicze do rozdziału listów o rozmiarach standardowych (ekonomicznych, priorytetowych, ekonomicznych i in.), listów niestandardowych (flatów), paczek, urz dzenia wspomagaj ce proces pocztowy jak system komunikacji i lokalizacji rodków transportu, system ledzenia przesyłek [7]. Ze wzgl du na pracochłonno procesu, terminy czasowe dostarczania przesyłek najwi cej uwagi wymaga proces sortowania przesyłek listowych. Maszyny do automatycznego opracowywania przesyłek listowych s ustawione jako niezale ne segmenty: maszyna rozdzielaj ca i licuj co stempluj ca CFC, zintegrowana maszyna czytaj ca z wideokodowaniem IRV, maszyna do rozdziału szczegółowego FSM, maszyna do rozdziału przesyłek typu flat FSS.

186 Mirosław Miciak, Roman Wiatr, Rafał Boniecki Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych 3. Rozdział przesyłek listowych w W złach Ekspedycyjno Rozdzielczych (WER) Mechanizacja i automatyzacja procesów technologicznych to rodki, jakie wiele administracji pocztowych na wiecie z powodzeniem zastosowało w celu ułatwienia pracy, a przede wszystkim dla zapewnienia terminowo ci przebiegu przesyłek. Poczta Polska proces ten rozpocz ła w 1992 r. Do chwili obecnej automatyczne rozdzielnie listowe pracuj w nast puj cych w złach: Warszawa, Katowice, Pozna, Kraków oraz Łód. Wszystkie te w zły s wyposa one w maszyny dostarczane przez niemieck firm Siemens Electrocom z wyj tkiem w zła w Warszawie, który wyposa ono w lini do rozdziału przesyłek listowych firmy japo skiej Nippon Electric Company (NEC). ródło: Materiały inf. Siemens. Rysunek 1. Maszyna rozdzielaj ca i licuj co stempluj ca CFC Proces opracowywania listów w WER-ach mo na podzieli na dwa etapy. W pierwszym nast puje wst pna selekcja na przesyłki standardowe nadaj ce si do sortowania maszynowego oraz przesyłki o nietypowych kształtach i rozmiarach przeznaczonych do opracowania r cznego. Typowe przesyłki stemplowane s w maszynie CFC, gdzie na podstawie odblasku farby fluorescencyjnej i perforacji znaczka naklejonego na li cie sprawdzane jest czy opłata została uiszczona. Umieszczenie odcisku datownika ko czy pierwszy etap.

187 Studies & Proceedings of Polish Association for Knowledge Management Nr 47, 2011 W dalszej kolejno ci w maszynie czytaj cej z wideokodowaniem IRV, system za pomoc modułu optycznego rozpoznawania znaków (ang. OCR Optical Character Recognition) automatycznie odczytuje adres. Rz d poziomych, pomara czowych kresek w dolnej cz ci listu lub pocztówki to efekt odczytania kodu pocztowego i nazwy miejscowo ci. Nanosi je, po elektronicznym przetworzeniu, drukarka natryskowa. Nadrukowany kod kreskowy posłu y nast pnym modułom LSM (ang. Letter Sorting Machine) i FSM (ang. Flat Sorting Machine) do ko cowego (szczegółowego) rozdzielenia przesyłek. Posortuj one i pogrupuj korespondencj do wybranych obszarów, np. rejonów dor cze i pocztowych urz dów oddawczych. Rysunek 2. Zintegrowana maszyna czytaj ca z modułem OCR i z wideokodowaniem IRV W przypadku kiedy OCR nie mo e sobie poradzi z odczytaniem danych adresowych, obraz przesyłki trafia do sekcji VCD (ang. Video Coding Desk). Jest to zespół stanowisk, wspomagaj cych odczyt automatyczny, gdzie na ekranach monitorów pojawiaj si strony adresowe przesyłek pocztowych. Operatorzy wpisuj kody pocztowe, a w przypadku rozdziału przesyłek dla niektórych miast nazw ulicy i numer. Cało tworzy tzw. wideokodowanie (ang. Video Coding System) [5]. Podstawowe problemy zwi zane z automatycznym sortowaniem przesyłek pocztowych dotycz znacz cego wpływu sprawno ci modułu OCR na efektywno pracy systemu. W przypadku du ej ilo przesyłek adresowanych odr cznym pismem, sprawno automatycznego odczytu przy u yciu modułu OCR znacz co spada.

188 Mirosław Miciak, Roman Wiatr, Rafał Boniecki Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych Rysunek 3. Maszyna do rozdziału szczegółowego FSM Rysunek 4. Stanowisko wideokodowania

189 Studies & Proceedings of Polish Association for Knowledge Management Nr 47, 2011 4. Parametry techniczno-eksploatacyjne maszyn do automatycznego opracowywania przesyłek listowych Maszyny do automatycznego opracowywania s ustawione jako niezale ne moduły. Parametry technologiczne poszczególnych modułów s nast puj ce (parametry podano przykładowo dla maszyn firmy NEC, dla maszyn firmy Siemens zasadniczo si nie ró ni ): a) maszyna dzielenia wst pnego (IRV): pr dko przetwarzania 40 000 szt./h (max 45 000 szt./h), poziom odczytu adresu maszynowego 80% lub wi cej, współczynnik bł du odczytu adresu maszynowego 0,5 % lub mniej, poziom odczytu adresu odr cznego, gdy kod PNA (Pocztowy Numer Adresowy) jest umieszczony w kratkach kodowych 83% lub wi cej, poziom odczytu adresu odr cznego bez kodu PNA w kratkach kodowych 40 % lub wi cej współczynnik bł du adresu odr cznego 1 % lub mniej, współczynnik odczytu rozszerzonego kodu kreskowego 98,3 % lub wi cej, pojemno pami ci zeskanowanych obrazów przesyłek 240 tys. obrazów przesyłek. b) maszyny do rozdziału szczegółowego (FSM): pr dko przetwarzania 40 000 szt./h (max 45 000 szt./h), programy sortuj ce do 100, liczba zasobników 360 (8 drukarek etykiet), wska nik odczytu kodu 98,3 % dla kodu 5-cyfr, wska nik bł dnego sortowania 0,5% lub mniej, wska nik bł dów odrzutów 0,2% 5. Parametry adresowania przesyłek ze wzgl du na skuteczno ich rozpoznawania Wymagania dotycz ce przesyłki listowej, bloku adresowego oraz dostosowanie znaczków pocztowych zostały ci le sprecyzowane i uregulowane w obowi zuj cych przepisach pocztowych. Przepisowy format przesyłki listowej dostosowanej do automatycznego rozdziału to: długo : 138 240 mm, wysoko : 88 165 mm, grubo : 0,16 5 mm, masa maksymalna: 50 g. Wymagania bloku adresowego s nast puj ce: pomi dzy poszczególnymi wierszami bloku adresowego nie nale y pozostawia odst pów, pocz tki wierszy w bloku adresowym winny le e w jednej linii, nie nale y u ywa podkre le, PNA i nazw miejscowo ci nale y umie ci w ostatnim wierszu, PNA nale y wpisywa we wła ciwe, wst pnie nadrukowane okienka, wiersze adresu nie mog przebiega uko nie,

190 Mirosław Miciak, Roman Wiatr, Rafał Boniecki Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych w przypadku stosowania kopert z okienkami, adres musi by w cało ci widoczny w okienku. Znaczek Strefa dla opłaty pocztowej ramka o wysoko ci 40 mm.... Pani Janina Nowak Ul.Cicha 132 m. 16 62-200 Gniezno... Maks. długo strefy adresowej 140 mm Blok adresowy Strefa kodowania o wys. 15 mm Rysunek 5. Wzór strony czołowej listu nadaj cego si do sortowania maszynowego ródło: Opracowanie własne. Ponadto podane s zalecenia, na które nale y zwróci uwag podczas adresowania przesyłek: adres pisz czytelnym pismem, kod i miejscowo pisz drukowanymi, prostymi, oddzielnymi literami, nie podkre laj adresu lub jego cz ci, pierwsze litery poszczególnych linii adresu musz tworzy jedn kolumn, poni ej kodu i nazwy miejscowo ci nie umieszczaj adnych napisów, rysunków czy naklejek, u ywaj niebieskiego lub czarnego tuszu, nie pisz adresu kolorem czerwonym (i jego pochodnymi), gdy maszyny nie odczytaj adresu w tym kolorze, nale y unika drukarek igłowych (nanoszone przez nie znaki s nieczytelne dla maszyny sortuj cej korespondencj ), wysoko czcionki u ytej przy adresowaniu nie powinna by mniejsza ni 2,5 mm i nie wi ksza ni 4,7 mm, logo, napisy reklamowe, znaki drukarskie, itp. powinny by umieszczone z lewej strony bloku adresowego. Kod pocztowy (pocztowy numer adresowy) jest to ci g cyfr (rzadziej liter i cyfr) dodawany do adresu, maj cy ułatwia sortowanie przesyłek. Format i zasady umieszczania kodów pocztowych s ró ne w ró nych krajach. W Polsce system kodów pocztowych (Pocztowe Numery Adresowe PNA) wprowadzono 1 stycznia 1973 na mocy rozporz dzenia nr 89 Ministerstwa Ł czno ci z 17 listopada 1972. Kody pocztowe maj format dd-ddd, gdzie d oznacza cyfr, i umieszcza si je z lewej strony nazwy miejscowo ci, w której znajduje si pocztowy urz d oddawczy. Pierwsza cyfra okre la okr g pocztowy, druga stref kodow, która wskazuje cz okr gu którym jest okre lony obszar poło ony wzdłu linii komunikacyjnych lub miasto wojewódzkie, trzecia to

191 Studies & Proceedings of Polish Association for Knowledge Management Nr 47, 2011 sektor kodowy obejmuj ca obszar podległy rozdzielni sektorowej, a w dziewi tnastu najwi kszych miastach umowne cz ci miast. Czwarta i pi ta wskazuj placówk pocztow i jej obszar działania lub jednostk dor czeniow. Automatyczne rozpoznawanie kodów pocztowych jest kluczowym elementem systemu sortowania, bowiem od niego zale y skuteczno całego systemu. Obecna technologia rozpoznawania kodów opiera si na systemach ICR, które jest odmian systemów OCR wykorzystywanych w procesie przetwarzania danych z dokumentów typu formularze. Metody rozpoznawania znaku oparte s zwykle na technologiach sieci neuronowych przy wsparciu tablic walidacji, które podwy szaj poziom rozpoznania pola. W spotykanych rozwi zaniach skuteczno rozpoznawania kodów pocztowych wynosi 40 90% [1][3][4][6][8][9]. Główne problemy zwi zane z rozpoznawaniem kodów pocztowych to dobór algorytmów lokalizacji pola adresowego, stosowanie eliminacji zniekształce etapu akwizycji np. filtracji, proces segmentacji znaków, wybór metody rozpoznawania kodu pocztowego, stosowanie tablic walidacyjnych. 6. Klasyfikacja stanu przesyłki ze wzgl du na proces odczytu adresu W zintegrowanej maszynie czytaj cej IRV z modułem OCR i z wideokodowaniem odbywa si automatycznie czytanie adresu przesyłki listowej. Wyró nia si dwa stany przeczytania adresu przesyłki listowej: w przypadku automatycznego odczytania adresu za pomoc modułu OCR, drukarka natryskowa po elektronicznym przetworzeniu nadrukowuje pasek kodu kreskowego w postaci rz du poziomych, pomara czowych kresek w dolnej cz ci listu lub pocztówki. Nadrukowany kod kreskowy posłu y nast pnym modułom LSM i FSM do ko cowego (szczegółowego) rozdzielenia przesyłek. Je eli automatyczny odczyt adresu przesyłki przez moduł OCR nie powiedzie si, wówczas jest ona kodowana r cznie na stanowisku wideokodowania. Z przedstawionej klasyfikacji stanu przesyłki wynika, e moduł OCR jest kluczowym elementem procesu i jest odpowiedzialny za rozpoznawanie danych z pola adresowego. Mała sprawno tego modułu podnosi koszty i zmniejsza przepustowo całego systemu opracowania przesyłek. Dynamiczny rozwój technik przetwarzania obrazów pozwala na wprowadzenie rozwi za umo liwiaj cych podniesienie skuteczno ci automatycznego systemu pocztowego w zwi zku z tym zaproponowano zastosowanie modułu rozpoznaj cego znaki uwzgl dniaj cego aktualizacj bazy danych dla poszczególnych klas obiektów przez wybór cech z wykorzystaniem zbiorów przybli onych (ang. rough set). Cechy obiektu (np. obrazu znaku) mog by uzyskiwane z wykorzystaniem transformaty Trace [10][11] a nast pnie z wykorzystaniem zbiorów przybli onych przeprowadza si analiz wszystkich znanych przypadków (znaków) wyst puj cych w obr bie danej klasy, które pozwol wyszczególni tylko informacje niezb dne do dyskryminacji znaków. Na rys. 6 przedstawiono schemat zaproponowanej metody.

192 Mirosław Miciak, Roman Wiatr, Rafał Boniecki Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych Uczenie Baza danych Klasyfikacja Zbiór ucz cy (osobny dla ka dej klasy znaków) D 1 D 2 D d Dane obiektu (znaku nieznanego) C 1 C 2 C c Redukty (Reducts) Baza reduktów Dla ka dej z klas obiektów D 1 D 2 D d D 1 D 2 D d D 1 D 2 D d C 1 C 2 C c C 1 C 2 C c C 1 C 2 C c R 1 R 2 R r R 1 R 2 R r R 1 R 2 R r R 1 R 2 R r Reguły (Rules) Rozkład (Decompsition) Baza reguł i rozkładów dla ka dej z klas obiektów Klasyfikacja obiekt/nie obiekt Klasyfikacja obiekt/nie obiekt Klasyfikacja obiekt/nie obiekt Blok decyzyjny Klasa obiektu Rysunek 6. Schemat zaproponowanej metody ródło: Opracowanie własne. Zaproponowana metoda bazuje na wydzielaniu cech znaku na podstawie analizy z wykorzystaniem zbiorów przybli onych. Podstawowe działania na zbiorach przybli onych s takie same, jak działania na zbiorach klasycznych, lecz, dodatkowo wprowadza si kilka nowych poj, które nie s u ywane w przypadku zbiorów klasycznych, mianowicie:

Studies & Proceedings of Polish Association for Knowledge Management Nr 47, 2011 193 Relacja nierozró nialno ci: Dla ka dego podzbioru cech B A IND( B) = 2 {( x, y) U : a( x) = a( y) } a B (1) Relacj nierozró nialno ci elementów x i y zapisujemy w postaci xind(b)y (x jest w relacji nierozró nialno ci z y w zbiorze cech B), oznacza ona, e elementy x oraz y maj te same warto ci podzbioru cech B, innymi słowy ze wzgl du na zbiór cech B, elementów x i y nie da si mi dzy sob rozró ni, Dolne przybli enie zbioru X w przestrzeni aproksymacji (S): { x U :[] x X } S( X ) (2) = IND( B) jest to najwi kszy podzbiór w S zawarty w X, Górne przybli enie zbioru X w przestrzeni aproksymacji (S): S( X ) = { x U :[] x IND( B) X 0} (3) Brzeg zbioru przybli onego: Bnd( X ) S( X ) S( X ) = (4) Powstaje zatem mo liwo zdefiniowania zbioru w oparciu o jego przybli enie dolne i górne. Dla ka dej z klas rozpoznawanych obiektów tworzone s reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworz wzorcow baz danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane s w grupach wszystkich klas. Najwi ksza liczba wyst pie wskazuje na klas badanego obiektu (znaku). W przypadku zastosowa pocztowych zestawy ucz ce poszczególnych klas uzupełniane s przez wzorce z wideokodowania i ponowne wydzielenie zbiorów reduktów i rozkładów dla poszczególnych klas obiektów. 7. Podsumowanie W artykule przedstawiono metod adaptacyjnego uczenia maszynowego do rozpoznawania i przetwarzania obrazów w procesach automatycznego opracowywania przesyłek pocztowych. Przesyłka pocztowa jest to ładunek jednostkowy opatrzony adresem, przyj ty przez operatora pocztowego w celu przemieszczenia i dor czenia adresatowi. W całym procesie pocztowym przemieszczania przesyłek od nadawcy do adresata wiod c rol pełni W zły Ekspedycyjno Rozdzielcze (WER), gdzie zbiegaj si strumienie przesyłek pochodz cych niemal e ze wszystkich kierunków w kraju. W momencie dopływu ładunków do WER s one rejestrowane w systemie teleinformatycznym. Dokonuje si tego na stanowiskach recepcyjnych, przy u yciu skanerów kodów kreskowych. Ze wzgl du na pracochłonno procesu, terminy czasowe dostarczania przesyłek najwi cej uwagi wymaga proces sortowania przesyłek listowych. Po ich przyj ciu do

194 Mirosław Miciak, Roman Wiatr, Rafał Boniecki Adaptacyjna metoda uczenia maszynowego w systemach klasyfikacji i sortowania przesyłek pocztowych WER na liniach do automatycznego rozdziału odbywa si proces sortowania przesyłek na poszczególne kierunki adresowe. Linie do automatycznego rozdziału zestawione s z maszyn ustawione jako niezale ne segmenty. Ze wzgl du na proces automatycznego rozpoznawania adresu, najistotniejszy segmentem linii jest zintegrowana maszyna czytaj ca z wideokodowaniem IRV. W maszynie czytaj cej z wideokodowaniem IRV, system za pomoc modułu OCR automatycznie odczytuje adres. W przypadku kiedy OCR nie mo e sobie poradzi z odczytaniem danych adresowych, obraz przesyłki trafia do sekcji VCD (ang. Video Coding Desk). Jest to zespół stanowisk, wspomagaj cych odczyt automatyczny, gdzie na ekranach monitorów pojawiaj si strony adresowe przesyłek pocztowych. Moduł OCR jest kluczowym elementem procesu i jest odpowiedzialny za rozpoznawanie danych z pola adresowego. Mała sprawno tego modułu podnosi koszty i zmniejsza przepustowo całego systemu opracowania przesyłek. Dynamiczny rozwój technik przetwarzania obrazów pozwala na wprowadzenie rozwi za umo liwiaj cych podniesienie skuteczno ci automatycznego systemu pocztowego. Zaproponowana metoda bazuje na wydzielaniu cech znaku na podstawie analizy z wykorzystaniem zbiorów przybli onych, dzi ki temu pojawia si mo liwo zdefiniowania zbioru cech w oparciu o przybli enie dolne i górne. Dla ka dej z klas rozpoznawanych obiektów tworzone s reguły decyzyjne oraz rozkłady poszczególnych parametrów, które tworz wzorcow baz danych. Na etapie rozpoznawania cechy nieznanego obiektu porównywane s w grupach wszystkich klas. Zastosowane zbiorów przybli onych pozwala na poszukiwanie ukrytych zale no ci pomi dzy danymi i podejmowanie decyzji w sytuacji istnienia niepełnych lub cz ciowo sprzecznych danych. Bibliografia 1. Bouchaffra D., Govindaraju V., Srihari S., 1999. Recognition of strings using nonstationary Markovian models: an application in ZIP code recognition. IEEE Computer Society Conference on Computer Vision and Pattern Recognition 2, s. 2174 2183. 2. Chaberek M., 2002 Makro- i mikroekonomiczne aspekty wsparcia logistycznego. Wydawnictwo Uniwersytetu Gda skiego. 3. Filatov A., Volgunin A., 1997. Handwritten ZIP code recognition. ICDAR 4, s. 766 770. 4. Forella G., 2000. Word perfect, Postal Technology. UKIP Media & Events Ltd. UK. 5. Ishikura T., Adachi T., 1999. Video Coding technology for postal automation system: Special issue on postal automation technology. NEC research and development 40, Tokyo, s. 176 180. 6. Maszewski M., Miciak M., 2006. Rozpoznawanie danych teleadresowych z wykorzystaniem współczynników Fouriera i zespolonej dyskretnej transformacji falkowej opartej na projekcji. Techniki Przetwarzania Obrazu. s. 381 386. 7. Michalski K., 2004. Rola centrum ekspedycyjno-rozdzielczego w kreowaniu warto ci sieci logistycznej Poczty Polskiej, Instytut logistyki i Magazynowania, Pozna. 8. Miciak M., Marchewka M., 2004. The recognition of postal code using Fourier transform method., XII Konferencja Sieci i Systemy Informatyczne, Łód, s. 461 468. 9. Mitsu Y., Tatsuro S., Isao Y., 1994. A recognition system for Japanese Zip code using Arc features. IEICE Transactions on Information and Systems. s. 810 816.

195 Studies & Proceedings of Polish Association for Knowledge Management Nr 47, 2011 10. Bok-Suk Shin., Effective feature extraction by trace transform for insect footprint recognition, Bio-Inspired Computing: Theories and Applications 2008, s. 97 102. 11. Petrou M., Piroddi R., Talebpour A., Texture recognition from sparsely and irregularly sampled data, Computer Vision and Image Understanding archive, 2006, s. 95 104. THE ADAPTIVE MACHINE LEARNING METHOD FOR POSTAL SORTING SYSTEMS Summary In this paper we present a method of adaptive machine learning to recognize images in the automatic process of mail sorting. Due to the automatic address recognition, the most important segment of this proces is adress reading through optical character recognition module. Low efficiency of this module raises costs and reduces the throughput of the system. Proposed a method based on the characer features obtained on the basis of rough sets analysis. However, data from the videocoding allow you to update the database patterns of individual character classes. Keywords: mail sorting, machine learning, rough sets Mirosław Miciak Roman Wiatr Rafał Boniecki Zakład In ynierii Poczty Wydział Telekomunikacji i Elektrotechniki Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy ul. Kordeckiego 20, 85-225 Bydgoszcz e-mail: mirosław.miciak@utp.edu.pl roman.wiatr@utp.edu.pl rafal.boniecki@utp.edu.pl