Analiza i przetwarzanie obrazo w



Podobne dokumenty
Analiza i przetwarzanie obrazów

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Pakiet Sokrates Instrukcja instalacji

5.2. Pierwsze kroki z bazami danych

APLIKACJA KONKURSOWA INSTRUKCJA UŻYTKOWNIKA

Instrukcja do programu myshowup

INSTRUKCJA PRZYGOTOWANIA ZDJĘĆ DO

Tworzenie infografik za pomocą narzędzia Canva

Instrukcja dla programu Ocena.XP

Instrukcja obsługi programu Do-Exp

Instalacja modemów iplus Huawei E169, E180, E220, E230 oraz E272 w systemie OS X Leopard (wersja polska).

1. Aby na stronie ZS umieścić artykuł np. news, wymagania edukacyjne, konspekt trzeba założyć sobie konto, w tym celu naciskamy

Implementacja filtru Canny ego

I. Spis treści I. Spis treści... 2 II. Kreator szablonów Tworzenie szablonu Menu... 4 a. Opis ikon Dodanie nowego elementu...

Ustawienia widoku ikon

AUTOMATYCZNE ROZPOZNAWANIE PUNKTÓW KONTROLNYCH GŁOWY SŁUŻĄCYCH DO 3D MODELOWANIA JEJ ANATOMII I DYNAMIKI

Kopiowanie, przenoszenie plików i folderów

Zajęcia komputerowe klasy I-III- wymagania

INSTRUKCJA SKŁADANIA ZLECEŃ ZA POMOCĄ APLIKACJI MOBILNEJ TellVet

Politechnika Poznańska, Instytut Informatyki, TWO/GE. Programowanie dla ios

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

1. Tilt-shift. TEMAT PROJEKTU Tilt-shift - aplikacja na system mobilny ios

Adobe InDesign lab.1 Jacek Wiślicki, Paweł Kośla. Spis treści: 1 Podstawy pracy z aplikacją Układ strony... 2.

Należy uruchomid program: Start-Wszystkie programy- Microsoft Office- Microsoft Office Access 2007

Jak zamówić zdjęcia przez FotoSender?

Utworzenie aplikacji mobilnej Po uruchomieniu Visual Studio pokazuje się ekran powitalny. Po lewej stronie odnośniki do otworzenia lub stworzenia

oprogramowanie mobilne Instrukcja obsługi PSR 2010

Następnie uruchom b-link z Menu Start lub ponownie uruchom komputer.

Zadanie 3: Liczenie winogron

KORZYSTANIE Z BAZY DANYCH UpToDate

Akademia Górniczo - Hutnicza im. Stanisława Staszica w Krakowie. Projekt. z przedmiotu Analiza i Przetwarzanie Obrazów

1 Warta Mobile Manual

Instrukcja użytkownika aplikacji modernizowanego Systemu Informacji Oświatowej

INSTRUKCJA KORZYSTANIA Z APLIKACJI

Minimalna wspierana wersja systemu Android to zalecana 4.0. Ta dokumentacja została wykonana na telefonie HUAWEI ASCEND P7 z Android 4.

I N S T R U K C J A O B S Ł U G I P L AT F O R M Y E N E R G I A S P O Ł E C Z N A. Spis treści

Umieszczanie grafiki w dokumencie

Aleksander Galisz. Gf aktura 1.0. Podręcznik użytkownika

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows XP

Kraków, ver

Instrukcja obsługi funkcji specjalnych szablonu C01 v.1.0

1 Warta Mobile Manual

2.2 Przestrzeń robocza zespołu Grupy Office 365

Zastępstwa Optivum. Jak rozpocząć pracę z programem Zastępstwa Optivum w nowym roku szkolnym? Przewodnik. Zakładanie nowej księgi zastępstw

Ćwiczenie 6. Wiadomości ogólne.

Teraz przechodzimy do zakładki Zarządzanie kolorami.

WYKONANIE APLIKACJI OKIENKOWEJ OBLICZAJĄCEJ SUMĘ DWÓCH LICZB W ŚRODOWISKU PROGRAMISTYCZNYM. NetBeans. Wykonał: Jacek Ventzke informatyka sem.

Instrukcja obsługi. Helpdesk. Styczeń 2018

Tworzenie pliku źródłowego w aplikacji POLTAX2B.

Podstawowe zasady tworzenia projektu w środowisku uvision 4.0, pisanie programów w asemblerze 8051

Gra na telefon komórkowy

Poradnik zetula.pl. Jak założyć konto na zetula.pl. i zabezpieczyć dane na swoim komputerze?

CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu

Poczta elektroniczna na urządzeniu mobilnym - Outlook

Pracownia internetowa w każdej szkole (edycja Jesień 2007)

Badanie ruchu złożenia

STEKOP S.A. Białystok 2003 INSTRUKCJA OBSŁUGI TERMINALA KONTROLI DOSTĘPU SYSTEMU INTEGRUJĄCEGO ULISSES

Koło zainteresowań Teleinformatyk XXI wieku. Projekt 3. Temat Aplikacja interfejsu Microsoft Kinect

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

5.4. Tworzymy formularze

Obsługa programu Paint. mgr Katarzyna Paliwoda

1. Pobieranie i instalacja FotoSendera

Tematy lekcji zajęć komputerowych klasa 4a grupa 1

SYSTEM OPERACYJNY. Monika Słomian

Instrukcja użytkownika aplikacji modernizowanego Systemu Informacji Oświatowej PRACA NA WIELU BAZACH DANYCH

Tworzenie menu i authoring w programie DVDStyler

SYSTEMY ZARZĄDZANIA TREŚCIĄ WORDPRESS

Edytor tekstu OpenOffice Writer Podstawy

SPIS TREŚCI. Sposób pierwszy... 3 Sposób drugi Ikony banków Ikony dostawców Strona1

Wstęp 5 Rozdział 1. Instalacja systemu 13. Rozdział 2. Logowanie i wylogowywanie 21 Rozdział 3. Pulpit i foldery 25. Rozdział 4.

Wstęp 5 Rozdział 1. SUSE od ręki 13

Wstawianie grafiki. Po wstawieniu grafiki, za pomocą znaczników możemy zmienić wielkość i położenie grafiki na slajdzie.

Temat 3. Projektowanie interfejsu użytkonwnika Kalkulator pierwszy program dla IOS

Ulotka skrócona Moduł Analizy BI. Wersja:

Expo Composer Garncarska Szczecin tel.: info@doittechnology.pl. Dokumentacja użytkownika

KARTA INFORMACYJNA Z INFORMATYKI DO KLASY 4. Imię i nazwisko ucznia:

Instrukcja obsługi Kamery IP

UWAGA: poniższe procedury przygotowane zostały w oparciu o program HiTi PhotoDesiree 2 w wersji

Divar - Archive Player. Instrukcja obsługi

Instrukcja obsługi elektronicznego formularza harmonogramu w ZSI SEZAM

Karta Warszawiaka. Przewodnik po aplikacji mobilnej. KartaWawa

oprogramowanie mobilne Instrukcja obsługi PSR 2010

Zmiany wprowadzone w pakiecie. Projekt PSZ.eDOK

Zalogowanie generuje nowe menu: okno do wysyłania plików oraz dodatkowe menu Pomoc

Uruchomienie aplikacji Plan lekcji w przeglądarce Internet Explorer

WORDPRESS INSTRUKCJA OBSŁUGI

TTS Jesteśmy dumni z bycia częścią

1 Warta Mobile Manual

REFERAT PRACY DYPLOMOWEJ

autor poradnika - KS Jak zamieszczać i edytować artykuły na szkolnej stronie internetowej

Pracownia internetowa w każdej szkole (edycja Jesień 2007)

etrader Pekao Podręcznik użytkownika Jak zacząć pracę z etrader Pekao?

Analiza i przetwarzanie obrazów

PRZEWODNIK PO ETRADER PEKAO ROZDZIAŁ I. JAK ZACZĄĆ PRACĘ Z ETRADER PEKAO? SPIS TREŚCI

Z nowym bitem Zajęcia komputerowe dla szkoły podstawowej. Wymagania na poszczególne oceny szkolne dla klasy IV

Mobilna Aplikacja Handlowa

Rysunek 1: Okno timeline wykorzystywane do tworzenia animacji.

Tematy lekcji zajęć komputerowych klasa 4b grupa 2

Transkrypt:

Analiza i przetwarzanie obrazo w Temat projektu: Aplikacja na system ios rozpoznająca tekst Michał Opach 1. Cel projektu Celem projektu było stworzenie aplikacji mobilnej na system operacyjny ios, która rozpoznaje tekst ze zdjęcia. Program pozwala na wybranie fotografii z albumu lub zrobienie zdjęcia. Po wybraniu obrazu źródłowego aplikacja w zależności od wybranej metody prezentuje wykryty tekst zaznaczając go w ramki, lub wykrywa całe linijki tekstu 2. Wykorzystane narzędzia Projekt został zrealizowany w środowisku programistycznym Xcode 6 z wykorzystaniem ios SDK 8. Aplikacja do działania wymaga wersji systemowej 8.0 lub wyższej. W projekcie wykorzystano bibliotekę OpenCV w wersji 2.4.9. Do zarządzania zewnętrznymi bibliotekami użyto managera zewnętrznych zależności cocoapods. 3. Sposób kompilacji Do kompilacji potrzebny jest komputer z systemem operacyjnym OS X w wersji co najmniej 10.10 wyposażony w procesor firmy Intel. Aby skompilowad projekt potrzebny nam jest program cocoapods. Poprzez terminal będąc w katalogu projektu gdzie znajduje się plik o nazwie Podfile uruchamiamy komendę pod install. Gdy program zakooczy działanie w tym samym folderze powinien wygenerowad się nowy plik z rozszerzeniem.xcworkspace, który zawiera właściwy projekt oraz projekt z podami. Przy pomocy Xcode kompilujemy cały workspace. 4. Sposób uruchomienia aplikacji Aby uruchomid program na fizycznym urządzeniu od niedawna nie trzeba byd zarejestrowanym deweloperem. Po zalogowaniu się na swoje Apple ID w Xcode należy wybrad free provisioning w ustawieniach generalnych projektu.

5. Interface Powyższy zrzut ekranu przedstawia widok, który pojawia się zaraz po uruchomieniu aplikacji. Pozwala on wybrad metodę oraz źródło obrazu. Przycisk kamery przenosi nas do aparatu, którym możemy zrobid zdjęcie. Natomiast ikona fotografii przenosi nas do albumu, gdzie możemy wybrad już zrobioną wcześniej fotografie.

Jeśli wybierzemy metodę 2, jesteśmy proszeni o ustawienie nachylenia tekstu przy pomocy slidera na dole ekranu. Zakres nachylenia to od -90 do +90

Po wyborze metody oraz zdjęcia następuje przeniesienie użytkownika do wyniku, który w przypadku pierwszej metody nanosi na obraz obszary, w których znajduje się tekst. Natomiast druga metoda zaznacza linijki tekstu

6. Implementacja Metoda 1 pierwsza przetwarzająca obraz: - zmniejszenie rozmiaru obrazu wejściowego - konwersja obrazu do skali szarości - gradient morfologiczny, którego elementem strukturalnym jest elipsa o rozmiarze 3x3 - binaryzacja przy pomocy progowania metodą Otsu - operacja zamknięcia, element strukturalny to prostokąt o rozmiarze 9x1 - znalezienie konturów - wypełnienie konturów białym kolorem - jeśli kontuar wypełniony jest białym kolorem więcej niż w 45% procentach obszaru i jest większy niż prostokąt o rozmiarze 8x8 to jest tekstem (na obrazie wejściowym rysowany jest czerwony prostokąt) Metoda 2 przetwarzająca obraz (wykrywanie linii): - konwersja oryginalnego obrazu do skali szarości - binaryzacja przy pomocy progowania metodą Otsu - przy pomocy funkcji liniowej sprawdzamy każdy wiersz, gdy w linii wstępuje tekst(czarny) a wiersz wyżej nie występował to jest to początek linijki tekstu, natomiast jeżeli wiersz jest cały biały a we wcześniejszym wstępował tekst to jest to koniec linii

7. Porównanie wyników dla obu metod Porównanie 1 - gdy obraz z tekstem jest dobrej jakości bez pochylenia Jak widad w tym przypadku obie metody wykonały swoje zadanie. Metoda 1 wykonała swoje obliczenia w czasie 0.054355 s. Natomiast rezultat widoczny po prawej stronie został osiągnięty w 0.029495 s. Obrazek wejściowy miał wymiary 637x468.

Porównanie 2 - gdy obraz z tekstem jest dobrej lecz jest pochyły Jaki widad metoda pierwsza nie poradziła sobie z wykryciem tekstu, czas jej wykonania wynosił 0.041580 s. Natomiast metoda wykrywająca linijki tekstu poradziła sobie z zadaniem. Linijki są trochę krzywe spowodowane jest to różnicą w doborze kąta pochylenia tekstu przez użytkownika a rzeczywistym kątem. Metoda 2 wykonała zadanie w czasie 0.052348 s. Obraz wejściowy miał wymiary 944x828.

Porównanie 3 fotografia z kamery telefonu przy złym oświetleniu Pierwsza metoda odnalazła prawie wszystkie znaki tekstowe z fotografii. Natomiast metoda druga wykryła tylko dwie pierwsze linijki tekstu oraz zaznaczyła wiele pustych linijek. Spowodowane jest to słabym, nierównym oświetleniem przez co metoda binaryzacji zwraca ciemne obszary w słabiej oświetlonych miejscach. Czas wykonania pierwszej metody to 0.321487 s, z kolei druga metoda wykonała się w 0.436242 s. Fotografia wejściowa miała rozmiar 2448x3264 8. Wnioski Założenia projektu zostały wykonane. Aplikacja prezentuje dwa podejścia do wykrywania tekstu na obrazach. Obie metody radzą sobie doskonale gdy obraz wejściowy jest dobrej jakości (np. pochodzi z programu graficznego lub edytora tekstowego). Jednak jeżeli tekst na obrazie źródłowym znacząco pochylimy wyłącznie metoda druga wykrywa tekst (wymaga to dodatkowego wprowadzenia przez użytkownika kąta pochylenia tekstu). Z kolei w przypadku

fotografii z kamery urządzenia metoda 1 w przeciwieostwie do metody 2 daje zadowalające rezultaty. Czasy wykonania obu metod są zadowalające użytkownik nie ma wrażenia oczekiwania na rezultat (średni czas animacji przejścia między jednym ekranem a drugim to 0.2 0.3 sekundy, w tym czasie metody realizowane są na bocznym wątku). Natomiast warto tu nadmienid ze w wyniku metody pierwszej obraz źródłowy zostaje zmniejszony. Nie jest to tak istotne jeżeli obraz jest dużych rozmiarów (większych niż rozdzielczośd natywna ekranu), natomiast w przypadku mniejszych obrazów użytkownik może zauważyd różnicę w jakości otrzymanego rezultatu (bardzo widoczne w pierwszym porównaniu).