PRZYGOTOWANIE WSTĘPNE OBRAZU DO OBRAZOWEJ BAZY DANYCH



Podobne dokumenty
1. Wprowadzenie. 2. Struktura obrazowej bazy danych

Przetwarzanie obrazu

Przetwarzanie obrazu

Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych

InŜynieria Rolnicza 14/2005. Streszczenie

KORELACJA MIĘDZY OBIEKTAMI GRAFICZNYMI JAKO ASPEKT WYSZUKIWANIA ICH W OBRAZOWEJ BAZIE DANYCH

Jak tworzyć pliki *.pdf z dowolnego programu (np. Word, Exel, PowerPoint itp.).

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Podstawowe informacje o obsłudze pliku z uprawnieniami licencja.txt

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla administratora systemu Warszawa 2007

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest

Implementacja filtru Canny ego

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

Reprezentacja i analiza obszarów

Instrukcja zarządzania kontami i prawami

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

Michał Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (3)

Systemy liczenia. 333= 3*100+3*10+3*1

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Technologia informacyjna

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Internetowy moduł prezentacji ofert pracy do wykorzystania na stronie WWW lub panelu elektronicznym. Wstęp

Współpraca Integry z programami zewnętrznymi

Instrukcja obsługi przewodnika multimedialnego Wirtualny spacer po świątyniach lewobrzeŝnej Warszawy

Dwufazowy system monitorowania obiektów. Karina Murawko, Michał Wiśniewski

KURS ACCESS 2003 Wiadomości wstępne

Najbardziej istotne zmiany w funkcjonalności B2B (niniejsze podsumowanie nie

EKSPLORACJA ZASOBÓW INTERNETU LABORATORIUM VIII WYSZUKIWANIE OBRAZÓW

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK?

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

1. Znajdowanie miejsca zerowego funkcji metodą bisekcji.

STRUKTURA WEWN TRZNA OBRAZOWEJ BAZY DANYCH. Tatiana Jaworska Instytut Bada Systemowych, Polska Akademia Nauk, ul. Newelska 6, Warszawa,

Program do obsługi ubezpieczeń minifort

Podstawowe zasady projektowania w technice

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Zastosowanie Geobazy w analizie przestrzennej. Jarosław Jasiewicz IPIG Wojciech Jaszczyk MPU

5. Administracja kontami uŝytkowników

Spis treści. I. Czym jest Indeks Haseł 3 II. Wyszukiwanie hasła 4. 1) Alfabetyczna lista haseł 4 2) Wyszukiwarka haseł 4 3) Grupy haseł 6

Pattern Classification

dr inż. Jacek Naruniec

Filtracja obrazu operacje kontekstowe

Program do obsługi ubezpieczeń minifort

Agnieszka Nowak Brzezińska

Tworzenie zespołu. Ustalenie aktualnego projektu. Laboratorium Technik Komputerowych I, Inventor, ćw. 4

Rejestr MR/TK Rejestr MR/TK. Instrukcja uŝytkownika. ESCR European Society of Radiology

Instalacja i opis podstawowych funkcji programu Dev-C++

WYKŁAD 12. Analiza obrazu Wyznaczanie parametrów ruchu obiektów

Dokumentacja instalacji aktualizacji systemu GRANIT wydanej w postaci HotFix a

Text mining w programie RapidMiner Michał Bereta

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Pokaz slajdów na stronie internetowej

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. dr inż. Adam Piórkowski. Jakub Osiadacz Marcin Wróbel

XII. Warunek wielokrotnego wyboru switch... case

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wprowadzania danych Warszawa 2007

Transformacja wiedzy w budowie i eksploatacji maszyn

WYKORZYSTANIE GIS W SERWISIE INTERNETOWYM SAMORZĄDU WOJEWÓDZTWA MAŁOPOLSKIEGO

Tablice, DataGridView

The University of Michigan Digital Library Production Service Collection

WSTAWIANIE GRAFIKI DO DOKUMENTU TEKSTOWEGO

Grafika komputerowa. Zajęcia IX

GIS w nauce. Poznań Analiza obiektowa (GEOBIA) obrazów teledetekcyjnych pod kątem detekcji przemian środowiska. mgr inż.

Detekcja punktów zainteresowania

Zastosowanie kołowej transformaty Hougha w zadaniu zliczania monet

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

Systemy uczące się Lab 4

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

OGÓLNOPOLSKI SYSTEM OCHRONY ZDROWIA OSOZ STRONA INTERNETOWA APTEKI

Prezentacja systemu zarządzania treścią CMS

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

252 Bazy danych. Praca z językiem XML

WSCAD. Wykład 5 Szafy sterownicze

Zaawansowane aplikacje internetowe

Program do obsługi ubezpieczeń minifort

Ćwiczenie nr 2. Najbardziej przydatnymi narzędziami do retuszu są: stempel - kopiuje fragmenty obrazu z wybranego obszaru w inne miejsca obrazka,

10. Redukcja wymiaru - metoda PCA

SZKOLENIA I STUDIA PODYPLOMOWE DOFINANSOWANE Z EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO

Instrukcja zmian w wersji Vincent Office

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Formularz MS Word. 1. Projektowanie formularza. 2. Formularze do wypełniania w programie Word

Komunikaty statystyczne medyczne

Diagnostyka obrazowa

Sentinel Playground. Aplikacja dostępna jest pod adresem internetowym: Ogólne informacje o aplikacji

Widzenie komputerowe (computer vision)

ABC filtrowania w ciemni - Jerzy Kołaczyński 1. Teoria 1. Teoria 2. Zastosowanie 3. Split grading 4. Tabele dla głowic kolorowych

Instrukcja automatycznego tworzenia pozycji towarowych SAD na podstawie danych wczytywanych z plików zewnętrznych (XLS).

POLITECHNIKA SZCZECIŃSKA WYDZIAŁ ELEKTRYCZNY

15. Funkcje i procedury składowane PL/SQL

System do rekrutacji nowej generacji

Laboratorium Programowanie Obrabiarek CNC. Nr H04

Aby pobrać program FotoSender naleŝy na stronę lub i kliknąć na link Program do wysyłki zdjęć Internetem.

Systemy ekspertowe. System ekspertowy wspomagający wybór zestawu komputerowego w oparciu o ontologie i system wnioskujący RacerPro

Transkrypt:

Słowa kluczowe: przetwarzanie obrazu, obrazowe bazy danych, segmentacja obrazu, selekcja obiektów, segmentacja elementów roślinnych Tatiana JAWORSKA * PRZYGOTOWANIE WSTĘPNE OBRAZU DO OBRAZOWEJ BAZY DANYCH Artykuł opisuje sposób segmentacji obrazu pod kątem umieszczenia go w obrazowej bazie danych nieruchomości. Analizowane obrazy zawierają róŝnego rodzaju zdjęcia domów jednorodzinnych. Postawiono sobie zadanie nienadzorowanego wydzielenia poszczególnych obiektów architektonicznych oraz wydzielenia domów z otoczenia (ogrody itp.). W tym celu obraz podlega segmentacji wstępnej przy pomocy analizy skupień (fuzzy c-means clustering). Następnie analizuje się oddzielnie kaŝde skupienie. Elementy budynków rozdziela się w oparciu o pojedyncze skupienia. Następnie wydziela się elementy roślinne z otoczenia. Rośliny zielone wydziela się przy pomocy koloru. Natomiast nie zielone elementy roślinne wyznacza się uŝywając współczynników diagonalnych analizy falkowej. 1. WSTĘP Zalew obrazami cyfrowymi postępuje lawinowo wraz z rozwojem coraz szybszych i pojemniejszych łączy internetowych. Wraz ze zwiększaniem się ilości obrazów następuje konieczność ich magazynowania w bazach danych, przetwarzania, rozpoznawania i wyszukiwania. Coraz częściej zaczynają powstawać duŝe bazy obrazowe. Bazy te róŝnią się między sobą w zaleŝności od rodzaju przechowywanych obrazów i celów do jakich mają słuŝyć. Inaczej będzie zatem konstruowana baza obrazów dla galerii i muzeów, a zupełnie inaczej, jeśli będzie to system informacji geograficznej (GIS) lub kolekcja zdjęć satelitarnych do celów geologicznych lub prognoz pogody. Jeszcze inne mechanizmy przeszukiwania będą wykorzystywane w policyjnych bazach odcisków palców i zdjęć twarzy przestępców, a inne przy obrazach kosmosu dla astronomów. Dotychczas powstające bazy obrazowe ograniczały się jedynie do rozpoznawania rodzaju obrazu, czy jest to dom, pies, czy samolot [8]. Następnie, kiedy uŝytkownik * Instytut Badań Systemowych, Polska Akademia Nauk, ul. Newelska 6, 01-447 Warszawa

takiej bazy zadawał pytanie do systemu bo potrzebował np. łąkę z Ŝółtopomarańczowymi kwiatami, system wybierał obraz spośród obrazów zakwalifikowanych jako łąka o podobnym kolorowym histogramie [4]. 2. STRUKTURA OBRAZOWEJ BAZY DANYCH W naszym projekcie zajmujemy się budową bazy zdjęć nieruchomości. W tym celu są wykorzystane zdjęcia domów jednorodzinnych pobrane z Internetu w formacie JPEG. Baza danych i mechanizmy analizy obrazu są zaimplementowane z pomocą pakietu MatLab (wersja 7.1) ze wspomaganiem następujących ToolBoxów: ImageProcessing, Fuzzy, Statistics, Wavelet i DataBase. Baza danych jest dostępna w trybie interaktywnym przez Internet. Interfejs internetowy jest wykonany w Perlu [5]. KaŜdy nowy obraz dołączany do bazy musi przejść obróbkę wstępną, która na rys. 1. jest przedstawiona jako selekcja cech. W ramach tego przygotowania muszą być wydzielone wszystkie interesujące nas elementy architektoniczne (takie jak okna, drzwi, dachy, itp.) i muszą one zostać oddzielone od otoczenia. Na tym etapie bardzo waŝne jest, aby właściwie dokonać segmentacji obrazu i wyznaczyć cechy obiektów, poniewaŝ na tych cechach będzie się dalej opierać indeksowanie bazy i jej przeszukiwanie. Po wyznaczeniu wszystkich cech pierwotnych obiektów i ich cech logicznych (np. sąsiedztwa) następuje dołączenie obiektów do bazy z jednoczesnym ich indeksowaniem obrazowym, czyli indeksy opierają się na cechach obrazów, a nie na elementach tekstowych, np. nazwie pliku z obrazem itp. Aby z tak utworzonej bazy obrazowej mogli korzystać uŝytkownicy tworzony jest graficzny interfejs uŝytkownika, który jest juŝ widoczny na stronie internetowej instytutu. Jeśli przyjrzymy się rysunkowi 1 to okazuje się, Ŝe Graficzny interfejs uŝytkownika jest podstawowym narzędziem do zadawania zapytań do bazy. Musi mieć on zatem moŝliwość łatwego pokazania uŝytkownikowi o jakie cechy moŝe zapytać. Musi zatem istnieć moŝliwość wyboru (np. przesunięcia suwakiem) koloru, kształtu, tekstury, lub typu szukanego elementu, jego atrybutów, itp. W niektórych bazach istnieje nawet moŝliwość zadawania pytań graficznie, czyli moŝliwość naszkicowania interesującego uŝytkownika kształtu lub podania kształtu przykładowego [4]. MoŜna teŝ podać obraz o interesującym uŝytkownika histogramie kolorów i wtedy baza będzie poszukiwać obrazów o analogicznym rozkładzie kolorów, itd. W naszym systemie pokazują się poszczególne elementy architektoniczne określonymi grupami (oddzielnie dachy, okna, drzwi, itp.). Odpowiedzią na zapytanie uŝytkownika jest konkretny obraz, lub zbiór obrazów, który jest wynikiem przeszukiwania bazy. To, na ile ten obraz spełnia oczekiwania uŝytkownika zaleŝy juŝ od następnego modułu, wyspecyfikowanego na rys. 1, jako Modułu dopasowania obrazów. Zawiera on odpowiednie miary dopasowania

obrazów, które równieŝ bazują na cechach obrazów wyznaczonych w procesie obróbki wstępnej. Rys. 1. Schemat obrazowej bazy danych 3. SEGMENTACJA WSTĘPNA W sytuacji, w której kolorowe obrazy domów są pobierane z Internetu i ich wstępna obróbka jest prowadzona w sposób nienadzorowany, kluczowym zagadnieniem staje się takie wyekstrahowanie obiektów z obrazu, Ŝeby nie trzeba było

ingerować w dalsze etapy włączania tych obrazów do bazy danych. W tym celu stosujemy dwu-etapową segmentację umoŝliwiającą dokładne wydzielenie interesujących nas obiektów z obrazu. Rys. 2. pokazuje przykładowy obraz domu, który podlegał obróbce wstępnej. Na pierwszym etapie obraz jest poddawany segmentacji przy uŝyciu rozmytej analizy skupień [7] (fuzzy c-means clustering), w wyniku której otrzymujemy wstępny podział obrazu ze względu na kolor. Dobre efekty uzyskuje się przy podziale na 5-6 skupień. Wtedy dobrze widoczne są takie elementy jak: dach, okna, drzwi itp. Rys. 3 pokazuje właśnie obraz domu po podziale na 5 skupień. Przy tej rozdzielczości dachówka nie jest juŝ rozróŝnialna, natomiast widać wyraźnie, Ŝe ceglane fragmenty elewacji i kominy są klasyfikowane do róŝnych skupień. Rys. 2. Przykładowy obraz poddawany obróbce wstępnej Drugim etapem jest rozdzielenie poszczególnych skupień tak, Ŝeby dostać obraz binarny jedno białe skupienie, czarna reszta obrazu widoczne na rys. 4. W ten sposób dostajemy tyle obrazów binarnych ile było policzonych skupień. Następnie znajdujemy krawędzie obiektów algorytmem Canny [1]. Algorytm ten został wybrany spośród innych algorytmów do wyszukiwania krawędzi poniewaŝ z niego dostajemy zamknięte kontury obiektów [3]. W związki z czarno-białym drukiem artykułu wszystkie rysunki w kolorze w tym artykule są do uzyskania na stronie internetowej autorki pod adresem: http://www.ibspan.waw.pl/~jaworska/

Rys. 3. Wynik segmentacji na 5 skupień Rys. 4. Jedno ze skupień wydzielone na podstawie podziału widocznego na rys. 3

Rys. 5. Obiekty wydzielone z drugiego skupienia (patrz rys. 4) Na podstawie uzyskanych zamkniętych konturów jesteśmy w stanie wyszczególnić pojedyncze obiekty. Po takiej segmentacji dostajemy zbiór oddzielnych ponumerowanych obiektów dla kaŝdego skupienia (przykład na rys.5). Następnie wyznaczane są cechy obiektów, takie jak: kolor, obwód, powierzchnia, środek cięŝkości, momenty główne bezwładności, osie bezwładności, mimośród, kod granic oraz połoŝenie w obrazie. Po ich policzeniu kaŝdy obiekt jest charakteryzowany przez wektor cech. 4. WYDZIELENIE ROŚLINNOŚCI Jak moŝna zobaczyć na rys. 3 roślinność w otoczeniu domu nie jest prawidłowo wydzielona, bo jedno drzewo wchodzi przykładowo w skład trzech skupień. Do wydzielenia domu z roślinności równieŝ podchodzimy dwuetapowo [9]. Najpierw w sposób najbardziej naturalny oznaczamy obszary, które są zielone w palecie RGB. Czyli większość drzew liściastych i trawa mieści się w zakresie green (10-170), a dwie pozostałe składowe, czyli R i B są mniejsze od wartości green dla kaŝdego piksela. Tak wydzielone obszary są pokazana na rys. 6. Jak widać istnieje jeszcze wiele roślin nie wydzielonych w ten sposób, np. kwiatki, czy gałązki, które mają inne kolory. Do tych elementów stosujemy transformację falkową [2], [6].

Rys. 6 Zielonym kolorem pokazane są obszary, dla których składowa zielona w palecie RGB naleŝy do zakresu [10,170] Rys. 7 Wartości detali diagonalnych przekraczające próg 22% wartości maksymalnej

W efekcie róŝne drobne elementy roślinne, które nie są zielone (jak gałązki, kwiatki, itd.), dają duŝe wartości współczynników diagonalnych transformacji falkowej na pierwszym poziomie analizy wielorozdzielczej, oznaczanej w naszym programie cd1. Aby je wyróŝnić wybieramy z transformaty całego obrazu tylko wartości współ-czynników przekraczających określony próg. Na razie ten próg jest ustawiany arbitralnie dla poszczególnych obrazów (mieści się w przedziale 20%-25% maksimum dla całego obrazu). Ale juŝ trwają prace nad automatycznym dobieraniem tego progu. Rys. 7 pokazuje wartości detali diagonalnych przekraczających próg 22% maksimum dla całego obrazu. Jak widać na następnym rysunku pokrywą się one z takimi elementami roślinnymi jak kwiaty w doniczkach, czy krzewy przy ścieŝce. Niestety z racji natury transformacji falkowej detale diagonalne ekstrahują wszystkie elementy skośne, dlatego pojawiają się teŝ zielone plamki na wodzie przed domem, ale to zostanie usunięte w chwili, gdy wydzielimy wodę przed domem. Rys. 8 Elementy roślinne wyznaczone przez połączenie koloru zielonego i maksymalnych współczynników diagonalnych

5. WYDZIELENIE FAKTUR Jak juŝ wspomniano w poprzednim rozdziale oddzielnie rozpoznawane muszą być obiekty teksturowane, gdyŝ w powyŝszym algorytmie byłyby one uznawane błędnie za zbiór obiektów składających się z elementów tekstury. W tym celu obraz poddawany będzie dwuwymiarowej transformacji falkowej. Do dalszej analizy wykorzystywane są detale wertykalne lub detale horyzontalne zaleŝnie od orientacji faktury. Dlatego do wyŝej wymienionych cech obiektów trzeba jeszcze dodać cechy opisujące teksturę niektórych obiektów. Niestety to zagadnienie będzie przedstawione juŝ w następnych pracach. 6. WNIOSKI I KIERUNKI DALSZYCH PRAC Jak widać przygotowanie wstępne obrazu z wydzieleniem znajdujących się na nim elementów jest zadaniem trudnym i musi składać się z wielu etapów. Zadanie jest tym trudniejsze, Ŝe staramy się stworzyć system pracujący automatycznie, bez pomocy człowieka nawet w trudniejszych przypadkach. W wyniku naszych prac część elementów architektonicznych jest juŝ moŝliwa do rozpoznania i wydzielenia z roślinnego tła. Natomiast nad elementami teksturowanymi są juŝ powaŝnie zaawansowane prace. Poza cechami pojedynczych obiektów opisuje się równieŝ cechy logiczne takie jak połoŝenie obiektów w całym obrazie, połoŝenie obiektów względem siebie, itp. Na podstawie powyŝej wyznaczonych cech obraz jest dołączany do bazy danych i odpowiednio indeksowany - teŝ w sposób obrazowy. Dotychczas wykonana segmentacja nie jest to jeszcze klasyfikacja w rozumieniu ludzkiego mózgu, który przypisuje od razu desygnaty widzianym obiektom, ale obiekt trójkątny zostanie częściej sklasyfikowany jako dach, a okrągły i ciemny jako okno. Głębsza analiza semantyczna jest oczywiście planowana w przyszłości. Będzie wtedy uŝyte rozumowanie oparte na przypadkach i wnioskowanie rozmyte. Zapewni ona łatwiejszą komunikację z uŝytkownikiem dzięki stworzeniu moŝliwości zadawanie rozmytych zapytań do bazy. LITERATURA [1] Canny J., A Computational Approach to Edge Detection, W: IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-8, Nr. 6, 1986, 679-698. [2] Daubechies I., Ten lectures on wavelets, Society for Industrial and Applied Math., Filadelfia, 1992

[3] Davis L. S., A Survey of Edge Detection Techniques, CGIP Vol. 4, 1975, 248-270 [4] Flickner M., Sawhney H., et al., Query by Image and Video Content: The QBIC System, W: IEEE Computer, Vol. 28, Nr. 9, sierpień,1995, 23-32. [5] Jaworska T., Partyka A., Obrazowe bazy danych, Raport Badawczy RB/37/2005, IBS PAN, 2005. [6] Mallat S., A wavelet tour of signal processing, Academic Press, Londyn, 1998 [7] Melin P., Castillo O., Hybrid Intelligent Systems for pattern Recognition Using Soft Computing, Springer, Berlin, 2005, 169-184. [8] Ogle V., Stonebraker M., CHABOT: Retrieval from a Relational Database of Images, W: IEEE Computer, Vol. 28, No. 9, sierpień, 1995, 40-48. [9] Russ J. C., The image processing. Handbook, CRC, Londyn, 1995 IMAGE PREPROCESSING FOR CONTENT-BASED IMAGE RETRIEVAL SYSTEM This article describes the way in which image is preprocessed for content-based image retrieval system. All efforts have been put into extracting elements from an image in the unsupervised way. Automated image extraction is crucial; especially, if we take into consideration the fact that the feature selection is still a task performed by human domain experts and represents a major stumbling block on the creation process of fully autonomous CBIR systems. Hence, the paper presents the results of edge detection and the two-step algorithm of object extraction to obtain separate objects prepared to the process of their recognition and introducing into database. In general, the plants are recognised with the use of different shades green colour separated from the RGB palette. To spot non-green elements of the plants the maximum values of diagonal wavelet details are applied.