TECHNOLOGIE INFORMATYCZNE NIEZBĘDNE DO ZBUDOWANIA SYSTEMU OCENIAJĄCEGO WALORY TURYSTYCZNE MIEJSC NA MAPIE DLA UŻYTKOWNIKÓW O ZNANYCH PREFERENCJACH Informatyka systemów autonomicznych Magdalena Frankiewicz, 148470
ZAŁOŻENIA SYSTEMU OPARTEGO NA GEOINFORMATYCE Geoinformatyka jest dziedziną nauki, która łączy osiągnięcia naukowe pozyskane z dziedziny informatyki oraz nauk o Ziemi, czyli geografii, geodezji, geofizyki i geologii. Systemy bazujące na takiej wiedzy pozwalają na pozyskiwanie danych geograficznych, ich analizowanie i modelowanie. W efekcie powstają systemy informacji oparte na interakcji człowieka z komputerem (lub innym urządzeniem), działające zarówno w bezprzewodowych jak i tradycyjnych sieciach komputerowych. Znane systemy wykorzystujące technologie geoinformatyczne to GIS (System Informacji Geograficznej), GPS (Global Positioning System), systemy teledetekcji i wspomagania decyzji (sdss). Aplikacje takie mają bardzo szerokie zastosowanie jako nie tylko systemy nawigacji, lokalizowania, planowania transportu ale także planowania zagospodarowania, telekomunikacji, turystyki i zdrowia publicznego. Główne narzędzia za pomocą których tworzone są te systemy to obiektowe bazy danych oraz geostatystyki. Opisy obiektów geograficznych zasadniczo składają się z dwóch części, zawierających dwa różne rodzaje danych. Są to: Dane przestrzenne, które mogą zawierać informacje zarówno o kształcie i lokalizacji bezwzględnej poszczególnych obiektów w wybranym układzie odniesienia, jak również o ich rozmieszczeniu wzajemnym względem innych obiektów (topologia). Dane opisowe (atrybutowe) opisujące cechy ilościowe lub jakościowe obiektów geograficznych nie związane z ich umiejscowieniem w przestrzeni. Niezależnie jednak od sposobu konstrukcji bazy danych, jej zasadniczymi jednostkami są zazwyczaj rekordy składające się z pól. Rekordy te reprezentują poszczególne obiekty geograficzne lub kartograficzne, natomiast ich pola odpowiadają atrybutom. Można wyobrazić sobie, że zbiór obiektów jednej klasy tworzy podkład (warstwę) mapy. W ten sposób model mapy analogowej w zapisie cyfrowym wygląda, jak gdyby nałożono na siebie szereg folii - podkładów o różnym zakresie tematycznym. WYMAGANIA SYSTEMU OCENIAJĄCEGO WALORY TURYSTYCZNE Prawie wszystkie miasta w Europie prezentują dzisiaj swoje atrakcje i walory na internetowych mapach. Internetowe plany stały się wizytówką miast i najlepszym narzędziem do promocji 2
własnych zasobów turystyczno-gospodarczych. To na tych mapach turyści szukają najważniejszych obiektów zainteresowań, na nich oceniają atuty miasta, planują swój czas, wybierają hotel, w którym chcą mieszkać oraz szukają atrakcji turystycznych, które chcą zobaczyć. Internetowa prezentacja jest narzędziem budowania pierwszego wrażenia i coraz częściej staje się podstawowym kryterium oceny atrakcyjności danej miejscowości. Wymagane też jest, aby użytkownik w wygodny sposób mógł sam ingerować w treść mapy, tj. wybierać podkład mapowy, przybliżać go i oddalać, ale także pozyskiwać dodatkowe informacje na temat wybranych przez siebie obiektów. Tymi dodatkowymi informacjami mogą być m.in. numer telefonu do wybranego na mapie hotelu, godziny otwarcia zaznaczonego na planie sklepu z pamiątkami, rozkład jazdy wybranego myszką przystanku, obraz zarejestrowany przez klikniętą na planie kamerę internetową, przeglądanie mapy imprez kulturalnych i rozrywkowych w mieście. Systemem spełniającym te kryteria jest np. Web-GIS (Rys. 1). Jego działanie polega na tym, że internauta wysyła do serwera żądanie dostarczenia mapy, podając jej parametry (obszar, rozmiary, format, skalę, itd.). W momencie odebrania żądania przez serwer, aplikacja działająca w systemie uruchamia wszystkie potrzebne programy i sięga do swoich zasobów danych, aby utworzyć nowy obraz mapy. Każda mapa generowana jest dynamicznie, a zaletą tego jest możliwość decydowania o treści mapy. Sami decydujemy, czy chcemy oglądać sieć komunikacyjną na podkładzie fotomapy, czy na tle mapy budynków i ulic. Źródło map jest nieograniczone, mogą to być dane dowolnych rozmiarów: mapy rastrowe, mapy wektorowe, bazy danych, mapy będące wynikiem analizy GIS, a nawet mapy dowolnego źródła w sieci internetowej. 3
Rys. 1 Schemat ogólny działania Web-GIS. SYSTEM REKOMENDUJĄCY MIEJSCA WEDŁUG PREFERENCJI UŻYTKOWNIKA Projekt systemu oceniającego walory turystyczne może być bardziej lub mniej rozbudowany. Wszystko zależy od oczekiwań użytkownika i tego, na ile pytań chce znać odpowiedzi. Jeżeli chcemy znać np. położenie kina na mapie, to powinno to się ograniczyć do stworzenia systemu korzystającego z kilku warstw tematycznych mapy. Jeżeli chcemy dodatkowoo znać repertuar kina i godziny seansów oraz którym środkiem komunikacji miejskiej można dojechać do celu to będzie to znacznie bardziej rozbudowany projekt. Podstawowym zadaniem systemu jest przeanalizowanie wymagań i przedstawienie zbioru możliwości. Serwis powinien gromadzić informacje o obiektach turystycznych, miejscach, miastach, krajach, oraz oceny użytkowników. Po otrzymaniu informacji od klienta o jego wstępnych preferencjach i uwzględnieniu ocen pozostałych użytkowników, system przedstawia klientowi wybrane propozycje. Przy tworzeniu każdego systemu rekomendującego głównym aspektem jest pozyskiwanie i porównywanie preferencji danych użytkowników. Może to się odbywać poprzez bezpośrednie pobranie danych od użytkownika, tzn. 4
Zapytanie użytkownika o ocenę danego obiektu. Ułożenie własnego rankingu danych obiektów przez użytkownika. Prezentacja dwóch obiektów i zapytanie go o wybranie lepszego. Zapytanie o zaznaczenie tych obiektów lub dziedzin, które są preferowane. Inną, niebezpośrednią metodą tworzenia modelu preferencji użytkownika jest np.: Obserwowanie obiektów jakie użytkownik ogląda na mapie. Zapisywanie czasu jaki spędza nad danym obiektem i częstości jego przeglądania. Tworzenie list obiektów powiązanych z systemem, ale pozyskiwanych z komputera użytkownika (wymaga to pewnej integracji programu zainstalowanego na dysku z systemem online). Analizowanie sieci społecznościowej i porównywanie z użytkownikami o podobnych preferencjach. Stosowanie pierwszej metody pozyskiwania preferencji jest ryzykowne ze względu na subiektywną ocenę użytkownika, której nie należy całkowicie ufać, zwłaszcza, jeżeli system będzie porównywał sieć preferencji innych internautów. Metoda polegająca na obserwacji akcji danej osoby wydaje się być bezpieczniejsza, z kolei nie pozwala na poznanie w stu procentach jego faktycznych zainteresowań. Dobrym rozwiązaniem jest więc zastosowanie systemu hybrydowego, który dane pozyskane bezpośrednio będzie uzupełniał danymi z analizy. W pamięci powinny znaleźć się nie tylko powiązania typu preferencja-obiekt czy użytkownikużytkownik o podobnych preferencjach, ale i takie jak obiekt preferowany-obiekt podobny. Jeżeli użytkownik wyznaczy wysoką ocenę danemu hotelowi w pewnym mieście, to serwis powinien być w stanie zaproponować jako alternatywę też inny hotel podobny do jego ulubionego (np. pod względem ilości gwiazdek, cennika) w tym samym lub nawet innym mieście o podobnych walorach turystycznych. Dodatkowym czynnikiem mogącym wpłynąć na wnioskowanie są też dane personalne osoby. Zanim użytkownik zechce skorzystać z ocenienia walorów turystycznych dla jego wakacji powinien najpierw podać swój wiek, ustalić przedział cenowy/miesięczny dochód, ilość osób z jaką chce spędzić wakacje (ewentualnie stan cywilny), swoje zainteresowania z dziedzin powiązanych z turystyką i inne tego typu informacje. Wiedza o tym pozwoli wyeliminować wiele rozwiązań i dostosować wyniki do indywidualnych potrzeb. 5
METODY I ALGORYTMY Turystyka jest powszechną dziedziną, dlatego system oceniający walory turystyczne powinien być dostępny dla każdego. Informacje zapisywane do bazy danych powinny być tworzone przez dowolnego użytkownika, który ma wiedzę na temat jakiegoś miejsca (odwiedził je lub jest tubylcem). Metoda polegająca na generowaniu wiedzy geograficznej przez amatorów to tzw. Neogeography ( nowa geografia ), która jest niejako metodą wymuszoną przez systemy Web 2.0, czyli wszystkie serwisy z dynamiczną zawartością modyfikowaną zgodnie z preferencjami użytkownika. W przeciwieństwie do takich systemów jak GIS, gdzie informacje są wprowadzane przez ekspertów i przeznaczone dla państwowych instytucji, więc dane muszą być rzetelne, tutaj wiedza pochodzi od ludzi, którzy nie muszą być obeznani w danej dziedzinie. Powinno to być zatem coś zbliżonego do Google Maps, Google Earth, GPS, Wikimapia. Zwłaszcza Wikimapia (Rys. 2) jest serwisem godnym uwagi, gdyż działa na zasadzie połączenia dwóch systemów Google Maps i Wikipedii. Użytkownik po znalezieniu na mapie Google danego miasta może odczytać informacje o nim, przenieść się do wikipedii, obejrzeć zdjęcia, obejrzeć komentarze i oceny innych użytkowników. Serwis oferuje też przeglądanie według kategorii (wyszukiwanie hoteli, restauracji ). Rys. 2 Wikimapia - informacje wyświetlane po kliknięciu na mapie na Warszawę. 6
Łączenie baz danych z kliku serwisów pozwala stworzyć zaawansowany system. Jeżeli dodalibyśmy do map Google i Wikipedii jeszcze np. profil użytkownika Flickr to narzuciłoby to filtrowanie według danych personalnych osoby. Metoda ta nazywa się geotagging i jest to proces połączenia geograficznych koordynatów z innymi danymi, takich jak strony internetowe, cyfrowe fotografie czy film. Usługi wspierające technologię geotaggingu mogą być również użyte w celu odnalezienia wiadomości, stron internetowych czy innych informacji związanych z określonymi przez użytkownika współrzędnymi geograficznymi. Zbadanie tak wielu powiązań miedzy obiektami, profilami użytkowników i preferencjami wiąże się z użyciem dużych zasobów pamięci i wymaga wielu operacji obliczeniowych. Często obliczenie wszystkich rozwiązań jest niemożliwe i wymaga zastosowania przybliżonych metod. Algorytmy planowania opierają się na stworzeniu agenta, którego działanie można określić różnymi algorytmami: Agent podąża ścieżką użytkownika jednocześnie ucząc się (traktując użytkownika jak nauczyciela). Działanie agenta jest determinowane przez np. POMDP (Partially Observable Markov Decision Process). Agent stara się wybrać optymalną ścieżkę, minimalizując jednocześnie koszt jej przejścia. Algorytm k najbliższych sąsiadów, używany do prognozowania wartości pewnej zmiennej losowej. Obserwacje stanowią zbiór uczący. Zamiast porównywania wszystkich obiektów ze sobą można wyznaczyć wektor będący średnią cech/preferencji dla danego rodzaju miejsc. W momencie oceniania walorów należy obliczyć tylko różnicę pomiędzy prognozą (wektorem średnim) a wektorem danej obserwacji. Collaborative filtering, czyli filtrowanie informacji i ich wymiana pomiędzy różnymi agentami. Dotyczy to znajdowania użytkowników o podobnych preferencjach i wykorzystania ich ocen w obliczaniu rekomendacji. Może się to sprowadzać to budowania macierzy obiekt-obiekt, obiekt-użytkownik, użytkownik-użytkownik itp. Pearson product-moment correlation coefficient inna metoda korelacji, dająca miarę podobieństwa pomiędzy dwoma wartościami z przedziału [-1,1]. Rodzaj zastosowanego rozwiązania zależy też od złożoności systemu. 7
SYSTEMY GEOINFORMATYCZNE DZISIAJ Rozwój systemów informacji geograficznej i Internetu pozwala dziś na stworzenie profesjonalnych systemów rekomendujących, w tym systemu oceniającego walory turystyczne z wykorzystaniem preferencji użytkownika. Serwisy typu GIS czy Google Maps są dziś bardzo popularne, stosowane zarówno w instytucjach państwowych jak i przez prywatne osoby. Stają się one coraz bardziej rozbudowane i dostarczają mapy i dane w coraz lepszej jakości. Jednym z projektów Google jest MyMaps, gdzie każdy użytkownik może posiadać własną mapę, dowolnie oznaczoną (Rys. 3). Jak widać mapa może służyć nie tylko jako pomoc w planowaniu tras i wycieczek, ale również jako rozrywka, z którą możemy skojarzyć inne zainteresowania, nie będąc pozbawionym przy tym nauki o świecie w którym żyjemy. Rys. 3 Przykładowa mapa z Google MyMaps - "Monster Sightings. LITERATURA http://pl.wikipedia.org/wiki/system_informacji_geograficznej http://www.gis.com http://www.mapakrakow.pl/citrusgis/index.php?section=webgis http://en.wikipedia.org 8