Użytkownik, Sieć i znaczenie. Podstawowe aspekty uobecniania się informacji w World Wide Web w perspektywie wyszukiwarek internetowych.



Podobne dokumenty
Konrad Dominas World Wide Web-technologiczny cud czy informacyjny nieład? Cyfrowa pragmatyka Sieci.

World Wide Web-technologiczny cud czy informacyjny nieład? Cyfrowa pragmatyka Sieci.

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Klasyfikacja informacji naukowych w Internecie na przykładzie stron poświęconych kulturze antycznej

INTERNET - NOWOCZESNY MARKETING

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można

Multiwyszukiwarka EBSCO Discovery Service przewodnik

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

#1 Wartościowa treść. #2 Słowa kluczowe. #3 Adresy URL

Oferta przygotowana przez BerMar multimedia. POZYCJONOWANIE oferta. tel.: (71)

2 Podstawy tworzenia stron internetowych

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

OPTYMALIZACJA SERWISÓW INTERNETOWYCH >>>WIĘCEJ<<<

Antyk w kulturze popularnej

Poradnik SEO. Ilu z nich szuka Twojego produktu? Jak skutecznie to wykorzystać?

Pozycjonowanie. Co to takiego?

Wyszukiwanie w czasie rzeczywistym sposób na zwiększenie widoczności zasobów bibliotek cyfrowych w wyszukiwarkach internetowych Karolina Żernicka

POZYCJONOWANIE STRON INTERNETOWYCH (SEO)

POZYCJONOWANIE I OPTYMALIZACJA STRON WWW PDF >>>WIĘCEJ<<<

Wyszukiwarka naukowa EBSCO Discovery Service - przewodnik

Tworzenie Stron Internetowych. odcinek 5

Aplikacje WWW - laboratorium

POMOC. 1. Wybór Katalogu

Sposoby analizy i interpretacji statystyk strony WWW.

Pozycjonowanie i SEO w czym jest różnica pojęć?

World Wide Web? rkijanka

POZYCJONOWANIE CHORZÓW >>>WIĘCEJ<<<

Oferta SEO. Analiza i optymalizacja

Instrukcja przygotowania pliku do deponowania

POZYCJONOWANIE STRON PORADY

Jak podnieść pozycje w Google?

POZYCJONOWANIE STRONY SKLEPU

Co to jest pozycjonowanie stron internetowych? Dlaczego warto pozycjonować strony internetowe?

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

SIECI KOMPUTEROWE I TECHNOLOGIE INTERNETOWE

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

System EssentioCMS. Korzyści z zastosowania EssentioCMS

Narzędzia Informatyki w biznesie

Spis treúci. Księgarnia PWN: Paweł Kobis - Marketing z Google. Podziękowania O Autorze Wstęp... 13

Jak pisać dobre teksty SEO?

Upowszechnianie dorobku naukowego w repozytoriach i bazach danych działania komplementarne czy konkurencyjne?

Skrócona instrukcja obsługi

Odkryj potencjał swojej strony internetowej

WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1

Web 3.0 Sieć Pełna Znaczeń (Semantic Web) Perspektywy dla branży motoryzacyjnej i finansowej. Przyjęcie branżowe EurotaxGlass s Polska 10 luty 2012


Badanie struktury sieci WWW

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu

Dobra pozycja w Google? Dlaczego warto nam zaufać?

Kodeks Dobrych Praktyk SEO IAB Polska

3.1. Na dobry początek

Internetowa strategia marketingowa

- google.pl (dla serwisów polskich) - google.com (dla witryn i fraz obcojęzycznych)

Dlaczego musimy nauczać o katalogach bibliotecznych, w świecie idei Web 2.0?

skutecznej rekrutacji

Audyt SEO. sklep-budowalny.pl Biuro obsługi: al. Grunwaldzka 2/ Gdańsk

PageRank i HITS. Mikołajczyk Grzegorz

REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

Pozycjonowanie stron w wyszukiwarkach internetowych. Szansa dla małych i średnich firm na konkurowanie z największymi

Ontologie, czyli o inteligentnych danych

Skuteczne sposoby budowania ruchu w oparciu o SEM/SEO. - Karol Wnukiewicz

Jak przetrwać w "wieku informacji"? [sieciowej]

JAK ZNALEŹĆ SIĘ NA SZCZYCIE GOOGLE? Ujawniamy sekrety skutecznego pozycjonowania TEMAT NUMERU: SPRZEDAŻ W SIECI E-COMMERCE UŻYTECZNOŚĆ

MARKETING INTERNETOWY

Spis treści

POZYCJONOWANIE W WYSZUKIWARKACH APTEK INTERNETOWYCH

Projektowanie architektury informacji katalogu biblioteki w oparciu o badania użytkowników Analiza przypadku

WYMAGANIA EDUKACYJNE Z ZAJĘĆ KOMPUTEROWYCH W KLASIE 4 SZKOŁY PODSTAWOWEJ

Laboratorium Technologii Informacyjnych. Projektowanie Baz Danych

Wikipedia działanie i architektura informacji

Darmowa publikacja dostarczona przez PatBank.pl - bank banków

EBSCO Discovery Service - przewodnik

Proporcje podziału godzin na poszczególne bloki. Tematyka lekcji. Rok I. Liczba godzin. Blok

Czym jest sportoryko?

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

Wykład I. Wprowadzenie do baz danych

Instrukcja użytkownika BIP

PROGRAM NAUCZANIA DLA I I II KLASY GIMNAZJUM

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

1. Wstęp Optymalizacja struktury adresów URL Wstęp Unikalność adresów URL (duplicate content)... 5

Efektywne wyszukiwanie informacji w Internecie

Tematyka i rozwiązania metodyczne kolejnych zajęć lekcyjnych wraz z ćwiczeniami.

BRIEF AGENCYJNY STRONA INTERNETOWA. Informacje podstawowe. Pełna nazwa firmy. Adres firmy do faktury NIP. Osoba prowadząca projekt.

KRYTERIA OCE Y RELEWA T OŚCI WY IKÓW W WYSZUKIWARKACH I TER ETOWYCH I ICH WYKORZYSTA IE DO PROMOCJI WITRY REGIO AL YCH

Strategia SEO. Załącznik B

Idea of responsive web design. Roman Białek Mateusz Mikołajczak Kacper Palmowski Krzysztof Szot

BIBLIOTEKA CYFROWA JAKO KONTENER TREŚCI DLA PORTALI INTERNETOWYCH. DLIBRA & DRUPAL DWA SYSTEMY, JEDNA WITRYNA.

Instrukcja przygotowania pliku do deponowania

Google Planner Keyword - Poradnik

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.

Instrukcja wyszukiwania w katalogach i bazach Biblioteki

POZYCJONOWANIE ZASOBÓW BIBLIOTEK CYFROWYCH

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2

2

SEO z pomysłem. dla leroymerlin.pl

Pierwsza strona internetowa

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 ZAMAWIANIE I REZERWOWANIE

Transkrypt:

Wydział Filologii Polskiej i Klasycznej UAM Pracownia Humanistycznych Studiów Interdyscyplinarnych Użytkownik, Sieć i znaczenie. Podstawowe aspekty uobecniania się informacji w World Wide Web w perspektywie wyszukiwarek internetowych. K. Dominas, Użytkownik, Sieć i znaczenie. Podstawowe aspekty uobecniania się informacji w World Wide Web w perspektywie wyszukiwarek internetowych, Images 2007, nr 9-10, ss. 49-61. Wyobraźmy sobie sytuację, w której stajemy się stroną internetową. Istniejemy w Sieci dlatego, że ktoś bądź coś nas znalazło ktoś w przypadku redaktorów katalogu, coś w przypadku robota wyszukiwarki internetowej 1. Jednak nie chodzi tylko o to, abyśmy zostali znalezieni, lecz przede wszystkim o to, abyśmy wśród znalezionych byli jak najwyżej. Nasz byt zależy nie tylko od tego, co sobą reprezentujemy, lecz również jak reprezentujemy. Jeśli nie mamy zbyt wielu przyjaciół, nasz status spada. Musimy być koleżeńscy i cytować innych. Musimy iść z duchem mody i trendów panujących w naszym wirtualnym środowisku. Jeśli popularne są kolory czerwony i zielony, nasza głowa (head nagłówek dokumentu HTML) musi być czerwona, a nasz tułów (body właściwa treść dokumentu HTML) zielony. Musimy się rozwijać, nie możemy stać w miejscu. Każdemu z nawigujących po nas powinniśmy się podobać, nikt nie może się zgubić, nasza architektura musi być zatem jasna i przejrzysta, przyjazna dla użytkownika. Akceptując i przestrzegając wciąż aktualizujących się zasad, być może sprawimy, iż sami zaczniemy je tworzyć. Wówczas każdy będzie nas naśladował, wielu będzie nas cytowało. Staniemy się popularni. Staniemy się wzorem. Przykład ten ilustruje podstawowe sposoby postrzegania informacji w Sieci 2 w aspekcie pragmatycznym (użytkownika Internetu). Są one związane z następującymi zjawiskami: architekturą informacji, marketingiem internetowym, poziomem merytorycznym treści (zawartości serwisu internetowego) i technologią, w której wykonano witrynę. Celem niniejszego artykułu jest krótkie opisanie wymienionych powyżej zjawisk a następnie ukazanie ich w perspektywie wyszukiwarek internetowych narzędzi, które są 1 / Niniejszy artykuł jest częścią rozprawy doktorskiej pt. Internetowa recepcja mitu o Eneaszu, napisanej pod kierunkiem prof. dra hab. Aleksandra W. Mikoajczaka z Uniwersytetu im. Adama Mickiewicza w Poznaniu. 2 / Współcześnie Internet definiuje się jako zbiór systemów porozumiewania, wśród których najważniejszą rolę odgrywają: World Wide Web (WWW), Usenet (grupy dyskusyjne), poczta elektroniczna, IRC (Internet Relay Chat rozmowy w czasie rzeczywistym) oraz VoIP (Voice over IP telefonia internetowa). Z definicji tej wynika, iż WWW jest częścią Internetu systemem działającym w oparciu o jego architekturę. Rozumiejąc tę zależność postanowiłem jednak słowa Internet, Sieć i WWW używać jako synonimów w celu uniknięcia powtórzeń.

odpowiedzialne w WWW za hierarchizowanie i generowanie znaczeń. Znaczenia te, jak zobaczymy w dalszej części artykułu, są pozorne to znaczy przekształcone, zredefiniowane przez aplikacje systemów wyszukiwawczych układających je w ranking według wpisanych w system algorytmów. Sposoby uobecniania się informacji w Sieci Dla Louisa Rosenfelda i Petera Morville a architektura informacji jest strukturalnym projektowaniem przestrzeni informacyjnej, służącym ułatwianiu kompletowania informacji i udostępniania ich użytkownikom 3. Autorzy Architektury informacji w serwisach internetowych patrzą na materiały zawarte w Sieci w trzech aspektach: kontekstu (cele biznesu, finansowanie, polityka, kultura, technologia, zasoby, ograniczenia), zawartości (rodzaje dokumentów i danych, obiekty, objętość, istniejąca struktura) i użytkowników (audytorium, zadania, potrzeby, metody wyszukiwania informacji, nabyte doświadczenie) 4. Częściami składowymi architektury informacji stają się: a) systemy organizacyjne sposób, w jaki informacja jest dzielona na kategorie, b) systemy etykietowania sposób, w jaki informacja jest reprezentowana, c) systemy nawigacyjne sposób, w jaki można przeglądać informacje, d) systemy wyszukiwawcze sposób, w jaki wyszukujemy informacje 5. Tomasz Frontczak w książce Marketing internetowy w wyszukiwarkach pisze: Istnienie serwisu internetowego jest bezcelowe, jeżeli prawdopodobieństwo jego znalezienia przez potencjalnego użytkownika (potencjalnego klienta) jest żadne lub znikome 6. Osoby zajmujące się marketingiem internetowym zwracają uwagę na sposób interpretowania witryn polegający na poprawianiu dostępu użytkownika do serwisu poprzez zwiększenie jego widoczności. Najważniejszym aspektem informacji staje się zatem to, czy ktoś ją kupi (sukces), czy też nie (klapa). Jeśli treści witryny zostaną zaprojektowane w sposób niezgodny z obowiązującymi zasadami marketingowymi, strona zginie w gąszczu podobnych sobie dokumentów 7. Witryna, aby żyć w Sieci, musi mieć nie tyle autorów, ile przede wszystkim odbiorców, im większe ich grono, tym lepiej. Podstawowymi wyznacznikami tego podejścia 3 / L. Rosenfeld, P. Morville, Architektura informacji w serwisach internetowych, tłum. K. Masłowski, T. Jarzębowicz, Gliwice 2003, s. 20. 4 / Ibidem, s. 41. 5 / Ibidem, s. 66. 6 / T. Frontczak, Marketing internetowy w wyszukiwarkach, Gliwice 2006, s. 17. 7 / Por. K. Kondracka, Serwis idealny, Chip 2004, nr 2, ss. 32-36; M. Pięta, Raport z oblężonej witryny, Chip 2005, nr 1, ss. 130-133; R. Kostka-Zawadzki, Lepkość witryny?, Magazyn internetowy WWW 2002, nr 10, ss. 52-54.

są: optymalizacja stron pod kątem wyszukiwarek (SEO Search Engine Optimization) 8, badanie słów kluczowych 9, użyteczność i funkcjonalność stron internetowych 10. Ocena poziomu merytorycznego koncentruje się przede wszystkim na zawartości serwisu a jej celem jest sprawdzenie treści pod kątem rzeczywistej wiedzy. Dobrym przykładem ukazującym jak duże znaczenie ma to podejście jest ogromny dziś portal Wikipedii 11, która dla wielu internautów szukających określonych informacji stanowi zdecydowanie najlepsze, często jedyne źródło wiedzy. Tymczasem Wikipedia jest serwisem o charakterze otwartym (open project), w którym każdy użytkownik może być potencjalnym autorem treści. Aby przekonać się, jak często jest to projekt o wątpliwych naukowo informacjach, można wykonać proste doświadczenie. Wystarczy bowiem znaleźć kilka popularnych haseł, następnie skopiować je i w części, bądź też w całości, wkleić do okna wyszukiwarki Google. W wielu przypadkach okaże się, iż otrzymamy w rankingu stron dziesiątki dokumentów z tą samą treścią. Pytanie, jakie narzuca się każdemu, kto ocenia takie witryny brzmi: kto dokonał plagiatu?, czy ktoś skopiował informacje z Wikipedii 12, czy też odwrotnie, jakiś bliżej nieznany autor wyciął fragment witryny, a następnie wkleił go do Encyklopedii?. Wyznacznikami tego podejścia mogą być następujące czynniki: badanie witryny pod kątem autorów poszczególnych artykułów, haseł itp., dokładne noty bibliograficzne strony bądź też całego serwisu, przypisy, itp. To, co w postaci rozmaitych materiałów funkcjonuje w WWW, zależy również od syntaktyki czyli odpowiednio dobranej technologii. Syntaktyka to nie tylko specyfika samej sieci, to także analiza współdziałania określonych elementów dokumentu skryptowego (HTML, XHTML, DHTML), takich jak odnośniki, nagłówki, metatagi, wewnętrzne arkusze stylów, itp. Każda interpretacja powinna nie tylko uwzględniać zapis, który w postaci strony internetowej widzimy na ekranie monitora, lecz również to wszystko, co znajduje się w kodzie skryptowym. Witryna internetowa jest zaledwie obrazem wygenerowanym przez przeglądarkę, właściwa treść znajduje się w tym, co jest przetwarzane, czyli w źródle strony (dokumencie skryptowym) 13. Zależność ta odpowiada terminowi modularności, jako jednemu z podstawowych kryteriów przekazu cyfrowego, wprowadzonemu przez Lva 8 / J. Duke, Zostań inżynierem SEO, Internet 2007, nr 2, ss. 41-44. 9 / Por. S. Thurow, Pozycjonowanie w wyszukiwarkach internetowych, tłum. M. Samodulski, Gliwice 2004. 10 / Por. J. Nielsen, Projektowanie funkcjonalnych serwisów internetowych, tłum. A. Bulandra, Gliwice 2003; A. Phyo, Web Design. Projektowanie atrakcyjnych stron WWW, tłum. M. Binkowski, Gliwice 2003. 11 / http://www.wikipedia.org/. Wszystkie serwisy, witryny i strony internetowe, zacytowane w niniejszej dysertacji, zostały odwiedzone między 1 listopada 2006 a 31 marca 2007 roku. 12 / Por. M. Zimnicki, Plagiat, czyli cienka czerwona linia pomiędzy cytowaniem a przestępstwem, Internet 2006, nr 12, ss. 62-64.

Manovicha w Języku nowych mediów 14. Termin ten zakłada, że przy łączeniu się zarówno samych mediów, jak i elementów je tworzących, wszystkie one zachowują swą niezależność, przede wszystkim w kontekście funkcjonalności i przeznaczenia. Zależności między zapytaniami użytkowników a znaczeniami w indeksach wyszukiwarek internetowych Z perspektywy wyszukiwarek internetowych wszystkie zaindeksowane przez roboty serwisy zawierające najmniejsze nawet odniesienia do treści mitycznych, stanowią zbiór dziesiątek milionów słów (haseł) przechowywanych w bazach tychże narzędzi 15. Słowa te nie niosą za sobą żadnego znaczenia, żadnej treści. W procesie interakcji między użytkownikiem wpisującym do interfejsu frazę a elementami zapisanymi przez aplikacje wyszukiwarki powstają jedynie określone zależności semantyczne. Mamy zatem do czynienia z procesem, który polega na dynamicznym i nieustannym tworzeniu pozornych znaczeń. Proces ten rozpoczyna się w momencie, w którym interanuta definiuje szukane przez siebie informacje za pomocą ciągu znaków, a następnie umieszcza je w oknie programu. Związki semantyczne kształtują się w zależności od systemu wyszukiwania 16. W tzw. modelu prostym w wyniku zestawienia zapytania z hasłami indeksowymi, zostaje znaleziony zestaw dokumentów będących odpowiedzią na wpis użytkownika (Ilustr. nr 1). Przed prezentacją dokumenty te są sortowane i klasyfikowane zgodnie z algorytmami rankingowymi (zgodności, popularności, oceny użytkowników i ekspertów, opłaty) 17. W modelu złożonym dla każdej grupy danych stanowiących zaindeksowane strony WWW, narzędzia wyszukiwarki bądź też autorzy witryn tworzą tzw. metadane, czyli informacje 14 / L. Manovich, Język nowych mediów, tłum P. Cypryański, Warszawa 2006, ss. 95-97. 15 / Wyszukiwarkę internetową definiuję jako program komputerowy przeznaczony do gromadzenia, indeksowania i udostępniania informacji w postaci adresów URL ułożonych w ranking. Za wyszukiwanie materiałów odpowiedzialny jest program-robot zwany pająkiem (spider) lub pełzakiem (crawler). Indeksowaniem zajmują się indeksery, zaś udostępnianiem witryn WWW interfejsy. Biorąc pod uwagę uproszczony model wyszukiwarki, narzędzia te składają się z pająka, indeksu oraz interfejsu. Tylko ostania z jej części jest bezpośrednio udostępniania użytkownikom. Por. K. Bibliński, Szukajcie a znajdziecie, PC World Komputer 2006, nr 4, s. 120-124; Hiperprzeszukiwanie sieci, red. J. M. Kleinberg, tłum. A. Bartnik, Świat Nauki 1999, nr 8, ss. 52-58; P. Wimmer, Moje miejsce na ziemi, PC World Komputer 2006, nr 12, ss. 159-161; M. Nowak, W pajęczynie i w całej reszcie, Chip 2004, nr 11, s. 108-112; K. Gienas, Nowa era szukania, Chip 2004, nr 3, ss. 120-121. 16 / Kiedy spider znajdzie określone przez użytkownika informacje, analizuje ich adres internetowy (URL), a następnie prosi serwer o ich przesłanie. Serwer wysyła strony pająkowi, który spisuje i indeksuje wszystkie słowa i wyrażenia. Na podstawie zawartości oraz innych czynników obliczana jest waga każdej witryny dla określonych słów i wyrażeń kluczowych. Uzyskany rezultat trafia do bazy. Znajdujący się w niej spis stron jest regularnie aktualizowany, w zależności od wyszukiwarki zwykle co 4 6 tygodni. Zarówno praca robotów, jak i sposób klasyfikowania i oceniania informacji dokonuje się za pomocą rozmaitych algorytmów, które stanowią tajemnicę firmy. Por. S. Thurow, Pozycjonowanie w wyszukiwarkach internetowych, op. cit., s. 56. 17 / L. Rosenfeld, P. Morville, Architektura informacji, op. cit., s. 163.

zapisane w postaci rekordów wyjaśniające czego dana strona może dotyczyć. Zapytanie jest w pierwszej kolejności zestawiane z rekordami metadanych, następnie z elementami witryn odnoszących się do tychże rekordów. W ten sposób powstaje zestaw dokumentów, które w odróżnieniu od poprzedniego modelu są bardziej precyzyjne i dokładne, nie opierają się bowiem tylko na prostym porównaniu. Zestawienie następuje tu za pośrednictwem równoważności, hierarchii bądź też skojarzenia (Ilustr. nr 2) 18 W badaniu zależności semantycznych w odniesieniu do wyszukiwarek internetowych podstawowe znaczenie mają sposoby organizowania informacji opisujących poszczególne elementy witryn WWW, takie jak metadane, słowniki kontrolowane i tezaurusy, a także relacje jakie zachodzą między powyższymi modelami a wpisami użytkowników. Metadane Metadane są w ogólnym znaczeniu informacjami stosowanymi do opisywania dokumentów, stron, obrazów, oprogramowania, plików audio i wideo oraz innych obiektów, dzięki czemu nawigacja między tymi elementami, ich wyszukiwanie i pozyskiwanie stają się łatwiejsze 19. Przykładem metadanych, w kontekście witryn internetowych, są tzw. metatagi dane służące do odpowiedniego formatowania stron WWW przez przeglądarki internetowe (np. system kodowania znaków) oraz do przekazywania informacji robotom narzędzi wyszukiwawczych 20. W tym ostatnim przypadku powszechnie używa się opisu strony (tag description) oraz słów kluczowych (tag keywords). Autorzy przykładowej witryny Greek Mythology Link zastosowali następujące parametry metadanych dla strony głównej (indeksowej) 21 : <META name="description" content="the Greek Mythology Link is a new collection of the Greek myths written on line by Carlos Parada."> <META NAME="keywords" CONTENT="achilles, aeolus, ancient, aphrodite, apollo, ares, artemis, athena, atlas, cerberus, chaos, characters, creation, demeter, dictionary, dionysus, eros, fates, genealogy, god, goddess, gods, greek, grekisk, hades, helen, hephaestus, hera, hercules, hermes, homer, icarus, iliad, images, jason, justice, king, map, maps, medusa, mitolog a, monsters, myth, mythical, mythology, mythologie, myths, myths, mytologi, odysseus, odyssey, olympus, orpheus, pan, pandora, parada, paris, pegasus, persephone, perseus, pics, pictures, poseidon, psyche, roman, rome, sea, sirens, stories, trojan, troy, underworld, uranus, venus, war, zeus"> 18 / Ibidem. 19 / Ibidem, s. 208. Por. K. Antosiewicz, Informacje o informacji o informacji..., Magazyn Internetowy WWW 2002, nr 12, ss. 24-25; M. Nahotko, Metadane. Sposób na uporządkowanie Internetu, Kraków 2004. 20 / B. Pfaffenberger, S. M. Schafer, C. White, B. Karow, HTML, XHTML i CSS. Biblia, op. cit., ss. 73-75. 21 / http://www.maicar.com/gml/.

W przytoczonym przykładzie metadanymi są słowa wyróżnione pogrubieniem 22. Dzięki nim baza wyszukiwarki, oprócz zaindeksowania niemal wszystkich elementów serwisu, otrzymuje dodatkowe rekordy pozwalające na bardziej precyzyjne zdefiniowanie znaczenia, a także stworzenie rankingu w momencie, w którym użytkownik wpisze frazę związaną z grecko- -rzymską mitologią. Warto w tym miejscu zaznaczyć, iż informacje zapisane w metatagach są niewidoczne na stronie internetowej, stanowią domenę dokumentu HTML, którego przetworzeniem zajmują się odpowiednie aplikacje wyszukiwarki. Ilustr. nr 1 Model prosty związków semantycznych między elementami baz wyszukiwarek internetowych a wpisami użytkowników Słowniki kontrolowane Najważniejszym systemem budowania pozornych znaczeń w procesie użytkownik-indeks wyszukiwarki są słowniki kontrolowane listy wyrażeń równoznacznych lub preferowanych. Wyrażenie równoznaczne reprezentowane są w postaci pierścieni synonimów, natomiast wyrażenia preferowane w postaci pliku autoryzowanego. Określając relacje między wyrażeniami, mamy do czynienia ze schematami klasyfikacyjnymi, tworząc zaś modele 22 / Wszystkie przykłady funkcjonowania określonych relacji między wyszukiwarkami internetowymi a wpisami użytkowników zostały opracowane dla słowa aeneas.

zależności oparte na skojarzeniach z tezaurusami 23. Słowniki kontrolowane składają się zatem z czterech sposobów definiowania treści: pierścienia synonimów, pliku autoryzowanego, schematu klasyfikacyjnego i tezaurusa; od systemu najprostszego po najbardziej złożony. Ilustr. nr 2 Model złożony związków semantycznych między elementami baz wyszukiwarek internetowych a wpisami użytkowników Pierścień synonimów łączy zestawy słów, które dla celów pobierania informacji uznaje się za równoważne. Model ten przyczynia się do zwiększenia współczynnika precyzji kosztem współczynnika odpowiedzi w procesie znajdowania danych pasujących do zapytania 24. Jest to postępowanie analogiczne do zachowania użytkownika, który, chcąc lepiej określić szukane przez siebie strony, posługuje się pytaniami bardziej złożonymi, wykorzystując do tego celu np. operatory logiczne lub arytmetyczne wyszukiwarki. Istnieją narzędzia pozwalające określić stosowane przez autorów witryn pierścienie synonimów dla najczęściej używanych zapytań. Narzędzia te to przede wszystkim aplikacje Overture Yahoo! Company oraz Google AdWords 25. Overture pozwala zbadać frazy, których szukają użytkownicy. Wpisując do interfejsu słowo aeneas ), otrzymujemy listę najpopularniejszych wyrażeń kluczowych zawierających 23 / L. Rosenfeld, P. Morville, Architektura informacji, op. cit., ss. 208-209. 24 / Ibidem, s. 209. 25 / http://adwords.google.com/select/login; http://www.content.overture.com/d/.

podane słowo (Ilustr. nr 3). Z wyników zaprezentowanych przez Overture możemy dowiedzieć się, iż powyższy termin został wpisany do wyszukiwarki w lutym 2007 roku blisko 1200 razy, najczęściej w połączeniu z takimi hasłami, jak: dido (697 razy) i purcell dido (563 razy). Projektanci witryn korzystają z tych informacji w celu poprawienia widoczności swojego serwisu analizując najczęstsze słowa i frazy dla danego tematu, tworzą listy synonimów i umieszczają je np., w metatagach. Ilustr. nr 3 Lista najpopularniejszych słów i fraz w mechanizmie wyszukiwarki Overture Yahoo! Company dla terminu aeneas Program Google AdWords jest w porównaniu z Overture bardziej rozbudowany. Wprowadzając słowo aeneas, dysponujemy kilkunastoma wariantami wykorzystania wyników (Ilustr. nr 4). Sortując je według trafności, możemy stworzyć następujący pierścień synonimów: aeneas, aeneas vergil, aeneas aeneid, aeneas translation, aeneas troy, aeneas dido, aeneas underworld, aeneas odysseus, aeneas roman, itd. Po przeanalizowaniu średniej liczby trafień, możemy odrzucić frazy, które są rzadko stosowane, np. aeneas roman i aeneas translation, dodać zaś te, które są niezwykle często wykorzystywane przez internatów, ale nie zawierają słowa aeneas, np. greek mythology, king arthur, greek god, itd. Każdy z elementów kluczowych może być opisany za pomocą trendów intensywności wyszukiwania (luty 2006 styczeń 2007). Obok ścisłych słów kluczowych program podaje

również tzw. dodatkowe słowa kluczowe, których klasyfikacja jest analogiczna do powyższych. Istnieje również możliwość hierarchizowania wyników poprzez odpowiednie dopasowywanie: przybliżone, do wyrażenia, ścisłe lub wykluczające. Ilustr. nr 4 Pierścienie synonimów w programie Google AdWords dla słowa aeneas Tezaurusy Najbardziej rozbudowanym systemem nadawania znaczeń wśród wszystkich rodzajów słowników kontrolowanych są tezaurusy semantyczna sieć pojęć łączące słowa ze swoimi synonimami, homonimami, antonimami i szerszym lub węższym zbiorem określeń pokrewnych. Rosenfelfd i Morville definiują tezaurus jako słownik kontrolowany, w którym równoważność oraz hierarchiczne i skojarzeniowe zależności są identyfikowane w celu poprawienia pozyskiwania informacji 26. 26 / L. Rosenfeld, P. Morville, Architektura informacji, op. cit., ss. 217-218.

Świat tezaurusów oparty jest o język techniczny opisujący podstawowe pojęcia oraz występujące między nimi zależności. Większość pojęć można sprowadzić do następujących kategorii: a) Preferred Term (PT) termin preferowany (termin akceptowany, nagłówek tematyczny, deskryptor). Wszystkie zależności semantyczne definiowane są względem terminu preferowanego; b) Variant Term (VT) termin zastępczy (hasło, termin niepreferowany); równoważny z synonimem (dość luźnym) terminu preferowanego; c) Broader Term (BT) termin szerszy. Poprzednik terminu preferowanego znajdujący się w hierarchii o jeden stopień wyżej; d) Narrower Term (NT) termin węższy. Następnik terminu preferowanego znajdujący się w hierarchii o jeden stopień niżej; e) Use (U) użyj. Forma składniowa wykorzystywana jako narzędzie zarówno dla tworzących indeksy, jak i ich użytkowników: termin zastępczy użyj termin preferowany; f) Used For (UF) zamiast (użyty zamiast, użyty dla). Wskazuje na zależność odwrotną: termin preferowany zamiast termin zastępczy. Stosowany w celu pokazania całej listy terminów zastępczych (wariantów) terminu preferowanego; g) Scope Note (SN) opis zakresu. Specyficzny element definicji określający termin preferowany. Stosowany do świadomego zawężenia terminu w celu usunięcia dwuznaczności 27. Z językiem technicznym tezaurusów ściśle są związane zależności semantyczne: równoważności, hierarchiczna, skojarzeniowa. Pierwsza z nich łączy terminy preferowane z terminami zastępczymi (równoważnymi, równoznacznymi). Brane są pod uwagę synonimy, prawie synonimy, akronimy, skróty, warianty leksykalne i często popełniane pomyłki pisowni 28. Jeżeli w wyszukiwarce Google zamiast przykładowego słowa aeneas użyjemy np. aeneaas system podpowie nam w następujący sposób: Czy chodziło Ci o aeneas?. Zależność hierarchiczna dzieli przestrzeń informacyjną na kategorie i podkategorie, łącząc pojęcie szersze i węższe według systemu poprzednik- -następnik. Istnieją trzy typy zależności hierarchicznych (A Narrower Term B): a) rodzajowa gatunek A jest członkiem gromady B, b) część całości B jest częścią A, 27 / Ibidem, s. 219. 28 / Ibidem, s. 229.

c) przykład B jest przykładem A 29. Zależność skojarzeniowa to silnie tkwiące w świadomości związki semantyczne, których nie można uznać ani za równoważne ani za hierarchiczne, np. aeneas Related Term roman mythology 30. Zależności te są procesem niezwykle subiektywnym i co należy podkreślić zależą one od panujących w cyberprzestrzeni mód i marketingu. Ilustr. nr 5 Tezaurus wyszukiwarki Ask Jeeves dla słowa aeneas Dobrym przykładem funkcjonowania tezaurusa jest ranking stron amerykańskiej wyszukiwarki Ask Jeeves (Ilustr. nr 5). Korzysta ona z następujących udogodnień: Narrow Your Search, Expand Your Search, Related Names. Kategorie te odpowiadają kolejno: terminowi węższemu (Narrower Term zależność hierarchiczna), terminowi szerszemu (Broader Term zależność hierarchiczna) i terminowi spokrewnionemu (Related Term zależność skojarzeniowa). Dla słowa Aeneas jako terminu preferowanego tezaurus wyszukiwarki Ask Jeeves przedstawiłem na poniższym schemacie (Ilustr. nr 6): 29 / Ibidem, s. 230. 30 / Ibidem, s. 231.

Ilustr. nr 6 Rozbudowany schemat tezaurusa wyszukiwarki Ask Jeeves dla terminu preferowanego aeneas Przyszłość wirtualnych znaczeń Czy przeciętny użytkownik Internetu ma szansę na to, aby w niedalekiej przyszłości wpisywane przez niego słowa i frazy niosły za sobą rzeczywiste znaczenia? Odpowiedzią na to pytanie może być koncepcja opracowana przez World Wide Web Consortium 31, a dotycząca tzw. sieci semantycznej, która wsparta sztuczną inteligencją ma zastąpić dotychczasowy WWW. Z ilustracji do artykułu Tima Bernersa-Lee, Jamesa Hendlera i Ori Lessili pt. Sieć semantyczna, wyłania się następujący obraz: oto ekran monitora z binarnym systemem zer i jedynek, w które wpisuje się proste stwierdzenie I know, what you mean... (Ilustr. nr 7) 32. Ilustr. nr 7 Ilustracja otwierająca artykuł Tima Bernersa-Lee, Jamesa Hendlera i Ori Lessili, pt. Sieć semantyczna 31 / http://www.w3.org/2001/sw/. 32 / T. Berners-Lee, J. Hendler, O. Lassila, Sieć semantyczna, tłum. A. Bartnik, Świat Nauki 2001, nr 7, ss. 40-49.

Autorzy Sieci semantycznej podzielili zasoby internetowe na informacje zrozumiałe dla ludzi oraz te, które są przetwarzane przez programy komputerowe 33. W ten sposób mamy do czynienia z dwoma podstawowymi pojęciami: rozumieniem aspektem semantycznym i przetwarzaniem aspektem syntaktycznym. Naukowcom pracującym nad nowym obliczem WWW przyświeca zatem idea stworzenia odpowiedniego oprogramowania, za pomocą którego możliwym stanie się fakt, iż komputery nie tylko będą rozumiały to, co przetwarzają, lecz także będą potrafiły interpretować zdobyte informacje i wymieniać z innymi komputerami w celu pogłębiania, własnej cyfrowej wiedzy. Jednak aby tego dokonać musi się zmienić nie tylko przekaz, lecz także zasoby samego systemu. I w ten sposób dochodzimy do punktu, w którym należy uzupełnić technologię połączyć syntaktykę z semantyką. Aby dzisiejsza sieć komputerowa stała się siecią semantyczną, nieodzowne staje się współdziałanie ludzi humanistyki w zakresie reprezentacji wiedzy z uczonymi, którzy tworzą programy do zapisywania owej wiedzy w postaci cyfrowej. 33 / Ibidem, s. 42.