Moduł I 1. Dzielenie się wiedzą w Internecie... 2 2. Metadane... 5 3. Języki informacyjno-wyszukiwawcze... 8 1
1. Dzielenie się wiedzą w Internecie Przypuszcza się, że zjawisko dzielenia się wiedzą jest równie stare jak ludzkość. Różni się ono jedynie formami. Nastanie ery WWW zintensyfikowało to zjawisko. Szczególną w tym rolę przypisuje się zjawisku Web 2.0 (informacja, jej tworzenie, organizowanie, użytkownicy, źródła). Web 2.0 jest drugą generacją WWW, a treść i struktura w dużej mierze współtworzone są przez użytkowników końcowych, czyli każdego z nas. Internauci są nie tylko odbiorcami informacji, ale także odpowiadają za jej kształtowanie. Użytkownicy współtworzą społeczności wirtualne, sieci powiązań nacechowane relacjami merytorycznymi i społecznymi. Przetwarzanie informacji działa w sposób społecznościowy, tzn. wiedza jest współorganizowana przez wielu ludzi. Globalna współpraca przyczynia się do powstania zbiorowej inteligencji, którą zdefiniowano jako zdolność wirtualnych społeczności do podnoszenia poziomu wiedzy i kompetencji eksperckich ich uczestników poprzez współpracę i debaty prowadzone na dużą skalę. (Cisek, 2009: s. 33 39) Typologia serwisów Web 2.0 1. Collaborative writting świadome i zamierzone współautorstwo, współredagowanie jednego dokumentu, tekstu, źródła informacji; asynchroniczne wspólne pisanie; ponadjednostkowe mechanizmy edycji i kontroli jakości. 2
Przykłady: serwisy typu Wiki, tj. Citizendium, Wikipedia; specjalistyczne: Library Success, LISWiki, Digital Research Tools, Scholarpedia. 2. Collaborative how-to ( jak to zrobić? ), strony internetowe typu Social Q-A sites ( pytanie-odpowiedź ). Tego rodzaju witryny mają charakter ekspercki bądź też quasi-ekspercki. Cechują się wzajemnym udzielaniem porad, współtworzeniem podręczników oraz odpowiadaniem na pytania innych użytkowników. Ekspertem staje się osoba, która uważa, że wie, jak rozwiązać dany problem. W tego rodzaju serwisach działają również społeczne mechanizmy kontroli (komentarze, redagowanie odpowiedzi i porad). Przykłady: how-to Jak-To-Zrobic.pl, HowStuffWorks, ehow; pytanie-odpowiedź WikiAnswers. 3. Open innovation miejsce spotkań osób mających problemy natury specjalistycznej (biznes, informacja, badania naukowe, technologie, organizacja i zarządzanie) oraz tych, którzy chcą pomóc w ich rozwiązaniu. Celem tego rodzaju platform jest tworzenie innowacji i nowej wiedzy. Uczestnikami są anonimowi pytający oraz eksperci proponujący rozwiązania (najlepsze nagradzane są znaczącymi kwotami finansowymi). Przykładami serwisów typu open innovation są: Innovation Exchange, OpenInnovation.eu. InnoCentive, 4. Sharing websites strony internetowe gromadzące wiele różnych dokumentów w jednym miejscu, czyli tworzące bardzo duże zasoby. W ich ramach publikowane są filmy, nagrania, artykuły, notatki, czasopisma, biuletyny, gazety, dokumenty, zdjęcia. Przykłady: Knol a unit of knowledge, Scribd, Note sharing, Presentation sharing, Podcast sharing. 3
5. Social bookmarking zamieszczanie w ogólnie dostępnych serwisach WWW odnośników do rekomendowanych przez użytkowników sieci Internet stron, plików, tekstów oraz usług sieciowych (społecznościowa mediacja pomiędzy zawartością sieci Internet a obecnymi i potencjalnymi korzystającymi). Powstałe w ten sposób zasoby spełniają funkcję katalogów oraz bibliografii specjalistycznych. Przykłady: Delicious, MojeTropy.pl, Bibsonomy, CiteULike, Connotea (Cisek, 2009: s. 33 39). 6. CONNOTEA nowy typ serwisu informacyjnego przeznaczony do tworzenia zestawień bibliograficznych dokumentów elektronicznych z odnośnikami do materiałów źródłowych. Swoją budową przypomina serwisy typu Wiki, jednocześnie wpisując się w poczet serwisów typu Web 2.0, mających charakter społecznościowy. Z racji swojego przeznaczenia CONNOTEA została wyposażona w usługę przechwytywania podstawowych danych dokumentu (opis, adres URL). Przy pomocy omawianego serwisu WWW można utworzyć kolekcję dokumentów on-line. CONNOTEA automatycznie pobiera dane z takich znanych witryn, jak: Nature.com, PubMed, Science, Blackwell Synergy, Wiley Interscience, Amazon, HubMed, D-Lib Magazine. CONNOTEA pozwala również na przeszukiwanie danych w kolekcjach utworzonych przez innych użytkowników. Dokumenty można wyszukiwać z funkcją or ( lub ) bądź też - (wykluczenie danego terminu ze stawianego zapytania) (Kamiński, 2006: http://www.ebib.info/2006/77/kaminski.php). Wymienione powyżej źródła informacji gospodarczej, specjalistycznej i naukowej stanowią warsztat pracy brokerów informacji. Dużą zaletą tego rodzaju źródeł jest to, że są one tworzone przez ludzi chcących dzielić się wiedzą, a tym samym bardzo zaangażowanych w kreowanie informacji wysokiej jakości, weryfikowalnej i będącej pod stałą kontrolą pozostałych użytkowników sieci Internet. Istnieje więc duże prawdopodobieństwo, że informacje dostępne w przedstawionych powyżej serwisach typu Web 2.0 cechują się stosunkowo dobrą jakością. 4
2. Metadane Metadane przeznaczone są do opisu dokumentów elektronicznych. Potocznie można je nazwać danymi o danych. W zastosowaniu do dokumentów WWW używane są do wyszukiwania informacji i służą opracowaniu dokumentów elektronicznych. Istnieje wiele standardów metadanych, gdyż każde środowisko stara się dostosować ich elementy na własny użytek. Wiodącą rolę spełnia tu Dublin Core jako standard metadanych dla prostego opisu zasobów (Nahotko, 2001: http://ebib.oss.wroc.pl/2001/19/nahotko.html). Przykładem, który może przybliżyć pojęcie metadanych, jest katalog biblioteczny, który jest dobrze usystematyzowanym zbiorem metadanych. Karta katalogowa opisuje większy zasób informacji, którym są skatalogowane książki lub inne dokumenty oraz odsyła użytkowników do tych zasobów. Współcześnie karty katalogowe występują w formie elektronicznej, a tym samym wspomnianym odesłaniem może być także przekierowanie do wersji on-line danej publikacji. 5
Dublin Core jest ogólnym standardem metadanych przyjętym jako standard ISO 15836-2003, którego zadaniem jest ułatwienie przeszukiwania zasobów elektronicznych w celu znalezienia kluczowych dla użytkownika informacji. W opisie zasobów internetowych w formacie Dublin Core uwzględnianych jest 15 elementów, czyli dane takie jak: tytuł, twórca lub autor, opis rzeczowy, opis, informacja o wydawcy i współtwórcy, data, format, typ dokumentu, identyfikator, źródło pochodzenia, język, relacja do innych dokumentów, miejsce i czas, własność opis praw autorskich, copyright lub odesłanie do serwisu dostarczającego informacji o warunkach dostępności dokumentu. Kolejność edycji ww. danych nie jest przypadkowy, bowiem prawidłowe ich wpisanie, we właściwej kolejności gwarantuje skuteczność wyszukiwania informacji przez użytkowników Internetu. Poniżej przedstawiono przykład zaczerpnięty z artykułu pt. Metadane zamiesczonego w biuletynie EBIB. <META NAME="DC.Title" CONTENT="Metadane"> <META NAME="DC.Subject" CONTENT="Metadane, Dublin Core, Przeszukiwarki"> <META NAME="DC.Description" CONTENT="Podstawowe informacje z zakresu metadanych"> <META NAME="DC.Publisher" CONTENT="Ossolineum"> <META NAME="DC.Creator" CONTENT="Marek Nahotko"> Źródło: Nahotko, http://www.oss.wroc.pl/biuletyn/ebib14/nahotko.html Dublin Core znalazł również praktyczne zastosowanie przy tworzeniu opisu dokumentów zamieszczanych w bibliotekach cyfrowych bazujących na oprogramowaniu dlibra. Tym samym tysiące e-publikacji dostępnych we współczesnych książnicach. Wikipedia. Wirtualna encyklopedia: http://wikipedia.org/wiki/dublin-core. Jak już wspomniano, metadane zawierają informacje o formie i treści dokumentu elektronicznego. Inaczej rzecz ujmując, jest to zwięzły i systematyczny zbiór informacji odsyłającej, który może być użyty do efektywnego i trafnego znalezienia większych zasobów informacyjnych. Metadane obejmują katalogowanie i indeksowanie wszelakich zasobów posiadających cechy dokumentów elektronicznych, jak również charakteryzujących przestrzeń geograficzną czy pliki graficzne. Umożliwiają one korzystającym z Internetu łatwiejsze znalezienie informacji oraz zarządzanie nimi. Dane dostępne w globalnej sieci mogą być znajdywane dzięki wyszukiwarkom przez wpisanie 6
słów kluczowych lub wyrażeń. Autorzy bądź też organizacje zajmujące się publikowaniem dokumentów elektronicznych wprowadzają metadane na początku kodu języka HTML. Narzędzia wyszukiwawcze przeglądają zasoby WWW, porównując dane wyrażenie lub też słowo z wpisanymi metadanymi. Użycie słowników kontrolowanych, takich jak Dublin Core, pozwala na zamierzoną edycję słów, które pozwolą wyszukać określony zbiór danych. Jedną z pułapek wyszukiwania jest to, że komercyjne firmy w polu matadanych wpisują pospolite lub złudnie podobne słowa, które są indeksowane przez popularne wyszukiwarki internetowe, w rezultacie czego zamiast fachowych artykułów w wynikach wyszukiwania ukazują się nam witryny dotyczące produktów rynkowych, kultury popularnej czy pornografii. Korzystanie z usystematyzowanego zbioru danych do edycji, opartego w gruncie rzeczy na standardach katalogowania wykorzystywanych od dawna przez środowisko bibliotekarzy, pozwoli na poprawienie możliwości wyszukiwawczych i lepszą identyfikację sprawdzonych i rzetelnych tekstów. Standard Generalized Markup Language (SGML) pozwala na zidentyfikowanie i znalezienie nazw tytułów, opisów rzeczowych oraz relacji między tekstem a obrazami lub bazami danych. Metadane są elementem zasobów informacyjnych, umożliwiając bezpośredni akces do danego dokumentu. Bez znaczenia pozostaje więc miejsce przyłączenia do sieci. Dotarcie do dowolnego składnika metadanych przyczynia się do bezpośredniego i szybkiego znalezienia treści dokumentu przez nie opisywanego, bez żadnych obwarowań formalnych czy też pośrednictwa. Konieczne jest zatem tworzenie i utrzymanie dodatkowych informacji, np. o oprogramowaniu, za pomocą którego odczytywana jest dana aplikacja czy adres WWW. Pozostaje jeszcze problem aktualności informacji o lokalizacji dokumentu elektronicznego w sieci. Aktualnie zagadnieniom wszelkiego rodzaju identyfikatorów e-dokumentów niezależnych od zmian w ich lokalizacji poświęca się wiele czasu (Nahotko, 2001: http://www.oss.wroc.pl/biuletyn/ebib14/nahotko.html). Pewnym rozwiązaniem mogłoby być zamieszczanie wartościowych e-publikacji w bibliotekach cyfrowych, które z reguły chętnie przyjmują różnego rodzaju dzieła dorobku intelektualnego, a dokumentowanie bazuje na korzystaniu ze standardów metadanych. Konieczne jest tylko uregulowanie kwestii przekazania praw autorskich. Ponadto warto zrobić ukłon w kierunku Open Access, gdzie również znajdzie się miejsce dla cennych e-wydawnictw. Poza tym psychologia podpowiada nam, że część autorów 7
będzie dbała o to, aby ich dzieła były widoczne w sieci z racji chęci poszukiwania uznania w społeczeństwie informacyjnym. 3. Języki informacyjno-wyszukiwawcze W poprzedniej części omówiono metadane, które służą poprawianiu możliwości wyszukiwania konkretnych danych w zasobach WWW. W tym rozdziale uwaga skupiona zostanie na problematyce języków informacyjno wyszukiwawczych, które są podstawą sprawnego działania systemów informacyjnowyszukiwawczych, a co za tym idzie skuteczniejszego poszukiwania informacji. Języki informacyjno wyszukiwawcze to, jak podaje definicja, języki sztuczne przeznaczone do opisu i poszukiwania informacji. Istotną ich odmianą są języki oparte na kartotekach wzorcowych, które stanowią narzędzia kontroli słownictwa pozwalające na niezawodne działanie systemów informacyjno wyszukiwawczych, tj. baz danych, katalogów bibliotecznych, wyszukiwarek w portalach wiedzy (Babik, 2004: s. 187 193). Kartotekami wzorcowymi przyjęto nazywać zindeksowane zbiory znormalizowanych form haseł formalnych oraz rzeczowych powiązanych odsyłaczami. Wyróżniamy kartoteki haseł osobowych, bibliograficznych, korporatywnych, geograficznych, tytułów ujednoliconych, haseł rzeczowych. Kartoteki wzorcowe służą do: ujednolicania form haseł, kontroli poprawności technicznej, a nawet merytorycznej, danych wprowadzanych do katalogu, wykazywania zasobów słownictwa danego języka informacyjno-wyszukiwawczego, jak również informowania o sposobach używania poszczególnych wyrażeń, 8
odwzorowywania relacji pomiędzy hasłami wzorcowymi, aktualizacji haseł bibliograficznych oraz rzeczowych. Dzięki językom informacyjno-wyszukiwawczym mamy do czynienia z takimi zjawiskami, jak: poprawa jakości tradycyjnych narzędzi wyszukiwawczych, zmiana funkcji języka haseł przedmiotowych, który przeobraża się w język informacyjno-wyszukiwawczy. Tego rodzaju zjawiska poprawiają możliwości wyszukiwawcze bazodanowych aplikacji internetowych, a co za tym idzie dostępność do źródeł wiedzy i zdolność do sprawnego zapełniania powstających luk informacyjnych (Babik, 2004: s. 187 193). Rodzaje języków informacyjno-wyszukiwawczych: 1. Języki deskryptorowe (opisowe) zostały utworzone w związku z potrzebą tworzenia słów dla wąskotematycznych zasobów dziedzinowych. Słownictwo stanowią jednostki zaczerpnięte z języka naturalnego. Przedstawicielami tego rodzaju języków informacyjno-wyszukiwawczych są tezaurusy, czyli słowniki przekładowe, uporządkowane alfabetycznie i semantycznie (znaczeniowo). 2. Język haseł przedmiotowych (JHP) wyrażany za pomocą notacji paranaturalnej, kontrolowany. Jest słownikiem tematów i określników, uporządkowanym alfabetycznie i zawierającym odsyłacze kierujące do poszczególnych wyrażeń. Zazwyczaj składa się z odrębnych wyrazów, tematów oraz określników stosowanych w poszczególnych kategoriach tematycznych. Jego przykładami są: język haseł przedmiotowych Katalogów Automatycznych Bibliotek Akademickich (KABA), Kartoteka wzorcowych haseł przedmiotowych Biblioteki Narodowej. 3. Język słów kluczowych słownictwo jest tworzone przez słowa kluczowe (wyrażenia) wybierane z tekstu dokumentu lub też treści zapytania. Nie są one kontrolowane lub podlegają tylko częściowej kontroli. Przybierają one formę tożsamą z językiem naturalnym. Język słów kluczowych cechuje się łatwością zastosowania, w związku z czym nie jest wymagane szkolenie przed przystąpieniem do jego stosowania. Wadą jest natomiast to, że nie ma możliwości wyeliminowania wyrażeń bliskoznacznych i synonimicznych, przez co dokumenty o bardzo zbliżonej treści mogą posiadać różne opisy. Języki słów kluczowych 9
tworzone są w oparciu o język naturalny, z autopsji. Powstają na bazie najbardziej rozpowszechnionych terminów pochodzących z literatury naukowej, technicznej oraz wszelkiego rodzaju specjalistycznych publikacji (http://www.jiw.w8w.pl/blog/). Rodzaje języków informacyjno-wyszukiwawczych języki deskryptorowe (opisowe) język haseł przedmiotowych (JHP) język słów kluczowych Największą popularność z racji funkcjonalności zyskały języki deskryptorowe (tezaurusy) oraz słowa kluczowe (keywords). Zdecydowały o tym ogólna dostępność i funkcjonalność, które mają szczególne znaczenie w przypadku wyszukiwania tekstów w bazach czasopism elektronicznych. Każdy z twórców dostarczających dany artykuł zobowiązany jest do podania słów kluczowych, za pomocą których identyfikowany jest artykuł. Ponadto dane słowo kluczowe indeksowane jest w tezaurusach będących często składową interfejsu wyszukiwania zaawansowanego bazy danych czasopism. Przedstawione rozwiązanie to oczywiście jeden z przykładów zastosowania języków informacyjno-wyszukiwawczych. Obecnie istnieją tendencje do odchodzenia od ścisłego utożsamiania haseł przedmiotowych z katalogami bibliotecznymi. Środowisko dokumentalistów bibliotecznych skłania się w kierunku rozluźnienia zasad opisu bibliograficznego bazującego wyłącznie na języku haseł przedmiotowych. Sam JHP jest również modyfikowany i rozszerzany o pojęcia współczesne, dzięki czemu nie można mówić o braku aktualności. 10