Strategie i narzędzia wyszukiwawcze Humanistyka drugiej generacji, człowiek cyfrowy, II rok, semestr letni 2015/16
Strategie wyszukiwawcze (I) ON THE WEB Wyszukiwanie podstawowych informacji Zwykle wykorzystywana jest jedna wyszukiwarka horyzontalna, ogólna, np. Google, Yahoo, Bing, WolframAlpha VIA THE WEB Wyszukiwanie złożone/wielowarstwowe/wieloetapowe Wyszukiwanie w ukrytych zasobach Internetu Korzystanie z różnych narzędzi wyszukiwawczych Wymagana jest znajomość multiwyszukiwarek, wyszukiwarek specjalistycznych, katalogów tematycznych, baz danych, serwisów, zasobów open access Wyszukiwanie zasobów naukowych, badawczych, komercyjnych, informacyjnych
Strategie wyszukiwawcze (II) Przeglądanie (browsing) Eksploracja wybranych, konkretnych stron internetowych/baz danych (nawigacja między hiperłączami). Wymaga dobrej znajomości źródeł elektronicznych. Strategia wykorzystywana do monitoringu wybranych zasobów. Wyszukiwanie (searching) Odkrywanie wcześniej nieznanych zasobów. Punktem startowym jest wybór narzędzi specjalistycznych, za pomocą których można dotrzeć do odpowiednich zasobów. Wyszukiwanie indeksowanych przez narzędzia specjalistyczne baz, serwisów, bibliotek cyfrowych, repozytoriów, stron internetowych. Eksplorowanie tych zasobów za pomocą zapytań (kwerend) i słów kluczowych. Strategia ta jest najskuteczniejsza podczas rozwiązywania konkretnych problemów i szukania odpowiedzi na precyzyjne pytania.
Strategia: Wyszukiwanie + Przeglądanie Wybór strategii Czy znasz temat/cel poszukiwań? tak Czy znasz słowa kluczowe? tak Czy znasz odpowiednią stronę internetową? tak nie nie nie Przeglądaj zasoby, by wybrać temat i słowa kluczowe Użyj wyszukiwarki, by za pomocą słów kluczowych dotrzeć do właściwej strony Przeszukuj strony internetowe, używając słów kluczowych jako narzędzia wyszukiwawczego Kontynuuj wyszukiwanie Na podstawie: Searching vs. Browsing, [w:] 21st Century Information Fluency [on-line], (23.09.2013)
Strategia (III): Model Big 6 Skills Pamiętaj! Strategia Big 6 Skills (Wielka Szóstka) nie musi być linearna, często poszczególne kroki tasują się, nakładają się na siebie Źródło: Edukacja medialna [on-line], [dostęp 30.09.2013]. Dostępny w: http://edukacjamedialna.edu.pl/info/infografiki/.
1. Identyfikacja problemu, rzeczywistej potrzeby informacyjnej hipotetycznego klienta RESEARCHER KLIENT KOMUNIKACJA ROZMOWA WYOBRAŹNIA
2. Wybór optymalnej strategii wyszukiwawczej, pozyskanie informacji z różnych źródeł Źródła informacji Internet, Archiwa, Biblioteki, Eksperci, Urzędy, Zasoby komercyjne, Wywiadownie gospodarcze etc. Źródła informacji Strategie wyszukiwawcze/metody działań
3. Filtracja: wybór, ocena, wartościowanie, selekcja źródeł i informacji wybór ocena selekcja
4. Przetwarzanie informacji: analiza, synteza, tworzenie dokumentów pochodnych notatek, zestawień statystycznych, raportów, streszczeń, baz danych, serwisów www przetwarzanie analiza/synteza produkt pochodny
5. Akredytacja informacji, czyli zapewnienie jakości i wiarygodności: kroki od 1 do 4 Świadomość celu/problemu/ potrzeby informacyjnej Wybór strategii i typów źródeł Pozyskiwanie i filtrowanie informacji Opracowanie uzyskanych danych, wytworzenie źródła pochodnego
6. Udostępnienie informacji/produktu pochodnego w formie i treści odpowiedniej do zapytania klienta Raport Baza danych Serwis internetowy etc. Klient Poinformowanie klienta o źródłach danych, wyjaśnienie wszelkich wątpliwości związanych z jakością danych i ich prawnym otoczeniem
Narzędzia wyszukiwawcze Operatory wyszukiwawcze Operatory Boole a Frazy Określone pola dokumentów Operatory bliskości Maskowanie końcówek Wyszukiwanie zaawansowane Opcje wyszukiwawcze i filtry wbudowane w wyszukiwarki, dziedzinowe bazy danych etc.
Operatory algebry Boole a Składnia: termin A AND termin B AND termin C A AND B Przykład: Kwerenda: prezydent miasto państwo Koniunkcja (iloczyn/mnożenie) Operator AND piszemy wielką literą Wynik: strony zawierające wszystkie wskazane słowa, nie muszą one jednak występować obok siebie i pojawiać się w tej samej kolejności Domyślna reguła logiczna Wynik zawiera elementy z obu zbiorów
Operatory algebry Boole a Składnia: termin A OR termin B OR termin C Przykład: Kwerenda: prezydent OR miasto OR państwo A OR B Wynik: strony zawierające słowo prezydent lub miasto lub państwo Sumowanie logiczne Operator OR piszemy wielką literą Wynik zawiera elementy ze zbioru A lub ze zbioru B Grupowanie słów w wynikach poprzez zastosowanie nawiasu Kwerenda: prezydent (miasto OR państwo) Wynik: strony odnoszące się do prezydenta miasta lub prezydenta państwa
Operatory algebry Boole a Składnia: termin A termin B NOT termin C Przykład: A AND NOT B B Kwerenda: prezydent miasto NOT państwo Wynik: strony odnoszące się do prezydenta miasta, wykluczenie stron związanych z prezydentem państwa Negowanie logiczne Operator NOT piszemy wielką literą Wynik zawiera elementy tylko ze zbioru A
Symbole + / - Iloczyn: + Składnia: termin A +termin B Negacja: - Składnia: termin A -termin B brak spacji brak spacji Przykład: Kwerenda: prezydent +miasto -państwo Wynik: strony odnoszące się do prezydenta miasta, wykluczenie stron związanych z prezydentem państwa
Operator bliskości proksemiczny: NEXT Składnia: termin A NEXT/liczba termin B najwyższa liczba terminów oddzielająca terminy A i B Przykład: Kwerenda: prezydent NEXT/4 miasta Wynik: zwraca dokumenty, w których pomiędzy terminem prezydent a terminem miasta występują najwyżej 4 inne terminy (a zatem 0, 1, 2, 3 lub 4 terminy). Ważne: Kwerenda: prezydent NEXT/0 miasto równoznaczna jest z kwerendą: prezydent miasta (fraza)
Wyszukiwanie fraz należy użyć cudzysłowu Składnia: termin A termin B Przykład: Kwerenda: obowiązki prezydenta miasta Wynik: strony z podaną frazą (dowolne miejsce zamieszczenia, przynajmniej raz) Kwerenda: obowiązki prezydenta miasta w Polsce Wynik: strony z podaną frazą, z przyimkiem w, z rzeczownikiem Polsce (dowolne miejsce zamieszczenia, przynajmniej raz)
Wpisywanie w kwerendę rzadkich/specjalistycznych słów ze znakami zastępczymi, np. * (gwiazdka) Przykład: w przypadku dłuższych fragmentów (np. utworu, którego autora nie jesteśmy pewni), wpisujemy słowa/frazy charakterystyczne (rzadkie), umieszczając pomiędzy nimi znak zastępujący całe słowa Pośród narodów - wyście nędzarzami! Z dumą hidalgów nosicie łachmany, I odkrywacie światu swoje rany, Aby zarabiać na chleb krwią i łzami. (Asnyk) Kwerenda: * hidalgów * łachmany Wynik: strony/dokumenty z tekstem i oznaczeniem autora Wyszukiwarki mają ograniczenia związane z ilością słów w kwerendzie, np. Google przyjmuje tylko 10 terminów
Składnia specjalna Uwaga! Między operatorem a terminem nie ma spacji Operator filtrujący Składnia/przykład Cel zastosowania intitle: inurl: intitle:muzeum zwraca strony zawierające w tytule strony słowo muzeum inurl:edu zwraca strony, w których adresie wystąpi rozszerzenie edu ogranicza przeszukiwanie do tytułów stron wyszukiwanie do adresów stron WWW intext: intext:konserwacja zwraca strony, w których treści wystąpi słowo konserwacja powoduje przeszukiwanie wyłącznie treści stron, ignoruje hiperłącza, adresy stron i ich tytuły inanchor: inanchor:jacek zwraca strony, które posiadają w swoich strukturach odsyłacze do stron zawierających w opisie słowo jacek (np. kurski, santorski, kuroń) ogranicza wyszukiwanie do hiperłączy strony (podczas tworzenia hiperłączy poza znacznikami html podawane są opisy), element inanchor: przeszukuje opisy stron site: rekrutacja site:umk.pl zwraca strony podające zasady rekrutacji na UMK pozwala ograniczyć obszar wyszukiwania do dowolnej witryny lub domeny link: link:tvn24.pl zwraca strony, które zawierają łącza do serwisu TVN24.pl zwraca listę stron, które zawierają odsyłacze do wskazanego adresu
Operator filtrujący filetype: Składnia/przykład archiwa filetype:pdf zwraca strony tematycznie dotyczące archiwów, zapisane w formacie pdf Cel zastosowania pozwala na wyszukiwanie różnych rodzajów plików related: related:www.umk.pl zwraca strony podobne do UMK, a więc szkół wyższych wyszukuje strony podobne/pokrewne do wskazanej info: info:www.helion.pl wyświetlone zostaną odnośniki do stron zawierających kopię strony Wydawnictwa Helion, linki do tej strony i jej podstron oraz strony podobne pozwala wyświetlić hiperłącza do stron zawierających więcej informacji nt. wskazanej strony (poszukiwania obejmują hiperłącza, podstrony, strony zawierające wskazany adres) cache: cache:www.yahoo.com zwraca archiwalną stronę wyszukiwarki Yahoo! odszukuje kopię strony zaindeksowaną przez Google, nawet jeśli oryginał strony nie jest już dostępny Opracowanie: M. Kowalska http://www.google.pl/intl/pl/help/operators.html
Ćwiczenie Wyszukaj danych na wybrany temat, korzystając z wyżej przedstawionych operatorów/terminów wyszukiwawczych. Skorzystaj z wybranej wyszukiwarki ogólnej np. Google, Yahoo, Bing, WolframAlpha Formułując kwerendy, zastosuj różne kombinacje operatorów/terminów wyszukiwawczych. Porównaj otrzymane wyniki (ilość rekordów przy różnych kwerendach, relewantność [odpowiedniość] do zapytania). Przykład: Kwerenda: wizualizacja wiedzy filetype:pdf