Internet t kilka pierwszych łyków
WWW -pierwsze kroki ki Sieć Word Wide Web jest dzisiaj najpopularniejszym obliczem Internetu Na ogromną popularność tej usługi ł składają się łatwość t posługiwania się stronami WWW oraz mnogość podanej w ciekawy sposób informacji. Poruszanie się po sieci WWW umożliwiają specjalne programy tzw. Przeglądarki.
Przeglądarka! Do zadań przeglądarki należy: - Ściąganie stron WWW. Wyświetlanie ich na ekranie monitora. Dostarczanie użytkownikowi wygodnego g sposobu nawigacji wśród odwiedzanych dokumentów.
Wprowadzanie adresów: Aby móc obejrzeć stronę WWW należy dostarczyć przeglądarce jej adres internetowy. Adresy można ż wpisywać ć ręcznie lub wybierać je z listy ostatnio odwiedzanych witryn. Adres http://www.wp.pl
Hiperłącza ł To najważniejsze elementy stron WWW, dzięki którym możliwe jest łatwe i szybkie przenoszenie się między dokumentami. Posiadają postać podkreślonego tekstu, bądź są wyróżnione od reszty tekstu w określony sposób.
Wyszukiwanie informacji na stronach WWW. Czyli: Szukać. Co? Gdzie? i? Jak?
Wyszukiwanie informacji na stronach WWW. W Internecie można znaleźć wiele potrzebnych i ciekawych informacji, ale jest ich tak dużo, że czasami nie sposób do nich dotrzeć. Obecnie Istnieje około 800 milionów stron WWW i liczba ta stale się zwiększa. Najlepiej jeśli znamy dokładny adres strony z poszukiwanymi wiadomościami, ale niestety tak jest rzadko. Wtedy należy yposłużyć się ę dostępnymi narzędziami służącymi do wyszukiwania informacji.
Katalogi stron - dił działanie. i Najstarszą metodą wyszukiwania informacji są katalogi stron internetowych. Serwisy te zatrudniają redaktorów, którzy przeglądają strony internetowe i decydują do jakiej kategorii je zaliczyć. Mogą również dodać krótki opis witryny. W ten sposób powstaje komputerowy katalog udostępniany wszystkim zainteresowanym. Przykłady katalogów: Yahoo! Wirtualna Polska
Drzewiasta struktura katalogu. Internetowe katalogi posiadają zbiory wyselekcjonowanych y i posegregowanych tematycznie witryn WWW. Katalog jest drzewiastą strukturą, w którą szukający się zagłębia. Witryny przypisane są, ze względu na swoją zawartość do poszczególnych kategorii, które dzielą się na kategorie podrzędne.
Katalogi stron - budowa Drzewiasta struktura przypomina drzewo katalogów i podkatalogów Exploratora Windows. Na końcu tej struktury znajdują się strony zawierające odsyłacze internetowe do konkretnych witryn.
Wyszukiwarka k internetowa t (ang. search engine) ) to program lub strona internetowa, której zadaniem jest ułatwienie użytkownikom Internetu znalezienie informacji w sieci. Wyszukiwarki przeszukują cały tekst dokumentu lub wybranej witryny Szukają wedle słów kluczowych, starając się je dokładnie znaleźć w jakiejś witrynie. Nie korzystają z podziału witryn na żadne kategorie.
Baza danych powstaje dzięki użyciu ż pajączków (specjalnych programów, penetrujących i indeksujących Internet przy minimalnym udziale człowieka)
Zasięg od bardzo małego ł i specjalistycznego, do 90% i więcej dostępnych zasobów Sieci. W znaczeniu ogólnym wyszukiwarka to oprogramowanie gromadzące w sposób automatyczny informacje o dokumentach tekstowych oraz plikach zgromadzonych w sieci (obszarze wyznaczonym dla wyszukiwarki do indeksowania).
Wyszukiwarki oparte na analizie treści strony Ponieważ Internet rośnie znacznie szybciej niż jakakolwiek grupa ludzi może go katalogować, oraz z powodu wad katalogów (np. pod danym hasłem może znajdować się tysiące stron), powstały wyszukiwarki, które przeszukują Internet analizując zawartość stron. Kiedy użytkownik poda wyszukiwarce zapytanie, ona odpowie mu łączami do stron, które uzna, w zależności od użytego algorytmu, za najbardziej odpowiednie.
Wyszukiwarki oparte na analizie treści strony cd.. Wyszukiwarki oparte na tej zasadzie mogą objąć ć znacznie większą część sieci niż katalogi. Niestety są one bardzo podatne na nadużycia, przez co użytkownik zamiast użytecznych informacji dostaje linki na strony nie mające nic wspólnego z jego zapytaniem. Szczególnie wyspecjalizowały się w tym strony pornograficzne.
Wyszukiwarki oparte na analizie topologii sieci Żeby przeciwdziałać temu, wyszukiwarki zaczęły stosować analizę topologii sieci. Tak więc stronę uważa się za odpowiadającą zapytaniu "britney spears", jeśli wiele stron na temat "britney spears" do niej się odwołuje. Strona porno z nagimi zdjęciami Britney, niezależnie od własnej treści, i niezależnie od całkowitej liczby linków (głównie z innych stron porno) na nią, niebędzie w ten sposób uznana za związaną z tematem. Natomiast jeśli zada się zapytanie "britney spears nude", strona ta zostanie uznana za istotną, ponieważ odwołuje się do niej wiele stron o tematyce "nude". Pierwszą wyszukiwarką, która zastosowała zaawansowane algorytmy analizy topologii sieci był Google.
Wyszukiwarki oparte na zasadzie aukcji miejsc Osobnym pomysłem jest wprowadzony yprzez Overture (obecnie część Yahoo!) system, gdzie strony płacą wyszukiwarce kilka centów za każde kliknięcie, przy czym miejsca są licytowane - strona która daje więcej za kliknięcie znajdzie się wyżej na liście rezultatów. Pozycje płatne są ą oznaczone jako takie, razem z ceną. ą System ten jest korzystny dla właścicieli stron - płacą oni tylko za wejścia nie za wyświetlenia.
Wyszukiwarki oparte na zasadzie aukcji miejsc cd.. Twórcy twierdzą, że jest on również korzystny dla użytkownika, gdyż tylko strony, które oferują coś użytecznego z danej dziedziny mogą sobie pozwolić na taką reklamę. Z drugiej jednak strony wiele użytecznych stron jest niekomercyjnych, a nawet przy stronach komercyjnych wyniki będą często nieoptymalne - np. na taką reklamę nie mogą sobie pozwolić strony, które mają niskie marże i oferują produkty yp po niskich cenach, a jedynie te, które mają wysokie marże i oferują produkty drożej.
Reklamy w wyszukiwarkach Wyszukiwarki stanowią wymarzony cel reklamodawców, ponieważ ż mają oni praktycznie pełną ł gwarancję, że osoba wyszukująca dane hasło jest nim zainteresowana. Tak więc większość ę wyszukiwarek oferuje reklamy zależne od treści zapytań (np. AdWords oferowany przez Google). Nie zawsze są one właściwie oddzielone od wyników poszukiwań, co stało się źródłem protestów grup ochrony praw konsumentów oraz kilku do dziś nierozstrzygniętych spraw sądowych. Ze względu na szeroką krytykę procederu nieoddzielania reklam od wyników, większość wyszukiwarek k z niego zrezygnowała ł i wyraźnie zaznacza teraz reklamy.
Metawyszukiwarki Przykłady: Friskr, Clusty, Ask.com, Metacrawler, Ixquick, Copernic (program), Watson (program) Metawyszukiwarki (zwane także multiwyszukiwarkami) dają jednoczesny dostęp do wielu (niekiedy: kilkudziesięciu) wyszukiwarek. Zwracają wynik wyszukiwania na ogół w wygodnej formie tabelarycznej. Czasami bardzo pomysłowo grupują wyniki. Niestety, najczęściej ę j dostęp do każdej wyszukiwarki dotyczy ytylko ok. 10% jej zasobów.
Pierwsza wyszukiwarka Pierwowzorem wyszukiwarek był stworzony w 1994 r. narzędzie zwane ROBALEM WWW (ang. Worm WWW). Program ten stworzył naukowiec z Uniwersytetu w Colorado Olivier McBrian. Program ten przeszukiwał i skanował dostępne wówczas zasoby sieci i WWW, a następnie indeksował ł je w bazie danych. Jego nazwa odzwierciedla metodę działania narzędzia pełza ono po sieci wynajdując jąc strony do zaindeksowania. ania Metodę opracowaną przez McBriana z wieloma modyfikacjami stosuje się w wyszukiwarkach do dziś.
Co to jest wyszukiwarka? Są to ogromne bazy danych składające się z: - interfejsu użytkownika (okno dialogowe, opcje do wyboru) - mechanizmów skanowania sieci (robot i algoorytmy) - algorytmów indeksujących zasoby i rejestrujących zmiany na zapisanych hjuż ż stronach - bazy danych, w której przechowywane są zgromadzone informacje (repozytorium) - algorytmy formułujące rankingi odpowiedzi na zadane zapytania; - mechanizmy pozwalające na stosowanie w wyszukiwarkach dodatkowych funkcji
Czyli... Wyszukiwarki są tworami działającymi automatycznie w zbieranie i indeksowanie informacji do ich baz danych (indeksów) nie ingeruje człowiek! (z takimi wyjątkami jak opcje reklamowe różnego rodzaju).
Jak działa skaner wyszukiwarki? Żadna z wyszukiwarek nie obejmuje swym zasięgiem i wszystkich stron WWW. Jedną z przyczyn jest sposób, w który wyszukiwarki znajdują i indeksują strony WWW w swojej bazie. Narzędzia te odnajdują strony metodą WĘDRÓWKI PO ODSYŁACZACH. Połączone siecią odnośników strony tworzą pewien twór, który w informatyce nazywa się GRAFEM (mapą odsyłaczy). Pełna struktura tak obszernego, skomplikowanego i zmiennego grafu nie jest nigdy znana.
Jak działa skaner wyszukiwarki? (2) Nie jest więc możliwe skonstruowanie takiego algorytmu, który w sposób niezawodny będzie ę w stanie wyszukać i zaindeksować wszystkie witryny znajdujące się w sieci internetowej. Roboty różnych wyszukiwarek posługują się różnymi algorytmami, wybierają więc różne drogi w grafie.
Ranking g( (lista odpowiedzi) Jest to lista wyświetlonych przez wyszukiwarkę adresów WWW, będących odpowiedzią d i na zapytanie użytkownika. Lista ta, w zależności od użytego narzędzia, może składać się z różnych elementów. Są to: - tytuły dokumentów, - adresy WWW, - szukane słowa lub frazy w kontekście, - rozmiar dokumentów, - daty ich powstania, - opis ich zawartości bądź w przypadku jego braku - pierwszych 150 znaków napotkanych w pierwszej kolejności przez robota w tekście strony (ok. 25 słów).
Kolejność wyników w rankingu (1) Kolejność l j występowania stron w rankingu nie jest przypadkowa wyniki są uszeregowane na podstawie określonego wskaźnika trafności. Obejmuje on liczbę oraz miejsce występowania słów kluczowych w dokumencie, a także inne, różne dla różnych wyszukiwarek kryteria pozycjonowania stron.
Kolejność wyników w rankingu (2) Czynniki mające wpływ na punktowanie dokumentów w rankingu: - słowa lub frazy yposzukiwane znajdują ją się ę wśród kilku pierwszych zdań dok. - słowa lub frazy poszukiwane znajdują się w tytule strony - słowa lub frazy poszukiwane znajdują się blisko siebie - słowa lub frazy poszukiwane występują w dok. więcej niż jeden raz - długość adresu
Kolejność lj wyników w rankingu (3) - słowa lub frazy poszukiwane znajdują się w opisie (description) dokumentu WWW - słowa lub frazy odpowiadają tym umieszczonym w elemencie SŁOWA KLUCZOWE (metadane); - liczba odsyłaczy prowadząca do strony WWW zawierającej słowa lub frazy wyszukiwawcze - strony rekomendujące witrynę WWW zawierającą słowa lub frazy wyszukiwawcze (wysoka akredytacja);
Kolejność lj wyników w rankingu (4) W algorytmie tworzącym ranking wyszukiwarki umieszczają mechanizmy obniżające wartość strony, jeśli odkryje próby sztucznego zawyżania ż pozycji w rankingu. Dla wybranych słów kluczowych (określanych w umowach handlowych) na pierwszych pozycjach rankingów występują tzw. linki sponsorowane (reklama).
Zalety wyszukiwarek k NAJLEPIEJ Z NICH KORZYSTAĆ: - kiedy szuka się konkretnego zagadnienia i łatwo jest je sformułować; - kiedy znana jest nazwa szukanego przedmiotu, nazwa własna lub nazwisko poszukiwanej osoby; - łatwo w wyszukiwarkach k wyszukuje się konkretne k frazy, np. poezji; - kiedy szuka się dużej ż jliczby wiadomości ś ina jeden temat;
Wady wyszukiwarek k trudność zadania adekwatnego zapytania; brak k oceny merytorycznej przechowywanych y zasobów (wyszukiwarki są automatami!); trudności d ś i z oceną i akredytacją wyszukanych y informacji;
Różnice pomiędzy wyszukiwarkami k i - typy indeksowanych dokumentów (strony WWW, pliki graficzne, multimedia i inne); - zasięg wyzukiwarki (przeszukiwanie całej sieci WWW lub jej części); - ograniczenia rozmiaru pobieranych pilków, np. poddawanie analizie wyłącznie pierwszych akapitów, określonej liczby słów, lub ładowanie przez robota określonej wielkości i MB; - wpływ elementów języka HTML (pogrubienia, strony w ramkach) na indeksowanie i stron; - zasady ustalania rankingu; - częstotliwość ttli skanowania sieci; i
Funkcjonalność kj wyszukiwarek k O funkcjonalności wyszukiwarek internetowych decydują: szybkość udzielania odpowiedzi na zapytanie; częstotliwość odświeżania informacji zawartych w bazie danych (pierwszego i ponownego indeksowania);
Efektywność fk wyszukiwarek k Na efektywność znajdowania informacji przez użytkownika mają wpływ: ranking; grupowanie stron pochodzących z jednego serwisu; możliwość wyszukiwania wewnątrz określonego serwisu; trafność udzielanych odpowiedzi; szybkość udzielanych odpowiedzi; występowanie i jakość reklam wśród odpowiedzi występowanie i jakość reklam wśród odpowiedzi zestawionych w rankingu;
Znaczniki META (1) Znaczniki META są częścią ś kodu źródłowego języka HTML. Określają one METADANE (informacje o informacji), które można zdefiniować w stosunku do danej strony internetowej. Mają one olbrzymi wpływ na wyszukiwanie witryn przez wyszukiwarki. Informacje ze znaczników META nie są wyśwetlane w przglądarce (nie widać ich na stronie).
Znaczniki META (2) <META NAME = keywords CONTENT= słowa kluczowe > Pozwala autorowi strony podać słowa kluczowe, z których przy idk indeksowaniu i itworzeniu rankingu korzystają tj wyszukiwarki. We wczesnych latach rozwoju Internetu (1994-95) element KEYWORD był jedyną informacją,którą wykorzystywały wyszukiwarki w rankingach.
Znaczniki META (3) <META NAME= robots CONTENT= parametry > Zadaniem tego elementu jest instruowanie wyszukiwarek, jak mają indeksować stronę WWW. Za pomocą kilku parametrów można określić, gdzie chcemy wpuścić robota i co może on indeksować. Parametry te to: NOINDEX zapobiega indeksowaniu i strony przez wyszukiwarki; INDEX pozwala robotom indeksować dokument HTML; NOFOLLOW zabrania robotom indeksowania i witryn, do których prowadzą odnośniki z indeksowanej strony; FOLLOW pozwala na indeksowanie wszystkich stron, do których wyszukiwarka dotrze przez odsyłacze z danej strony; NOIMAGEINDEX zapobiega indeksowaniu grafiki na stronie WWW (tekst może być indeksowany);
Znaczniki META (4) <META NAME= description CONTENT= opis strony > Pozwala na umieszczenie i krótkiego ki opisu merytorycznego dotyczącego zawartości strony. Opis ten jest wyświetlany ś przy adresie WWW w rankingu wyszukanych stron. Powinien krótko informować użytkowników o treściowej zawartości witryny.
METAWYSZUKIWANIE A (1) Metawyszukiwanie polega na wyszukiwaniu słów kluczowych w tekście źródłowym stron WWW. Metoda ta pozwala na przeszukiwanie tytułów stron, adresów WWW, odsyłaczy y hipertekstowych i innych dodatkowych informacji, które są określone za pomocą znaczników meta języka HTML.
MULTIWYSZUKIWARKI powstały, ponieważ nawet bardzo duża wyszukiwarka nie indeksuje więcej niż 30-40% stron WWW w sieci, bazy danych poszczególnych wyszukiwarek pokrywają się tylko częściowo, a algorytmy wyszukiwarek różnią się na tyle, że dla tej samej kwerendy dają odmienne rezultaty nawet dla tej samej bazy danych. Dlatego powstały nowe aplikacje multiwyszukiwarki kierujące to samo zapytanie do wielu narzędzi wyszukiwawczych. Z punktu widzenia użytkownika działają podobnie do tradycyjnych wyszukiwarek, ale tak naprawdę nie posiadają własnej bazy danych lecz korzystają z usług innych baz kilku wyszukiwarek, dodając ewentualnie własne oceny dokumentów, grupując je w specyficzny sposób itp.
Rodzaje multiwyszukiwarek Można wyróżnić 3 rodzaje multiwyszukiwarek: serwisy typu lista są to strony WWW, na których zgromadzone zostały odnośniki do wybranych, standardowych wyszukiwarek. Dzięki temu łącząc się z jednym adresem można dokonywać poszukiwań przy wykorzystywaniu wielu serwisów. Pełnią rolę puntów informacyjnych o nowych, bądź mało znanych wyszukiwarkach i katalogach. Raczej nie są uznawane za prawdziwe multiwyszukiwarki; serwisy poszukujące pojedyńczo są to multiwyszukiwarki oferujące przeważnie jedno pole do wpisania, a użytkownik ma możliwość wyboru narzędzi, które zostaną przeszukane. Proces wyszukiwania odbywa się po kolei tzn. w określonym czasie multiwyszukiwarka łączy się tylko z jednym narzędziem. Uzyskane wyniki zwykle wyświetlane są przy zachowaniu podziału na poszczególne narzędzia. Wada gdy multiwyszukiwarka natrafi na wolny serwis, trzeba będzie długo czekać na uzyskanie wyników cząstkowych i ostatecznych; serwisy poszukujące równolegle łączą się z wieloma (wybranymi przez użytkownika) narzędziami w jednym czasie;
Zalety i wady multiwyszukiwarek k Zalety: stosunkowo duża prędkość działania i reprezentatywność wyników; Wady: można zadawać tylko proste pytania z uwagi na różnorodność dostępnych opcji, syntaktyki i semantyki bardziej zaawansowanych zapytań w różnych wyszukiwarkach;
Wyszukiwarki internetowe - budowa. Bardziej wydajnym sposobem klasyfikowania stron WWW są wyszukiwarki internetowe (szperacze), które tworzą automatycznie swoje bazy danych o witrynach. Oprogramowanie wyszukiwarki składa się z dwóch oddzielnych modułów, z których: pierwszy odwiedza strony internetowe, analizując umieszczane na nich teksty, oraz podąża za odsyłaczami hipertekstowymi do kolejnych stron. drugi obsługuje powstającą w ten sposób bazę danych, często nazywaną indeksem. Korzystanie z bazy polega na wpisaniu poszukiwanych słów i obejrzeniu wyświetlonych wyników w postaci hipertekstowych odsyłaczy do stron, które zawierają wpisane wyrażenie. Jako pierwsze wyświetlane są adresy witryn, które bardziej odpowiadają zadanemu pytaniu.
Wyszukiwarki tekstowe - działanie. Oprogramowanie szperacza próbuje samodzielnie określić tematykę dokumentu i jego wartość, co ma później wpływ na miejsce, które dany dokument zajmuje w klasyfikacji odpowiedzi. Automatyczne wybieranie słów kluczowych z przeglądanych dokumentów polega na analizie umiejscowienia poszczególnych wyrazów i częstości ich powtarzania w stosunku do innych. Taki sposób badania zawartości stron WWW nazywa się wyszukiwaniem tekstowym.
JAK SZUKAĆ Ć?
Heurystyka w wyszukiwaniu informacji Wyszukiwaniem informacji nazywamy y proces przeszukiwania określonego zbioru dokumentów odnoszących ą się ę do tematu wskazanego w zapytaniu. Strategia wyszukiwania: Czego dotyczy problem? Jakie są kluczowe kwestie z nim związane? Czy można je wyrazić innymi słowami?
Zmierzając do celu poprzez Wyszukiwanie faktograficzne Wyszukiwanie bibliograficzne Wyszukiwanie i według słów kluczowych Wyszukiwanie boolowskie Wyszukiwanie koncepcyjne Szukanie frazy Szukanie rozmyte Tezaurus
10 rad dla korzystających z wyszukiwarek 1. Stosuj jako słowa kluczowe przede wszystkim rzeczowniki. Przykład: planeta planety 2. Stosuj w zapytaniu 6 do 8 słów kluczowych. Przykład: planeta planety odkrycie kosmos wszechświat system słoneczny 3. Korzystaj ze znaków specjalnych tzw. masek Przykład: planet*
10 rad dla korzystających z wyszukiwarek 4. Stosuj synonimy z operatorem OR. Przykład: lotnik OR pilot 5.Łącz słowa kluczowe z frazami. Przykład: planet* system słoneczny 6. W zapytaniu użyj ż j2 3f fraz lub wyrażeń. ż ń Przykład: nowa planeta system słoneczny odkrycie OR znalezienie 7.Rozdzielaj frazy zawarte w cudzysłowach nawiasami. i Przykład: ( nowa planeta ) ( system słoneczny ) (odkrycie OR znalezienie)
10 rad dla korzystających z wyszukiwarek 8. Najpierw umieszczaj w zapytaniu frazę opisującą, CO jest szukane. Przykład: ( nowa planeta ) (odkrycie OR znalezienie) ( system słoneczny ) 9. Łącz elementy zapytania operatorem AND. Przykład: ( nowa planeta ) AND (odkrycie OR znalezienie) AND ( system słoneczny ) ł 10. Korzystaj z wyszukiwarek obsługujących operatory boolowskie w ich pełnej postaci.
Wyszukiwanie według słów kluczowych. Najprostszym sposobem zadawania pytania bazie danych szperacza jest wpisanie poszukiwanego wyrazu lub wyrazów określających żądaną przez nas informację. Baza danych wyświetli nam listę ę stron, które zawierają poszukiwane słowo lub słowa. Może to jednak spowodować wyświetlenie listy zawierającej bardzo dużo adresów, której przejrzenie staje się czasochłonne.
Przeszukiwanie otrzymanych wyników. W takim przypadku niektóre szperacze pozwalają nam na przeszukanie otrzymanych wyników. Należy sformułować dodatkowe pytanie do bazy, co umożliwi zmniejszenie liczby otrzymanych stron i dokładniejsze wyniki wyszukania. Przykład Poszukujemy uje stron internetowych eto szkół wyższych. yc Na pytanie szkoły baza wyszukiwarki zwróci nam bardzo dużą ż liczbę adresów. Dzięki możliwości przeszukania otrzymanych wyników zadajemy ponowne pytanie wyższe,, ograniczając w ten sposób liczbę otrzymanych wyników.
Wyszukiwanie i frazy Wpisanie do wyszukiwarki dwóch słów Pan Tadeusz spowoduje wyświetlenie stron zawierających słowo Pan i witryn zawierających wyraz Tadeusz oraz tych, które zawierają oba słowa. Jednak nam chodziło tylko o strony dotyczące Pana Tadeusza. Należy ponownie zadać to samo pytanie jednak oba wyrazy umieścić w cudzysłowie ( Pan Tadeusz ). Otrzymamy listę zawierającą adresy stron, które w swoim tekście posiadają dwa słowa obok siebie i to w żądanej kolejności.
Wyszukiwanie i rozmyte. Wyszukiwanie rozmyte polega na uwzględnieniu różnych form danego wyrazu. W pytaniu podajemy początek wyrazu pozostałą część zastępujemy znakiem? Lub *. Znak? zastępuje tylko jedną literę, zaś * zastępuje większą ilość znaków. Przykład Jeśli poszukujemy ogólnie stron na temat poczty, to po wpisaniu słowa poczta wyszukiwarka wyświetli nam adresy stron zawierających wyraz poczta, a pominie strony zawierające wyrazy poczty, pocztowy itd..
Konieczność występowania wyrazu lub nie. Inną możliwość dają nam dwa znaki + i -. Pierwszy wymusza na szperaczu wyświetlenie stron, które muszą zawierać wyraz poprzedzony +. Drugi zaś wyklucza strony zawierające dane słowo. Przykład Poszukujemy stron różnych liceów. Jeśli zadamy pytanie liceum, to szperacz wyświetli nam obok stron liceów, także adresy wydawnictw i księgarni internetowych, które oferują podręczniki dla liceum. Zadanie pytania liceum -wydawnictwa -księgarnie umożliwi pozbycie się tych nieinteresujących nas w tej chwili adresów.
Serwisy wyszukiwania i informacji» Katalogi» Multiwyszukiwarki» Wyszukiwarki
Wyszukiwarki kontra katalogi Wyszukiwarki Obszerna baza adresów Nieprzerwana aktualizacja roboty Dane niekiedy nieaktualne i nietrafne Katalogi Stosunkowo mała baza adresów Ręczna aktualizacja powolna Wiarygodność
Działanie wyszukiwarki
Idealny serwis szukania informacji Jak najwięcej dokumentów w bazie obszerna odpowiedź Trafność odpowiedzi d i Szybkość działania Pomoc w formułowaniu złożonych zapytań Intuicyjność obsługi, estetyka yj g y wykonania
Ocena zagranicznych wyszukiwarek Altavis AOL Excite FAST Go2Ne Google HotBot Lycos Northe Yahoo! 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100 % trafność zapytania obsługa odpowiedzi
Ocena polskich wyszukiwarek Net.Sprint Arena NETOskop AltaVista Excite PolandOnTheNet Onet Emulti TheoSeek Wirtualna Polska 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% trafność zapytania obsługa odpowiedzi d i
Wnioski: Zagraniczne Polskie Skuteczność Skuteczność Google Go2Net, Fast, AOL Możliwości Google, Fast NorthernLight, AltaVista, Hotbot Onet Arena, Net.Sprint Możliwościś Onet NEToskop
Zwycięzca zagraniczny
Zwycięzca polski
Szukaj..a nie znajdziesz a może ż jednak?
Gdzie szukać? http://www.google.pl Wirtualna Polska http://www.wp.pl Istniejący od 1995 roku i zaliczany obecnie do największych w Polsce tematyczny katalog stron WWW. Oprócz ręcznego przeglądania katalogu, WP umożliwia przeszukiwanie go za pomocą słów kluczowych. Onet.pl http://www.onet.pl Największy konkurent WP prowadzony przez internetowy oddział firmy Optimus. Zawiera bogatą ą zawartość katalogu stron WWW, umożliwia przeszukiwanie za pomocą słów kluczowych, oferuje wiele usług i serwisów dodatkowych.
Gdzie szukać? Polski Infoseek http://infoseek.icm.edu.pl Bardzo szybka wyszukiwarka zasobów polskiego Internetu. Nie zawiera katalogu, wyszukiwanie odbywa się wyłącznie przy pomocy zadawania pytań (słowa kluczowe). Posiada bardzo dużemożliwości i największy zasób zgromadzonych informacji (ok.. 1,5 mln. dokumentów) spośród wszystkich polskich serwisów. sów. Yahoo! http://www.yahoo.com Numer 1 na świecie. Zawiera informacje o tysiącach witryn i milionach stron WWW we wszystkich językach.przeszukiwanie Yahoo! Odbywa się poprzez przechodzenie przez kolejne katalogi i podkatalogi tematyczne lub zadawanie pytań..
Gdzie szukać? AltaVista http://www.altavista.com Pionier wśród wyszukiwarek. Posiada jedną z największych baz danych. Liczącą około 140 mln. Stron WWW oraz przeszło 4 mln artykułów grup dyskusyjnych. Działatakże polska wersja AltaVisty, znajdująca się pod adresem http://www.altavista.pl HotBot http://www.hotbot.comhotbot Serwis o dużych możliwościach, pozwalający bardzo dokładnie określić rodzaj poszukiwanej informacji. Wyszukiwanie zaawansowane daje możliwość wyszukania grafiki, plików dźwiękowych, dokumentów z określonej domeny. HotBot posiada także tematyczny katalog stron WWW.
Formułowanie zapytań do wyszukiwarek. Różne wyszukiwarki dysponują różnymi rodzajami zapytań, co daje jeszcze większe ę możliwości odnalezienia informacji w krótkim czasie.
Wyszukiwanie według słów kluczowych. Najprostszym sposobem zadawania pytania bazie danych szperacza jest wpisanie poszukiwanego wyrazu lub wyrazów określających żądaną przez nas informację. Baza danych wyświetli nam listę ę stron, które zawierają poszukiwane słowo lub słowa. Może to jednak spowodować wyświetlenie listy zawierającej bardzo dużo adresów, której przejrzenie staje się czasochłonne.
Przeszukiwanie otrzymanych wyników. W takim przypadku niektóre szperacze pozwalają nam na przeszukanie otrzymanych wyników. Należy sformułować dodatkowe pytanie do bazy, co umożliwi zmniejszenie liczby otrzymanych stron i dokładniejsze wyniki wyszukania. Przykład Poszukujemy uje stron internetowych eto szkół wyższych. yc Na pytanie szkoły baza wyszukiwarki zwróci nam bardzo dużą ż liczbę adresów. Dzięki możliwości przeszukania otrzymanych wyników zadajemy ponowne pytanie wyższe,, ograniczając w ten sposób liczbę otrzymanych wyników.
Wyszukiwanie i frazy Wpisanie do wyszukiwarki dwóch słów Pan Tadeusz spowoduje wyświetlenie stron zawierających słowo Pan i witryn zawierających wyraz Tadeusz oraz tych, które zawierają oba słowa. Jednak nam chodziło tylko o strony dotyczące Pana Tadeusza. Należy ponownie zadać to samo pytanie jednak oba wyrazy umieścić w cudzysłowie ( Pan Tadeusz ). Otrzymamy listę zawierającą adresy stron, które w swoim tekście posiadają dwa słowa obok siebie i to w żądanej kolejności.
Wyszukiwanie i rozmyte. Wyszukiwanie rozmyte polega na uwzględnieniu różnych form danego wyrazu. W pytaniu podajemy początek wyrazu pozostałą część zastępujemy znakiem? Lub *. Znak? zastępuje tylko jedną literę, zaś * zastępuje większą ilość znaków. Przykład Jeśli poszukujemy ogólnie stron na temat poczty, to po wpisaniu słowa poczta wyszukiwarka wyświetli nam adresy stron zawierających wyraz poczta, a pominie strony zawierające wyrazy poczty, pocztowy itd..
Konieczność występowania wyrazu lub nie. Inną możliwość dają nam dwa znaki + i -. Pierwszy wymusza na szperaczu wyświetlenie stron, które muszą zawierać wyraz poprzedzony +. Drugi zaś wyklucza strony zawierające dane słowo. Przykład Poszukujemy stron różnych liceów. Jeśli zadamy pytanie liceum, to szperacz wyświetli nam obok stron liceów, także adresy wydawnictw i księgarni internetowych, które oferują podręczniki dla liceum. Zadanie pytania liceum -wydawnictwa -księgarnie umożliwi pozbycie się tych nieinteresujących nas w tej chwili adresów.
Metawyszukiwarki. Czasami w czasie szukania potrzebnych informacji na stronach WWW na zadane pytanie wyszukiwarka nie wyświetli nam żadnego adresu lub będzie ich bardzo mało. Wtedy można skorzystać z matawyszukiwarek. Są to serwisy internetowe, które nie posiadają własnej bazy danych, ale potrafią wysłać nasze zapytania do kilku lub kilkunastu samodzielnych szperaczy, odebrać je od nich i przedstawić w przejrzystej j formie.
Webring. bi Ciekawą formą nawigacji po stronach WWW jest webring (sieciowy pierścień). Webring łączy ze sobą strony o określonej tematyce. Każda witryna należąca do określonego pierścienia posiada odpowiednie odsyłacze do innych stron webringu. Daje to możliwość przeglądania stron po kolei do tyłu i do przodu, wyświetlanie listy z adresami wszystkich stron, a nawet losowy wybór strony z tego webringu.
Katalogi i wyszukiwarki specjalistyczne. Internet umożliwia dostęp nie tylko do stron WWW, ale także do zdjęć, programów, kamer internetowych. Powstały specjalistyczne wyszukiwarki i katalogi, które gromadzą adresy stron dotyczących ą y tylko określonej tematyki bądź jednego rodzaju informacji.