PRZESZŁOŚĆ
Początki obalamy mity Wyszukiwarki nie istniały od zawsze (!) Wyszukiwarki są stosunkowo nową zdobyczą Internetu (~10 lat, ~5 lat popularności masowej, Internet ~30 lat) Bez wyszukiwarek też jakoś się żyło
Przesyt informacyjny Większa ilość informacji nie przekłada się na jakość Nawet Internet kiedyś był o wiele bardziej wiarygodny Lepsze wyszukiwarki nie przekładają się na dostęp do jakościowo lepszej wiedzy
Wielki Wybuch WWW
Wielki Wybuch WWW Potrzeba organizacji Arystoteles a substance, a quality, a quantity, a relation, a place, a time, a position, a state, an action, or a passion Denis Diderot The Encyclopedie (1751-1772) 16,500 stron, 72,000 haseł, 17,000,000 słów Google - Microsoft returns 33,400,000 Melvil Dewey Czarna ospa incidence & prevention of disease medical sciences applied sciences ODP: The plague Infectious Diseases Conditions and Diseases Health
Zamierzchłe źródła informacji BBS Bulletin Board System Czasy połączeń telefonicznych Wolne? Sierpień 1991 9600bodów Fora dyskusyjne Wiarygodne (eksperci dziedzinowi) Stosunkowo szybkie Działają nadal (!) i umożliwiają przeszukiwanie archiwów Google Groups (przejęło Deja)
Wujek Gopher Gopher (suseł) prawdziwy hypertext
Babcia Veronica Veronica Very Easy Rodent-Oriented Netwide Index to Computerized Archives Prawdopodobnie pierwsza wyszukiwarka Działała tylko dla protokołu Gopher Po odnalezieniu zasobu, e-mailowało się go do siebie
Babcia Veronica w akcji
Dziadek Archie Pozwalał przeszukiwać archiwa zasobów FTP Nadal istnieją działające instalacje Archie http://archie.icm.edu.pl Funkcjonalność Archie dostępna również we współczesnych serwisach wyszukujących
Powstaje WWW Tim Berners-Lee Powiązania dokument-dokument (rewolucja!) Gopher: listingi dokumentów FTP: katalogi, pliki Information wants to be free Trudny HTML (a zwycięstwo głównie przypadkowe) Pierwsze przeglądarki (Mosaic) Users deeply resist paying today for what was free yesterday upadek Gophera Dodanie rysunków do tekstu
Zbiory odsyłaczy (web-surfing) Gromadzone tematycznie odnośniki do lokalizacji w Internecie Zazwyczaj segregowane tematycznie ( ulubione ) Submission-based search engines ALIWEB (Archie for the WEB) web rings Web surfing powoli odchodzi w zapomnienie Dały początek katalogom internetowym
Pierwsze roboty internetowe Pełzacze WWW Wanderer (Matthew Gray) Miał jedynie liczyć hosty dostępne w Internecie, później rozbudowany o indeksowanie How to Tell if Your Head's About to Blow Up It really can the web already did
Pierwsze wyszukiwarki pełnotekstowe WebCrawler (Brian Pinkerton, Univ. of WA) Brian Pinkerton Biotechnolog Genetically engineered tomatoes Niechętny publikacji Webcrawlera Pierwszy indeksujący treść stron ~15000 zapytań dziennie w 1994 Milion zapytań w sześć miesięcy od powstania
Pierwsze wyszukiwarki pełnotekstowe Lycos (Michael fuzzy Mauldin, CMU) Lycosidae pająki z rodziny pogońcowatych (nie budują sieci) Tylko słowa kluczowe dzięki temu duży indeks Wprowadzenie snippetów
Altavista DEC zakłada Altavistę Zapytania z operatorami Boole a Duży indeks stron Bardzo szybka (jak na owe czasy)
Kręci się biznes a użytkowników bolą głowy Masa reklam/ dodatków/ zaśmiecone indeksy Sztucznie zaburzana kolejność wyników Wyszukiwarki przekształcają się w portale kombajny z fontanną
Altavista narodziny potwora
Altavista narodziny potwora
Altavista narodziny potwora
Altavista narodziny potwora
Google, Google!, GOOOOOGLE! To organize the world s information making it universally accessible and useful L. Page, S. Brin (Stanford) Nowy algorytm oznaczania stron wartościowych i śmieci PageRank Google niszczy konkurencję Dokładność (przez analizę struktury indeksu) Szybkość (tysiące niedrogich komputerów opartych na Linuxie) jedynie wyszukiwarka brak elementów komercyjnych (do czasu )
Google, sweet Google
Google, sweet Google
Meta wyszukiwarki Siła wielu w jednym Problemy z licencjami Nadal niektóre działają MetaCrawler Dogpile Vivisimo
Meta wyszukiwarki
TERAŹNIEJSZOŚĆ
There can be only one Dominacja Google Tworzenie się mitu jedynej wyszukiwarki Słowotwórstwo Google for it! Istnieje jednak pewna konkurencja: Overture (kupiło niedawno AllTheWeb) Inktomi (Yahoo) Teoma LookSmart ODP
Popularność wyszukiwarek
Poległy lub zanikły Browser wars rynek w większości zdominowany przez IE, nieznaczny udział Mozilli, śladowe ilości innych wyszukiwarek Lokalne narzędzia do meta-wyszukiwania typu Copernic Wielcy przeszłości Infoseek, Altavista, NorthernLights wykupieni/ korzystają z innych źródeł META znaczniki HTML Zmierzch hipertekstu (dominacja technologii graficznych typu np. Flash)
A na polu ostały się kombajny
Nowe trendy Inna prezentacja wyników Grupowanie Vivisimo Carrot 2 Podpowiedzi (keywords) Teoma Infonetware Aeiwi
Grupowanie
Grupowanie
Carrot 2 Projekt w Zakładzie Inteligentnych Systemów Wspomagania Decyzji Paweł Kowalik Stanisław Osiński Jerzy Stefanowski Dawid Weiss Michał Wróblewski Strona główna: http://www.cs.put.poznan.pl/dweiss/carrot Demo: http://ophelia.cs.put.poznan.pl:2001
Podpowiedzi
Nowe interfejsy użytkownika Co zaprezentuje Google? Google labs
Niewypały
Niewypały
Wyszukiwarki a życie codzienne Wciąż rosnąca popularność Bezgraniczna ufność Domeny zastosowań: DNS Słownik Portal Źródło wiedzy (encyklopedia) Nawet medycznej: Terry Chilton Słaba wiedza o możliwościach zawężania zapytań i operatorach dodatkowych
Bezpieczeństwo Kto o co pyta? Kto pyta nie błądzi? Sterowanie wynikami The power to control the information we find and do not find
PRZYSZŁOŚĆ
Szukanie odpowiedzi a nie materiałów Szukanie celowe a nie referencyjne System START System AnswerBus
Interfejsy graficzne? Kartoo Maps Raczej trudno sobie to wyobrazić
Inne wyzwania WWW robi się coraz bardziej medialne Rozmiar indeksowanych danych?
Send your queries now
Źródła http://ww.domaindlx.com/i2nee/oldpages.asp http://www.thesearchenginewars.com/archives5.html http://www.searchenginewatch.com/reports/article.php/2156481 http://www.globe.dk/htmlbog/historie.htm http://www.google.com http://www.alltheweb.com http://www.kartoo.com i inne.