Zastosowania algorytmu PageRank w wyszukiwaniu



Podobne dokumenty
Zastosowania algorytmu pagerank w wyszukiwaniu

PageRank i HITS. Mikołajczyk Grzegorz

Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

OPCJE PROGRAMU Widoczne u góry na szarym pasku.

Inteligentne systemy informacyjne

POZYCJONOWANIE STRONY SKLEPU

Sposoby wyszukiwania multimedialnych zasobów w Internecie

GŁÓWNY URZĄD STATYSTYCZNY Departament Przemysłu

BUDOWA POPULARNOŚCI WITRYNY JAKO KRYTERIUM SKUTECZNEGO POZYCJONOWANIA WITRYN INTERNETOWYCH W WYSZUKIWARKACH

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można

INTERNET - NOWOCZESNY MARKETING

Maciej Piotr Jankowski

Internet wyszukiwarki internetowe

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Co to jest pozycjonowanie stron internetowych? Dlaczego warto pozycjonować strony internetowe?

Ranking wyników na bazie linków

uczyć się bez zagłębiania się w formalnym otoczeniu,

POZYCJONOWANIE I OPTYMALIZACJA STRON WWW PDF >>>WIĘCEJ<<<

Podstawowe informacje o obsłudze pliku z uprawnieniami licencja.txt

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest

Spis treści. I. Czym jest Indeks Haseł 3 II. Wyszukiwanie hasła 4. 1) Alfabetyczna lista haseł 4 2) Wyszukiwarka haseł 4 3) Grupy haseł 6

Klasa I szkoły ponadgimnazjalnej matematyka

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Sposoby analizy i interpretacji statystyk strony WWW.

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Rekurencje. Jeśli algorytm zawiera wywołanie samego siebie, jego czas działania moŝe być określony rekurencją. Przykład: sortowanie przez scalanie:

8. Projektowanie stron www cz.2 (Informacje o stronie sekcja <head>, formatowanie strony sekcja <body>)

Audyt SEO. sklep-budowalny.pl Biuro obsługi: al. Grunwaldzka 2/ Gdańsk

Spis treúci. Księgarnia PWN: Paweł Kobis - Marketing z Google. Podziękowania O Autorze Wstęp... 13

POZYCJONOWANIE CHORZÓW >>>WIĘCEJ<<<

WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE. Filip Makowiecki filip.makowiecki@ceo.org.pl

Instrukcja warunkowa i złoŝona.

XV. Wskaźniki Odczytywanie adresu pamięci istniejących zmiennych Wskaźniki pierwsze spojrzenie.

Instrukcja korzystania z Krajowego Rejestru Agencji Zatrudnienia

Systemy liczenia. 333= 3*100+3*10+3*1

Centralność w sieciach społecznych. Radosław Michalski Social Network Group - kwiecień 2009

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem.

OPTYMALIZACJA SERWISÓW INTERNETOWYCH >>>WIĘCEJ<<<

Pozycjonowanie stron w wyszukiwarkach internetowych. Szansa dla małych i średnich firm na konkurowanie z największymi

Pozycjonowanie. Co to takiego?

ZAJĘCIA 25. Wartość bezwzględna. Interpretacja geometryczna wartości bezwzględnej.

Inżynieria oprogramowania. Część 8: Metoda szacowania ryzyka - PERT

POZYCJONOWANIE STRONY WWW >>>WIĘCEJ<<<

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Co zrobić aby dołączyć do Programu Partnerskiego Ceneo.pl?

z :16

Analiza składowych głównych. Wprowadzenie

PODRĘCZNIK SZYBKIE WPROWADZENIE

Jak Polacy korzystają z kart bankowych Raport Money.pl. Autor: Bartosz Chochołowski, Money.pl

Czym jest. Inbound Marketing?

World Wide Web? rkijanka

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Skarbnik CE na PocketPC 2003

Biuro rachunkowe widoczne w Internecie

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu

Analiza długiego ogona wizyt z wyszukiwarek internetowych

wbudowany system do głosowania Avtek TS Pro3 / Pro4K

głosowanie wbudowany system do głosowania Avtek TS Pro3 / Pro4K

Wyszukiwanie. Zakładki

Wyszukiwarka naukowa EBSCO Discovery Service - przewodnik

Pomoc. BIP strona portalu

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Algorytmy mrówkowe. H. Bednarz. Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Inteligentne systemy informatyczne

Projektowanie zorientowane na uŝytkownika

1. Znajdowanie miejsca zerowego funkcji metodą bisekcji.

Tajemnice skutecznego wyszukiwania na przykładzie

Zasady tworzenia podstron

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego

#1 Wartościowa treść. #2 Słowa kluczowe. #3 Adresy URL

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

BeamYourScreen Bezpieczeństwo


SEARCH ENGINE OPTIMALIZATION CZYLI JAK ZWIĘKSZYĆ KONWERSJE STRONY W 7 KROKACH

The University of Michigan Digital Library Production Service Collection

Skuteczne sposoby budowania ruchu w oparciu o SEM/SEO. - Karol Wnukiewicz

3.1. Na dobry początek

Oferta stworzenia strony www lub/i jej pozycjonowanie /Sztuką jest utworzyć stronę www, ale największą sztuką wzbudzić nią zainteresowanie...!

Księgarnia PWN: Paweł Kobis - Marketing z Google CZYNNIKI WPŁYWAJĄCE NA POZYCJĘ W WYSZUKIWARKACH

POZYCJONOWANIE STRON INTERNETOWYCH (SEO)

Wszystko o sitelinkach w Google AdWords No prawie wszystko ;)

Spis treści

Systemy rozgrywek sportowych OGÓLNE ZASADY ORGANIZOWANIA ROZGRYWEK SPORTOWYCH

Poradnik SEO. Ilu z nich szuka Twojego produktu? Jak skutecznie to wykorzystać?

Marketing Internetowy

Obsługa kampanii AdWords Spis treści

Jak zdobywać linki z profili TR? Strona 1

METODY POSZUKIWANIA PRACY

Efektywne wyszukiwanie informacji w Internecie

Niepewności pomiarów

Aplikacje i witryny (Facebook)

Teoretyczne wprowadzenie do programu pocztowego Microsoft Outlook 2007

Jak podnieść pozycje w Google?

KATEGORIA OBSZAR WIEDZY

METODY INŻYNIERII WIEDZY

Scenariusz zajęć WARSZTATY KOMPUTEROWE DLA NAUCZYCIELI. Autor: Maciej Lisak-Zbroński. 1. Grupa: Nauczyciele (uczący różnych przedmiotów)

Google Analytics - Wstęp

Rozdział 7. Drukowanie

[domen.pl. Strony jakiejśtam.pl

Marketing w wyszukiwarkach, wyniki organiczne i sponsorowane

Transkrypt:

Zastosowania algorytmu PageRank w wyszukiwaniu Artur Strzelecki Zaczęło się od poszukiwania ciekawego tematu na pracę doktorską. Lawrence Page skupił uwagę na rodzącej się wówczas sieci World Wide Web [Batt06]. Sieć WWW była interesująca ze względu na pewne cechy matematyczne, kaŝda strona była węzłem i kaŝdy odnośnik na stronie był połączeniem między węzłami. Była to klasyczna struktura grafu. Page teoretyzował, Ŝe World Wide Web jest być moŝe największym grafem w historii i rośnie w zawrotnym tempie. ZauwaŜył, Ŝe przechodzenie odnośnikami z jednej strony na inną jest niewiarygodnie proste, jednak nie moŝna tego powiedzieć o drodze powrotnej. Oglądając stronę internetową nie wiadomo było, jakie strony do niej odsyłają. Przydałaby się wiedza, kto jest z kim połączony. Taka analiza wywodzi się z bibliometryki publikacji naukowych. W publikacjach, oprócz recenzji, waŝna jest lista cytatów. Cytat to odnośnik albo lista kluczowych informacji o publikacji, umoŝliwiających jej zidentyfikowanie i ponowne znalezienie. Drugim, istotnym dla publikacji naukowych pojęciem są adnotacje. Adnotacje słuŝą do opisywania cytatów. Mogą zawierać krytykę albo komentarz. Adnotacja to osąd cytowanego dokumentu. Ostatnim elementem jest ranga publikacji. Prace są oceniane równieŝ na podstawie liczby cytowanych dokumentów, liczby dokumentów, które się potem do nich odwołują oraz domniemanej wagi kaŝdego z cytatów.

Page doszedł do wniosku, Ŝe cała sieć WWW opiera się na wykorzystaniu cytatów i adnotacji. Odnośnik jest cytatem, a tekst odnośnika jest adnotacją. Page stworzył BackRub, system, który wykrywał odnośniki w sieci WWW, zapisywał je do analizy, a następnie prezentował adresy sieciowe, w których znajdują się odnośniki do określonej strony. Zainspirowany analizą cytatów, Page zaproponował, Ŝe liczba odnośników do danej strony moŝe być wskazówką przy ustalaniu rangi tej strony. UwaŜał teŝ, Ŝe kaŝdy odnośnik wymaga własnego rankingu, opartego na liczbie odnośników z pierwotnej strony. Zatem zliczać trzeba nie tylko odnośniki na poszczególnych stronach, ale równieŝ odnośniki załączone do odnośników, co istotnie zwiększa ilość wymaganych obliczeń. Page i Brin, z którym współpracował od początku projektu, opracowali algorytm PageRank, nazwany na cześć pierwszego, który potrafił uwzględniać zarówno liczbę odnośników do określonej strony, jak i liczbę odnośników na kaŝdej z odsyłających stron. PageRank PageRank jak wcześniej wspomniano, to metoda wyliczenia rankingu dla kaŝdej strony na podstawie grafu sieci. Graf sieci składa się z wierzchołków lub węzłów, czyli stron oraz krawędzi, mianowicie odnośników (ang. links). KaŜda strona moŝe mieć odnośniki wychodzące (ang. outlinks, outboundlinks) z niej oraz odnośniki przychodzące (ang. backlinks, inboundlinks) Te ostatnie dzielą się na wewnętrzne (ang. internal links) i zewnętrzne (ang. external links). Ranking strony zaleŝy od ilości odnośników, które do niej prowadzą. Generalnie, strony z większą ilością odnośników mają lepszy ranking niŝ strony, które mają ich mniej. Tak

działa proste zliczanie odnośników. Natomiast PageRank wprowadza bardziej wyrafinowaną metodę zliczania odnośników [PBMW98], która spowodowało, Ŝe nowatorski algorytm był lepszy od konkurencji w ówczesnym czasie. W wielu przypadkach zwykłe zliczanie odnośników nie koresponduje z rzeczywistą wartością strony, na którą wskazują. Na przykład, jeśli witryna ma odnośnik ze strony głównej znanego uniwersytetu, moŝe mieć tylko ten jeden, ale jest on wartościowy. Ta witryna powinna być wyŝej w rankingu niŝ wiele stron, które mają więcej odnośników, ale z ciemnych miejsc Internetu. Na podstawie powyŝszych załoŝeń wyciągnięto wniosek, Ŝe strona ma wyŝszy ranking, jeśli suma rankingów stron do niej odsyłających jest wysoka. Obejmuje to dwa przypadki, gdy strona ma wiele odnośników oraz gdy strona ma ich mniej, ale wyŝej rankingowanych. Uproszczony wzór rankingu wygląda tak: R( u) = c v B u R( v) N gdzie R(u) jest rankingiem strony u, c współczynnikiem normalizującym (częściej nazywanym d, współczynnik tłumienia na początku autorzy przyjęli d=0,85), takim, Ŝe całkowity ranking wszystkich stron jest stały, Bu to grupa stron zawierających odnośniki do u, Nv to liczba odnośników wychodzących ze strony u. R(v) jest rankingiem strony v, która zawiera odnośnik do u. Całe równanie jest rekurencyjne. Oryginalna hipoteza autorów algorytmu zakłada, Ŝe średnia z wszystkich wartości PageRank [BrPa98] wszystkich witryn wynosi 1. Wynika z tego, Ŝe dopóki kaŝda strona posiada odnośnik wychodzący to suma wszystkich wartości PageRank jest równa liczbie stron w systemie. v

W pierwszych testach autorzy do wyliczenia PageRank z 322 milionów odnośników potrzebowali 52 iteracji, natomiast połowa próby, czyli 161 milionów odnośników zabrała 45 iteracji. Ilustruje to wzrastającą wydajność PageRank w miarę rozrostu grafu sieci a wykres iteracji jest odwzorowany logarytmicznie. W czasie testów napotkano na problem funkcji rankingującej. Zakładamy, Ŝe dwie strony wzajemnie do siebie odsyłają, ale juŝ nigdzie indziej. Przypuszczamy takŝe, Ŝe jest gdzieś strona, która ma odnośnik do jednej z tych dwóch. W trakcie iteracji PageRank będzie akumulowany w pętli, natomiast nie będzie dystrybuowany dalej, poniewaŝ brakuje wyjścia tej pętli. Tak powstała sytuacja została określona jako rank sink. Do obejścia tej pułapki, zastosowano model losowego surfera (ang. random surfer model). Nawiązuje on do losowego poruszania się po grafie. Losowy surfer po prostu sukcesywnie klika w losowo wybrane odnośniki. Jeśli prawdziwy uŝytkownik sieci dostałby się do małej pętli pomiędzy stronami, jest nieprawdopodobne, aby kontynuował poruszanie się w niej bez końca. Zamiast tego, uŝytkownik przeskoczy do innej strony. Takie zachowanie określa się jako okresowe znudzenie i przeskoczenie do innej strony. Drugim zagroŝeniem prawidłowego obliczenia modelu PageRank są odnośniki prowadzące do stron bez Ŝadnego odnośnika wychodzącego (np. polityka prywatności). W trakcie badań okazało się, Ŝe w bazie znajduje się spora liczba takich odnośników. PoniewaŜ nie ma moŝliwości dystrybuowania ich rankingu do innych stron, podjęto decyzję o usunięciu z systemu wszystkich takich odnośników zanim PageRank został wy-

liczony. Autorzy podkreślili, Ŝe ma to wpływ na końcowe wartości, ale nie zmienia go znacząco. Zastosowanie w wyszukiwaniu Głównym zastosowaniem PageRank jest wyszukiwanie. Na potrzeby badań zostały zbudowane dwie wyszukiwarki uŝywające PageRank. Pierwsza z nich to prosta wyszukiwarka oparta o tytuły stron. Druga z nich to pełno tekstowa wyszukiwarka Google. Ówcześnie Google łączyło juŝ w sobie kilka czynników do rankingowania i szeregowania rezultatów wyszukiwania takich jak, standardowe miary pozyskiwania danych (ang. standard information retrieval measures) odległość pomiędzy słowami kluczowymi w treści (ang. proximity), treść odnośnika (ang. anchor text) oraz PageRank. Treść odnośnika została [BrPa98] specjalnie potraktowana w tej wyszukiwarce. Zazwyczaj inne wyszukiwarki wiązały treść odnośnika ze stroną, na której się znajdował, natomiast Google dodatkowo przywiązało tę treść do strony, na którą odnośnik wskazywał. Rozszerzenie treści odnośnika na stronę, do której odsyła najwcześniej pojawiło się w pierwszej, najstarszej wyszukiwarce McBryan s Word Wide Web Worm [McBr94]. Miało to kilka zalet, po pierwsze taki odnośnik często dostarczał ściślejszych informacji o stronie niŝ ona sama o sobie. Po drugie moŝna było dotrzeć do dokumentów, które nie były wykryte przez wyszukiwarki tekstowe, takich jak obrazy, programy i bazy danych. Był to sposób na wykrywanie stron, które wcześniej nie znalazły się w indeksie. Najlepsze rezultaty PageRank prezentuje dla sprecyzowanych zapytań. Zwracając rezultat z wynikami zapytania, testowa wyszukiwarka oparta

tylko o tytuły stron, wynajdywała wszystkie strony, których tytuł zawierał kaŝde słowo składające się na zapytanie. Następnie rezultat był sortowany według PageRank. Te dwa elementy sprawiły, Ŝe wyszukiwarka tak dobrze działała. Dopasowanie tytułów odpowiadało za precyzyjne wyniki, natomiast PageRank zapewnił wysoką jakość. PageRank potrafi takŝe reprezentować pewną miarę autorytetu lub zaufania. Np. mała hobbistyczna witryna moŝe być często odwiedzana przez uŝytkowników, poniewaŝ odnośnik do niej znajduje się na stronie głównej poczytnej gazety. Taka mała witryna otrzyma wysoki PageRank, poniewaŝ została zauwaŝona przez bardzo waŝną stronę. Reprezentuje to pewien obraz zaufania, gdzie wspomniana witryna zyskuje na swoim autorytecie lub zaufaniu, dzięki odnośnikowi z autorytatywnego źródła. PageRank niestety jest naraŝony na manipulację celem uzyskania komercyjnych korzyści. śeby poprawić PageRank witryny trzeba pozyskać odnośniki z wysoko rankingowanych stron lub bardzo duŝo odnośników ze stron o nikłej wartości. Zdaniem autorów algorytmu najgorszą formą manipulacji jest kupowanie reklamowych odnośników na popularnych stronach z wysokim PageRank. Ta słabość na komercyjne manipulacje rankingiem ma daleko idące skutki, w efekcie pogarsza jakość działania samej wyszukiwarki. Wykorzystanie wiedzy o PageRank Niektórzy autorzy witryn po przestudiowaniu algorytmu PageRank mieli pomysł wygenerowania milionów stron, które mogłyby wyprodukować PageRank i poprawić ranking ich własnych witryn. Teoretycznie powinno to działać przy właściwej strukturze odnośników, jednak prak-

tycznie nie działa wcale. Google zmieniło swój algorytm lata temu. Jedna ze zmian zapobiega takiemu działaniu, inna zmienia wartość współczynnika tłumienia. Zakłada się, Ŝe usprawnienia w algorytmie są wprowadzane średnio raz na kwartał. Inny aspekt nasuwa pytanie, które odnośniki są zliczane do obliczenia PageRank. Jeśli strona A dwukrotnie odsyła do strony B i raz do strony C to istnieją róŝne moŝliwości jak PageRank zostanie podzielony pomiędzy strony B i C. Obecna wersja algorytmu PageRank ignoruje wielokrotne linki z tych samych stron. Od 18 stycznia 2005 r., Google razem z innymi wyszukiwarkami rozpoznaje nowy atrybut w znaczniku anchor [Prcs05]. To atrybut rel i jest zapisywany jako: <a href= "http://domena.pl/strona.html" rel="nofollow"> treść odnośnika </a>. Atrybut mówi wyszukiwarce Ŝeby kompletnie zignorowała odnośnik. Poprzez ten odnośnik nie zostanie przekazany PageRank do wskazywanej strony i nie pomoŝe jej rankingowi, jakby odnośnik wcale nie istniał. Aktualnie istnieją dwa sposoby pozyskania niezaleŝnej informacji o wartości PageRank: poprzez pasek narzędzi (ang. toolbar) Google oraz katalog Google. Oczywiście istnieje wiele innych narzędzi, które oferują wyświetlanie wartości PageRank w przeglądarce lub w kodzie HTML, jednak wykorzystują one informacje pochodzące z usługi paska narzędzi. Pasek narzędzi Google (Toolbar Google) uŝywa logarytmicznej skali w przedziale od 0 do 10. Przyrost wartości na logarytmicznej skali w pasku narzędzi odpowiada przyrostowi rzeczywistego PageRank logarytmowanego przy podstawie b, ustalanej na nowo przy kaŝdorazowej aktualizacji rankingu. Najbardziej prawdopodobne jest rozwiązanie, Ŝe Google normalizuje skale tak, aby zawsze strona z najwyŝszym PageRank

miała wartość nie większą niŝ 10. Skorzystanie ze skali logarytmicznej, bądź podobnej oznacza, Ŝe potrzeba o wiele więcej dodatkowych odnośników, które przeniosą wysoki PageRank, Ŝeby przenieść stronę z obecnego poziomu PageRank na następny. Katalog Google uŝywa logarytmicznej skali z przedziału od 0 do 7. Dwie róŝne skale mogą dostarczyć dodatkowych, bardziej ścisłych informacji o PageRank. Strony, które mają jeden wynik w pasku narzędzi mogą mięć inny wynik w katalogu. Oczywiście takie informacje moŝna wyświetlić tylko dla stron, które znajdują się w ODP (Open Directory Project, www.dmoz.org), poniewaŝ katalog Google wyświetla jego zawartość. JednakŜe mogą wyniknąć nieścisłości, gdy w róŝnym czasie zostaną wykonane aktualizacje wartości w pasku narzędzi i w katalogu. Wydaję się, Ŝe katalog jest częściej aktualizowany. W ostatnim czasie zaobserwowano wiele prób manipulowania wynikiem PageRank pokazywanym w pasku narzędzi. MoŜna to wykonać przez przekierowanie jednej strony na drugą z wysokim PageRank. Google łączy te strony i pokazuje jeden PageRank dla strony docelowej, jaki i dla przekierowanej. Jeśli przekierowanie zostanie zastąpione nową treścią, pasek narzędzi pokazuje dla niej przez jakiś czas fałszywy Page- Rank. Czasem strony są zamaskowane (ang. cloaked) i przekierowanie widoczne jest jedynie dla wyszukiwarki, podczas gdy uŝytkownicy widzą normalną treść. Fałszywy PageRank moŝna wykryć poprzez sprawdzenie zarchiwizowanej wersji strony w wyszukiwarce, przeprowadzając inspekcję odnośników, sprawdzając czy PageRank jest przekierowany na inną stronę oraz uŝywając operatora zaawansowanego wyszukiwania info.

W internecie istnieje kilka witryn utrzymujących, Ŝe potrafią przewidzieć przyszłą wartość PageRank danej strony. Oczywiście nikt nie posiada tej samej struktury grafu sieci, jaką ma Google do obliczenia Page- Rank. Dlatego takie przewidywanie opiera się na innego rodzaju danych. Na podstawie odnośników przychodzących, co jest bardzo niedokładne lub na odnośnikach przychodzących i odpowiadającej danej stronie wartości PageRank z paska narzędzi. Nawet w drugim przypadku istnieje wiele niewiadomych jak: Lista odnośników zwracanych przez Google nie jest wyświetlana w całości, pokazuje niewielką ilość. Gdyby korzystać z odnośników z innej wyszukiwarki, nie wiadomo czy Google akurat te wszystkie zlicza. Pasek narzędzi pokazuje tylko liczbę całkowitą na logarytmicznej skali. PageRank równy 5 moŝe mieć wartość 5,0 lub 5,99. Aktualnie pokazywana wartość jest brana jako dana wejściowa. JednakŜe, właśnie ta wartość zmieni się przy następnej aktualizacji całego indeksu. Podstawa logarytmiczna jest częścią obliczania prognozy. Jednak większość osób uŝywa wyłącznie wartości z przedziału 5 do 8. Liczba odnośników wychodzących musi zostać zastąpiona średnią ilością odnośników w trakcie danego okresu. Skala wyświetlana na pasku narzędzi nie jest stała. Wszystkie powyŝsze niewiadome kumulują się, zatem rozsądne przewidywanie jest niemoŝliwe. Najbardziej prawdopodobne trafienie nie jest lepsze niŝ proste przewidzenie, Ŝe PageRank się nie zmieni lub ustale-

nie, Ŝe będzie wynosić maksymalny PageRank ze strony odsyłającej minus jeden. Podsumowanie W pierwotnym załoŝeniu PageRank miał być systemem do sortowania odnośników. Jeśli strona miała wiele odnośników to najlepsze z nich wyświetlane były najwyŝej. Taki rozkład odnośników jest równieŝ interesujący w przypadku analizy stron konkurencji. Podsumowując PageRank jest systemem, który spłaszcza kaŝdą stronę w sieci Internet do jednej liczby. PageRank to globalny ranking wszystkich stron, niezaleŝny od ich zawartości, bazujący wyłącznie na ich połoŝeniu w strukturze grafu sieci. Literatura [Batt06] Battele J.: Szukaj, Wydawnictwo PWN, Warszawa 2006. [PBMW98] Page L., Brin S., Motwani R., Winograd, T.: The PageRank Citation Ranking: Bringing Order to the Web. Stanford Uniwersity 1998. [BrPa98] Brin S., Page L.: Anatomy of a Large-Scale Hypertextual Web Search Engine, Proceedings 7th International World Wide Web Conference. Brisbane, Australia 1998. [McBr94] McBryan O. A.: GENVL and WWWW: Tools for Taming the Web. Proceedings 1st International World Wide Web Conference. Geneva, Switzerland 1994. [Prcs05] http://googleblog.blogspot.com/, Preventing comment spam, dostęp 27.04.2008 r.

Informacje o autorze Mgr Artur Strzelecki Katedra Informatyki, Akademia Ekonomiczna ul. Bogucicka 3 40-226 Katowice Polska e-mail: strzelecki@ae.katowice.pl