Wykład 12 Budowa wyszukiwarki. Wykładowca: dr inż. Mariusz Trzaska

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wykład 12 Budowa wyszukiwarki. Wykładowca: dr inż. Mariusz Trzaska"

Transkrypt

1 Wykład 12 Budowa wyszukiwarki Wykładowca: dr inż. Mariusz Trzaska

2 Zagadnienia Wstęp Projektowanie indeksu Budowa robota Indekser Analizator tekstu Ranking stron Google opis architektury oraz ogólnej zasady działania Podsumowanie Tworzenie portali biznesowych, Wykład 13 2

3 Kwestie decyzyjne Świat jest bardzo konkurencyjny, zaś rynek wyszukiwarek jest ciasny. W każdym kraju co najwyżej kilka wyszukiwarek uzyskuje sukces rynkowy. Możliwe są jednak wyszukiwarki o ściśle określonym profilu tematycznym. Taka wyszukiwarka może odnieść sukces wśród specjalistów z danej dziedziny. Wyszukiwarka typu pająk, czy katalog? Pająki automatycznie indeksują zasoby Webu, praktycznie bez udziału człowieka Katalogi są tworzone przez ludzi, np. Yahoo. Aby odniosły sukces, konieczne jest zainteresowanie potencjalnych oferentów, aby chcieli wprowadzać informację o swoich stronach do odpowiednich kategorii tematycznych. Tworzenie portali biznesowych, Wykład 13 3

4 Błędy i nadużycia twórców stron WWW Strony WWW zawierają ogromną ilość śmieci, często wprowadzanych tam celowo. Twórcy stron WWW stosują najprzeróżniejsze brudne sztuczki po to, aby ich strona (zawierająca tzw. spam, czyli niechcianą reklamę lub inne podobne treści) znalazła się w wykazie stron dostarczanych do klientów. Przykładowo, umieszcza się ten sam wyraz wielokrotnie na stronie HTML bez uzasadnienia, daje się czcionkę w kolorze tła, aby oszukać pająka, itd Należy stosować specjalne metody, aby spamowców wyeliminować, ale tego pokroju ludzie i firmy nie ustają w przechytrzaniu tych metod. Jakość informacji dostarczanej do użytkownika jest przez to bardzo niska. Większość krajów planuje (lub już wprowadziła) ustawodawstwo przeciwdziałające spamowi. Na firmy uprawiające spaming będą nakładane kary pieniężne (tak jak to jest obecnie w krajach zachodnich za foldery reklamowe wtykane do skrzynek pocztowych w Niemczech jest to karane wysokim mandatem). Tworzenie portali biznesowych, Wykład 13 4

5 Zakres wyszukiwarki Dość często portale są zorganizowane na podstawie pewnego labiryntu stron, w których użytkownik może bardzo łatwo się pogubić. Skutkiem jest niemożliwość uzyskania pożądanej informacji W takim przypadku można tworzyć wyszukiwarkę wyłącznie do własnych stron WWW. W przypadku rozbudowanego portalu tak wyszukiwarka znakomicie ułatwia pracę użytkownika. Dość często duże portale budują wyszukiwarkę uniwersalną, która obejmuje swoim zasięgiem pewien obszar geograficzny i/lub tematyczny. Budowa wyszukiwarki ogólno-światowej jest przedsięwzięciem kosztownym ze względu na konieczność zapewnienia znacznych zasobów pojemności dysków czasu procesorów przepustowość sieci podtrzymywania kopii (mirrors) Tworzenie portali biznesowych, Wykład 13 5

6 Projektowanie bazy danych - indeksu Link ID_strony_źródłowej ID_strony docelowej * * Możliwa jest oczywiście dowolna rozbudowa tego najprostszego schematu, np. w związku z informacją o stronach zawierających spam, itd. Strona_WWW ID_strony_WWW Tytuł (255 znaków) URL (255 znaków) Zawartość (1024 znaków) Ranking (ocena wagi strony) Liczba_linków_na stronie Klaster (kategoria tematyczna) * * ID_tematu Temat (char 255) Tworzenie portali biznesowych, Wykład 13 6

7 Charakterystyka informacji z indeksu Linki: umożliwiają pracę pająka ma on gdzie zapisać informację o stronach, które odwiedził i o stronach, które mają połączenie z tych stron. ID_strony sztuczny klucz mający na celu zmniejszenie i znormalizowanie informacji z URL wewnętrzny dla danej wyszukiwarki Zawartość mogą to być wybrane, charakterystyczne zdania pochodzące ze strony HTML Ranking pewna automatycznie wyznaczana miara, która określa, czy ta strona może mieć znaczenie dla użytkowników. Google stosuje ranking oparty na analizie ilości i konfiguracji linków na stronie. Temat słowo lub fraza której może użyć użytkownik w swoim zapytaniu. Tworzenie portali biznesowych, Wykład 13 7

8 Architektura przykładowego systemu Pająk np. w jęz.perl Strony HTML Czyszczenie i formatowanie danych Wewnętrzne procesy (obliczanie rankingu, itd.) SQL www Dysk roboczy Baza danych robocza Serwer serwletów Serwer HTTP (Apache) JSP JDBC www Baza danych publikacyjna Tworzenie portali biznesowych, Wykład 13 8

9 Budowa pająka (robota) Można go budować w oparciu o gotowe elementy. Są gotowe, bezpłatne modułu oparte o język Perl lub udostępniane w postaci biblioteki do Java. CPAN, Checkbo, Combine, DWCP,... Lista narzędzi do budowy pająków jest dostępna pod: Strony bogate w linki z danej dziedziny (zwane hubs) są dobrymi punktami startowymi do przeszukiwania całej sieci. Np. dla dziedziny baz danych dobrymi punktami startowymi jest Penn Database Research Group, DBLP Bibliography oraz Yahoo!Databases. Dobra identyfikacja hubs jest atutem wyszukiwarki Google Filtry zapobiegające odwiedzaniu stron wymagających parametryzacji (CGI), konieczne są metody zapobiegające zapętleniu się pająka. Częstotliwość odświeżania pająka: związana z jego szybkością i dostępnością odwiedzanych stron. Nawet przy 25 stronach na sekundę dla ściągania mamy 5 sekund na stronę do przetwarzania czyli sekund dla odwiedzonych stron, czyli 6 dni i nocy. Tworzenie portali biznesowych, Wykład 13 9

10 Bardziej zaawansowane pająki Powinny nie tylko zarządzać pamięcią, lecz także procesorem oraz ruchem w sieci. Strategie kolejkowania stron do odwiedzenia Np. 500 kolejek, strony z tego samego serwera w różnych kolejkach W ten sposób każdy serwer będzie odwiedzany co najwyżej raz na 500 razy Pająk może stosować jedną z następujących strategii: Błądzenie po stronach internetowych: na wejściu lista URL-i startowych, następnie pobieranie kolejnych stron wg grafu linków łączących strony. Poszukiwanie w innych bazach danych (multi-search). Konieczne jest skonstruowanie pijawek (leech), czyli programów specjalizujących się w pozyskiwaniu informacji z konkretnego serwisu. Strategia mieszana: najpierw multi-search, później wyszukiwanie w grafie. Bardziej inteligentne pająki powinny mieć możliwość oceny, czy dana strona może być interesująca dla użytkowników. Może to odbywać na zasadzie zliczania liczby linków do tej strony. Tworzenie portali biznesowych, Wykład 13 10

11 Niektóre reguły wzmacniające pająka Istnienie wyspecjalizowanego modułu oceniającego wartość strony na podstawie pewnej heurystyki (np. liczby i rodzaju terminów z danej dziedziny). Baza wiedzy zawierająca informację lingwistyczną, np. tezaurus (ontologia) Jeżeli dokument zawiera słowa ze zbioru {s1,..., sn}, to jest interesujący Jeżeli dokument zawiera słowa ze zbioru {s1,..., sn}, to linki z tej strony prowadzą do interesujących stron Jeżeli strona jest główną stroną instytucji, to prawdopodobnie zawiera linki do pracowników i aktywów (produktów, projektów, itd.) tej instytucji Jeżeli strona jest stroną domową pracownika, to prawdopodobnie zawiera linki do jego artykułów i ulubionych stron. W ten sposób można przypisać wagi nie tylko do stron, ale dowolnych bytów (osób, instytucji, tematów, itd.) i na podstawie tych wag ustalać potencjalne zainteresowanie użytkowników tą stroną. Przypisywanie wag może być iteracyjne (Google): waga strony X uzależniona od wag stron na których znajdują się linki do X. Tworzenie portali biznesowych, Wykład 13 11

12 Indekser dokumentów Indeksowanie jest to proces tworzenia indeksu, czyli specjalizowanej bazy danych zawierającej pewien wyciąg z indeksowanej strony (np. słowa kluczowe, frazy) oraz jej URL. Indeks powinien być zoptymalizowany pod katem wyszukiwania, tj. zorganizowany tak, aby umożliwić bardzo szybkie wyszukiwanie na podstawie kryteriów (słów lub fraz) zadanych przez użytkownika. Indeks powinien zawierać także dowolna informację, która da pewne wskazówki użytkownikowi co do przydatności strony bez jej fizycznego ściągania, np. tytuł strony data strony format strony (np..doc,.pdf,.ppt) frazy, w których na danej stronie występują zadane przez wyrazy Istnieją standardowe, komercyjne indeksatory, np. pakiet LUCENE Tworzenie portali biznesowych, Wykład 13 12

13 Komponenty indeksera Identyfikacja słów/fraz/termów występujących w dokumentach Usuwanie słów popularnych Ekstrakcja tematów przy użyciu algorytmu szukającego tematu Zastąpienie tematów przez numeryczne identyfikatory termów indeksujących celem wydajniejszego przetwarzania Zliczanie wystąpień tematów Użycie tezaurusa (ontologii) dla zastąpienia zbyt wyspecjalizowanych terminów terminami ogólniejszymi Tworzenie fraz dla termów o wysokiej częstotliwości Obliczanie wag dla wszystkich prostych termów, fraz i klas tezaurusa Przypisywanie każdej stronie odpowiednich prostych termów, fraz i pozycji tezaurusa z odpowiednimi wagami. Tworzenie portali biznesowych, Wykład 13 13

14 Parser stron HTML i innych formatów Istnieje wiele osobliwości technicznych na stronach HTML, które muszą być oprogramowane przez pająka. Istotne jest zignorowanie informacji organizacyjnej, specjalnych znaczników do kodowania i wyświetlania i wykrycie informacji ważnej merytorycznie. Istotne jest również przeciwdziałanie nadużyciom twórców stron mającym na celu radykalne zwiększenia prawdopodobieństwa pojawienia się jej na ekranie klienta. Obecnie parsery posiadają możliwości analizowania dokumentów w innych formatach niż HTML, np..pdf,.doc,.ppt Oznacza to konieczność bardzo dokładnego rozpoznania fizycznej konstrukcji tych formatów Specjalnym problemem technicznym są sposoby kodowania niestandardowych znaków, np. znaków z polskimi ogonkami Tworzenie portali biznesowych, Wykład 13 14

15 Analizator tekstu Steruje strukturalizacją tekstu, czyli jego podziałem na słowa Dokonuje normalizacji tekstu, m.in. zamienia duże litery na małe dokonuje normalizacji fleksji (np. sprowadzenie do I osoby, I przypadku liczby pojedynczej, itd.) usuwa słowa pospolite na podstawie tzw. stop-listy: w języku angielskim: a, and, are, as, at,..., their, then, will,... słowa pospolite mogą się różnić dla specjalizowanych zbiorów dokumentów, np. w tekstach prawnych są to słowa artykuł, paragraf, ustęp Dla niektórych języków (niemiecki) konieczne jest rozbicie słowa na sekwencją słów; w jęz. polskim - nazw chemicznych lub farmaceutycznych. Może być potrzebne skorzystanie z zapamiętanych związków paradygmatycznych, np. związków patrz też lub generalizacji kogut -> kura, pekińczyk -> pies Może zmienić grupę słów na term (frazę): krzesło, elektryczne => krzesło elektryczne Tworzenie portali biznesowych, Wykład 13 15

16 Odpowiedzi na pytania Analogicznie do normalizacji indeksowanego tekstu powinna nastąpić normalizacja zapytania użytkownika Użytkownik również może zadać pytanie małymi lub dużymi literami, z różną formą fleksyjną, itd. Algorytm przyporządkowania dokumentów do zapytania uwzględnia: specyficzne operatory wprowadzone do zapytań, np. AND, OR, NOT jeżeli język nie wprowadza takich operatorów, wówczas przyjmuje się pewną semantykę domyślną w taki sposób aby uwzględnić potencjalną intencję użytkownika Odbywa się to poprzez zliczanie wag trafności dokumentu do pytania W Google najpierw dokumenty, które zawierają wszystkie slowa uzyte przez użytkownika, później dokumenty, w których jedno z tych słów jest nieobecne, itd. Dodatkowo, trafność wynikowa zależy od wagi strony. Zwraca się listę wynikową relewantnych dokumentów w porządku malejącego rankingu. Tworzenie portali biznesowych, Wykład 13 16

17 Ranking stron Ogromna liczba prostych heurystyk pozwalających ustalić wagę strony (w ogóle) i wagę strony w odniesieniu do danego zapytania. Istotne jest to, że ten ranking musi być technicznie efektywny, tj. musi być obliczony w akceptowalnym czasie. to częściej eliminuje pomysły oparte na zbyt wyrafinowanych metodach ( sztucznej inteligencji ). Metody rankingu: opinie redaktorów (metoda bardzo kosztowna) opinie użytkowników ( feedback po zadaniu pytania) popularność strony (jak często ją wyszukano) ocena zawartości informacyjnej (niemierzalna obiektywnie, jedynie na podstawie trzeciorzędnych symptomów, takich jak występowanie pewnych słów) lokalizacja (np. serwer bardzo popularnej i bogatej firmy) finansowanie (zwiększenie rankingu strony jest sponsorowane przez jej twórcę). liczba linków prowadzących do strony (ew. ważonych linków) Tworzenie portali biznesowych, Wykład 13 17

18 Forma odpowiedzi na zapytanie Zwykle jest to lista odsyłaczy do dokumentów Każda pozycja tej listy może zawierać: URL dokumentu Tytuł dokumentu data utworzenia dokumentu/ostatnia modyfikacja rozmiar dokumentu w bajtach język dokumentu streszczenie dokumentu (automatyczne, w postaci charakterystycznych fraz) opis dokumentu lista słów kluczowych dokumentu ranking dokumentu dokumenty związane z tym dokumentem ( patrz też ) Mogą pojawić się także sugestie dotyczą zmiany zapytania użytkownika lub podpowiedzi i sugestie co do dalszych kroków wyszukiwania. Tworzenie portali biznesowych, Wykład 13 18

19 Istniejące rozwiązania Google Autorzy: Sergey Brin, Lawrence Page Nazwa: słowo googol oznacza Główna motywacja twórców: Stworzenie systemu wyszukującego charakteryzującego się bardzo wysoką jakością działania nawet kosztem wydajności. W dużym stopniu wykorzystuje struktury powiązań pomiędzy dokumentami Google zarządza prawdopodobnie największym clusterem Linuxa: 80 TB powierzchni dyskowej i łączną przepustowością 50 GB/s Do przygotowania slajdów dotyczących Google wykorzystano: Sergey Brin, Lawrence Page The Anatomy of a Large-Scale Hypertextual Web Search Engine. (http://infolab.stanford.edu/~backrub/google.html) Materiały pochodzące z Tworzenie portali biznesowych, Wykład 13 19

20 Google - Architektura Serwer URL Roboty internetowe Serwer magazynujący Repozytorium Kotwice Serwer indeksujący Rozstrzyganie URL Leksykon Linki Beczki Indeks dokumentów Serwery sortujące PageRank Serwer wyszukujący Tworzenie portali biznesowych, Wykład 13 20

21 Serwer URL Pobiera początkowe URL jako punkt startowy Odczytuje URL e z Indeksu Dokumentów Wysyła URL e do Robota celem przetwarzania Kolejność URL i jest istotna (głębokość) Roboty internetowe Serwer URL Kotwice Rozstrzyganie URL Linki Indeks dokumentów PageRank Tworzenie portali biznesowych, Wykład 13 21

22 Roboty internetowe Polskie tłumaczenia terminu Crawler: robot internetowy, pełzacz, pająk, BOT Pobiera strony z serwera www Zapisuje je na serwerze magazynującym Google wykorzystuje 4 roboty z których każdy ma około 300 połączeń. W szczycie pobierają około 100 stron na sekundę. Robot Exclusion Protocol nieformalny standard dotyczący oznaczania treści znajdujących się na www, które nie powinny być pobierane przez robota. Serwer URL Roboty internetowe Serwer magazynujący Tworzenie portali biznesowych, Wykład 13 22

23 Serwery magazynujące Roboty przekazują im pobrane strony www w postaci oryginalnej Kompresują je i w takiej postaci (format zlib; RFC1950) przekazują do repozytorium Sprawność kompresji to około 3:1 Zawierają unikalny identyfikator (docid) dla każdej ze stron Roboty internetowe Serwer magazynujący Repozytorium Tworzenie portali biznesowych, Wykład 13 23

24 Repozytorium Skompresowane strony www Pełen HTML każdej ze stron Zawartość stron skompresowana algorytmem zlib, który ma dobry stosunek jakości do szybkości Format: docid Długość dokumentu URL dokumentu Zawartość Serwer magazynujący Repozytorium Serwer indeksujący Tworzenie portali biznesowych, Wykład 13 24

25 Serwer indeksujący (Indexer) Odczytuje dane z repozytorium (skompresowane strony www) i dekompresuje je Parsuje każdy dokument i konwertuje każde słowo w trafienie (hit): Słowo, Pozycja w dokumencie, Względna wielkość czcionki, Małe/duże litery Różnicuje trafienia z uwzględnieniem: url, tytułu, Tekstu, meta Kotwice Serwer indeksujący Beczki Repozytorium Leksykon Indeks dokumentów Serwery sortujące Serwer wyszukujący Tworzenie portali biznesowych, Wykład 13 25

26 Moduł indeksujący (Indexer) (2) Rozmieszcza trafienia (hits) w beczkach tworząc częściowo posortowany indeks Parsuje linki i dodatkowe informacje (zurl, dourl, tekst linku) w specjalnych plikach kotwicowych (anchor files) Generuje plik leksykonu Tworzenie portali biznesowych, Wykład 13 26

27 Rozstrzyganie URL (URL Resolver) Odczytuje pliki kotwicowe Konwertuje względne adresy URL do bezwzględnych Mapuje bezwzględne adresy URL na identyfikatory docid Umieszcza tekst w indeksie razem z identyfikatorem docid, który do niego prowadzi Generuje bazę linków zawierającą pary identyfikatorów docid: Wykorzystywane do obliczania pozycji każdego z dokumentów w PageRanks Rozstrzyganie URL Kotwice Linki Indeks dokumentów Tworzenie portali biznesowych, Wykład 13 27

28 Serwery sortujące (Sorters) Przetwarza główny indeks (posortowane docid) w celu wygenerowania indeksu odwróconego (inverted) zawierającego posortowane identyfikatory słów wordid Krótki odwrócony indeks beczek zawierających tytuł i trafienia Pełny odwrócony indeks beczek zawierających pełny tekst Zawiera przesunięcie pozycji dla każdego wordid w odwróconym indeksie Beczki Serwery sortujące Tworzenie portali biznesowych, Wykład 13 28

29 Ranking stron (PageRank) Tworzy ranking ważności cytować danej strony Może być traktowany jako przybliżony model zachowań użytkownika: Zakłada losowego surfera z podanymi początkowymi linkami, klikającego na pojawiających się linkach Użytkownik nigdy nie wraca; czasami jest znudzony i rozpoczyna od innych linków Prawdopodobieństwo, że odwiedzi on jakąś stronę jest określane właśnie przez jej PageRank Linki PageRank Serwer wyszukujący Tworzenie portali biznesowych, Wykład 13 29

30 Ranking stron (PageRank) (2) Definicja PageRank: Zakładamy, że strona A ma strony T1, Tn prowadzące do niej. Parametr d to współczynnik tłumienia, który może przyjmować wartość od 0 do 1 (zwykle wynosi 0,85). C(A) jest definiowane jako liczba linków wychodzących ze strony A. PageRank strony A obliczany jest wzorem: PR(A) = (1-d) + d (PR(T1)/C(T1) PR(Tn)/C(Tn)) Suma PageRank dla wszystkich stron web u wynosi 1. Tworzenie portali biznesowych, Wykład 13 30

31 Ranking stron (PageRank) (3) Strony mają wyższy PageRank jeżeli wiele linków do nich prowadzi Wysoki PageRank mogą mieć strony nawet z niewielką liczbą prowadzących linków, pod warunkiem, że prowadzące strony mają wysoki PageRank (np. Yahoo, onet, gaeta.pl, itp.). Linki PageRank Serwer wyszukujący Tworzenie portali biznesowych, Wykład 13 31

32 Kotwice (Anchors) Tekst opisujący link prowadzący do strony www 24 miliony stron wygenerowało około 259 milionów kotwic (6,6 GB) Zwykle jest to dużo lepszy opis strony niż, np. jej nagłówek Istnieją nawet dla stron, które nie mogą być zaindeksowane przez systemy wyszukujące oparte na tekście Potencjalny problem odnośników do stron, które nie istnieją Kotwice Serwer indeksujący Rozstrzyganie URL Tworzenie portali biznesowych, Wykład 13 32

33 Linki (Links) Baza danych zawierająca pary identyfikatorów dokumentów docid Wykorzystywane do obliczenia PageRank konkretnych stron www Rozmiar ok. 3,9 GB Rozstrzyganie URL Linki PageRank Tworzenie portali biznesowych, Wykład 13 33

34 Indeks dokumentów Indeks ISAM (Indexed Sequential Access Mode) posortowany według identyfikatorów dokumentów docid Każdy wpis zawiera Status dokumentu Jego sumę kontrolną Różne statystyki Serwer URL Rozstrzyganie URL Serwer indeksujący Indeks dokumentów Jeżeli dokument Serwer wyszukujący został odwiedzony przez robota to wskaźnik do pliku zawierającego linki dokumentu i tytuł nie został odwiedzony przez robota to wskaźnik do pliku zawierającego tylko URL. Tworzenie portali biznesowych, Wykład 13 34

35 Leksykon (Lexicon) Wersja robocza znajduje się w pamięci RAM Zawiera około słów Rozmiar około 293 MB Serwer indeksujący Leksykon Serwer wyszukujący Tworzenie portali biznesowych, Wykład 13 35

36 Beczki (Barrerls) Rozmiar: krótki indeks ok. 4,1 GB, Pełny ok. 37 GB Główny indeks jest posortowany według identyfikatorów dokumentów (docid), docid Odwrócony indeks jest posortowany według identyfikatorów słów (wordid) wordid Silnik wyszukujący najpierw sprawdza krótki indeks wordid docid Kotwice Serwer indeksujący Rozstrzyganie URL Beczki Indeks dokumentów Serwery sortujące Serwer wyszukujący Tworzenie portali biznesowych, Wykład 13 36

37 Format Główny indeks Beczki (Barrerls) (2) Odwrócony indeks (trochę podobnie jak główny) Tworzenie portali biznesowych, Wykład 13 37

38 1. Parsowanie Przetwarzanie zapytania 2. Konwersja słów na odpowiadające im identyfikatory (wordid) 3. Odszukanie w beczkach, listy dokumentów dla każdego ze słów 4. Przeszukanie listy dokumentów w celu znalezienia dokumentów zawierających wszystkie słowa kluczowe 5. Obliczenie pozycji dokumentu w zapytaniu 6. Jeżeli korzystamy z krótkiego indeksu i jesteśmy na końcu listy dokumentów to rozpoczynamy przeszukiwanie w pełnym indeksie i idziemy do kroku nr Jeżeli nie jesteśmy na końcu listy dokumentów to wracamy do pkt Sortowanie wyników według rankingu (patrz następny slajd) i zwrócenie pierwszych z nich Tworzenie portali biznesowych, Wykład 13 38

39 Ranking zapytanie z jednym słowem 1. Przeanalizuj listę trafień tego dokumentu dla szukanego słowa. 2. Trafienie może być różnego rodzaju (tytuł, tekst, itp). Każdy z nich ma inną wagę. 3. Te wagi typów tworzą wektor indeksowany typem. 4. Policz liczbę trafień każdego rodzaju w liście trafień. 5. Następnie każdą z tych liczb zmodyfikuj o specjalną wagę, która na początku rośnie liniowo, a później dość szybko się zmniejsza. 6. Policz iloczyn skalarny wektora z pkt 3 oraz wektora z obliczeń z pkt. 5. Otrzymasz wartość zwaną IR. 7. Wartość IR jest przetwarzaną w oparciu o PageRank. Tworzenie portali biznesowych, Wykład 13 39

40 Ranking zapytanie z wieloma słowami 1. Przeskanuj wiele list tak aby trafienia znajdujące się blisko siebie były wyżej oceniane. 2. Dla każdego zestawu trafień oblicz ich sąsiedztwo 3. Zaklasyfikuj każde z sąsiedztw do jednej z 10 kategorii. 4. Oblicz liczbę trafień nie tylko dla każdego ich typu, ale również dla pary [typ, sąsiedztwo] 5. Każdy para [typ, sąsiedztwo] ma przypisaną wagę 6. Zmodyfikuj liczby trafień w oparciu o wagi. 7. Oblicz iloczyn skalarny liczby trafień oraz par [typ, sąsiedztwo] 8. W efekcie otrzymasz IR, który zostanie zmodyfikowany w oparciu o PageRank, dając ostateczną wartość w rankingu. Tworzenie portali biznesowych, Wykład 13 40

41 Podsumowanie Budowa własnego pająka i wyszukiwarki jest trudnym przedsięwzięciem z kilku powodów: materia lingwistyczna będąca jej podmiotem jest bardzo złożona zbieranie informacji i udzielanie odpowiedzi na zapytania podlegają bardzo silnym ograniczeniom czasowym i wydajnościowym wyrafinowane algorytmy (oparte na tradycyjnej wiedzy lingwistycznej i metodach sztucznej inteligencji) mają nikłe zastosowanie ze względu na ogrom bazy dokumentów i konieczność szybkiego jej przetwarzania. wygrywają metody inżynierkie, które najczęściej nie mają nic wspólnego z naukami lingwistycznymi i stanem sztuki AI coraz więcej informacji jest umieszczana w bazach danych ( hidden web ), które ze względu na specyficzne interfejsy mogą być słabo dostępne dla wyszukiwarek Dla usprawnienia i zdyscyplinowania wyszukiwania w Sieci podjęto liczne prace standaryzacyjne zmierzające do ustrukturalizowania i znormalizowania informacji: XML, Dublin Core, RDF, Semantic Web. jest to jednak początek długiej drogi, która nie wiadomo dokąd prowadzi. Tworzenie portali biznesowych, Wykład 13 41

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite Tomasz Boiński: 1 Pozycjonowanie stron i zastosowanie mod_rewrite Pozycjonowanie stron Promocja strony odbywa się poprzez umiejscowienie jej jak najwyżej w wynikach wyszukiwania Wyszukiwarki indeksują

Bardziej szczegółowo

Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe Wykład 8: Wyszukiwarki internetowe Marcin Bieńkowski Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe (II UWr) Wykład 8 1 / 37 czyli jak znaleźć igłę w sieci Sieci komputerowe

Bardziej szczegółowo

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można jednak wyróżnić 3 główne elementy, które brane są pod uwagę:

Bardziej szczegółowo

Badanie struktury sieci WWW

Badanie struktury sieci WWW Eksploracja zasobów internetowych Wykład 1 Badanie struktury sieci WWW mgr inż. Maciej Kopczyński Białystok 214 Rys historyczny Idea sieci Web stworzona została w 1989 przez Tima BernersaLee z CERN jako

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Główną Uniwersytetu Medycznego w Poznaniu. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Uniwersytetu Jagiellońskiego. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i w jednym miejscu.

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

Indeksowanie full text search w chmurze

Indeksowanie full text search w chmurze Prezentacja przygotowana dla: 5. Konferencja MIC w Poznaniu, 16.06.20111 Lucene.NET Indeksowanie full text search w chmurze K2 i Windows Azure dlaczego dla nas to możliwe? 1. Mamy unikalne połącznie kompetencji

Bardziej szczegółowo

Pobieranie i przetwarzanie treści stron WWW

Pobieranie i przetwarzanie treści stron WWW Eksploracja zasobów internetowych Wykład 2 Pobieranie i przetwarzanie treści stron WWW mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Jedną z funkcji silników wyszukiwania danych, a właściwie ich modułów

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Ekran Wyszukiwania Podstawowego w multiwyszukiwarce EBSCO Discovery Service zapewnia dostęp poprzez jedno okienko wyszukiwawcze na platformie EBSCOhost do wszystkich zasobów biblioteki. Na ekranie do wyszukiwania

Bardziej szczegółowo

edziennik Ustaw Opis architektury

edziennik Ustaw Opis architektury edziennik Ustaw Opis architektury Spis treści 1 Wstęp...3 2 Architektura systemu...3 2.1 Schemat poglądowy rozwiązania...3 2.2 Architektura logiczna...4 2.3 Opis elementów systemu...5 2.3.1 Moduł Udostępniający...5

Bardziej szczegółowo

Skrócona instrukcja obsługi

Skrócona instrukcja obsługi Web of Science Skrócona instrukcja obsługi ISI WEB OF KNOWLEDGE SM Można przeszukiwać ponad 9 00 czasopism w ponad językach z różnych dziedzin nauk ścisłych, społecznych i humanistycznych, aby znaleźć

Bardziej szczegółowo

TECHNOLOGIA INFORMACYJNA

TECHNOLOGIA INFORMACYJNA KATEDRASYSTEMÓWOBLICZENIOWYCH TECHNOLOGIA INFORMACYJNA 1. Podstawy Zajęcia opierają się na wykorzystaniu dostępnych zasobów sprzętowych (serwery) oraz rozwiązań programowych (platforma uczelniana, systemy

Bardziej szczegółowo

Efektywne wyszukiwanie informacji w Internecie

Efektywne wyszukiwanie informacji w Internecie Efektywne wyszukiwanie informacji w Internecie Internet rozrasta się w takim tempie, że znalezienie w nim czegokolwiek jest bardzo trudne. Obecnie w Internecie jest już kilkadziesiąt miliardów stron Największa

Bardziej szczegółowo

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu. Technologie cyfrowe Artur Kalinowski Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.pl Semestr letni 2014/2015 Usługi internetowe usługa internetowa (ang.

Bardziej szczegółowo

WYSZUKIWANIE INFORMACJI W INTERNECIE

WYSZUKIWANIE INFORMACJI W INTERNECIE Sławomir Szaruga Ośrodek Nowoczesnych Technologii Informacyjnych ŁCDNiKP WYSZUKIWANIE INFORMACJI W INTERNECIE II etap edukacji (klasa VI) Cele kształcenia Cele ogólne: kształtowanie umiejętności wyszukiwania

Bardziej szczegółowo

Metadane. Przykry obowiązek czy przydatny zasób?

Metadane. Przykry obowiązek czy przydatny zasób? Metadane Przykry obowiązek czy przydatny zasób? A D A M I W A N I A K Administracja publiczna a ustawa o Infrastrukturze Informacji Przestrzennej, Kielce, 13-14 października 2011 r. Problem nadmiaru informacji

Bardziej szczegółowo

Zasady Wykorzystywania Plików Cookies

Zasady Wykorzystywania Plików Cookies Zasady Wykorzystywania Plików Cookies Definicje i objaśnienia używanych pojęć Ilekroć w niniejszym zbiorze Zasad wykorzystywania plików Cookies pojawia się któreś z poniższych określeń, należy rozumieć

Bardziej szczegółowo

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu XXVIII Letnia Szkoła Naukowa Metodologii Nauk Empirycznych Zakopane, 12-14.05.2014 Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu Maciej Zaborowicz Instytut Inżynierii

Bardziej szczegółowo

Tomasz Grześ. Systemy zarządzania treścią

Tomasz Grześ. Systemy zarządzania treścią Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,

Bardziej szczegółowo

Rozdział ten zawiera informacje o sposobie konfiguracji i działania Modułu OPC.

Rozdział ten zawiera informacje o sposobie konfiguracji i działania Modułu OPC. 1 Moduł OPC Moduł OPC pozwala na komunikację z serwerami OPC pracującymi w oparciu o model DA (Data Access). Dzięki niemu można odczytać stan obiektów OPC (zmiennych zdefiniowanych w programie PLC), a

Bardziej szczegółowo

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Instalacja SQL Server Express. Logowanie na stronie Microsoftu Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy

Bardziej szczegółowo

Pomoc. BIP strona portalu

Pomoc. BIP strona portalu Pomoc BIP strona portalu Biuletyn Informacji Publicznej powstał w celu powszechnego udostępnienia informacji publicznej w postaci elektronicznej. Głównym zadaniem portalu jest przekazywanie informacji

Bardziej szczegółowo

Scenariusz zajęć WARSZTATY KOMPUTEROWE DLA NAUCZYCIELI. Autor: Maciej Lisak-Zbroński. 1. Grupa: Nauczyciele (uczący różnych przedmiotów)

Scenariusz zajęć WARSZTATY KOMPUTEROWE DLA NAUCZYCIELI. Autor: Maciej Lisak-Zbroński. 1. Grupa: Nauczyciele (uczący różnych przedmiotów) 1. Grupa: Nauczyciele (uczący różnych przedmiotów) 2. Zagadnienie: Internet jako ważne źródło informacji w pracy nauczyciela 3. Temat: Wyszukiwanie informacji w Internecie 4. Czas trwania: 2 godz. lekcyjne

Bardziej szczegółowo

Wyszukiwanie informacji

Wyszukiwanie informacji Wyszukiwanie informacji Informatyka Temat 1 Krotoszyn, wrzesień 2015 r. 1 Informatyka 1 Przeszukiwanie zasobów internetowych Krotoszyn, 2015 r. Spis treści prezentacji 1. Wprowadzenie 2. Gdzie szukać informacji?

Bardziej szczegółowo

Czytelnik w bibliotece cyfrowej

Czytelnik w bibliotece cyfrowej Czytelnik w bibliotece cyfrowej Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe IV Warsztaty Biblioteki Cyfrowe Poznań, 2007 Do czego służy Aplikacja Czytelnika? Udostępnianie zasobów cyfrowych

Bardziej szczegółowo

W dalszej części dokumentu przedstawiamy skrócony opis kluczowych funkcji systemu. Niniejszy dokument nie zawiera opisu technicznego systemu.

W dalszej części dokumentu przedstawiamy skrócony opis kluczowych funkcji systemu. Niniejszy dokument nie zawiera opisu technicznego systemu. 1. Informacje Podstawowe Mediamanager 2.1 jest systemem wspierającym zarządzanie dokumentami elektronicznymi. Podstawowymi funkcjami realizowanymi przez oprogramowanie jest przetrzymywanie, zarządzanie

Bardziej szczegółowo

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Sposoby wyszukiwania multimedialnych zasobów w Internecie Sposoby wyszukiwania multimedialnych zasobów w Internecie Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy e-mail: lidka@utp.edu.pl III seminarium z cyklu INFOBROKER:

Bardziej szczegółowo

SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu

SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu SI w procesach przepływu i porządkowania informacji Paweł Buchwald Wyższa Szkoła Biznesu Początki SI John MC Carthy prekursor SI Alan Thuring pomysłodawca testu na określenie inteligencji maszyn Powolny

Bardziej szczegółowo

PROGRAM NAUCZANIA DLA ZAWODU TECHNIK INFORMATYK, 351203 O STRUKTURZE PRZEDMIOTOWEJ

PROGRAM NAUCZANIA DLA ZAWODU TECHNIK INFORMATYK, 351203 O STRUKTURZE PRZEDMIOTOWEJ PROGRAM NAUCZANIA DLA ZAWODU TECHNIK INFORMATYK, 351203 O STRUKTURZE PRZEDMIOTOWEJ Systemy baz danych 1. 2 Wstęp do baz danych 2. 2 Relacyjny model baz danych. 3. 2 Normalizacja baz danych. 4. 2 Cechy

Bardziej szczegółowo

WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE. Filip Makowiecki filip.makowiecki@ceo.org.pl

WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE. Filip Makowiecki filip.makowiecki@ceo.org.pl WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE Filip Makowiecki filip.makowiecki@ceo.org.pl DO CZEGO WYKORZYSTUJEMY INTERNET? Aktywność Polaków w sieci (Oriaq, 2010) Własny ślad w internecie

Bardziej szczegółowo

156.17.4.13. Adres IP

156.17.4.13. Adres IP Adres IP 156.17.4.13. Adres komputera w sieci Internet. Każdy komputer przyłączony do sieci ma inny adres IP. Adres ten jest liczbą, która w postaci binarnej zajmuje 4 bajty, czyli 32 bity. W postaci dziesiętnej

Bardziej szczegółowo

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak Wyszukiwanie boolowskie i strukturalne Adam Srebniak Wyszukiwanie boolowskie W wyszukiwaniu boolowskim zapytanie traktowane jest jako zdanie logiczne. Zwracane są dokumenty, dla których to zdanie jest

Bardziej szczegółowo

Ćwiczenie: JavaScript Cookies (3x45 minut)

Ćwiczenie: JavaScript Cookies (3x45 minut) Ćwiczenie: JavaScript Cookies (3x45 minut) Cookies niewielkie porcje danych tekstowych, które mogą być przesyłane między serwerem a przeglądarką. Przeglądarka przechowuje te dane przez określony czas.

Bardziej szczegółowo

Ogólnopolskie Repozytorium Prac Dyplomowych

Ogólnopolskie Repozytorium Prac Dyplomowych Ogólnopolskie Repozytorium Prac Dyplomowych System Informacji o Szkolnictwie Wyższym POL-on Podręcznik użytkownika Spis treści 1.Logowanie do systemu oraz role w ORPD... 3 1.1.Jak założyć konto w systemie

Bardziej szczegółowo

INTERNET - NOWOCZESNY MARKETING

INTERNET - NOWOCZESNY MARKETING STRONA INTERNETOWA TO JUŻ ZBYT MAŁO! INTERNET ROZWIJA SIĘ Z KAŻDYM DNIEM MÓWIMY JUŻ O: SEM Search Engine Marketing, czyli wszystko co wiąże się z marketingiem internetowym w wyszukiwarkach. SEM jest słowem

Bardziej szczegółowo

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Wydział Informatyki i Zarządzania Politechnika Wrocławska kazienko@pwr.wroc.pl Dlaczego eksploracja danych w serwisach internetowych? Kanały

Bardziej szczegółowo

World Wide Web? rkijanka

World Wide Web? rkijanka World Wide Web? rkijanka World Wide Web? globalny, interaktywny, dynamiczny, wieloplatformowy, rozproszony, graficzny, hipertekstowy - system informacyjny, działający na bazie Internetu. 1.Sieć WWW jest

Bardziej szczegółowo

WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE OCENY Z PRZEDMIOTU INFORMATYKA

WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE OCENY Z PRZEDMIOTU INFORMATYKA WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE OCENY Z PRZEDMIOTU INFORMATYKA Klasa VI Wymagania na ocenę śródroczną: Niedostateczną Uczeń nie spełnia wymogów na ocenę dopuszczającą. Dopuszczającą wymienia podstawowe

Bardziej szczegółowo

Sposoby analizy i interpretacji statystyk strony WWW.

Sposoby analizy i interpretacji statystyk strony WWW. Sposoby analizy i interpretacji statystyk strony WWW. Jak oceniać sprzedaŝ przez WWW? Grzegorz Skiera, Łukasz PraŜmowski grzegorz.skiera@cyberstudio.pl lukasz.prazmowski@cyberstudio.pl O czym powiemy?

Bardziej szczegółowo

Audyt SEO. sklep-budowalny.pl. +531 525 600 biuro@semtec.pl www.semtec.pl. Biuro obsługi: al. Grunwaldzka 2/5 80-236 Gdańsk

Audyt SEO. sklep-budowalny.pl. +531 525 600 biuro@semtec.pl www.semtec.pl. Biuro obsługi: al. Grunwaldzka 2/5 80-236 Gdańsk Audyt SEO sklep-budowalny.pl Spis treści 1 WSTĘP... 3 2 ZALECENIA OGÓLNE... 5 2.1 OPTYMALIZACJA NAGŁÓWKÓW NA WSZYSTKICH PODSTRONACH... 5 2.2 KONFIGURACJA PARAMETRÓW W GOOGLE WEBMASTER TOOLS... 6 2.3 USUNIĘCIE

Bardziej szczegółowo

Google Analytics - Wstęp

Google Analytics - Wstęp Google Analytics Google Analytics - Wstęp Google Analytics to narzędzie do analityki internetowej, udostępnione przez firmę Google w listopadzie 2005,które umożliwia właścicielom witryn zebrać informacje

Bardziej szczegółowo

Dokumentacja Administratora portalu. aplikacji. Wirtualna szkoła

Dokumentacja Administratora portalu. aplikacji. Wirtualna szkoła Dokumentacja Administratora portalu aplikacji Wirtualna szkoła aktualna na dzień 20.12.2012 Wykonawca: Young Digital Planet SA 2012 Strona 2 z 15 Spis Treści Wirtualna szkoła SYSTEM ZARZĄDZANIA NAUCZANIEM...

Bardziej szczegółowo

Pozycjonowanie stron w wyszukiwarkach internetowych. Szansa dla małych i średnich firm na konkurowanie z największymi

Pozycjonowanie stron w wyszukiwarkach internetowych. Szansa dla małych i średnich firm na konkurowanie z największymi Pozycjonowanie stron w wyszukiwarkach internetowych Szansa dla małych i średnich firm na konkurowanie z największymi Podstawowe informacje na temat pozycjonowania Według badań Search Engine Watch 81% internautów

Bardziej szczegółowo

SEO / SEM PREZENTACJA OFERTY

SEO / SEM PREZENTACJA OFERTY SEO / SEM PREZENTACJA OFERTY 1CONTENT 2 Zajmujemy się marketingiem internetowym. Zdobywaliśmy doświadczenie w znanych firmach pcozycjonerskich oraz agencjach interaktywnych. Wypracowaliśmy własne metody

Bardziej szczegółowo

SHAREPOINT SHAREPOINT QM SHAREPOINT DESINGER SHAREPOINT SERWER. Opr. Barbara Gałkowska

SHAREPOINT SHAREPOINT QM SHAREPOINT DESINGER SHAREPOINT SERWER. Opr. Barbara Gałkowska SHAREPOINT SHAREPOINT QM SHAREPOINT DESINGER SHAREPOINT SERWER Opr. Barbara Gałkowska Microsoft SharePoint Microsoft SharePoint znany jest również pod nazwą Microsoft SharePoint Products and Technologies

Bardziej szczegółowo

Oferta prowadzenia kampanii reklamowej AdWords

Oferta prowadzenia kampanii reklamowej AdWords Oferta prowadzenia reklamowej AdWords Oferta ważna 14 dni od daty otrzymania e-maila ofertę przygotował: e-mail: www: tel: fax: Bernard Piekara bernard@inetmedia.pl +48 12 681 55 57 Zawartość niniejszego

Bardziej szczegółowo

APD. Archiwum Prac Dyplomowych w USOS. Mariusz.Czerniak@umk.pl

APD. Archiwum Prac Dyplomowych w USOS. Mariusz.Czerniak@umk.pl APD Archiwum Prac Dyplomowych w USOS Mariusz.Czerniak@umk.pl Plan prezentacji Wprowadzenie do aplikacji Zastosowania i scenariusze działań Plany na najbliższą przyszłość Geneza i przeznaczenie APD należy

Bardziej szczegółowo

konsultacja online raport pdf, analiza, propozycja działań Skuteczne strategie.

konsultacja online raport pdf, analiza, propozycja działań Skuteczne strategie. konsultacja online raport pdf, analiza, propozycja działań Skuteczne strategie. Skuteczne strategie. 2 Odpowiedni marketing hotelu w tak nasyconym rynku jak dzisiaj jest jednym z filarów gwarantujących

Bardziej szczegółowo

Oferta przygotowana przez BerMar multimedia. POZYCJONOWANIE oferta. e-mail: info@bermar.pl tel.: 00 48 (71) 725 61 22

Oferta przygotowana przez BerMar multimedia. POZYCJONOWANIE oferta. e-mail: info@bermar.pl tel.: 00 48 (71) 725 61 22 POZYCJONOWANIE oferta Elementy oferty W ramach usług związanych z poprawieniem rozpoznawalności marki oraz dostępności do informacji o firmie w sieci WWW oferujemy: Audyt serwisu WWW; Analizę pozycji strony

Bardziej szczegółowo

Wszystko o sitelinkach w Google AdWords No prawie wszystko ;)

Wszystko o sitelinkach w Google AdWords No prawie wszystko ;) Wszystko o sitelinkach w Google AdWords No prawie wszystko ;) Rozszerzeń reklam Google AdWords jest coraz więcej rodzajów i są one coraz bardziej powszechnie używane. Szczególnie popularne są tzw. Sitelinki

Bardziej szczegółowo

Jak przetrwać w "wieku informacji"? [sieciowej]

Jak przetrwać w wieku informacji? [sieciowej] II Forum Wiedzy Interdyscyplinarnej im. J. J. Śniadeckich Bydgoszcz - Żnin, 28-29.04.2004 Jak przetrwać w "wieku informacji"? [sieciowej] Żyć i działać we współczesnym świecie to znaczy korzystać z informacji

Bardziej szczegółowo

EBSCO Discovery Service - przewodnik

EBSCO Discovery Service - przewodnik Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka... 1 O multiwyszukiwarce... 2 Przeszukiwane źródła... 2 Jak rozpocząć korzystanie?... 2 Wyszukiwanie zaawansowane... 3 Zawężanie

Bardziej szczegółowo

Skuteczne sposoby budowania ruchu w oparciu o SEM/SEO. - Karol Wnukiewicz

Skuteczne sposoby budowania ruchu w oparciu o SEM/SEO. - Karol Wnukiewicz Skuteczne sposoby budowania ruchu w oparciu o SEM/SEO - Karol Wnukiewicz Pino Brunch - 26 marca 2009 Agenda Wstęp SEM a SEO Strategie i założenia Wybór słów kluczowych Techniczne aspekty budowy strony

Bardziej szczegółowo

Serwery LDAP w środowisku produktów w Oracle

Serwery LDAP w środowisku produktów w Oracle Serwery LDAP w środowisku produktów w Oracle 1 Mariusz Przybyszewski Uwierzytelnianie i autoryzacja Uwierzytelnienie to proces potwierdzania tożsamości, np. przez: Użytkownik/hasło certyfikat SSL inne

Bardziej szczegółowo

EBSCOhost Wyszukiwanie podstawowe dla Bibliotek akademickich

EBSCOhost Wyszukiwanie podstawowe dla Bibliotek akademickich EBSCOhost Wyszukiwanie podstawowe dla Bibliotek akademickich Szkolenie support.ebsco.com Witamy w szkoleniu EBSCO Publishing dotyczącym Wyszukiwania podstawowego dla Bibliotek akademickich, zwięzłym przewodniku

Bardziej szczegółowo

Security Master Class

Security Master Class Security Master Class Platforma kompleksowej analizy zdarzeń Linux Polska SIEM Radosław Żak-Brodalko Senior Solutions Architect Linux Polska sp. z o.o. Podstawowe problemy Jak pokryć lukę między technicznym

Bardziej szczegółowo

KATEGORIA OBSZAR WIEDZY

KATEGORIA OBSZAR WIEDZY Moduł 7 - Usługi w sieciach informatycznych - jest podzielony na dwie części. Pierwsza część - Informacja - wymaga od zdającego zrozumienia podstawowych zasad i terminów związanych z wykorzystaniem Internetu

Bardziej szczegółowo

Część I Rozpoczęcie pracy z usługami Reporting Services

Część I Rozpoczęcie pracy z usługami Reporting Services Spis treści Podziękowania... xi Wprowadzenie... xiii Część I Rozpoczęcie pracy z usługami Reporting Services 1 Wprowadzenie do usług Reporting Services... 3 Platforma raportowania... 3 Cykl życia raportu...

Bardziej szczegółowo

INSTRUKCJA UŻYTKOWNIKA SYSTEMU BIP

INSTRUKCJA UŻYTKOWNIKA SYSTEMU BIP INSTRUKCJA UŻYTKOWNIKA SYSTEMU BIP REGIONALNY SYSTEM BIULETYNÓW INFORMACJI PUBLICZNEJ ORAZ CYFROWY URZĄD DLA URZĘDU MARSZAŁKOWSKIEGO WOJEWÓDZTWA MAŁOPOLSKIEGO Gdynia, maj 2013 Metryka Nazwa projektu Dostarczenie

Bardziej szczegółowo

Ranking wyników na bazie linków

Ranking wyników na bazie linków Eksploracja zasobów internetowych Wykład 4 Ranking wyników na bazie linków mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Poznane do tej pory mechanizmy sortowania istotności zwróconych wyników bazowały

Bardziej szczegółowo

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian

Bardziej szczegółowo

Internet wyszukiwarki internetowe

Internet wyszukiwarki internetowe Internet wyszukiwarki internetowe 1. WYSZUKIWARKI INTERNETOWE to doskonały sposób na znalezienie potrzebnych informacji w Internecie. Najpopularniejsze wyszukiwarki to: http://www.google.pl/ http://www.netsprint.pl/

Bardziej szczegółowo

Rozkład materiału do zajęć z informatyki. realizowanych według podręcznika

Rozkład materiału do zajęć z informatyki. realizowanych według podręcznika Rozkład materiału do zajęć z informatyki realizowanych według podręcznika E. Gurbiel, G. Hardt-Olejniczak, E. Kołczyk, H. Krupicka, M.M. Sysło Informatyka, nowe wydanie z 007 roku Poniżej przedstawiamy

Bardziej szczegółowo

Zasady programowania Dokumentacja

Zasady programowania Dokumentacja Marcin Kędzierski gr. 14 Zasady programowania Dokumentacja Wstęp 1) Temat: Przeszukiwanie pliku za pomocą drzewa. 2) Założenia projektu: a) Program ma pobierać dane z pliku wskazanego przez użytkownika

Bardziej szczegółowo

Wyszukiwarka i usługi Google

Wyszukiwarka i usługi Google Wyszukiwarka i usługi Google Funkcjonalność: Łączenie wiadomości w wątki, Ochrona przed spamem, Filtry i zaawansowana kategoryzacja poczty, Pojemność 15 GB (współdzielona z Google Drive i Zdjęcia Google+),

Bardziej szczegółowo

Architektura komputerów

Architektura komputerów Architektura komputerów Wykład 7 Jan Kazimirski 1 Pamięć podręczna 2 Pamięć komputera - charakterystyka Położenie Procesor rejestry, pamięć podręczna Pamięć wewnętrzna pamięć podręczna, główna Pamięć zewnętrzna

Bardziej szczegółowo

DOZ.PL Kupowanie przez wyszukiwanie

DOZ.PL Kupowanie przez wyszukiwanie DOZ.PL Kupowanie przez wyszukiwanie Jak poprawić ilość i jakość ruchu w serwisie internetowym i przełożyć to na sprzedaż? Portal Dbam o Zdrowie pokazał jak tego dokonać. Właściciel serwisu www.doz.pl w

Bardziej szczegółowo

Instrukcja użytkownika. systemu BIP

Instrukcja użytkownika. systemu BIP Instrukcja użytkownika systemu BIP SPIS TREŚCI 1. Informacje o biuletynie... 3 1.1. Mapa serwisu... 3 1.2. Redakcja biuletynu... 3 1.3. Słownik skrótów... 5 1.4. Historia zmian... 5 1.5. Statystyka odwiedzin...

Bardziej szczegółowo

dziennik Instrukcja obsługi

dziennik Instrukcja obsługi Ham Radio Deluxe dziennik Instrukcja obsługi Wg. Simon Brown, HB9DRV Tłumaczenie SP4JEU grudzień 22, 2008 Zawartość 3 Wprowadzenie 5 Po co... 5 Główne cechy... 5 baza danych 7 ODBC... 7 Który produkt

Bardziej szczegółowo

Jak podnieść pozycje w Google?

Jak podnieść pozycje w Google? Jak podnieść pozycje w Google? STRONNET 2015 Zawartość Jak podnieść pozycje w Google?... 1 1. Tytuł strony... 3 2. Adres strony... 3 3. Opis strony... 4 4. Znaczniki h1 h2... 4 5. Słowa kluczowe w treści

Bardziej szczegółowo

Poziomy wymagań Konieczny K Podstawowy- P Rozszerzający- R Dopełniający- D Uczeń:

Poziomy wymagań Konieczny K Podstawowy- P Rozszerzający- R Dopełniający- D Uczeń: WYMAGANIA EDUKACYJNE PRZEDMIOT: Witryny i aplikacje internetowe NUMER PROGRAMU NAUCZANIA (ZAKRES): 351203 Lp 1. Dział programu Podstawy HTML Poziomy wymagań Konieczny K Podstawowy- P Rozszerzający- R Dopełniający-

Bardziej szczegółowo

I. Informacje ogólne. Jednym z takich systemów jest Mambo.

I. Informacje ogólne. Jednym z takich systemów jest Mambo. MAMBO (CMS) I. Informacje ogólne CMS, Content Management System ("system zarządzania treścią") jest to jedna lub zestaw aplikacji internetowych pozwalających na łatwe utworzenie oraz późniejszą aktualizację

Bardziej szczegółowo

- google.pl (dla serwisów polskich) - google.com (dla witryn i fraz obcojęzycznych)

- google.pl (dla serwisów polskich) - google.com (dla witryn i fraz obcojęzycznych) Pozycjonowanie stron to najpopularniejsza obecnie metoda promocji serwisów www w Internecie. Obejmuje szereg działań dokonywanych wobec określonej strony internetowej. Prowadzą one do tego, aby po wpisaniu

Bardziej szczegółowo

Poradnik SEO. Ilu z nich szuka Twojego produktu? Jak skutecznie to wykorzystać?

Poradnik SEO. Ilu z nich szuka Twojego produktu? Jak skutecznie to wykorzystać? Poradnik SEO Poradnik SEO Internet to najszybciej rozwijające się medium. W Polsce jest już 15 mln użytkowników, ponad 90% z nich używa wyszukiwarki Google. Dziennie użytkownicy zadają ponad 130 milionów

Bardziej szczegółowo

POZYCJONOWANIE STRON INTERNETOWYCH (SEO)

POZYCJONOWANIE STRON INTERNETOWYCH (SEO) POZYCJONOWANIE STRON INTERNETOWYCH (SEO) Nasza oferta różni się od ofert innych firm pozycjonujących. W Polsce firmy pozycjonujące strony przygotowują zestaw słów kluczowych pod które przygotowują pozycjonowanie.

Bardziej szczegółowo

Internetowa strategia marketingowa

Internetowa strategia marketingowa Strategie Marketingowe Marketing Internetowy dr Grzegorz Szymański Internetowa strategia marketingowa Pozycjonowanie Jest to jedna z najskuteczniejszych i najtańszych metod reklamy w Internecie. Skuteczne

Bardziej szczegółowo

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym 1 Wprowadzenie do środowiska Oracle APEX, obszary robocze, użytkownicy Wprowadzenie Plan Administracja obszarem roboczym 2 Wprowadzenie Co to jest APEX? Co to jest APEX? Architektura Środowisko Oracle

Bardziej szczegółowo

Kroki dwa. do najlepszych pozycji w Google

Kroki dwa. do najlepszych pozycji w Google Kroki dwa do najlepszych pozycji w Google o mnie Wojciech Kłodziński Programista od 10 lat Branża SEO od 4 lat Założyciel Enterso sp. Z o.o. Zanim wystartujemy krótka rozgrzewka Nasze główne zasoby Kapitał

Bardziej szczegółowo

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Hurtownie danych Przetwarzanie zapytań. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Magazyny danych operacyjnych, źródła Centralna hurtownia danych Hurtownie

Bardziej szczegółowo

finiownia loginów. W zależności od ustawionej opcji użytkownik login:

finiownia loginów. W zależności od ustawionej opcji użytkownik login: SYSTEM INFORMATYCZNY KS-ASW 2016 z dnia 2016-01-19 Raport Nr 1/2016 MODUŁ ksasw.exe OPIS ZMIAN, MODYFIKACJI i AKTUALIZACJI 1. Wersja 2016 modułu aswplan.exe 1. Wersja 2016 programu aswzsby.dll 1. Wersja

Bardziej szczegółowo

Księgarnia PWN: Paweł Kobis - Marketing z Google CZYNNIKI WPŁYWAJĄCE NA POZYCJĘ W WYSZUKIWARKACH

Księgarnia PWN: Paweł Kobis - Marketing z Google CZYNNIKI WPŁYWAJĄCE NA POZYCJĘ W WYSZUKIWARKACH Księgarnia PWN: Paweł Kobis - Marketing z Google CZYNNIKI WPŁYWAJĄCE NA POZYCJĘ W WYSZUKIWARKACH Oto zestawienie tych czynników w tabeli. Ważność każdego z nich przedstawiona jest w skali 0 5. Poniżej

Bardziej szczegółowo

Aplikacje WWW - laboratorium

Aplikacje WWW - laboratorium Aplikacje WWW - laboratorium PHP + bazy danych Celem ćwiczenia jest przygotowanie prostej aplikacji internetowej wykorzystującej technologię PHP. Aplikacja pokazuje takie aspekty, współpraca PHP z bazami

Bardziej szczegółowo

Co to jest pozycjonowanie stron internetowych? Dlaczego warto pozycjonować strony internetowe?

Co to jest pozycjonowanie stron internetowych? Dlaczego warto pozycjonować strony internetowe? Co to jest pozycjonowanie stron internetowych? Pozycjonowanie to wszelkie działania mające na celu podniesienie pozycji strony internetowej, na określone słowa kluczowe, w wyszukiwarce Google. Dlaczego

Bardziej szczegółowo

Phocus.pl to polsko-japońska firma składająca się z grupy kreatywnych profesjonalistów, którzy współpracując razem tworzą porządne rzeczy.

Phocus.pl to polsko-japońska firma składająca się z grupy kreatywnych profesjonalistów, którzy współpracując razem tworzą porządne rzeczy. Phocus.pl - oferta O firmie Phocus.pl to polsko-japońska firma składająca się z grupy kreatywnych profesjonalistów, którzy współpracując razem tworzą porządne rzeczy. Naszym celem jest dostarczenie Państwu

Bardziej szczegółowo

2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego

2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego 2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego produktu. 23 czerwca 2014 Spis treści 3 Spis treści...5

Bardziej szczegółowo

Polski Zasób Normalizacyjny (PZN) Instrukcja Sekretarza KT (wersja 1.1)

Polski Zasób Normalizacyjny (PZN) Instrukcja Sekretarza KT (wersja 1.1) Polski Zasób Normalizacyjny (PZN) Instrukcja Sekretarza KT (wersja 1.1) SPIS TREŚCI 1. Panel użytkownika... 2 2. Opiniowanie... 3 3. Głosowanie... 6 3.1 Zakładanie głosowania związanego z tematem normalizacyjnym

Bardziej szczegółowo

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2 Internet, jako ocean informacji Technologia Informacyjna Lekcja 2 Internet INTERNET jest rozległą siecią połączeń, między ogromną liczbą mniejszych sieci komputerowych na całym świecie. Jest wszechstronnym

Bardziej szczegółowo

Odkrywanie niewidzialnych zasobów sieci

Odkrywanie niewidzialnych zasobów sieci Odkrywanie niewidzialnych zasobów sieci Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy II seminarium z cyklu INFOBROKER: Wyszukiwanie i przetwarzanie cyfrowych

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Analizy na podstawie danych sprawozdawczych - Moduł Analiz dla Banków Spółdzielczych

Analizy na podstawie danych sprawozdawczych - Moduł Analiz dla Banków Spółdzielczych Analizy na podstawie danych sprawozdawczych - Moduł Analiz dla Banków Spółdzielczych Kwiecień 2012 Wszelkie prawa zastrzeżone. Dokument może być reprodukowany lub przechowywany bez ograniczeń tylko w całości.

Bardziej szczegółowo

Multi-projekt z przedmiotów Inżynieria oprogramowania, Współczesne bazy danych i Programowanie w języku Java

Multi-projekt z przedmiotów Inżynieria oprogramowania, Współczesne bazy danych i Programowanie w języku Java Multi-projekt z przedmiotów Inżynieria oprogramowania, Współczesne bazy danych i Programowanie w języku Java Spis treści 1 Terminarz...3 2 Specyfikacja wymagań - założenia projektowe...4 2.1 Informacje

Bardziej szczegółowo

Sprzętowo wspomagane metody klasyfikacji danych

Sprzętowo wspomagane metody klasyfikacji danych Sprzętowo wspomagane metody klasyfikacji danych Jakub Botwicz Politechnika Warszawska, Instytut Telekomunikacji Plan prezentacji 1. Motywacje oraz cele 2. Problemy klasyfikacji danych 3. Weryfikacja integralności

Bardziej szczegółowo

OPIEKUN DORADCY: KONTO FIRMY ZARZĄDZANIE KLIENTAMI

OPIEKUN DORADCY: KONTO FIRMY ZARZĄDZANIE KLIENTAMI Portalami Opiekun Doradcy / Opiekun Zysku zarządza firma Opiekun Inwestora z siedzibą w Poznaniu, NIP: 972 117 04 29 KONTAKT W SPRAWIE WSPÓŁPRACY W RAMACH PROJEKTU OPIEKUN DORADCY pomoc@opiekundoradcy.pl,

Bardziej szczegółowo

INFORMATYKA Pytania ogólne na egzamin dyplomowy

INFORMATYKA Pytania ogólne na egzamin dyplomowy INFORMATYKA Pytania ogólne na egzamin dyplomowy 1. Wyjaśnić pojęcia problem, algorytm. 2. Podać definicję złożoności czasowej. 3. Podać definicję złożoności pamięciowej. 4. Typy danych w języku C. 5. Instrukcja

Bardziej szczegółowo

Strona wizytówka od 400 zł

Strona wizytówka od 400 zł Strona wizytówka od 400 zł Oferta z dnia 21.01.2010 Prosta strona zawierająca podstawowe informacje o firmie oraz jej ofercie. Pozwala ona klientom na odnalezienie firmy w sieci, zapoznanie się z jej ofertą,

Bardziej szczegółowo