XML i nowoczesne metody zarządzania treścią
|
|
- Martyna Krawczyk
- 7 lat temu
- Przeglądów:
Transkrypt
1 XML i nowoczesne metody zarządzania treścią Wykład 13: Wyszukiwanie informacji Maciej Ogrodniczuk MIMUW, 7 stycznia 2010 Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 1
2 Wyszukiwanie na poważnie Tematem wykładu nie będzie wyszukiwanie w Internecie (w sensie składni Google a itp.) ani w bazie danych, lecz tzw. enterprise search, czyli indeksowanie, przeszukiwanie i prezentacja dokumentów firmowych uprawnionym użytkownikom. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 2
3 Wyszukiwanie na poważnie Tematem wykładu nie będzie wyszukiwanie w Internecie (w sensie składni Google a itp.) ani w bazie danych, lecz tzw. enterprise search, czyli indeksowanie, przeszukiwanie i prezentacja dokumentów firmowych uprawnionym użytkownikom. Idea: wyszukiwarka jest najważniejszym komponentem systemu zarządzania dokumentami. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 2
4 Wyszukiwanie na poważnie Tematem wykładu nie będzie wyszukiwanie w Internecie (w sensie składni Google a itp.) ani w bazie danych, lecz tzw. enterprise search, czyli indeksowanie, przeszukiwanie i prezentacja dokumentów firmowych uprawnionym użytkownikom. Idea: wyszukiwarka jest najważniejszym komponentem systemu zarządzania dokumentami. Specyfika (w porównaniu z wyszukiwarką internetową): ograniczony zakres (zwykle intranet, znane prawa dostępu,...) możliwość wykorzystania firmowych standardów (np. rodzaju używanych metadanych) ale niekoniecznie, ranking dokumentów nie aż tak istotny, konieczność przeszukiwania wielu źródeł, w wielu formatach, lepsza aktualność listy wyników, brak śmieci! Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 2
5 Jak działa wyszukiwanie? Z punktu widzenia użytkownika: cel: znajdź mi najlepszą odpowiedź na zadane pytanie, wprowadź zapytanie, oczekuj na listę wyników. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 3
6 Jak działa wyszukiwanie? Z punktu widzenia użytkownika: cel: znajdź mi najlepszą odpowiedź na zadane pytanie, wprowadź zapytanie, oczekuj na listę wyników. W systemie: zanalizuj zapytanie, uzyskaj dostęp do danych, zanalizuj je, utwórz listę wyników zgodnych z zapytaniem, uwzględniając uprawnienia użytkownika, uporządkuj listę wyników, zaprezentuj ją użytkownikowi. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 3
7 Jak naprawdę działa wyszukiwanie? Naiwne wyobrażenie o wyszukiwaniu: 1 przeglądaj dokumenty jeden po drugim, 2 jeśli w danym dokumencie znajduje się poszukiwany element (metadana, wyraz, fraza, wzorzec) powiadom użytkownika, 3 jeśli wyniki mają być uporządkowane, zbieraj je w jakiejś strukturze danych i wyświetl po przejrzeniu wszystkich. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 4
8 Jak naprawdę działa wyszukiwanie? Naiwne wyobrażenie o wyszukiwaniu: 1 przeglądaj dokumenty jeden po drugim, 2 jeśli w danym dokumencie znajduje się poszukiwany element (metadana, wyraz, fraza, wzorzec) powiadom użytkownika, 3 jeśli wyniki mają być uporządkowane, zbieraj je w jakiejś strukturze danych i wyświetl po przejrzeniu wszystkich. Działa dla 100 dokumentów. A dla ? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 4
9 Jak naprawdę działa wyszukiwanie? Naiwne wyobrażenie o wyszukiwaniu: 1 przeglądaj dokumenty jeden po drugim, 2 jeśli w danym dokumencie znajduje się poszukiwany element (metadana, wyraz, fraza, wzorzec) powiadom użytkownika, 3 jeśli wyniki mają być uporządkowane, zbieraj je w jakiejś strukturze danych i wyświetl po przejrzeniu wszystkich. Działa dla 100 dokumentów. A dla ? Dużych ilości danych nie da się szybko przeszukiwać bez wstępnego zindeksowania treści. Indeks to struktura danych porównywalna z wykazem rzeczowym w książce, zoptymalizowana pod kątem jej przeszukiwania, typowo zawierająca informację: o wystąpieniu słowa w dokumencie, zwykle także o miejscu jego wystąpienia. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 4
10 Jak naprawdę działa wyszukiwanie? Naiwne wyobrażenie o wyszukiwaniu: 1 przeglądaj dokumenty jeden po drugim, 2 jeśli w danym dokumencie znajduje się poszukiwany element (metadana, wyraz, fraza, wzorzec) powiadom użytkownika, 3 jeśli wyniki mają być uporządkowane, zbieraj je w jakiejś strukturze danych i wyświetl po przejrzeniu wszystkich. Działa dla 100 dokumentów. A dla ? Dużych ilości danych nie da się szybko przeszukiwać bez wstępnego zindeksowania treści. Indeks to struktura danych porównywalna z wykazem rzeczowym w książce, zoptymalizowana pod kątem jej przeszukiwania, typowo zawierająca informację: o wystąpieniu słowa w dokumencie, zwykle także o miejscu jego wystąpienia. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 4
11 Uwaga na wpisy w indeksie! Ważne: indeks musi być aktualny to na jego podstawie użytkownik dostanie wyniki, częstość i sposób synchronizacji indeksu ze stanem faktycznym zależy od zastosowania i możliwości technicznych: często nie da się przyrostowo, tylko trzeba całościowo, często nie da się na bieżąco, tylko trzeba cyklicznie, proces indeksowania może generować dodatkowe dane pożyteczne podczas wyświetlania wyników (np. streszczenia dokumentów). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 5
12 Czy indeks powinien zawierać wszystkie słowa? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 6
13 Czy indeks powinien zawierać wszystkie słowa? Słowa nieznaczące (ang. stopwords) to w kontekście wyszukiwania często występujące słowa języka nie niosące samodzielnie żadnego znaczenia (przedimki, spójniki, przyimki, zaimki...) Czy wyszukiwać słowa nieznaczące? samodzielnie na pewno nie, bo wystąpią w (prawie) każdym dokumencie, + to dlaczego Google znajduje? Czy indeksować słowa nieznaczące? bez nich indeks będzie mniejszy, a wyszukiwanie prostsze (po usunięciu ich z zapytania), + bez nich nie wyszukamy fraz takich jak Take That czy The The. Dobra rada: dobrze, by podsystem wyszukujący pozwalał na definiowanie listy słów nieznaczących. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 6
14 Co to znaczy słowa? Podział tekstu na jednostki podstawowe (np. dla celów umieszczenia w indeksie) to segmentacja tekstu (tokenizacja). Segmenty tekstu mogą być w niektórych przypadkach krótsze niż słowa ortograficzne ( od spacji do spacji ). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 7
15 Co to znaczy słowa? Podział tekstu na jednostki podstawowe (np. dla celów umieszczenia w indeksie) to segmentacja tekstu (tokenizacja). Segmenty tekstu mogą być w niektórych przypadkach krótsze niż słowa ortograficzne ( od spacji do spacji ). Problemy tokenizacji: ważna znajomość języka tekstu (brak spacji w językach azjatyckich...), ważna znajomość kodowania znaków (dla oddzielenia znaków białych od zawartości vide U+00A0), jaki znak dzieli segmenty? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 7
16 Co to znaczy słowa? Podział tekstu na jednostki podstawowe (np. dla celów umieszczenia w indeksie) to segmentacja tekstu (tokenizacja). Segmenty tekstu mogą być w niektórych przypadkach krótsze niż słowa ortograficzne ( od spacji do spacji ). Problemy tokenizacji: ważna znajomość języka tekstu (brak spacji w językach azjatyckich...), ważna znajomość kodowania znaków (dla oddzielenia znaków białych od zawartości vide U+00A0), jaki znak dzieli segmenty? ( can t, długośmy, przyszedłby, doń, polsko-niemiecki, pięćdziesięciozłotowy), czy spacja zawsze dzieli segmenty? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 7
17 Co to znaczy słowa? Podział tekstu na jednostki podstawowe (np. dla celów umieszczenia w indeksie) to segmentacja tekstu (tokenizacja). Segmenty tekstu mogą być w niektórych przypadkach krótsze niż słowa ortograficzne ( od spacji do spacji ). Problemy tokenizacji: ważna znajomość języka tekstu (brak spacji w językach azjatyckich...), ważna znajomość kodowania znaków (dla oddzielenia znaków białych od zawartości vide U+00A0), jaki znak dzieli segmenty? ( can t, długośmy, przyszedłby, doń, polsko-niemiecki, pięćdziesięciozłotowy), czy spacja zawsze dzieli segmenty? (dwadzieścia pięć), co z datami? liczbami? walutami? co ze skrótami (prof. = profesor?)... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 7
18 Co począć z odmianą wyrazów? Problem: chcemy się dowiedzieć czym karmić kota wpisujemy w wyszukiwarkę i... Nie znajduje się, bo w dokumencie było Czym karmić koty. Placebo: użyć symboli wieloznacznych (ang. wildcards) w zapytaniu: Czym karmić kot*. Panaceum: wyszukiwanie z fleksją (stemming, lematyzacja). W indeksie zapisywane są gramatyczne formy podstawowe kolejnych słów (np. mianownik rzeczownika, bezokolicznik czasownika). W ten sam sposób normalizowane jest zapytanie. Problem nie jest trywialny, zwłaszcza po polsku: Dudek, obciąć pensję vs. Real obetnie pensję Dudkowi. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 8
19 Co począć z odmianą wyrazów? Problem: chcemy się dowiedzieć czym karmić kota wpisujemy w wyszukiwarkę i... Nie znajduje się, bo w dokumencie było Czym karmić koty. Placebo: użyć symboli wieloznacznych (ang. wildcards) w zapytaniu: Czym karmić kot*. Panaceum: wyszukiwanie z fleksją (stemming, lematyzacja). W indeksie zapisywane są gramatyczne formy podstawowe kolejnych słów (np. mianownik rzeczownika, bezokolicznik czasownika). W ten sam sposób normalizowane jest zapytanie. Problem nie jest trywialny, zwłaszcza po polsku: Dudek, obciąć pensję vs. Real obetnie pensję Dudkowi. Uwaga: zmiany w indeksie mogą sprawić, że niektóre słowa staną się nieodróżnialne (ang. bore = nudziarz vs. bear = niedźwiedź, Google: zęby vs. żeby)! Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 8
20 Co począć z odmianą wyrazów? Problem: chcemy się dowiedzieć czym karmić kota wpisujemy w wyszukiwarkę i... Nie znajduje się, bo w dokumencie było Czym karmić koty. Placebo: użyć symboli wieloznacznych (ang. wildcards) w zapytaniu: Czym karmić kot*. Panaceum: wyszukiwanie z fleksją (stemming, lematyzacja). W indeksie zapisywane są gramatyczne formy podstawowe kolejnych słów (np. mianownik rzeczownika, bezokolicznik czasownika). W ten sam sposób normalizowane jest zapytanie. Problem nie jest trywialny, zwłaszcza po polsku: Dudek, obciąć pensję vs. Real obetnie pensję Dudkowi. Uwaga: zmiany w indeksie mogą sprawić, że niektóre słowa staną się nieodróżnialne (ang. bore = nudziarz vs. bear = niedźwiedź, Google: zęby vs. żeby)! Najlepszy analizator morfologiczny dla zainteresowanych: Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 8
21 Lematyzacja w środowisku wielojęzycznym Uwaga oczywista: potrzebujemy modułów dla każdego języka: stemujemy dokumenty, stemujemy zapytanie, dopasowujemy zapytanie do dokumentów. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 9
22 Lematyzacja w środowisku wielojęzycznym Uwaga oczywista: potrzebujemy modułów dla każdego języka: stemujemy dokumenty, stemujemy zapytanie, dopasowujemy zapytanie do dokumentów. Uwaga mniej oczywista: za pomocą którego modułu stemować? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 9
23 Lematyzacja w środowisku wielojęzycznym Uwaga oczywista: potrzebujemy modułów dla każdego języka: stemujemy dokumenty, stemujemy zapytanie, dopasowujemy zapytanie do dokumentów. Uwaga mniej oczywista: za pomocą którego modułu stemować? Możemy wykryć język dokumentu (za pomocą metod statystycznych działa niemal idealnie): badając występowanie słów charakterystycznych dla języka, badając występowanie n-gramów (zbitek n-literowych), porównując kompresowalność tekstu ze wskaźnikiem dla tekstu porównawczego,... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 9
24 Lematyzacja w środowisku wielojęzycznym Uwaga oczywista: potrzebujemy modułów dla każdego języka: stemujemy dokumenty, stemujemy zapytanie, dopasowujemy zapytanie do dokumentów. Uwaga mniej oczywista: za pomocą którego modułu stemować? Możemy wykryć język dokumentu (za pomocą metod statystycznych działa niemal idealnie): badając występowanie słów charakterystycznych dla języka, badając występowanie n-gramów (zbitek n-literowych), porównując kompresowalność tekstu ze wskaźnikiem dla tekstu porównawczego,... I musimy jeszcze tylko wykryć (ustawić ręcznie, przypisać domyślny) język zapytania, co może być trudne dla krótkich tekstów (vide Stare forty). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 9
25 Podpowiedzi (pisowni) Jak to działa? użytkownik wprowadza zapytanie, system zgaduje, o co mogło chodzić użytkownikowi na bieżąco lub po wyświetleniu wyników (gdy ich brak lub nie może znaleźć wyników spełniających podane kryteria). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 10
26 Podpowiedzi (pisowni) Jak to działa? użytkownik wprowadza zapytanie, system zgaduje, o co mogło chodzić użytkownikowi na bieżąco lub po wyświetleniu wyników (gdy ich brak lub nie może znaleźć wyników spełniających podane kryteria). Dwa sposoby korekty zapytania: automatyczny, poprzez zamianę błędnie napisanego słowa na jego poprawną wersję, półautomatyczny, poprzez wyświetlenie użytkownikowi poprawnej pisowni i umożliwienie mu ponownego wykonania wyszukiwania z użyciem poprawnej wersji zapytania. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 10
27 Podpowiedzi (pisowni) Zwykle sposób kontroli pisowni można konfigurować regulując: 1 stopień podobieństwa dwóch słów, który musi być zachowany, by można było przyjąć, że jedno jest złą pisownią drugiego, 2 stopień podobieństwa, przy którym zła pisownia winna być automatycznie poprawiana. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 11
28 Podpowiedzi (pisowni) Zwykle sposób kontroli pisowni można konfigurować regulując: 1 stopień podobieństwa dwóch słów, który musi być zachowany, by można było przyjąć, że jedno jest złą pisownią drugiego, 2 stopień podobieństwa, przy którym zła pisownia winna być automatycznie poprawiana. Jak konstruuje się podpowiedzi? na bazie listy słów z tekstów indeksowanych, ewentualnie wpisów z oddzielnego słownika ortograficznego. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 11
29 Podpowiedzi (pisowni) Zwykle sposób kontroli pisowni można konfigurować regulując: 1 stopień podobieństwa dwóch słów, który musi być zachowany, by można było przyjąć, że jedno jest złą pisownią drugiego, 2 stopień podobieństwa, przy którym zła pisownia winna być automatycznie poprawiana. Jak konstruuje się podpowiedzi? na bazie listy słów z tekstów indeksowanych, ewentualnie wpisów z oddzielnego słownika ortograficznego. Żelazna zasada: nie podpowiadaj niczego, czego nie da się znaleźć. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 11
30 Indeksowanie różnych źródeł i ekstrakcja tekstu Źródła tekstu to nie tylko pliki, ale także: zawartość dostępna online, pola CLOB w bazie danych (pobierz tekst, użyj nazw kolumn do ekstrakcji metadanych), maile,... dlatego oprócz samego silnika wyszukiwarki ważny jest też interfejs dostępu do danych. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 12
31 Indeksowanie różnych źródeł i ekstrakcja tekstu Źródła tekstu to nie tylko pliki, ale także: zawartość dostępna online, pola CLOB w bazie danych (pobierz tekst, użyj nazw kolumn do ekstrakcji metadanych), maile,... dlatego oprócz samego silnika wyszukiwarki ważny jest też interfejs dostępu do danych. Podobnie z ekstrakcją tekstu: prosta dla plików czysto tekstowych, bardziej złożona dla innych formatów tekstowych (np. usuń znaczniki HTML-owe, weź pod uwagę atrybut alt i metadane ze znaczników <meta>; nie popsuj polskich liter w PDF-ach), wymagająca użycia dedykowanych narzędzi dla pozostałych formatów. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 12
32 Sortowanie wyników wg trafności Co to znaczy, że dokument pasuje do zapytania? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 13
33 Sortowanie wyników wg trafności Co to znaczy, że dokument pasuje do zapytania? Pozycja wyniku na liście odzwierciedla ważoną średnią wielu parametrów często nieoczywistych: wystąpienia słów w dokumencie, wystąpienia słów w metadanych, tekstach linków (PageRank), kto da więcej?... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 13
34 Sortowanie wyników wg trafności Co to znaczy, że dokument pasuje do zapytania? Pozycja wyniku na liście odzwierciedla ważoną średnią wielu parametrów często nieoczywistych: wystąpienia słów w dokumencie, wystąpienia słów w metadanych, tekstach linków (PageRank), kto da więcej?... Najpopularniejszy sposób reprezentacji dokumentów i zapytań: model przestrzeni wielowymiarowej (ang. vector space model), którą tworzą wszystkie słowa zawarte w indeksowanych dokumentach (każde słowo jest osobnym wymiarem tej przestrzeni). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 13
35 Metryki zapytań Dokument (zbiór słów) i zapytanie mogą zostać przedstawione jako wielowymiarowe wektory, których współrzędne przechowują informację o występowaniu poszczególnych słów w treści dokumentu/zapytania (wystąpienie oznacza niezerową wartość). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 14
36 Metryki zapytań Dokument (zbiór słów) i zapytanie mogą zostać przedstawione jako wielowymiarowe wektory, których współrzędne przechowują informację o występowaniu poszczególnych słów w treści dokumentu/zapytania (wystąpienie oznacza niezerową wartość). Przy takiej reprezentacji jakość wyniku jest funkcją odległości między wektorem dokumentu a wektorem zapytania zgodnie z określoną metryką. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 14
37 Metryki zapytań Dokument (zbiór słów) i zapytanie mogą zostać przedstawione jako wielowymiarowe wektory, których współrzędne przechowują informację o występowaniu poszczególnych słów w treści dokumentu/zapytania (wystąpienie oznacza niezerową wartość). Przy takiej reprezentacji jakość wyniku jest funkcją odległości między wektorem dokumentu a wektorem zapytania zgodnie z określoną metryką. Dwie najpopularniejsze metryki: binarna wektor zawiera wartość 1 dla każdego słowa zawartego w dokumencie i 0 dla wszystkich innych słów, TF/IDF stosunek częstości wystąpień słów w dokumencie (ang. Term Frequency) do ich istotności tym niższej, im więcej różnych dokumentów zawiera dane słowo (ang. Inverse Document Frequency). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 14
38 Metryki zapytań Dokument (zbiór słów) i zapytanie mogą zostać przedstawione jako wielowymiarowe wektory, których współrzędne przechowują informację o występowaniu poszczególnych słów w treści dokumentu/zapytania (wystąpienie oznacza niezerową wartość). Przy takiej reprezentacji jakość wyniku jest funkcją odległości między wektorem dokumentu a wektorem zapytania zgodnie z określoną metryką. Dwie najpopularniejsze metryki: binarna wektor zawiera wartość 1 dla każdego słowa zawartego w dokumencie i 0 dla wszystkich innych słów, TF/IDF stosunek częstości wystąpień słów w dokumencie (ang. Term Frequency) do ich istotności tym niższej, im więcej różnych dokumentów zawiera dane słowo (ang. Inverse Document Frequency). Podobnie możemy obliczać odległość między wektorami dokumentów, tworząc listę dokumentów podobnych do danego. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 14
39 Kiedy wyszukiwanie pełnotekstowe to za mało Wyszukiwanie pełnotekstowe działa najlepiej, gdy użytkownik jest w stanie przewidzieć, jakich słów użyto w przeszukiwanych dokumentach, a dokumenty opisane są dokładnie ( ręcznie). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 15
40 Kiedy wyszukiwanie pełnotekstowe to za mało Wyszukiwanie pełnotekstowe działa najlepiej, gdy użytkownik jest w stanie przewidzieć, jakich słów użyto w przeszukiwanych dokumentach, a dokumenty opisane są dokładnie ( ręcznie). Niestety, rzadko kiedy jest tak pięknie: w zapytaniach używane są synonimy pojęć z dokumentów ( błękitny sweterek ), dokumenty zawierają pojęcia szczegółowe bez wskazania szerszej klasy ( KDL-19S5730E śnieży ), podczas gdy zapytania mogą być ogólne ( metro na Węgrzech ), użytkownik nie do końca wie, czego szuka ( TV nie działa ). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 15
41 Kiedy wyszukiwanie pełnotekstowe to za mało Wyszukiwanie pełnotekstowe działa najlepiej, gdy użytkownik jest w stanie przewidzieć, jakich słów użyto w przeszukiwanych dokumentach, a dokumenty opisane są dokładnie ( ręcznie). Niestety, rzadko kiedy jest tak pięknie: w zapytaniach używane są synonimy pojęć z dokumentów ( błękitny sweterek ), dokumenty zawierają pojęcia szczegółowe bez wskazania szerszej klasy ( KDL-19S5730E śnieży ), podczas gdy zapytania mogą być ogólne ( metro na Węgrzech ), użytkownik nie do końca wie, czego szuka ( TV nie działa ). Rozwiązania: wyszukiwanie ze słownikiem synonimów, wyszukiwanie sterowane dialogiem, drzewa decyzyjne, czyli ogólnie rzecz biorąc wyszukiwanie z modelem (wiedzy). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 15
42 Najprostszy model: metadane, słowniki, taksonomie Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 16
43 Najprostszy model: metadane, słowniki, taksonomie Metadane tekstowe mogą zawierać dowolny tekst (np. tytuł artykułu) lub wartość z ograniczonego zestawu (dział gazety, państwo itp.) słownika. Mogą być wypełniane na dwa sposoby: ręcznie, tj. na podstawie pól dokumentu, pól formularza,... automatycznie w wyniku analizy zawartości dokumentu. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 16
44 Najprostszy model: metadane, słowniki, taksonomie Metadane tekstowe mogą zawierać dowolny tekst (np. tytuł artykułu) lub wartość z ograniczonego zestawu (dział gazety, państwo itp.) słownika. Mogą być wypełniane na dwa sposoby: ręcznie, tj. na podstawie pól dokumentu, pól formularza,... automatycznie w wyniku analizy zawartości dokumentu. Zestaw metadanych wraz z opisem ich zawartości tworzy prosty model danych dla wyszukiwania, który może zostać użyty podczas: wyświetlania interfejsu użytkownika (wyszukiwarki zaawansowanej), dialogu z użytkownikiem w celu doprecyzowania kryteriów zapytania, filtrowania wyników,... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 16
45 Wyszukiwanie sterowane dialogiem Gdy użytkownik nie uwzględnił w swoim zapytaniu wszystkich kryteriów nakładanych na istotne metadane (atrybuty modelu), a wyników jest na tyle dużo, że warto doprecyzować zapytanie, system może przed wykonaniem wyszukiwania automatycznie wygenerować pytania uszczegóławiające. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 17
46 Wyszukiwanie sterowane dialogiem Gdy użytkownik nie uwzględnił w swoim zapytaniu wszystkich kryteriów nakładanych na istotne metadane (atrybuty modelu), a wyników jest na tyle dużo, że warto doprecyzować zapytanie, system może przed wykonaniem wyszukiwania automatycznie wygenerować pytania uszczegóławiające. Przykład modelu oferty sprzedaży samochodów: producent Audi, Fiat,... model zależny od producenta: A4, A6, A8, TT,... rok produkcji, cena, przebieg, kolor,... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 17
47 Wyszukiwanie sterowane dialogiem Gdy użytkownik nie uwzględnił w swoim zapytaniu wszystkich kryteriów nakładanych na istotne metadane (atrybuty modelu), a wyników jest na tyle dużo, że warto doprecyzować zapytanie, system może przed wykonaniem wyszukiwania automatycznie wygenerować pytania uszczegóławiające. Przykład modelu oferty sprzedaży samochodów: producent Audi, Fiat,... model zależny od producenta: A4, A6, A8, TT,... rok produkcji, cena, przebieg, kolor,... Zapytanie: Audi za mniej niż złotych. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 17
48 Wyszukiwanie sterowane dialogiem Gdy użytkownik nie uwzględnił w swoim zapytaniu wszystkich kryteriów nakładanych na istotne metadane (atrybuty modelu), a wyników jest na tyle dużo, że warto doprecyzować zapytanie, system może przed wykonaniem wyszukiwania automatycznie wygenerować pytania uszczegóławiające. Przykład modelu oferty sprzedaży samochodów: producent Audi, Fiat,... model zależny od producenta: A4, A6, A8, TT,... rok produkcji, cena, przebieg, kolor,... Zapytanie: Audi za mniej niż złotych. Formularz umożliwiający doprecyzowanie kryteriów zawierający pytania zwrotne bazujące na zindeksowanych dokumentach: jaki model? A4, A6, A8? (bo nie ma TT w tej cenie), jaki rok produkcji? jaki przebieg? mniej niż 100K, 100K-200K, powyżej 200K? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 17
49 Filtrowanie wyników Na podobnej zasadzie mogą zostać udostępnione filtry umożliwiające zawężanie listy wyników już zwróconej po wykonaniu zapytania. Korzyść w porównaniu z wielokrotnym wypełnianiem formularza: dynamiczna, aktualna informacja o liczbie wyników w danej klasie, możliwość wyeliminowania pustych odpowiedzi brak zgadywania. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 18
50 Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees) to technika ułatwiająca interaktywną diagnozę trudnych do zdefiniowania problemów. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 19
51 Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees) to technika ułatwiająca interaktywną diagnozę trudnych do zdefiniowania problemów. Drzewo jest grafem wyborów prowadzących do rozwiązania problemu: każdy węzeł w drzewie wyboru (miejsce rozgałęzienia) składa się z pytania i możliwych odpowiedzi, odpowiedzi mogą prowadzić do dalszych wyborów (czyli pytań) lub w końcu do rozwiązań. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 19
52 Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees) to technika ułatwiająca interaktywną diagnozę trudnych do zdefiniowania problemów. Drzewo jest grafem wyborów prowadzących do rozwiązania problemu: każdy węzeł w drzewie wyboru (miejsce rozgałęzienia) składa się z pytania i możliwych odpowiedzi, odpowiedzi mogą prowadzić do dalszych wyborów (czyli pytań) lub w końcu do rozwiązań. Jak to działa? udzielenie odpowiedzi powoduje ustalenie wartości określonych atrybutów zapytania (jak dla wyszukiwarki zaawansowanej), już ustalone wartości mogą być dostępne jako parametry kolejnych zapytań, jeśli dialog nie doprowadzi do uzyskania rozwiązania, użytkownik może zwykle posłużyć się standardowym wyszukiwaniem. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 19
53 Drzewa decyzyjne zastosowania i dodatkowe możliwości Zastosowanie: szczególnie do rozwiązywania problemów wymagających diagnostyki: w centrach obsługi klienta (call center, contact center), serwisach, innych specjalistycznych zastosowaniach wymagających samoobsługi. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 20
54 Drzewa decyzyjne zastosowania i dodatkowe możliwości Zastosowanie: szczególnie do rozwiązywania problemów wymagających diagnostyki: w centrach obsługi klienta (call center, contact center), serwisach, innych specjalistycznych zastosowaniach wymagających samoobsługi. Dodatkowe możliwości drzew decyzyjnych: narzędzia graficzne do budowy drzew, wielojęzyczność na poziomie węzła, ścieżki zależne od roli/grupy użytkownika, odpowiedzi domyślne. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 20
55 Drzewa decyzyjne przykład środowiska graficznego Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 21
56 Interfejs użytkownika wyszukiwarki Złote rady z notatnika projektanta interfejsu: 1 Najważniejsza jest łatwość użycia: żaden system podpowiedzi nie zastąpi intuicji użytkownika, który chciałby od razu móc wyszukiwać, warto zainwestować w grafika, warto przeprowadzić testy użyteczności ekranów (okna zapytania i listy wyników). 2 Każdemu według potrzeb: zdecydowana większość zapytań ma nie więcej niż 3 słowa, a tylko 5% z nich używa operatorów, ale: zaawansowani użytkownicy mogą potrzebować więcej, więc nie można rezygnować z wyszukiwania zaawansowanego. 3 Metadane: włącz najważniejsze z nich (np. typ/format dokumentu) nawet do najprostszego formularza wyszukiwania, nie przeładuj metadanymi pojedynczego wyniku. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 22
57 Z notatnika projektanta interfejsu 4 Postać listy wyników: dołącz nagłówek: czego szukano, ile wyników, podpowiedzi pisowni itd., ogranicz widok podstawowy do najważniejszych metadanych, podawaj zawsze rozmiar dokumentu oryginalnego (by ostrzec przed otwieraniem dużych dokumentów); jeśli wynikiem są multimedia, dołącz odtwarzacz, użyj kontekstu z podświetlonymi elementami zapytania, by zawsze było jasne, dlaczego właśnie ten wynik znalazł się na liście, zapewnij sortowanie, stronicowanie, grupowanie, filtrowanie wyników. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 23
58 Z notatnika projektanta interfejsu 5 Mniej często znaczy więcej: pokaż różne aspekty danych już na pierwszej stronie nie zwiększając ich ilości, lecz dodatkowo je kategoryzując, ułatw wyszukiwanie w już zwróconych wynikach, używaj zakładek i filtrów do ograniczania zakresu wyszukiwania, utrzymanie taksonomii kosztuje, ale korzystanie z niej jest dobrze odbierane przez użytkowników. 6 Nie przesadzaj z wodotryskami: drzewo hiperboliczne jest dobre na demo, ale czy sprawdza się w codziennej pracy? jeden nowy komponent odkrywający nieoczywiste związki między danymi zawsze się obroni (ciekawy filtr metadanych, sensowne linki kontekstowe,...) 7 Nie martw się malkontentami używania każdego interfejsu, nawet najlepiej przetestowanego i najbardziej intuicyjnego, użytkownicy będą się musieli nauczyć. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 24
59 Wydajność i dostępność wyszukiwania (i innych) Dwie podstawowe metody zwiększenia wydajności i dostępności: Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 25
60 Wydajność i dostępność wyszukiwania (i innych) Dwie podstawowe metody zwiększenia wydajności i dostępności: 1 zrównoleglenie instalacji, 2 jej rozdzielenie na moduły (np. modułu aktualizacji indeksu od zwracania wyników, podział indeksu na części...) Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 25
61 Wydajność i dostępność wyszukiwania (i innych) Dwie podstawowe metody zwiększenia wydajności i dostępności: 1 zrównoleglenie instalacji, 2 jej rozdzielenie na moduły (np. modułu aktualizacji indeksu od zwracania wyników, podział indeksu na części...) Ważne: zapewnienie stuprocentowej dostępności systemu jest praktycznie niemożliwe, a każde podwyższenie jej o jedno miejsce po przecinku (np. z 99% do 99,9%) generuje koszty o jeden rząd wielkości wyższe w stosunku do poniesionych poprzednio, przed rozpoczęciem podnoszenia wydajności zawsze rozważa się stosunek kosztów jej wprowadzenia do strat związanych z obniżoną wydajnością. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 25
62 Wydajność i dostępność wyszukiwania (i innych) Dwie podstawowe metody zwiększenia wydajności i dostępności: 1 zrównoleglenie instalacji, 2 jej rozdzielenie na moduły (np. modułu aktualizacji indeksu od zwracania wyników, podział indeksu na części...) Ważne: zapewnienie stuprocentowej dostępności systemu jest praktycznie niemożliwe, a każde podwyższenie jej o jedno miejsce po przecinku (np. z 99% do 99,9%) generuje koszty o jeden rząd wielkości wyższe w stosunku do poniesionych poprzednio, przed rozpoczęciem podnoszenia wydajności zawsze rozważa się stosunek kosztów jej wprowadzenia do strat związanych z obniżoną wydajnością. Inna ważna zasada projektowania bezpieczeństwa: nie przesadzać, podwyższając koszty rozwiązania obsługującego nierealistyczne zagrożenia. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 25
63 Wyszukiwanie a ochrona danych Dwa podstawowe rozwiązania zapewniające kontrolę wyświetlania wyników: 1 indeksowanie treści wraz z prawami dostępu (ang. early binding) niedozwolone dokumenty nie trafiają w ogóle na listę wyników, 2 wymuszanie praw na etapie dostępu do zasobu (ang. late binding): a b wyświetlanie wszystkich dokumentów na liście wyników, sprawdzenie uprawnień przy próbie dostępu, usuwanie niedozwolonych dokumentów z listy wyników jeszcze przed jej wyświetleniem. 3 oba naraz! Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 26
64 Konsekwencje ochrony danych Konsekwencje: 1 szybkość (weryfikacja dostępu jest czasochłonna, warto ją robić offline), ale każda zmiana praw dostępu skutkuje zmianami w indeksie, co bywa czasochłonne! może istnieć moment, gdy użytkownik może uzyskać dostęp do dokumentu, do którego nie ma praw bo w indeksie jeszcze się nie zmieniło... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 27
65 Konsekwencje ochrony danych Konsekwencje: 1 szybkość (weryfikacja dostępu jest czasochłonna, warto ją robić offline), ale każda zmiana praw dostępu skutkuje zmianami w indeksie, co bywa czasochłonne! może istnieć moment, gdy użytkownik może uzyskać dostęp do dokumentu, do którego nie ma praw bo w indeksie jeszcze się nie zmieniło... 2 rzeczywiste odzwierciedlenie najświeższych praw dostępu, indekser niezależny od komponentu autoryzacyjnego, ale wcześniejsze uwzględnienie praw mogłoby zmniejszyć porcję indeksu do przejrzenia... a b wydaje się najbezpieczniejsze, ale czy chcemy pozwolić Kowalskiemu na znalezienie dokumentu Wypowiedzenie-Kowalski-1-lutego.doc? świetny pomysł, ale często trzeba jeszcze czyścić listy dokumentów powiązanych, przeliczać liczby wyników... co z podpowiedziami? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 27
66 Typowe problemy wyszukiwania (i ich rozwiązania) Dlaczego nie mogę znaleźć tego, czego szukam? Rady dla użytkownika: może zrobiłem literówkę? użyłem synonimu? użyłem zbyt ogólnego zapytania? użyłem zbyt szczegółowego zapytania? problem z językiem? nie mam uprawnień do wyświetlenia wyników? Rady dla administratora: analizuj logi: jakiego rodzaju zapytania pojawiały się najczęściej? jakie błędy użytkownicy popełniali najczęściej? jakiego rodzaju zapytania nie zwróciły wyników? dodaj moduły, które mogą pomóc użytkownikom. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 28
67 Jak wybrać najlepsze narzędzie wyszukiwawcze? Trzy podstawowe typy systemów wyszukiwawczych: programowe, sprzętowe (ang. search appliances), zdalne (ang. remote search services). Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 29
68 Jak wybrać najlepsze narzędzie wyszukiwawcze? Trzy podstawowe typy systemów wyszukiwawczych: programowe, sprzętowe (ang. search appliances), zdalne (ang. remote search services). Na czym nam właściwie zależy? jakie metody wyszukiwawcze? elastyczny interfejs, łatwo integrowalny z firmową witryną? tylko formularz i lista wyników, czy także API? dostępność wyników w formacie XML? jakie moduły? czy można łatwo doimplementować nowe? jakie źródła dokumentów? jaka szybkość, skalowalność, metody równoważenia obciążenia,... Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 29
69 Jak wybrać najlepsze narzędzie wyszukiwawcze? Trzy podstawowe typy systemów wyszukiwawczych: programowe, sprzętowe (ang. search appliances), zdalne (ang. remote search services). Na czym nam właściwie zależy? jakie metody wyszukiwawcze? elastyczny interfejs, łatwo integrowalny z firmową witryną? tylko formularz i lista wyników, czy także API? dostępność wyników w formacie XML? jakie moduły? czy można łatwo doimplementować nowe? jakie źródła dokumentów? jaka szybkość, skalowalność, metody równoważenia obciążenia,... Jak je porównać? zindeksować reprezentatywne źródła danych, porównać listy zindeksowanych dokumentów, porównać listy wyników dla danego zestawu zapytań testowych. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 29
70 Wdrożenie systemu wyszukiwawczego podejście ewolucyjne: na początek zindeksuj najważniejszy serwer, potem cały intranet, monitoruj, co robią użytkownicy i rozszerzaj zakres, pomyśl, co indeksować najlepiej wszystko, bo nie wiadomo, co przyda się użytkownikom, ale może dla uniknięcia śmietnika warto wybrać (stworzyć?) serwer zawierający najważniejsze informacje? rozsądne minimum: systemy plików, serwery sieciowe, archiwa mailowe, serwery wiki, systemy śledzenia błędów (bugzilla i spółka), artykuły portalowe, zawartość tekstową baz danych, dane programów specjalistycznych, o ile dostarczają właściwych interfejsów, przemyśl strategię aktualizacji indeksu co 5 minut czy w nocy? przesyłając dane do procesów indeksujących (push) czy pozwalając na ich niezależne ściąganie (pull)? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 30
71 Utrzymanie systemu wyszukiwawczego Ważne pytania: czy jest możliwe usuwanie treści z indeksu? jak to zrobić? jak indeksowana jest nowa treść? jak aktualizuje się indeks? jak system radzi sobie z problemami technicznymi (np. odwołaniami do nieosiągalnych źródeł zewnętrznych)? jak zmiany w taksonomii wpływają na działanie i aktualność systemu? czy można (i jak) dodawać nowe metadane? nowe typy dokumentów? czy to wymaga przebudowy indeksu? zmiany interfejsu? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 31
72 Utrzymanie systemu wyszukiwawczego Ważne pytania: czy jest możliwe usuwanie treści z indeksu? jak to zrobić? jak indeksowana jest nowa treść? jak aktualizuje się indeks? jak system radzi sobie z problemami technicznymi (np. odwołaniami do nieosiągalnych źródeł zewnętrznych)? jak zmiany w taksonomii wpływają na działanie i aktualność systemu? czy można (i jak) dodawać nowe metadane? nowe typy dokumentów? czy to wymaga przebudowy indeksu? zmiany interfejsu? Uwaga: zmiany w modelu są operacją potencjalnie kosztowną aby nowe atrybuty i wartości mogły zostać uwzględnione w wyszukiwaniu, trzeba przeindeksować całe repozytorium! Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 31
73 Skalowanie wyszukiwania Ważne pytania: czy temat w ogóle nas dotyczy? jak szybko zwiększa się liczba naszych dokumentów? jak szybko przyrasta liczba zapytań? jakie możliwości skalowania oferuje system wyszukiwawczy? wyłącznie poprzez zakup wydajniejszego sprzętu? poprzez rozdzielenie modułów na różne maszyny? poprzez równoważenie obciążenia poszczególnych modułów przez wiele maszyn które procesy (indeksowanie, wyszukiwanie)? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 32
74 Studium przypadku Ośrodek Studiów Wschodnich OSW to polski sztab analityków monitorujących sytuację polityczną, ekonomiczną i społeczną w państwach wschodnich. Główne założenia dla systemu: ułatwienie przeszukiwania wielojęzycznej bazy dokumentów (co najmniej: PL, EN, DE, RU, UA), spójne udostępnienie różnorodnych źródeł danych (dokumenty własne, serwisy informacyjne, portale o tematyce wschodniej), możliwość uzyskiwania odpowiedzi w ciągu kilku sekund, użycie narzędzi lingwistycznych i zaawansowanych technik wyszukiwawczych, wyszukiwarka dostępna z poziomu przeglądarki WWW z portletowym GUI, możliwości personalizacyjne, system praw dostępu. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 33
75 Studium przypadku Ośrodek Studiów Wschodnich Efekt: integracja różnych źródeł danych w pojedyncze repozytorium, dwa tryby dodawania dokumentów: ręczny, w miarę ich tworzenia przez analityków, z poziomu formularza WWW, automatyczny, na zasadzie cyklicznego importu danych z polskich, rosyjskich oraz ukraińskich serwisów informacyjnych. model danych: specyfika typów dokumentów, wielojęzyczne transkrypcje nazw (np. wyszukiwanie dokumentów z nazwiskiem zwróci dokumenty, w których zapisano je jako Medvedev czy Miedwiediew), wielojęzyczne synonimy (wyszukiwanie bezrobocie w Polsce znajdzie dokument zawierający unemployment in Poland ), wyszukiwanie pełnotekstowe z fleksją: zintegrowane stemmery dla polskiego, angielskiego, rosyjskiego i niemieckiego, Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 33
76 Studium przypadku Ośrodek Studiów Wschodnich Efekt: zadawanie zapytań: w języku naturalnym (w składni podobnej do Google ), z poziomu formularza metadanych, filtrowanie listy wyników w celu jej ograniczenia do wybranych regionów, języków, dat oraz niektórych innych ważnych własności dokumentów, podgląd dokumentów w formacie HTML: zautomatyzowany konwerter z ok. 200 popularnych formatów. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 33
77 Interfejs systemu Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 34
78 Miało nie być o Google u, ale przykazań Google a odnośnie wyszukiwania korporacyjnego: 1 Poprawiaj zadowolenie użytkowników jeśli wyszukiwarka pomoże im w pracy, nie będą pamiętać, ile kosztowała. Pytaj użytkowników, co jeszcze możesz dla nich zrobić. 2 Przyspieszaj wyszukiwanie łatwość zadawania zapytań i szybkość pozyskania wyniku zachęcają do użycia wyszukiwarki. 3 Promuj wyszukiwanie staraj się, by pole zapytania było wszechobecne, dostępne na każdej stronie serwisu intranetowego firmy oraz zawsze także na liście wyników, zachęcając do użycia wyszukiwarki i precyzowania kryteriów zapytania. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 35
79 Miało nie być o Google u, ale przykazań Google a odnośnie wyszukiwania korporacyjnego: 4 Odchudź strony zapytania i wyników niech główna strona zapytania pozostanie prosta. Przenieś dodatkowe opcje na inną stronę, ogranicz do minimum niezwiązane z wyszukiwaniem komponenty nawigacyjne na stronie wyników. 5 Indeksuj jak najwięcej użytkownicy zwykle nie znajdują ważnego dokumentu, którego szukają, bo nie trafił do indeksu. 6 Nie zapominaj o wielości typów dokumentów oprócz HTML-i indeksuj również PDF-y, dokumenty MS Office,... 7 Publikuj, publikuj, publikuj zachęć użytkowników do zapisywania dokumentów w indeksowalnych repozytoriach choćby na dysku sieciowym, a nie na własnych komputerach. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 35
80 Miało nie być o Google u, ale przykazań Google a odnośnie wyszukiwania korporacyjnego: 8 Nie bój się indeksowania dokumentów zastrzeżonych użyj mechanizmów autentykacyjnych do ich ochrony, ale jednocześnie staraj się pokazać użytkownikom, jaka informacja jest w ogóle dostępna. 9 Przetestuj zindeksowaną treść spróbuj wyszukać ważne lub reprezentatywne dokumenty. Zachęć użytkowników do testowania wyszukiwarki. 10 Mierz korzyści i patrz w przyszłość! Monitoruj ustalone wskaźniki średnią liczbę wyszukiwań na jednego użytkownika lub jedną dobę, by wiedzieć, jak zmienia się zaufanie do narzędzia. Postaraj się, by wybrane rozwiązanie było skalowalne. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 35
81 Sesja w Sejmie Najbliższy wykład zaplanowany jest jako sesja wyjazdowa. Wraz z p. Władysławem Bakszą, Naczelnikiem Wydziału Edycji Tekstów, postaramy się zaprezentować XML-owy system zarządzania tekstami legislacyjnymi wdrożony w Biurze Legislacyjnym Kancelarii Sejmu. Plan działań: 1 do środy 13 I można się jeszcze zgłaszać (i wycofywać), 2 14 I spotykamy się o w Biurze Przepustek na Wiejskiej (wejście od Górnośląskiej bramą przy poczcie) z dokumentami tożsamości, 3 kończymy najpóźniej o 17.45, żeby zainteresowani zdążyli jeszcze na ćwiczenia. Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 36
82 Jak dojechać? Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 37
XML i nowoczesne metody zarządzania treścią
XML i nowoczesne metody zarządzania treścią Wykład 13: Wyszukiwanie informacji Maciej Ogrodniczuk MIMUW, 9 stycznia 2011 Wykład 13: Wyszukiwanie informacji XML i nowoczesne metody zarządzania treścią 1
Instrukcja obsługi Zaplecza epk w zakresie zarządzania tłumaczeniami opisów procedur, publikacji oraz poradników przedsiębiorcy
Instrukcja obsługi Zaplecza epk w zakresie zarządzania tłumaczeniami opisów procedur, publikacji oraz poradników przedsiębiorcy Spis treści: 1 WSTĘP... 3 2 DOSTĘP DO SYSTEMU... 3 3 OPIS OGÓLNY SEKCJI TŁUMACZENIA...
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy
Załącznik nr 1. Specyfikacja techniczna portalu internetowego Łódź, 15.10.2012 r.
Załącznik nr 1. Specyfikacja techniczna portalu internetowego Łódź, 15.10.2012 r. Stworzenie platformy internetowej na potrzeby projektu. 1 Wykonanie portalu internetowego na potrzeby e-usługi, obejmującego
REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką
REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką Autor: Paweł Konieczny Promotor: dr Jadwigi Bakonyi Kategorie: aplikacja www Słowa kluczowe: Serwis
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
E-czeki - zakładanie listy odbiorców, raport uprawnień (Bankowość Elektroniczna dla Klientów Korporacyjnych Getin Noble Bank SA)
E-czeki - zakładanie listy odbiorców, raport uprawnień (Bankowość Elektroniczna dla Klientów Korporacyjnych Getin Noble Bank SA) Spis treści Wstęp... 1 I Lista odbiorców e-czeków... 2 1. Lista odbiorców
Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite
Tomasz Boiński: 1 Pozycjonowanie stron i zastosowanie mod_rewrite Pozycjonowanie stron Promocja strony odbywa się poprzez umiejscowienie jej jak najwyżej w wynikach wyszukiwania Wyszukiwarki indeksują
W dalszej części dokumentu przedstawiamy skrócony opis kluczowych funkcji systemu. Niniejszy dokument nie zawiera opisu technicznego systemu.
1. Informacje Podstawowe Mediamanager 2.1 jest systemem wspierającym zarządzanie dokumentami elektronicznymi. Podstawowymi funkcjami realizowanymi przez oprogramowanie jest przetrzymywanie, zarządzanie
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy
Przewodnik użytkownika (instrukcja) AutoMagicTest
Przewodnik użytkownika (instrukcja) AutoMagicTest 0.1.21.137 1. Wprowadzenie Aplikacja AutoMagicTest to aplikacja wspierająca testerów w testowaniu i kontrolowaniu jakości stron poprzez ich analizę. Aplikacja
SYSTEM EZD v. 3.16.26.0
SYSTEM EZD v. 3.16.26.0 1. Dodano możliwość zablokowania zmiany rocznika w rejestracji sprawy W ustawieniach administracyjnych wykorzystując nowa opcję: można globalnie ustawić możliwość zakładania sprawy:
OMNITRACKER Wersja testowa. Szybki przewodnik instalacji
OMNITRACKER Wersja testowa Szybki przewodnik instalacji 1 Krok 1:Rejestracja pobrania (jeżeli nie wykonana dotychczas) Proszę dokonać rejestracji na stronieomninet (www.omnitracker.com) pod Contact. Po
OMNITRACKER Wersja testowa. Szybki przewodnik instalacji
OMNITRACKER Wersja testowa Szybki przewodnik instalacji 1 Krok 1:Rejestracja pobrania (jeżeli nie wykonana dotychczas) Proszę dokonać rejestracji na stronieomninet (www.omnitracker.com) pod Contact. Po
POZYCJONOWANIE STRONY SKLEPU
. Wszystko O Pozycjonowaniu I Marketingu. >>>POZYCJONOWANIE STRON LEGNICA POZYCJONOWANIE STRONY SKLEPU >>>WIĘCEJ
Pomoc. BIP strona portalu
Pomoc BIP strona portalu Biuletyn Informacji Publicznej powstał w celu powszechnego udostępnienia informacji publicznej w postaci elektronicznej. Głównym zadaniem portalu jest przekazywanie informacji
Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6
Zawartość Wstęp... 1 Instalacja... 2 Konfiguracja... 2 Uruchomienie i praca z raportem... 6 Wstęp Rozwiązanie przygotowane z myślą o użytkownikach którzy potrzebują narzędzie do podziału, rozkładu, rozbiórki
ECDL/ICDL Zarządzanie projektami Moduł S5 Sylabus - wersja 1.0
ECDL/ICDL Zarządzanie projektami Moduł S5 Sylabus - wersja 1.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Zarządzanie projektami. Sylabus opisuje zakres wiedzy
Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.
STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów
Deduplikacja danych. Zarządzanie jakością danych podstawowych
Deduplikacja danych Zarządzanie jakością danych podstawowych normalizacja i standaryzacja adresów standaryzacja i walidacja identyfikatorów podstawowa standaryzacja nazw firm deduplikacja danych Deduplication
ERGODESIGN - Podręcznik użytkownika. Wersja 1.0 Warszawa 2010
ERGODESIGN - Podręcznik użytkownika Wersja 1.0 Warszawa 2010 Spis treści Wstęp...3 Organizacja menu nawigacja...3 Górne menu nawigacyjne...3 Lewe menu robocze...4 Przestrzeń robocza...5 Stopka...5 Obsługa
POMOC. 1. Wybór Katalogu
Bibliografia Regionalna obejmuje książki i czasopisma lokalne zawierające wszelkie wiadomości na temat Woli. Gromadzone informacje dotyczą najczęściej takich zagadnień jak życie społeczne, inwestycje,
Nowe funkcje w programie SYMFONIA Faktura Premium w wersji 2009
SYMFONIA Faktura Premium Strona 1 Nowe funkcje w programie SYMFONIA Faktura Premium w wersji 2009 Dodatkowe pola tekstowe w danych kontrahenta i towaru W celu umożliwienia użytkownikom przechowywania dodatkowych
Ogólnopolskie Repozytorium Prac Dyplomowych
Ogólnopolskie Repozytorium Prac Dyplomowych System Informacji o Szkolnictwie Wyższym POL-on Podręcznik użytkownika Spis treści 1.Logowanie do systemu oraz role w ORPD... 3 1.1.Jak założyć konto w systemie
Co nowego w programie GM EPC
Co nowego w programie GM EPC Nawigacja graficzna Program GM EPC następnej generacji posiada szereg nowych funkcji, dzięki którym wyszukiwanie właściwej części jest szybsze i łatwiejsze. Aby uzyskać szczegółowe
Biblioteka Wirtualnej Nauki
Biblioteka Wirtualnej Nauki BAZA SCOPUS Scopus jest największą na świecie bibliograficzną bazą abstraktów i cytowań recenzowanej literatury naukowej, wyposażoną w narzędzia bibliometryczne do śledzenia,
INSTRUKCJA EDYCJI PROFILU OSOBOWEGO W SERWISIE WWW.UMCS.PL
INSTRUKCJA EDYCJI PROFILU OSOBOWEGO W SERWISIE WWW.UMCS.PL Lublin, 16 stycznia 2014 r. 1. Logowanie do systemu Aby rozpocząć edycję profilu osobowego wejdź na stronę główną www.umcs.pl w zakładkę Jednostki
Wyszukiwanie plików w systemie Windows
1 (Pobrane z slow7.pl) Bardzo często pracując na komputerze prędzej czy później łapiemy się na pytaniu - Gdzie jest ten plik? Zapisujemy i pobieramy masę plików i w nawale pracy pewne czynności są wykonywane
Indeksowanie full text search w chmurze
Prezentacja przygotowana dla: 5. Konferencja MIC w Poznaniu, 16.06.20111 Lucene.NET Indeksowanie full text search w chmurze K2 i Windows Azure dlaczego dla nas to możliwe? 1. Mamy unikalne połącznie kompetencji
Praca dyplomowa. Program do monitorowania i diagnostyki działania sieci CAN. Temat pracy: Temat Gdańsk Autor: Łukasz Olejarz
Temat Gdańsk 30.06.2006 1 Praca dyplomowa Temat pracy: Program do monitorowania i diagnostyki działania sieci CAN. Autor: Łukasz Olejarz Opiekun: dr inż. M. Porzeziński Recenzent: dr inż. J. Zawalich Gdańsk
WPROWADZENIE WYSZUKIWANIE OGŁOSZEŃ
WPROWADZENIE 1. Cel dokumentu Celem dokumentu jest: Zapoznanie internauty z funkcjonalnością realizowaną przez Bazę Konkurencyjności. Dostarczenie szczegółowych informacji na temat podstron, które znajdują
I. Interfejs użytkownika.
Ćwiczenia z użytkowania systemu MFG/PRO 1 I. Interfejs użytkownika. MFG/PRO w wersji eb2 umożliwia wybór użytkownikowi jednego z trzech dostępnych interfejsów graficznych: a) tekstowego (wybór z menu:
Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych:
Nabór CKU Przeglądanie oferty i rejestracja kandydata Informacje ogólne Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych: Internet Explorer wersja
Załącznik techniczny przedmiotu zamówienia komponentu
Załącznik nr 1 mapowego dla portalu WWW Załącznik techniczny przedmiotu zamówienia komponentu 1.1 Komponent mapowy Zleceniodawcy pozostawia się wolną rękę w wyborze technologii w jakiej zostanie stworzony
MATERIAŁY DYDAKTYCZNE. Streszczenie: Z G Łukasz Próchnicki NIP w ramach projektu nr RPMA /15
MATERIAŁY DYDAKTYCZNE w ramach projektu nr RPMA.10.01.01-14-3849/15 Streszczenie: Aktywności platformy Moodle Zadania, opcje dziennika NIP 799-174-10-88 Spis treści 1. Zadania... 2 2. Ocenianie... 6 3.
Instrukcja erejestracji Kliniki Nova.
Instrukcja erejestracji Kliniki Nova. 1. Opis funkcji systemu erejestracji: 1.1 użytkownik nie zalogowany. Wyszukiwanie wizyt. 1. Zakładka Wyszukiwanie pozwala na przeszukiwanie dostępnych wizyt. 2. Poprzez
Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych:
Rejestracja- MDK Przeglądanie oferty i rejestracja kandydata Informacje ogólne Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych: Internet Explorer
Włącz autopilota w zabezpieczeniach IT
Włącz autopilota w zabezpieczeniach IT POLICY MANAGER Scentralizowanie zarządzania zabezpieczeniami jest dużo łatwiejsze F-Fecure Policy Manager zapewnia narzędzia umożliwiające zautomatyzowanie większości
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Spis treści. I. Czym jest Indeks Haseł 3 II. Wyszukiwanie hasła 4. 1) Alfabetyczna lista haseł 4 2) Wyszukiwarka haseł 4 3) Grupy haseł 6
Spis treści I. Czym jest Indeks Haseł 3 II. Wyszukiwanie hasła 4 1) Alfabetyczna lista haseł 4 2) Wyszukiwarka haseł 4 3) Grupy haseł 6 III. Dokumenty powiązane z wybranym hasłem 7 IV. Moje hasła 10 1)
Seeon Enterprise Search Engine. Rozwiązanie obsługiwane przez eo Networks S.A.
Seeon Enterprise Search Engine Rozwiązanie obsługiwane przez eo Networks S.A. Seeon Enterprise Search Engine SeeOn Search Engine to kompleksowy, w pełni gotowy do wdrożenia silnik wyszukiwania dedykowany
MATERIAŁY DYDAKTYCZNE. Streszczenie: Z G Łukasz Próchnicki NIP w ramach projektu nr RPMA /15
MATERIAŁY DYDAKTYCZNE w ramach projektu nr RPMA.10.01.01-14-3849/15 Streszczenie: Aktywności platformy Moodle Wiki, Opinia zwrotna NIP 799-174-10-88 Spis treści 1. Wiki... 2 2. Opinia zwrotna... 5 str.
Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych:
Nabór CKU Przeglądanie oferty i rejestracja kandydata Informacje ogólne Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych: Internet Explorer wersja
Sylabus Moduł 2: Przetwarzanie tekstów
Sylabus Moduł 2: Przetwarzanie tekstów Niniejsze opracowanie przeznaczone jest dla osób zamierzających zdać egzamin ECDL (European Computer Driving Licence) na poziomie podstawowym. Publikacja zawiera
RFP. Wymagania dla projektu. sklepu internetowego B2C dla firmy Oplot
RFP Wymagania dla projektu sklepu internetowego B2C dla firmy Oplot CEL DOKUMENTU Celem niniejszego dokumentu jest przedstawienie wymagań technicznych i funkcjonalnych wobec realizacji projektu budowy
5. Praca z klasą. Dodawanie materiałów i plików. Etykieta tematu. Rozdział 5 Praca z klasą
5. Praca z klasą Jako prowadzący i nauczyciel mamy bardzo duże możliwości, jeżeli chodzi o zamieszczanie i korzystanie z materiałów na platformie e-learningowej. Wykładowca w pierwszej kolejności musi
Podręcznik użytkownika Publikujący aplikacji Wykaz2
Podręcznik użytkownika Publikujący aplikacji Wykaz2 TiMSI Sp z o o ul Czapli 63, 02-781 Warszawa tel : +48 22 644 86 76, fax: +48 22 644 78 52 NIP: 951-19-39-800 Sąd Rejonowy dla mst Warszawy w Warszawie,
Win Admin Replikator Instrukcja Obsługi
Win Admin Replikator Instrukcja Obsługi Monitoring Kopie danych (backup) E-mail Harmonogram lokalne i zewnętrzne repozytorium Logi Pamięć Procesor HDD Administracja sprzętem i oprogramowaniem (automatyzacja
Dziennik Urzędowy Unii Europejskiej L 274/9
20.10.2009 Dziennik Urzędowy Unii Europejskiej L 274/9 ROZPORZĄDZENIE KOMISJI (WE) NR 976/2009 z dnia 19 października 2009 r. w sprawie wykonania dyrektywy 2007/2/WE Parlamentu Europejskiego i Rady w zakresie
Biblioteka Wirtualnej Nauki
Biblioteka Wirtualnej Nauki BAZA EBSCO EBSCO Publishing oferuje użytkownikom w Polsce dostęp online do pakietu podstawowego baz danych w ramach projektu Electronic Information for Libraries Direct eifl
Instrukcja użytkownika. Aplikacja Smart Paczka DPD
Instrukcja użytkownika Aplikacja Smart Paczka DPD Instrukcja użytkownika Aplikacja Smart Paczka DPD Wersja 2.0 Warszawa, Wrzesień 2015 Strona 2 z 9 Instrukcja użytkownika Aplikacja Smart Paczka DPD Spis
Nowe funkcje w programie SYMFONIA Handel Premium w wersji 2009
SYMFONIA Handel Premium Strona 1 z 7 Nowe funkcje w programie SYMFONIA Handel Premium w wersji 2009 Dodatkowa ochrona dostępu do przeglądania cen zakupu towarów Duża grupa użytkowników programu zgłaszała
ZARZĄDZANIE DOKUMENTACJĄ. Tomasz Jarmuszczak PCC Polska
ZARZĄDZANIE DOKUMENTACJĄ Tomasz Jarmuszczak PCC Polska Problemy z zarządzaniem dokumentacją Jak znaleźć potrzebny dokument? Gdzie znaleźć wcześniejszą wersję? Która wersja jest właściwa? Czy projekt został
Nabór Bursy/CKU. Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych:
Nabór Bursy/CKU Przeglądanie oferty i rejestracja kandydata Informacje ogólne Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych: Internet Explorer
Planowanie przestrzenne
Planowanie przestrzenne Powszechny, szybki dostęp do pełnej i aktualnej informacji planistycznej jest niezbędny w realizacji wielu zadań administracji publicznej. Digitalizacja zbioru danych planistycznych
Tajemnice skutecznego wyszukiwania na przykładzie
Tajemnice skutecznego wyszukiwania na przykładzie Przeglądarka program otwierający wrota Internetu Wyszukiwarka a przeglądarka Wyszukiwarka program pozwalający wyszukiwać linki do stron WWW Kilka podstawowych
Spis treści. Warto zapamiętać...2. Podstawy...3
Spis treści Warto zapamiętać...2 Podstawy...3 Moduły:...12 Aktualności...12 Fotogaleria i galeria wideo...13 Download...15 Przekierowanie...16 Formularz...17 Katalog produktów...18 Komponenty...18 Pokaz
Przewodnik użytkownika (instrukcja) AutoMagicTest
Przewodnik użytkownika (instrukcja) AutoMagicTest 0.2.1.173 1. Wprowadzenie Aplikacja AutoMagicTest to aplikacja wspierająca testerów w testowaniu i kontrolowaniu jakości stron poprzez ich analizę. Aplikacja
ECDL ZARZĄDZANIE PROJEKTAMI
ECDL ZARZĄDZANIE PROJEKTAMI EUROPEJSKI CERTYFIKAT UMIEJĘTNOŚCI KOMPUTEROWYCH ZARZĄDZANIE PROJEKTAMI Syllabus v. 1.0 Oficjalna wersja dokumentu jest dostępna w serwisie WWW Polskiego Biura ECDL www.ecdl.pl
ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 5.0
ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 5.0 Przeznaczenie sylabusa Dokument ten zawiera szczegółowy sylabus dla modułu ECDL/ICDL Przetwarzanie tekstów. Sylabus opisuje zakres wiedzy i
Nowe funkcje w programie SYMFONIA Handel Premium w wersji 2009.c
SYMFONIA Handel Premium Strona 1 Nowe funkcje w programie SYMFONIA Handel Premium w wersji 2009.c Zmiany związane z nowelizacją Ustawy o VAT Z dniem 1 grudnia 2008r. weszła w życie nowelizacja ustawy o
Instalacja SQL Server Express. Logowanie na stronie Microsoftu
Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy
Nowe funkcje w programie Symfonia Mała Księgowość
Symfonia Mała Księgowość 1 / 6 Symfonia Mała Księgowość Spis treści: Korzyści z zakupu nowej wersji 2 Symfonia Mała Księgowość w wersji 2011.1b 2 Nowe formularze deklaracji podatkowych 2 Eksport deklaracji
1. Zaloguj się do systemu UONET+ jako administrator i uruchom moduł Administrowanie.
UONET+ Co zrobić, gdy szkoła obsługiwana przez system UONET+ jest likwidowana? W poradzie opisano czynności, jakie należy wykonać w przypadku, gdy szkoła obsługiwana przez system UONET+ ulega likwidacji
WYMAGANIA EDUKACYJNE. Witryny i Aplikacje Internetowe klasa I
WYMAGANIA EDUKACYJNE Witryny i Aplikacje Internetowe klasa I Dopuszczający definiuje pojęcia: witryna, portal, wortal, struktura witryny internetowej; opisuje rodzaje grafiki statycznej wymienia i charakteryzuje
OPIS KRYTERIÓW PRZYZNAWANIA PUNKTÓW ZA MINIMALNE FUNKCJONALNOŚCI SYSTEMU
Załącznik nr 6 Nr postępowania: 6/ZK/10.1.3-R/2017 OPIS KRYTERIÓW PRZYZNAWANIA PUNKTÓW ZA MINIMALNE FUNKCJONALNOŚCI SYSTEMU (zgodnie z opisanymi w załączniku nr 5 minimalnymi funkcjonalnościami systemu)
Część I Rozpoczęcie pracy z usługami Reporting Services
Spis treści Podziękowania... xi Wprowadzenie... xiii Część I Rozpoczęcie pracy z usługami Reporting Services 1 Wprowadzenie do usług Reporting Services... 3 Platforma raportowania... 3 Cykl życia raportu...
Definiowanie filtrów IP
Definiowanie filtrów IP Spis treści 1. Klienci korporacyjni... 3 1.1. def3000/ceb... 3 2. Klienci detaliczni... 6 2.1. def2500/reb... 6 2 1. Klienci korporacyjni 1.1. def3000/ceb Dla każdego Klienta korporacyjnego,
Eksploracja danych a serwisy internetowe Przemysław KAZIENKO
Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Wydział Informatyki i Zarządzania Politechnika Wrocławska kazienko@pwr.wroc.pl Dlaczego eksploracja danych w serwisach internetowych? Kanały
Na komputerach z systemem Windows XP zdarzenia są rejestrowane w trzech następujących dziennikach: Dziennik aplikacji
Podgląd zdarzeń W systemie Windows XP zdarzenie to każde istotne wystąpienie w systemie lub programie, które wymaga powiadomienia użytkownika lub dodania wpisu do dziennika. Usługa Dziennik zdarzeń rejestruje
Przewodnik po serwisie INFORLEX.PL BIZNES
Przewodnik po serwisie INFORLEX.PL ...3 Nowe dokumenty w Serwisie Kalendarium...5 Wyszukiwanie tekstowe Wyniki wyszukiwania Precyzowanie wyników Sortowanie Wyszukiwanie zaawansowane Wyszukiwanie po identyfikatorze
!!!!!!!!!!! PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych. Autorzy: Marek Zachara
PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych Autorzy: Marek Zachara Opis merytoryczny Cel naukowy (jaki problem wnioskodawca podejmuje się rozwiązać, co jest jego istotą, co uzasadnia
Podręcznik użytkownika. Użytkownik niezalogowany
Podręcznik użytkownika Użytkownik niezalogowany 2011 1 2 Zawartość 1. Kategorie... 5 1.1. Wstęp... 5 2. Artykuły... 6 2.1. Widok artykułu... 6 3. Zamówienia publiczne... 9 3.1. Przeglądanie zamówieo publicznych...
Monitoring procesów z wykorzystaniem systemu ADONIS
Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management
Podręcznik Administratora Szkoły
Projekt systemowy 'Fascynujący Świat Nauki i Technologii' nr POKL.09.01.02-16-001/13 jest współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego. Projekt systemowy Fascynujący
Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej
Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej Geoportal Usługa portalu edukacyjnego Instrukcja użytkownika Historia zmian Wersja Data Kto Opis zmian 1.0 2014-05-27 Sygnity
Instrukcja przygotowania pliku do deponowania
Instrukcja przygotowania pliku do deponowania Etapy przygotowania pliku Przygotowanie pliku w formacie PDF Uzupełnienie metadanych w dokumencie Nadanie nazwy pliku PDF Format tekstowy pliku PDF Uporządkowanie
wersja 1.0 ośrodek komputerowy uj cm ul. mikołaja kopernika 7e, Kraków tel
S Y S T E M B A D A Ń A N K I E T O W Y C H wersja 1.0 uj cm, 31-034 Kraków tel. 12 422 99 63 Opis konfiguracji Tworzenie ankiety rozpoczynamy ikoną znajdującą się w prawym górnym rogu ekranu. Ilustracja
Ustalanie dostępu do plików - Windows XP Home/Professional
Ustalanie dostępu do plików - Windows XP Home/Professional Aby edytować atrybuty dostępu do plikow/ katalogow w systemie plików NTFS wpierw sprawdź czy jest Wyłączone proste udostępnianie czyli przejdź
Laboratorium Technologii Informacyjnych. Projektowanie Baz Danych
Laboratorium Technologii Informacyjnych Projektowanie Baz Danych Komputerowe bazy danych są obecne podstawowym narzędziem służącym przechowywaniu, przetwarzaniu i analizie danych. Gromadzone są dane w
Dokumentacja Użytkownika Systemu
Dokumentacja Użytkownika Systemu Integracja z Ceneo.pl Wersja 2016.3.2 Spis treści 1 INTEGRACJA... 3 2 REJESTRACJA NA CENEO.PL... 4 3 KONFIGURACJA Z SERWISEM CENEO.PL... 5 4 PRZYGOTOWANIE ASORTYMENTU...
ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 6.0
ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 6.0 Przeznaczenie sylabusa Dokument ten zawiera szczegółowy sylabus dla modułu ECDL/ICDL Przetwarzanie tekstów. Sylabus opisuje zakres wiedzy i
Podręcznik użytkownika Wprowadzający aplikacji Wykaz2
Podręcznik użytkownika Wprowadzający aplikacji Wykaz2 TiMSI Sp z o o ul Czapli 63, 02-781 Warszawa tel : +48 22 644 86 76, fax: +48 22 644 78 52 NIP: 951-19-39-800 Sąd Rejonowy dla mst Warszawy w Warszawie,
Propozycja standaryzacji usługi lokalizacji adresu
dr inż. Waldemar Izdebski 1,2 mgr inż. Andrzej Bielasty 2 Propozycja standaryzacji usługi lokalizacji adresu Numery adresowe są jednym z najprostszych elementów danych przestrzennych. Niemniej jednak są
Instrukcja użytkownika. systemu BIP
Instrukcja użytkownika systemu BIP SPIS TREŚCI 1. Informacje o biuletynie... 3 1.1. Mapa serwisu... 3 1.2. Redakcja biuletynu... 3 1.3. Słownik skrótów... 5 1.4. Historia zmian... 5 1.5. Statystyka odwiedzin...
Część 3 - Konfiguracja
Spis treści Część 3 - Konfiguracja... 3 Konfiguracja kont użytkowników... 4 Konfiguracja pól dodatkowych... 5 Konfiguracja kont email... 6 Konfiguracja szablonów dokumentów... 8 Konfiguracja czynności
Pojęcie systemu informacyjnego i informatycznego
BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego DANE wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. SYSTEM
Wnioski i dyspozycje elektroniczne. Instrukcja użytkownika systemu bankowości internetowej dla firm. BOŚBank24 iboss
BANK OCHRONY ŚRODOWISKA S.A. ul. Żelazna 32 / 00-832 Warszawa tel.: (+48 22) 850 87 35 faks: (+48 22) 850 88 91 e-mail: bos@bosbank.pl Instrukcja użytkownika systemu bankowości internetowej dla firm Wnioski
2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego
2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego produktu. 23 czerwca 2014 Spis treści 3 Spis treści...5
Netsprint Search. Koncepcja
Netsprint Search Koncepcja Netsprint - fakty 10-letnie doświadczenie Pierwsza firma, która wprowadziła silnik wyszukiwawczy w Polsce Pierwszy polski zaawansowany system reklamy kontekstowej (XI 2005) Pierwsze
Zapytania do bazy danych
Zapytania do bazy danych Tworzenie zapytań do bazy danych MS Access może być realizowane na dwa sposoby. Standard SQL (Stucture Query Language) lub QBE (Query by Example). Warto wiedzieć, że drugi ze sposobów
OPIS PRZEDMIOTU ZAMÓWIENIA
ZAPYTANIE OFERTOWE Poznań, 8 lutego 2017 r. Szanowni Państwo, Uniwersytet Przyrodniczy w Poznaniu zwraca się z uprzejmą prośbą o przesłanie oferty handlowej na wykonanie usługi opracowania, uruchomienia
Tytuły Wykonawcze. Opis systemu tworzenia dokumentacji TW-1
Tytuły Wykonawcze Opis systemu tworzenia dokumentacji TW-1 Program pozwala na tworzenie tytułów wykonawczych według Rozporządzenia Ministra Finansów z dnia 16 maja 2014 r. 1.Główne cechy systemu -ewidencja
Platforma e-learningowa
Dotyczy projektu nr WND-RPPD.04.01.00-20-002/11 pn. Wdrażanie elektronicznych usług dla ludności województwa podlaskiego część II, administracja samorządowa realizowanego w ramach Decyzji nr UDA- RPPD.04.01.00-20-002/11-00
Nabór Przedszkola. Jak złożyć wniosek o przyjęcie dziecka do przedszkola?
Nabór Przedszkola Jak złożyć wniosek o przyjęcie dziecka do przedszkola? Jeśli gmina prowadzi elektroniczną rekrutację do przedszkoli z wykorzystaniem systemu Nabór Przedszkola, to rodzic może zarejestrować
timetrack Przewodnik Użytkownika timetrack Najważniejsze Funkcje
timetrack Przewodnik Użytkownika timetrack jest łatwą w obsłudze aplikacją, stworzoną do rejestracji czasu. Pozwala ona na zapisywanie czasu spędzonego z klientami oraz podczas pracy nad projektami i zadaniami
Zarządzanie danymi przestrzennymi
Zarządzanie danymi przestrzennymi ERGO wykorzystuje technologię GIS typu Open Source zapewniającą otwartość, skalowalność oraz niskie koszty wdrożenia i utrzymania systemu. System zapewnia scentralizowane
Wiadomości. Instrukcja użytkownika systemu bankowości internetowej dla firm. BOŚBank24 iboss
BANK OCHRONY ŚRODOWISKA S.A. ul. Żelazna 32 / 00-832 Warszawa tel.: (+48 22) 850 87 35 faks: (+48 22) 850 88 91 e-mail: bos@bosbank.pl Instrukcja użytkownika systemu bankowości internetowej dla firm Wiadomości