METODY INDEKSOWANIA DOKUMENTÓW TEKSTOWYCH W SYSTEMACH WEBOWYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "METODY INDEKSOWANIA DOKUMENTÓW TEKSTOWYCH W SYSTEMACH WEBOWYCH"

Transkrypt

1 Indeksowanie, Indeks Inwersyjny Grupowanie, Pliki Podpisu Daniel Halikowski METODY INDEKSOWANIA DOKUMENTÓW TEKSTOWYCH W SYSTEMACH WEBOWYCH Zasoby sieci Internet to miliardy plików zlokalizowanych na całym świecie. Wraz z pojawieniem się tak ogromnych ilości stron WWW, dokumentów, baz danych oraz aplikacji zaistniała potrzeba usprawniania mechanizmów ich wyszukiwania oraz przechowywania. Najważniejszą operacją wykonywaną przez wyszukiwarkę, umożliwiającą szybkie wyszukiwanie relewantnych danych jest indeksowanie dokumentów oraz ich poprawna klasyfikacja w bazie danych. Indeksowanie dokumentu polega na określeniu tematu lub przedmiotu i wyrażeniu tego tematu lub przedmiotu w języku informacyjno-wyszukiwawczym (stosowanym w danym systemie wyszukiwania informacji) w charakterystyce wyszukiwawczej indeksowanego dokumentu [6]. Jedną z metod indeksowania dużej ilości plików tekstowych takich jak np. strony Web jest zastosowanie indeksu inwersyjnego. Kolejnymi metodami są grupowanie oraz pliki podpisu. Zastosowanie każdej z tych technik nie daje nam precyzyjnych rezultatów, ale są one najbardziej rozpowszechnionymi rozwiązaniami wśród silników wyszukujących. W referacie przedstawiono analizy i charakterystyki technik indeksowania dokumentów tekstowych, przedstawiono ich wady i zalety. Porównanie tych metod umożliwi wybór najlepszego rozwiązania podczas tworzenia systemu indeksującego. 1. WSTĘP Działanie mechanizmów indeksujących (porządkujących dokumenty) polega na penetrowaniu sieci w celu wyszukania odpowiednich dokumentów, a następnie stworzenia indeksu, czyli bazy danych zawierającej informacje o zawartości indeksowanego pliku. Programy przeszukujące Internet można podzielić na dwie kategorie. Pierwszą z nich stanowią aplikacje korzystające ze specjalnego programu komputerowego, tzw. crawlera (zwanego również robotem lub pająkiem). Drugą stanowią aplikacje przedstawiające wyniki w postaci katalogów tworzonych przez redaktorów. W przypadku Crawlerów po sformułowaniu kryteriów przeszukują one strony sieci Web w celu znalezienia relewantnych wyników, które w przypadku tych Instytut Informatyki, Państwowa Wyższa Szkoła Zawodowa w Nysie, ul Grodzka 19, Nysa ( dhalikowski@pwsz.nysa.pl)

2 aplikacji generowane są automatycznie. Bardzo ważną cechą Crawlerów jest regularne odwiedzanie stron które już wcześniej zostały przeszukane, dzięki czemu odnotowują one zmiany dokonywane w serwisie WWW. Praca tych robotów polega przede wszystkim na analizie adresów internetowych, treści nagłówków i zawartości strony głównej, na podstawie których zostają wygenerowane słowa kluczowe, które z kolei umożliwiają odpowiednie segregowanie treści. Informacja dostarczona przez pająka podlega jeszcze odpowiedniej obróbce przez oprogramowanie wyszukiwarki, która ma na celu znalezienie odpowiedzi na zadane zapytanie oraz uszeregowanie wyników w odpowiedniej kolejności. W przypadku katalogów, są one tworzone przez redaktorów i zawierają wybrane przez nich adresy oraz strony zgłoszone przez webmasterów. Proces ten ma kilka wad. Jest bardzo pracochłonny, ponieważ nie jest on wykonywany automatycznie, a aktualizacja stron jest dokonywana bardzo rzadko. Niesie ze sobą także inne niebezpieczeństwa, gdyż wartość strony i to czy zostanie ona skatalogowana zależy od upodobań redaktora. Jak wynika z powyższego podstawowym celem wyszukiwania i indeksowania dokumentów jest gromadzenie informacji, jakie słowa zawierają poszczególne dokumenty, dlatego tak ważne jest stworzenie systemu, który w optymalny sposób będzie analizował zawartość indeksowanego pliku. Większość obecnych metod tworzenia indeksu opiera się w zasadzie na tej samej idei, w której kluczem do sukcesu jest oczywiście właściwa treść dokumentu. 2. REPREZENTACJA DOKUMENTU Techniki indeksowania opierają się na odpowiedniej interpretacji danego dokumentu i reprezentacji jego zawartości. Najlepszym sposobem jest reprezentacja dokumentu jako wektora słów lub fraz. Na podstawie szeregu badań stwierdzono jednak, że indeksowanie słów (czy pojedynczych termów), czyli tzw. reprezentacja prosta, jest bardziej efektywna niż indeksowanie fraz. Przyczyną takiego stanu rzeczy może być fakt, iż różne frazy mogą mieć to samo znaczenie. Ważną rzeczą jest też odpowiedni dobór termów (słów) reprezentujących dany dokument. Dobór opiera się zwykle na iloczynie tfxidf, w którym tf wskazuje na lokalne znaczenie termu, a df lub idf na globalne znaczenie termu. Tf jest to częstotliwość termu w dokumencie, df częstotliwość termu w populacji dokumentów, a idf inwersyjna częstotliwość dokumentu. Ważność termu ocenia się na podstawie jego zdolności do odróżnienia dokumentów relewantnych od nierelewantnych. Zdroworozsądkowe rozważania prowadzą do postawienia hipotezy, że częstotliwość występowania różnych słów w tekście w języku naturalnym jest związana z ważnością tych słów dla reprezentacji treści [6], nie do końca jednak tak jest. Jeżeli weźmiemy pod uwagę typowy zbiór dokumentów zauważymy, że słowa często występujące są na ogół mało znaczące, co zaprzecza wcześniejszym stwierdzeniom. Słowa rzadko występujące mogą za to być

3 słowami o dużym znaczeniu dla danego dokumentu, a ich eliminacja wiąże się automatycznie ze spadkiem precyzji. Praktyczny schemat doboru termów eliminujący podstawowe wady miałby następującą formę: - Użycie stop-lista, która eliminuje słowa często występujące o małym znaczeniu - Obliczenie częstotliwości termów tf ij oznaczającej liczbę wystąpień T j w D i, gdzie T j oznacza term w dokumencie D i - Wybranie progowej częstości T, i przypisanie każdemu dokumentowi grupy termów, których tf ij jest większa od T 3. INDEKS INWERSYJNY Techniką indeksowania bazującą na powyższej formie reprezentacji dokumentu jest indeks inwersyjny (inverted index), z którego korzysta większość serwisów indeksujących. Indeks taki jest skonstruowany podobnie jak spis terminów na końcu książki - dla każdego słowa przechowywana jest lista dokumentów zawierających to słowo (każde słowo znajdujące się w bazie danych ma odpowiedni wpis w indeksie inwersyjnym, a każdy indeks zawiera wskaźnik do dokumentów, które zawierają tamto słowo). Umożliwia to bardzo szybkie wyszukiwanie, ponieważ indeksy są sprawdzane w celu znalezienia reprezentanta dla słowa kluczowego. Ten reprezentant zawiera odnośniki do wszystkich dokumentów lub stron web-owych, które zawierają to słowo (rys 1). Dokument 1 Fryderyk Szopen Fortepian Utwór Dokument 3 Jan Nowak Szopen Utwór Dokument 2 Fryderyk Szopen Biografia Fryderyk Dokument1, Dokument 2 Szopen Dokument1, Dokument 2 Fortepian Dokument1 Utwór Dokument1, Dokument 3 Jan Dokument3 Nowak Dokument3 Biografia Dokument 2 Rys 1. Przykład indeksu inwersyjnego Fig 1. Inverted index example

4 Możliwym rozszerzeniem indeksu odwróconego może być wersja, w której przechowywane są także dodatkowe informacje na temat słowa, takie jak lokalizacja słowa w dokumencie, liczba wystąpień we wszystkich dokumentach czy liczba wystąpień w każdym z dokumentów. Umożliwi to szybsze wyszukiwanie fraz, zastosowanie wyszukiwania przybliżonego wykorzystującego informację o słowach, które znajdują się blisko siebie, oraz formułowanie bardziej skomplikowanych składni zapytań [3]. Ta dodatkowa informacja ułatwia nam także proces zaszeregowania dokumentów. Na przykład, term występujący w dokumencie częściej, z oczywistych względów ma szansę być bardziej relewantnym (mając na uwadze wcześniej opisane warunki) takie zjawisko nazywamy Częstotliwością Terminu [2]. Także, jeśli zapytanie zawiera wielorakie słowa i jedno z takich słów występuje tylko w kilku dokumentach to te dokumenty będą w wyższych pozycjach rankingu, nazywamy to inwersyjną częstotliwością dokumentu. Oczywiście to niesie ze sobą pewne konsekwencje. Im więcej informacji przechowujemy, tym więcej miejsca na dysku będziemy potrzebować, a także może to spowodować wydłużony czas znajdowania indeksu. Istnieją także pewne ograniczenia wynikające z używania tej metody, które wpływają na indeksowanie a w konsekwencji na późniejsze wyszukiwanie. Przykładami tych ograniczeń są: - Kontrolowany słownik, który jest kolekcją słów kluczowych, które mają być zaindeksowane. Słowa, które są w dokumencie, a nie są w tym słowniku nie zostaną zaindeksowane, a co się z tym wiąże znalezione. - Użycie Stop-Listy zawierającej słowa, których nie ma potrzeby indeksować (np. przyimki, przedimki) - Użycie zestawu reguł, które decydują o początku słowa lub tekstu, który ma być zaindeksowany. Reguły te muszą uporać się np. z różnym rozmieszczeniem, interpunkcją i formatem słów, co ma znaczny wpływ na jakość indeksowania. - Lista ciągu znaków przeznaczonych do indeksowania (lub wykluczonych przy indeksowaniu). W dużych bazach tekstowych nie wszystkie ciągi znaków są indeksowane (często np. nie indeksuje się ciągu następujących po sobie znaków numerycznych) IMPLEMENTACJA INDEKSU ODWROTNEGO Poniżej przedstawiony system (rys 2) stanowi przykładową implementację indeksowania inwersyjnego. System ten nie indeksuje stron, ale zasada jego działania pozwala na zastosowanie go w procesie indeksowania dokumentów tekstowych (tylko w małym zakresie).

5 Indeks inwersyjny Katalog główny aa ab ac ad za zi zo zz Advanced adam... advanced advocacy Rys 2. Struktura indeksów Fig 2. Index structure Jak widać cały indeks posiada katalog macierzysty. W tym katalogu znajduje się wiele podkatalogów, a nazwy tych podkatalogów zaczynają się od dwóch liter. Podkatalogi są posortowane alfabetycznie. Dla każdego słowa znajdującego się w dokumencie istnieje plik, który znajduje się w katalogu, którego nazwa jest dwiema pierwszymi literami tego słowa. Na przykład, pliki indeksu słowa adam, advanced, advocacy będą znajdować się w katalogu o nazwie ad. Pliki te zawierają pełną nazwę pliku dokumentów zawierających te słowa. Oczywiście w przypadku indeksowania stron zamiast nazwy pliku będzie znajdować się skrót URL [3]. Algorytm indeksujący dokumenty w ten sposób może wyglądać następująco: 1. Wczytaj pierwszy dokument. 2. Podziel zawartość na słowa ( terminy). 3. Zapamiętaj słowa w pamięci. 4. Wczytaj kolejny dokument. 5. Zapisz słowa do pliku indeksu. 6. Wróć do kroku 4 w przypadku, gdy są jeszcze pliki do indeksowania. Przeszukiwanie indeksu rozpoczynamy od ustawienia się na początku struktury podkatalogów (katalog aa ) i porównywaniu nazw poszczególnych podkatalogów

6 z szukanym słowem. W przypadku znalezienie katalogu, którego nazwa odpowiada dwóm pierwszym literom szukanego terminu, wewnątrz tego katalogu znajdziemy plik, którego nazwa będzie szukanym terminem a w jego wnętrzu będą ścieżki dostępu do plików, w których się to słowo znajduje. Ten system jest bardzo prosty, co sprowadza się do tego, że pozwala na szukanie jedynie pojedynczych słów. Stanowi jednak podstawę dla bardziej złożonego systemu, w którym użycie koniunkcji, dysjunkcji czy negacji da możliwość porównania zwróconych pozycji. Na przykład użycie operatora AND spowoduje, że system zwróci nam nazwy plików, w których znajdują się oba szukane słowa [1]. 4. GRUPOWANIE Grupowanie jest techniką używaną w celu zwiększenia szybkości wyszukiwania oraz do zwracania większej ilości jak najbardziej adekwatnych wyników. Z reguły jest tak, że podobne dokumenty mają tendencję być relewantnymi na to samo zapytanie, więc są one grupowane w jednym zbiorze. Jeżeli wynikiem zapytania jest dokument znajdujący się w takim zbiorze, wtedy jako wynik może być zwracana adekwatna grupa dokumentów. Grupowanie możemy stosować zarówno do dokumentów jak i do słów [5]. Grupy słów będą zawierać terminy, które mają podobne znaczenie (np. synonimy). Kiedy poszukujemy określonego terminu, silnik wyszukujący może poszukiwać wśród innych słów znajdujących się w określonej grupie. Takie grupy słów mogą być tworzone manualnie lub przez inteligentny algorytm, który może na bieżąco aktualizować i modyfikować takie zbiory. Rola tego algorytmu polega na analizie wartości i znaczenia słów i odpowiednim sklasyfikowaniu ich przynależności (wrzucenie do odpowiedniego zbioru). Może być też tak, że będą one tworzone przez połączenie obu sposobów. 4.1.W JAKI SPOSÓB GENERUJEMY GRUPY Jedną z metod generowania zbiorów (grup) jest tworzenie wektora dla każdego z dokumentów. Wektor ten jest rozmiaru t, gdzie t jest liczbą słów kluczowych dla wszystkich dokumentów, wskutek czego każdy wektor będzie dosyć duży. Wartość t może być zmniejszona poprzez zastosowanie trzech procesów: - Użycie 'Negative dictionary', który eliminuje proste słowa o małym znaczeniu takie jak 'i', 'z', 'lub', 'jest', etc. - Redukcja słowa do jego podstawy. Na przykład advertising, advert, advertiser, advertisement możemy zredukować do advert i to jest ta podstawa. W tym momencie warto wspomnieć o tzw. Stemmingu czyli transformacji słowa do postaci bazowej w celu wyeliminowania fleksyjności języka (prace nad tym rozwiązaniem prowadzi m.in. p. D Weiss).

7 - Następnie użycie tezaurus a stanowiącego zbiór semantycznie i hierarchicznie powiązanych terminów, ułatwiający wyszukiwanie pochodnych informacji, który przypisze słowa do jednej klasy słów zawierających synonimy innych (spowoduje to redukcję wektora w przypadku wystąpienia takowych synonimów). To klasa słów byłaby wtedy pozycją t w wektorze każdego dokumentu [3]. Wszystkie dokumenty mają wektory o tej samej strukturze. Każda pozycja w wektorze jest przypisana do odpowiedniej klasy słów. Ilustruje to następujący przykład: Jeżeli jedyną klasą słów w bazie danych byłyby słowa: słowo1, słowo2 i słowo3, wektor dla tych dokumentów byłby następujący: W={słowo1; słowo2; słowo3} Jeżeli mamy dokument ze słowami słowo1 i słowo3 to wektor miałoby postać: W={1; 0; 1} Jeżeli mamy dokument tylko ze słowem słowo1 to wektor miałoby postać: W={1; 0 ; 0} Zero jest wstawiane w wektorze klasy słów, jeżeli słowo nie występuje w tym dokumencie. Najprostszym sposobem przedstawienia obecności słowa byłoby wstawienie jedynki w wektorze na pozycji słowa, ale możemy to udoskonalić poprzez nadanie słowu wagi dla każdego dokumentu. Wagę taką można obliczyć np. na podstawie strategii ważenia termów zwanej term frequency-inverse dokument frequency ze wzoru [6]: tfidf ij =tf ij xidf j =tf ij xlog 2 (N/df j ) (1) gdzie: tf ij : liczba wystąpień termu j w dokumencie I df j : liczba dokumentów zawierających term j N: ogólna liczba dokumentów Najpopularniejszymi czynnikami branymi pod uwagę w metodzie grupowania (tak jak w indeksie odwróconym) są: - Częstotliwość występowania terminu na stronie (może być normalizowana do obliczenia dla różnych długości dokumentów) - Specyfikacja terminu tj. branie pod uwagę częstości występowania terminu w całej bazie danych.

8 Po utworzeniu wektora musimy zaktualizować grupy klastrów. Możemy tego dokonać poprzez zastosowanie na macierzy funkcji znajdującej dokumenty, które powinny być połączone w grupę. To oznacza porównanie każdego wektora pozostałymi wektorami, co daje nam n 2 operacji, jeżeli mamy n- dokumentów. Następnie możemy stworzyć hierarchię klastrów poprzez porównanie właściwości wektorów. To pozwali nam na utworzenie struktury katalogów, które będą użyte w razie wyszukiwania ręcznego. 5. PLIKI PODPISU (SIGNATURE FILES) Mniej znaną metodą indeksowania, o której warto jeszcze wspomnieć jest technologia tzw. plików podpisu. Pliki takie są plikami binarnymi stworzonymi na podstawie funkcji hashowania głównego dokumentu. Plik podpisu zawiera ciąg bitów reprezentujących zawartość danego dokumentu albo jego części. Podpis jest odpowiednio długim wektorem składającym się z zer lub jedynek. Podpis słowa jest wektorem bitów odpowiadającym właściwemu słowu. Aby stworzyć taki plik podpisu należy zawartość indeksowanego pliku podzielić na oddzielne części (słowa) oraz usunąć słowa znajdujące się na stopliście. Następnie przypisujemy każdemu słowu n- bitowy podpis. Wstępnie wszystkie bity wektora ustawione są na zero, jednak w ciągu dalszego przetwarzania danych bity na pozycjach k zostają ustawione na jeden używając k- różnych funkcji hashowania. Aby zlokalizować dokument zawierający szukane słowo, dla każdego termu znajdującego się w zapytaniu tworzymy podpis używając tych samych funkcji hashujących co podczas tworzenia pliku podpisu a następnie porównujemy podpis z wcześniej stworzonym plikiem podpisu. Najprostszą formą tej technologii była idea rozwijana przez p. Tsichritzisa i Christodoulakisa, którzy to zaproponowali binarny kod dla każdego słowa, który w prosty sposób zastępowałoby faktyczne słowo w dokumencie. Zastosowanie takiego rozwiązania pozwala oszczędzić przestrzeń na dysku, chroni porządek słów, i zwiększa szybkość przeszukiwania. Na przykład, proste i często używane słowa mogą być reprezentowane przez tak małe słowo binarne jak to tylko możliwe. 6. WNIOSKI Indeksowanie ma ogromny wpływ na działanie serwisu wyszukiwawczego. Dzięki indeksowi możemy wyszukać określone dane spośród ogromnego zbioru w ciągu ułamku sekundy. Dobranie odpowiednich algorytmów indeksujących daje nam możliwość wyszukiwania najbardziej relewantnych dokumentów a to jest celem każdego serwisu wyszukiwawczego. Metody tu przedstawione są jednymi

9 z najpopularniejszych technik używanych przez przeglądarki internetowe, choć mają jednak swoje wady. Badanie ich i ulepszanie, a jednoczesne szukanie nowych metod daje jednak szansę na stworzenie technologii optymalnej i najbardziej praktycznej, może niepozbawionej wad, ale dużej mierze satysfakcjonującej użytkownika, a to jest przecież najważniejsze. LITERATURA [1] [2] [3] [4] GLOSSBRENNER A., GLOSSBRENNER E., Search Engines for the World Wide Web, Peachpit Press, Berkeley [5] KIMMO PALIN, JANNE PASANEN, TEEMU ROOS, Clustering Documents by Minimum Encoding, University of Helsinki [6] KŁOPOTEK A. M., Inteligentne wyszukiwarki internetowe, Warszawa, AOW EXIT, 2001, [7] OPPENHEIM C., MORRIS A., McKNIGHT C., The evaluation of WWW serach engines, J. of Documentation, 2000, Vol. 56, nr 2, s [8] SHWARTZ C., Web search engines, J. of the ASIS, 1998, Vol. 49, nr 11, s STRESZCZENIE (Indexing text documents in Web systems) The Internet consists of many files across the world. There are millions World Wide Web pages, text files, applications and databases. To search relevant documents search engines have to use good indexing method to classification those documents in storing databases. One method of storing many pages of text, such as Web pages, is to use an inverted index. Another methods of storing the pages in a database is to use a clastering and signature files. Those techniques unfortunately cannot give precise results, but are most popular methods used by search engines. In this paper are characteristics of each indexing techniques, those advantages and defects. There are also comparisons methods which let us to choose the best method to use in indexing systems.

Metody indeksowania dokumentów tekstowych

Metody indeksowania dokumentów tekstowych Metody indeksowania dokumentów tekstowych Paweł Szołtysek 21maja2009 Metody indeksowania dokumentów tekstowych 1/ 19 Metody indeksowania dokumentów tekstowych 2/ 19 Czym jest wyszukiwanie informacji? Wyszukiwanie

Bardziej szczegółowo

Wyszukiwanie informacji w internecie. Nguyen Hung Son

Wyszukiwanie informacji w internecie. Nguyen Hung Son Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy

Bardziej szczegółowo

Semantyczne podobieństwo stron internetowych

Semantyczne podobieństwo stron internetowych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana

Bardziej szczegółowo

Wyszukiwanie tekstów

Wyszukiwanie tekstów Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły

Bardziej szczegółowo

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Główną Uniwersytetu Medycznego w Poznaniu. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i

Bardziej szczegółowo

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS UNIWERSYTET ZIELONOGÓRSKI INSTYTUT INFORMATYKI I ELEKTROTECHNIKI ZAKŁAD INŻYNIERII KOMPUTEROWEJ Przygotowali: mgr inż. Arkadiusz Bukowiec mgr inż. Remigiusz Wiśniewski LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

Bardziej szczegółowo

Bazy dokumentów tekstowych

Bazy dokumentów tekstowych Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe

Bardziej szczegółowo

Algorytmy sortujące i wyszukujące

Algorytmy sortujące i wyszukujące Algorytmy sortujące i wyszukujące Zadaniem algorytmów sortujących jest ułożenie elementów danego zbioru w ściśle określonej kolejności. Najczęściej wykorzystywany jest porządek numeryczny lub leksykograficzny.

Bardziej szczegółowo

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury

Bardziej szczegółowo

Algorytmy i struktury danych. Wykład 4 Tablice nieporządkowane i uporządkowane

Algorytmy i struktury danych. Wykład 4 Tablice nieporządkowane i uporządkowane Algorytmy i struktury danych Wykład 4 Tablice nieporządkowane i uporządkowane Tablice uporządkowane Szukanie binarne Szukanie interpolacyjne Tablice uporządkowane Szukanie binarne O(log N) Szukanie interpolacyjne

Bardziej szczegółowo

SQL - Structured Query Language -strukturalny język zapytań SQL SQL SQL SQL

SQL - Structured Query Language -strukturalny język zapytań SQL SQL SQL SQL Wprowadzenie do SQL SQL - Structured Query Language -strukturalny język zapytań Światowy standard przeznaczony do definiowania, operowania i sterowania danymi w relacyjnych bazach danych Powstał w firmie

Bardziej szczegółowo

Metoda list inwersyjnych. Wykład III

Metoda list inwersyjnych. Wykład III Metoda list inwersyjnych Wykład III Plan wykładu Cele metody Tworzenie kartoteki wyszukiwawczej Redundancja i zajętość pamięci Wyszukiwanie informacji Czasy wyszukiwania Ocena metody: wady i zalety Modyfikacje

Bardziej szczegółowo

Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim

Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim dr Agnieszka Kowalska Pełnomocnik Rektora ds. wprowadzenia systemu antyplagiatowego w Uniwersytecie Jagiellońskim Otwarty

Bardziej szczegółowo

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2 Internet, jako ocean informacji Technologia Informacyjna Lekcja 2 Internet INTERNET jest rozległą siecią połączeń, między ogromną liczbą mniejszych sieci komputerowych na całym świecie. Jest wszechstronnym

Bardziej szczegółowo

Temat: Ułatwienia wynikające z zastosowania Frameworku CakePHP podczas budowania stron internetowych

Temat: Ułatwienia wynikające z zastosowania Frameworku CakePHP podczas budowania stron internetowych PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W ELBLĄGU INSTYTUT INFORMATYKI STOSOWANEJ Sprawozdanie z Seminarium Dyplomowego Temat: Ułatwienia wynikające z zastosowania Frameworku CakePHP podczas budowania stron internetowych

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Uniwersytetu Jagiellońskiego. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i w jednym miejscu.

Bardziej szczegółowo

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite Tomasz Boiński: 1 Pozycjonowanie stron i zastosowanie mod_rewrite Pozycjonowanie stron Promocja strony odbywa się poprzez umiejscowienie jej jak najwyżej w wynikach wyszukiwania Wyszukiwarki indeksują

Bardziej szczegółowo

MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH

MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH SPIS TREŚCI i EKRANÓW WSTĘP Ekran1: Wstęp. Logowanie Ekran2: Strona początkowa UDOSTEPNIONE MATERIAŁY Ekran3: Dostępne materiały Ekran4: Zawartość

Bardziej szczegółowo

dr inż. Jarosław Forenc

dr inż. Jarosław Forenc Informatyka 2 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr III, studia stacjonarne I stopnia Rok akademicki 2010/2011 Wykład nr 7 (24.01.2011) dr inż. Jarosław Forenc Rok akademicki

Bardziej szczegółowo

W dalszej części dokumentu przedstawiamy skrócony opis kluczowych funkcji systemu. Niniejszy dokument nie zawiera opisu technicznego systemu.

W dalszej części dokumentu przedstawiamy skrócony opis kluczowych funkcji systemu. Niniejszy dokument nie zawiera opisu technicznego systemu. 1. Informacje Podstawowe Mediamanager 2.1 jest systemem wspierającym zarządzanie dokumentami elektronicznymi. Podstawowymi funkcjami realizowanymi przez oprogramowanie jest przetrzymywanie, zarządzanie

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service przewodnik

Multiwyszukiwarka EBSCO Discovery Service przewodnik Multiwyszukiwarka EBSCO Discovery Service to narzędzie zapewniające łatwy i skuteczny dostęp do wszystkich źródeł elektronicznych Biblioteki Uczelnianej (prenumerowanych i Open Access) za pośrednictwem

Bardziej szczegółowo

Badanie struktury sieci WWW

Badanie struktury sieci WWW Eksploracja zasobów internetowych Wykład 1 Badanie struktury sieci WWW mgr inż. Maciej Kopczyński Białystok 214 Rys historyczny Idea sieci Web stworzona została w 1989 przez Tima BernersaLee z CERN jako

Bardziej szczegółowo

Wykład XII. optymalizacja w relacyjnych bazach danych

Wykład XII. optymalizacja w relacyjnych bazach danych Optymalizacja wyznaczenie spośród dopuszczalnych rozwiązań danego problemu, rozwiązania najlepszego ze względu na przyjęte kryterium jakości ( np. koszt, zysk, niezawodność ) optymalizacja w relacyjnych

Bardziej szczegółowo

2017/2018 WGGiOS AGH. LibreOffice Base

2017/2018 WGGiOS AGH. LibreOffice Base 1. Baza danych LibreOffice Base Jest to zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego programu komputerowego,

Bardziej szczegółowo

Uproszczony opis obsługi ruchu w węźle IP. Trasa routingu. Warunek:

Uproszczony opis obsługi ruchu w węźle IP. Trasa routingu. Warunek: Uproszczony opis obsługi ruchu w węźle IP Poniższa procedura jest dokonywana dla każdego pakietu IP pojawiającego się w węźle z osobna. W routingu IP nie wyróżniamy połączeń. Te pojawiają się warstwę wyżej

Bardziej szczegółowo

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0 ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy

Bardziej szczegółowo

ang. file) Pojęcie pliku (ang( Typy plików Atrybuty pliku Fragmentacja wewnętrzna w systemie plików Struktura pliku

ang. file) Pojęcie pliku (ang( Typy plików Atrybuty pliku Fragmentacja wewnętrzna w systemie plików Struktura pliku System plików 1. Pojęcie pliku 2. Typy i struktury plików 3. etody dostępu do plików 4. Katalogi 5. Budowa systemu plików Pojęcie pliku (ang( ang. file)! Plik jest abstrakcyjnym obrazem informacji gromadzonej

Bardziej szczegółowo

Kodowanie informacji. Kody liczbowe

Kodowanie informacji. Kody liczbowe Wykład 2 2-1 Kodowanie informacji PoniewaŜ komputer jest urządzeniem zbudowanym z układów cyfrowych, informacja przetwarzana przez niego musi być reprezentowana przy pomocy dwóch stanów - wysokiego i niskiego,

Bardziej szczegółowo

MS Word 2010. Długi dokument. Praca z długim dokumentem. Kinga Sorkowska 2011-12-30

MS Word 2010. Długi dokument. Praca z długim dokumentem. Kinga Sorkowska 2011-12-30 MS Word 2010 Długi dokument Praca z długim dokumentem Kinga Sorkowska 2011-12-30 Dodawanie strony tytułowej 1 W programie Microsoft Word udostępniono wygodną galerię wstępnie zdefiniowanych stron tytułowych.

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

Pobieranie i przetwarzanie treści stron WWW

Pobieranie i przetwarzanie treści stron WWW Eksploracja zasobów internetowych Wykład 2 Pobieranie i przetwarzanie treści stron WWW mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Jedną z funkcji silników wyszukiwania danych, a właściwie ich modułów

Bardziej szczegółowo

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy

Bardziej szczegółowo

Instrukcje dla zawodników

Instrukcje dla zawodników Płock, 17 marca 2018 r. Instrukcje dla zawodników Arkusze otwieramy na wyraźne polecenie komisji. Wszystkie poniższe instrukcje zostaną odczytane i wyjaśnione. 1. Arkusz składa się z 3 zadań. 2. Każde

Bardziej szczegółowo

Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego

Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego Arytmetyka cyfrowa Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego (binarnego). Zapis binarny - to system liczenia

Bardziej szczegółowo

< K (2) = ( Adams, John ), P (2) = adres bloku 2 > < K (1) = ( Aaron, Ed ), P (1) = adres bloku 1 >

< K (2) = ( Adams, John ), P (2) = adres bloku 2 > < K (1) = ( Aaron, Ed ), P (1) = adres bloku 1 > Typy indeksów Indeks jest zakładany na atrybucie relacji atrybucie indeksowym (ang. indexing field). Indeks zawiera wartości atrybutu indeksowego wraz ze wskaźnikami do wszystkich bloków dyskowych zawierających

Bardziej szczegółowo

Metoda List Łańcuchowych

Metoda List Łańcuchowych Metoda List Łańcuchowych mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2010 Celem metody jest utrzymanie zalet MLI (dobre czasy wyszukiwania), ale wyeliminowanie jej wad (wysoka

Bardziej szczegółowo

Indeksowanie w bazach danych

Indeksowanie w bazach danych w bazach Katedra Informatyki Stosowanej AGH 5grudnia2013 Outline 1 2 3 4 Czym jest indeks? Indeks to struktura, która ma przyspieszyć wyszukiwanie. Indeks definiowany jest dla atrybutów, które nazywamy

Bardziej szczegółowo

REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką

REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką Autor: Paweł Konieczny Promotor: dr Jadwigi Bakonyi Kategorie: aplikacja www Słowa kluczowe: Serwis

Bardziej szczegółowo

WYSZUKIWANIE INFORMACJI W INTERNECIE

WYSZUKIWANIE INFORMACJI W INTERNECIE Sławomir Szaruga Ośrodek Nowoczesnych Technologii Informacyjnych ŁCDNiKP WYSZUKIWANIE INFORMACJI W INTERNECIE II etap edukacji (klasa VI) Cele kształcenia Cele ogólne: kształtowanie umiejętności wyszukiwania

Bardziej szczegółowo

Tajemnice skutecznego wyszukiwania na przykładzie

Tajemnice skutecznego wyszukiwania na przykładzie Tajemnice skutecznego wyszukiwania na przykładzie Przeglądarka program otwierający wrota Internetu Wyszukiwarka a przeglądarka Wyszukiwarka program pozwalający wyszukiwać linki do stron WWW Kilka podstawowych

Bardziej szczegółowo

Programowanie w języku Python. Grażyna Koba

Programowanie w języku Python. Grażyna Koba Programowanie w języku Python Grażyna Koba Kilka definicji Program komputerowy to ciąg instrukcji języka programowania, realizujący dany algorytm. Język programowania to zbiór określonych instrukcji i

Bardziej szczegółowo

Systemy liczbowe używane w technice komputerowej

Systemy liczbowe używane w technice komputerowej Systemy liczbowe używane w technice komputerowej Systemem liczenia nazywa się sposób tworzenia liczb ze znaków cyfrowych oraz zbiór reguł umożliwiających wykonywanie operacji arytmetycznych na liczbach.

Bardziej szczegółowo

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I Wojciech Kotłowski Instytut Informatyki Politechniki Poznańskiej email: imię.nazwisko@cs.put.poznan.pl pok. 2 (CW) tel. (61)665-2936 konsultacje:

Bardziej szczegółowo

Wyszukiwarka naukowa EBSCO Discovery Service - przewodnik

Wyszukiwarka naukowa EBSCO Discovery Service - przewodnik Wyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Uniwersytetu w Białymstoku oraz katalogu Biblioteki. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo

Bardziej szczegółowo

Algorytmy i struktury danych

Algorytmy i struktury danych Algorytmy i struktury danych Proste algorytmy sortowania Witold Marańda maranda@dmcs.p.lodz.pl 1 Pojęcie sortowania Sortowaniem nazywa się proces ustawiania zbioru obiektów w określonym porządku Sortowanie

Bardziej szczegółowo

Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1

Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1 Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

Internet wyszukiwarki internetowe

Internet wyszukiwarki internetowe Internet wyszukiwarki internetowe 1. WYSZUKIWARKI INTERNETOWE to doskonały sposób na znalezienie potrzebnych informacji w Internecie. Najpopularniejsze wyszukiwarki to: http://www.google.pl/ http://www.netsprint.pl/

Bardziej szczegółowo

16MB - 2GB 2MB - 128MB

16MB - 2GB 2MB - 128MB FAT Wprowadzenie Historia FAT jest jednym z najstarszych spośród obecnie jeszcze używanych systemów plików. Pierwsza wersja (FAT12) powstała w 1980 roku. Wraz z wzrostem rozmiaru dysków i nowymi wymaganiami

Bardziej szczegółowo

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6 Zawartość Wstęp... 1 Instalacja... 2 Konfiguracja... 2 Uruchomienie i praca z raportem... 6 Wstęp Rozwiązanie przygotowane z myślą o użytkownikach którzy potrzebują narzędzie do podziału, rozkładu, rozbiórki

Bardziej szczegółowo

Podstawy programowania 2. Przygotował: mgr inż. Tomasz Michno

Podstawy programowania 2. Przygotował: mgr inż. Tomasz Michno Instrukcja laboratoryjna 2 Podstawy programowania 2 Temat: Zmienne dynamiczne tablica wskaźników i stos dynamiczny Przygotował: mgr inż. Tomasz Michno 1 Wstęp teoretyczny 1.1 Tablice wskaźników Tablice

Bardziej szczegółowo

Primo wyszukiwarka naukowa

Primo wyszukiwarka naukowa Primo wyszukiwarka naukowa Wyszukiwarka Primo to uniwersalne narzędzie do jednoczesnego przeszukiwania wszystkich zasobów bibliotecznych, zarówno tradycyjnych jak i elektronicznych. Pozwala szybko dotrzeć

Bardziej szczegółowo

Instrukcja do ćwiczeń nr 4 typy i rodzaje zmiennych w języku C dla AVR, oraz ich deklarowanie, oraz podstawowe operatory

Instrukcja do ćwiczeń nr 4 typy i rodzaje zmiennych w języku C dla AVR, oraz ich deklarowanie, oraz podstawowe operatory Instrukcja do ćwiczeń nr 4 typy i rodzaje zmiennych w języku C dla AVR, oraz ich deklarowanie, oraz podstawowe operatory Poniżej pozwoliłem sobie za cytować za wikipedią definicję zmiennej w informatyce.

Bardziej szczegółowo

Wyszukiwanie zaawansowane

Wyszukiwanie zaawansowane Wyszukiwanie zaawansowane Wyszukiwanie zaawansowane umożliwia przeszukiwanie zasobów metadanych przy pomocy specjalnie wydzielonych kryteriów wyszukiwania (data, zakres, typ i kategoria dokumentu, format

Bardziej szczegółowo

Algorytm grupowania danych typu kwantyzacji wektorów

Algorytm grupowania danych typu kwantyzacji wektorów Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, rozważane dotychczas problemy koncentrowały się na nauczeniu na podstawie zbioru treningowego i zbioru etykiet klasyfikacji

Bardziej szczegółowo

Zapisywanie algorytmów w języku programowania

Zapisywanie algorytmów w języku programowania Temat C5 Zapisywanie algorytmów w języku programowania Cele edukacyjne Zrozumienie, na czym polega programowanie. Poznanie sposobu zapisu algorytmu w postaci programu komputerowego. Zrozumienie, na czym

Bardziej szczegółowo

Optymalizacja. Przeszukiwanie lokalne

Optymalizacja. Przeszukiwanie lokalne dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Maciej Hapke Idea sąsiedztwa Definicja sąsiedztwa x S zbiór N(x) S rozwiązań, które leżą blisko rozwiązania x

Bardziej szczegółowo

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych rk Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych pojęć, prawdopodobnie zastanawiasz się, kiedy zaczniesz

Bardziej szczegółowo

Pojęcie systemu informacyjnego i informatycznego

Pojęcie systemu informacyjnego i informatycznego BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego DANE wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. SYSTEM

Bardziej szczegółowo

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Kodowanie transformacyjne Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Zasada Zasada podstawowa: na danych wykonujemy transformacje która: Likwiduje korelacje Skupia energię w kilku komponentach

Bardziej szczegółowo

Technologie Informacyjne

Technologie Informacyjne System binarny Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności October 7, 26 Pojęcie bitu 2 Systemy liczbowe 3 Potęgi dwójki 4 System szesnastkowy 5 Kodowanie informacji 6 Liczby ujemne

Bardziej szczegółowo

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można jednak wyróżnić 3 główne elementy, które brane są pod uwagę:

Bardziej szczegółowo

Backend Administratora

Backend Administratora Backend Administratora mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Katowice, 2011 W tym celu korzystając z konsoli wydajemy polecenie: symfony generate:app backend Wówczas zostanie stworzona

Bardziej szczegółowo

ZNACZNIKI META. Znacznik META

ZNACZNIKI META. Znacznik META ZNACZNIKI META Znacznik META element dokumentu HTML dostarczający informacji niewidocznych dla użytkowników, lecz istotnych z punktu widzenia odbiorców dokumentu przeglądarek i serwisów wyszukiwawczych

Bardziej szczegółowo

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY. Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY. 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z przykładowym systemem ekspertowym napisanym w JESS. Studenci poznają strukturę systemu ekspertowego,

Bardziej szczegółowo

1.1. Pozycyjne systemy liczbowe

1.1. Pozycyjne systemy liczbowe 1.1. Pozycyjne systemy liczbowe Systemami liczenia nazywa się sposób tworzenia liczb ze znaków cyfrowych oraz zbiór reguł umożliwiających wykonywanie operacji arytmetycznych na liczbach. Dla dowolnego

Bardziej szczegółowo

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0 ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy

Bardziej szczegółowo

IMIĘ I NAZWISKO... Wykorzystując wyszukiwarkę Google wykonaj poniższe polecenia:

IMIĘ I NAZWISKO... Wykorzystując wyszukiwarkę Google wykonaj poniższe polecenia: Załączniki nr 1 KARTA PRACY GRUPA.. Klasa.. IMIĘ I NAZWISKO... Wykorzystując wyszukiwarkę Google wykonaj poniższe polecenia: CZĘŚĆ I 1. Podaj, od czego pochodzi nazwa miasta Piotrkowa Trybunalskiego. 2.

Bardziej szczegółowo

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany.

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany. Przedstawiamy algorytmy porządkowania dowolnej liczby elementów, którymi mogą być liczby, jak również elementy o bardziej złożonej postaci (takie jak słowa i daty). Porządkowanie, nazywane również często

Bardziej szczegółowo

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak Wyszukiwanie boolowskie i strukturalne Adam Srebniak Wyszukiwanie boolowskie W wyszukiwaniu boolowskim zapytanie traktowane jest jako zdanie logiczne. Zwracane są dokumenty, dla których to zdanie jest

Bardziej szczegółowo

LABORATORIUM 3 ALGORYTMY OBLICZENIOWE W ELEKTRONICE I TELEKOMUNIKACJI. Wprowadzenie do środowiska Matlab

LABORATORIUM 3 ALGORYTMY OBLICZENIOWE W ELEKTRONICE I TELEKOMUNIKACJI. Wprowadzenie do środowiska Matlab LABORATORIUM 3 ALGORYTMY OBLICZENIOWE W ELEKTRONICE I TELEKOMUNIKACJI Wprowadzenie do środowiska Matlab 1. Podstawowe informacje Przedstawione poniżej informacje maja wprowadzić i zapoznać ze środowiskiem

Bardziej szczegółowo

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod

Bardziej szczegółowo

Wyszukiwanie dokumentów/informacji

Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie

Bardziej szczegółowo

WPROWADZENIE DO BAZ DANYCH

WPROWADZENIE DO BAZ DANYCH WPROWADZENIE DO BAZ DANYCH Pojęcie danych i baz danych Dane to wszystkie informacje jakie przechowujemy, aby w każdej chwili mieć do nich dostęp. Baza danych (data base) to uporządkowany zbiór danych z

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Ekran Wyszukiwania Podstawowego w multiwyszukiwarce EBSCO Discovery Service zapewnia dostęp poprzez jedno okienko wyszukiwawcze na platformie EBSCOhost do wszystkich zasobów biblioteki. Na ekranie do wyszukiwania

Bardziej szczegółowo

Instrukcja przygotowania pliku do deponowania

Instrukcja przygotowania pliku do deponowania Instrukcja przygotowania pliku do deponowania Etapy przygotowania pliku Przygotowanie pliku w formacie PDF Uzupełnienie metadanych w dokumencie Nadanie nazwy pliku PDF Format tekstowy pliku PDF Uporządkowanie

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

KATEGORIA OBSZAR WIEDZY NR ZADANIA. 2.1.2. Podstawowe informacje i czynności

KATEGORIA OBSZAR WIEDZY NR ZADANIA. 2.1.2. Podstawowe informacje i czynności Moduł 2 - Użytkowanie komputerów - od kandydata wymaga się zaprezentowania wiedzy i umiejętności w zakresie wykorzystania podstawowych funkcji komputera klasy PC i jego systemu operacyjnego. Kandydat powinien

Bardziej szczegółowo

Bazy danych. Andrzej Łachwa, UJ, /15

Bazy danych. Andrzej Łachwa, UJ, /15 Bazy danych Andrzej Łachwa, UJ, 2013 andrzej.lachwa@uj.edu.pl www.uj.edu.pl/web/zpgk/materialy 15/15 PYTANIA NA EGZAMIN LICENCJACKI 84. B drzewa definicja, algorytm wyszukiwania w B drzewie. Zob. Elmasri:

Bardziej szczegółowo

Tomasz Grześ. Systemy zarządzania treścią

Tomasz Grześ. Systemy zarządzania treścią Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,

Bardziej szczegółowo

Numeracja dla rejestrów zewnętrznych

Numeracja dla rejestrów zewnętrznych Numeracja dla rejestrów zewnętrznych System ZPKSoft Doradca udostępnia możliwość ręcznego nadawania numerów dla procedur i dokumentów zgodnie z numeracją obowiązującą w rejestrach zewnętrznych, niezwiązanych

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Uniwersytetu Warszawskiego oraz katalogu Biblioteki. Odnajdziesz publikacje na potrzebny Ci temat szybko,

Bardziej szczegółowo

EBSCO Discovery Service - przewodnik

EBSCO Discovery Service - przewodnik Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka... 1 O multiwyszukiwarce... 2 Przeszukiwane źródła... 2 Jak rozpocząć korzystanie?... 2 Wyszukiwanie zaawansowane... 3 Zawężanie

Bardziej szczegółowo

Języki formalne i automaty Ćwiczenia 6

Języki formalne i automaty Ćwiczenia 6 Języki formalne i automaty Ćwiczenia 6 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Wyrażenia regularne... 2 Standardy IEEE POSIX Basic Regular Expressions (BRE) oraz Extended

Bardziej szczegółowo

Algorytmy i struktury danych

Algorytmy i struktury danych Algorytmy i struktury danych 5. Pamięć komputera Łódź 2013 Bity i bajty Pamięć komputera jest kategoryzowana wg dostępu, szybkości i pojemności. Typ Szybkość dostępu Odległość do CPU Pojemność Ulotna?

Bardziej szczegółowo

Co nowego w programie GM EPC

Co nowego w programie GM EPC Co nowego w programie GM EPC Nawigacja graficzna Program GM EPC następnej generacji posiada szereg nowych funkcji, dzięki którym wyszukiwanie właściwej części jest szybsze i łatwiejsze. Aby uzyskać szczegółowe

Bardziej szczegółowo

Optymalizacja ciągła

Optymalizacja ciągła Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej

Bardziej szczegółowo

Archiwum DG 2016 PL-SOFT

Archiwum DG 2016 PL-SOFT 2 1 to kompleksowe narzędzie ochrony Twoich danych genealogicznych utworzonych w programie Drzewo genealogiczne. Aplikacja nie wymaga instalacji na komputerze i jest uruchamiana bezpośrednio z dysku USB.

Bardziej szczegółowo

Wprowadzenie do baz danych

Wprowadzenie do baz danych Wprowadzenie do baz danych Dr inż. Szczepan Paszkiel szczepanpaszkiel@o2.pl Katedra Inżynierii Biomedycznej Politechnika Opolska Wprowadzenie DBMS Database Managment System, System za pomocą którego można

Bardziej szczegółowo

Wstęp do poradnika metodycznego 5. 2. Przykładowy rozkład materiału 13 I rok nauczania...13 II rok nauczania...13 Rozkład materiału:...

Wstęp do poradnika metodycznego 5. 2. Przykładowy rozkład materiału 13 I rok nauczania...13 II rok nauczania...13 Rozkład materiału:... Spis treści Wstęp do poradnika metodycznego 5. Oprogramowanie wykorzystywane w podręczniku 7 Środowisko... 7 Narzędzia... 8. Przykładowy rozkład materiału 3 I rok nauczania...3 II rok nauczania...3 Rozkład

Bardziej szczegółowo

System plików przykłady. implementacji

System plików przykłady. implementacji Dariusz Wawrzyniak Plan wykładu CP/M MS DOS ISO 9660 UNIX NTFS System plików (2) 1 Przykłady systemu plików (1) CP/M katalog zawiera blok kontrolny pliku (FCB), identyfikujący 16 jednostek alokacji (zawierający

Bardziej szczegółowo

Program do wagi SmartScale

Program do wagi SmartScale Program do wagi SmartScale zarządzanie pomiarami zarządzanie towarami - dodawanie, usuwanie oraz wyszukiwanie towarów zarządzanie kontrahentami dodawanie i usuwanie oraz wyszukiwanie wydruki kwitów w trybie

Bardziej szczegółowo

KATEGORIA OBSZAR WIEDZY

KATEGORIA OBSZAR WIEDZY Moduł 3 - Przetwarzanie tekstów - od kandydata wymaga się zaprezentowania umiejętności wykorzystywania programu do edycji tekstu. Kandydat powinien wykonać zadania o charakterze podstawowym związane z

Bardziej szczegółowo

INTERNET - NOWOCZESNY MARKETING

INTERNET - NOWOCZESNY MARKETING STRONA INTERNETOWA TO JUŻ ZBYT MAŁO! INTERNET ROZWIJA SIĘ Z KAŻDYM DNIEM MÓWIMY JUŻ O: SEM Search Engine Marketing, czyli wszystko co wiąże się z marketingiem internetowym w wyszukiwarkach. SEM jest słowem

Bardziej szczegółowo

OPTYMALIZACJA SERWISÓW INTERNETOWYCH >>>WIĘCEJ<<<

OPTYMALIZACJA SERWISÓW INTERNETOWYCH >>>WIĘCEJ<<< INTERNETOWYCH. Wszystko O Pozycjonowaniu I Marketingu. >>>POZYCJONOWANIE STRON BYDGOSZCZ OPTYMALIZACJA SERWISÓW INTERNETOWYCH >>>WIĘCEJ

Bardziej szczegółowo

Wyszukiwanie plików w systemie Windows

Wyszukiwanie plików w systemie Windows 1 (Pobrane z slow7.pl) Bardzo często pracując na komputerze prędzej czy później łapiemy się na pytaniu - Gdzie jest ten plik? Zapisujemy i pobieramy masę plików i w nawale pracy pewne czynności są wykonywane

Bardziej szczegółowo

O słowach kluczowych prawie wszystko

O słowach kluczowych prawie wszystko O słowach kluczowych prawie wszystko prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski Sulejówek, 13 listopada 2014 r. Rola języka i

Bardziej szczegółowo

System kontroli wersji - wprowadzenie. Rzeszów,2 XII 2010

System kontroli wersji - wprowadzenie. Rzeszów,2 XII 2010 System kontroli wersji - wprowadzenie Rzeszów,2 XII 2010 System kontroli wersji System kontroli wersji (ang. version/revision control system) służy do śledzenia zmian głównie w kodzie źródłowym oraz pomocy

Bardziej szczegółowo