Eksploracja złożonych typów danych Text i Web Mining

Wielkość: px
Rozpocząć pokaz od strony:

Download "Eksploracja złożonych typów danych Text i Web Mining"

Transkrypt

1 Eksploracja złożonych typów danych Text i Web Mining Jerzy Stefanowski Instytut Informatyki Politechniki Poznańskiej Wykład AiED, Poznań 2002 Co będzie? Eksploracja danych tekstowych Wyszukiwanie informacji w tekstowych bazach danych Automatyczne przetwarzanie tekstów Web-mining klasyfikacja zadań Wyszukiwanie informacji w Internecie Podsumowanie Text a Web mining Text mining: Analiza i automatyczne przetwarzanie informacji przechowywanych w zbiorach dokumentów i tekstowych bazach danych; dokumenty z różnych źródeł i w różnych formatach Efektywne wyszukiwanie informacji w tekstowych bazach danych (ang. Information Retrieval) Web mining: Poszukiwanie i pozyskiwanie informacji z zasobów WWW, lecz także: analiza struktury powiązań zasobów WWW analiza sposobu korzystania z WWW przez użytkowników 1

2 Eksploracja tekstowych baz danych - motywacje Znacząca ilość informacji dostępna w postaci różnego rodzaju dokumentów, np.: artykuły, wiadomości, czasopisma, książki, biblioteki elektroniczne, e, news, zasoby WWW Dane tego typu nie są ustrukturalizowane lub ustrukturalizowane w niewielkim stopniu Rozmiary danych tekstowych rosną gwałtownie Problemy z wyszukiwaniem właściwej informacji Wyszukiwanie informacji (Information Retrieval) dziedzina rozwijana równolegle z typowymi bazami danych związana jest z organizacją i wyszukiwaniem informacji z bardzo dużej liczby dokumentów Typowe zadanie: znajdź właściwe dokumenty na podstawie zapytania użytkownika wyspecyfikowanego jako słowa kluczowe lub przykład dokumentu Różnice z systemami zarządzania baz danych (DBMS): DBMS obejmują dobrze zdefiniowane i ustrukturalizowane dane; Podstawowe zagadnienie efektywne przetwarzanie zapytań, zarządzanie transakcjami czy złożonymi obiektami, aktualizacja, itp. IR nieustrukturalizowane informacje, inne spojrzenie na zapytania; poszukiwanie przybliżone, automatyczna indeksacja termami słowami kluczowymi Tekstowe bazy danych modele i techniki indeksacji Model podstawowy: Dokument jest reprezentowany jako ciąg znaków, zbiór słów kluczowych (identyfikatorów, termów w modelu statystycznym) lub jako jednostki leksykalne Bezpośrednie przetwarzanie całego dokumentu (ciągu znaków) nie jest stosowane Reprezentacja za pomocą pojedynczych termów jest najbardziej popularna (tzw. wektory słów) Duże znaczenie doboru właściwych termów i automatycznej indeksacja dokumentów 2

3 Zapytania w tekstowych bazach danych Zapytanie jest wyrażeniem zbudowanym ze słów kluczowych (termów) połączonych operatorami: np. tea or coffee, car and repair shop, DBMS but_not Oracle W najprostszym modelu zwraca się dokument zawierający lub opisany słowami kluczowymi Ograniczenia modelu słów kluczowych: Synonimy: słowo T nie pojawia się w dokumencie, pomimo że dokument jest ściśle związany z dziedziną lub słowem kluczowym T. Wielosynonimy: to samo słowo ma różne znaczenie w zależności od kontekstu jego użycia, np. mining. Inny typ zapytań: similarity-based retrieval znajdź podobne dokumenty na podstawie stopnia zgodności z termami charakteryzującymi dokumenty. Schemat działania systemu wyszukiwawczego Zapytanie Analiza formalna Charakterystyka wyszukiwawcza zapytania Obliczanie podobieństwa Indeksowane dokumenty Indekser dokumentów Baza dokumentów Odszukane podobne dokumenty Automatyczna indeksacja dokumentów Indeksowanie polega na przypisaniu dokumentowi zbioru identyfikatorów, słów kluczowych charakteryzujących temat lub przedmiot dokumentu i wyrażeniu ich w odpowiednim języku informacyjno-wyszukującym Indeksowanie manualne (eksperci) vs. automatyczne kontrolowane stosowanie odpowiednich słowników, list terminologicznych obiektywne i nieobiektywne identyfikatory tekstów 3

4 Struktura tekstów naukowych Struktura dokumentów WWW <html> <head> <meta http-equiv="content-type" content="text/html; charset=iso "> <meta name="subject" content="strona osobista Jerzego Stefanowskiego"> <meta name="author" content="jerzy Stefanowski"> <meta name="description" content="this page contains main information on machine learning, knowledge discovery and data mining. The process of knowledge discovery from databases is discussed. Basic methods of discovering various knowledge representations are presented....> <meta name="keywords" content="sztuczna inteligencja, artificial inteligence,...> <title>jerzy Stefanowski's Knowledge Discovery Page</title> <!-- stefan.html, November 29,2001 Jerzy Stefanowski--> </head>... Identyfikatory tekstów Obiektywne identyfikatory to np.: nazwiska autorów, tytuł pracy, miejsce wydania, nazwa wydawcy, data publikacji, długość, liczba stron, bibliograficzne dane katalogowe. Inne identyfikatory dotyczą przedmiotu i zawartości tekstu wybór i stopień ich użyteczności jest różnie realizowany 4

5 Miary oceny systemów wyszukiwania informacji Dokładność (Precision, P) określa stopień, w jakim odnalezione dokumenty pasują do zapytania P = [ Re levant Re trieved] [ Retrieved] Kompletność (Recall, R) określa jaka część dokumentów pasujących do zapytania została odnaleziona [ Relevant Retrieved] R = [ Relevant] [Retrieved] zbiór odnalezionych dokumentów, [Relevant] zbiór dokumentów pasujących do zapytania Indeksacja pojedynczych termów Podstawowe założenie: Częstotliwość występowania różnych słów w tekście jest związana z ważnością tych słów dla reprezentacji treści Prosty schemat indeksacji: Oblicz Freq ji częstość termu T j w dokumencie D i Oblicz całkowitą częstość termu w zbiorze dokumentów TotalFre j = Σ i Freq ji dla i = 1,2,..., n. Uporządkować termy według całkowitej częstości Wyeliminować termy o zbyt wysokiej i zbyt niskiej częstości Pozostałe termy użyć jako termy indeksujące Wady tego podejścia? Analiza języka naturalnego, podział na termy, cd. Stop listy: Słowa pospolite często występujące w różnych dokumentach, a nie mające znaczenia dla treści tekstu. W języki angielskim np. a, the, and, at, for, no, not, of, there, to, with... analiza gramatyczna dostarcza stop-lists, głównie dla języka angielskiego. Stop listy różnią się dla specjalizowanych zbiorów dokumentów, np. teksty prawne: article lub paragraph. Analiza tzw. language corpus. Lematyzacja (ang. steming): Słowa są zbudowane jako syntaktyczne warianty pewnego podstawowego podsłowa, rdzenia tzw. tematu; np. słowa play, playing, plays, played, player posiadają wspólny temat play Analiza tematów dobrze rozwinięta dla języka angielskiego, np. algorytm PorterStemmer. W innych językach potrzebne bardziej specjalizowane podejścia, problemy w języku polskim. Potrzeba automatycznego rozpoznawania języka dokumentu. Stosowanie tzw. tezaurusów dla zastępowania niektórych słów szczegółowych terminami ogólniejszymi (np. WordNet) 5

6 Schemat doboru termów Bardziej praktyczny schemat indeksacji: 1. Zidentyfikuj pojedyncze słowa w tekście. 2. Wyeliminuj popularne słowa za pomocą stop list. 3. Użyj lematyzacji dla ograniczenia pozostałych słów do ich podstawowych tematów. 4. Dla wszystkich pozostałych termów T j w każdym dokumencie D i oblicz częstość tf ij jako liczbę wystąpień T j w D i. 5. Wybrać progową częstość T, i przypisać każdemu dokumentowi D i wszystkie termy T j dla których tf ij > T. Czy to jest wystarczające? Miary oceny termów Schematy indeksacji oparte na termach z wysoką częstością są dogodne ze względu na miarę kompletności. Dla miary precyzji dogodne dla indeksacji - tylko jeżeli częste termy występują nierównomiernie w zbiorze dokumentów. Precyzja jest raczej wyższa dla termów rzadko występujących w zbiorze dokumentów! Wykorzystuje się miarę df j liczba dokumentów w zbiorze N dokumentów, w których występuję term T j. Oblicza się tzw. odwrotną częstotliwość idf j = log(n/ df j ). Połączenie obu elementów indeksujących tf ij idf j spełnia oczekiwania wobec precyzji i kompletności wyszukiwania informacji. Wskaźnik ważności termu - tzw. waga termu: w ij = tf ij log(n/ df j ). Automatyczne indeksowanie Blueprint 1. Zidentyfikuj pojedyncze słowa w tekście. 2. Wyeliminuj popularne słowa za pomocą stop list. 3. Użyj lematyzacji dla ograniczenia pozostałych słów do ich podstawowych tematów. 4. Dla wszystkich pozostałych termów T j w każdym dokumencie D i oblicz współczynnik wagi termu w ij = tf ij log(n/ df j ). 5. Przypisz każdemu dokumentowi D i jego reprezentację za pomocą zbioru termów T, i wag im odpowiadającym w ij : D i {T 1, w i1 ;T 2, w i1 ;...; T t, w it } Więcej książka G. Salton Automatic Text Processing. 6

7 Wektorowy model przestrzeni termów Zbiór N dokumentów jest opisany za pomocą zbioru t termów indeksujących (ozn. T i ) Każdy dokument (zapytanie) D r (Q j ) jest reprezentowany jako wektor w t wymiarowej przestrzeni R t. j-ta składowa wektora, tzw. waga, jest liczbą wyrażającą związek (ważność) termu T i z danym dokumentu. 0 brak wystąpienia lub znaczenia termu w dokumencie, może być różnie obliczana. Zbiór dokumentów reprezentowany w przestrzeni wektorowej jako macierz (term-document matrix). T1 T2 L Tt D1 a11 a12 L a1t D2 a21 a22 L a2t M M M M M D N a N1 a N 2 L a Nt Ważenie termów / słów wagi jak dane słowo, lub term, jest charakterystyczne dla dokumentu? wiele różnych form: binarna w ij =1 lub w ij =0 częstość wystąpień - w ij =tf ij (t j ) tfidf (Salton) w ij =tf ij (t j )log(n/df ij (t j )) rola lematyzacji w procesie obliczania wag rola stop words w procesie obliczania wag macierz term-document (A) kolumny dokumenty wiersze słowa / termy Przykład macierz A 0.58 A = Źródło: Prezentacja Carrot2 Milestone report, Stanisław Osiński 7

8 Obliczanie podobieństwa Dokument D r =(a r1,a r2,...,a rt ) Zapytanie Qj=(q j1,q j2,...,q jt ) Podobieństwo wektorów x i y mierzone jako iloczyn x y = x y cosα Jeżeli termy są nieskorelowane T i T i = 1 to t sim( D r, Q j ) = k = 1a rk q jk sim( D Q ) = r j t k = 1a rk q jk 2 = 1 = 1 t t k ( a rk ) k ( q jk ) 2 miara kosinusowa mierzy kąt między wektorami; jest znormalizowana <-1,1> i niezależna od wielkości dokumentów oraz liczby przypisanych im termów Pojęcie bliskości w macierzy A jesteśmy zainteresowani kątem jaki tworzą między sobą wektory dokumentów Identyczny kąt dokumenty są złożone z identycznych słów dokumenty są podobne T t a j q a i= ijq 1 i cosθ j = = a t t j q a q i= 1 ij i= 1 i d j Θ q Źródło: Prezentacja Carrot2 Milestone report, Stanisław Osiński Przykład, c.d. ( ) T qˆ = 0.58 r = T 0.81 = T Źródło: Prezentacja Carrot2 Milestone report, Stanisław Osiński 8

9 Redukcja wymiaru danych Trudności w przetwarzaniu, indeksowaniu i przeszukiwaniu wielu dokumentów opisanych bardzo dużą liczbą termów Potrzeba redukcji wymiaru danych tekstowych: Latent Sematic Indexing Podobne dokumenty mają podobne częstości słów. Macierz czestości dokumentów i termów należy transformować (SVD singular value decomposition) do postaci iloczynu trzech macierzy A,S,B, gdzie A i B mają ortogonalne kolumny a S jest macierzą diagonalną; Uwzględnia się tylko k [100,300] największych wartości S, tworząc nową macierz X rzędu k najbliższą oryginalnej macierzy Stosowane także inne algorytmy, np. grupowania lub SOM Dekompozycja SVD pomijając szczegóły matematyczne kolumny macierzy U tworzą ortogonalną bazę w przestrzeni kolumn macierzy A wektory te wykazują podobieństwo do tematów obecnych w A = A = U Σ T V Źródło: Prezentacja Carrot2 Milestone report, Stanisław Osiński Przykład Lingo 0.65 U = P = Zakładamy, że r A = 2 (tzn, pod uwagę brane są dwa pierwsze wektory kolumnowe macierzy U). Źródło: Prezentacja Carrot2 Milestone report, Stanisław Osiński 9

10 Typowe zadania w Text - Mining Wyszukiwanie dokumentów Znajdź p dokumentów najbliższych zapytaniu Q Określ podobieństwo dwóch dokumentów Rangowanie ważności różnych dokumentów Grupowanie (poszukiwanie klasyfikacji) dokumentów Algorytmy grupowania, zwłaszcza hierarchiczne, wykorzystujące termy Także grupowanie dokumentów na podstawie podobieństw wynikających ze wspólnych autorów, źródła pochodzenia Automatycznie klasyfikowanie dokumentów Analiza powiązań zależności między jednostkami tekstu Analiza dokumentów WWW lub XML WWW: Stan aktualny Ogromna baza informacji, lecz nieustrukturalizowane, niejednorodne i rozproszone środowisko; Gwałtownie i dynamicznie rozwijające się zasoby: średnio 1 nowy serwer co 2 godziny 5 milionów stron WWW w milionów w mld dokumentów w 2001 Szybka dezaktualizacja wskaźników i opisów Potrzeba lepszych narzędzi odkrywania wiedzy o zawartości i zasobach. Hosts Internet growth Sep-69 Sep-72 Sep-75 Sep-78 Sep-81 Sep-84 Sep-87 Sep-90 Sep-93 Sep-96 Sep-99 The Asilomar Report urges the database research community to contribute in deploying new technologies for resource and information retrieval from the World-Wide Web. WWW: Wyzwania Przykład wzrostu danych: Yahoo! (Kohavi2000) Obsługuje ponad 680 milion żądań stron dziennie. Dane w Web log data narastają w tempie do 6GB/h! Olbrzymie zasoby informacji: artykuły, czasopisma (Elsievier), wiadomości (CNN), sklepy internetowe (Amazon), usługi finansowe (banki, giełda) podróże i usługi turystyczne WWW gigantyczny zbiór dokumentów, także zawierający informacje o powiązaniach (hyper-links); informacje o dostępie i sposobie użycia zasobów 10

11 Web Mining Klasyfikacja zadań Web Mining Web Content Mining Web Structure Mining Web Usage Mining Web Page Content Mining Search Result Mining General Access Pattern Tracking Customized Usage Tracking wg. J.Han, Data mining Web-mining: Wyszukiwanie informacji w serwisach WWW Internet olbrzymia ilość informacji, lecz gdzie i jak znaleźć to co Nas interesuje? Różnego rodzaju serwisy wspomagające wyszukiwanie: Multiwyszukiwarki Pojedyncze wyszukiwarki pokrywają mała cześć zasobów; Wyszukiwarki udzielają różnych odpowiedzi na te same zapytanie Multiwyszukiwarki (metawyszukiwarki) kierują te same zapytanie jednocześnie do kilku wyszukiwarek 11

12 Prezentacja wyników Interfejs większości wyszukiwarek udostępnia rankingową listę dokumentów Dokumenty opisane podstawowymi informacjami: adres URL, tytuł dokumentu, streszczenie lub opis dokumentu, data/rozmiar.., tzw. ranking Ranking dokumentów jest przygotowywany: dynamicznie podobieństwo między zapytaniem a dokumentem statycznie (przygotowany off-line): opinie redaktorów, popularność, zawartość informacyjna, PageRank, lokalizacja,... Ograniczenia list rankingowych Idea grupowania wyników zapytań Ranked-list presentation Grouping engine (post-search clustering) Salsa:foods Salsa:dance inne kategorie Więcej: www-idss.cs.put.poznan.pl/carrot 12

13 Grupowanie odpowiedzi na zapytania Co dalej? Obecne narzędzia ograniczone do przetwarzania informacji tekstowych. Wyszukiwarki do przetwarzania informacji multimedialnych!? Możemy zapytać : Kogo przedstawia to zdjęcie? Lub poprosić : Odnajdź podobne Gdzie szukać dalej? Książki G. Salton: Automatic Text Processing. J. Han, M. Kamber: Data mining. M. Kłopotek: Inteligentne wyszukiwarki internetowe. Internet (spójrz tam na podkatalog publications) Inne wiele, np. 13

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie

Bardziej szczegółowo

Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1

Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1 Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia

Bardziej szczegółowo

Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych

Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące

Bardziej szczegółowo

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Główną Uniwersytetu Medycznego w Poznaniu. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Uniwersytetu Jagiellońskiego. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i w jednym miejscu.

Bardziej szczegółowo

Odkrywanie niewidzialnych zasobów sieci

Odkrywanie niewidzialnych zasobów sieci Odkrywanie niewidzialnych zasobów sieci Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy II seminarium z cyklu INFOBROKER: Wyszukiwanie i przetwarzanie cyfrowych

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Semantyczne podobieństwo stron internetowych

Semantyczne podobieństwo stron internetowych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana

Bardziej szczegółowo

Analiza danych tekstowych i języka naturalnego

Analiza danych tekstowych i języka naturalnego Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach

Bardziej szczegółowo

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można jednak wyróżnić 3 główne elementy, które brane są pod uwagę:

Bardziej szczegółowo

Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe Wykład 8: Wyszukiwarki internetowe Marcin Bieńkowski Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe (II UWr) Wykład 8 1 / 37 czyli jak znaleźć igłę w sieci Sieci komputerowe

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Tomasz Grześ. Systemy zarządzania treścią

Tomasz Grześ. Systemy zarządzania treścią Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,

Bardziej szczegółowo

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB IX Krajowe Forum Informacji Naukowej i Technicznej Zakopane wrzesień 2007 Biblioteka CIOP-PIB Biblioteka CIOP-PIB

Bardziej szczegółowo

METODY INDEKSOWANIA DOKUMENTÓW TEKSTOWYCH W SYSTEMACH WEBOWYCH

METODY INDEKSOWANIA DOKUMENTÓW TEKSTOWYCH W SYSTEMACH WEBOWYCH Indeksowanie, Indeks Inwersyjny Grupowanie, Pliki Podpisu Daniel Halikowski METODY INDEKSOWANIA DOKUMENTÓW TEKSTOWYCH W SYSTEMACH WEBOWYCH Zasoby sieci Internet to miliardy plików zlokalizowanych na całym

Bardziej szczegółowo

Indeksowanie full text search w chmurze

Indeksowanie full text search w chmurze Prezentacja przygotowana dla: 5. Konferencja MIC w Poznaniu, 16.06.20111 Lucene.NET Indeksowanie full text search w chmurze K2 i Windows Azure dlaczego dla nas to możliwe? 1. Mamy unikalne połącznie kompetencji

Bardziej szczegółowo

Alicja Marszałek Różne rodzaje baz danych

Alicja Marszałek Różne rodzaje baz danych Alicja Marszałek Różne rodzaje baz danych Rodzaje baz danych Bazy danych można podzielić wg struktur organizacji danych, których używają. Można podzielić je na: Bazy proste Bazy złożone Bazy proste Bazy

Bardziej szczegółowo

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite Tomasz Boiński: 1 Pozycjonowanie stron i zastosowanie mod_rewrite Pozycjonowanie stron Promocja strony odbywa się poprzez umiejscowienie jej jak najwyżej w wynikach wyszukiwania Wyszukiwarki indeksują

Bardziej szczegółowo

Baza PEDAGOG narzędziem edukacji informacyjnej w bibliotece

Baza PEDAGOG narzędziem edukacji informacyjnej w bibliotece Baza PEDAGOG narzędziem edukacji informacyjnej w bibliotece akademickiej Danuta Szewczyk-Kłos Biblioteka Główna Uniwersytetu Opolskiego Bibliograficzne bazy danych i ich rola w rozwoju nauki Biblioteka

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych

Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych Jak Nas widzą, tak Nas piszą Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych Warszawa Maj 2013 Plan prezentacji 1. Stan informacji naukowej w zakresie nauk technicznych w Polsce 2. Koncepcja systemu

Bardziej szczegółowo

Internetowa strategia marketingowa

Internetowa strategia marketingowa Strategie Marketingowe Marketing Internetowy dr Grzegorz Szymański Internetowa strategia marketingowa Pozycjonowanie Jest to jedna z najskuteczniejszych i najtańszych metod reklamy w Internecie. Skuteczne

Bardziej szczegółowo

EBSCO Discovery Service - przewodnik

EBSCO Discovery Service - przewodnik Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka... 1 O multiwyszukiwarce... 2 Przeszukiwane źródła... 2 Jak rozpocząć korzystanie?... 2 Wyszukiwanie zaawansowane... 3 Zawężanie

Bardziej szczegółowo

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak Wyszukiwanie boolowskie i strukturalne Adam Srebniak Wyszukiwanie boolowskie W wyszukiwaniu boolowskim zapytanie traktowane jest jako zdanie logiczne. Zwracane są dokumenty, dla których to zdanie jest

Bardziej szczegółowo

Specjalnościowy Obowiązkowy Polski Semestr VI

Specjalnościowy Obowiązkowy Polski Semestr VI KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 0/06 Z-ID-608a Anaiza danych niestrukturanych Unstructured Data Anaysis A. USYTUOWANIE

Bardziej szczegółowo

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Wydział Informatyki i Zarządzania Politechnika Wrocławska kazienko@pwr.wroc.pl Dlaczego eksploracja danych w serwisach internetowych? Kanały

Bardziej szczegółowo

Bazy Danych. C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000

Bazy Danych. C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000 Bazy Danych LITERATURA C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000 J. D. Ullman, Systemy baz danych, WNT - W-wa, 1998 J. D. Ullman, J. Widom, Podstawowy

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

Pobieranie i przetwarzanie treści stron WWW

Pobieranie i przetwarzanie treści stron WWW Eksploracja zasobów internetowych Wykład 2 Pobieranie i przetwarzanie treści stron WWW mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Jedną z funkcji silników wyszukiwania danych, a właściwie ich modułów

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Ekran Wyszukiwania Podstawowego w multiwyszukiwarce EBSCO Discovery Service zapewnia dostęp poprzez jedno okienko wyszukiwawcze na platformie EBSCOhost do wszystkich zasobów biblioteki. Na ekranie do wyszukiwania

Bardziej szczegółowo

Informatyka wspomaga przedmioty ścisłe w szkole

Informatyka wspomaga przedmioty ścisłe w szkole Informatyka wspomaga przedmioty ścisłe w szkole Prezentuje : Dorota Roman - Jurdzińska W arkuszu I na obu poziomach występują dwa zadania związane z algorytmiką: Arkusz I bez komputera analiza algorytmów,

Bardziej szczegółowo

Transformacja wiedzy w budowie i eksploatacji maszyn

Transformacja wiedzy w budowie i eksploatacji maszyn Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces

Bardziej szczegółowo

Jak przetrwać w "wieku informacji"? [sieciowej]

Jak przetrwać w wieku informacji? [sieciowej] II Forum Wiedzy Interdyscyplinarnej im. J. J. Śniadeckich Bydgoszcz - Żnin, 28-29.04.2004 Jak przetrwać w "wieku informacji"? [sieciowej] Żyć i działać we współczesnym świecie to znaczy korzystać z informacji

Bardziej szczegółowo

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie

Bardziej szczegółowo

Metadane. Przykry obowiązek czy przydatny zasób?

Metadane. Przykry obowiązek czy przydatny zasób? Metadane Przykry obowiązek czy przydatny zasób? A D A M I W A N I A K Administracja publiczna a ustawa o Infrastrukturze Informacji Przestrzennej, Kielce, 13-14 października 2011 r. Problem nadmiaru informacji

Bardziej szczegółowo

Wyszukiwanie w czasie rzeczywistym sposób na zwiększenie widoczności zasobów bibliotek cyfrowych w wyszukiwarkach internetowych Karolina Żernicka

Wyszukiwanie w czasie rzeczywistym sposób na zwiększenie widoczności zasobów bibliotek cyfrowych w wyszukiwarkach internetowych Karolina Żernicka Wyszukiwanie w czasie rzeczywistym sposób na zwiększenie widoczności zasobów bibliotek cyfrowych w wyszukiwarkach internetowych Karolina Żernicka Instytut Informacji Naukowej i Bibliologii Uniwersytet

Bardziej szczegółowo

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

Wyszukiwanie w Katalogu Bibliotek PW za pomocą multiwyszukiwarki Primo

Wyszukiwanie w Katalogu Bibliotek PW za pomocą multiwyszukiwarki Primo Wyszukiwanie w Katalogu Bibliotek PW za pomocą multiwyszukiwarki Primo Aby znaleźć potrzebne książki i czasopisma, skorzystaj ze wspólnego katalogu Biblioteki Głównej, jej filii oraz większości bibliotek

Bardziej szczegółowo

Ontologie, czyli o inteligentnych danych

Ontologie, czyli o inteligentnych danych 1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania

Bardziej szczegółowo

Baza danych. Modele danych

Baza danych. Modele danych Rola baz danych Systemy informatyczne stosowane w obsłudze działalności gospodarczej pełnią funkcję polegającą na gromadzeniu i przetwarzaniu danych. Typowe operacje wykonywane na danych w systemach ewidencyjno-sprawozdawczych

Bardziej szczegółowo

Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:

Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2: Wstęp Jednym z typowych zastosowań metod sztucznej inteligencji i uczenia maszynowego jest przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP), której typowych przykładem jest analiza

Bardziej szczegółowo

Sieciowe usługi informacyjne dla nauk technicznych BazTech, BazTOL

Sieciowe usługi informacyjne dla nauk technicznych BazTech, BazTOL Sieciowe usługi informacyjne dla nauk technicznych BazTech, BazTOL Lidia Derfert-Wolf Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy IX Krajowe Forum Informacji Naukowej i Technicznej Wymiana informacji

Bardziej szczegółowo

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu XXVIII Letnia Szkoła Naukowa Metodologii Nauk Empirycznych Zakopane, 12-14.05.2014 Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu Maciej Zaborowicz Instytut Inżynierii

Bardziej szczegółowo

SPIS TREŚCI Funkcje systemu operacyjnego Zapewnia obsługę dialogu między użytkownikiem a komputerem Nadzoruje wymianę informacji między poszczególnymi urządzeniami systemu komputerowego Organizuje zapis

Bardziej szczegółowo

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

CLARIN rozproszony system technologii językowych dla różnych języków europejskich CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN

Bardziej szczegółowo

Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych dr inż. Adam Iwaniak Infrastruktura Danych Przestrzennych w Polsce i Europie Seminarium, AR Wrocław

Bardziej szczegółowo

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38 Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem zajęcia 1 dr Jakub Boratyński pok. A38 Program zajęć Bazy danych jako podstawowy element systemów informatycznych wykorzystywanych

Bardziej szczegółowo

Czytelnik w bibliotece cyfrowej

Czytelnik w bibliotece cyfrowej Czytelnik w bibliotece cyfrowej Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe IV Warsztaty Biblioteki Cyfrowe Poznań, 2007 Do czego służy Aplikacja Czytelnika? Udostępnianie zasobów cyfrowych

Bardziej szczegółowo

Badanie struktury sieci WWW

Badanie struktury sieci WWW Eksploracja zasobów internetowych Wykład 1 Badanie struktury sieci WWW mgr inż. Maciej Kopczyński Białystok 214 Rys historyczny Idea sieci Web stworzona została w 1989 przez Tima BernersaLee z CERN jako

Bardziej szczegółowo

Baza danych. Baza danych to:

Baza danych. Baza danych to: Baza danych Baza danych to: zbiór danych o określonej strukturze, zapisany na zewnętrznym nośniku (najczęściej dysku twardym komputera), mogący zaspokoić potrzeby wielu użytkowników korzystających z niego

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

INFORMATYKA Pytania ogólne na egzamin dyplomowy

INFORMATYKA Pytania ogólne na egzamin dyplomowy INFORMATYKA Pytania ogólne na egzamin dyplomowy 1. Wyjaśnić pojęcia problem, algorytm. 2. Podać definicję złożoności czasowej. 3. Podać definicję złożoności pamięciowej. 4. Typy danych w języku C. 5. Instrukcja

Bardziej szczegółowo

Primo: Oblicze nowoczesnej biblioteki Biblioteki. Primo. Olsztyn 21.09.2010. Maciej Dziubecki Aleph Polska Sp. z o.o.

Primo: Oblicze nowoczesnej biblioteki Biblioteki. Primo. Olsztyn 21.09.2010. Maciej Dziubecki Aleph Polska Sp. z o.o. Primo Primo: Oblicze nowoczesnej biblioteki Biblioteki Olsztyn 21.09.2010 Maciej Dziubecki Aleph Polska Sp. z o.o. Dogonid Google? Lidia Derfert-Wolf Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy

Bardziej szczegółowo

Pytania SO Oprogramowanie Biurowe. Pytania: Egzamin Zawodowy

Pytania SO Oprogramowanie Biurowe. Pytania: Egzamin Zawodowy Pytania SO Oprogramowanie Biurowe Pytania: Egzamin Zawodowy Pytania SO Oprogramowanie Biurowe (1) Gdzie w edytorze tekstu wprowadza się informację lub ciąg znaków, który ma pojawić się na wszystkich stronach

Bardziej szczegółowo

Bazy danych - wykład wstępny

Bazy danych - wykład wstępny Bazy danych - wykład wstępny Wykład: baza danych, modele, hierarchiczny, sieciowy, relacyjny, obiektowy, schemat logiczny, tabela, kwerenda, SQL, rekord, krotka, pole, atrybut, klucz podstawowy, relacja,

Bardziej szczegółowo

Wrocławska Wyższa Szkoła Informatyki Stosowanej. Bazy danych. Dr hab. inż. Krzysztof Pieczarka. Email: krzysztof.pieczarka@gmail.

Wrocławska Wyższa Szkoła Informatyki Stosowanej. Bazy danych. Dr hab. inż. Krzysztof Pieczarka. Email: krzysztof.pieczarka@gmail. Wrocławska Wyższa Szkoła Informatyki Stosowanej Bazy danych Dr hab. inż. Krzysztof Pieczarka Email: krzysztof.pieczarka@gmail.com Literatura: Connoly T., Begg C., Systemy baz danych Praktyczne metody projektowania,

Bardziej szczegółowo

Program wykładu. zastosowanie w aplikacjach i PL/SQL;

Program wykładu. zastosowanie w aplikacjach i PL/SQL; Program wykładu 1 Model relacyjny (10 godz.): podstawowe pojęcia, języki zapytań (algebra relacji, relacyjny rachunek krotek, relacyjny rachunek dziedzin), zależności funkcyjne i postaci normalne (BCNF,

Bardziej szczegółowo

Analiza internetowa czyli Internet jako hurtownia danych

Analiza internetowa czyli Internet jako hurtownia danych Analiza internetowa czyli Internet jako hurtownia danych Agenda 1. Hurtownie danych, eksploracja danych i OLAP 3. Internet 5. Analiza Internetowa 7. Google Analytics 9. Podsumowanie Hurtownie danych (definicja)

Bardziej szczegółowo

Jacek Tomaszczyk Instytut Bibliotekoznawstwa i Informacji Naukowej Uniwersytet Śląski

Jacek Tomaszczyk Instytut Bibliotekoznawstwa i Informacji Naukowej Uniwersytet Śląski Jacek Tomaszczyk Instytut Bibliotekoznawstwa i Informacji Naukowej Uniwersytet Śląski Terminologia 1. Terminologia jako dyscyplina naukowa. 2. Terminologia jako zbiór terminów (słownictwo specjalistyczne).

Bardziej szczegółowo

Netsprint Search. Koncepcja

Netsprint Search. Koncepcja Netsprint Search Koncepcja Netsprint - fakty 10-letnie doświadczenie Pierwsza firma, która wprowadziła silnik wyszukiwawczy w Polsce Pierwszy polski zaawansowany system reklamy kontekstowej (XI 2005) Pierwsze

Bardziej szczegółowo

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu. Technologie cyfrowe Artur Kalinowski Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.pl Semestr letni 2014/2015 Usługi internetowe usługa internetowa (ang.

Bardziej szczegółowo

POZYCJONOWANIE W WYSZUKIWARKACH APTEK INTERNETOWYCH

POZYCJONOWANIE W WYSZUKIWARKACH APTEK INTERNETOWYCH ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 605 STUDIA INFORMATICA NR 25 2010 PIOTR JÓZWIAK GRZEGORZ SZYMAŃSKI Politechnika Łódzka POZYCJONOWANIE W WYSZUKIWARKACH APTEK INTERNETOWYCH Pozycjonowanie

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Pojęcie systemu informacyjnego i informatycznego

Pojęcie systemu informacyjnego i informatycznego BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego DANE wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. SYSTEM

Bardziej szczegółowo

Definicja Głębokiego Internetu

Definicja Głębokiego Internetu Anna Zych Plan prezentacji Wstęp Definicja Głębokiego Internetu Dlaczego niewidzialne dla wyszukiwarek? Co zawiera Głęboki Internet Strategie wyszukiwawcze Narzędzia wyszukiwawcze Przyszłość Niewidzialnego

Bardziej szczegółowo

1 Wprowadzenie do J2EE

1 Wprowadzenie do J2EE Wprowadzenie do J2EE 1 Plan prezentacji 2 Wprowadzenie do Java 2 Enterprise Edition Aplikacje J2EE Serwer aplikacji J2EE Główne cele V Szkoły PLOUG - nowe podejścia do konstrukcji aplikacji J2EE Java 2

Bardziej szczegółowo

Wykład V. Rzut okiem na języki programowania. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład V. Rzut okiem na języki programowania. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład V Rzut okiem na języki programowania 1 Kompilacja vs. interpretacja KOMPILACJA Proces, który przetwarza program zapisany w języku programowania,

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Dane w postaci grafów Przykład: social network 3 Przykład: media network 4 Przykład: information network

Bardziej szczegółowo

Pojęcie bazy danych funkcje i możliwości

Pojęcie bazy danych funkcje i możliwości Pojęcie bazy danych funkcje i możliwości Baza danych to zbiór informacji zapisanych w ściśle określony sposób w strukturach odpowiadających założonemu modelowi danych. W potocznym ujęciu obejmuje dane

Bardziej szczegółowo

Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie

Bardziej szczegółowo

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia ZP/ITS/11/2012 Załącznik nr 1a do SIWZ ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia Przedmiotem zamówienia jest: Przygotowanie zajęć dydaktycznych w postaci kursów e-learningowych przeznaczonych

Bardziej szczegółowo

Wyszukiwanie informacji

Wyszukiwanie informacji Wyszukiwanie informacji Informatyka Temat 1 Krotoszyn, wrzesień 2015 r. 1 Informatyka 1 Przeszukiwanie zasobów internetowych Krotoszyn, 2015 r. Spis treści prezentacji 1. Wprowadzenie 2. Gdzie szukać informacji?

Bardziej szczegółowo

CLUSTERING. Metody grupowania danych

CLUSTERING. Metody grupowania danych CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Skrócona instrukcja obsługi

Skrócona instrukcja obsługi Web of Science Skrócona instrukcja obsługi ISI WEB OF KNOWLEDGE SM Można przeszukiwać ponad 9 00 czasopism w ponad językach z różnych dziedzin nauk ścisłych, społecznych i humanistycznych, aby znaleźć

Bardziej szczegółowo

Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki. Paweł Parys. Nr albumu: 209216. Aukcjomat

Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki. Paweł Parys. Nr albumu: 209216. Aukcjomat Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Paweł Parys Nr albumu: 209216 Aukcjomat Praca licencjacka na kierunku INFORMATYKA w zakresie INFORMATYKA Praca wykonana pod kierunkiem

Bardziej szczegółowo

Baza Cytowań POL-index założenia i cele

Baza Cytowań POL-index założenia i cele Baza Cytowań POL-index założenia i cele Wojciech Fenrich Centrum Promocji Informatyki, Warszawa, 20 listopada 2013 Plan wystąpienia Geneza systemu POL-index Zakres i przepływ danych w systemie Polski Współczynnik

Bardziej szczegółowo

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy ogólny Rodzaj zajęć: wykład, laboratorium BAZY DANYCH Databases Forma studiów: Stacjonarne

Bardziej szczegółowo

I rok. semestr 1 semestr 2 15 tyg. 15 tyg. Razem ECTS. laborat. semin. ECTS. konwer. wykł. I rok. w tym. Razem ECTS. laborat. semin. ECTS. konwer.

I rok. semestr 1 semestr 2 15 tyg. 15 tyg. Razem ECTS. laborat. semin. ECTS. konwer. wykł. I rok. w tym. Razem ECTS. laborat. semin. ECTS. konwer. Wydział Informatyki i Nauki o Materiałach Kierunek Informatyka studia I stopnia inżynierskie studia stacjonarne 08- IO1S-13 od roku akademickiego 2015/2016 A Lp GRUPA TREŚCI PODSTAWOWYCH kod Nazwa modułu

Bardziej szczegółowo

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład XI

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład XI Wrocław 2006 INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład XI Paweł Skrobanek C-3, pok. 323 e-mail: pawel.skrobanek@pwr.wroc.pl INTERNETOWE BAZY DANYCH 1. Wprowadzenie 2. Wybrana aspekty optymalizacji

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka daje możliwość jednoczesnego przeszukania większości baz udostępnianych w Politechnice Lubelskiej oraz katalogu Biblioteki PL. Przeszukiwane

Bardziej szczegółowo

Architektury Usług Internetowych. Wyszukiwanie usług w systemie BeesyCluster

Architektury Usług Internetowych. Wyszukiwanie usług w systemie BeesyCluster Architektury Usług Internetowych laboratorium nr 6: Wyszukiwanie usług w systemie BeesyCluster Jakub Kuryłowicz, dr inż. Paweł Czarnul jakub.kurylowicz@eti.pg.gda.pl, pczarnul@eti.pg.gda.pl Katedra Architektury

Bardziej szczegółowo

Unconventional Clinical Insight engine

Unconventional Clinical Insight engine ClinicalKey to nie tylko konwencjonalna wyszukiwarka To zintegrowana platforma informacji medycznej z wyszukiwarką wewnątrz wyszukiwarki Unconventional Clinical Insight engine Przy projektowaniu uwzględniliśmy

Bardziej szczegółowo

Bazy danych 2. Wykład 1

Bazy danych 2. Wykład 1 Bazy danych 2 Wykład 1 Sprawy organizacyjne Materiały i listy zadań zamieszczane będą na stronie www.math.uni.opole.pl/~ajasi E-mail: standardowy ajasi@math.uni.opole.pl Sprawy organizacyjne Program wykładu

Bardziej szczegółowo

WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE. Filip Makowiecki filip.makowiecki@ceo.org.pl

WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE. Filip Makowiecki filip.makowiecki@ceo.org.pl WYSZUKIWANIE INFORMACJI W INTERNECIE I ICH WYKORZYSTANIE Filip Makowiecki filip.makowiecki@ceo.org.pl DO CZEGO WYKORZYSTUJEMY INTERNET? Aktywność Polaków w sieci (Oriaq, 2010) Własny ślad w internecie

Bardziej szczegółowo

Systemy GIS Tworzenie zapytań w bazach danych

Systemy GIS Tworzenie zapytań w bazach danych Systemy GIS Tworzenie zapytań w bazach danych Wykład nr 6 Analizy danych w systemach GIS Jak pytać bazę danych, żeby otrzymać sensowną odpowiedź......czyli podstawy języka SQL INSERT, SELECT, DROP, UPDATE

Bardziej szczegółowo

Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II

Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II Zespół TI Instytut Informatyki Uniwersytet Wrocławski ti@ii.uni.wroc.pl http://www.wsip.com.pl/serwisy/ti/ Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II Rozkład wymagający

Bardziej szczegółowo

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d. TECHNOLOGIE BAZ DANYCH WYKŁAD 1 Wprowadzenie do baz danych. Normalizacja. (Wybrane materiały) Dr inż. E. Busłowska Definicja bazy danych Uporządkowany zbiór informacji, posiadający własną strukturę i wartość.

Bardziej szczegółowo

Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I

Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I Zespół TI Instytut Informatyki Uniwersytet Wrocławski ti@ii.uni.wroc.pl http://www.wsip.com.pl/serwisy/ti/ Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I Rozkład zgodny

Bardziej szczegółowo

Co, kto, kiedy, jak, gdzie? Metadane. Metodyka opracowania i stosowania metadanych w Polsce

Co, kto, kiedy, jak, gdzie? Metadane. Metodyka opracowania i stosowania metadanych w Polsce Metodyka opracowania i stosowania metadanych w Polsce Adam Iwaniak Szkolenie w Luboradzy, ZCPWZ, 12-13.02.2009r. Metadane Metadane sumaryczny opis lub charakterystyka zbioru danych. Odpowiedź na pytania:

Bardziej szczegółowo

Wykład XII. optymalizacja w relacyjnych bazach danych

Wykład XII. optymalizacja w relacyjnych bazach danych Optymalizacja wyznaczenie spośród dopuszczalnych rozwiązań danego problemu, rozwiązania najlepszego ze względu na przyjęte kryterium jakości ( np. koszt, zysk, niezawodność ) optymalizacja w relacyjnych

Bardziej szczegółowo

SERWISY BIBLIOTECZNE w perspektywie SEO

SERWISY BIBLIOTECZNE w perspektywie SEO Instytut Informacji Naukowej i Bibliotekoznawstwa Władysław Marek Kolasa SERWISY BIBLIOTECZNE w perspektywie SEO XI Ogólnopolska Konferencja Automatyzacja bibliotek pt. Biblioteki nowej generacji - nowoczesne

Bardziej szczegółowo

Baza danych BazTech historia, twórcy, zasoby

Baza danych BazTech historia, twórcy, zasoby http://baztech.icm.edu.pl/ Baza danych BazTech historia, twórcy, zasoby Dorota Buzdygan Biblioteka Politechniki Krakowskiej VI Ogólnopolska Konferencja Naukowa Informacja w świecie cyfrowym. Technologia

Bardziej szczegółowo

Multi-projekt z przedmiotów Inżynieria oprogramowania, Współczesne bazy danych i Programowanie w języku Java

Multi-projekt z przedmiotów Inżynieria oprogramowania, Współczesne bazy danych i Programowanie w języku Java Multi-projekt z przedmiotów Inżynieria oprogramowania, Współczesne bazy danych i Programowanie w języku Java Spis treści 1 Terminarz...3 2 Specyfikacja wymagań - założenia projektowe...4 2.1 Informacje

Bardziej szczegółowo