Technologie wyszukiwania pełnotekstowego

Podobne dokumenty
media Wyszukiwanie pełnotekstowe z wykorzystaniem Search Engine

Multimedialne bazy danych. Andrzej Łachwa, WFAiIS UJ 2011

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Szkolenie autoryzowane. MS 6232 Wdrażanie bazy danych Microsoft SQL Server 2008 R2

Full Text Search. Study Group Tomasz Libera

Tworzenie komponentów logiki biznesowej i warstwy dostępu do danych w oparciu o EJB3.0/JPA lub EJB 3.1/JPA2

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

Od uczestników szkolenia wymagana jest umiejętność programowania w języku C oraz podstawowa znajomość obsługi systemu Windows.

Od uczestników szkolenia wymagana jest umiejętność programowania w języku C oraz podstawowa znajomość obsługi systemu Linux.

PRZEWODNIK PO PRZEDMIOCIE

Architektura mikroserwisów na platformie Spring IO

Indeksowanie full text search w chmurze

*Grafomania z. Neo4j. Praktyczne wprowadzenie do grafowej bazy danych.

Modelowanie procesów biznesowych, przepływu pracy i wdrażanie aplikacji w oparciu o Jboss jbpm lub Activiti

Projekt: MS i CISCO dla Śląska

Front-end: solidne podstawy. Wszystko, co warto wiedzieć o HTML, CSS, JavaScript i Bootstrap.

Java Persistence API - zagadnienia zaawansowane

Referat pracy dyplomowej

Full Stack JavaScript z Angular i Nest. Dni: 5. Opis: Adresaci szkolenia

Tytuł szkolenia: Angular 4 - budowanie nowoczesnych i wydajnych aplikacji przeglądarkowych

Spis treści. Przedmowa

egroupware czy phpgroupware jest też mniej stabilny.

Ekspert MS SQL Server Oferta nr 00/08

Szkolenie wycofane z oferty. Apache Cassandra - modelowanie, wydajność, analiza danych

VMware vsphere 5.5: Install, Configure, Manage

Język SQL, zajęcia nr 1

Projektowanie i implementacja wysokowydajnych aplikacji w języku

TOPWEB SPSall Budowanie portalu intranetowego

VMware View: Desktop Fast Track [v5.1] Dni: 5. Opis: Adresaci szkolenia

Wyszukiwanie pełnotekstowe (Full-Text Search) w SQL Server

HP Matrix Operating Environment: Infrastructure Administration

Dni: 2. Partner merytoryczny. Opis: Adresaci szkolenia

EJB 3.0 (Enterprise JavaBeans 3.0)

Porównanie systemów zarządzania relacyjnymi bazami danych

SZKOLENIE TWORZENIE SYSTEMÓW

Projektowanie: architektura baz danych

REFERAT PRACY DYPLOMOWEJ

Podstawy frameworka Spring

Programowanie obiektowe

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

JBoss Application Server

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

WEBCON BPS Instalacja Standalone

WYKORZYSTANIE PRZESZUKIWANIA PEŁNOTEKSTOWEGO W KONSTRUKCJI APLIKACJI O ARCHITEKTURZE CIENKIEGO KLIENTA 1

Włodzimierz Dąbrowski, Przemysław Kowalczuk, Konrad Markowski. Bazy danych ITA-101. Wersja 1

Zadanie nr 4.5: Oprogramowanie bazodanowe. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia

ZSE - Systemy baz danych 1 SIECIOWE SERWERY BAZ DANYCH

Zajęcia prowadzone przez MCT, auditora wiodącego systemów bezpieczeństwa informacji.

Dni: 3. Opis: Adresaci szkolenia

Identity Management w Red Hat Enterprise Portal Platform. Bolesław Dawidowicz

HP Matrix Operating Environment Foundations

Dotacje na innowacje. Inwestujemy w waszą przyszłość.

Modelowanie procesów biznesowych, przepływu pracy oraz reguł biznesowych na przykładzie Drools i jbpm lub Activiti

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

Budowanie interfejsów do baz danych

Firebird Alternatywa dla popularnych darmowych systemów bazodanowych MySQL i Postgres

PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W NOWYM SĄCZU SYLABUS PRZEDMIOTU. Obowiązuje od roku akademickiego: 2011/2012

Szkolenie autoryzowane. MS Konfiguracja i zarządzanie Microsoft SharePoint 2010

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

Aplikacje webowe z wykorzystaniem Node.js oraz Express

Tematy projektów Edycja 2014

Bazy Danych. C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000

Migracja do PostgreSQL za pomocą narzędzi Enterprise DB

Seeon Enterprise Search Engine. Rozwiązanie obsługiwane przez eo Networks S.A.

Extranet narzędzie zapewniające kontrolę i usprawniające współpracę z oddziałami spółki oraz partnerami zewnętrznymi.

Need for speed. Kliknij, aby edytować style wzorca tekstu jak sobie radzić z dużą ilością użytkowników i danych

INFORMATYKA Pytania ogólne na egzamin dyplomowy

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

Aplikacje internetowe oparte na kluczowych technologiach Java Enterprise(Servlet,JSP,JDBC, )

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

Podyplomowe Studium Informatyki w Bizniesie Wydział Matematyki i Informatyki, Uniwersytet Łódzki specjalność: Tworzenie aplikacji w środowisku Oracle

e_talent innowacyjna aplikacja webowa do zarządzania rozwojem pracowników w organizacji Zespół ForUnit

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

KARTA PRZEDMIOTU. Procedury składowane w bazach danych D1_11

Opisy efektów kształcenia dla modułu

Produktywne tworzenie aplikacji webowych z wykorzystaniem Groovy i

PRZEWODNIK PO PRZEDMIOCIE

Bazy danych 2. Wykład 1

PRZEWODNIK PO PRZEDMIOCIE

Podstawy analizy danych numerycznych w języku Python

Projekt: MICROSOFT i CISCO dla Zachodniopomorskich MŚP Opis autoryzowanych szkoleń Microsoft planowanych do realizacji w ramach projektu

Aplikacje Internetowe, Servlety, JSP i JDBC

VMware vsphere: Automation Fast Track

Odpowiedź II wyjaśnienie na zapytania do Specyfikacji Istotnych Warunków Zamówienia.

JBoss: MetaMatrix, Mobicents, Seam, Rools, ESB

Technologia informacyjna

Programowanie.NET - kurs zaawansowany

forma studiów: studia stacjonarne Liczba godzin/tydzień: 1, 0, 2, 0, 0

Zaawansowane programowanie w języku C++

Programowanie MorphX Ax

OMEGA-PSIR na Uniwersytecie Gdańskim

SZKOLENIE: Administrator baz danych. Cel szkolenia

Baza danych. Modele danych

Czym jest jpalio? jpalio jpalio jpalio jpalio jpalio jpalio jpalio jpalio

e-off f i f ce: :Sekr k e r tari r at t w chm h urz r e Marcin Pytel

E-commerce. Genialnie proste tworzenie serwisów w PHP i MySQL.

Efektywne tworzenie aplikacji webowych z wykorzystaniem AngularJS, HTML5 i JavaScript

Transkrypt:

Kod szkolenia: Tytuł szkolenia: FULLTEXT Technologie wyszukiwania pełnotekstowego Dni: 3 Opis: Adresaci szkolenia: Szkolenie adresowane jest do osób zainteresowanych funkcjonalnością wyszukiwania pełnotekstowego i różnych spoosbów jej wykorzystania. Cel szkolenia: Uczestnicy dowiedzą się czym jest wyszukiwanie pełnotekstowe, zagadnienia z nim związane, jakie są możliwości jego realizacji oraz najlepsze praktyki. Dodatkowo poznają szeroką gamę produktów realizujących tą funkcjonalność uwzględniając rozwiązania zarówno bazodanowe jak i dedykowane biblioteki programistyczne, w szczególności te wiodące na rynku jak Apache Lucene, Apache Solr, Sphinx Search czy Hibernate Search. Po szkoleniu uczestnicy będą potrafili zaprojektować oraz oprogramować system dostarczający funkcjonalność wyszukiwania pełnotekstowego. Szkolenie traktuje temat w bardzo szerokim aspekcie tak, aby uczestnik był przygotowany do realizacji tego zadania tak, aby spełniło ono wszystkie wymagania oraz potrafił wybrać rozwiązanie najlepsze w danej sytuacji. Mocne strony szkolenia: Program obejmuje całościowo i wyczerpująco zagadnienia związane z wyszukiwaniem pełnotekstowym, przedstawia wiele ciekawych aspektów, typowe problemy oraz najlepsze praktyki. W przeciwieństwie do większości tego typu szkoleń, zawiera ono część warsztatową, która pozwoli na ugruntowanie wiedzy również w praktycznym jej aspekcie. Wymagania: Od uczestników wymagana jest podstawowa umiejętność znajomość baz danych i języka SQL oraz programowania w języku Java. Parametry szkolenia: 3*8 godzin (3*7 netto) wykładów i warsztatów. Wielkość grupy: maks. 8-10 osób Program szkolenia:

1. Koncepcja wyszukiwania pełnotekstowego I. Idea wyszukiwania pełnotekstowego (full-text search, FTS) II. Gdzie przydatne jest wyszukiwanie pełnotekstowe? i. Strony WWW ii. Aplikacje webowe iii. Bazy danych iv. Poczta e-mail 2. Wyszukiwanie pełnotekstowe w szczegółach, typowe problemy I. Użycie LIKE II. Realizacja i. Stop-słowa ii. Lematyzacja iii. Stemming iv. Morfologia języków v. Indeksy TF-IDF vi. Ocena dopasowania szukanego tekstu do tekstu znalezionego vii. Wyszukiwanie aproksymacyjne viii. Indeksy w bazie danych A. Konfiguracja indeksów w bazie danych B. Miejsce przetrzymywania indeksów C. Wydajne indeksowanie D. Utrzymywanie indeksów E. Transakcyjność III. Architektura separacji odpowiedzialności komend i zapytań (Command Query Responsibility Separation - CQRS) IV. Rozproszenie wyszukiwania V. Przeszukiwanie pełnotekstowe w plikach różnego formatu (PDF, XML, MS Office,...) VI. Skalowalność 3. Wsparcie wyszukiwania pełnotekstowego na poziomie źródeł danych I. Opensource'owe bazy danych i. MySQL A. Możliwosci Fulltext @. Tabele typu MyISAM @. Wyszukiwanie z rozwijaniem zapytania, MATCH ii. PostgreSQL A. Możliwości @. TSVECTOR column @. Dedykowane indeksy a. GIN b. GiST @. Utrzymywanie kolumny TSVECTOR II. Komercyjne bazy danych i. MS SQL Server

A. Możliwości @. Reguły językowe @. Dedykowany serwis @. Tworzenie katalogów @. Tworzenie indeksów unikalnych i FULLTEXT @. Utrzymywanie indeksów FULLTEXT @. Stoplisty @. Synonimy @. Zadawanie zapytań a. CONTAINS b. FREETEXT c. CONSTAINSTABLE d. FREETEXTTABLE @. Rodzaje wyrażeń a. Proste b. Oparte o prefixowanie c. Z wariantami d. Oparte o bliskość elementów e. Ważone C. Dostępność w produktach Microsoft Exchange i Microsoft SharePoint D. Zalety i wady ii. Oracle A. Możliwości Oracle Text @. Typy indeksów a. Standard b. Catalog c. Classification d. Substring e. Prefix iii. IBM DB2 III. NoSQL 4. Wspracie wyszukiwania na poziomie dedykowanych bibliotek programistycznych i serwerów I. Apache Lucene A. Indeksowanie @. Elementy a. Index b. Document c. Field @. Klasy a. IndexWriter

b. Directory c. Analyzer d. Document e. Field @. Możliwości przetrzymywania indeksów (plik, pamięć, dowolna baza danych) @. Utrzymywanie indeksów, strategie odświeżania indeksów B. Wyszukiwanie @. Klasy a. IndexReader b. IndexSearcher c. Query d. QueryParser e. TopDocs/ScoreDocs f. Document @. Typy zapytań (Term, Range, Prefix, Boolean, Phrase, WilCard, Fuzzy) C. Narzędzie do inspekcji indeksów - Luke II. Apache Solr i. Relacja z Apache Lucene i iii. Przykłady wdrożeń iv. Konfiguracja (Schema.xml, Solrconfig.xml) v. Realizacja A. Architektura B. Dokumenty C. Indexy D. Pola dynamiczne E. Pluginy F. Faceted search @. Wprowadzenie @. Przykłady zastosowania @. Realizacja III. Sphinx Search A. SphinxAPI, SphinxQL, B. Główne moduły @. Indexer @. Search @. Searchd @. Sphinxapi C. Konfiguracja plik sphinx.conf D. Budowanie indexów E. Zapytania

Powered by TCPDF (www.tcpdf.org) IV. Hibernate Search A. Integracja z Apache Lucene B. Konfiguracja: hiberante.cfg.xml i hibernate.properties, API do konfiguracji C. Architektura: @. Index manager @. Aktualizacja indeksu a transakcja a. Dwa tryby: no-scope i transactional b. Zalety trybu transactional: spełnienie ACID, wydajność @. Indeksy współdzielone, środowisko klastrowe @. Strategie czytania współdzielone, niewspółdzielone (Reader Strategy) @. DirectoryProvider (przetrzymywanie indeksu w pamięci, w systemie plików) @. Ustawienia wpływające na wydajność (merge_factor, max_merge_docs itd.) D. Adnotacje Hibernate Search: Indexed, Analyzer, ClassBridge, DocumentId E. Mapowanie encji F. Hibernate Analyzer G. Typy zapytań: TermQuery, WildcardQuery, PrefixQuery, PhraseQuery i inne H. API do wyszukiwania: Query, QueryBuilder i inne I. Strategie przebudowywania indeksu V. Inne i. Solandra ii. Elasticsearch iii. DataparkSearch iv. Ferret v. mnogosearch vi. Xapian vii. Google Custom Search Index