Neurobook. Inteligentne repozytoria wiedzy. Cezary Dołęga



Podobne dokumenty
NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

Ontologie, czyli o inteligentnych danych

Czy repozytorium zastąpi bazę bibliograficzną? Doświadczenia instytutowej biblioteki medycznej

Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych

BIBLIOTECA NACIONAL DE ESPAÑA (Coleccion Digital) HISZPAŃSKA BIBLIOTEKA NARODOWA (Zbiory w wersji elektronicznej)

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Biblioteka Cyfrowa czy Biblioteka 2.0 czyli co przechowuje biblioteka

Bazy patentowe jako źródło informacji naukowej

DIGITALIZACJA. Maciej Rynarzewski Oddział Zbiorów Specjalnych

Przetwarzanie języka naturalnego (NLP)

Upowszechnianie dorobku naukowego w repozytoriach i bazach danych działania komplementarne czy konkurencyjne?

Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe

i wyszukiwanie informacji w zasobach drukowanych i elektronicznych Politechniki Poznańskiej

Społeczeństwo informacyjne Rola normalizacji. Jerzy Krawiec Warszawa,

AUTOMATYKA INFORMATYKA

Sieciowe usługi informacyjne dla nauk technicznych BazTech, BazTOL

Lokalizacja dokumentów w bazie DOrobku NAukowego (DONA)

Federacja Bibliotek Cyfrowych w sieci PIONIER

Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014

Stanusch Technologies S.A. lider w rozwiązaniach opartych o sztuczną inteligencję

WYKORZYSTANIE FUNDUSZY UNIJNYCH PRZEZ BIBLIOTEKĘ GŁÓWNĄ AKADEMII MORSKIEJ W SZCZECINIE

Dokumentowanie dorobku naukowego Politechniki Warszawskiej

OPIS PRZEDMIOTU. Dygitalizacja i biblioteki cyfrowe MSIW IN23D-SP. Wydział Administracji i Nauk Społecznych Instytut/Katedra

Katalog usług epuap. Michał Bukowski Analityk epuap. Serock, 28 października 2009 r.

Analiza danych tekstowych i języka naturalnego

Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lokalizacja dokumentów w bazie DOrobku NAukowego (DONA)

Rozwój Wielkopolskiej Biblioteki Cyfrowej a zmiany funkcjonalności systemu dlibra

KONCEPCJE TRWAŁEJ OCHRONY

udostępnianie zasobów naukowych i dydaktycznych Uniwersytetu Rzeszowskiego

SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu

CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA

AKTUALNE PROBLEMY W ZARZĄDZANIU ZBIORAMI BIBLIOTECZNYMI. Błażej Feret Biblioteka Politechniki Łódzkiej

System ZSIN wyzwanie dla systemów do prowadzenia EGiB

Sztuczna inteligencja dla bezpieczeństwa ruchu drogowego

Platforma epuap. 1-3 marca 2011

Cyfrowa transformacja w kadrach

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

Platforma epuap. Igor Bednarski kierownik projektu epuap2 CPI MSWiA. Kraków, r.

Kierunki rozwoju systemów obiegu dokumentów: Enterprise Content Management. Jarosław Żeliński analityk biznesowy, projektant systemów

XML i nowoczesne metody zarządzania treścią

Spotkanie robocze PIONIER-CERT Poznań, Tomasz Nowak Zespół Bezpieczeństwa PCSS

GS1 Globalny Język Biznesu. GS1 Smart Search. GTIN w sieci czy to ma sens? Artur Kośmider Instytut Logistyki i Magazynowania

Od e-materiałów do e-tutorów

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Indeksowanie full text search w chmurze

Termin: r.

Biblioteka Politechniki Krakowskiej

2

Internetowy System Aktów Prawnych RP oraz Dziennik Ustaw RP

Infrastruktura bibliotek cyfrowych

Projekt przejściowy 2015/2016 BARTOSZ JABŁOŃSKI, TOMASZ JANICZEK

Akty prawne regulujące funkcjonowanie stron podmiotowych BIP

Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie

The Online Books Page

Spis treści. Wykaz skrótów 13. Wstęp 17

Semantyczny Monitoring Cyberprzestrzeni

Plan prezentacji. 1. Archer DMS. 2. Organizacja archiwum. 3. Organizacja pracy. 4. Funkcjonalność systemu. Quality Software Solutions 2

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Pla$orma edukacyjna czy to wystarczy? Przygotował: Artur Dyro, Prezes Learnetic S.A.

INSTRUKCJA DOTYCZĄCA WYPEŁNIANIA OŚWIADCZEŃ (zał. 2 do zarządzenia nr 13/2016)

Zastosowanie technologii Semantic Web w regionalnej sieci telemedycznej

Specjalizacja magisterska Bazy danych

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

DLIBRA & DRUPAL DWA SYSTEMY, JEDNA WITRYNA

Zintegrowana platforma drukowania, skanowania, archiwizowania i obiegu

Jak udostępnić dane PZGiK w sieci? Artur Kapuściński

Czytelnik w bibliotece cyfrowej

Zarządzanie informacją i wiedzą w usługach o podwyŝszonym poziomie bezpieczeństwa. Maciej Stroiński stroins@man.poznan.pl

Jakość bibliotek cyfrowych. Próba ustalenia kryteriów oceny z punktu widzenia (zaawansowanego) użytkownika

mgr inż. Mariusz Jarocki Forum Nauczycieli Bibliotekarzy Szkolnych

Kontrola dostępu do informacji w administracji publicznej

Struktura prezentacji

Spis lektur Lektura obowiązkowa Lektury uzupełniające A. Publikacje drukowane:

The Binder Consulting

Program Sharpdesk Sharpdesk rozwiązanie do zarządzania dokumentami

Innowacja geoinformacyjna. Geoinformation innovation

Repozytoria uczelniane i ich rola w projekcie SYNAT

Oprogramowanie systemu B2B zakup licencji na oprogramowanie umożliwiające zarządzanie informacjami o produktach:

Masowe zabezpieczanie i udostępnianie egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej. Leszek Szafrański Biblioteka Jagiellońska

dr inż. Kajetan Wojsyk Zastępca Dyrektora ds. Informatycznych Centrum Systemów Informacyjnych Ochrony Zdrowia Warszawa Miedzeszyn,

BIBLIOTEKA CYFROWA JAKO KONTENER TREŚCI DLA PORTALI INTERNETOWYCH. DLIBRA & DRUPAL DWA SYSTEMY, JEDNA WITRYNA.

Udostępnianie i przechowywanie obiektów cyfrowych w kontekście biblioteki akademickiej

UŻYTKOWNIK PAP - INSTRUKCJA UŻYTKOWANIA SERWISU PAP

Nowe spojrzenie na prawo

CYFROWY POWIAT MIKOŁOWSKI ORAZ CYFROWY POWIAT MIKOŁOWSKI BIS

Tomasz Grześ. Systemy zarządzania treścią

W kierunku zwiększania dostępności zasobów udostępnianych przez polskie biblioteki cyfrowe Nowoczesne rozwiązania w systemie dlibra 6

Projekt i implementacja systemu wspomagania planowania w języku Prolog

Oferta edukacyjna Książnicy Karkonoskiej 2017/2018 Szkoły ponadgimnazjalne. Szkoły PONADGIMNAZJALNE

Wyszukiwanie pełnotekstowe w zasobach bibliotek cyfrowych

Analiza cytowań pracowników i jednostek Politechniki Wrocławskiej w świetle zmian w bazie Web of Science

Platformy czasopism naukowych a bibliograficzne bazy danych: obszary przenikania, narzędzia, usługi

Organizacja i logistyka digitalizacji

Publiczna prezentacja założeń projektu pn. Polska Platforma Medyczna portal zarządzania wiedzą i potencjałem badawczym. Wrocław, 12 grudnia 2016 r.

Efektywność wyszukiwania informacji w publicznie dostępnych katalogach bibliotek wykorzystujących polskie programy biblioteczne

Możliwości wsparcia regionalnych specjalizacji w latach

ZAPYTANIE OFERTOWE NR 2

Transkrypt:

Neurobook Inteligentne repozytoria wiedzy Cezary Dołęga adres-mailowy@neurosoft.pl

Plan prezentacji Definicja repozytorium wiedzy, cechy Techniki SI w repozytoriach wiedzy Przetwarzanie obrazów Analiza treści i przetwarzanie języka naturalnego Przykłady repozytoriów projekty Neurosoft Prawo, Normy, Patenty, KsiąŜki Sztuczna Inteligencja - innowacyjne rozwiązania 2

Definicja Repozytorium (łac. Repositorium) miejsce uporządkowanego przechowywania dokumentów, z których wszystkie są przeznaczone do udostępniania, zaprojektowane w taki sposób, aby dostęp do wszystkich jego zasobów był równie łatwy. Repozytorium wiedzy repozytorium dokumentów z określonej dziedziny, wyposaŝone w specyficzne dla tej dziedziny mechanizmy ułatwiające dostęp do informacji, lub/i mechanizmy syntezujące dodatkowe informacje na bazie treści przechowywanych dokumentów. Sztuczna Inteligencja - innowacyjne rozwiązania 3

Cechy repozytorium wiedzy Kompletność chronologiczna, tematyczna, etc... Aktualność nowe dane mogą zmieniać stare Powiązania odwzorowane relacje między danymi Przeszukiwalność FTS, taksonomie Dostępność postać cyfrowa, Internet, PDA, epapier Sztuczna Inteligencja - innowacyjne rozwiązania 4

SI w repozytoriach wiedzy Na etapie opracowywania zawartości OCR digitalizacja dokumentów drukowanych Strukturalizacja treści dokumentów Automatyczne wykrywanie powiązań Normalizacja tekstu na potrzeby wyszukiwania Klasyfikacja dokumentów miejsce w taksonomii Generowanie streszczeń Synteza nowych faktów, ontologie Sztuczna Inteligencja - innowacyjne rozwiązania 5

SI w repozytoriach wiedzy (cd) Na etapie eksploatacji Analiza zapytań (np. normalizacja) Korekta zapytań (ang. Did you mean...? ) Uszczegóławianie zapytań (ang. Suggest... ) Wyszukiwanie semantyczne Systemy dialogowe, konwersacja Sztuczna Inteligencja - innowacyjne rozwiązania 6

Własny OCR dlaczego? Zła jakość oryginału Wysokie wymagania Sztuczna Inteligencja - innowacyjne rozwiązania 7

Normalizacja tekstu Gram prezentacja on-line Sztuczna Inteligencja - innowacyjne rozwiązania 8

Projekty Neurosoftu Neurolex całe prawodawstwo polskie i UE realizacja od 2001 r. do dzisiaj (C.H.Beck Sp. z o.o.) Neuronorm Polskie Normy realizacja od 2004 r. do dzisiaj (ArsBoni Sp. z o.o.) Neuropat patenty i wzory uŝytkowe realizacja 2008 r. (Urząd Patentowy RP) Neurolib czytelnia internetowa realizacja 2008 r. Sztuczna Inteligencja - innowacyjne rozwiązania 9

Neurolex Papier -> XML + obraz Całe prawo PL i UE (bez lokaln.) 928 tys. stron oryginałów 282 tys. dokumentów 57,5 tys. XML-i z treścią Pełna struktura aktu w XML Odesłania i cytowania Legalis system informacji prawnej Przetwarzanie codziennie kilkaset stron Sztuczna Inteligencja - innowacyjne rozwiązania 10

Neuronorm Wszystkie Polskie Normy Źródło = papier + PDF + HTML Dokument = obraz + metryka Taksonomia ICS 583 tys. stron on-line ~33 tys. dokumentów on-line ~70 tys. metryk dokumentów enormy.pl Polskie Normy On-line Integram Polskie Normy na CD DRM do ochrony kopii Sztuczna Inteligencja - innowacyjne rozwiązania 11

Neuropat Polskie patenty i wzory uŝytkowe Lata 1924-1991 ~780 tys. stron 154 tys. patentów, 5 tys. wzorów Taksonomia IPC Źródło = papier Wynik = PDF + txt + metryka Wykryte spisy treści Sztuczna Inteligencja - innowacyjne rozwiązania 12

Neurolib Czytelnia ksiąŝek on-line Źródło = papier lub PDF Dokument = obraz + tekst Wyszukiwanie pełnotekstowe z fleksyjnym podświetlaniem wyników Technologia Java (applet) Strukturalizacja wg spisu treści Czytaj24.pl czytelnia internetowa Synteza mowy Dostęp = PC, telefon, epapier Sztuczna Inteligencja - innowacyjne rozwiązania 13

Dziękuję za uwagę Sztuczna Inteligencja - innowacyjne rozwiązania 14