Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst



Podobne dokumenty
dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

Konferencja UKSW, Bezpieczeństwo w Internecie: Internet Rzeczy. Bezpieczeństwo Smart City.

MOBILNE ROZPOZNAWANIE TWARZY

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

MAREK NIEZGÓDKA ICM, UNIWERSYTET WARSZAWSKI

Elektroniczny dostęp do rejestrów sądowych

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

Zbieranie i ochrona danych osobowych w konsultacjach publicznych

Informatyzacja kluczowych rejestrów państwowych tworzymy usługi przyjazne Obywatelom

Informatyzacja kluczowych rejestrów państwowych tworzymy usługi przyjazne Obywatelom

POMAGAMY LUDZIOM W MOMENTACH, KTÓRE MAJA ZNACZENIE

Funkcjonalność konfiguracji Szkoleniowej systemu Profesal

OPIS PRZEDMIOTU ZAMÓWIENIA. Część nr 4.3

UBEZPIECZENIE L4 DLA WSZYSTKICH FUNKCJONARIUSZY SŁUŻB MUNDUROWYCH

Kluczowe projekty informatyczne MSWiA uwarunkowania prawne, koncepcyjne i realizacyjne

Znaczenie rejestru CEPIK dla bezpieczeństwa i obronności państwa. dr Kamil Czaplicki Katedra Prawa Informatycznego WPIA UKSW

System Informatyczny Powiadamiania Ratunkowego

Elastyczność i mobilność w jednym, kompletnym pakiecie Panasonic UC Pro. Doskonała łączność gdziekolwiek się znajdujesz

Ewaluacja mowy syntetycznej za pomocą systemu rozpoznawania mowy

Nowa Strategia Cyberbezpieczeństwa RP na lata główne założenia i cele

OPIS PRZEDMIOTU - SYLABUS. Nazwa jednostki prowadzącej przedmiot WYDZIAŁ SOCJOLOGICZNO HISTORYCZNY KATEDRA POLITOLOGII ZAKŁAD ADMINISTRACJI PUBLICZNEJ

Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT

Geomant Mobile Presence

Opracowanie: mgr Joanna Jakubiak-Karolak mgr Ewa Niedźwiedzka. Strona 1 z 14

Ministerstwo Spraw Wewnętrznych i Administracji

Komunikacja w sieciach różnorodnych technologicznie na potrzeby zarządzania kryzysowego koncepcja SECRICOM

Założenia projektu ustawy o zmianie niektórych ustaw, w związku z pozyskiwaniem i wykorzystywaniem danych telekomunikacyjnych. Warszawa, maj 2012 r.

ROZPORZĄDZENIE MINISTRA INFRASTRUKTURY 1) z dnia r.

Program warsztatów CLARIN-PL

Elastyczność i mobilność w jednym, kompletnym pakiecie Panasonic UC Pro. Doskonała łączność gdziekolwiek się znajdujesz

Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

KOMENDA WOJEWÓDZKA POLICJI W POZNANIU. Drakkar- polsko-norweski kurs na bezpieczeństwo strefy Schengen

Co nowego w programie GM EPC

System SINUS otwarte narzędzie do budowy bibliograficznych baz danych

HomeNetMedia - aplikacja spersonalizowanego dostępu do treści multimedialnych z sieci domowej

Security Master Class

WYMAGANIA SZCZEGÓŁOWE

TECHNOLOGIE JUTRA DZISIAJ NOWOCZESNE ZARZĄDZANIE MAJĄTKIEM

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Xpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie

POMAGAMY LUDZIOM W MOMENTACH, KTÓRE MAJĄ ZNACZENIE

ZARZĄDZENIE NR 2/11 SZEFA CENTRALNEGO BIURA ANTYKORUPCYJNEGO. z dnia 3 stycznia 2011 r.

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

Miejsce NC Cyber w systemie bezpieczeństwa teleinformatycznego państwa

EXSO-CORE - specyfikacja

Laboratoria Badawcze Systemów Mobilnych Instytut Informatyki Politechniki Poznańskiej MOBILNE MIASTO

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Internetowa ogólnopolska baza informatycznych projektów badawczych otwartej innowacji Platforma współpracy SPINACZ 1/46

Zadania PCSS w Polskiej Platformie Bezpieczeństwa Wewnętrznego

Warsztaty KPRM-MF-MG-MPiPS MRR-MSWiA-MSZ 28 kwietnia 2011 r.

Włodzimierz Wyraz Radcomp Integral Sp. z o.o.

KLUCZ PUNKTOWANIA ZADAŃ

PROGRAM NAPRAWCZY MAJĄCY NA CELU POPRAWĘ WYNIKÓW SPRAWDZIANU ZEWNĘTRZNEGO KLAS SZÓSTYCH PRZYJĘTY PRZEZ RADĘ PEDAGOGICZNĄ W DNIU 3 GRUDNIA 2012 R.

Zarządzanie informacją i wiedzą w usługach o podwyŝszonym poziomie bezpieczeństwa. Maciej Stroiński stroins@man.poznan.pl

RÓWNOWAŻNOŚĆ ZAOFEROWANCH PAKIETÓW PROGRAMÓW BIUROWYCH

ORGANY I JEDNOSTKI UPRAWNIONE DO ŻĄDANIA DANYCH OSOBOWYCH. każdy. każdy. każdy

Sposoby wyszukiwania multimedialnych zasobów w Internecie

SKRÓCONY OPIS systemu lojalnościowego

U ług u i g teleme m dyc y zne n w w regi g on o a n lne n j słu u bi b e z dr d ow o i w a Mich c ał a K o K si s ed e owsk s i

Spotkanie robocze PIONIER-CERT Poznań, Tomasz Nowak Zespół Bezpieczeństwa PCSS

Zintegrowana platforma zarządzania miastem w kontekście bezpieczeństwa publicznego. (Centrum Bezpieczeństwa Miasta)

Projekty realizowane w Podlaskim Urzędzie Wojewódzkim. Projekt administracji rządowej województwa podlaskiego CU2

Integracja rozwiązań teleinformatycznych SLICAN z aplikacjami CRM.

CEPiK co się zmieni w starostwach. Data publikacji wersja 1.1

Specyfikacja techniczna GoBiz Virtual Office - systemu dostępu do zasobów wirtualnego biura przez Internet

CENTRALNA EWIDENCJA POJAZDÓW i KIEROWCÓW

ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI. z dnia 2 sierpnia 2002 r. w sprawie usuwania pojazdów. (Dz. U. z dnia 27 sierpnia 2002 r.

Ochrona środowiska w gminie

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Na komputerach z systemem Windows XP zdarzenia są rejestrowane w trzech następujących dziennikach: Dziennik aplikacji

TECHNIK PRAC BIUROWYCH

Bogdan Żurek, S&T Services Polska

Transpozer czasowy mowy

z dnia r. w sprawie wzoru wniosku o udostępnienie danych z centralnej ewidencji pojazdów

PLATFORMA COMARCH SECURITY. Analiza i skracanie wideo

ROZPORZĄDZENIE. z dnia. r.

Kurs zdalny Zarządzanie informacją przestrzenną

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Konfiguracja programu ODBCImportYOTOGI do pracy z systemem Yotogi.

English in Mind Wydanie egzaminacyjne - zgodność zawartości podręcznika ze standardami wymagań egzaminu gimnazjalnego z języka angielskiego

Zarządzanie wiedzą w instytucji naukowej cz. I

Lokalizacja Oprogramowania

" # # Problemy budowy bezpiecznej i niezawodnej globalnej sieci szerokopasmowej dla słub odpowiadajcych za bezpieczestwo publiczne

Świadczenie usługi hurtowej wysyłki wiadomości SMS dla Urzędu Miasta Torunia w latach

Usługa Utilitia Korzystanie z Internetu przez Osoby Niepełnosprawne. Piotr Witek Utilitia.pl Kraków, 16 Lipca 2013 r.

AUTOMATYCZNE ROZPOZNAWANIE PUNKTÓW KONTROLNYCH GŁOWY SŁUŻĄCYCH DO 3D MODELOWANIA JEJ ANATOMII I DYNAMIKI

Program szkolenia EXCEL ZAAWANSOWANY Z WPROWADZENIEM DO VBA.

Spis treści Wprowadzenie ROZDZIAŁ I Definiowanie podstawowych pojęć 1. Historia bezpieczeństwa 2. Pojęcie bezpieczeństwa 3.

EGZAMIN MATURALNY 2011 JĘZYK WŁOSKI

Nauczanie na odległość

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

Warszawa, dnia 23 czerwca 2014 r. Poz. 816 ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH 1) z dnia 18 czerwca 2014 r.

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty)

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Stowarzyszenia Polska Platforma Bezpieczeństwa Wewnętrznego. za rok 2008

RSIP. Krok w stronę integracji

Transkrypt:

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Mariusz Owsianny, PCSS Dr inż. Ewa Kuśmierek, Kierownik Projektu, PCSS Partnerzy konsorcjum Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

System automatycznego rozpoznawania mowy ARM-1 Projekt rozwojowy nr DOBR/0008/R/ID1/2013/03 współfinansowany ze środków NCBR realizowany przez konsorcjum Poznańskie Centrum Superkomputerowo-Sieciowe Stowarzyszenie Polska Platforma Bezpieczeństwa Wewnętrznego Future Voice System Sp. z o.o. Celem projektu jest zbudowanie zaawansowanego systemu rozpoznawania i przetwarzania mowy polskiej na tekst, dedykowanego dla służb odpowiedzialnych za bezpieczeństwo państwa i obywateli Współpraca: Policja, Straż Graniczna, Centralne Biuro Śledcze, Ministerstwo Sprawiedliwości, Służba Celna, Żandarmeria Wojskowa, Agencja Bezpieczeństwa Wewnętrznego, Sądy RP oraz wybrane jednostki Prokuratury RP, Inspekcja Transportu Drogowego Czas realizacji: kwiecień 2013 r. lipiec 2016 r.

Rezultaty projektu ARM-1 Zaawansowany system rozpoznawania mowy umożliwiający automatyczne analizowanie głosowych wypowiedzi i zapisywanie ich w postaci tekstu Transkrypcja wypowiedzi pochodzących z wcześniej dokonanych nagrań rozpoznawanie różnego rodzaju mowy poprawność rozpoznania uzależniona od jakości nagrania wykorzystanie w modelu akustycznym i językowym charakterystycznego słownictwa i kontekstu wypowiedzi funkcje ułatwiające dyktowanie specyficznych wypowiedzi, np. numerów rejestracyjnych samochodów, dat czy numerów telefonów Wyszukiwanie w nagraniach fraz słownych ze wskazaniem odpowiedniego fragmentu nagrania

Rezultaty projektu ARM-1 Konsultacje prac badawczo-rozwojowych prowadzone na bieżąco z przedstawicielami użytkowników końcowych Współpraca Policja, Straż Graniczna, Centralne Biur Śledcze, Ministerstwo Sprawiedliwości, Służba Celna, Żandarmeria Wojskowa, Agencja Bezpieczeństwa Wewnętrznego, Sady RP oraz wybrane jednostki Prokuratury RP, Inspekcja Transportu Drogowego Testy wypracowanych rozwiązań przez użytkowników końcowych baza 997 Integracja efektów projektu z aplikacjami wykorzystywanymi przez służby mundurowe, sadownictwo i prokuraturę Kompatybilność z dostępnymi na rynku popularnymi narzędziami takimi jak Microsoft Office

Rezultaty projektu Automatyczna konwersja mowy na tekst na żywo oraz z nagrań mowa dyktowana oraz spontaniczna. nagrania rejestrowane w różnych warunkach akustycznych, np. w warunkach polowych z wyraźnymi zakłóceniami. mowa rejestrowana przy użyciu różnych urządzeń - mikrofonów, telefonów komórkowych, dyktafonów. Podstawowe zastosowania - sporządzanie: dokumentów przy stanowisku biurowym notatek oraz protokołów oględzin z miejsca zdarzenia notatek z oględzin w pomieszczeniach laboratoryjnych dokumentacji przebiegu odpraw i narad służbowych stenogramów z nagrań operacyjnych przy wykorzystaniu ukrytych mikrofonów, telefonów

Tekstowa Indeksacja Nagrań Szybkie wyszukiwanie w nagraniach fraz słownych umożliwia przeszukiwanie bardzo dużych baz nagrań skraca czas wyszukania i znacznie zmniejsza jego koszty tworzy nowe możliwości przetwarzania i wykorzystania nagrań Podstawowe zastosowanie przeszukiwanie baz nagrań telefonicznych systemów alarmowych nagrań telefonicznych systemów konsultacyjnych różnego rodzaju nagrań operacyjnych treści multimedialnych

Testy rezultatów projektu Testy systemu Tekstowej Indeksacji Nagrań dla bazy nagrań 997 Baza testowa przekazana przez KWP w Poznaniu - łącznie 7 451 nagrań Adaptacja systemu rozszerzenie aktywnego słownika nazwy firm, lokalizacji różnego typu, marki samochodów, nazwy przystanków MPK, ulic, szkół sposób zapisu wyrażeń typu cyfra/litera/liczba dyktowanych po sobie numery rejestracyjne: PO5464 numer telefonów: 68639350 identyfikatory: 163 rozszerzenie kryteriów wyszukiwania o godzinę i datę zarejestrowania nagrania

Adaptacja systemu Adaptacja systemu do dziedziny zastosowania i potrzeb użytkowników systemowa dostosowanie modelu akustycznego i językowego do używanego słownictwa uwzględnienie metadanych specyficznych dla nagrań użytkownika uzupełnianie słownika rozpoznawanych wyrazów modyfikacja listy wyszukiwanych fraz modyfikacja słownika synonimów

Dziękuję za uwagę! Poznańskie Centrum Superkomputerowo-Sieciowe Dział nowych interfejsów z użytkownikiem ul. Dąbrowskiego 79A, 60-529 Poznań e-mail: arm@man.poznan.pl www.pcss.pl, www.speechlabs.pl Partnerzy konsorcjum Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst