dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

Podobne dokumenty
Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

Ewaluacja mowy syntetycznej za pomocą systemu rozpoznawania mowy

W kierunku zwiększania dostępności zasobów udostępnianych przez polskie biblioteki cyfrowe Nowoczesne rozwiązania w systemie dlibra 6

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Otwarty Standard Danych Oświatowych. Marcin Wolski, Cezary Mazurek, Piotr Grzybowski

System SINUS otwarte narzędzie do budowy bibliograficznych baz danych

Włodzimierz Wyraz Radcomp Integral Sp. z o.o.

OFERTA NA SYSTEM LIVE STREAMING

Sprawozdanie z laboratoriów HTK!

Konferencja UKSW, Bezpieczeństwo w Internecie: Internet Rzeczy. Bezpieczeństwo Smart City.

PLATFORMA COMARCH SECURITY. Analiza i skracanie wideo

Oszczędności w gospodarstwie przy użyciu nowoczesnych rozwiązań w rolnictwie.

Wirtualizacja zasobów IPv6 w projekcie IIP

BEZPIECZEŃSTWO PUBLICZNE. Wymagania edukacyjne i PSO. Kryteria, według których oceniane są poszczególne obszary aktywności

Rozwój j specjalistycznych usług. ug telemedycznych w Wielkopolsce. Michał Kosiedowski

Komunikacja w sieciach różnorodnych technologicznie na potrzeby zarządzania kryzysowego koncepcja SECRICOM

DZIAŁ I OZNACZENIE INSTYTUTU

Usługa: Testowanie wydajności oprogramowania

Sprawozdanie z działalności Zarządu Głównego Polskiego Towarzystwa Fonetycznego za okres od września 2008 r. do września 2012 r.

Projekt badawczy. Zastosowania technologii dynamicznego podpisu biometrycznego

Lista rankingowa pozytywnie zaopiniowanych wniosków z konkursu BiO 6/2014. System zarządzania informacjami w transmisji elektronicznej (radio, TV)

Elektroniczny dostęp do rejestrów sądowych

Ministerstwo Spraw Wewnętrznych i Administracji

Patronaty honorowe: Prezydent Miasta Kielce Polskie Towarzystwo Informacji Przestrzennej Patronaty medialne:

Rozwiązanie GIS dla mniejszego. miasta: model Miasta Stalowa Wola. Janusz JEśAK. Jacek SOBOTKA. Instytut Rozwoju Miast. ESRI Polska Sp. z o. o.

Rozwój bibliotek cyfrowych w Polsce. Cezary Mazurek Tomasz Parkoła Marcin Werla

System diagnostyki słuchu

DZIAŁ I OZNACZENIE INSTYTUTU

OPIS PRZEDMIOTU - SYLABUS. Nazwa jednostki prowadzącej przedmiot WYDZIAŁ SOCJOLOGICZNO HISTORYCZNY KATEDRA POLITOLOGII ZAKŁAD ADMINISTRACJI PUBLICZNEJ

Informatyzacja kluczowych rejestrów państwowych tworzymy usługi przyjazne Obywatelom

Propozycje tematów prac magisterskich 2013/14 Automatyka i Robotyka - studia stacjonarne Pracowania Układów Elektronicznych i Przetwarzania Sygnałów

Integracja rozwiązań teleinformatycznych SLICAN z aplikacjami CRM.

System Ostrzegania, Alarmowania i Informowania dla województwa dolnośląskiego

TEST DIAGNOSTYCZNY. w ramach projektu TIK? tak! - na kompetencje cyfrowe najwyższy czas!

Informatyzacja kluczowych rejestrów państwowych tworzymy usługi przyjazne Obywatelom

Czwarte warsztaty Biblioteki cyfrowe dzień 1. Poznań 12 listopada 2007 r.

M o d e r n i z a c j a CBOP

Tytuł: Projekt pt. Indywidualizacja konstrukcji wielofunkcyjnych kamizelek balistycznych skrytego noszenia Akronim Secret

Integracja rozwiązań teleinformatycznych SLICAN z aplikacjami CRM.

Nowa Strategia Cyberbezpieczeństwa RP na lata główne założenia i cele

ERDAS ADE Suite edytor baz danych Oracle Spatial

Wymagania techniczne Sage Asystent 2017

Internet w szkole, czyli jak mądrze inwestować w cyfrową edukację? Nowe Media

Informatyka Studia II stopnia

Czynności pozaprocesowe, lecz praworządne. Oparte na osobowych źródłach informacji lub środkach technicznych

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

System Wspomagania Dowodzenia Państwowego Ratownictwa Medycznego. Józefa Szczurek-Żelazko Sekretarz Stanu

Oprogramowanie wspierające kalibrację kamer 3D oraz analizę głębi obrazu stereoskopowego. Piotr Perek. Łódź, 7 grudnia Politechnika Łódzka

Kreowanie innowacyjnych usług i produktów metodą Design Thinking

na rzecz transferu wiedzy i innowacji do gospodarki

System sterowania robota mobilnego z modułem rozpoznawania mowy

Usługi utrzymaniowe infrastruktury SI PSZ

Program warsztatów CLARIN-PL

POLSKA AKADEMIA NAUK Rejestr instytutów naukowych Nr rejestru: RIN-III-16/98 DZIAŁ I OZNACZENIE INSTYTUTU Nr kolejny wpisu

UAM.TV. Naukowa Uniwersytecka Telewizja Internetowa IDEA STRUKTURA PERSPEKTYWY

Elektroniczny Obieg Dokumentów edok. I Mazowiecki Konwent Informatyków i Administracji Zegrze, 8-9 września 2016 r.

siedziba POZNAŃ tel. (061) tel. kom fax (061)

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2015/2016

Usługi ze wsparciem Centrum Innowacji Microsoft. Jerzy Mikołajczak, Marek Zawadzki

System zarządzania i monitoringu

platforma zapewniająca usługi wirtualizacji

Spotkania informacyjne dotyczące bazy danych o ocenach oddziaływania przedsięwzięcia na środowisko i strategicznych ocenach oddziaływania na


Zastosowanie danych adresowych

zaawansowana platforma obsługi dokumentów PRO

Problemy optymalizacji, rozbudowy i integracji systemu Edu wspomagającego e-nauczanie i e-uczenie się w PJWSTK

Kluczowe projekty informatyczne MSWiA uwarunkowania prawne, koncepcyjne i realizacyjne

Informatyczny System Osłony Kraju (ISOK) Prezentacja projektu. Warszawa, 24 czerwca 2014 r.

MAREK NIEZGÓDKA ICM, UNIWERSYTET WARSZAWSKI

Olympus DYKTAFON WS-853+KUPON PREMIUM -50% na AB FOTOKSIĄŻKĘ

MOBILNE ROZPOZNAWANIE TWARZY

Modernizacja systemów TETRA w polskiej Policji

BIBLIOTEKA CYFROWA JAKO KONTENER TREŚCI DLA PORTALI INTERNETOWYCH. DLIBRA & DRUPAL DWA SYSTEMY, JEDNA WITRYNA.

Centrum Szkolenia Straży Granicznej w Kętrzynie

Laboratoria Badawcze Systemów Mobilnych Instytut Informatyki Politechniki Poznańskiej MOBILNE MIASTO

Multimedialne Systemy Interaktywne

Kierunki rozwoju zagrożeń bezpieczeństwa cyberprzestrzeni

GE Security. Alliance. zaawansowany system zarządzania bezpieczeństwem

Publikacje z zakresu bezpiecznego funkcjonowania człowieka w środowisku pracy z lat jako obraz prowadzonych badań

Bezpieczne miasto. koncepcja i rozwiązania w projekcie Mayday Euro 2012

TERMINARZ SZKOLEŃ 2011

OPI-TPP - Wprowadzenie do części warsztatowej

Działając wspólnie podwajamy efekty

UBEZPIECZENIE L4 DLA WSZYSTKICH FUNKCJONARIUSZY SŁUŻB MUNDUROWYCH

Lokalizacja wywołań alarmowych w Polsce

Zintegrowana Platforma Identyfikacji i Weryfikacji Zjawisk Przestępczości Ubezpieczeniowej: Funkcjonalności i korzyści dla Zakładów Ubezpieczeń

POMAGAMY LUDZIOM W MOMENTACH, KTÓRE MAJA ZNACZENIE

Instrukcja użytkownika. programu NFZMonit

Projekty realizowane w Podlaskim Urzędzie Wojewódzkim. Projekt administracji rządowej województwa podlaskiego CU2

JTW SP. Z OO. Zapytanie ofertowe. Wdrożenie/Uruchomienie systemu B2B

Usługi przechowywania danych KMD/PLATON-U4 dla bibliotek cyfrowych. Maciej Brzeźniak, Norbert Meyer, Rafał Mikołajczak, Maciej Stroiński

Nowoczesne technologie bliżej nas 1

Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

WSZECHSTRONNE. KOMFORTOWE. DOSKONAŁA JAKOŚĆ DŹWIĘKU.

Audyt oprogramowania. Artur Sierszeń

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

z dnia r. w sprawie wzoru wniosku o udostępnienie danych z centralnej ewidencji pojazdów

Zintegrowana platforma zarządzania miastem w kontekście bezpieczeństwa publicznego. (Centrum Bezpieczeństwa Miasta)

OBIEG INFORMACJI I WSPOMAGANIE DECYZJI W SYTUACJACH KRYZYSOWYCH

Transkrypt:

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst, dedykowany dla służb odpowiedzialnych za bezpieczeństwo państwa dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

System Automatycznego Rozpoznawania Mowy ARM-1 Projekt rozwojowy nr DOBR/0008/R/ID1/2013/03 współfinansowany ze środków NCBiR realizowany przez konsorcjum Poznańskie Centrum Superkomputerowo-Sieciowe Stowarzyszenie Polska Platforma Bezpieczeństwa Wewnętrznego Future Voice Systems, Sp. z o.o. Celem projektu jest zbudowanie zaawansowanego systemu rozpoznawania i przetwarzania mowy polskiej na tekst, dedykowanego dla służb odpowiedzialnych za bezpieczeństwo państwa i obywateli Potencjalni użytkownicy: Policja, Straż Graniczna, CBA, ABW, Służba Celna, Żandarmeria Wojskowa, Państwowa Straż Pożarna, Ministerstwo Sprawiedliwości, Sądy RP, Prokuratura oraz wybrane jednostki Wojska Polskiego Termin zakończenia kwiecień 2016 r.

Podstawowe informacje o systemie ARM-1 System autorski nie bazujący na obcych rozwiązaniach Podstawowa funkcjonalność rozpoznawanie mowy na żywo rozpoznawanie mowy z nagrań Zaawansowana funkcjonalność automatyczna adaptacja do głosu mówcy, mikrofonu i środowiska akustycznego indeksacja baz nagrań i wyszukiwania fraz słownych rozpoznawanie treści językowych i pozajęzykowych wspomaganie dyktowania komendy głosowe, makra, integracja z MS Word Aplikacje rozpoznawania mowy wyszukiwanie fraz słownych charakterystyka mówcy

Charakterystyka systemu ARM-1 Rozpoznawanie mowy różnego typu dyktowana - staranna spontaniczna nacechowana emocjonalnie (nagrania z kontroli operacyjnej) rejestrowanej w różnych warunkach akustycznych warunki biurowe warunki operacyjne - z wyraźnymi zakłóceniami rejestrowanej przy pomocy różnych urządzeń mikrofony - dedykowane, ukryte dyktafony telefony komórkowe w czasie rzeczywistym wpływ jakości nagrania na czas i poprawność rozpoznawania zależność od ustawień jakości

Kierunki prac w projekcie ARM-1 Pozyskanie i opracowanie zasobów charakterystycznych dla obszaru zastosowań akustycznych: ok. 800 h nagrań lingwistycznych; ok. 18 GB tekstu Budowa dedykowanych modeli akustycznych mowa dyktowana, rozprawy sądowe, nagrania oględzin, narad, nagrania operacyjne, Budowa dedykowanych modeli lingwistycznych mowa dyktowana, spontaniczna domena tematyczna wypowiedzi Optymalizacja silnika rozpoznawania wielowątkowe przetwarzanie optymalne wykorzystanie zasobów sprzętowych dwa modele działania: desktopowy, serwerowy Rozwój aplikacji

Wyniki rozpoznawania mowy dyktowanej Test na 97 mówcach (ok. 30 godzin materiału dźwiękowego, łącznie 7713 wypowiedzi): model uniwersalny Dokładność rozpoznawania: 87% Względny czas dekodowania: 100% Test na 13 mówcach (ok. 3 godziny materiału dźwiękowego, łącznie 1911 wypowiedzi): model nie adaptowany/model adaptowany Dokładność rozpoznawania: 88% / 92% Względny czas dekodowania: 95% / 50% Dokładność rozpoznawania średni procent poprawnie rozpoznanych słów minus wstawione słowa Względny czas dekodowania średni procent czasu rozpoznawania liczony względem długości wypowiedzi

Prezentacja systemu ARM-1 Mariusz Owsianny, Piotr Francuzik 1. Rozpoznawanie mowy dyktowanej 2. Rozpoznawanie mowy spontanicznej z nagrań 3. Wyszukiwanie fraz słownych w nagraniach

DZIĘKUJEMY ZA UWAGĘ Badania współfinansowane ze środków NCBiR - projekt rozwojowy nr DOBR/0008/R/ID1/2013/03 Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst, dedykowany dla służb odpowiedzialnych za bezpieczeństwo państwa.

Poznańskie Centrum Superkomputerowo - Sieciowe afiliowane przy Instytucie Chemii Bioorganicznej PAN, ul. Noskowskiego 12/14, 61-704 Poznań, tel : (+48 61) 858-20-00, fax: (+48 61) 852-59-54, e-mail: office@man.poznan.pl, http://www.pcss.pl