Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Mariusz Owsianny, PCSS Dr inż. Ewa Kuśmierek, Kierownik Projektu, PCSS Partnerzy konsorcjum Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst
System automatycznego rozpoznawania mowy ARM-1 Projekt rozwojowy nr DOBR/0008/R/ID1/2013/03 współfinansowany ze środków NCBR realizowany przez konsorcjum Poznańskie Centrum Superkomputerowo-Sieciowe Stowarzyszenie Polska Platforma Bezpieczeństwa Wewnętrznego Future Voice System Sp. z o.o. Celem projektu jest zbudowanie zaawansowanego systemu rozpoznawania i przetwarzania mowy polskiej na tekst, dedykowanego dla służb odpowiedzialnych za bezpieczeństwo państwa i obywateli Współpraca: Policja, Straż Graniczna, Centralne Biuro Śledcze, Ministerstwo Sprawiedliwości, Służba Celna, Żandarmeria Wojskowa, Agencja Bezpieczeństwa Wewnętrznego, Sądy RP oraz wybrane jednostki Prokuratury RP, Inspekcja Transportu Drogowego Czas realizacji: kwiecień 2013 r. lipiec 2016 r.
Rezultaty projektu ARM-1 Zaawansowany system rozpoznawania mowy umożliwiający automatyczne analizowanie głosowych wypowiedzi i zapisywanie ich w postaci tekstu Transkrypcja wypowiedzi pochodzących z wcześniej dokonanych nagrań rozpoznawanie różnego rodzaju mowy poprawność rozpoznania uzależniona od jakości nagrania wykorzystanie w modelu akustycznym i językowym charakterystycznego słownictwa i kontekstu wypowiedzi funkcje ułatwiające dyktowanie specyficznych wypowiedzi, np. numerów rejestracyjnych samochodów, dat czy numerów telefonów Wyszukiwanie w nagraniach fraz słownych ze wskazaniem odpowiedniego fragmentu nagrania
Rezultaty projektu ARM-1 Konsultacje prac badawczo-rozwojowych prowadzone na bieżąco z przedstawicielami użytkowników końcowych Współpraca Policja, Straż Graniczna, Centralne Biur Śledcze, Ministerstwo Sprawiedliwości, Służba Celna, Żandarmeria Wojskowa, Agencja Bezpieczeństwa Wewnętrznego, Sady RP oraz wybrane jednostki Prokuratury RP, Inspekcja Transportu Drogowego Testy wypracowanych rozwiązań przez użytkowników końcowych baza 997 Integracja efektów projektu z aplikacjami wykorzystywanymi przez służby mundurowe, sadownictwo i prokuraturę Kompatybilność z dostępnymi na rynku popularnymi narzędziami takimi jak Microsoft Office
Rezultaty projektu Automatyczna konwersja mowy na tekst na żywo oraz z nagrań mowa dyktowana oraz spontaniczna. nagrania rejestrowane w różnych warunkach akustycznych, np. w warunkach polowych z wyraźnymi zakłóceniami. mowa rejestrowana przy użyciu różnych urządzeń - mikrofonów, telefonów komórkowych, dyktafonów. Podstawowe zastosowania - sporządzanie: dokumentów przy stanowisku biurowym notatek oraz protokołów oględzin z miejsca zdarzenia notatek z oględzin w pomieszczeniach laboratoryjnych dokumentacji przebiegu odpraw i narad służbowych stenogramów z nagrań operacyjnych przy wykorzystaniu ukrytych mikrofonów, telefonów
Tekstowa Indeksacja Nagrań Szybkie wyszukiwanie w nagraniach fraz słownych umożliwia przeszukiwanie bardzo dużych baz nagrań skraca czas wyszukania i znacznie zmniejsza jego koszty tworzy nowe możliwości przetwarzania i wykorzystania nagrań Podstawowe zastosowanie przeszukiwanie baz nagrań telefonicznych systemów alarmowych nagrań telefonicznych systemów konsultacyjnych różnego rodzaju nagrań operacyjnych treści multimedialnych
Testy rezultatów projektu Testy systemu Tekstowej Indeksacji Nagrań dla bazy nagrań 997 Baza testowa przekazana przez KWP w Poznaniu - łącznie 7 451 nagrań Adaptacja systemu rozszerzenie aktywnego słownika nazwy firm, lokalizacji różnego typu, marki samochodów, nazwy przystanków MPK, ulic, szkół sposób zapisu wyrażeń typu cyfra/litera/liczba dyktowanych po sobie numery rejestracyjne: PO5464 numer telefonów: 68639350 identyfikatory: 163 rozszerzenie kryteriów wyszukiwania o godzinę i datę zarejestrowania nagrania
Adaptacja systemu Adaptacja systemu do dziedziny zastosowania i potrzeb użytkowników systemowa dostosowanie modelu akustycznego i językowego do używanego słownictwa uwzględnienie metadanych specyficznych dla nagrań użytkownika uzupełnianie słownika rozpoznawanych wyrazów modyfikacja listy wyszukiwanych fraz modyfikacja słownika synonimów
Dziękuję za uwagę! Poznańskie Centrum Superkomputerowo-Sieciowe Dział nowych interfejsów z użytkownikiem ul. Dąbrowskiego 79A, 60-529 Poznań e-mail: arm@man.poznan.pl www.pcss.pl, www.speechlabs.pl Partnerzy konsorcjum Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst