Speech Recognition Engine

Podobne dokumenty
Podręcznik instalacji Command WorkStation 5.6 z aplikacjami Fiery Extended Applications 4.2

Podręcznik instalacji

Instrukcja obsługi SafeIT - modułu zdalnego sterowania do sterowników kotłów CO firmy Foster v1.0

Program Zabezpieczający LOCK. Instrukcja obsługi

Instrukcja użytkownika ARSoft-WZ1

Programowanie w Sieci Internet Python - c. d. Kraków, 28 listopada 2014 r. mgr Piotr Rytko Wydział Matematyki i Informatyki

SystimPlus. Dokumentacja (FAQ) dla wersji: v

Wersja polska. Wstęp. Zawartość opakowania. Uwaga! WC030 Sweex Webcam 300K with Microphone USB

Dynamiczne i wydajne tworzenie interfejsu. Piotr Michałkiewicz

Instalacja urządzenia

HELIOS pomoc społeczna

Programator procesorów rodziny AVR AVR-T910

Tablet bezprzewodowy QIT30. Oprogramowanie Macro Key Manager

Obsługa przesyłek InPost w aplikacji Komornik SQL

Viatoll Calc v1.3. Viatoll Calc. Instrukcja użytkownika. Strona 1

Adobe Sign. Podręcznik przechowywania danych Adobe Systems Incorporated. All rights reserved. Ostatnia aktualizacja: 13 marca 2017 r.

Programowanie Urządzeń Mobilnych. Część II: Android. Wykład 2

Dodanie nowej formy do projektu polega na:

Zestaw głośnomówiący Bluetooth do motoru oraz skutera PARROT SK4000

INSTRUKCJA INSTALACJI URZĄDZENIA

Informatyzacja Przedsiębiorstw

POLSKI. Macro Key Manager Podręcznik użytkownika

Instrukcje dotyczące systemu Windows w przypadku drukarki podłączonej lokalnie

PRZYJMOWANIE/WYDAWANIE KOLEKTORAMI BY CTI

Z pojedynczym obiekcie zasady grupy znajdziemy dwa główne typy ustawień:

Windows 10 - Jak uruchomić system w trybie

Instrukcja instalacji Control Expert 3.0

Instrukcja obsługi Rejestrator jazdy HD 50213

Ćwiczenie 1. Modelowanie prostego procesu

Funkcje dodatkowe. Wersja 1.2.1

INSTRUKCJA UŻYTKOWNIKA

1. Opis. 2. Wymagania sprzętowe:

Rodzaje plików. Podstawowe definicje.

Modułowy programowalny przekaźnik czasowy firmy Aniro.

IBM SPSS Statistics - Essentials for R: Instrukcje instalacji dla Windows

Instrukcje instalacji pakietu IBM SPSS Data Access Pack dla systemu Windows

Skrócona instrukcja obsługi systemu automatycznego operatora

Instalacja pakietu Office 365 ProPlus wersja stand-alone/offline

Exchange PEPUG

Unlocker. Windows: przenoszenie i usuwanie zablokowanych plików

Interfejsy sieciowe w systemie Windows Server

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Spis treści. FAQ: /PL Data: 30/06/2015. Instalacja polskiej wersji LOGO! Soft Comfort. 1 Pobranie pliku 2

Budowa i oprogramowanie komputerowych systemów sterowania. Laboratorium 4. Metody wymiany danych w systemach automatyki DDE

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Oprogramowanie. DMS Lite. Podstawowa instrukcja obsługi

INSTRUKCJA OBSŁUGI REPEATERA WI-FI OMEGA ΩMEGA O25W - WIRELESS N 300M.

Laboratorium 8 ( Android -pierwsza aplikacja)

Wykorzystanie oprogramowania IPscore, wer. 2.1 w Ośrodkach Informacji Patentowej (dostosowanie programu do polskiej wersji środowiska komputerowego)

Instrukcja użytkownika ARsoft-CFG WZ1 4.0

Wersja polska. Wstęp. Instalacja software. MP508FMV2 Sweex Black Onyx MP4 Player

Rejestracja na platformie Ingram Micro Cloud Marketplace.

Spotkanie robocze PIONIER-CERT Poznań, Tomasz Nowak Zespół Bezpieczeństwa PCSS

PROBLEMY TECHNICZNE. Co zrobić, gdy natrafię na problemy związane z użytkowaniem programu DYSONANS

Paragon HFS+ for Windows

Czytnik kart SIM instrukcja obsługi

Firma Informatyczna ASDER. Prezentacja. Serwer danych lokalnych. Przemysław Kroczak ASDER

Systemy operacyjne I Laboratorium Część 3: Windows XP

ADAPTER INTERFEJSU dla ipod KS-PD100 Przed użyciem adaptera

ADAPTERA INTERFEJSU ODTWARZACZA D. KS-PD500 Przed użyciem adaptera

Aplikacje WWW - laboratorium

Konsorcjum FEN Sp. z o.o. ul. Dąbrowskiego 273A, Poznań Mateusz Zapotoczny support [at] fen.pl

Samsung Universal Print Driver Podręcznik użytkownika

PARTS BULLETIN. Date: Issue No: Page: 1 (5) Radioodbiorniki marki Pioneer

Istnieją trzy sposoby tworzenia kopii zapasowej na panelu Comfort:

Instrukcja instalatora kart mikroprocesorowych od Windows XP do Windows Wstęp 1 2. Wymagania instalacji 1 3.

Programowanie aplikacji mobilnych

Rozdział 4. Multimedia

Modem i sieci lokalne

Papyrus. Papyrus. Katedra Cybernetyki i Robotyki Politechnika Wrocławska

7 Business Ship Control dla Wf-Mag Prestiż i Prestiż Plus

Polska wersja pakietu raportowego ActiveFactory 9.1 wymaga polskiego systemu operacyjnego Windows 2000 / Windows XP / Windows 2003.

Wdrożenie modułu płatności eservice. dla systemu Drupal Commerce 7.x-1.9

Programowanie Obiektowe GUI

FAQ: /PL Data: 16/11/2007 Programowanie przez Internet: Konfiguracja modułów SCALANCE S 612 V2 do komunikacji z komputerem przez VPN

Ploter I-V instrukcja obsługi

1. Instalacja modułu w systemie Windows.

Rysunek 1: Okno z lista

Modem i sieć lokalna Instrukcja obsługi

MONITOROWANIE WINDOWS Z NETCRUNCHEM 7 P A G E 1

Tworzenie nowych pytań materiał dla osób prowadzących kursy

SUBIEKT GT IMPORT XLS Dokumenty

ZWIĘZŁY OPIS PODSTAWOWYCH FUNKCJI

Webowy generator wykresów wykorzystujący program gnuplot

Spis treści INTERFEJS (WEBSERVICES) - DOKUMENTACJA TECHNICZNA 1

Programowanie niskopoziomowe

W dowolnej przeglądarce internetowej należy wpisać poniższy adres:

Platforma e-learningowa

RR-5T INSTRUKCJA OBSŁUGI RR-5T !!! System sterowania napędami PORTOS. Dane techniczne : Charakterystyka urządzenia:

Funkcje dodatkowe. Wersja 1.2.1

ODMS Moduł transkrypcji

Pomoc do programu ISO Manager

Konfiguracja WDS na module SCALANCE W Wstęp

OKRĘGOWA KOMISJA EGZAMINACYJNA W KRAKOWIE WYDZIAŁ BADAŃ I ANALIZ

CENTRALA STERUJĄCA SMART CONTROL

Karta Video USB DVR-USB/42

NetDrive czyli jak w prosty sposób zarządzać zawartością FTP

Wykonać Ćwiczenie: Active Directory, konfiguracja Podstawowa

Transkrypt:

Wydział Fizyki, Astronomii i Informatyki Stosowanej UMK 21 grudnia 2011

1 Wstęp 2 3

SPEECH API Wstęp TTS - Text To Speech Speech Recognition Engine Windows 7 posiada 5.4 Rysunek: Opcje rozpoznawania mowy w panelu sterowania Windows 7

Jezyki, które potrafi rozpoznawać SRE: Chiński Japoński Angielski Francuzki Niemiecki Hiszpański potrzebujemy odpowiedniego pakietu językowego. Rysunek: Windows 7 cię słucha

ISpRecoContext Wstęp ISpRecoContext Główny interfejs rozpoznawania mowy. Tworzony za pomocą metody ISpRecognizer::CreateRecoContext Każda aplikacja musi mieć przynajmniej jeden RecoContext. Może mieć więcej. Każdy obiekt ISpRecoContext może zajmować się innymi zdarzeniami związanymi z rozpoznawaniem mowy. Każdy ISpRecoContext może używać innej grammatyki.

ISpRecognizer Wstęp ISpRecognizer Interfejs pozwalający aplikacji na wybór odpowiedniego silnika rozpoznawania mowy. Każdy interfej ISpRecognizer reprezentuje pojedyńczy SR engine. Możemy do niego podłączyć wiele kontekstów (ISpRecoContext). Umożliwia wybór źródła audio. Istnieją 2 implementacje ISpRecognizer a: 1 shared-recognizer 2 in-process (InProc)

SpSharedRecognizer - shared recognizer SR engine jest tworzony w osobnym procesie. Może być współdzielony przez programy (mogą pracować równocześnie). Jest tylko jeden w systemie. Nie trzeba określać źródła dźwięku, wybiera te ustawione domyślnie w systemie (w panelu sterowania) SpInProcRecognizer - in process Tworzony w tym samym procesie co aplikacja. Nie może być współdzielony przez aplikacje. Konieczne jest podanie źródła audio.

Obsługa zdarzeń Wstęp W jaki sposób będziemy obsługiwać zdarzenia decydujemy korzystając z ISpRecoContext (który dziedziczy z ISpEventSource). By określić, które zdarzenia mamy umieszczać w kolejce i o których mamy informować korzystamy z ISpEventSource::SetInterest (gdy go nie użyjemy domyślnie będziemy obsługiwać tylko SPEI RECOGNITION). Najważniejsze zdarzenia 1 SPEI RECOGNITION 2 SPEI FALSE RECOGNITION

Wstęp Programy do rozpoznawania mowy działają przeważnie na dwa sposoby (tryby):

Wstęp Programy do rozpoznawania mowy działają przeważnie na dwa sposoby (tryby): 1 dictation - program pracuje jako notatnik starając rozpoznać się to co mu powiemy

Wstęp Programy do rozpoznawania mowy działają przeważnie na dwa sposoby (tryby): 1 dictation - program pracuje jako notatnik starając rozpoznać się to co mu powiemy 2 command and control - program ma określone reguły (słowa), które ma rozpoznać i to ich oczekuje.

dictation Wstęp 1 Tworzymy ISpRecoGramma: ISpRecoContext::CreateGrammar 2 Ładujemy odpowiednią gramatykę: ISpRecoGrammar::LoadDictation 3 Ustawiamy stan gramatyki jako aktywny (SPRS ACTIVE): ISpRecoGrammar::SetDictationState

command and control 1 ISpRecoContext::CreateGrammar 2 ISpRecoGrammar::LoadCmdxxx 3 ISpRecoGrammar::SetRuleState or ISpRecoGrammar::SetRuleIdState Grammar Rule Zasady określające jakie słowa będziemy rozpoznawać zapisane są w pliku XML. Plik ten zostaje skompilowany za pomocą Gramma Compilera (gc.exe) do pliku *.cfg.

1 <grammar LANGID= 409 > <DEFINE> 3 <ID NAME= meeting VAL= 1 /> <ID NAME= AmA VAL= 100 /> 5 <ID NAME= t b r e VAL= 101 /> </DEFINE> 7 <RULE NAME= SCHEDULE ID= 139 TOPLEVEL= ACTIVE > <OPT> 9 <L> <P>P l e a s e</p> 11 <P>P l e a s e h e l p me</p> </L> 13 </OPT> <L PROPNAME= r e q u e s t > 15 <P VAL= meeting >s c h e d u l e a meeting</p> <P VAL= meeting >s e t up a meeting</p> 17 </L> <P>w i t h</p> 19 <L PROPNAME= p a r t i c i p a n t s > <P VAL= AmA >Amy Anderson</P> 21 <P VAL= t b r e >Ted Bremer</P> </L> 23 </RULE> </GRAMMAR>

Wyniki Rozpoznawania Informacje o rozpoznanym tekście (dla danego ISpRecoGramma i ISpRecoContext) znajdują się w obiekcie klasy RecoResult, który trafia do nas jako pole struktury SPEVENT (znajdują się w niej informacje o zdarzeniu). Rozpoznany tekst możemy odczyta za pomocą metody ISpPhrase::GetText. SPPHRASE SPPHRASE struktura zawierająca informacje o procesie rozpoznawania tekstu w tym hipotezy, błędne rozpoznania, rozpoznany tekst i alternatywnie rozpoznany tekst. Możemy się do niej dostać za pomocą metody ISpPhrase::GetPhrase

Kolokwialne Pytania na Kolokwium 1 Podaj różnicę między shared-recognizer a in-process.

Dziękuję za uwagę