Sprawozdanie z laboratoriów HTK!

Podobne dokumenty
Sprawozdanie z laboratoriów HTK

Rozpoznawanie mowy za pomocą HTK

I. Gramatyka. Poniżej prezentowana jest realizowana gramatyka:

SPRAWOZDANIE Z LABORATORIÓW HTK SYLWIA BAŁAZY AKADEMIA GÓRNICZO-HUTNICZA IM. S. STASZICA W KRAKOWIE

Sprawozdanie z laboratoriów HTK

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Poradnik HTK. Adrian Sekuła

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

a) Tworzymy podcast w programie Audacity

Ćwiczenie II. Edytor dźwięku Audacity

Advance CAD 2016 SP1. W tym dokumencie opisano ulepszenia w programie Advance CAD 2016 z dodatkiem Service Pack 1. Co nowego w Advance CAD 2016 SP1

2.2 Opis części programowej

Język angielski Wymagania edukacyjne dla klas I

KO M U N I K ATO R Z A F R E E DICO S.C. 2012

Technik mechatronik kwalifikacjae18 Analiza egzaminu zewnętrznego - czerwiec 2015

WYMAGANIA EDUKACYJNE Z JĘZYKA NIEMIECKIEGO DLA KLASY 4 SŁUCHANIE ZE ZROZUMIENIEM: Ocena celująca Uczeń: posiada wiedzę i umiejętności, znacznie

HTK czego NIE robić. Bartłomiej Chojnacki. - uważać przy przepisywaniu komend, czasem małe L wygląda identycznie jak duże I

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Opisy efektów kształcenia dla modułu

Księgowość Optivum. Jak zweryfikować poprawność kwot w zestawieniu budżetowym?

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO KLASY IV-VI SZKOŁA PODSTAWOWA W CHORZEWIE. Spis treści

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

Krzyżówka na lekcji o logarytmie liczby dodatniej i nie tylko

Testowy dokument raz dwa trzy

ANALIZA WYNIKÓW PISEMNEGO EGZAMINU MATURALNEGO Z JĘZYKA ANGIELSKIEGO 2012

Program warsztatów CLARIN-PL

Lekcja 5 - PROGRAMOWANIE NOWICJUSZ

Edycja szablonu artykułu do czasopisma

Kryteria oceniania języka angielskiego w Szkole Podstawowej nr 16 w Zespole Szkolno-Przedszkolnym nr 1 w Gliwicach

SYSTEM OCENIANIA Z JĘZYKÓW OBCYCH.

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

ROGUE RF. Instrukcja obsługi (wersja poprawiona) Wireless Gamepad PC with headphones MT1503

Audacity jest darmowym edytorem audio

OGÓLNE KRYTERIA OCENIANIA POSZCZEGÓLNYCH SPRAWNOŚCI JĘZYKOWYCH

Wymagania edukacyjne i kryteria ocen z języka niemieckiego dla gimnazjum.

Raport z badania Ankietowego. Wizerunek Urzędu Miasta Nowy Targ i oczekiwania jego klientów - w ramach procedury systemu zarządzania, jakością PZ-1.5.

Metody Inżynierii Wiedzy

Przedmiotowy System Oceniania z języka niemieckiego w Gimnazjum nr 1 w Brześciu Kujawskim

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

Jak usunąć wokal z nagrania?

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

6.4. Efekty specjalne

Karta pracy do doświadczeń

r. rok szkolny 2012/2013

SPRAWDŹ JAKIE TESTY MOŻESZ WYKONAĆ Z INNOVATION KONTROLA JPK

Laboratorium Technologii Informacyjnych. Projektowanie Baz Danych

System diagnostyki słuchu

Zasady oceniania na lekcjach języka angielskiego w klasach 4-8

Pracownia Językowa InterAktin - Tablica interaktywna - Gratis! InterAktin

ZASADY OCENIANIA Z JĘZYKÓW OBCYCH.

Oprócz funkcjonalności wymaganych przez zamawiających, urządzenia Hikvision oferują dodatkowo następujące funkcjonalności:

KRYTERIA OCENIANIA Z JĘZYKA FRANCUSKIEGO / ROSYJSKIEGO NA POSZCZEGÓLNE OCENY 1-6. (drugi język obcy kurs początkujący)

SŁOWNIK NORWESKICH CZĘŚCI MOWY V (C) Jerzy Kazojć Słownik zawiera słów.

Nagrywać można wszystko nasze głosy, dźwięki wydawane przez przedmioty, dźwięki otoczenia itp.

- autorzy programu - wyjście z programu

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH I III

Skanowanie OCR w aplikacji Kancelaria Komornika. Instrukcja dla użytkownika

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO KLASY I-III

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

Projekcje multimedialne

PRZEDMIOTOWY SYSTEM OCENIANIA Z JEZYKA ANGIELSKIEGO KLASY IV-VI SZKOŁY PODSTAWOWEJ

Maciej Piotr Jankowski

Dopuszczający Dostateczny Dobry Bardzo dobry Celujący. Osiągnięcie uczeń rozumie wszystkie komunikaty i wypowiedzi nauczyciela ;

WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO DLA UCZNIÓW KLASY VI NA POSZCZEGÓLNE OCENY I OKRES OCENA CELUJĄCA

8.2 Drukowanie arkusza kalkulacyjnego

Szkoła Podstawowa w Dunowie, Dunowo 11, Świeszyno

OPRACOWANIE WYNIKÓW DZIELNICOWEGO EGZAMINU ÓSMOKLASISTY Z JĘZYKA ANGIELSKIEGO MAJ 2018

1 Spedytor Wstępny instruktaż

Laboratorium Ericsson HIS NAE SR-16

Laboratorium Komputerowe Systemy Pomiarowe

Regulamin zatwierdzono na posiedzeniu Rady Pedagogicznej 05 marca 2013r.

DIAGNOZA KLAS PIERWSZYCH Z WYCHOWANIA FIZYCZNEGO. Rok szkolny 2012/2013

5.4. Efekty specjalne

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

PRZEDMIOTOWY SYSTEM OCENIANIA

EFEKTYWNOŚĆ WYNAGRODZEŃ W BANKACH W POLSCE

Jak korzystać z Platformy Edukacyjnej Historia dla Polonii?

II. Kontrola i ocena pracy ucznia.

Wstawianie filmu i odtwarzanie go automatycznie

EGZAMIN MATURALNY Z JĘZYKA OBCEGO NOWOŻYTNEGO I. UWAGI WSTĘPNE

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa I gimnazjum Mgr Magdalena Mazanek Mgr Magdalena Pajor GRAMATYKA I SŁOWNICTWO.

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA HISZPANSKIEGO Kl. III gimnazjalna

Dr hab. inż. Marek Pawełczyk, prof. nzw. w Politechnice Śląskiej Koordynator Projektu POKL /10

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO KLASY IV-VI SZKOŁA PODSTAWOWA NR 43 w BIAŁYMSTOKU

METODY REPREZENTACJI INFORMACJI

INSTRUKCJA UŻYTKOWNIKA

PRZEDMIOTOWE ZASADY OCENIANIA JĘZYK FRANCUSKI ROK SZKOLNY 2016/2017

Panel Konta - instrukcja

PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

Laboratorium Badanie topologii i budowa małej sieci

Nowa Netia administrator firmy Nagrywanie połączeń-zarządzanie

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA HISZPAŃSKIEGO

Wymagania edukacyjne na poszczególne oceny z języka angielskiego dla klas VI szkoły podstawowej.

Flex.CRM (contact relation management) System do zarządzania kontaktami

Wymagania edukacyjne z języka angielskiego dla uczniów gimnazjum klasy I - III

OCENIANIE PRZEDMIOTOWE. język łaciński

PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu

Kontrola i ocena pracy ucznia.

Transkrypt:

Inżynieria akustyczna - Technologia mowy 2013 Błażej Chwiećko Sprawozdanie z laboratoriów HTK! 1. Przeznaczenie tworzonego systemu! Celem było stworzenie systemu służącego do sterowania samochodem. Zaimplementowane zostały podstawowe funkcję silnika, okien, radia i klimatyzacji. 2. Gramatyka! Model gramatyki został oparty o naturalne komendy, które mogłyby być wydane samochodowi z zainstalowanych systemem rozpoznawania mowy. Każde polecenie rozpoczyna się od kluczowego elementu, typu silnik, okno, klimatyzacji i definiuje obiekt, którym będziemy sterować. Poniżej zamieszczona została gramatyka systemu: 3. Słownik! W słowniku umieszczonych zostało 30 słów, które posłużyć miały do stworzenia systemu.

4. Nagrania treningowe! Do zrealizowania nagrań posłużył mikrofon wbudowany w laptopie i program Audacity. Nagrania zostały wykonane w 16 bitach, 16 khz i mono. Łączny czas nagrań wyniósł 2:50. W nagraniach użyto wszystkich możliwych do wystąpienia kombinacji zdać. Wykonane zostały w pokoju, w którym panowała cisza. 5. Wyniki! Numer reestymacji 1 15-70 2 5-100 3 15-100 4 15-105 5 15-100 6 15-100 7 15-100 8 15-100 9 15-100 10 15-100 Tabela 1. Wyniki uzyskanie podczas rozpoznania nagrań testowych W tabeli przedstawione zostały wyniki uzyskane podczas procesu rozpoznawania mowy. Jak można zauważyć żaden z wyników nie przekroczył progu 15% procent dobrze rozpoznanych słów. Dla sentencji wynik zawsze wynosił 0%. Wynik najwyższy uzyskany został przy pierwszej reestymacji. Poprawność na poziomie 15% i celność wynosząca tylko -70. 10-10 Wartości -30-50 -70-90 -110 1 2 3 4 5 6 7 8 9 10 Numer reestymacji Rysunek 1. Wyniki uzyskane podczas rozpoznawania nagrań testowych

6. Analiza wyników! Niestety uzyskana rozpoznawalność mowy jest bardzo niezadowalająca i wyniki uzyskane w trakcie pracy z programem są marnej jakości. Wynikać to może z budowy gramatyki, która mimo że nie jest skomplikowana mogła przysporzyć HTK sporo problemów. Innym istotnym problemem, który wpłynąć mógł na poziom otrzymanych wyników, mogły być nagrania testowe, a dokładniej zawarte w nich zdaniach, które pozwoliły wytrenować niektóre fonemy lepiej od innych. Po spróbowaniu wszystkich znanych mi metod poprawy wyników i marnych rezultatów tychże prób postanowiłem spróbować od początku i naprawić każdą część systemu począwszy od gramatyki. 7. Gramatyka! W poprzedniej wersji zauważone zostały, że niektóre komendy mają zbyt wiele możliwości i dlatego w późniejszych etapach pracy z HTK możliwe było powielanie się niektórych instrukcji i problem z rozpoznawaniem konkretnych zdań dlatego postanowiłem edytować gramatykę i otrzymałem plik o następującej treści: 8. Słownik! Słownik również został poprawiony, a dodatkowo wprowadzone zostały do niego pozostałe możliwe transkrypcje fonetyczne występujących w nim słów.

9. Nagranie treningowe! Nowa gramatyka i nowy słownik wymagały nowych nagrań treningowych, które i w tym wypadku zostały nagrane na mikrofon w laptopie i w programie Audacity. Nagrania zostały wykonane w 16 bitach, 16 khz i mono. Łączny czas nagrań wyniósł 2:36. W nagraniach użyto wszystkich możliwych do wystąpienia kombinacji zdać i każde z nich powtórzone dwukrotnie. Wykonane zostały w pokoju, w którym panowała cisza. 10. Wyniki! Numer reestymacji 1 0-89.47 2 15.79-94.74 3 15.79-94.74 4 5.26-105.26 5 10.53-105.26 6 21.05-100 7 5.26-110.53 8 5.26-131.58 9 5.26-131.58 10 5.26-131.58 Tabela 2. Wyniki uzyskanie podczas rozpoznania nagrań testowych dla zmienionej gramatyki i słownika W powyżej tabeli widać, że niestety wyniki uzyskane po edycji gramatyki i słownika nie są zauważalnie lepsze, przy niektórych reestymacjach są dużo niższe! Wartości 20 0-20 -40-60 -80-100 -120-140 1 2 3 4 5 6 7 8 9 10 Numer reestymacji Rysunek 2. Wyniki uzyskanie podczas rozpoznania nagrań testowych dla zmienionej gramatyki i słownika

11. Analiza wyników! Wyniki otrzymane podczas drugiej próby również nie są zadowalające. Tylko szóstej reestymacji udało się przekroczyć 20 procent rozpoznawalności. Wynik ten jest o zaskakujące, ponieważ inne reestymację oscylują w graniach 5 procent. Mimo poprawionej gramatyki i słownika wyniki nie są na tyle satysfakcjonujące, aby mogły być używane w życiu codziennym. 21.05% rozpoznanych słów czyli najlepszy wynik z całego zadania jest to niewiele ponad 1 /5, co czyni mój program bardzo nieudolnym, należy dodać że cały czas mam na myśli rozpoznawanie słów. Zaimplementowane dane nie były w stanie rozpoznać ani jednego zdania poprawnie. Problem rozpoznawaniem mojej mowy mógł wynikać z budowy gramatyki, niedokładnej adnotacji, słabej jakości mikrofonu lub po prostu jakości mojej wypowiedzi i artykułowanych przeze mnie dźwięków. Wyrażam zgodę na dołączenie moich nagrań do korpusu mowy AGH. Nagrania mogą być odtwarzane ale wyłącznie bez podawania tożsamości mówcy (np. w celu prezentacji jakości, rodzaju nagrań itd.).