Rozpoznawanie mowy dla języków semickich. HMM - HTK, CMU SPHINX-4, Simon
|
|
- Władysław Niewiadomski
- 6 lat temu
- Przeglądów:
Transkrypt
1 Rozpoznawanie mowy dla języków semickich HMM - HTK, CMU SPHINX-4, Simon
2 Charakterystyka języków semickich Przykłady: arabski, hebrajski, amharski, tigrinia, maltański (280 mln użytkowników). Budowa spółgłoskowo rdzeniowa. Spółgłoskowe pisma alfabetyczne pisane od prawej do lewej. Duża liczba spółgłosek gardłowych.
3 Lokalizacja geograficzna
4 Budowa języka Słowa formowane wokół spółgłosek, które przenoszą znaczenie. Fleksyjna funkcja samogłosek. Pomijanie samogłosek w zapisie.
5 Cechy specyficzne Rozróżnienie na samogłoski długie i krótkie. Samogłoski realizowane w zapisie przez spółgłoski. Wiele wariantów tego samego fonemu.
6 Podstawowa struktura języka Język arabski Język hebrajski 36 fonemów: 28 spółgłosek, 6 samogłosek, 2 dyftongi /a, e, i, a:, e:, i:/ oraz /aj, aw/ 22 spółgłosek 5 podstawowych samogłosek + zanikające odmiany /a, e, o, u, i/
7 Alfabet hebrajski
8 Rodzaje samogłosek hebrajskich
9 Alfabet arabski
10 Problemy 1. Diakrytyzacja teksty nie są w pełni diakrytyzowane wiele podobnych form zanikające różnice między samogłoskami 2. Wiele dialektów hebrajski jako język diaspory (naleciałości) Starohebrajski a ivrit hadash MSA (Model Standard Arabic) Qur an based 3. Skomplikowana fonologia zmienna długość samogłosek (HMM temporal variation)
11
12
13 Arabic Automatic Speech Recognition
14 Analizowane systemy rozpoznawania mowy HMM + HTK for Arabic Language CMU SPHINX 4 Simon Testing Simon blog:
15 Zadanie
16 Przegląd badań i projektów I Iqbal, et. al. [2008] Bazuje na pryncypiach recytacji Koranu System wykazuje 90 % trafności na plikach mowy ciągłej zawierającej ponad 1000 samogłosek Razak, et.al. [2008] Bazuje na recytacji Koranu Wykorzystuje algorytm MFCC Rozpoznanie i rozróżnienie arabskiej wymowy i akcentowania poprzez wyodrębnienie samogłosek
17 Przegląd badań i projektów II Tolba, et. al. [2005] Segmentacja spółgłosek/samogłosek przy użyciu transformacji falkowej Projekt nowego algorytmu nie wykorzystującego informacji lingwistycznej Transformacja falkowa i analiza transjentów pomiędzy samogłoskami i spółgłoskami na konkretnych poziomach dekompozycji pakietowej Trafność: 88,3 %
18 Przegląd badań i projektów III - 1 Alotaibi, Hussain [2010] Wyodrębnienie samogłosek (MSA) 1. HMM 2. Analiza formantowa System parameters: fs = 10 khz, 16 bit, framing/window Hamming 25 ms, lap 10 ms MFCC Coefficients: 22 length of cepstral filtering, 26 filter bank chanels, 12 MFCC coefficients preemphasis
19 Przegląd badań i projektów III - 2 Alotaibi, Hussain [2010] Baza danych: nagrania wymowy 10 mężczyzn, wiek lat (Arabia Saudyjska, Egipt) 5 różnych prób dla 8 samogłosek x 10 = 4000 próbek 60% trening, 40% testy SRS 91,6 % Fatha kasrah 99%, short fatha 77,5 % 5 samogłosek osiągnęło poziom 90%
20 Podobieństwo między długimi i krótkimi samogłoskami
21 CMU Sphinx Satori, Hiyassat, Chenfour [2007] Bazuje na HMM Informacja lingwistyczna: Budowa sylab: CV, CVV, CVC, CVVC, CVCC, CVVCC (zawsze rozpoczyna się od C, nigdy od dwóch C) Parametry systemu (optymalizacja): 5 state left-to-right architecture (speech unit) 16 Gaussians (state model) Best results at: filler insertion probability 0.1, word insertion probability = 0.123, language weight = 6
22 CMU Sphinx Baza nagrań: 60 Marokańczyków (25 F, 35 M), 10 przykładów, 5 powtórzeń = 3000 próbek fs = 16 khz, 16 bit, trening: 3000 próbek Test: M/F x N prób
23 CMU Sphinx Arabic Automatic Speech Recognition htm - Sphinx, dokumentacja + próbki
24 Simon
25 Simon Ralf s Arabic Speech Model, Ralf s Hebrew Speech Model for Simon - słowniki - software
26 Prezentacja w oparciu o poniższe artykuły: Comaparative Analysis of Arabic Vowels using Formants and an Automatic Speech Recognition System Yousef Ajami Alotaibi, Amir Hussain (International Journal of Signal Processing, King Saud University, Stirling University) Investigation Arabic Speech Recognition Using CMU Sphinx System Hassan Satori, Hussein Hiyassat, Mostafa Harti, Noureddine Chenfour (Dar Mehraz Fes, Maroko)
27 Oraz źródła:
Omówienie różnych metod rozpoznawania mowy
Omówienie różnych metod rozpoznawania mowy Na podstawie artykułu: Comparative study of automatic speech recognition techniques Beniamin Sawicki Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna
Bardziej szczegółowoAKUSTYKA MOWY. Podstawy rozpoznawania mowy część I
AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek
Bardziej szczegółowoSynteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan
Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan Synteza mowy System przetwarzania tekstu pisanego na mowę Text-to-Speech (TTS) TTS powinien być w stanie przeczytać
Bardziej szczegółowoPRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM
MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,
Bardziej szczegółowoKorpusy mowy i narzędzia do ich przetwarzania
Korpusy mowy i narzędzia do ich przetwarzania Danijel Korzinek, Krzysztof Marasek Polsko-Japońska Akademia Technik Komputerowych Katedra Multimediów kmarasek@pjwstk.edu.pl danijel@pjwstk.edu.pl 2015-05-18
Bardziej szczegółowoKATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:
KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie
Bardziej szczegółowoRozpoznawanie mowy za pomocą HTK
Kinga Frydrych Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna, rok III, 2013/2014 Sprawozdanie z ćwiczeń laboratoryjnych z Technologii mowy Rozpoznawanie mowy za pomocą HTK 1. Opis gramatyki
Bardziej szczegółowoO sylabie oraz sposobach jej naprawy w egipskim arabskim
O sylabie oraz sposobach jej naprawy w egipskim arabskim Tematyka mojego dzisiejszego wystąpienia związana jest z moją pracą magisterską, która poświęcona była fonologicznemu porównaniu egipskiego arabskiego
Bardziej szczegółowoAlgorytmy rozpoznawania mowy oparte o kształt i/lub ruch ust - przegląd literatury naukowej z lat
Algorytmy rozpoznawania mowy oparte o kształt i/lub ruch ust - przegląd literatury naukowej z lat 2008-2014 Wojciech Jończyk Wydział Inżynierii Mechanicznej i Robotyki Katedra Mechaniki i Wibroakustyki
Bardziej szczegółowoTranskrypcja fonetyczna i synteza mowy. Jolanta Bachan
Transkrypcja fonetyczna i synteza mowy Jolanta Bachan IPA Międzynarodowy alfabet fonetyczny, MAF (ang. International Phonetic Alphabet, IPA) alfabet fonetyczny, system transkrypcji fonetycznej przyjęty
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna (j.a. amerykański) Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom
Bardziej szczegółowoKARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. Dostarczenie studentom dogłębnej wiedzy na temat angielskiego systemu fonologicznego.
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Gramatyka opisowa 2. KIERUNEK: filologia, specjalność filologia angielska 3. POZIOM STUDIÓW: studia pierwszego stopnia 4. ROK/ SEMESTR STUDIÓW: rok I, semestr 2 5.
Bardziej szczegółowoZastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. brytyjski) Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna (j.a. brytyjski) Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom kwalifikacji
Bardziej szczegółowoOpisy efektów kształcenia dla modułu
Karta modułu - Technologia mowy 1 / 5 Nazwa modułu: Technologia mowy Rocznik: 2012/2013 Kod: RIA-1-504-s Punkty ECTS: 7 Wydział: Inżynierii Mechanicznej i Robotyki Poziom studiów: Studia I stopnia Specjalność:
Bardziej szczegółowo4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
Bardziej szczegółowoZastosowanie algorytmu DTW jako narzędzia w identyfikacji mówcy
Piotr Żelasko, Agata Trawińska, Bartosz Ziółko, Marcin Czyżyk, Joanna Stanisławek, Elżbieta Ślusarz Zastosowanie algorytmu DTW jako narzędzia w identyfikacji mówcy Wstęp W badaniach fonoskopijnych dotyczących
Bardziej szczegółowoSprawozdanie z laboratoriów HTK!
Inżynieria akustyczna - Technologia mowy 2013 Błażej Chwiećko Sprawozdanie z laboratoriów HTK! 1. Przeznaczenie tworzonego systemu! Celem było stworzenie systemu służącego do sterowania samochodem. Zaimplementowane
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski
Automatyczne rozpoznawanie mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody holistyczne;
Bardziej szczegółowoOPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU Nazwa
Bardziej szczegółowoPrzygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA
Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA 1 Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA MBROLA.Creating the
Bardziej szczegółowoTranspozer czasowy mowy
Transpozer czasowy mowy Politechnika Gdańska ul. Narutowicza 11/12 80-233 Gdańsk www.pg.gda.pl 1. Wprowadzenie Transpozer czasowy mowy został opracowany w celu wspierania rozumienia mowy przez osoby z
Bardziej szczegółowoKARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE: znajomość języka angielskiego na poziomie B1 (na początku semestru 2) i B1+ (na początku semestru 3)
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Gramatyka opisowa 2. KIERUNEK: filologia, specjalność filologia angielska 3. POZIOM STUDIÓW: studia pierwszego stopnia 4. ROK/SEMESTR STUDIÓW: rok I, II/semestr 2,
Bardziej szczegółowoOPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) studia pierwszego stopnia
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) Nazwa modułu (przedmiotu)
Bardziej szczegółowoSynteza mowy. opracowanie: mgr inż. Kuba Łopatka
Synteza mowy opracowanie: mgr inż. Kuba Łopatka Synteza mowy (ang. TTS - Text-To-Speech ) zamiana tekstu w formie pisanej na sygnał akustyczny, którego brzmienie naśladuje brzmienie ludzkiej mowy. Podstawowe
Bardziej szczegółowoPodstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski
Podstawy automatycznego rozpoznawania mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody
Bardziej szczegółowoOPIS MODUŁU (PRZEDMIOTU)
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS MODUŁU (PRZEDMIOTU)
Bardziej szczegółowoNiko 2 Przedmiotowy System Oceniania
Niko 2 Przedmiotowy System Oceniania TREŚCI NAUCZANIA REALIZOWANE W PODRĘCZNIKU NIKO 2 I PODLEGAJĄCE OCENIANIU MÓWIENIE I SŁUCHANIE - opisywanie ilustracji - komentowanie przedstawionej na obrazku sytuacji
Bardziej szczegółowoPRACA DYPLOMOWA Inżynierska
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA Inżynierska Temat: Narzędzie programowe do optymalizacji
Bardziej szczegółowoPRACA DYPLOMOWA Inżynierska
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA Inżynierska Temat: Półautomatyczne rozpoznawanie mówców
Bardziej szczegółowoKomputerowe przetwarzanie sygnału mowy
Komputerowe przetwarzanie sygnału mowy Prof dr hab inż Bożena Kostek Katedra Systemów Multimedialnych Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska Komputerowe przetwarzanie sygnału
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Bardziej szczegółowoScenariusz nr 1. Autor scenariusza: Krystyna Jakubowska. Blok tematyczny: Historia książki
Autor scenariusza: Krystyna Jakubowska Blok tematyczny: Historia książki Scenariusz nr 1 I. Tytuł scenariusza: Dzieje pisma. II. Czas realizacji: 2 jednostki lekcyjne. III. Edukacje (3 wiodące): polonistyczna,
Bardziej szczegółowoModelowanie języka naturalnego (polskiego) dla potrzeb budowy systemu rozpoznawania mowy klasy LVCSR
Akademia Górniczo - Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki i Informatyki Biomedycznej Autoreferat rozprawy doktorskiej Modelowanie języka naturalnego (polskiego)
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna (j.a. amerykański) Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom
Bardziej szczegółowoKLASYFIKACJA ZDAŃ W SYGNALE
KLASYFIKACJA ZDAŃ W SYGNALE MOWY Z WYKORZYSTANIEM MODELU DTW Włodzimierz Kasprzak Raport IAiIS PW Nr 12-04 Warszawa, maj 2012 r. POLITECHNIKA WARSZAWSKA WYDZIAŁ ELEKTRONIKI I TECHNIK INFORMACYJNYCH INSTYTUT
Bardziej szczegółowoCzym jest HTK HMMs ASR
HTK 138 Czym jest HTK Zbiór programów implementujących Niejawne Łańcuchy Markowa - Hidden Markov Models (HMMs) ASR, synteza mowa, rozpoznawanie liter, badania nad sekwencjami DNA Analiza mowy, wyćwiczenie
Bardziej szczegółowoWykorzystanie suprasegmentalnych zjawisk językowych w modelowaniu języka polskiego na potrzeby systemu rozpoznawania mowy
Wykorzystanie suprasegmentalnych zjawisk językowych w modelowaniu języka polskiego na potrzeby systemu rozpoznawania mowy Bartosz Ziółko, Magdalena Igras Katedra Elektroniki Zespół Przetwarzania Sygnałów
Bardziej szczegółowoZastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy
Tomasz ZIELIŃSKI ), Paweł GAJDA ), Marcin STACHURA ) Robert WIELGAT 2), Daniel KRÓL 2), Tomasz WOŹNIAK 3), Stanisław GRABIAS 3) ) AKADEMIA GÓRNICZO-HUTNICZA, KATEDRA METROLOGII 2) PAŃSTWOWA WYŻSZA SZKOŁA
Bardziej szczegółowo4. EKSPLOATACJA UKŁADU NAPĘD ZWROTNICOWY ROZJAZD. DEFINICJA SIŁ W UKŁADZIE Siła nastawcza Siła trzymania
3 SPIS TREŚCI Przedmowa... 11 1. WPROWADZENIE... 13 1.1. Budowa rozjazdów kolejowych... 14 1.2. Napędy zwrotnicowe... 15 1.2.1. Napęd zwrotnicowy EEA-4... 18 1.2.2. Napęd zwrotnicowy EEA-5... 20 1.3. Współpraca
Bardziej szczegółowodr inż. Jacek Naruniec
dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,
Bardziej szczegółowoHLT_12 Warszawa. Lingwistyka matematyczna w Katedrze Elektroniki AGH
HLT_12 Warszawa Lingwistyka matematyczna w Katedrze Elektroniki AGH 1 Lingwistyka jaka jest każdy widzi Lingwistyka matematyczna: - identyfikacja rozmówcy - przetwarzanie języka naturalnego - przetwarzanie
Bardziej szczegółowoń ę ń ę ń ę ń ę ę ę ę ę ź ń ź Ś ę Ł ń ę ę ń ę ń ę ę ę ę ę ę ź ę ę Ż ę ŚĆ ę Ż ń ń ę ń ę ę ę ę ę ź ę ę Ś Ś Ś Ś ź ę ń ę ę Ź ń Ś Ś ę ń ę ę ę ę ę ź ń ŚĆ Ś ń ń ń Ą ń ę ę ŚĆ ę Ż ę ń ę ę ę ę ę ź ń Ś Ś ź Ś Ł ę
Bardziej szczegółowoPoradnik HTK. Adrian Sekuła
Poradnik HTK Adrian Sekuła Wstęp Poradnik wykonano do przedmiotu Technologia Mowy, prowadzonego przez dr inż. Bartosza Ziółko i dr inż. Jakuba Gałkę na studiach Inżynieria Akustyczna na AGH w Krakowie.
Bardziej szczegółowoInwersja mowy za pomocą nieliniowej transfomacji czasowej Inversion of speech by non-linear transformation of temporary
Robert Wielgat 1 *, Anita Lorenc 2 1 Państwowa Wyższa Szkoła Zawodowa w Tarnowie, Instytut Politechniczny, Zakład Elektroniki i Telekomunikacji State Higher Vocational School in Tarnow, Polytechnic Institute,
Bardziej szczegółowoJĘZYKOZNAWSTWO TYPOLOGICZNE I PORÓWNAWCZE UAM 2017/2018. prof. dr hab. Nicole Nau
JĘZYKOZNAWSTWO TYPOLOGICZNE I PORÓWNAWCZE UAM 2017/2018 prof. dr hab. Nicole Nau ZAJĘCIA 07-11-2017 Typologia morfologiczna jak wyglądają języki różnego typu? Kategorie gramatyczne Wykładniki kategorii
Bardziej szczegółowoPraca dyplomowa - magisterska
Wydział Informatyki i Zarządzania kierunek studiów: Informatyka specjalność: Internet i Technologie Mobilne Praca dyplomowa - magisterska METODY TWORZENIA GIER STEROWANYCH GŁOSEM Marek Pawluch słowa kluczowe:
Bardziej szczegółowoZASTOSOWANIE ROZPOZNAWANIA MÓWCY W AUTOMATYCZNEJ TRANSLACJI MOWY TYPU SPEECH-TO-SPEECH 1
STUDIA INFORMATICA 2014 Volume 35 Number 3 (117) Piotr KŁOSOWSKI, Adam DUSTOR, Jacek IZYDORCZYK Politechnika Śląska, Instytut Elektroniki ZASTOSOWANIE ROZPOZNAWANIA MÓWCY W AUTOMATYCZNEJ TRANSLACJI MOWY
Bardziej szczegółowoEfekt Lombarda. Czym jest efekt Lombarda?
Efekt Lombarda Na podstawie raportu Priscilli Lau z roku 2008 na Uniwersytecie w Berkeley wykonanego na podstawie badań w laboratorium Fonologii. Autor prezentacji: Antoni Lis Efekt Lombarda Czym jest
Bardziej szczegółowoHTK czego NIE robić. Bartłomiej Chojnacki. - uważać przy przepisywaniu komend, czasem małe L wygląda identycznie jak duże I
Wstęp HTK czego NIE robić Bartłomiej Chojnacki Niniejszy poradnik proponuję jako uzupełnienie do istniejącego już świetnego dokumentu Adriana Sekuły Poradnik HTK, gdyby nie on zapewne do tej pory grzebałbym
Bardziej szczegółowoKLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
Bardziej szczegółowoANALIZA SZYBKIEJ IDENTYFIKACJI MÓW- CY IMPLEMENTOWANYCH W ŚRODOWI- SKU MATLAB ORAZ CODE COMPOSER STUDIO
Zeszyty Naukowe WSInf Vol 9, Nr 3, 2010 Tomasz Marciniak, Radosław Weychan, Adam Dąbrowski Politechnika Poznańska Katedra Sterowania i Inżynierii Systemów Pracownia Przetwarzania Sygnałów i Układów Elektronicznych
Bardziej szczegółowoROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI 1) z dnia 30 maja 2005 r.
Dz.U.05.102.855 ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI 1) z dnia 30 maja 2005 r. w sprawie sposobu transliteracji imion i nazwisk osób należących do mniejszości narodowych i etnicznych
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom kwalifikacji I stopnia
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna j. angielskiego brytyjskiego Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna j. brytyjskiego Kierunek Forma studiów Poziom kwalifikacji Rok Semestr Jednostka prowadząca
Bardziej szczegółowoMODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 2
Uniwersytet Śląski w Katowicach str. 1 Program kształcenia, załącznik nr 1. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy 3. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne
Bardziej szczegółowoWady i ograniczenia systemów rozpoznawania mowy
Karolina Kuligowska 1, Paweł Kisielewicz 2, Aleksandra Włodarz 3 Wady i ograniczenia systemów rozpoznawania mowy 1. Wstęp Rozpoznawanie mowy (ang. speech recognition, speech-to-text STT) jest procesem
Bardziej szczegółowoĆwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej
Ćwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej 1. Filtry FIR o skończonej odpowiedzi impulsowej (SOI) Filtracja FIR polega na tym, że sygnał wyjściowy powstaje
Bardziej szczegółowoSamogłoski proste (monoftongi) języka łatgalskiego cechy widmowe
Samogłoski proste (monoftongi) języka łatgalskiego cechy widmowe 1. Istniejące opisy Dotychczas nie publikowano opisów akustycznych samogłosek łatgalskich. Pewnym punktem odniesienia mogą być opisy systemu
Bardziej szczegółowoTechnologie Mowy Bartosz Ziółko
www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Technologie Mowy Bartosz Ziółko 1 Technologie Mowy 2 Technologie Mowy 3 Technologie Mowy 4 Dane kontaktowe Dr inż. Jakub Gałka C2/419 Telefon 50-68
Bardziej szczegółowo3. Pismo etiopskie. Ciekawostki
3. Pismo etiopskie Ciekawostki Najważniejsze języki Etiopii: AMHARSKI, OROMO, TIGRINIA, SOMALI, GURAGIE, Sidamo, Uelajta. W przypadku Etiopii nie można utożsamiać liczby przedstawicieli danej grupy etnicznej
Bardziej szczegółowoGramatyka opisowa języka polskiego Kod przedmiotu
Gramatyka opisowa języka polskiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Gramatyka opisowa języka polskiego Kod przedmiotu 09.3-WH-FiP-GOP-1-K-S14_pNadGen0FA8C Wydział Kierunek Wydział Humanistyczny
Bardziej szczegółowoSprawozdanie z laboratoriów HTK
Inżynieria Akustyczna Technologia Mowy 2013 Jakub Antoniuk Sprawozdanie z laboratoriów HTK 1.Opis gramatyki System był projektowany w celu obsługi inteligentnych instalacji w domach. Istnieją systemy pozwalające
Bardziej szczegółowoAkustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski
Akustyka mowy wprowadzenie Opracował: dr inż. Piotr Suchomski Kontakt Katedra Systemów Multimedialnych Wydział ETI dr inż. Piotr M. Suchomski, pok. EA 730 e-mail: pietka@sound.eti.pg.gda.pl tel. 23-01
Bardziej szczegółowoANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
Bardziej szczegółowoANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
Bardziej szczegółowodr inż. Artur Janicki pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW
dr inż. Artur Janicki email: A.Janicki@tele.pw.edu.pl, pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW Kodowanie źródła podstawowe informacje Sygnał mowy informacje ogólne, jak
Bardziej szczegółowodr hab. inż. Artur Janicki pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW
dr hab. inż. Artur Janicki email: A.Janicki@tele.pw.edu.pl, pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW Kodowanie źródła podstawowe informacje Sygnał mowy informacje ogólne, jak powstaje
Bardziej szczegółowoRozpoznawanie mówcy i emocji
Katedra Elektroniki, Zespół Przetwarzania Sygnałów www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Rozpoznawanie mówcy i emocji Bartosz Ziółko Wykorzystano materiały Davida Sierry, Wojciecha
Bardziej szczegółowoSystem Korekty Tekstu Polskiego
System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Wersja algorytmu dla języka hiszpańskiego Wnioski
Bardziej szczegółowoTest wydajności współczynników percepcyjnych w kontekscie rozpoznawania emocji
Tomasz Sapiński, Dorota Kamińska Politechnika Łódzka Test wydajności współczynników percepcyjnych w kontekscie rozpoznawania emocji Wprowadzenie Komunikacja interpersonalna to nieodzowny element ludzkiego
Bardziej szczegółowoO-MaSE Organization-based Multiagent System Engineering. MiASI2, TWO2,
O-MaSE Organization-based Multiagent System Engineering MiASI2, TWO2, 2017-2018 Materiały Strona poświęcona metodzie O-MaSE http://macr.cis.ksu.edu/projects/omase.html (Multiagent & Cooperative Reasoning
Bardziej szczegółowoKorpusy i Narzędzia do Analizy Mowy w Clarin-PL
1 / 20 Korpusy i w Clarin-PL Krzysztof Marasek, Danijel Koržinek, Łukasz Brocki, Krzysztof Wołk Polsko-Japońska Akademia Technik Komputerowych 2 / 20 Plan prezentacji 1 2 3 / 20 4 / 20 Motywacja Brak darmowych
Bardziej szczegółowoOCENA MOśLIWOŚCI WYKORZYSTANIA HODOWLI ŚWIŃ RASY ZŁOTNICKIEJ
ASSESSMENT OF POTENTIAL FOR ZŁOTNICKA SPOTTED PIG BREEDING IN ORGANIC FARMS OCENA MOśLIWOŚCI WYKORZYSTANIA HODOWLI ŚWIŃ RASY ZŁOTNICKIEJ PSTREJ W GOSPODARSTWACH EKOLOGICZNYCH Janusz Tomasz Buczyński (1),
Bardziej szczegółowoROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW
ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW Maciej Piasecki, Szymon Zyśko Wydziałowy Zakład Informatyki Politechnika Wrocławska Wybrzeże Stanisława Wyspiańskiego
Bardziej szczegółowoKRYTERIA OCENY ROCZNEJ Z JĘZYKA POLSKIEGO W KLASIE IV
WYMAGANIA EDUKACYJNE JĘZYK POLSKI KL.IV KRYTERIA OCENY ROCZNEJ Z JĘZYKA POLSKIEGO W KLASIE IV OCENĘ CELUJĄCĄ programem nauczania dla klasy IV i poza tym: twórczo i samodzielnie rozwija własne uzdolnienia
Bardziej szczegółowoKARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Nauka o języku i komunikacji. 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Nauka o języku i komunikacji 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym 3. POZIOM STUDIÓW: studia podyplomowe 4. ROK/ SEMESTR STUDIÓW:
Bardziej szczegółowoTransformata Fouriera. Sylwia Kołoda Magdalena Pacek Krzysztof Kolago
Transformata Fouriera Sylwia Kołoda Magdalena Pacek Krzysztof Kolago Transformacja Fouriera rozkłada funkcję okresową na szereg funkcji okresowych tak, że uzyskana transformata podaje w jaki sposób poszczególne
Bardziej szczegółowoBeyond Upper-intermediate (B2) rozkład materiału 120h lekcyjnych
3-11h 2-13h 1-11h ROZDZIAŁ Beyond Upper-intermediate (B2) rozkład materiału 120h lekcyjnych 1 ROZDZIAŁ LICZBA GODZIN TEMATYKA- SŁOWNICTWO FUNKCJE KOMUNIKACYJNE GRAMATYKA UMIEJĘTNOŚCI LIFE SKILLS INTEGRACJA
Bardziej szczegółowoMODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1
Uniwersytet Śląski w Katowicach str. Program kształcenia, załącznik nr. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy 3. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne
Bardziej szczegółowo2. Opis zajęć dydaktycznych i pracy studenta
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Filologia, specjalność język rosyjski program język biznesu, I stopień Sylabus modułu: Gramatyka opisowa języka rosyjskiego (GOJR02) Nazwa
Bardziej szczegółowoDiagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z zastosowaniem MFCC i klasyfikatora rozmytego
mgr inż. ADAM GŁOWACZ Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Akademia Górniczo-Hutnicza w Krakowie Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z
Bardziej szczegółowoKarta przedmiotu. Politechnika Krakowska im. Tadeusza Kościuszki. 1 Informacje o przedmiocie. 2 Rodzaj zajęć, liczba godzin w planie studiów
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu obowiązuje studentów rozpoczynających studia w roku akademickim 2018/2019 Kierunek studiów: Wszystkie kierunki Forma sudiów: stacjonarne
Bardziej szczegółowoInstrukcja dopasowania SoundRecover2 u dorosłych
Phonak Target Marzec 2017 Instrukcja dopasowania SoundRecover2 u dorosłych Poniższa instrukcja jest przeznaczona do dopasowań dla osób dorosłych. Przy dopasowaniach pediatrycznych skorzystaj z oddzielnej
Bardziej szczegółowoMorfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Bardziej szczegółowoIMPROVED SPEECH RECOGNITION PROCESS BASED ON PHONETICS AND PHONOLOGY OF POLISH LANGUAGE
ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: ELEKTRONIKA z. 12 2000 Nr kol. 1492 Piotr KŁOSOWSKI Politechnika Śląska, Instytut Elektroniki USPRAWNIENIE PROCESU AUTOM ATYCZNEGO ROZPOZNAW ANIA MOWY OPARTEGO
Bardziej szczegółowoKRYTERIA OCEN Z JĘZYKA POLSKIEGO W KLASIE V
KRYTERIA OCEN Z JĘZYKA POLSKIEGO W KLASIE V OCENA CELUJĄCĄ otrzymuje ją uczeń, który opanował pełny zakres wiadomości i umiejętności określonych programem nauczania dla klasy V oraz: twórczo i samodzielnie
Bardziej szczegółowo2. Opis zajęć dydaktycznych i pracy studenta
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Filologia, specjalność rosjoznawstwo, I stopień Sylabus modułu: Gramatyka opisowa języka rosyjskiego (02-FL-RJ-S1-GOJR02) Nazwa wariantu
Bardziej szczegółowoRozpoznawanie obiektów na podstawie zredukowanego zbioru cech. Piotr Porwik Uniwersytet Śląski w Katowicach
Rozpoznawanie obiektów na podstawie zredukowanego zbioru cech Piotr Porwik Uniwersytet Śląski w Katowicach ?? It is obvious that more does not mean better, especially in the case of classifiers!! *) *)
Bardziej szczegółowoInteligentne metody rozpoznawania dźwięku
Politechnika Łódzka Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Kierunek Informatyka Praca magisterska Inteligentne metody rozpoznawania dźwięku Stanisław Kacprzak Promotor: prof. dr
Bardziej szczegółowoDydaktyka wczesnego nauczania języka niemieckiego - opis przedmiotu
Dydaktyka wczesnego nauczania języka niemieckiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Dydaktyka wczesnego nauczania języka niemieckiego Kod przedmiotu 05.1-WP-PEDP-DWNN Wydział Kierunek
Bardziej szczegółowoXpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie
Xpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie XPRESS SCAN, które pozwala użytkownikom bezpośrednio z urządzenia Xerox przez panel dotykowy zrealizować odpowiedni
Bardziej szczegółowoAutor: Krzysztof Dąbek 30 marca / 24
Metaprezentacja Czyli jak zaciekawić ludzi i przekazać informacje z elementami emisji głosu Krzysztof Dąbek 30 marca 2017 Autor: Krzysztof Dąbek 30 marca 2017 1 / 24 Wstęp Inspiracja Inspiracja Szymon
Bardziej szczegółowoSystem Korekty Tekstu Polskiego
Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona
Bardziej szczegółowoII. Kontrola i ocena pracy ucznia.
II. Kontrola i ocena pracy ucznia. Formy kontroli A. Kontrola bieżąca (sprawdza postępy uczniów, zachęcając ich do dalszej systematycznej pracy, pozwala na uzupełnienie braków w wiedzy i skorygować błędy).
Bardziej szczegółowoSYLABUS MODUŁU KSZTAŁCENIA
Lp. Element Opis SYLABUS MODUŁU KSZTAŁCENIA Nazwa modułu Typ modułu Fonetyka obowiązkowy 3 Instytut Instytut Nauk Humanistyczno-Społecznych i Turystyki 4 5 Kod modułu Kierunek, specjalność, poziom i profil
Bardziej szczegółowoWykrywanie twarzy ludzkich na kolorowych obrazach ze złożonym tłem
Wykrywanie ludzkich na kolorowych obrazach ze złożonym tłem Lech Baczyński www.baczynski.com Na podstawie artykułu panów: Yanjiang Wang, Baozong Yuan i in. Do czego przydatne jest wykrywanie (detekcja)?
Bardziej szczegółowoHybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych
Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Politechnika Łódzka Streszczenie rozprawy doktorskiej Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach
Bardziej szczegółowoPRZEWODNIK DYDAKTYCZNY I PROGRAM NAUCZANIA PRZEDMIOTU FAKULTATYWNEGO NA KIERUNKU LEKARSKIM ROK AKADEMICKI 2016/2017
PRZEWODNIK DYDAKTYCZNY I PROGRAM NAUCZANIA PRZEDMIOTU FAKULTATYWNEGO NA KIERUNKU LEKARSKIM ROK AKADEMICKI 2016/2017 1. NAZWA PRZEDMIOTU: Francuski w medycynie dla początkujących 2. NAZWA JEDNOSTKI (jednostek
Bardziej szczegółowo