Rozpoznawanie mowy dla języków semickich. HMM - HTK, CMU SPHINX-4, Simon
|
|
- Władysław Niewiadomski
- 7 lat temu
- Przeglądów:
Transkrypt
1 Rozpoznawanie mowy dla języków semickich HMM - HTK, CMU SPHINX-4, Simon
2 Charakterystyka języków semickich Przykłady: arabski, hebrajski, amharski, tigrinia, maltański (280 mln użytkowników). Budowa spółgłoskowo rdzeniowa. Spółgłoskowe pisma alfabetyczne pisane od prawej do lewej. Duża liczba spółgłosek gardłowych.
3 Lokalizacja geograficzna
4 Budowa języka Słowa formowane wokół spółgłosek, które przenoszą znaczenie. Fleksyjna funkcja samogłosek. Pomijanie samogłosek w zapisie.
5 Cechy specyficzne Rozróżnienie na samogłoski długie i krótkie. Samogłoski realizowane w zapisie przez spółgłoski. Wiele wariantów tego samego fonemu.
6 Podstawowa struktura języka Język arabski Język hebrajski 36 fonemów: 28 spółgłosek, 6 samogłosek, 2 dyftongi /a, e, i, a:, e:, i:/ oraz /aj, aw/ 22 spółgłosek 5 podstawowych samogłosek + zanikające odmiany /a, e, o, u, i/
7 Alfabet hebrajski
8 Rodzaje samogłosek hebrajskich
9 Alfabet arabski
10 Problemy 1. Diakrytyzacja teksty nie są w pełni diakrytyzowane wiele podobnych form zanikające różnice między samogłoskami 2. Wiele dialektów hebrajski jako język diaspory (naleciałości) Starohebrajski a ivrit hadash MSA (Model Standard Arabic) Qur an based 3. Skomplikowana fonologia zmienna długość samogłosek (HMM temporal variation)
11
12
13 Arabic Automatic Speech Recognition
14 Analizowane systemy rozpoznawania mowy HMM + HTK for Arabic Language CMU SPHINX 4 Simon Testing Simon blog:
15 Zadanie
16 Przegląd badań i projektów I Iqbal, et. al. [2008] Bazuje na pryncypiach recytacji Koranu System wykazuje 90 % trafności na plikach mowy ciągłej zawierającej ponad 1000 samogłosek Razak, et.al. [2008] Bazuje na recytacji Koranu Wykorzystuje algorytm MFCC Rozpoznanie i rozróżnienie arabskiej wymowy i akcentowania poprzez wyodrębnienie samogłosek
17 Przegląd badań i projektów II Tolba, et. al. [2005] Segmentacja spółgłosek/samogłosek przy użyciu transformacji falkowej Projekt nowego algorytmu nie wykorzystującego informacji lingwistycznej Transformacja falkowa i analiza transjentów pomiędzy samogłoskami i spółgłoskami na konkretnych poziomach dekompozycji pakietowej Trafność: 88,3 %
18 Przegląd badań i projektów III - 1 Alotaibi, Hussain [2010] Wyodrębnienie samogłosek (MSA) 1. HMM 2. Analiza formantowa System parameters: fs = 10 khz, 16 bit, framing/window Hamming 25 ms, lap 10 ms MFCC Coefficients: 22 length of cepstral filtering, 26 filter bank chanels, 12 MFCC coefficients preemphasis
19 Przegląd badań i projektów III - 2 Alotaibi, Hussain [2010] Baza danych: nagrania wymowy 10 mężczyzn, wiek lat (Arabia Saudyjska, Egipt) 5 różnych prób dla 8 samogłosek x 10 = 4000 próbek 60% trening, 40% testy SRS 91,6 % Fatha kasrah 99%, short fatha 77,5 % 5 samogłosek osiągnęło poziom 90%
20 Podobieństwo między długimi i krótkimi samogłoskami
21 CMU Sphinx Satori, Hiyassat, Chenfour [2007] Bazuje na HMM Informacja lingwistyczna: Budowa sylab: CV, CVV, CVC, CVVC, CVCC, CVVCC (zawsze rozpoczyna się od C, nigdy od dwóch C) Parametry systemu (optymalizacja): 5 state left-to-right architecture (speech unit) 16 Gaussians (state model) Best results at: filler insertion probability 0.1, word insertion probability = 0.123, language weight = 6
22 CMU Sphinx Baza nagrań: 60 Marokańczyków (25 F, 35 M), 10 przykładów, 5 powtórzeń = 3000 próbek fs = 16 khz, 16 bit, trening: 3000 próbek Test: M/F x N prób
23 CMU Sphinx Arabic Automatic Speech Recognition htm - Sphinx, dokumentacja + próbki
24 Simon
25 Simon Ralf s Arabic Speech Model, Ralf s Hebrew Speech Model for Simon - słowniki - software
26 Prezentacja w oparciu o poniższe artykuły: Comaparative Analysis of Arabic Vowels using Formants and an Automatic Speech Recognition System Yousef Ajami Alotaibi, Amir Hussain (International Journal of Signal Processing, King Saud University, Stirling University) Investigation Arabic Speech Recognition Using CMU Sphinx System Hassan Satori, Hussein Hiyassat, Mostafa Harti, Noureddine Chenfour (Dar Mehraz Fes, Maroko)
27 Oraz źródła:
Omówienie różnych metod rozpoznawania mowy
Omówienie różnych metod rozpoznawania mowy Na podstawie artykułu: Comparative study of automatic speech recognition techniques Beniamin Sawicki Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna
AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I
AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek
Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan
Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan Synteza mowy System przetwarzania tekstu pisanego na mowę Text-to-Speech (TTS) TTS powinien być w stanie przeczytać
PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM
MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,
Korpusy mowy i narzędzia do ich przetwarzania
Korpusy mowy i narzędzia do ich przetwarzania Danijel Korzinek, Krzysztof Marasek Polsko-Japońska Akademia Technik Komputerowych Katedra Multimediów kmarasek@pjwstk.edu.pl danijel@pjwstk.edu.pl 2015-05-18
KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:
KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie
Rozpoznawanie mowy za pomocą HTK
Kinga Frydrych Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna, rok III, 2013/2014 Sprawozdanie z ćwiczeń laboratoryjnych z Technologii mowy Rozpoznawanie mowy za pomocą HTK 1. Opis gramatyki
O sylabie oraz sposobach jej naprawy w egipskim arabskim
O sylabie oraz sposobach jej naprawy w egipskim arabskim Tematyka mojego dzisiejszego wystąpienia związana jest z moją pracą magisterską, która poświęcona była fonologicznemu porównaniu egipskiego arabskiego
Algorytmy rozpoznawania mowy oparte o kształt i/lub ruch ust - przegląd literatury naukowej z lat
Algorytmy rozpoznawania mowy oparte o kształt i/lub ruch ust - przegląd literatury naukowej z lat 2008-2014 Wojciech Jończyk Wydział Inżynierii Mechanicznej i Robotyki Katedra Mechaniki i Wibroakustyki
Transkrypcja fonetyczna i synteza mowy. Jolanta Bachan
Transkrypcja fonetyczna i synteza mowy Jolanta Bachan IPA Międzynarodowy alfabet fonetyczny, MAF (ang. International Phonetic Alphabet, IPA) alfabet fonetyczny, system transkrypcji fonetycznej przyjęty
PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna (j.a. amerykański) Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom
KARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. Dostarczenie studentom dogłębnej wiedzy na temat angielskiego systemu fonologicznego.
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Gramatyka opisowa 2. KIERUNEK: filologia, specjalność filologia angielska 3. POZIOM STUDIÓW: studia pierwszego stopnia 4. ROK/ SEMESTR STUDIÓW: rok I, semestr 2 5.
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. brytyjski) Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna (j.a. brytyjski) Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom kwalifikacji
Opisy efektów kształcenia dla modułu
Karta modułu - Technologia mowy 1 / 5 Nazwa modułu: Technologia mowy Rocznik: 2012/2013 Kod: RIA-1-504-s Punkty ECTS: 7 Wydział: Inżynierii Mechanicznej i Robotyki Poziom studiów: Studia I stopnia Specjalność:
4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
Zastosowanie algorytmu DTW jako narzędzia w identyfikacji mówcy
Piotr Żelasko, Agata Trawińska, Bartosz Ziółko, Marcin Czyżyk, Joanna Stanisławek, Elżbieta Ślusarz Zastosowanie algorytmu DTW jako narzędzia w identyfikacji mówcy Wstęp W badaniach fonoskopijnych dotyczących
Sprawozdanie z laboratoriów HTK!
Inżynieria akustyczna - Technologia mowy 2013 Błażej Chwiećko Sprawozdanie z laboratoriów HTK! 1. Przeznaczenie tworzonego systemu! Celem było stworzenie systemu służącego do sterowania samochodem. Zaimplementowane
Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski
Automatyczne rozpoznawanie mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody holistyczne;
OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU Nazwa
Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA
Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA 1 Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA MBROLA.Creating the
Transpozer czasowy mowy
Transpozer czasowy mowy Politechnika Gdańska ul. Narutowicza 11/12 80-233 Gdańsk www.pg.gda.pl 1. Wprowadzenie Transpozer czasowy mowy został opracowany w celu wspierania rozumienia mowy przez osoby z
KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE: znajomość języka angielskiego na poziomie B1 (na początku semestru 2) i B1+ (na początku semestru 3)
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Gramatyka opisowa 2. KIERUNEK: filologia, specjalność filologia angielska 3. POZIOM STUDIÓW: studia pierwszego stopnia 4. ROK/SEMESTR STUDIÓW: rok I, II/semestr 2,
OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) studia pierwszego stopnia
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) Nazwa modułu (przedmiotu)
Synteza mowy. opracowanie: mgr inż. Kuba Łopatka
Synteza mowy opracowanie: mgr inż. Kuba Łopatka Synteza mowy (ang. TTS - Text-To-Speech ) zamiana tekstu w formie pisanej na sygnał akustyczny, którego brzmienie naśladuje brzmienie ludzkiej mowy. Podstawowe
Podstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski
Podstawy automatycznego rozpoznawania mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody
OPIS MODUŁU (PRZEDMIOTU)
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS MODUŁU (PRZEDMIOTU)
Niko 2 Przedmiotowy System Oceniania
Niko 2 Przedmiotowy System Oceniania TREŚCI NAUCZANIA REALIZOWANE W PODRĘCZNIKU NIKO 2 I PODLEGAJĄCE OCENIANIU MÓWIENIE I SŁUCHANIE - opisywanie ilustracji - komentowanie przedstawionej na obrazku sytuacji
PRACA DYPLOMOWA Inżynierska
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA Inżynierska Temat: Narzędzie programowe do optymalizacji
PRACA DYPLOMOWA Inżynierska
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA Inżynierska Temat: Półautomatyczne rozpoznawanie mówców
Komputerowe przetwarzanie sygnału mowy
Komputerowe przetwarzanie sygnału mowy Prof dr hab inż Bożena Kostek Katedra Systemów Multimedialnych Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska Komputerowe przetwarzanie sygnału
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Scenariusz nr 1. Autor scenariusza: Krystyna Jakubowska. Blok tematyczny: Historia książki
Autor scenariusza: Krystyna Jakubowska Blok tematyczny: Historia książki Scenariusz nr 1 I. Tytuł scenariusza: Dzieje pisma. II. Czas realizacji: 2 jednostki lekcyjne. III. Edukacje (3 wiodące): polonistyczna,
Modelowanie języka naturalnego (polskiego) dla potrzeb budowy systemu rozpoznawania mowy klasy LVCSR
Akademia Górniczo - Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki i Informatyki Biomedycznej Autoreferat rozprawy doktorskiej Modelowanie języka naturalnego (polskiego)
PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna (j.a. amerykański) Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom
KLASYFIKACJA ZDAŃ W SYGNALE
KLASYFIKACJA ZDAŃ W SYGNALE MOWY Z WYKORZYSTANIEM MODELU DTW Włodzimierz Kasprzak Raport IAiIS PW Nr 12-04 Warszawa, maj 2012 r. POLITECHNIKA WARSZAWSKA WYDZIAŁ ELEKTRONIKI I TECHNIK INFORMACYJNYCH INSTYTUT
Czym jest HTK HMMs ASR
HTK 138 Czym jest HTK Zbiór programów implementujących Niejawne Łańcuchy Markowa - Hidden Markov Models (HMMs) ASR, synteza mowa, rozpoznawanie liter, badania nad sekwencjami DNA Analiza mowy, wyćwiczenie
Wykorzystanie suprasegmentalnych zjawisk językowych w modelowaniu języka polskiego na potrzeby systemu rozpoznawania mowy
Wykorzystanie suprasegmentalnych zjawisk językowych w modelowaniu języka polskiego na potrzeby systemu rozpoznawania mowy Bartosz Ziółko, Magdalena Igras Katedra Elektroniki Zespół Przetwarzania Sygnałów
Zastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy
Tomasz ZIELIŃSKI ), Paweł GAJDA ), Marcin STACHURA ) Robert WIELGAT 2), Daniel KRÓL 2), Tomasz WOŹNIAK 3), Stanisław GRABIAS 3) ) AKADEMIA GÓRNICZO-HUTNICZA, KATEDRA METROLOGII 2) PAŃSTWOWA WYŻSZA SZKOŁA
4. EKSPLOATACJA UKŁADU NAPĘD ZWROTNICOWY ROZJAZD. DEFINICJA SIŁ W UKŁADZIE Siła nastawcza Siła trzymania
3 SPIS TREŚCI Przedmowa... 11 1. WPROWADZENIE... 13 1.1. Budowa rozjazdów kolejowych... 14 1.2. Napędy zwrotnicowe... 15 1.2.1. Napęd zwrotnicowy EEA-4... 18 1.2.2. Napęd zwrotnicowy EEA-5... 20 1.3. Współpraca
dr inż. Jacek Naruniec
dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,
HLT_12 Warszawa. Lingwistyka matematyczna w Katedrze Elektroniki AGH
HLT_12 Warszawa Lingwistyka matematyczna w Katedrze Elektroniki AGH 1 Lingwistyka jaka jest każdy widzi Lingwistyka matematyczna: - identyfikacja rozmówcy - przetwarzanie języka naturalnego - przetwarzanie
ń ę ń ę ń ę ń ę ę ę ę ę ź ń ź Ś ę Ł ń ę ę ń ę ń ę ę ę ę ę ę ź ę ę Ż ę ŚĆ ę Ż ń ń ę ń ę ę ę ę ę ź ę ę Ś Ś Ś Ś ź ę ń ę ę Ź ń Ś Ś ę ń ę ę ę ę ę ź ń ŚĆ Ś ń ń ń Ą ń ę ę ŚĆ ę Ż ę ń ę ę ę ę ę ź ń Ś Ś ź Ś Ł ę
Poradnik HTK. Adrian Sekuła
Poradnik HTK Adrian Sekuła Wstęp Poradnik wykonano do przedmiotu Technologia Mowy, prowadzonego przez dr inż. Bartosza Ziółko i dr inż. Jakuba Gałkę na studiach Inżynieria Akustyczna na AGH w Krakowie.
Inwersja mowy za pomocą nieliniowej transfomacji czasowej Inversion of speech by non-linear transformation of temporary
Robert Wielgat 1 *, Anita Lorenc 2 1 Państwowa Wyższa Szkoła Zawodowa w Tarnowie, Instytut Politechniczny, Zakład Elektroniki i Telekomunikacji State Higher Vocational School in Tarnow, Polytechnic Institute,
JĘZYKOZNAWSTWO TYPOLOGICZNE I PORÓWNAWCZE UAM 2017/2018. prof. dr hab. Nicole Nau
JĘZYKOZNAWSTWO TYPOLOGICZNE I PORÓWNAWCZE UAM 2017/2018 prof. dr hab. Nicole Nau ZAJĘCIA 07-11-2017 Typologia morfologiczna jak wyglądają języki różnego typu? Kategorie gramatyczne Wykładniki kategorii
Praca dyplomowa - magisterska
Wydział Informatyki i Zarządzania kierunek studiów: Informatyka specjalność: Internet i Technologie Mobilne Praca dyplomowa - magisterska METODY TWORZENIA GIER STEROWANYCH GŁOSEM Marek Pawluch słowa kluczowe:
ZASTOSOWANIE ROZPOZNAWANIA MÓWCY W AUTOMATYCZNEJ TRANSLACJI MOWY TYPU SPEECH-TO-SPEECH 1
STUDIA INFORMATICA 2014 Volume 35 Number 3 (117) Piotr KŁOSOWSKI, Adam DUSTOR, Jacek IZYDORCZYK Politechnika Śląska, Instytut Elektroniki ZASTOSOWANIE ROZPOZNAWANIA MÓWCY W AUTOMATYCZNEJ TRANSLACJI MOWY
Efekt Lombarda. Czym jest efekt Lombarda?
Efekt Lombarda Na podstawie raportu Priscilli Lau z roku 2008 na Uniwersytecie w Berkeley wykonanego na podstawie badań w laboratorium Fonologii. Autor prezentacji: Antoni Lis Efekt Lombarda Czym jest
HTK czego NIE robić. Bartłomiej Chojnacki. - uważać przy przepisywaniu komend, czasem małe L wygląda identycznie jak duże I
Wstęp HTK czego NIE robić Bartłomiej Chojnacki Niniejszy poradnik proponuję jako uzupełnienie do istniejącego już świetnego dokumentu Adriana Sekuły Poradnik HTK, gdyby nie on zapewne do tej pory grzebałbym
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
ANALIZA SZYBKIEJ IDENTYFIKACJI MÓW- CY IMPLEMENTOWANYCH W ŚRODOWI- SKU MATLAB ORAZ CODE COMPOSER STUDIO
Zeszyty Naukowe WSInf Vol 9, Nr 3, 2010 Tomasz Marciniak, Radosław Weychan, Adam Dąbrowski Politechnika Poznańska Katedra Sterowania i Inżynierii Systemów Pracownia Przetwarzania Sygnałów i Układów Elektronicznych
ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI 1) z dnia 30 maja 2005 r.
Dz.U.05.102.855 ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI 1) z dnia 30 maja 2005 r. w sprawie sposobu transliteracji imion i nazwisk osób należących do mniejszości narodowych i etnicznych
PRZEWODNIK PO PRZEDMIOCIE
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom kwalifikacji I stopnia
PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna j. angielskiego brytyjskiego Angielski Język Biznesu
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Fonetyka praktyczna j. brytyjskiego Kierunek Forma studiów Poziom kwalifikacji Rok Semestr Jednostka prowadząca
MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 2
Uniwersytet Śląski w Katowicach str. 1 Program kształcenia, załącznik nr 1. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy 3. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne
Wady i ograniczenia systemów rozpoznawania mowy
Karolina Kuligowska 1, Paweł Kisielewicz 2, Aleksandra Włodarz 3 Wady i ograniczenia systemów rozpoznawania mowy 1. Wstęp Rozpoznawanie mowy (ang. speech recognition, speech-to-text STT) jest procesem
Ćwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej
Ćwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej 1. Filtry FIR o skończonej odpowiedzi impulsowej (SOI) Filtracja FIR polega na tym, że sygnał wyjściowy powstaje
Samogłoski proste (monoftongi) języka łatgalskiego cechy widmowe
Samogłoski proste (monoftongi) języka łatgalskiego cechy widmowe 1. Istniejące opisy Dotychczas nie publikowano opisów akustycznych samogłosek łatgalskich. Pewnym punktem odniesienia mogą być opisy systemu
Technologie Mowy Bartosz Ziółko
www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Technologie Mowy Bartosz Ziółko 1 Technologie Mowy 2 Technologie Mowy 3 Technologie Mowy 4 Dane kontaktowe Dr inż. Jakub Gałka C2/419 Telefon 50-68
3. Pismo etiopskie. Ciekawostki
3. Pismo etiopskie Ciekawostki Najważniejsze języki Etiopii: AMHARSKI, OROMO, TIGRINIA, SOMALI, GURAGIE, Sidamo, Uelajta. W przypadku Etiopii nie można utożsamiać liczby przedstawicieli danej grupy etnicznej
Gramatyka opisowa języka polskiego Kod przedmiotu
Gramatyka opisowa języka polskiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Gramatyka opisowa języka polskiego Kod przedmiotu 09.3-WH-FiP-GOP-1-K-S14_pNadGen0FA8C Wydział Kierunek Wydział Humanistyczny
Sprawozdanie z laboratoriów HTK
Inżynieria Akustyczna Technologia Mowy 2013 Jakub Antoniuk Sprawozdanie z laboratoriów HTK 1.Opis gramatyki System był projektowany w celu obsługi inteligentnych instalacji w domach. Istnieją systemy pozwalające
Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski
Akustyka mowy wprowadzenie Opracował: dr inż. Piotr Suchomski Kontakt Katedra Systemów Multimedialnych Wydział ETI dr inż. Piotr M. Suchomski, pok. EA 730 e-mail: pietka@sound.eti.pg.gda.pl tel. 23-01
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
dr inż. Artur Janicki pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW
dr inż. Artur Janicki email: A.Janicki@tele.pw.edu.pl, pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW Kodowanie źródła podstawowe informacje Sygnał mowy informacje ogólne, jak
dr hab. inż. Artur Janicki pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW
dr hab. inż. Artur Janicki email: A.Janicki@tele.pw.edu.pl, pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW Kodowanie źródła podstawowe informacje Sygnał mowy informacje ogólne, jak powstaje
Rozpoznawanie mówcy i emocji
Katedra Elektroniki, Zespół Przetwarzania Sygnałów www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Rozpoznawanie mówcy i emocji Bartosz Ziółko Wykorzystano materiały Davida Sierry, Wojciecha
System Korekty Tekstu Polskiego
System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Wersja algorytmu dla języka hiszpańskiego Wnioski
Test wydajności współczynników percepcyjnych w kontekscie rozpoznawania emocji
Tomasz Sapiński, Dorota Kamińska Politechnika Łódzka Test wydajności współczynników percepcyjnych w kontekscie rozpoznawania emocji Wprowadzenie Komunikacja interpersonalna to nieodzowny element ludzkiego
O-MaSE Organization-based Multiagent System Engineering. MiASI2, TWO2,
O-MaSE Organization-based Multiagent System Engineering MiASI2, TWO2, 2017-2018 Materiały Strona poświęcona metodzie O-MaSE http://macr.cis.ksu.edu/projects/omase.html (Multiagent & Cooperative Reasoning
Korpusy i Narzędzia do Analizy Mowy w Clarin-PL
1 / 20 Korpusy i w Clarin-PL Krzysztof Marasek, Danijel Koržinek, Łukasz Brocki, Krzysztof Wołk Polsko-Japońska Akademia Technik Komputerowych 2 / 20 Plan prezentacji 1 2 3 / 20 4 / 20 Motywacja Brak darmowych
OCENA MOśLIWOŚCI WYKORZYSTANIA HODOWLI ŚWIŃ RASY ZŁOTNICKIEJ
ASSESSMENT OF POTENTIAL FOR ZŁOTNICKA SPOTTED PIG BREEDING IN ORGANIC FARMS OCENA MOśLIWOŚCI WYKORZYSTANIA HODOWLI ŚWIŃ RASY ZŁOTNICKIEJ PSTREJ W GOSPODARSTWACH EKOLOGICZNYCH Janusz Tomasz Buczyński (1),
ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW
ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW Maciej Piasecki, Szymon Zyśko Wydziałowy Zakład Informatyki Politechnika Wrocławska Wybrzeże Stanisława Wyspiańskiego
KRYTERIA OCENY ROCZNEJ Z JĘZYKA POLSKIEGO W KLASIE IV
WYMAGANIA EDUKACYJNE JĘZYK POLSKI KL.IV KRYTERIA OCENY ROCZNEJ Z JĘZYKA POLSKIEGO W KLASIE IV OCENĘ CELUJĄCĄ programem nauczania dla klasy IV i poza tym: twórczo i samodzielnie rozwija własne uzdolnienia
KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Nauka o języku i komunikacji. 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Nauka o języku i komunikacji 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym 3. POZIOM STUDIÓW: studia podyplomowe 4. ROK/ SEMESTR STUDIÓW:
Transformata Fouriera. Sylwia Kołoda Magdalena Pacek Krzysztof Kolago
Transformata Fouriera Sylwia Kołoda Magdalena Pacek Krzysztof Kolago Transformacja Fouriera rozkłada funkcję okresową na szereg funkcji okresowych tak, że uzyskana transformata podaje w jaki sposób poszczególne
Beyond Upper-intermediate (B2) rozkład materiału 120h lekcyjnych
3-11h 2-13h 1-11h ROZDZIAŁ Beyond Upper-intermediate (B2) rozkład materiału 120h lekcyjnych 1 ROZDZIAŁ LICZBA GODZIN TEMATYKA- SŁOWNICTWO FUNKCJE KOMUNIKACYJNE GRAMATYKA UMIEJĘTNOŚCI LIFE SKILLS INTEGRACJA
MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1
Uniwersytet Śląski w Katowicach str. Program kształcenia, załącznik nr. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy 3. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne
2. Opis zajęć dydaktycznych i pracy studenta
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Filologia, specjalność język rosyjski program język biznesu, I stopień Sylabus modułu: Gramatyka opisowa języka rosyjskiego (GOJR02) Nazwa
Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z zastosowaniem MFCC i klasyfikatora rozmytego
mgr inż. ADAM GŁOWACZ Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Akademia Górniczo-Hutnicza w Krakowie Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z
Karta przedmiotu. Politechnika Krakowska im. Tadeusza Kościuszki. 1 Informacje o przedmiocie. 2 Rodzaj zajęć, liczba godzin w planie studiów
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu obowiązuje studentów rozpoczynających studia w roku akademickim 2018/2019 Kierunek studiów: Wszystkie kierunki Forma sudiów: stacjonarne
Instrukcja dopasowania SoundRecover2 u dorosłych
Phonak Target Marzec 2017 Instrukcja dopasowania SoundRecover2 u dorosłych Poniższa instrukcja jest przeznaczona do dopasowań dla osób dorosłych. Przy dopasowaniach pediatrycznych skorzystaj z oddzielnej
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
IMPROVED SPEECH RECOGNITION PROCESS BASED ON PHONETICS AND PHONOLOGY OF POLISH LANGUAGE
ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: ELEKTRONIKA z. 12 2000 Nr kol. 1492 Piotr KŁOSOWSKI Politechnika Śląska, Instytut Elektroniki USPRAWNIENIE PROCESU AUTOM ATYCZNEGO ROZPOZNAW ANIA MOWY OPARTEGO
KRYTERIA OCEN Z JĘZYKA POLSKIEGO W KLASIE V
KRYTERIA OCEN Z JĘZYKA POLSKIEGO W KLASIE V OCENA CELUJĄCĄ otrzymuje ją uczeń, który opanował pełny zakres wiadomości i umiejętności określonych programem nauczania dla klasy V oraz: twórczo i samodzielnie
2. Opis zajęć dydaktycznych i pracy studenta
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Filologia, specjalność rosjoznawstwo, I stopień Sylabus modułu: Gramatyka opisowa języka rosyjskiego (02-FL-RJ-S1-GOJR02) Nazwa wariantu
Rozpoznawanie obiektów na podstawie zredukowanego zbioru cech. Piotr Porwik Uniwersytet Śląski w Katowicach
Rozpoznawanie obiektów na podstawie zredukowanego zbioru cech Piotr Porwik Uniwersytet Śląski w Katowicach ?? It is obvious that more does not mean better, especially in the case of classifiers!! *) *)
Inteligentne metody rozpoznawania dźwięku
Politechnika Łódzka Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Kierunek Informatyka Praca magisterska Inteligentne metody rozpoznawania dźwięku Stanisław Kacprzak Promotor: prof. dr
Dydaktyka wczesnego nauczania języka niemieckiego - opis przedmiotu
Dydaktyka wczesnego nauczania języka niemieckiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Dydaktyka wczesnego nauczania języka niemieckiego Kod przedmiotu 05.1-WP-PEDP-DWNN Wydział Kierunek
Xpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie
Xpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie XPRESS SCAN, które pozwala użytkownikom bezpośrednio z urządzenia Xerox przez panel dotykowy zrealizować odpowiedni
Autor: Krzysztof Dąbek 30 marca / 24
Metaprezentacja Czyli jak zaciekawić ludzi i przekazać informacje z elementami emisji głosu Krzysztof Dąbek 30 marca 2017 Autor: Krzysztof Dąbek 30 marca 2017 1 / 24 Wstęp Inspiracja Inspiracja Szymon
System Korekty Tekstu Polskiego
Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona
II. Kontrola i ocena pracy ucznia.
II. Kontrola i ocena pracy ucznia. Formy kontroli A. Kontrola bieżąca (sprawdza postępy uczniów, zachęcając ich do dalszej systematycznej pracy, pozwala na uzupełnienie braków w wiedzy i skorygować błędy).
SYLABUS MODUŁU KSZTAŁCENIA
Lp. Element Opis SYLABUS MODUŁU KSZTAŁCENIA Nazwa modułu Typ modułu Fonetyka obowiązkowy 3 Instytut Instytut Nauk Humanistyczno-Społecznych i Turystyki 4 5 Kod modułu Kierunek, specjalność, poziom i profil
Wykrywanie twarzy ludzkich na kolorowych obrazach ze złożonym tłem
Wykrywanie ludzkich na kolorowych obrazach ze złożonym tłem Lech Baczyński www.baczynski.com Na podstawie artykułu panów: Yanjiang Wang, Baozong Yuan i in. Do czego przydatne jest wykrywanie (detekcja)?
Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych
Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Politechnika Łódzka Streszczenie rozprawy doktorskiej Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach
PRZEWODNIK DYDAKTYCZNY I PROGRAM NAUCZANIA PRZEDMIOTU FAKULTATYWNEGO NA KIERUNKU LEKARSKIM ROK AKADEMICKI 2016/2017
PRZEWODNIK DYDAKTYCZNY I PROGRAM NAUCZANIA PRZEDMIOTU FAKULTATYWNEGO NA KIERUNKU LEKARSKIM ROK AKADEMICKI 2016/2017 1. NAZWA PRZEDMIOTU: Francuski w medycynie dla początkujących 2. NAZWA JEDNOSTKI (jednostek