HLT_12 Warszawa. Lingwistyka matematyczna w Katedrze Elektroniki AGH



Podobne dokumenty
4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Opisy efektów kształcenia dla modułu

Informatyka Studia II stopnia

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

Katedra Systemów Decyzyjnych. Kierownik: prof. dr hab. inż. Zdzisław Kowalczuk

V Seminarium Naukowe "Inżynierskie zastosowania technologii informatycznych" - relacja

Wirtualny doradca - projekt naukowców AGH

Krzysztof Ślot Biometria Łódź, ul. Wólczańska 211/215, bud. B9 tel

Program warsztatów CLARIN-PL

Przetwarzanie i analiza przetwarzanie obrazów oraz sygnałów

Semantyczna analiza języka naturalnego

Bezodpadowe technologie przeróbki rud metali nieżelaznych

Ontologie, czyli o inteligentnych danych

Kiedy porozmawiamy z telefonem? (A nie przez telefon) Systemy informacyjne Wykład 1.

Sprawozdanie z laboratoriów HTK!

Profil dyplomowania: Systemy multimedialne

Wykorzystanie suprasegmentalnych zjawisk językowych w modelowaniu języka polskiego na potrzeby systemu rozpoznawania mowy

Oferta przedmiotów wybieralnych 2017/2018. Studia I stopnia Elektronika i telekomunikacja

Projekt badawczy. Zastosowania technologii dynamicznego podpisu biometrycznego

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

BAZA DANYCH NAGRAŃ MOWY DLA ANALIZY PORÓWNAWCZEJ RÓŻNOJĘZYCZNYCH FONEMÓW

Korpusy mowy i narzędzia do ich przetwarzania

LISTA KURSÓW PLANOWANYCH DO URUCHOMIENIA W SEMESTRZE ZIMOWYM 2015/2016

Technologie Mowy Bartosz Ziółko

Profil dyplomowania: Systemy Multimedialne Specjalnośd: Inżynieria Dźwięku i Obrazu

PL B1. AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA, Kraków, PL BUP 01/11. WIESŁAW WAJS, Kraków, PL

Adaptive wavelet synthesis for improving digital image processing

Profil dyplomowania: Systemy multimedialne

Propozycje tematów prac magisterskich 2013/14 Automatyka i Robotyka - studia stacjonarne Pracowania Układów Elektronicznych i Przetwarzania Sygnałów

Rozpoznawanie mówcy i emocji

Diagnostyka procesów przemysłowych Kod przedmiotu

Open Access w technologii językowej dla języka polskiego

Analiza danych tekstowych i języka naturalnego

II. Wydział Elektroniki

AUTOMATYKA INFORMATYKA

Projekt SGI. WP 3.1 Wirtualne laboratorium i teleimersja Jacek Cała. (cala@ics.agh.edu.pl) (luke@ics.agh.edu.pl) Łukasz Czekierda

Profil dyplomowania: Systemy multimedialne

Przetwarzanie i analiza przetwarzanie obrazów oraz sygnałów

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Metody Sztucznej Inteligencji Methods of Artificial Intelligence. Elektrotechnika II stopień ogólno akademicki. niestacjonarne. przedmiot kierunkowy

Sztuczna inteligencja stan wiedzy, perspektywy rozwoju i problemy etyczne. Piotr Bilski Instytut Radioelektroniki i Technik Multimedialnych

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)

W Polsce żyje ok. 5,5 miliona osób niepełnosprawnych wzrost o 50% w ostatnich 20 latach

Omówienie różnych metod rozpoznawania mowy

WSKAŹNIKI ILOŚCIOWE - Punkty ECTS w ramach zajęć: Efekty kształcenia. Wiedza Umiejętności Kompetencje społeczne (symbole) MK_1. Analiza matematyczna

Imagination Is More Important Than Knowledge

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Stanusch Technologies S.A. lider w rozwiązaniach opartych o sztuczną inteligencję

Opis efektów kształcenia dla modułu zajęć

DiaSter - system zaawansowanej diagnostyki aparatury technologicznej, urządzeń pomiarowych i wykonawczych. Politechnika Warszawska

II. MODUŁY KSZTAŁCENIA

Badania podstawowe esencją nauki

ROZDZIAŁ 1. WPROWADZENIE DO PROBLEMATYKI SYSTEMÓW EKSPERTOWYCH 19

Profil dyplomowania: Systemy multimedialne.

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW

Wykaz tematów prac inżynierskich dla studentów studiów stacjonarnych kierunku Informatyka i agroinżynieria w roku akademickim 2014/2015

Reprezentacja rozmyta - zastosowania logiki rozmytej

Narodowe Centrum Nauki a Uniwersytet Jagielloński. Kraków, 19 grudnia 2012 Andrzej Jajszczyk

EZI Siatka przejściowa s.3 - s.7

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Realizowany w roku akademickim 2016/2017

Granty badawcze źródła finansowania dla doktorantów. Poznań, r.

WYKAZ PRZEDMIOTÓW I PLAN REALIZACJI

System sterowania robota mobilnego z modułem rozpoznawania mowy

Tematy i zakres rozpraw doktorskich w ramach dyscypliny informatyka techniczna i telekomunikacja w roku akademickim 2019/2020

LISTA KURSÓW PLANOWANYCH DO URUCHOMIENIA W SEMESTRZE ZIMOWYM 2015/2016

Przetwarzanie języka naturalnego (NLP)

Biometryczna Weryfikacja (NIE inwigilacja)

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi

KARTA MODUŁU KSZTAŁCENIA

Lokalizacja Oprogramowania

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

IMiR - Inżynieria Akustyczna - opis kierunku 1 / 5

Twinning Day 21 kwiecień 2015

Profil dyplomowania: Systemy multimedialne

Komputerowe przetwarzanie sygnału mowy

Logika dla socjologów Część 2: Przedmiot logiki

Kandydaci powinni spełniać warunki określone w Ustawie z dnia 27 lipca 2005 r. Prawo o Szkolnictwie Wyższym ( Dz. U. z 2012 r. poz. 572).

Zakład Sterowania Systemów

Kierunki rozwoju usług monitorowania. Outsourcing stacji monitorowania. Optymalizacja kosztów

Technologie Internetowe i Algorytmy

Sprawozdanie z działalności Zarządu Głównego Polskiego Towarzystwa Fonetycznego za okres od września 2008 r. do września 2012 r.

INŻYNIERIA OPROGRAMOWANIA

Urządzenia Elektroniki Morskiej Systemy Elektroniki Morskiej

Informatyka na WPPT. prof. dr hab. Jacek Cichoń dr inż. Marek Klonowski

Wydział Fizyki i Informatyki Stosowanej ZAPRASZAMY NA STUDIA

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

Repetytorium z matematyki 3,0 1,0 3,0 3,0. Analiza matematyczna 1 4,0 2,0 4,0 2,0. Analiza matematyczna 2 6,0 2,0 6,0 2,0

Z punktu widzenia kognitywisty: język naturalny

PROGRAM SEMINARIUM ZAKOPANE czwartek, 2 grudnia 2010 r. Sesja przedpołudniowa. Otwarcie seminarium Prof. dr hab. inż. Tadeusz Czachórski

Analiza strategiczna SWOT innowacyjności gospodarki Małopolski. Kraków, 9 marca 2012 r.

1 Programowanie urządzen mobilnych Sztuczna inteligencja i systemy 2 ekspertowe

S PECJALNO S C I NTELIGENTNE S YSTEMY D ECYZYJNE

Informatyka- studia I-go stopnia

Przegląd najnowszych startupów z dziedziny technologii mowy

dr hab. inż. Krystyna Macek-Kamińska, profesor PO

Innowacyjne narzędzia w procesie digitalizacji

Transkrypt:

HLT_12 Warszawa Lingwistyka matematyczna w Katedrze Elektroniki AGH 1

Lingwistyka jaka jest każdy widzi Lingwistyka matematyczna: - identyfikacja rozmówcy - przetwarzanie języka naturalnego - przetwarzanie mowy - rozpoznawanie mowy - synteza mowy 2

Katedra Elektroniki Zespół Przetwarzania Sygnałów Akademia Górniczo-Hutnicza im. S. Staszica w Krakowie Wydział Informatyki, Elektroniki i Telekomunikacji prof. Mariusz Ziółko dr inż. Jakub Gałka - adiunkci - dr inż. Bartosz Ziółko mgr inż. Dawid Skurzok - asystenci - mgr inż. Mariusz Mąsior mgr inż. Tomasz Jadczyk - doktoranci - mgr inż. Magdalena Igras mgr inż. Rafał Samborski - doktoranci - mgr inż. Jan Wicijowski + pracownicy i studenci pomagający realizować granty + http://www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ 3

Psychoakustyczna falkowa analiza mowy czas 4

Zbiory tekstów języka polskiego Źródło MBajty Mil. słów Różnych słów Różnych dwójek Różnych trójek Rzeczpospolita 879 104 856 349 18 115 373 43 414 592 Wikipedia 754 97 2 623 358 31 139 080 61 865 543 Literatura 490 68 1 151 043 23 830 490 50 794 854 Transkrypcje 325 32 381 166 6 848 729 16 283 781 Literatura 2 6500 949 6 162 530 153 152 158 441 284 743 Literatura 3 285 181 1 229 331 36 297 382 93 751 340 W Literatura 2 : Słowa występujące więcej niż 10 razy to 951 844 Dwójki słów występujące więcej niż 10 razy to 6 426 198 Trójki słów występujące więcej niż 10 razy to 5 166 537 5

Projekt rozwojowy nr OR00001905 Aplikacje technologii mowy w systemach bezpieczeństwa publicznego Realizowany w okresie od 8.IX.2008 do 7.IX.2011 6

Wyniki projektu Sąd Apelacyjny w Krakowie Głosowe sterowanie programem do zarządzania bazą danych akt i dokumentów sądowych Policja Głosowe sterowanie stanowiskiem koordynatora działań operacyjnych Komendy Wojewódzkiej Policji w Krakowie 7

System rozpoznawania mówcy 8

Opis jakości systemu stopień rozpoznania 9

Dwie równoległe metody rozpoznawania 10

Systemy wielomikrofonowe do lokalizacji źródeł dźwięku c l 1 Microphone 1 d b a Microphone 2 l 2 f s t v 44100 Hz 23μs 330 m/s v t 7.5mm 11

Możliwość pracy kilku niezależnych operatorów m4 m3 m2 m1 12

Analiza porównawcza różnojęzycznych fonemów (NCN, OPUS, 2012-2014) Q. D. Atkinson: Phonetic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa. Science, 32, 346-348, 2011. Cele projektu : opracowanie nowej metody ekstrakcji fonemów i określania ich charakterystyk, zbadanie różnic pomiędzy fonemami dla około 300 języków świata, badanie pochodzenia i ekspansji języków, stworzenie drzewa genealogicznego języków świata w oparciu o multijęzyczną analizę fonemów i metody stosowane w ewolucyjnej genetyce, zwiększenie efektywności rozpoznawania fonemów mowy polskiej. Zarówno wyniki prac jak i zebrany materiał lingwistyczny będzie dostępny dla naukowców całego świata na stronie internetowej http://speechsamples.agh.edu.pl 13

Raytracer audio i video (NCBiR, Innotech, 2012-2014) m.in. Symulowanie wpływu akustyki pomieszczeń na dialogi. Modyfikacja brzmienia nagrania w celu rozróżnienia różnych trzecioplanowych postaci posługujących się nagraniami pochodzącymi od tego samego aktora. 14

System dialogowy człowiek-komputer oparty na łączach telefonicznych (NCBiR, Lider, 2012-2014) Korpus mowy z rozmów telefonicznych; Udoskonalenie parametryzacji i segmentacji (specyfika mowy zniekształconej przez połączenie telefoniczne); Klasyfikacja (dynamiczne sieci Bayesa, warunkowe pole losowe, głębokie sieci neuronowe); Detekcja przerw pomiędzy słowami (przy braku przerwy akustycznej statystyki fonemów i logika rozmyta); Udoskonalenie modelu n-gramowego; Model semantyczny oparty o: macierze słowo-temat, Słownik Semantyczny i Słowosieć; Podejmowanie decyzji i rozumienie wypowiedzi w oparciu o rozpoznaną mowę; Przyjazna i wciągająca forma interakcji z użytkownikiem. 15

Lingwistyczny warsztat do analizy i rozpoznawania mowy (NCN, Sonata, 2012-2014) Wykrywanie zdań wtrąconych, końców zdań, przerw itp.; Dostosowanie gramatyki Spejda do języka mówionego; Wykonanie probabilistycznej wersji Spejda; Analiza małych grup słownych w celu rozcinania siatki słów; Analiza metod użycia słownika fleksyjnego w modelowaniu mowy; Zbadanie powiązań między słownikiem kolokacji a modelem n-gramowym; Rozwinięcie modelu n-gramowego z wykorzystaniem informacji typu syntaktycznego. 16

Biometryczna weryfikacja i identyfikacja głosu (NCBiR, 2012-2014) Stworzenie konkurencyjnego zarówno ekonomicznie jak i technologicznie produktu z dziedziny biometrii głosowej. Badania mają doprowadzić do opracowania zaawansowanego technologicznie systemu rozpoznawania i identyfikacji mówcy. Zakłada się, że opracowany system korzystać będzie z informacji akustycznej, bez uwzględnienia innych modalności. Podstawowymi zastosowaniami systemu będą infolinie oraz telefoniczne centra obsługi klienta. Drugim zastosowaniem systemu będzie wykorzystanie weryfikacji głosu jako elektronicznego klucza w budynkach inteligentnych, zamkach elektronicznych, itp. 17

Algorytmy audiowizualnego przetwarzania sygnału mowy polskiej na potrzeby interfejsu człowiekkomputer (NCN, PRELUDIUM, 2012-2014) 18

19

Kamienie milowe w historii świata i ludzkości "Na początku było Słowo" (J 1, 1). Tymi słowami Jan rozpoczyna swą Ewangelię, sięgając poza granice wyznaczające początek naszego czasu, aż do Boskiej wieczności. Język jest jednym z najnowszych wytworów ewolucji - zdecydowana większość lingwistów z obozu ewolucjonistów umieszcza pojawienie się pierwszego dosyć dobrze rozwiniętego języka nie wcześniej niż 40 czy 50 tysięcy lat temu. Gutenberg Johannes, właściwie Johannes Gensfleisch zum Gutenberg (ok. 1399-1468), niemiecki złotnik i mincerz. Uważany za wynalazcę drukowania za pomocą ruchomych czcionek, aparatu do ich odlewania i prasy drukarskiej. Początki Internetu wiążą się z powstaniem sieci rozległej ARPANET i sięgają końca lat 60. XX wieku. 20

Proletariusze wszystkich krajów, łączcie się! fragment z Manifestu Komunistycznego Karola Marksa i Fryderyka Engelsa Lingwiści w całej Polsce, łączcie się! AGH 21

Dziękujemy za wzmożoną uwagę! 22