Analiza dialogu na potrzeby tworzenia systemów dialogowych. Jolanta Bachan

Podobne dokumenty
Dopasowanie rozmówców w dialogu w sytuacji stresowej

Ewaluacja mowy syntetycznej za pomocą systemu rozpoznawania mowy

Projektowanie Graficznych Interfejsów Użytkownika Robert Szmurło

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Laboratorium przez Internet w modelu studiów inżynierskich

Programowanie gier. wykład 0. Joanna Kołodziejczyk. 30 września Joanna Kołodziejczyk Programowanie gier 30 września / 13

WPROWADZENIE DO UML-a

Rozwiązanie GIS dla mniejszego. miasta: model Miasta Stalowa Wola. Janusz JEśAK. Jacek SOBOTKA. Instytut Rozwoju Miast. ESRI Polska Sp. z o. o.

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Co to jest jest oprogramowanie? 8. Co to jest inżynieria oprogramowania? 9. Jaka jest różnica pomiędzy inżynierią oprogramowania a informatyką?

Wprowadzenie do teorii systemów ekspertowych

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

PRZEWODNIK PO PRZEDMIOCIE

Ćwiczenia technik efektywnego uczenia się Spotkanie 4

Ontologie, czyli o inteligentnych danych

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

Projektowanie Zorientowane na Użytkownika (UCD)

Dialogowe akty mowy w modelach sztucznej inteligencji

Rola i zadania. eczeństwie wiedzy. w społecze. Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow.

nauczania GIS na WAT

Sprawozdanie z działalności Zarządu Głównego Polskiego Towarzystwa Fonetycznego za okres od września 2008 r. do września 2012 r.

Wykorzystanie standardów serii ISO oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

SCHEMAT CZYNNOŚCI PROJEKTOWYCH. Marek Adamczewski

Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT

FILM - W INFORMACJI TURYSTYCZNEJ (A2 / B1)

Odkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013.

ekon enerator Koncepcji Ekologicznych spólne przedsięwzięcie NCBR i NFOŚiGW

Mapowanie wybranych procesów obsługi klienta w sektorze. Dzień 1.

Ontogeneza aktów mowy

Język opisu sprzętu VHDL

Formułowanie i zastosowanie pryncypiów architektury korporacyjnej w organizacjach publicznych

KIERUNEK: KOGNITYWISTYKA

Informatyka I stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)

Spis treści WSTĘP... 9

Monitoring procesów z wykorzystaniem systemu ADONIS

KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI Ogólne umiejętności posługiwania się komputerem

Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan

CN-GP50N. Instrukcja Obsługi. Przeglądarka obrazów Telefon (Zestaw Głośnomówiący) Polski. Przenośny System Nawigacji

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

PRZEWODNIK PO PRZEDMIOCIE

HCI Human Computer Interaction

Spis treúci. 1. Wprowadzenie... 13

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Cel i zawartość prezentacji

Moduł skierowany jest do Studentów/ -tek psychologii z dwóch ostatnich semestrów studiów:

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2015/2016

Architektura oprogramowania w praktyce. Wydanie II.

Wykład I. Wprowadzenie do baz danych

Transkrypcja fonetyczna i synteza mowy. Jolanta Bachan

Najprostszy schemat blokowy

Egzamin / zaliczenie na ocenę* 0,5 0,5

zna metody matematyczne w zakresie niezbędnym do formalnego i ilościowego opisu, zrozumienia i modelowania problemów z różnych

Program warsztatów CLARIN-PL

Programowanie w Ruby

ZASADY PREZENTACJI -ANALIZA STRATEGICZNA

Zakładane efekty kształcenia dla kierunku Wydział Telekomunikacji, Informatyki i Elektrotechniki

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Informatyka Studia II stopnia

Efekty kształcenia. Tabela efektów kształcenia

Semiotyczne podstawy redagowania nowej generacji map topograficznych. Dr hab. Wiesław Ostrowski Dr Tomasz Berezowski

Pracownia Językowa InterAktin - Tablica interaktywna - Gratis! InterAktin

Matematyczne Podstawy Informatyki

Semantyczny Monitoring Cyberprzestrzeni

WMS Thematic Standard do publikacji opracowań kartograficznych. Serena Coetzee, Adam Iwaniak, Paweł Netzel

2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK

Perspektywa 2. Procedury w służbie HR

GUI - projektowanie interfejsów

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Rekomendujemy uczestnictwo w projekcie osobom spełniającym następujące kryteria:

LearnIT project PL/08/LLP-LdV/TOI/140001

Opisy efektów kształcenia dla modułu

Podhalańska Państwowa Wyższa Szkoła Zawodowa w Nowym Targu

Projekt Szkoła Trenerów Biznesu Poziom Zaawansowany dedykowany jest trenerom praktykom na ścieżce rozwoju zawodowego.

ZAŁOŻENIA FILOZOFICZNE

E-learning: nowoczesna metoda kształcenia

Dostępność danych o uczestnikach programów rynku pracy w Polsce

Podstawy projektowania architektonicznego II

OBIEG INFORMACJI I WSPOMAGANIE DECYZJI W SYTUACJACH KRYZYSOWYCH

Skrócona instrukcja obsługi systemu automatycznego operatora

Spis treści tomu pierwszego

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013

Definicje. Najprostszy schemat blokowy. Schemat dokładniejszy

Fabryka Łożysk Tocznych Kraśnik S.A. ogłasza otwarty nabór partnera do wspólnego przygotowania i realizacji

Prezentacje - wystąpienia publiczne

TWORZENIE GRY. projektowanie konstruowanie. użycie. R. Duke, Gaming the Future s Language, SAGE Publications, New York, 1974

Indeks aktywnego starzenia - ujęcie regionalne

Kształcenie w zakresie kartografii i systemów informacji geograficznej na Wydziale Geodezji i Kartografii Politechniki Warszawskiej

Spis treści 5. Spis treści. Część pierwsza Podstawy projektowania systemów organizacyjnych przedsiębiorstwa

SPINACZ.edu.pl platforma współpracy nauki z biznesem w zakresie innowacyjnych rozwiązań informatycznych

Dokument komputerowy w edytorze grafiki

Proces badawczy schemat i zasady realizacji

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Przygotowanie prezentacji

Grant Wielkopolskiego Kuratora Oświaty

Koncepcja systemu zarządzania jakością w dużym projekcie informatycznym zgodnie z normą ISO/IEC 9001:2008

ćwiczenia 15 zaliczenie z oceną

Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych

PRZYKŁAD. Prosta uczelnia. Autor: Jan Kowalski nr indeksu: (przykładowy projekt)

Transkrypt:

Analiza dialogu na potrzeby tworzenia systemów dialogowych Jolanta Bachan 1

Dlaczego analiza dialogu? badania są potrzebne? Obecne systemy opierają się głównie na intuicji inżynierów mowy, nie na systematycznej analizie lingwistycznej badania są ważne? Modele automatów rzeczywistych dialogów są nową metodą, szczególnie dla języka polskiego, i są potrzebne do modelowania odpowiednich scenariuszy badania są trudne? Niezbyt wiele prac zostało przeprowadzonych na ten temat, przeniesienie opisów korpusowych na modele komputerowe, a następnie na system operacyjny jest bardzo skomplikowane 2

Projektowanie systemu dialogowego Komunikacja człowiek-komputer: specyfikacje wymagają lingwistycznego badania korpusowego lingwistycznego modelowania komputerowego System dialogowy powinien być: dobrze umotywowane przez teorię dialogu analizę rzeczywistych dialogów testowany w rzeczywistych warunkach 3

Akty dialogowe Przeczytaj: http://en.wikipedia.org/wiki/dialog_act Dialogue acts are the smallest functional units of dialogues, and are utterances corresponding to speech acts such as greetings, request, suggestion, accept, confirm, reject, thank, feedback (Gibbon et al. 2000:6). DIT++ Taxonomy of Dialogue Acts (Bunt 2010) http://dit.uvt.nl/ https://pl.wikipedia.org/wiki/akt_mowy 4

Mój własny system dialogowy 5

Główna teza Dopasowanie reprezentacji semantycznych jest niezbędne do pomyślnej komunikacji w dialogu. 6

Scenariusz Sytuacja stresowa nagłego wypadku Sytuacja publiczna Zadanie z mapą Dopasowanie reprezentacji semantycznych map 7

Strategia badań Teoretyczna: Selektywne wyszukiwanie prac na temat dialogu Skupienie się na dopasowaniu interlokutorów Empiryczna: Korpusowe badania lingwistyczne dialogu do ekstrakcji modeli formalnych jako źródło danych do rozwoju systemu Komputerowe: Weryfikacja modeli ewaluowanego systemu 8

Metodologia Językoznawstwo: lingwistyczne + psycholingwistyczne teorie dialogu korpusowo-lingwistyczne opisy dialogu Językoznawstwo komputerowe: modelowanie dialogu automatami Eksperymentalna technologia mowy: Komponent syntezy mowy systemu dialogowego tworzenie mikrogłosów : technika + ewaluacja głos dla systemu prototypowego + ewaluacja 9

Cele i ograniczenia Cele ukierunkowane na: podstawowy system dialogowy do weryfikacji koncepcji, oparty na głównych twierdzeniach i łączący komunikację pisemną i mówioną prototyp demonstrujący: metodologię realizację twierdzenia o dopasowaniu semantycznym w symulowanych, ale realistycznych warunkach stresowych Celem nie jest: rozwój pełnego funkcjonalnego systemy dialogowego spełniającego standardy inżynierskie 10

Ogólny schemat systemu dialogowego 11

Schemat Text-In-Voice-Out X Text input X Schemat TIVO jest często stosowany w systemach poleceń i kontroli oraz w systemach protezowych (por. Stephen Hawking) 12

Dopasowanie interaktywne Definicja dopasowania : podstawową funkcją dopasowania jest koordynacja pomiędzy interlokutorami w celu uzyskania pomyślnego wyniku komunikacji Typy dopasowania: dopasowanie w dialogu odbywa się na poziomie semantycznym, syntaktycznym i pragmatycznym (Pickering & Garrod 2004) 13

Model dopasowania interaktywnego (Pickering & Garrod 2004) 14

Ale może jednak transmisja jest autonomiczna...? 15

Projektowanie korpusu osoby nagrywane 12 par & 3 pary kontrolne 15 mężczyzn & 15 kobiet, M:M, M:K, K:K sytuacja publiczna osoby, które się nie znały osoby z dużą różnicą wieku różny status akademicki: nauczyciel student scenariusze: nagłego wypadku & neutralny metody: map-task & diapix nagranie neutralne: Sto lat samotności (1967) Gabriel García Márquez 16

Nagrania 48kHz sampling rate 17

Materiały do pozyskiwania mowy 18

1. Scenariusz nagłego wypadku 19

Mapa scenariusza nagłego wypadku dopasowanie + rozbieżność Mówca A Mówca B 20

Mapa scenariusza nagłego wypadku dopasowanie + rozbieżność Przykład rozbieżności A: spk//znaczy* oczywiście nie ma nie ma pan właśnie wyjścia tam na rondzie yyy są roboty więc w prawo B: acha A: spk B: spk//bo właśnie w* z* z mojej mapy wynika że nie ma robót 21

Diapixy scenariusza nagłego wypadku Mówca A Mówca B 22

2. Scenariusz neutralny 23

Mapy scenariusza neutralnego Mówca A Mówca B 24

Diapixy scenariusza neutralnego (Bradlow et al. 2007) Mówca A Mówca B 25

Przechowywanie odpowiedzi 1 odpowiedź 3 nakładające się odpowiedzi 26

Dane korpusu (w sekundach) Map task: Diapix: Map task: Diapix: Reading ER ER Neutral Neutral All 2325 3957 2353 5391 1111 Min 54 59 72 150 31 Max 325 310 251 568 49 Mean 155 264 157 359 37 Overall 15137sec = 4h 12m 2726298KB = 2.6GB 27

Metadane Date Folder name, e.g. 2011-02-15_03_MM. Subject s education Subjects occupation, e.g. Ph.D. student Subject s ID Notes Subject s sex Place of the recording Subject s name Length of recording Subject s age Size of recording in KB Subject s height Subject s weight youngest: 19, oldest: 53, max age difference: 32 28

Analiza ogólna Map task: nagły wypadek szybka mowa, formalna, dominacja mówcy A Diapix: nagły wypadek mowa formalna, dialog kooperatywny Map task: kino mowa nieformalna, dużo wtrąceń (auto-feedback) mówcy B, zabawna rozmowa Diapix: zakupy mowa nieformalna, dialog kooperatywny, zdrobnienia 29

Anotacja dialogu 30

Analiza F0 31

System dialogowy 32

Semantyczne dopasowanie + rozbieżność Człowiek Komputer 33

Semantyczny FSA: mapa + droga 34

Architektura systemu dialogowego Text-In-Voice-Out (TIVO) 35

FSA systemu dialogowego Linie przerywane pokazują możliwe zmiany kolejek dialogowych 36

Fragment przykładowego dialogu Dzień dobry! Witam! Jak się nazywasz? Kobieta czy mężczyzna? (Drukowany tekst: k/m) A wie Pani gdzie jest szpital? No to dobrze. To jeżeli mogłaby Pani wyjaśnić drogę, to bardzo bym prosił. Tak, dobrze. Acha, czyli rozumiem: prosto. A potem? Chyba coś się musiało zmienić nie mogę tam. Drukowany tekst: Karetka jest na: q10 (+ mapa) Nie, nie, nie. Nie ma właśnie wejścia tam.... No postaramy się. W razie czego będziemy jeszcze dzwonić. Także... proszę czekać. Niedługo przyjeżdżamy. Dziękuję. Anna k tak f k p r? r co 37

Ewaluacja 52 osoby Formalny: 14 kobiet & 12 mężczyzn Nieformalny: 14 kobiet & 12 mężczyzn Wiek średni: 22/23 lata Wszystkie odpowiedzi: 1072 Czas: 152min 22s Min: 1min 51s Max: 4min 47s 38

Graficzna prezentacja wyników skala MOS (Mean Opinion Score) 39

Podsumowanie zadań rozwojowych (1) Specyfikacje: semantyczne dopasowanie w dialogu z wyborem stylu mowy formalnym i nieformalnym realistyczny scenariusz warunków stresowych (dialog w sytuacji alarmowej z centrum telefonicznym szpitala) Projektowanie: selekcja formalnych własności automatów automat semantycznego dopasowania automat kontroli dialogu korpusowe badania lingwistyczne (ogólne + konkretny scenariusz) formalna analiza aktów dialogowych + modelowanie skończeniestanowe 40

Podsumowanie zadań rozwojowych (2) Zasoby: Lingwistyka korpusowa: korpusy + anotacja + modele ogólna:... modelowanie automatami:... konkretne scenariusze:... Implementacja: ekstrakcja informacji z korpusów stworzenie głosu syntetycznego prototyp systemu dialogowego: FSA dopasowania semantycznego FSA menadżera dialogu 41

Podsumowanie Prototyp weryfikujący koncepcję wykazano, że cel modelowania semantycznego dopasowania został osiągnięty poparł twierdzenie, że tradycyjny zestaw emocjonalnych etykiet może być zastąpiony przez formalny-nieformalny styl mowy w systemie dialogowym Dopasowanie jest nie tylko odpowiednie dla sytuacji publicznych ludzkie: semantyczne 42

Osiągnięcia praktyczne Synteza mowy ekstraktor zdań bogatych fonetycznie automatyczny ekstraktor difonów syntetyczny głos męski PL2 Korpus polskich dialogów (4 godz. 12 min): 12 par & 3 pary kontrolne sytuacja publiczna scenariusze: nagły wypadek & neutralny metody: map-task & diapix czytanie neutralne Prototypowy system dialogowy 43

Pytanie Jakie mogą być problemy nagrań dialogów telefonicznych, samochodowych, z centrum handlowego? Jak wyeliminować te problemy? 44

Przeanalizuj dialog Przeanalizuj dialog z punktu widzenia zaprojektowania systemu dialogowego http://bachan.speechlabs.pl/files/dialogues/dialog.wav 45

Do zobaczenia za tydzień! 46