Bazy nagrań mowy. Katarzyna Klessa Eksploracja, interpretacja, analiza. Wykład otwarty, UAM, Wydział Neofilologii, dn

Podobne dokumenty
Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych

Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych

Językowe bazy danych. Katarzyna Klessa Eksploracja, interpretacja, analiza , Uniwersytet Warszawski, Wydział Polonistyki

Językowe bazy danych. Katarzyna Klessa Eksploracja, interpretacja, analiza , Uniwersytet Warszawski, Wydział Polonistyki

Wprowadzenie do projektowania i wykorzystania baz danych. Katarzyna Klessa

Wprowadzenie do projektowania i wykorzystania baz danych. Katarzyna Klessa

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Podstawy tworzenia i redagowania tekstów specjalistycznych Dokumentacja techniczna

Baza danych. Modele danych

Badania ewaluacyjne WYWIAD 6 ZAJĘCIA

Wykład I. Wprowadzenie do baz danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Bazy danych - wykład wstępny

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

LITERATURA. Wprowadzenie do systemów baz danych C.J.Date; WNT Warszawa 2000

Program warsztatów CLARIN-PL

Bazy danych TERMINOLOGIA

Platforma wymiany informacji e- science.pl, jako skuteczne narzędzie współpracy. Mateusz Tykierko

KARTA PRZEDMIOTU. Programowanie aplikacji internetowych

Wprowadzenie do projektowania i wykorzystania baz danych Relacje i elementy projektowania baz

Wykład 2. Relacyjny model danych

dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Badania marketingowe. Omówione zagadnienia. Społeczna Wyższa Szkoła Przedsiębiorczości i Zarządzania

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Badania marketingowe

Program szkolenia VBA (VISUAL BASIC FOR APPLICATIONS) W EXCELU PODSTAWOWY.

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Program szkolenia PODSTAWY VBA (VISUAL BASIC FOR APPLICATIONS) I FORMULARZE.

Bazy Danych. C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000

Dotacje na innowacje. Inwestujemy w waszą przyszłość.

Opracowała : mgr Elżbieta Książkiewicz-Mroczka

RELACYJNE BAZY DANYCH

Hurtownia danych praktyczne zastosowania

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

dokonać podziału zachowań klienta przeprowadzić rozmowę sprzedażową

BAZY DANYCH. Co to jest baza danych. Przykłady baz danych. Z czego składa się baza danych. Rodzaje baz danych

Ewaluacja wewnętrzna, a podnoszenie jakości pracy szkół. System Zarządzania Informacją Aplikacja nadzoru pedagogicznego

Bazy danych Wykład zerowy. P. F. Góra

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

Badania marketingowe. Omówione zagadnienia

Programowanie obiektowe

Informacje ogólne. Informacje szczegółowe

Laboratorium Technologii Informacyjnych. Projektowanie Baz Danych

Podyplomowe Studium Informatyki w Bizniesie Wydział Matematyki i Informatyki, Uniwersytet Łódzki specjalność: Tworzenie aplikacji w środowisku Oracle

Budowanie interfejsów do baz danych

Trening kompetencji cyfrowych uczniów i nauczycieli z wykorzystaniem usług Google

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym

X SPOTKANIE EKSPERCKIE. System ocen pracowniczych metodą 360 stopni

DIAGNOZA LOKALNA Krok po kroku o tym, jak się czegoś dowiedzieć i nie zwariować

Elektroniczna Ewidencja Materiałów Wybuchowych

Problemy optymalizacji, rozbudowy i integracji systemu Edu wspomagającego e-nauczanie i e-uczenie się w PJWSTK

Pozdrawiam Andrzej Wegner, Consensus. Firma Usługowa.

Opis programu ERWIN. System Zarządzania Postępowaniem. Warszawa ERWIN

PHP: bazy danych, SQL, AJAX i JSON

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

Założenia programu InfoTrick

Miejski Informator naprawdę Multimedialny

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

Wymagane jest podłączenie serwera do Internetu (konieczne do zdalnego dostępu).

ZASADY PRZETWARZANIA DANYCH OSOBOWYCH PRZY KORZYSTANIU ZE STRONY INTERNETOWEJ

Organizacja zajęć BAZY DANYCH II WYKŁAD 1. Plan wykładu. SZBD Oracle

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

ZASADY PRZETWARZANIA DANYCH OSOBOWYCH PRZY KORZYSTANIU ZE STRONY INTERNETOWEJ Spis treści

Spis treści. Od autorów / 9

KARTA KURSU. Języki hipertekstowe i tworzenie stron WWW. Opis kursu (cele kształcenia) Warunki wstępne. Efekty kształcenia. Nazwa

Hurtownie danych. 31 stycznia 2017

Efekty wynikające ze Standardów Kształcenia Nauczycieli

Dziecko z SLI w szkole - diagnoza i postępowanie Agnieszka Maryniak

Bazy danych w geomatyce Databases in Geomatics

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

egroupware czy phpgroupware jest też mniej stabilny.

Kurs MATURA Z INFORMATYKI

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

INSTRUKCJA OBSŁUGI USTAWIEŃ DYNAMICZNIE PRZEDZIELANYCH ADRESÓW IP W URZĄDZENIACH SYSTEMU IP-PRO ORAZ REJESTRATORACH MY-DVR

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie

mail: strona: konsultacje: na stronie (po wcześniejszym umówieniu drogą mailową)

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

WPROWADZENIE DO BAZ DANYCH

ZASADY PRZETWARZANIA DANYCH OSOBOWYCH PRZY KORZYSTANIU ZE STRONY INTERNETOWEJ

Spis treści MONITOR PRACY... 4

Część I Istota analizy biznesowej a Analysis Services

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...


Zbieranie i ochrona danych osobowych w konsultacjach publicznych

Technologia informacyjna

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Systemy baz danych. mgr inż. Sylwia Glińska

EXSO-CORE - specyfikacja

Transkrypt:

Bazy nagrań mowy Eksploracja, interpretacja, analiza Katarzyna Klessa klessa@amu.edu.pl Wykład otwarty, UAM, Wydział Neofilologii, dn. 16.03.206

Bazy nagrań mowy plan wykładu Wybrane etapy poprzedzające proces nagrywania mowy a ich skuteczna eksploracja. Wielokrotny użytek i współdzielenie zasobów. Interpretacja przykłady baz nagrań mowy. Jakie dane badamy, a jakie chcielibyśmy badać? Jak technologia może usprawniać proces tworzenia zasobów na różnych jego etapach, np. anotacja nagrań, zarządzanie danymi. 2

Bazy nagrań mowy dla kogo mogą być użyteczne? Grupa użytkowników a sposób udostępniania prezentacji danych bazy nagrań przeznaczone do badań naukowych nad sygnałem mowy, analiza zaburzeń mowy, porównanie z normą bazy dla technologii: synteza, rozpoznawanie mowy i mówcy, archiwa językowe dla specjalistów i popularyzatorskie. Inni użytkownicy niż ci pierwotnie planowani? 3

Wielokrotny użytek i współdzielenie zasobów re-usability 4

Wybrane etapy prac 5

Dane Metadane metadane dane o danych» dla nagrań mowy dane osobowe mówcy, wiek, płeć, jego stan psychiczny, dane środowiska nagraniowego, mikrofonów, osób nagrywających, innych osób obecnych przy nagraniu, innych czynników...» dla danych tekstowych dane jak np. w katalogu bibliotecznym, informacje o sposobach kolekcjonowania danych...» załączniki np. zgody na wykorzystanie danych» uwaga: rozróżnienie nie jest jednoznaczne, jeśli korpus jest wielokrotnego użytku metadane mogą stać się danymi i na odwrót 6

Metadane a współdzielenie zasobów re-usability Rozbudowany system metadanych może przyczynić się do większej użyteczności korpusu, także w obszarach poza pierwotnym docelowym obszarem zastosowań np. nagrania mowy na potrzeby badań fonetycznych mogą stać się wartościowym materiałem na potrzeby psychologii, socjologii, terapii języka i mowy, technologii informatycznej i in. Właściwy opis i dokumentacja zasobów mogą stanowić o ich większej użyteczności. Aspekty współdzielenia danych i komercyjne. 7

Dane surowe i korpusy językowe Dane surowe (raw/primary data) bez obróbki, systematyzacji, nieprzetworzone / przetworzone w niewielkim stopniu Zdjęcia: languagesindanger.eu 8

Dane surowe i korpusy językowe Korpus (ang. corpus, corpora; z łac. ciało, określona całość) dane zebrane zwykle wg założonego z góry klucza, w określonym celu zwykle już w trakcie projektowania korpusu planuje się określoną jego strukturę oraz sposób opisu danych uporządkowana kolekcja nagrań, tekstów pisanych, transkrypcji wypowiedzi i / lub powiązanych z nimi nagrań mowy 9

Różne sposoby pozyskiwania danych Zdjęcia: languagesindanger.eu 10

Paradoks obserwatora Observer's Paradox Celem badań językoznawczych prowadzonych w danej społeczności ma być ustalenie, jak ludzie rozmawiają ze sobą wtedy, gdy nikt ich systematycznie nie obserwuje. Ale takie dane możemy pozyskać tylko przez systematyczną obserwację. William Labov (1972) Sociolinguistic Patterns. Fot. L. W. Hine, The Observer and the Observed. 11

Zgoda na nagrania Zgoda na nagrania głosu i ich wykorzystanie - można jej udzielić w formie pisemnej (optymalnie) lub ustnej, jeśli zostanie ona zarejestrowana. Warto sprawdzić aktualne przepisy przed rozpoczęciem nagrań. 12

Mowa spontaniczna: baza JST / CREST Baza mowy spontanicznej i ekspresywnej JST/CREST. Baza złożona z szeregu podzbiorów, z których jeden zebrano tak, że ochotnikom zamontowano małe przenośne urządzenia do nagrywania. Urządzenia rejestrowały spontaniczną mowę tych osób podczas codziennych czynności (w pracy, domu czy szkole) przez stosunkowo długi okres czasu (np. kilka miesięcy). 13

Mowa spontaniczna: język opiekuńczy mikrokorpus UAM 4 matki mówiące do swoich dzieci, niemowląt <1 r.ż Okoliczności: karmienie, przewijanie, kładzenie do snu i in. codzienne czynności Zdjęcie: poster Design, structure, and preliminary analyses of a speech corpus of infant directed speech (IDS) and adult directed speech (ADS). SLE 2015, dzięki uprzejmości M.Oleśkowicz-Popiel 14

Mowa spontaniczna a kwestie techniczne, prawne i etyczne Zarządzanie? Kontrola? Metadane? Przetwarzanie? Kwestie etyczne Ochrona danych osobowych 15

Scenariusze nagraniowe Wypowiedzi (dialogi, monologi): spontaniczne quasi-spontaniczne, wywoływane, zadaniowe czytane (teksty ciągłe, listy wyrazowe, jednostki izolowane) Rejestracja zachowań językowych Wiedza o języku, świadomość języka 16

Mowa wywoływana, skierowana do dzieci i dorosłych - IDS vs. ADS korpus NeuroPerKog Wypowiedzi izolowane (sylaby, krótkie słowa / logatomy) realizowane w sposób neutralny oraz jako skierowane do dzieci - instrukcja + zdjęcie jako sposób wywołania specyficznej realizacji wypowiedzi 17

Dialogi zadaniowe, telefoniczne: Paralingua Dial Kilka etapów sesji nagraniowej różne zadania: czytanie tekstu, 4 zadania dialogowe, ponowne czytanie tekstu Rozmowa przez telefon komórkowy, brak kontaktu wzrokowego Nagrania za pomocą kamer, mikrofonów i telefonów komórkowych. Fot. freeeimages.com 18

Dialogi zadaniowe Korpusy multimodalne DiaGest, Borderland Zadania dialogowe zaprojektowane w celu wywołania gestykulacji np. tzw. origami task, maptask Rejestracja audio i wideo, badanie interakcji mowy z innymi, językowymi i pozajęzykowymi składowymi wypowiedzi Www.bordland.amu.edu.pl, screenshot z progr. E LAN z languagesindanger.eu, dzięki uprzejmości M. Karpińskiego 19

Portrety emocjonalne: Paralingua Emo Emotion portrayals, por. GEMEP Geneva corpus (Scherer et al.) Wypowiedzi neutralne leksykalnie, co najmniej jedna fraza, wyrazy o wysokiej częstości występowania w codziennym użyciu, wszyscy mówcy te same teksty wypowiedzi Emocje podstawowe i emocje o zróżnicowanym nacechowaniu i stopniu pobudzenia (valence, activation) Fot. Ewa Sobczak ze spektaklu Dziewczyna na kanapie 20

Portrety emocjonalne: Paralingua Emo Wyniki z: Głowacka, K. (2016) Praca magisterska, UAM 21

Archiwa językowe, dokumentacja języków Cele gromadzenia danych na potrzeby archiwizacji i dokumentacji oraz badań naukowych (fonetycznych, psycholingwistycznych, socjologicznych ) mogą być różne, ale wiele metod i technik pokrywa się Archiwa językowe np.» http://www.dialektologia.uw.edu.pl/index.php» http://dobes.mpi.nl/» https://www.soas.ac.uk/library/archives/» http://inne-jezyki.amu.edu.pl/frontend/ Wykorzystanie danych na potrzeby popularyzacji wiedzy: http://pl.languagesindanger.eu/map-html/pl/ 22

Archiwa językowe, dokumentacja języków www.inne-jezyki.amu.edu.pl 23

Reprezentatywność korpusów Reprezentatywność zakres w jakim korpus informuje o zjawiskach zachodzących w całej populacji; w przypadku korpusów językowych w języku lub jego specjalizowanym podzbiorze Odróżnia korpusy od archiwów językowych *(jednak por. korpusy mowy spontanicznej, jak określić ich reprezentatywność?) Możliwość generalizacji, wyciągania uogólnionych wniosków 24

Korpusy statyczne vs. dynamiczne Statyczne zbiór danych językowych dający informację na temat elementów systemu językowego w określonym momencie łatwiej kontrolować zrównoważenie zawartości korpusu, użyteczność może być bardziej ograniczona (dezaktualizacja). Dynamiczne umożliwiają obserwację zmienności zjawisk językowych w czasie, trudniejsze w utrzymaniu, droższe, trudniejsza kontrola zrównoważenia i jakości danych Archiwa często o charakterze dynamicznym, niekiedy każde nagranie na wagę złota. 25

Opis i systematyzacja danych w korpusach - wybór metod i technologii Jeśli pojęcie 'baza danych' to dla nas po prostu jakikolwiek zbiór danych, to na powyższe pytanie możemy odpowiedzieć - 'tak' Ograniczenia - brak powiązań między poszczególnymi plikami, trudności w sortowaniu ze względu na różne kryteria, trudności we współpracy, gdy dane są edytowane przez różne osoby (kto edytuje, który plik, kiedy, co zostało zmienione?) Systemy wspomagające pracę na zbiorach plików, np. Git http://git-scm.com/ - darmowy hosting dla Git, np. https://github.com/, https://bitbucket.org/ 26

Techniki zbierania (meta)danych Kwestionariusze papierowe, elektroniczne, on-line wady i zalety (czasochłonność, koszty, konieczność dostępu do Internetu i zasilania w miejscu nagrań) kwestionariusz / ankieta arkusz kalkulacyjny przetwarzanie danych analiza / prezentacja 27

Techniki zbierania (meta)danych Darmowe, intuicyjne narzędzia do tworzenia ankiet internetowych, np. Google Forms, ankietka.pl 28

Transkrypcja, segmentacja, anotacja Różnice w definiowaniu, wieloznaczność Przykłady: archiwum gwarypolskie.uw.edu.pl trullsenglish.weebly.com/annotating-text.html 29

Transkrypcja, segmentacja, anotacja 30

Transkrypcja, segmentacja, anotacja annotationpro.org 31

Transkrypcja, segmentacja, anotacja annotationpro.org 32

Zarządzanie danymi Wybór technologii zależny od rodzaju i przeznaczenia korpusu. Optymalnie jest, gdy sposób systematyzacji danych dobrany jest już na etapie wstępnego projektowania tworzonego zasobu. Różne sposoby systematyzacji korpusów językowych: np. bazy plikowe arkusze kalkulacyjne relacyjne bazy danych» Relacyjna baza danych zbiór danych zorganizowanych w postaci tabel powiązanych różnego rodzaju relacjami 33

Relacyjna baza danych - i relacyjny model rzeczywistości Relacyjna baza danych oparta jest na tzw relacyjnym modelu rzeczywistości: ma odzwierciedlać pewien fragment rzeczywistości, jej elementów oraz powiązań między nimi. 34

Architektura klient - serwer 35

Jak nauczyć się rozmawiać z relacyjną bazą danych? 1. Przede wszystkim trzeba ją mieć instalacja *(różne platformy, Microsoft SQL Server, MySQL, Oracle). 2. Warto, a czasem trzeba poznać język obcy: SQL 3. Z bazą relacyjną można komunikować się różnymi kanałami: - bezpośrednie zapytania do bazy (w języku SQL) - za pośrednictwem program(ów) do zarządzania / edycji danych (które wykonają polecenia SQL w naszym imieniu, wówczas nie musimy znać składni tego języka zapytań) - lokalnie lub przez Internet 36

Warto - nie warto - trzeba? Czy / kiedy warto szukać czegoś więcej niż zwykły zbiór plików czy arkusz kalkulacyjny? - kiedy mamy 1 osobę pracującą nad 1 plikiem? - kiedy mamy 1 osobę i wiele danych? - kiedy mamy dużo osób i średnią ilość danych? - kiedy mamy dużo osób i bardzo dużo danych? - kiedy różne osoby korzystają z danych z różnych miejsc, zdalnie? 37

Warto - nie warto - trzeba? Czy / kiedy warto szukać czegoś więcej niż zwykły zbiór plików czy arkusz kalkulacyjny? - kiedy mamy 1 osobę pracującą nad 1 plikiem - nie warto - kiedy mamy 1 osobę i wiele danych - warto - kiedy mamy dużo osób i średnią ilość danych - warto - kiedy mamy dużo osób i bardzo dużo danych - trzeba - kiedy różne osoby korzystają z danych z różnych miejsc, zdalnie - warto czasem trzeba - zależnie od ilości danych (np. za stroną internetową z danymi stoi zwykle baza danych) 38

39

Popularyzacja wiedzy www.languagesindanger.eu 40

Wydanie poświęcone narzędziom dla fonetyki, m.in. narzędziom do opisu i analizy nagrań mowy. 41

Dziękuję za uwagę! klessa@amu.edu.pl annotationpro.org katarzyna.klessa.pl