XI International PhD Workshop OWD 2009, October 2009

Wielkość: px
Rozpocząć pokaz od strony:

Download "XI International PhD Workshop OWD 2009, October 2009"

Transkrypt

1 XI International PhD Workshop OWD 2009, October 2009 SYSTEM KORPUSOWEJ SYNTEZY MOWY DLA JĘZYKA POLSKIEGO POLISH UNIT SELECTION SPEECH SYNTHESIS SYSTEM Krzysztof Szklanny, Polsko-Japońska WyŜsza Szkoła Technik Komputerowych ( , prof. Krzysztof Marasek, Polsko-Japońska WyŜsza Szkoła Technik Komputerowych) Abstract The main aim of this study is to describe the process of creating Polish Unit Selection Speech Synthesis System. The Unit Selection Speech Synthesis makes it possible to generate intelligible and naturally sounding speech. The naturalness is achieved by the careful joining together suitable acoustic units, covering the whole of the utterance. The main prerequisite for a unit selection system is a speech database covering the acoustic units found in the language for a given domain. A well constructed speech corpora was constructed in such a way that its phonetic representation serves as the basis for the design of cost the cost function. This cost function is often decomposed into two costs: a target cost (how closely candidate units in the inventory match the specification of the target phone sequence) and join cost (how well neighboring units can be joined). In the following article, the method of creating the text corpora will be presented then the process of recording will be described. To automate the segmentation process the HTK toolkit was used based on the 3-state HMM models with 39 coefficients. The implementation of the new Polish voice was prepared in metasystem Festival. To obtain higher quality of synthetic speech the optimization of the cost function was conducted by using the genetic algorithm. The results of MOS test shows that quality of generated speech has significantly increased. The full TTS was prepared and can be downloaded from Streszczenie Celem pracy było stworzenie w pełni funkcjonalnego, systemu korpusowej syntezy mowy polskiej. W pracy przygotowano korpus tekstowy nagrano go, oraz przeprowadzono jego segmentację. Przygotowaną bazę akustyczną wraz z odpowiednio zmodyfikowanymi modułami lingwistycznymi zaimplementowano w metasystemie Festival 1.WaŜną częścią pracy była optymalizacja funkcji kosztu za pomocą algorytmu ewolucyjnego, co pozwoliło na uzyskanie lepszej jakości syntetycznej mowy. 1. Wiadomości wstępne Synteza korpusowa (ang. unit selection) jest najbardziej efektywną i popularną metodą syntezy konkatenacyjnej, poniewaŝ pozwala na uzyskanie mowy o jakości bliskiej naturalnej. Sercem systemu jest odpowiednio przygotowany korpus. Zawiera on posegmentowane wypowiedzi, a pośrednio segmenty akustyczne o róŝnej rozciągłości (np. fonemy, difony, trifony, sylaby, wyrazy, całe zdania). KaŜda jednostka występuje wielokrotnie. Segmentacji bazy dokonuje się w automatyczny sposób stosując modele statystyczne lub rozwiązania heurystyczne takie jak sieci neuronowe. Chcąc wygenerować zadaną wypowiedź dobierane są takie jednostki, które minimalizują wartość funkcji kosztu. Funkcja ta składa się z dwóch części: kosztu doboru jednostki oraz kosztu konkatenacji. Koszt doboru jednostki jest funkcją, która optymalizuje fragmenty łączonej mowy poprzez wybieranie najbardziej pasujących pod względem lingwistycznym. Funkcja kosztu konkatenacji wyznacza jakość połączenia na podstawie czasu trwania jednostek akustycznych tworzących łączone fragmenty, ich intonacji, konturu widma oraz energii. Na ogół modyfikacje prozodyczne sygnału nie są konieczne, co przekłada się na duŝą naturalność brzmienia generowanej mowy. Optymalizacja funkcji kosztu oraz ustalenie wag poszczególnych składowych jest zadaniem trudnym i bardzo waŝnym, poniewaŝ parametry funkcji kosztu mają wpływ na jakość generowanej mowy

2 Proces tworzenia systemu korpusowej syntezy mowy dla języka polskiego jest bardzo skomplikowany. Obejmował etap przygotowania korpusu, realizacje nagrań, segmentację bazy językowej. Następnie przygotowano nowy głos w środowisku Festival przy wykorzystaniu bazy akustycznej. Etap ten zawierał tworzenie nowych modułów jak i dostosowywanie juŝ istniejących. Następnie zoptymalizowano funkcję kosztu wykorzystując do tego algorytm ewolucyjny. Efekt badań został potwierdzony percepcyjnym testem jakości syntetycznej mowy typu MOS (ang. mean opinion score). 2. Przygotowanie korpusu Pierwszym etapem tworzenia systemu korpusowej syntezy mowy była realizacja korpusu. Proces obejmował selekcję tekstów, transkrypcję fonetyczną oraz wielokrotne balansowanie bazy w celu stworzenia optymalnego oraz reprezentatywnego zbioru języka polskiego. Do stworzenia korpusu wykorzystano teksty przemówień parlamentarnych. Rozmiar początkowego korpusu wynosił 300 MB i zawierał zdań. Usunięto wszystkie meta dane, skróty, akronimy oraz liczby zostały rozwinięte. Następnie przygotowano transkrypcję fonetyczną przy uŝyciu alfabetu SAMPA. Porównano ze sobą dwa algorytmy transkrypcji fonetycznej: system regułowy przygotowany dla systemu Festival [1] oraz metodę automatyczną opartą na drzewach decyzyjnych C.50 [2]. W wyniku porównania obydwu metod okazało się, Ŝe lepszym i znacznie efektywniejszym rozwiązaniem jest zastosowanie metody drzew decyzyjnych, dzięki któremu uzyskuje się znacznie większą dokładność w transkrypcji fonetycznej. Proces balansowania korpusu został przygotowany za pomocą algorytmu zachłannego. Korpus sejmowy został podzielony na 12 podkorpusów po 20 MB kaŝdy a następnie zastosowano program CorpusCrt.[3]. Podział ten wynikał z maksymalnego rozmiaru korpusu jaki moŝe być zaakceptowany przez program. KaŜdy podkorpus zawierał około fonemów. Okazało się, Ŝe dla kaŝdego z tych podkorpusów częstotliwości występowania fonemów są bardzo zbliŝone do siebie. Rysunek 1 ilustruje procentowy udział poszczególnych fonemów dla dwóch dowolnie wybranych podkorpusów sejmowych. Rys.1. Porównanie rozkładu częstotliwości występowania poszczególnych fonemów w dwóch losowych podkorpusach sejmowych. Fig.1. Comparison of phonetic distribution between two random sub-corpora of parliamentary statements. Do wyboru najbardziej reprezentatywnych zdań oraz zbalansowanych wybrano następujące kryteria: Minimalna długość fonetyczna zdania to 30 znaków 2 ; Maksymalna długość fonetyczna zdania to 80 znaków; Korpus powinien zawierać 2500 zdań. W korpusie kaŝdy fonem powinien wystąpić co najmniej 40 razy; KaŜdy difon powinien wystąpić co najmniej 4 razy; KaŜdy trifon powinien wystąpić co najmniej 3 razy, to wymaganie jest dostępne tylko dla najczęściej występujących trifonów. ZałoŜenia te zostały określone na podstawie [4,5]. W ten sposób uzyskano 12 róŝnych korpusów po 2500 zdań kaŝdy. Po dwóch etapach balansowania zwiększyła się globalna liczba difonów (z do ) zmniejszyła się ilość difonów występujących mniej niŝ 4 razy (z 175 do 68) oraz uzyskano większą ilość róŝnych difonów (z 1096 do 1196). Uzyskano większą liczbę trifonów (z do ) oraz zwiększyła się ilość róŝnych trifonów (z do 13882). Finalny korpus zawiera zdania pytające wykrzyknikowe oraz został wzbogacony o rzadko występujące słowa. Rozkład częstotliwości występowania poszczególnych fonemów przedstawia Rysunek 2. Ostatnim krokiem korekty korpusu była manualna weryfikacja korpusu, pozwalająca na usunięcie lub zmianę zdań bezsensownych lub bardzo trudnych do wymówienia. Rys.2. Częstotliwość występowania poszczególnych fonemów w finalnej wersji korpusu. Fig.2. Phonetic distribution in final corpus 2 Bez znaków interpunkcyjnych 236

3 3. Nagrania Następnym etapem była realizacja nagrań. Korpus został zarejestrowany przez półprofesjonalnego mówcę. Speaker był zaznajomiony z transkrypcją fonetyczną języka polskiego. Podczas nagrań tekst ortograficzny oraz jego transkrypcja była wyświetlana mówcy oraz osobie nadzorującej nagrania. Nagrania miały miejsce w komorze bezechowej w Polsko-Japońskiej WyŜszej Szkole Technik Komputerowych. UŜyto dynamicznego mikrofony Rode NT1000. Baza akustyczna została zarejestrowana z częstotliwością próbkowania 48 khz oraz 16 bitową rozdzielczością w formacie RAW. Dodatkowo uŝyty został pop-filter zainstalowany pomiędzy mówcą a mikrofonem. Dzięki temu uzyskano mniejszą moc strugi powietrza uderzającą w membranę mikrofonu podczas artykulacji głosek zwartych takich jak p, b, d, t, k, g.[6]. Materiał został zarejestrowany za pomocą 24 bitowego interfejsu dźwiękowego M-Audio o maksymalnej częstotliwości próbkowania 96 khz. Sesja nagraniowa trwała około miesiąca i odbywała się w trudnych warunkach, podczas roku akademickiego. Przed kaŝdą sesją odsłuchiwano poprzednie nagrania w celu uzyskania podobnej intonacji oraz sposobu mówienia. DuŜą uwagę przyłoŝono do eliminacji wszelkiego rodzaju zakłóceń, szumów, stuków oraz innych zniekształceń harmonicznych. Podczas rejestracji sygnału stwierdzono obecność stałych składowych częstotliwościowych ok Hz. Częstotliwości te były przenoszone poprzez przewody wentylacyjne laboratoriów uczelni. Podjęto próbę wyeliminowania istniejących zniekształceń, poniewaŝ wiadomo, Ŝe im mniejsza jest manipulacja sygnałem dźwiękowym (np. automatyczna redukcja szumów, poprawa dynamiki sygnału itp.) tym lepsza jakość generowanej mowy.[7] 4. Automatyczna segmentacja korpusu DuŜa baza akustyczna wymusza przynajmniej częściową automatyzację procesu segmentacji. Polega ona przede wszystkim na wstępnym dopasowaniu granic sygnału i transkrypcji fonetycznej (alignment), przy pomocy narzędzi opartych o mechanizmy rozpoznawania mowy. Wykorzystano do tego toolkit HTK (Hidden Markov Model Toolkit) 3 oparty na ukrytych modelach Markova (HMM). KaŜdy z modeli został sparametryzowany w przestrzeni 39 współczynników, mianowicie 12 współczynników MFCC opisujących charakterystykę cepstrum w skali melowej oraz jednemu współczynnikowi energii (E) wraz pochodnymi pierwszego i drugiego stopnia.[8,9]. Przygotowano 5 zestawów róŝnych modeli Wszystkie dostarczone komplety reprezentujące fonemy zawierały 38 modeli HMM. Dodatkowy model HMM, wykorzystywany przez program Aligner, reprezentował ciszę. KaŜdy z modeli składał się z trzech stanów, reprezentujących nagłos, śródgłos oraz wygłos danego fonemu [10]. Tab.1. Porównanie poziomu rozpoznawalności róŝnych modeli HMM. Comparison between different structures of HMMs. Modele HMM (fonemy) ramka 5ms, pobierana co 1ms (fonemy) ramka 15ms, pobierana co 5ms (fonemy) ramka 25ms, pobierana co 10ms (fonemy) ramka 25ms, pobierana co 10ms, dodatkowa estymacja na bazie akustycznej (difony) ramka 25ms, pobierana co 10ms Rozpoznane słowa (%) Rozpoznane zdania (%) 38,14 33,06 71,47 55,65 93,27 89,52 92,95 89,52 71,79 53,23 W pierwszym z zestawów wykorzystano okno analizy o szerokości 5ms, pobierane z przesunięciem czasowym co 1ms. W drugim, ramka miała rozmiar 15ms i była pobierana co 5ms, natomiast w trzecim odpowiednio ramkę 25ms z przesunięciem 10ms. KaŜdy z 3 wymienionych zestawów został wytrenowany na podstawie 585 fonetycznie dobranych nagrań wypowiedzi 40 mówców, zawierających pojedyncze wyrazy i zdania [11]. Aby podnieść poziom dokładności rozpoznawania, do kaŝdego stanu wstępnie wytrenowanych modeli HMM dodano mikstury Gaussowskie, po czym ponownie estymowano parametry modeli. Ten proces we wszystkich przypadkach powtórzono 3 razy. Na zakończenie przeprowadzono ostateczną estymację parametrów wszystkich modeli HMM na podstawie zarejestrowanych nagrań 40 mówców. Czwarty zestaw ukrytych modeli Markowa reprezentujący fonemy powstał w wyniku dodatkowej estymacji trzeciego zestawu na posegmentowanej bazie akustycznej za pomocą trzeciego zestawu modeli. Ostatni zestaw HMM wykorzystujący difony wytrenowany i estymowany został na podstawie bazy danych Speecon [13], która zawiera zarejestrowane wypowiedzi 600 mówców. W przypadku modeli difonów trening w całości odbywał się na podstawie nieposegmentowanych nagrań. Poziom rozpoznawalności dla modeli fonemów z ramką 25 ms pobieraną co 10 ms był niŝszy o 0,34% od najlepszego zestawu modeli. Jednak dzięki adaptacji do konkretnego mówcy i warunków

4 Rys.3. Porównanie róŝnych rodzajów modeli HMM: z ramką 15 ms, z ramką 25 ms oraz z ramką 25 ms oszacowaną na korpusie. Fig.3. Comparison between different HMM models: 15 ms frame period, 25 ms frame period model and 25ms period estimated on corpus. nagrań, pozwolił na uzyskanie mniejszej ilość błędów w segmentacji. [11]. Rozpoznawalności danego zestawu modeli HMM nie określa poprawności wyznaczanych przez niego granic jednostek akustycznych. Na rysunku 3 przedstawiono kolejne wersje segmentacji to zaczynając od góry: model o ramce 15ms i kroku 5ms, model o ramce 25ms i kroku 10ms oraz ten sam zestaw modeli o ramce 25, pobieranej, co 10ms, dodatkowo estymowany na bazie akustycznej. Ostatnim etapem segmentacji była weryfikacja manualna oraz automatyzacja procesu rozpoznawania. Korekta polegała na zidentyfikowaniu, wyszukaniu oraz poprawieniu wszelkich cyklicznie powtarzających się błędów. Ze względu na rozmiar bazy akustycznej, postanowiono znacznie zautomatyzować proces wyszukiwania błędów. W tym celu wykorzystano skrypty, których działanie polegało na obliczeniu czasu trwania kaŝdego fonemu w nagraniach, wyliczeniu globalnych średnich i odchylenia standardowego dla róŝnych fonemów oraz wyszukaniu i wypisaniu wystąpień, których czas trwania znacząco odbiegał od wyliczonych wcześniej średnich (2x odchylenie standardowe) [11]. Metoda ta okazała się w miarę skuteczna w wyszukiwaniu istotnych błędów w segmentacji jak i błędnej transkrypcji fonetycznej. W wyniku działania skryptów otrzymano listę ok wykrytych fonemów o nienaturalnym czasie trwania.[15] 5. Funkcja kosztu i jej optymalizacja Po przygotowaniu bazy akustycznej wykonano szereg czynności w środowisku Festival pozwalających na uruchomienie w nim prototypowego głosu. Zmodyfikowano moduły lingwistyczne języka polskiego [14]. Przygotowano struktury zdaniowe opisujące lingwistyczne zaleŝności w nagranym korpusie. W kolejnym etapie wyekstrahowano z sygnału kontur F0 następnie przygotowano sygnał z opisem F0 oraz sparametryzowano bazę akustyczną (LPC i MFCC). W ten sposób powstała pierwsza wersja systemu bez zoptymalizowanej funkcji kosztu. Jak wspomniano proces optymalizacji jest istotny i ma wpływ na jakość syntetycznej mowy dlatego poświecono temu etapowi duŝo czasu. W meta systemie Festival funkcja kosztu została zdefiniowana w następujący sposób: Wynik funkcji kosztu jest wyliczany na podstawie średniej waŝonej funkcji kosztu doboru jednostki oraz kosztu konkatenacji. Koszt konkatenacji definiuje następujące parametry: koszt F0, koszt energii sygnału, koszt nieciągłości spektralnej Koszt doboru jednostki składa się z następujących składowych: koszt akcentu, koszt lewego i prawego kontekstu, koszt niewłaściwego doboru melodii, koszt pozycji w sylabie, koszt pozycji w słowie, koszt pozycji we frazie, koszt Part-Of-Speech Funkcja kosztu jest wagowo znormalizowaną sumą wymienionych komponentów. W celu optymalizacji funkcji kosztu zastosowano algorytm ewolucyjny ze strategią µ+ λ. Algorytm ewolucyjny jest rodzajem algorytmu przeszukującego przestrzeń alternatywnych rozwiązań problemu w celu określenia najlepszych rozwiązań. Ma swoje zastosowanie przy poszukiwaniu rozwiązania problemu, którego nie da się rozwiązać w linowy sposób. W pierwszej iteracji algorytm generuje populację losową w postaci siedmiu osobników, z których kaŝdy ma 11 cech, co oznacza, Ŝe optymalizowanych będzie 11 parametrów funkcji kosztu. Następnie dokonuje się syntezy 7 realizacji kaŝdego zdania w syntezatorze z parametrami wyznaczonymi przez algorytm ewolucyjny. Te zdania poddane zostają subiektywnej ocenie ekspertów. Zdanie, które 238

5 zostało ocenione jako najlepsze pod względem jakości syntezy jest osobnikiem preferowanym do wygenerowania kolejnej populacji. Iteracja powtarzana jest 17 razy. WaŜnym elementem optymalizacji funkcji kosztu było przygotowanie odpowiedniego korpusu testowego. Przygotowany został 100 zdaniowy korpus testowy o maksymalnej długości zdania 60 fonemów. Ze 100 zdań wybranych zostało 19. Zdania były łączone po dwa w celu otrzymania większej ilości trudnych elementów akustycznych. Szczególnie uwzględniono grupy spółgłoskowe. PoniŜej znajdują się przykładowe zdania wykorzystane w finalnym korpusie: W TadŜykistanie padał bez przerwy rzęsisty deszcz i zamienił boisko w dŝungli w grzęzawisko. Szwagier i bratowa siedli mu na plecach i potęŝną dłonią przydusili łeb męŝczyzny do ziemi. Fala powietrza z dzwonka nad drzwiami wejściowymi, wdziera się do środka i strąca kwiatek z okna. W teście wzięło udział 20 ekspertów językowych. Wśród nich znalazło się 3 ekspertów z dziedziny syntezy mowy, 3 fonetyków. Pozostałe osoby zajmują się lingwistyką na co dzień i są osłuchane z mową. Taki wybór osób do testów umoŝliwił uzyskanie miarodajnych wyników. Test był umie szczony na stronie internetowej (synteza.pjwstk.edu.pl) i dwa razy dziennie aktualizowany przez okres dwóch tygodni. Uczestnicy testu byli proszeni o wybór jednego najlepiej brzmiącego zdania spośród siedmiu pochodzących ze specjalnie przygotowanego korpusu testowego. Nagranie moŝna było odsłuchać od dowolnego fragmentu dzięki zamieszczeniu plików dźwiękowych jako embedded objects. Pliki dźwiękowe były zapisane w formacie Microsoft Wave. Dzięki temu jakiekolwiek zniekształcenia wynikające z kompresji zostały wyeliminowane. Kryterium wyboru najlepiej brzmiącego zdania czyli osobnika w przeszukiwanej populacji, było znalezienie syntetycznego zdania z najmniejszą ilością błędów prozodycznych, intonacyjnych, łączeniowych. Przygotowano 20 iteracji algorytmu ewolucyjnego (17 iteracji + 3 podsumowujące). Sesje 1-17 były sesjami podstawowymi to znaczy, Ŝe kaŝda iteracja słuŝyła wybraniu najlepszego potomka po to by w kolejnej uzyskać pokolenie jeszcze bardziej przystosowane czyli posiadające bardziej zoptymalizowane cechy funkcji kosztu. Sesje były sesjami podsumowującymi. W sesji 18 wybrano najlepszego kandydata spośród sesji 1-7. W sesji 19 wybrano najlepszego kandydata spośród sesji W sesji 20 wybrano najlepszego kandydata spośród sesji 15, 16, 17, 18, oraz spośród dwóch kandydatów z sesji 19. W sesji 17 został wytypowany osobnik 4 (pierwotnie populacja 3). Potwierdzeniem wyboru tego kandydata jest sesja 20, w której znaleźli się najlepsi wygrani osobnicy z poszczególnych grup sesyjnych. W niej ponownie zwycięŝył osobnik 4 z pierwotnej populacji 3. Z przeprowadzonych badań wynika, Ŝe dla przygotowanego głosu najistotniejszymi parametrami są : Pozycja w sylabie, nieciągłość melodii, prawy kontekst, nieciągłość energii, koszt akcentu, zły dobór f0 dla kosztu doboru jednostki, Tabela 2 przedstawia wagi poszczególnych składowych funkcji kosztu. Tab.2. Wagi najlepszych osobników z kaŝdej sesji. Kolejne kolumny oznaczają parametry funkcji kosztu konkatenacji a następnie kosztu doboru jednostki (rozdział 5). Dwa ciemniejsze wiersze wskazują parametry najlepszego osobnika. Weights of the best individuals from each population. The columns mean parameters of the cost function: join cost and then target cost (chapter 5). Two darker lines are pointing the best individual's parameters ,6 20, ,4 96,5 84,4 91,7 42,1 31,6 9, ,2 87,6 0 92,1 79,9 96,7 36,3 32, ,4 81,5 24,8 77,8 3,8 97,9 77, ,6 29, ,3 61, ,1 74,4 54,6 26,8 33, ,1 24, , ,8 44,3 24, , ,8 59,3 0 99,2 93,5 46,5 55,3 23, ,7 45,5 14,8 97,3 91,8 44,7 59,4 19,6 34, ,7 29,6 42,9 29, ,3 48, ,9 26, ,4 30,3 97,8 58, ,2 60,7 30,1 22,6 22, ,2 36, , ,9 53, ,6 41, ,9 53,3 50,9 0 91,6 83,9 49,1 24, , ,4 57, , ,9 1,1 51,4 3,4 70,4 97,4 76,9 56, ,6 94,5 0 59,7 0 86,5 92,4 95, , ,1 90, , ,2 96, ,2 10,4 0 6,3 83,8 54, ,4 5,9 74,5 96,1 31,5 88,6 59,4 75,6 12,6 98,4 81,5 24,8 77,8 3,8 97,9 77, ,6 29, ,4 30,3 97,8 58, ,2 60,7 30,1 22,6 22, ,4 57, , ,9 1,1 51,4 3,4 70,4 6. MOS W celu zweryfikowania zoptymalizowanej funkcji kosztu przygotowano test mający na celu sprawdzenie czy zastosowana strategia optymalizacji funkcji kosztu poprawiła jakość syntezy. W teście wzięło udział 28 studentów studiów magisterskich, znających zagadnienia dotyczące syntezy mowy, fonetyki języka polskiego, transkrypcji fonetycznej oraz posiadających wiedzę związaną przetwarzaniem języka naturalnego. Test został zrealizowany w tych samych warunkach odsłuchowych przy zapewnieniu ekspertom identycznego sprzętu odsłuchującego w postaci słuchawek Philips HP1900.Test został podzielony na 5 części. W kaŝdej z nich zostało przygotowanych 5 zdań do odsłuchu. Pierwszą część testu stanowiły pliki z nagrane w ramach korpusu. Druga część testu polegała na resyntezie promptów z korpusu. Trzecia część testu polegała na syntezie z domyślną funkcją kosztu w Festivalu, czwarta z najgorszymi ustawieniami wytypowanymi na etapie estymacji funkcji kosztu za pomocą algorytmu ewolucyjnego. 239

6 Piąta część testu zawierała parametry wytypowane jako najlepszą funkcję kosztu. Pierwsza część testu otrzymała średnią ocenę 4,6, w skali od 1 do 5, co wskazuje, iŝ mówcy ocenili głos lektora dość wysoko. Resynteza zdań wiąŝe się z utratą jakości. Eksperci ocenili średnio jakość syntezy na poziomie 3,793 co jest rezultatem dobrym. Z porównania trzech funkcji kosztu wynika, Ŝe proces estymacji parametrów przyniósł oczekiwany efekt. Eksperci ocenili domyślną funkcję kosztu jako 2,185, najgorszą funkcje kosztu uzyskana podczas estymacji parametrów na 1,97. Zoptymalizowaną funkcję kosztu za pomocą algorytmu ewolucyjnego oceniono na 2, Wnioski Autor uwaŝa, Ŝe opracowana technologia, zawierająca przygotowanie korpusu, jego segmentację odpowiednie przygotowanie modułów lingwistycznych oraz opracowanie funkcji kosztu w Festivalu daje satysfakcjonujący efekt. Na podstawie róŝnicy w ocenie pomiędzy resyntezą a uzyskaną funkcją kosztu oraz plikami nagranymi w korpusie i ich resyntezą, autor uwaŝa, Ŝe jakość mowy znacznie wzrosłaby gdyby baza akustyczna została zarejestrowana przez profesjonalnego lektora oraz gdyby lektor mówił wolniejszym tempem. Dzięki temu moŝna byłoby uzyskać mniejsze fluktuacje F0 oraz dokładniejszą jakość segmentacji bazy. Kolejnym etapem badań, będzie stworzenie nowego głosu korpusowego, który zostanie zarejestrowany przez profesjonalnego mówcę. System syntezy mowy jest dostępny pod następującym adresem: 8. Podziękowania Chciałbym bardzo serdecznie podziękować mojemu Promotorowi prof. Krzysztofowi Maraskowi za pomoc w realizacji niniejszej pracy. Praca jest częściowo finansowana z grantu MNiSW N /0641, autor: Mgr. inŝ Krzysztof Szklanny, kszklanny@pjwstk.edu.pl, Koszykowa 86, Warsaw, tel.(0-22) , fax (0-22) Literatura 1. Black Alan, Taylor Paul: Festival Speech Synthesis System: system documentation. Technical Report HCRC/TR 83, University of Edinburgh, Human Communication Research Centre, Marasek Krzysztof: Synteza mowy: przegląd technologii i zastosowań ze szczególnym uwzględnieniem języka polskiego, Bailador Alberto: CorpusCrt. Technical report, Polytechnic University of Catalonia (UPC) Bozkurt Baris, Dutoit Thierry, Ozturk Ozlem: Text Design For TTS Speech Corpus Building Using A Modified Greedy Selection, Proc. Eurospeech, Geneva 2003, pp Clark Robert, Richmond Korin, King Simon: Multisyn: Open-domain unit selection for the Festival speech synthesis system. Speech Communication, 49(4): , Kominek John, Black Alan: CMU ARCTIC databases for speech synthesis, CMU-LTI Ver Language Technologies Institute School of Computer Science Carnegie Mellon University 5000 Forbes Ave., Pittsburgh, PA Van Santen Jan, Buchsbaum Adam: Methods for Optimal Text Selection In Proc.5th Euro Conf on Speech Communication and Technology (EUROSPEECH-97), pages553 6, Rhodes, Greece. 8. Young S. Evermann G. Kershaw D. Moore G. Odell J. Ollason D. Valtchev V. Woodland P. (2001) The HTK Book (for HTK Version 3.1) Microsoft Corporation Cambridge University Engineering Department. First published December 1995 Revised for HTK Version 3.1 December Black Alan, Lenzo Kevin: Buliding Synthetic Voices ( ) 10. Zhang Jason, Toth Artur, Collins-Thompson Kevyn, Black Alan: Prominence prediction for supersentential prosodic modeling based on a new database. In Fifth ISCA ITRW on Speech Synthesis (SSW5), Pittsburgh, PA, USA Oliver Dominika, Szklanny Krzysztof: Creation and analysis of a Polish speech database for use in unit selection synthesis, LREC Genoa, Italy Marasek Krzysztof, Gubrynowicz Ryszard: Multilevel Annotation in SpeeCon Polish Speech Database InIMTCI, pages Oliver Dominika: Polish Text to Speech Synthesis, praca magisterska University of Edinburgh Department of Linguistics Szklanny Krzysztof, Wojtówski Michał: Automatic segmentation quality improvement for realization of unit selection In Proceedings of Human System Interactions p Digital Object Identifier /HSI , Krakow 2008, Poland Adres słuŝbowy Autora: Mgr inŝ. Krzysztof Szklanny Polsko-Japońska WyŜsza Szkoła Technik Komputerowych ul. Koszykowa Warszawa tel. (022) fax (022) kszklanny@pjwstk.edu.pl 240

Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan

Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan Synteza mowy System przetwarzania tekstu pisanego na mowę Text-to-Speech (TTS) TTS powinien być w stanie przeczytać

Bardziej szczegółowo

Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA

Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA 1 Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA MBROLA.Creating the

Bardziej szczegółowo

Transkrypcja fonetyczna i synteza mowy. Jolanta Bachan

Transkrypcja fonetyczna i synteza mowy. Jolanta Bachan Transkrypcja fonetyczna i synteza mowy Jolanta Bachan IPA Międzynarodowy alfabet fonetyczny, MAF (ang. International Phonetic Alphabet, IPA) alfabet fonetyczny, system transkrypcji fonetycznej przyjęty

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12: KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie

Bardziej szczegółowo

Korpusy mowy i narzędzia do ich przetwarzania

Korpusy mowy i narzędzia do ich przetwarzania Korpusy mowy i narzędzia do ich przetwarzania Danijel Korzinek, Krzysztof Marasek Polsko-Japońska Akademia Technik Komputerowych Katedra Multimediów kmarasek@pjwstk.edu.pl danijel@pjwstk.edu.pl 2015-05-18

Bardziej szczegółowo

Opisy efektów kształcenia dla modułu

Opisy efektów kształcenia dla modułu Karta modułu - Technologia mowy 1 / 5 Nazwa modułu: Technologia mowy Rocznik: 2012/2013 Kod: RIA-1-504-s Punkty ECTS: 7 Wydział: Inżynierii Mechanicznej i Robotyki Poziom studiów: Studia I stopnia Specjalność:

Bardziej szczegółowo

Rozpoznawanie mowy dla języków semickich. HMM - HTK, CMU SPHINX-4, Simon

Rozpoznawanie mowy dla języków semickich. HMM - HTK, CMU SPHINX-4, Simon Rozpoznawanie mowy dla języków semickich HMM - HTK, CMU SPHINX-4, Simon Charakterystyka języków semickich Przykłady: arabski, hebrajski, amharski, tigrinia, maltański (280 mln użytkowników). Budowa spółgłoskowo

Bardziej szczegółowo

SYNTEZA MOWY W E-LEARNINGU DLA OSÓB NIEPEŁNOSPRAWNYCH

SYNTEZA MOWY W E-LEARNINGU DLA OSÓB NIEPEŁNOSPRAWNYCH SYNTEZA MOWY W E-LEARNINGU DLA OSÓB NIEPEŁNOSPRAWNYCH Krzysztof Szklanny kszklanny@pjwstk.edu.pl Polsko-Japońska Wyższa Szkoła Technik Komputerowych Słowa kluczowe:

Bardziej szczegółowo

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Pomiary w technice studyjnej. TESTY PESQ i PEAQ Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne

Bardziej szczegółowo

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Rozpoznawanie obrazów

Rozpoznawanie obrazów Rozpoznawanie obrazów Laboratorium Python Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, M. Zięba, J. Kaczmar Cel zadania Celem zadania jest implementacja liniowego zadania

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z liniowym zadaniem najmniejszych

Bardziej szczegółowo

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego

Bardziej szczegółowo

ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1)

ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1) ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL 1. Problem Rozważmy układ dwóch równań z dwiema niewiadomymi (x 1, x 2 ): 1 x1 sin x2 x2 cos x1 (1) Nie jest

Bardziej szczegółowo

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH InŜynieria Rolnicza 14/2005 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH Streszczenie W

Bardziej szczegółowo

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL 1 / 20 Korpusy i w Clarin-PL Krzysztof Marasek, Danijel Koržinek, Łukasz Brocki, Krzysztof Wołk Polsko-Japońska Akademia Technik Komputerowych 2 / 20 Plan prezentacji 1 2 3 / 20 4 / 20 Motywacja Brak darmowych

Bardziej szczegółowo

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL 1 / 21 Korpusy i w Clarin-PL Danijel Koržinek i Łukasz Brocki Polsko-Japońska Akademia Technik Komputerowych 3 lutego 2017 r., Łódź 2 / 21 3 / 21 Motywacja Brak darmowych ogólnodostępnych korpusów komercyjne:

Bardziej szczegółowo

XII International PhD Workshop OWD 2010, 23 26 October 2010. Metodyka pozyskiwania i analizy wyników badań symulacyjnych ścieżek klinicznych

XII International PhD Workshop OWD 2010, 23 26 October 2010. Metodyka pozyskiwania i analizy wyników badań symulacyjnych ścieżek klinicznych XII International PhD Workshop OWD 2010, 23 26 October 2010 Metodyka pozyskiwania i analizy wyników badań symulacyjnych ścieżek klinicznych Methodology of Acquiring and Analyzing Results of Simulation

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

Podstawy Przetwarzania Sygnałów

Podstawy Przetwarzania Sygnałów Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech

Bardziej szczegółowo

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania

Bardziej szczegółowo

Algorytm genetyczny (genetic algorithm)-

Algorytm genetyczny (genetic algorithm)- Optymalizacja W praktyce inżynierskiej często zachodzi potrzeba znalezienia parametrów, dla których system/urządzenie będzie działać w sposób optymalny. Klasyczne podejście do optymalizacji: sformułowanie

Bardziej szczegółowo

Porównanie wyników symulacji wpływu kształtu i amplitudy zakłóceń na jakość sterowania piecem oporowym w układzie z regulatorem PID lub rozmytym

Porównanie wyników symulacji wpływu kształtu i amplitudy zakłóceń na jakość sterowania piecem oporowym w układzie z regulatorem PID lub rozmytym ARCHIVES of FOUNDRY ENGINEERING Published quarterly as the organ of the Foundry Commission of the Polish Academy of Sciences ISSN (1897-3310) Volume 15 Special Issue 4/2015 133 138 28/4 Porównanie wyników

Bardziej szczegółowo

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka Synteza mowy opracowanie: mgr inż. Kuba Łopatka Synteza mowy (ang. TTS - Text-To-Speech ) zamiana tekstu w formie pisanej na sygnał akustyczny, którego brzmienie naśladuje brzmienie ludzkiej mowy. Podstawowe

Bardziej szczegółowo

Rozpoznawanie mowy za pomocą HTK

Rozpoznawanie mowy za pomocą HTK Kinga Frydrych Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna, rok III, 2013/2014 Sprawozdanie z ćwiczeń laboratoryjnych z Technologii mowy Rozpoznawanie mowy za pomocą HTK 1. Opis gramatyki

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora.

Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora. Wprowadzenie do programu RapidMiner Studio 7.6, część 7 Podstawy metod wyboru atrybutów w problemach klasyfikacyjnych, c.d. Michał Bereta www.michalbereta.pl Wybór / ocena atrybutów na podstawie oceny

Bardziej szczegółowo

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji

Bardziej szczegółowo

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Bardziej szczegółowo

Część I. Pomiar drgań własnych pomieszczenia

Część I. Pomiar drgań własnych pomieszczenia LABORATORIUM INśYNIERII DŹWIĘKU 2 ĆWICZENIE NR 10 Część I. Pomiar drgań własnych pomieszczenia I. Układ pomiarowy II. Zadania do wykonania 1. Obliczyć promień krytyczny pomieszczenia, przy załoŝeniu, Ŝe

Bardziej szczegółowo

Zadania laboratoryjne i projektowe - wersja β

Zadania laboratoryjne i projektowe - wersja β Zadania laboratoryjne i projektowe - wersja β 1 Laboratorium Dwa problemy do wyboru (jeden do realizacji). 1. Water Jug Problem, 2. Wieże Hanoi. Water Jug Problem Ograniczenia dla każdej z wersji: pojemniki

Bardziej szczegółowo

Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach

Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach Adam Stawowy Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach Summary: We present a meta-heuristic to combine Monte Carlo simulation with genetic algorithm for Capital

Bardziej szczegółowo

ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2014 Seria: TRANSPORT z. 82 Nr kol. 1903

ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2014 Seria: TRANSPORT z. 82 Nr kol. 1903 ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2014 Seria: TRANSPORT z. 82 Nr kol. 1903 Piotr FOLĘGA 1 DOBÓR ZĘBATYCH PRZEKŁADNI FALOWYCH Streszczenie. Różnorodność typów oraz rozmiarów obecnie produkowanych zębatych

Bardziej szczegółowo

Ewaluacja mowy syntetycznej za pomocą systemu rozpoznawania mowy

Ewaluacja mowy syntetycznej za pomocą systemu rozpoznawania mowy za pomocą systemu rozpoznawania mowy Jolanta Bachan Tomasz Kuczmarski Piotr Francuzik Rozpoznawanie mowy i mówców 17-18 września 2012 Poznań Cel Eksperymentalna ocena mowy syntetycznej za pomocą systemu

Bardziej szczegółowo

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka NeuroVoice Synteza i analiza mowy Paweł Mrówka pawel.mrowka@neurosoft.pl Plan prezentacji Synteza mowy - SynTalk Wprowadzenie do syntezy konkatenacyjnej Zastosowanie analizy językowej tekstu MoŜliwości

Bardziej szczegółowo

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2 InŜynieria Rolnicza 14/2005 Michał Cupiał, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza im. Hugona Kołłątaja w Krakowie DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY

Bardziej szczegółowo

XIII International PhD Workshop OWD 2011, October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH

XIII International PhD Workshop OWD 2011, October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH XIII International PhD Workshop OWD 2011, 22 25 October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH METHOD OF REEINGINEERING ORGANIZATION USING BUSINESS PROCESS

Bardziej szczegółowo

Program warsztatów CLARIN-PL

Program warsztatów CLARIN-PL W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19

Bardziej szczegółowo

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 9: Inference in Structured Prediction 1 intro (1 lecture) Roadmap deep learning for NLP (5 lectures) structured prediction

Bardziej szczegółowo

Omówienie różnych metod rozpoznawania mowy

Omówienie różnych metod rozpoznawania mowy Omówienie różnych metod rozpoznawania mowy Na podstawie artykułu: Comparative study of automatic speech recognition techniques Beniamin Sawicki Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna

Bardziej szczegółowo

Optymalizacja optymalizacji

Optymalizacja optymalizacji 7 maja 2008 Wstęp Optymalizacja lokalna Optymalizacja globalna Algorytmy genetyczne Badane czasteczki Wykorzystane oprogramowanie (Algorytm genetyczny) 2 Sieć neuronowa Pochodne met-enkefaliny Optymalizacja

Bardziej szczegółowo

Optymalizacja Automatycznych Testów Regresywnych

Optymalizacja Automatycznych Testów Regresywnych Optymalizacja Automatycznych Testów Regresywnych W Organizacji Transformującej do Agile Adam Marciszewski adam.marciszewski@tieto.com Agenda Kontekst projektu Typowe podejście Wyzwania Cel Założenia Opis

Bardziej szczegółowo

NIEPEWNOŚĆ POMIARÓW POZIOMU MOCY AKUSTYCZNEJ WEDŁUG ZNOWELIZOWANEJ SERII NORM PN-EN ISO 3740

NIEPEWNOŚĆ POMIARÓW POZIOMU MOCY AKUSTYCZNEJ WEDŁUG ZNOWELIZOWANEJ SERII NORM PN-EN ISO 3740 PRACE INSTYTUTU TECHNIKI BUDOWLANEJ - KWARTALNIK BUILDING RESEARCH INSTITUTE - QUARTERLY 2 (162) 2012 ARTYKUŁY - REPORTS Anna Iżewska* NIEPEWNOŚĆ POMIARÓW POZIOMU MOCY AKUSTYCZNEJ WEDŁUG ZNOWELIZOWANEJ

Bardziej szczegółowo

SYSTEM MONITOROWANIA DECYZYJNEGO STANU OBIEKTÓW TECHNICZNYCH

SYSTEM MONITOROWANIA DECYZYJNEGO STANU OBIEKTÓW TECHNICZNYCH Aleksander JASTRIEBOW 1 Stanisław GAD 2 Radosław GAD 3 monitorowanie, układ zasilania w paliwo, diagnostyka SYSTEM MONITOROWANIA DECYZYJNEGO STANU OBIEKTÓW TECHNICZNYCH Praca poświęcona przedstawieniu

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia

Bardziej szczegółowo

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1 Spis treści 1. Cyfrowy zapis i synteza dźwięku... 2 2. Schemat blokowy i zadania karty dźwiękowej... 4 UTK. Karty dźwiękowe. 1 1. Cyfrowy zapis i synteza dźwięku Proces kodowania informacji analogowej,

Bardziej szczegółowo

ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN

ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 37, s. 141-146, Gliwice 2009 ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN KRZYSZTOF HERBUŚ, JERZY ŚWIDER Instytut Automatyzacji Procesów

Bardziej szczegółowo

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie

Bardziej szczegółowo

Sprawozdanie z laboratoriów HTK!

Sprawozdanie z laboratoriów HTK! Inżynieria akustyczna - Technologia mowy 2013 Błażej Chwiećko Sprawozdanie z laboratoriów HTK! 1. Przeznaczenie tworzonego systemu! Celem było stworzenie systemu służącego do sterowania samochodem. Zaimplementowane

Bardziej szczegółowo

PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM

PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,

Bardziej szczegółowo

Polcode Code Contest PHP-10.09

Polcode Code Contest PHP-10.09 Polcode Code Contest PHP-10.09 Przedmiotem konkursu jest napisanie w języku PHP programu, którego wykonanie spowoduje rozwiązanie zadanego problemu i wyświetlenie rezultatu. Zadanie konkursowe Celem zadania

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

Algorytmy genetyczne

Algorytmy genetyczne 9 listopada 2010 y ewolucyjne - zbiór metod optymalizacji inspirowanych analogiami biologicznymi (ewolucja naturalna). Pojęcia odwzorowujące naturalne zjawiska: Osobnik Populacja Genotyp Fenotyp Gen Chromosom

Bardziej szczegółowo

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod

Bardziej szczegółowo

Microsoft EXCEL SOLVER

Microsoft EXCEL SOLVER Microsoft EXCEL SOLVER 1. Programowanie liniowe z wykorzystaniem dodatku Microsoft Excel Solver Cele Po ukończeniu tego laboratorium słuchacze potrafią korzystając z dodatku Solver: formułować funkcję

Bardziej szczegółowo

Tom 6 Opis oprogramowania

Tom 6 Opis oprogramowania Część 4 Narzędzie do wyliczania wielkości oraz wartości parametrów stanu Diagnostyka stanu nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 30 maja 2012 Historia dokumentu Nazwa

Bardziej szczegółowo

FOLIA POMERANAE UNIVERSITATIS TECHNOLOGIAE STETINENSIS Folia Pomer. Univ. Technol. Stetin. 2009, Oeconomica 275 (57), 53 58

FOLIA POMERANAE UNIVERSITATIS TECHNOLOGIAE STETINENSIS Folia Pomer. Univ. Technol. Stetin. 2009, Oeconomica 275 (57), 53 58 FOLIA POMERANAE UNIVERSITATIS TECHNOLOGIAE STETINENSIS Folia Pomer. Univ. Technol. Stetin. 2009, Oeconomica 275 (57), 53 58 Anna LANDOWSKA ROZWIĄZANIE PROBLEMU OPTYMALNEGO PRZYDZIAŁU ZA POMOCĄ KLASYCZNEGO

Bardziej szczegółowo

Transpozer czasowy mowy

Transpozer czasowy mowy Transpozer czasowy mowy Politechnika Gdańska ul. Narutowicza 11/12 80-233 Gdańsk www.pg.gda.pl 1. Wprowadzenie Transpozer czasowy mowy został opracowany w celu wspierania rozumienia mowy przez osoby z

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

7. Identyfikacja defektów badanego obiektu

7. Identyfikacja defektów badanego obiektu 7. Identyfikacja defektów badanego obiektu Pierwszym krokiem na drodze do identyfikacji defektów było przygotowanie tzw. odcisku palca poszczególnych defektów. W tym celu został napisany program Gaussian

Bardziej szczegółowo

Dobór parametrów algorytmu ewolucyjnego

Dobór parametrów algorytmu ewolucyjnego Dobór parametrów algorytmu ewolucyjnego 1 2 Wstęp Algorytm ewolucyjny posiada wiele parametrów. Przykładowo dla algorytmu genetycznego są to: prawdopodobieństwa stosowania operatorów mutacji i krzyżowania.

Bardziej szczegółowo

Technologia mowy i języka Speech and Language Technology, Vol. 3

Technologia mowy i języka Speech and Language Technology, Vol. 3 Fonetyczna struktura materiału testowego stosowanego w subiektywnych pomiarach jakości mowy Phonetic structure of test material used in subjective measurements of speech quality Stefan Brachmański, Piotr

Bardziej szczegółowo

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych... Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe

Bardziej szczegółowo

OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA

OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2008 Seria: TRANSPORT z. 64 Nr kol. 1803 Rafał SROKA OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA Streszczenie. W

Bardziej szczegółowo

Nadajemy pracy sens. Raport Zbiorczy ANALIZA RENTOWNOŚCI. Klient / Klient testowy

Nadajemy pracy sens. Raport Zbiorczy ANALIZA RENTOWNOŚCI. Klient / Klient testowy Raport Zbiorczy ANALIZA RENTOWNOŚCI Klient / Klient testowy Wygenerowano: 04/03/2016 Informacje o ValueView ValueView to pomiar rentowności zadań, stanowisk i komórek organizacyjnych. Rentowność rozumiana

Bardziej szczegółowo

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 8. Filtracja uśredniająca i statystyczna.

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 8. Filtracja uśredniająca i statystyczna. Politechnika Świętokrzyska Laboratorium Cyfrowe przetwarzanie sygnałów Ćwiczenie 8 Filtracja uśredniająca i statystyczna. Cel ćwiczenia Celem ćwiczenia jest zdobycie umiejętności tworzenia i wykorzystywania

Bardziej szczegółowo

Lokalizacja Oprogramowania

Lokalizacja Oprogramowania mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji

Bardziej szczegółowo

HARMONOGRAM ORAZ INSTRUKCJE DWICZEO

HARMONOGRAM ORAZ INSTRUKCJE DWICZEO HARMONOGRAM ORAZ INSTRUKCJE DWICZEO O p ra c o wa n ie: dr inż. J er zy Sa w icki S z c z ec in 2008 WYKAZ DWICZEO LABORATORYJNYCH ORAZ HARMONOGRAM ZAJĘD TEMATY DWICZEO LABORATORYJNYCH (w nawiasach symboliczne

Bardziej szczegółowo

Strategie ewolucyjne. Gnypowicz Damian Staniszczak Łukasz Woźniak Marek

Strategie ewolucyjne. Gnypowicz Damian Staniszczak Łukasz Woźniak Marek Strategie ewolucyjne Gnypowicz Damian Staniszczak Łukasz Woźniak Marek Strategie ewolucyjne, a algorytmy genetyczne Podobieństwa: Oba działają na populacjach rozwiązań Korzystają z zasad selecji i przetwarzania

Bardziej szczegółowo

Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych

Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Politechnika Łódzka Streszczenie rozprawy doktorskiej Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach

Bardziej szczegółowo

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka L.p. Nazwisko i imię studenta Promotor Temat pracy magisterskiej 1. Wojciech Kłopocki dr Bartosz Ziemkiewicz Automatyczne

Bardziej szczegółowo

OPTYMALIZACJA ZBIORNIKA NA GAZ PŁYNNY LPG

OPTYMALIZACJA ZBIORNIKA NA GAZ PŁYNNY LPG Leon KUKIEŁKA, Krzysztof KUKIEŁKA, Katarzyna GELETA, Łukasz CĄKAŁA OPTYMALIZACJA ZBIORNIKA NA GAZ PŁYNNY LPG Streszczenie Praca dotyczy optymalizacji kształtu zbiornika toroidalnego na gaz LPG. Kryterium

Bardziej szczegółowo

Integracja systemu CAD/CAM Catia z bazą danych uchwytów obróbkowych MS Access za pomocą interfejsu API

Integracja systemu CAD/CAM Catia z bazą danych uchwytów obróbkowych MS Access za pomocą interfejsu API Dr inż. Janusz Pobożniak, pobozniak@mech.pk.edu.pl Instytut Technologii Maszyn i Automatyzacji produkcji Politechnika Krakowska, Wydział Mechaniczny Integracja systemu CAD/CAM Catia z bazą danych uchwytów

Bardziej szczegółowo

Tom 6 Opis oprogramowania

Tom 6 Opis oprogramowania Część 9 Narzędzie do wyliczania wskaźników statystycznych Diagnostyka Stanu Nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 31 maja 2012 Historia dokumentu Nazwa dokumentu Nazwa

Bardziej szczegółowo

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości

Bardziej szczegółowo

Wykrywanie sygnałów DTMF za pomocą mikrokontrolera ATmega 328 z wykorzystaniem algorytmu Goertzela

Wykrywanie sygnałów DTMF za pomocą mikrokontrolera ATmega 328 z wykorzystaniem algorytmu Goertzela Politechnika Poznańska Wydział Informatyki Kierunek studiów: Automatyka i Robotyka Wykrywanie sygnałów DTMF za pomocą mikrokontrolera ATmega 328 z wykorzystaniem algorytmu Goertzela Detection of DTMF signals

Bardziej szczegółowo

Akademia Morska w Szczecinie. Wydział Mechaniczny

Akademia Morska w Szczecinie. Wydział Mechaniczny Akademia Morska w Szczecinie Wydział Mechaniczny ROZPRAWA DOKTORSKA mgr inż. Marcin Kołodziejski Analiza metody obsługiwania zarządzanego niezawodnością pędników azymutalnych platformy pływającej Promotor:

Bardziej szczegółowo

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem

Bardziej szczegółowo

5. Administracja kontami uŝytkowników

5. Administracja kontami uŝytkowników 5. Administracja kontami uŝytkowników Windows XP, w porównaniu do systemów Windows 9x, znacznie poprawia bezpieczeństwo oraz zwiększa moŝliwości konfiguracji uprawnień poszczególnych uŝytkowników. Natomiast

Bardziej szczegółowo

Moduł mapowania danych

Moduł mapowania danych Moduł mapowania danych Styczeń 2011 Wszelkie prawa zastrzeżone. Dokument może być reprodukowany lub przechowywany bez ograniczeń tylko w całości. W przeciwnym przypadku, żadna część niniejszego dokumentu,

Bardziej szczegółowo

InŜynieria Rolnicza 14/2005. Streszczenie

InŜynieria Rolnicza 14/2005. Streszczenie Michał Cupiał Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza w Krakowie PROGRAM WSPOMAGAJĄCY NAWOśENIE MINERALNE NAWOZY 2 Streszczenie Przedstawiono program Nawozy 2 wspomagający nawoŝenie

Bardziej szczegółowo

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury

Bardziej szczegółowo

PROGRAM DOBORU WYMIENNIKÓW CIEPŁA FIRMY SECESPOL CAIRO 3.2 PODRĘCZNIK UŻYTKOWNIKA

PROGRAM DOBORU WYMIENNIKÓW CIEPŁA FIRMY SECESPOL CAIRO 3.2 PODRĘCZNIK UŻYTKOWNIKA PROGRAM DOBORU WYMIENNIKÓW CIEPŁA FIRMY SECESPOL CAIRO 3.2 PODRĘCZNIK UŻYTKOWNIKA SPIS TREŚCI 1. Przegląd możliwości programu 1 1.1. Okno główne 1 1.2. Podstawowe funkcje 1 1.2.1. Wprowadzanie danych 1

Bardziej szczegółowo

Krzysztof Kadowski. PL-E3579, PL-EA0312,

Krzysztof Kadowski. PL-E3579, PL-EA0312, Krzysztof Kadowski PL-E3579, PL-EA0312, kadowski@jkk.edu.pl Bazą danych nazywamy zbiór informacji w postaci tabel oraz narzędzi stosowanych do gromadzenia, przekształcania oraz wyszukiwania danych. Baza

Bardziej szczegółowo

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Wykrywanie twarzy na zdjęciach przy pomocy kaskad Wykrywanie twarzy na zdjęciach przy pomocy kaskad Analiza i przetwarzanie obrazów Sebastian Lipnicki Informatyka Stosowana,WFIIS Spis treści 1. Wstęp... 3 2. Struktura i funkcjonalnośd... 4 3. Wyniki...

Bardziej szczegółowo

Nadajemy pracy sens. Raport Zbiorczy ANALIZA RENTOWNOŚCI. Klient / Klient testowy

Nadajemy pracy sens. Raport Zbiorczy ANALIZA RENTOWNOŚCI. Klient / Klient testowy Raport Zbiorczy ANALIZA RENTOWNOŚCI Klient / Klient testowy Wygenerowano: 04/03/2016 Wstęp Najważniejsze informacje o ValueView ValueView to metodologia pomiaru rentowności zadań, stanowisk i komórek organizacyjnych.

Bardziej szczegółowo

Laboratorium przedmiotu Technika Cyfrowa

Laboratorium przedmiotu Technika Cyfrowa Laboratorium przedmiotu Technika Cyfrowa ćw.3 i 4: Asynchroniczne i synchroniczne automaty sekwencyjne 1. Implementacja asynchronicznych i synchronicznych maszyn stanu w języku VERILOG: Maszyny stanu w

Bardziej szczegółowo

Analiza stanów gry na potrzeby UCT w DVRP

Analiza stanów gry na potrzeby UCT w DVRP Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527 Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza

Bardziej szczegółowo

W poszukiwaniu sensu w świecie widzialnym

W poszukiwaniu sensu w świecie widzialnym W poszukiwaniu sensu w świecie widzialnym Andrzej Śluzek Nanyang Technological University Singapore Uniwersytet Mikołaja Kopernika Toruń AGH, Kraków, 28 maja 2010 1 Podziękowania Przedstawione wyniki powstały

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

REFERAT PRACY DYPLOMOWEJ

REFERAT PRACY DYPLOMOWEJ REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i implementacja środowiska do automatyzacji przeprowadzania testów aplikacji internetowych w oparciu o metodykę Behavior Driven Development. Autor: Stepowany

Bardziej szczegółowo

Segmentacja akustycznej bazy językowej na potrzeby realizacji korpusowej syntezy mowy w systemie Festival

Segmentacja akustycznej bazy językowej na potrzeby realizacji korpusowej syntezy mowy w systemie Festival Katedra Multimediów Michał Wójtowski Nr albumu s1773 Segmentacja akustycznej bazy językowej na potrzeby realizacji korpusowej syntezy mowy w systemie Festival Praca magisterska napisana pod kierunkiem

Bardziej szczegółowo

Uczenie sieci typu MLP

Uczenie sieci typu MLP Uczenie sieci typu MLP Przypomnienie budowa sieci typu MLP Przypomnienie budowy neuronu Neuron ze skokową funkcją aktywacji jest zły!!! Powszechnie stosuje -> modele z sigmoidalną funkcją aktywacji - współczynnik

Bardziej szczegółowo

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski Akustyka mowy wprowadzenie Opracował: dr inż. Piotr Suchomski Kontakt Katedra Systemów Multimedialnych Wydział ETI dr inż. Piotr M. Suchomski, pok. EA 730 e-mail: pietka@sound.eti.pg.gda.pl tel. 23-01

Bardziej szczegółowo

GIS w nauce. Poznań 01-03.06.2015. Analiza obiektowa (GEOBIA) obrazów teledetekcyjnych pod kątem detekcji przemian środowiska. mgr inż.

GIS w nauce. Poznań 01-03.06.2015. Analiza obiektowa (GEOBIA) obrazów teledetekcyjnych pod kątem detekcji przemian środowiska. mgr inż. GIS w nauce Poznań 01-03.06.2015 Analiza obiektowa (GEOBIA) obrazów teledetekcyjnych pod kątem detekcji przemian środowiska mgr inż. Paweł Hawryło dr hab. inż. Piotr Wężyk dr inż. Marta Szostak Laboratorium

Bardziej szczegółowo