METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI

Podobne dokumenty
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

KODOWANIE I KOMPRESJA SYGNAŁU MOWY

Analogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, )

Wybrane algorytmu kompresji dźwięku

1 ALGORYTMY KODOWANIA ŹRÓDŁOWEGO MOWY

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Kompresja dźwięku w standardzie MPEG-1

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

dr inż. Artur Janicki pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Przesył mowy przez internet

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

dr hab. inż. Artur Janicki pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW

KOMPRESJA STRATNA DŹWIĘKU

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik

MODULACJE IMPULSOWE. TSIM W10: Modulacje impulsowe 1/22

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Technika audio część 2

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Kwantyzacja wektorowa. Kodowanie różnicowe.

Jakości usług telekomunikacyjnych

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

PODSTAWY TELEKOMUNIKACJI Egzamin I (za każde polecenie - 6 punktów)

Klasyfikacja mówców oparta na modelowaniu GMM-UBM dla mowy o różnej jakości

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry Pojęcia podstawowe Klasyfikacja sygnałów

PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Jakość transmisji multimedialnej. Opracowanie: Marcin Szykulski

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Zaawansowane algorytmy DSP

Program wykładu. informatyka + 2

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.

TEORIA WYTWARZANIA DŹWIĘKÓW

METODY OCENY JAKOŚCI DŹWIĘKU

Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego

Projektowanie układów scalonych do systemów komunikacji bezprzewodowej

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski

5/25/2017. Elementy teorii informacji. Co to jest informacja? Słownik Języka Polskiego: Elementy teorii informacji

Zalecane ustawienia przepływności bitowej dla różnych typów kodeka dla kamer serii i7-c, i7-p oraz i5-c

Teoria przetwarzania A/C i C/A.

WPŁYW PRÓBKOWANIA I KWANTYZACJI NA JAKOŚĆ DŹWIĘKU

Kompresja cyfrowych sygnałów fonicznych z łącznym wykorzystaniem rozszerzania widma i modelowania

Wybrane metody kompresji obrazów

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Przykładowe zadanie praktyczne

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka

NADESŁANE ARTYKUŁY METODY OCENY JAKOŚCI DŹWIĘKU W TELEFONII VOICE OVER IP

PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI.

Przykładowe rozwiązanie zadania dla zawodu technik telekomunikacji

Przekształcenia sygnałów losowych w układach

Konfiguracja kodeka 3ivx 4.5.1

Wielokanałowe systemy kodowania dźwięku

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

ADAPTACYJNE PRZETWARZANIE SYGNAŁÓW LABORATORIUM. Ćwiczenie 4. Wybrane telekomunikacyjne zastosowania algorytmów adaptacyjnych

Przetwarzanie sygnałów w telekomunikacji

Wytwarzanie znaku wodnego w czasie rzeczywistym

Kodowanie podpasmowe

MODULACJA. Definicje podstawowe, cel i przyczyny stosowania modulacji, rodzaje modulacji. dr inż. Janusz Dudczyk

PL B1. Sposób i układ do modyfikacji widma sygnału ultraszerokopasmowego radia impulsowego. POLITECHNIKA GDAŃSKA, Gdańsk, PL

Cechy karty dzwiękowej

Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku

PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199

Algorytmy detekcji częstotliwości podstawowej

Krzysztof Włostowski pok. 467 tel

Percepcyjne kodowanie dźwięku

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Karta dźwiękowa. Architektura systemów komputerowych Ćwiczenie 3

Semantyczne kodowanie mowy przy bardzo małych prędkościach transmisji.

Instytut Telekomunikacji Wydział Elektroniki i Technik Informacyjnych.

JAKOŚĆ USŁUG TELEKOMUNIKACYJNYCH. Sławomir Kula Przemysław Dymarski Marcin Golański

KARTA DO CENTRAL: MICRA, SIGMA I OPTIMA. ver xx

Instytut Telekomunikacji Wydział Elektroniki i Technik Informacyjnych.

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

Systemy i Sieci Radiowe

Kompresja danych DKDA (7)

Przetwornik analogowo-cyfrowy

Sygnały, media, kodowanie

Percepcja dźwięku. Narząd słuchu

Badanie jakości sygnałów audio

Formaty plików audio

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Transkrypt:

METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI Maciej Kulesza pok. 726 Katedra Systemów Multimedialnych Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody kodowania typu waveform Porównanie jakości kodowania uzyskiwanej dla poszczególnych algorytmów Szerokopasmowe kodowanie sygnału mowy Przyszłość kodeków dla zastosowań w telekomunikacji Podsumowanie 1

Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody kodowania typu waveform Porównanie jakości kodowania uzyskiwanej dla poszczególnych algorytmów Szerokopasmowe kodowanie sygnału mowy Przyszłość kodeków dla zastosowań w telekomunikacji Podsumowanie Właściwości sygnału mowy Widmo sygnału mowy posiada strukturę formantową Jakie pasmo posiada sygnał mowy? W paśmie do 300-3400 Hz występują 3-4 formanty sygnału mowy, które posiadają znaczący wpływ na zrozumiałość Pełne pasmo sygnału mowy obejmuje częstotliwości od około 50 Hz do 14 khz 2

Właściwości sygnału mowy W sygnale mowy możemy wyróżnić zasadniczo trzy części składowe: Składowe dźwięczne (np. samogłoski) Składowe bezdźwięczne (np. sz, s, itp.) Stany transjentowe (stanowią sumę składowych dźwięcznych i bezdźwięcznych) Składowe dźwięczne sygnału mowy mają strukturę harmoniczną Możliwe jest zatem wyznaczenie częstotliwości podstawowej sygnału harmonicznego Właściwości kodeków mowy Parametry określające właściwości kodeków mowy Wymagana przepływność strumienia bitowego Opóźnienie wprowadzane przez algorytm i jego złożoność (MIPS, WMOPS) Pasmo kodowanej mowy Zrozumiałość -> badana z wykorzystaniem list logatomowych (zrównoważone fonetycznie sekwencje pozbawione znaczenia semantycznego) Jakość sygnału mowy wyrażona w skali MOS (Mean Opinion Score) -> określane w wyniku przeprowadzenia testów subiektywnych (oceny 1-5) 3

Właściwości kodeków mowy Przeprowadzanie testów subiektywnych mających na celu określenie jakości kodowania sygnału mowy przez poszczególne algorytmy jest uciążliwe ITU-T P. 862 - automatyczna metoda oceny jakości sygnału mowy PESQ (Perceptual Evaluation os Speech Quality) Wyniki uzyskiwane w skali PESQ są skorelowane z wynikami uzyskiwanymi w wyniku testów subiektywnych (MOS) i dlatego mogą być stosowane zamiennie Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody kodowania typu waveform Porównanie jakości kodowania uzyskiwanej dla poszczególnych algorytmów Szerokopasmowe kodowanie sygnału mowy Przyszłość kodeków dla zastosowań w telekomunikacji Podsumowanie 4

Metody kodowania typu waveform Kodowaniu podlegają wartości próbek sygnału PCM (Pulse Code Modulation) 8000*16=128 kbps u-law/a-law (PCM) > G.711 Sygnał o rozdzielczości 14-bitowej poddawany jest kompresji w koderze i kodowany na 8 bitach (nieliniowa kwantyzacja)-> 8000*8=64 kbps Metody kodowania typu waveform ADPCM (Adaptive Differential PCM) -> G.726 Wartości próbek sygnału mowy są ze sobą skorelowane Możliwe jest zatem dokonywanie predykcji wartości próbki następnej na podstawie próbek poprzedzających Kodowaniu podlega sygnał błędu obliczany jako różnica pomiędzy sygnałem wejściowym a predykowanym Dostępne przepływności: 40, 32, 24 kbps Największej degradacji podlegają transjenty 5

Perceptualny ADPCM Sygnał filtrowany wstępnie zgodnie z charakterystyką odpowiadającą estymowanemu progowi słyszenia input signal PRE-FILTER QUANTIZER LOSSLESS ENCODER LOSSLESS DECODER INVERSE QUANTIZER POST-FILTER decoded signal PSYCHOACOUSTIC MODEL Irrelevance reduction Redundancy reduction Metody kodowania typu waveform Metody w których kodowaniu podlegają wartości próbek sygnału: Pozwalają na uzyskanie wysokiej jakości sygnału mowy Wymagają łączy zapewniających stosunkowe szerokie pasmo Wprowadzają marginalne opóźnienie w procesie kodowania (rzędu pojedynczych milisekund) Nie wymagają dużej mocy obliczeniowej 6

Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody kodowania typu waveform Porównanie jakości kodowania uzyskiwanej dla poszczególnych algorytmów Szerokopasmowe kodowanie sygnału mowy Przyszłość kodeków dla zastosowań w telekomunikacji Podsumowanie bazują na odpowiednim modelu sygnału mowy Model uwzględnia sygnał pobudzenia oraz filtr o zmiennej w czasie charakterystyce częstotliwościowej Przepływność Zrozumiałość/Jakość 7

W dekoderze sygnał mowy jest syntetyzowany na podstawie grupy przesłanych parametrów Excitation { parameters } EXCITATION GENERATOR excitation signal Vocal tract { parameters } LINEAR SYSTEM speech signal Możemy wyróżnić kilka głównych grup metod parametrycznych LPC10 (Linear Predictive Codec) MELP (Mixed-Excited Linear Prediction) MP/RPE-LP (Multi-Pulse/Regular Pulse Excited LP) CELP (Code Excited Linear Prediction) Przepływność Zrozumiałość/Jakość (LPC-10) Każda ramka sygnału jest klasyfikowana jako dźwięczna bądź bezdźwięczna Dla ramek dźwięcznych sygnałem modelującym jest ciąg impulsów generowanych na podstawie informacji o częstotliwości podstawowej tonu krtaniowego Ramki bezdźwięczne syntetyzowane są z wykorzystaniem generatora szumu białego Przepływność Zrozumiałość/Jakość 8

(MELP - Mixed Excited Linear Prediction) Sygnał dzielony jest na kilka podpasm (zwykle 5) Dla każdego z podpasm sygnał pobudzenia określany jest jako suma sygnału generowanego na podstawie częstotliwości tonu krtaniowego oraz szumu Struktura harmoniczna może być celowo zaburzana w celu wierniejszego odzwierciedlenia stanów transjentowych Przepływność Zrozumiałość/Jakość (MP/RPE-LP -> Multi-Pulse/Regular Pulse Excited) MP sygnał pobudzenia modelowany jako sekwencja impulsów, których położenie na osi czasu nie jest ograniczone (10 do 12 impulsów dla 10 ms sygnału) RPE sygnał pobudzenia modelowany jest jako sekwencja impulsów, przy czym odległości pomiędzy nimi są stałe (10 do 12 impulsów dla 5 ms sygnału) Położenie na osi czasu impulsów dobierane jest zwykle na zasadzie analysis-by-synthesis Przepływność Zrozumiałość/Jakość 9

(CELP - Code Excited Linear Prediction) Zamiast modelowania sygnału pobudzenia wykorzystywana jest książka kodowa, w której zapisane są określone sekwencje -> kodowanie wektorowe Wybór odpowiedniej sekwencji następuje na zasadzie analysis-by-synthesis Przepływność Zrozumiałość/Jakość (CELP - Code Excited Linear Prediction) Wybierana jest ta sekwencja dla której sygnał błędu wyznaczany jako różnica pomiędzy ramką sygnału oryginalnego i syntetyzowanego jest najmniejszy w sensie średniokwadratowym Indeks wybranej sekwencji z książki kodowej transmitowany jest do dekodera Przepływność Zrozumiałość/Jakość 10

(CELP - Code Excited Linear Prediction) Wyznaczony sygnał błędu jest perceptualnie ważony w celu wykorzystania zjawiska maskowania jednoczesnego Zrozumiałość/Jakość Przepływność (CELP - Code Excited Linear Prediction) Metody typu CELP należą do grupy najpopularniejszych kodeków wykorzystywanych w telekomunikacji G.723.1 MP-MLQ/ACELP (Multi Pulse/Algebraic CELP) -> 5.3/6.3 kbps G.728 LD-CELP (Low Delay-CELP) -> 9.6, 12.8, 16 kbps G.729 CS-ACELP (Conjugate Structure Algebraic CELP) -> 6.4, 8, 11.8 kbps GSM (AMR-NB) -> 4.75 12.2 kbps GSM FR (Full Rate) -> 12.2 kbps Przepływność Zrozumiałość/Jakość 11

Struktura koder G729 Porównanie jakości kodowania Zestawienie próbek zakodowanych algorytmami CELP/MELP jest dostępne poprzez -> http://www.signalogic.com 12

Porównanie jakości kodowania W celu dokładnego zbadania właściwości kodeka konieczne jest przeprowadzenie zestawu kompleksowych testów Kodowanie mowy w szumie (np. różne poziomy szumu samochodowego ) Określenie wpływu kodowanego języka na jakość (nie powinno być) Wpływ zjawisk związanych z transmisją w kanale telekomunikacyjnym na jakość (np. utrata pakietów) Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody kodowania typu waveform Porównanie jakości kodowania uzyskiwanej dla poszczególnych algorytmów Szerokopasmowe kodowanie sygnału mowy Przyszłość kodeków mowy Podsumowanie 13

Kodowanie szerokopasmowe Pasmo >4 khz ma również znaczący wpływ na zrozumiałość (nie jest możliwe odróżnienie f od s dla sygnału wąskopasmowego, można pomylić głos matki i córki, trudno jest dokładnie zanotować nieznane frazy) Możliwa jest prowadzenie swobodnej konwersacji Przepływność Zrozumiałość/Jakość BWE Bandwidth Extension Pomiędzy pasmem podstawowym a pasmem >4000 Hz występuje korelacja możliwe jest ślepa regeneracja pasma >4000 Hz -> słaba jakość Możliwe jest przesyłanie niewielkiej ilości dodatkowych danych, na podstawie których dekoder dokonuje syntezy pasma >4000 Hz\ Słuch jest bardziej czuły na wierne odwzorowanie obwiedni widma niż pobudzenia w paśmie >4000 Hz 14

BWE Bandwidth Extension Dla sygnału mowy można przyjąć prosty model pobudzenia w paśmie >4000 Hz w postaci szumu białego SBR (Spectral Band Replication) -> pobudzenie z pasma podstawowego wykorzystywane jest również w paśmie wyższym Metoda stosowana w kodeku AAC HE Metody nieliniowe inne Kodowanie szerokopasmowe Zwykle przyjmuje się następujący podział kodeków ze względu na pasmo kodowanej mowy: narrow band (do 4 khz) wideband (do 8kHz) ultra wideband (do 16 khz) W jaki sposób możliwe jest kodowanie sygnału mowy w szerokim paśmie? Przepływność Zrozumiałość/Jakość 15

PESQ 2010-04-12 Kodowanie szerokopasmowe Wielo-pasmowe kodowanie sygnału mowy z wykorzystaniem modułów CELP -> Speex (www.speex.org) Zrozumiałość/Jakość Przepływność Kodowanie szerokopasmowe (AMR-WB) G.722.2 AMR-WB (Adaptive Multi Rate-Wide Band) Algorytm oparty na architekturze ACELP (sygnał pobudzenia dobierany dla szerszego pasma) Koduje sygnał w paśmie od 50 do 7000 Hz Przepływność od 6.6 do 23.85 kbps (dla niższych przepływności kodeka więcej pasma przeznacza się na kodowania kanałowe) Standard dla telefonii stacjonarnej i bezprzewodowej 4,1 3,9 3,7 3,5 3,3 3,1 2,9 G723 G728 G729 AMRWB OggVorbis 2,7 5000 7000 9000 11000 13000 15000 17000 19000 21000 23000 25000 bitrate [bps] 16

Kodowanie szerokopasmowe (VMR-WB) VMR-WB (Variable Rate Multi-Mode Wideband) By zapewnić optymalną jakość przy zadanej średniej przepływności, chwilowa przepływność dostosowywana jest do charakteru kodowanego sygnału (0.8-13.3 kbps) Koder klasyfikuje ramki na puste (nie zawierające sygnału mowy, a jedynie szum tła) dźwięczne bezdźwięczne transjentowe Jeden z trybów pracy kodeka jest zgodny ze standardem AMR-WB (minimalna utraty jakości VMR-WB->AMR-WB) Standard telefonii CDMA2000 VMR-WB 17

VMR-WB 6000 4000 2000 0-2000 -4000-6000 0 1000 2000 3000 4000 5000 6000 Przyszłość kodeków mowy (AMR-WB+) Dotychczas stosowane kodeki mowy (CELP) bardzo słabo kodują sygnały muzyczne Nowoczesne kodeki mowy nie tylko kodują sygnał mowy w szerokim paśmie, ale również pozwalają na kodowanie z wysoką jakością sygnałów muzycznych Kodek wykorzystuje hybrydową architekturę ACELP/TCX http://www.voiceage.com 18

Kodek AMR-WB+ Kodek AMR-WB+ 19

Kodek G729.1 (G.729EV) Zbudowany w oparciu o wąskopasmowy kodek G.729 Adaptacyjny algorytm kodowania szerokopasmowego (50-7000 Hz, 8-32 kbps) Kodek hybrydowy CELP dla niskich przepływności, CELP wraz z kodowaniem widmowym dla wyższych przepływności Pozwala na kodowanie sygnału mowy oraz muzycznych (dla wyższych przepływności) G729.1 (8, 12 kbps) Dla niskich przepływności kodek zachowuje się jak zwykły kodek mowy G.729 20

G729.1 (14 kbps) Zastosowano metodę poszerzania widma sygnału z 4000 do 7000 Hz - TDBWE G729.1 (24-32 kbps) Predykcyjne kodowanie widmowe TDAC Sygnału rezydualnego kodeka CELP (50-4000 Hz) Sygnału w paśmie >4000 Hz 21

G729.1 (koder) Kodek G722.1C Kodek stanowi rozwinięcie algorytmu G729.1 Sygnał audio próbkowany z częstotliwości 32 khz kodowane pasmo zdublowane w stosunki do G729.1 (14 khz zamiast 7 khz) Celem było opracowanie algorytmu, który: Jest możliwe prosty obliczeniowo (wymaga niewielkiej mocy obliczeniowej procesora i pamięci) wprowadza niewielkie opóźnienie kodowania (algorytm do zastosowania w komunikacji głosowej) 22

Kodek G722.1C wprowadzane opóźnienie G.722.1C (ms) eaac+ (ms) AMR-WB+ (ms) 40.0 129.9 [1] 113. 8 [2] Kodek G722.1C złożoność obliczeniowa Bit rate G.722.1C eaac+ AMR-WB+ (kbit/s) (WMOPS) (WMOPS) (WMOPS) 24 9.7 40.8 80.1 32 10.3 42.6 86.7 23

Kodek G722.1C testy MUSHRA Reverberant Speech with Office Noise 5 4 3 2 1 24kbps 32kbps 48kbps 64kbps 0 G.722.1C AAC-LD AMR-WB+ eaac+ Kodek G722.1C testy MUSHRA Music and Mixed Content (48 kbps) 100 80 60 40 20 0 G.722.1C AAC-LD AAC-LD at 64kbps 24

Kodek MPEG RM0 Podsumowanie (co warto zapamiętać/wiedzieć) Zasadę działania kodeków opartych na algorytmie predykcji liniowej (model produkcji mowy: pobudzenie+filtr) Różnicę w architekturze kodeków LPC-10, MELP, CELP Czynniki, jakie należy wziąć pod uwagę przy wyborze kodeka oraz sposoby oceny jakości kodowania Wytłumaczyć zasadność kodowania sygnału mowy w szerokim paśmie Standardy kodowania szerokopasmowego i metody doboru przepływności w kodeku VMR-WB, AMR-WB+ 25