Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Podobne dokumenty
Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kompresja dźwięku w standardzie MPEG-1

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Kodowanie podpasmowe

Kompresja Danych. Streszczenie Studia Dzienne Wykład 13, f(t) = c n e inω0t, T f(t)e inω 0t dt.

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

O sygnałach cyfrowych

Przetwarzanie i transmisja danych multimedialnych. Wykład 9 Kodowanie podpasmowe. Przemysław Sękalski.

Technika audio część 2

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik

Program wykładu. informatyka + 2

Percepcja dźwięku. Narząd słuchu

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Kompresja sekwencji obrazów - algorytm MPEG-2

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Transformata Fouriera

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Technika audio część 1

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.

Wybrane metody kompresji obrazów

Percepcyjne kodowanie dźwięku

Kwantyzacja wektorowa. Kodowanie różnicowe.

Kompresja video (MPEG)

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Reprezentacje danych multimedialnych - dźwięk. 1. Podstawowe fakty 2. Próbkowanie 3. Kwantyzacja 4. Formaty plików

Konwersja dźwięku analogowego do postaci cyfrowej

Kompresja sekwencji obrazów

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

dr inż. Jacek Naruniec

Metody kodowania i przechowywania sygnałów dźwiękowych. Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl

PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH

Kompresja danych DKDA (7)

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych

Podstawy Przetwarzania Sygnałów

LABORATORIUM AUDIOLOGII I AUDIOMETRII

Kompresja obrazów w statycznych - algorytm JPEG

Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku

Akwizycja i przetwarzanie sygnałów cyfrowych

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ

Zastosowanie kompresji w kryptografii Piotr Piotrowski

x(n) x(n-1) x(n-2) D x(n-n+1) h N-1

cennik detaliczny , ,- seria wzmacniacz zintegrowany 1010 odtwarzacz CD

Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry Pojęcia podstawowe Klasyfikacja sygnałów

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Dźwięk podstawowe wiadomości technik informatyk

PROTOKÓŁ POMIAROWY - SPRAWOZDANIE

Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.

Kwantyzacja wektorowa. Plan 1. Zasada działania 2. Projektowanie. Algorytm LBG 3. Kwantyzatory strukturalne 4. Modyfikacje

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

Podstawowe funkcje przetwornika C/A

ZAŁĄCZNIK NR Cyfrowy mikser foniczny z wyposażeniem ilość 1 kpl.

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Zaawansowane algorytmy DSP

Wprowadzenie do cyfrowej obróbki dźwięku

Fundamentals of Data Compression

Przetwarzanie sygnałów

Przykładowe zadanie praktyczne

Cechy karty dzwiękowej

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

Wielokanałowe systemy kodowania dźwięku

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Technologie Informacyjne

Przetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski.

Modulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK)

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Przetwarzanie analogowo-cyfrowe sygnałów

RENDERING W CZASIE RZECZYWISTYM. Michał Radziszewski

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

08 Stereodekoder, korekcja barwy dźwięku.

MODULACJE IMPULSOWE. TSIM W10: Modulacje impulsowe 1/22

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

JAKOŚĆ USŁUG TELEKOMUNIKACYJNYCH. Sławomir Kula Przemysław Dymarski Marcin Golański

Kompresja video. Plan 1. Korelacje czasowe 2. Standardy wideokonferencji 3. Standardy MPEG 4. Video w sieci ATM

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI

Przesył mowy przez internet

dr inż. Artur Janicki pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW

Standardy zapisu i transmisji dźwięku

Konfiguracja kodeka 3ivx 4.5.1

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

Przetwornik analogowo-cyfrowy

Zalecane ustawienia zwrotnic i filtrów

(12) OPIS PATENTOWY (19) PL (11)

Realizacja regulatora PID w komputerze PC z kartą akwizycji danych. Opracował na podstawie dokumentacji dr inż. Jarosław Tarnawski

Transkrypt:

Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania transformacyjnego sztuczny podział na bloki. Problemy z rekonstrukcją na krawędziach bloków Tutaj: sposób rozdziału rozkład na róŝne pasma częstotliwościowe za pomocą filtrów cyfrowych Kodowanie kaŝdego pasma oddzielnie Główny obszar zastosowań: kodowanie mowy (G.722), dźwięku (MPEG audio)

Filtry Filtry układy słuŝące wyodrębnieniu składowych o odpowiednich częstotliwościach Charakterystyka filtra funkcja przenoszenia modułu Rodzaje filtrów: Dolnoprzepustowe Górnoprzepustowe Środkowoprzepustowe Filtry cyfrowe działają na ciągi liczb (zwykle są to próbki sygnału ciągłego). Minimalna wymagana częstość próbkowania Uogólnione tw. Nyquista: aby odtworzyć dokładnie sygnał, który zawiera składowe o częstotliwościach pomiędzy f 1 a f 2 naleŝy go próbkować z częstością 2* f f f p ( ) 2 1

Kodowanie podpasmowe algorytm

Koder Kodowanie podpasmowe działanie Sygnał wejściowy wchodzi na bank filtrów analizujących rozkład na podpasma Podpróbkowanie w stosunku (szerokość całego pasma):(szerokość podpasma) Zgodne z reguła Nyquista Ogranicza całkowitą ilość próbek Kodowane podpasm Mechanizm kodowania (DPCM, ADPCM, kwantyzacja; VLC) Sposób rozdziału bitów Przesyłanie zakodowanego sygnału

Kodowanie podpasmowe działanie c.d. Dekoder Dekodowanie w podpasmach Uzupełnianie (wstawienie odpowiedniej ilości zer pomiędzy próbkami) Podanie na filtry syntetyczne Sumowanie zrekonstruowanych sygnałów podpasm

Percepcja dźwięku Podstawowe fakty Zakres słyszalności: 20 Hz 20 khz, największa czułość w zakresie 2 4 khz Czułość na dźwięk jest funkcją częstotliwości Człowiek przetwarza dźwięk w pewnych podpasmach, zwanych pasmami krytycznymi. Cały zakres akustyczny około 24 pasm krytycznych Szerokość pasma krytycznego stała dla małych, rośnie dla częstości > 500 Hz

Maskowanie Polega na przesłanianiu wraŝenia brzmienia dźwięków przez inne sąsiadujące w dziedzinie częstotliwości lub czasu. Maskowanie jednoczesne (częstotliwościowe) Silniejszy dźwięk zakłóca współbrzmiące słabsze dźwięki o zbliŝonych częstotliwościach Efekt tym większy im mniejsza separacja w częstotliwości

Maskowanie c.d. Maskowanie niejednoczesne (czasowe) silny dźwięk maskuje inne juŝ poza jego czasem trwania Premasking moŝe trwać kilka kilkanaście milisekund Postmasking do 200 ms Premasking mocniejsze dźwięki są przetwarzane szybciej niŝ słabsze Postmasking wysycenie, długi czas relaksacji neuronów

Maskowanie c.d. Łączne działanie obu typów maskowania Maskowanie pozwala na opuszczenie części danych bez szkody dla jakości dźwięku Łączny opis progu czułości jako funkcji częstotliwości oraz wpływu maskowania model psychoakustyczny.

Standard MPEG Opracowany na początku lat 90-tych jako standard kodowania video Zawiera definicję standardu kodowania audio trzy odmiany (warstwy) o coraz większej złoŝoności Działanie oparte na: Kodowaniu podpasmowym Modelu psychoakustycznym słyszenia (przydział bitów)

MPEG audio - działanie Dopuszcza sygnał wejściowy próbkowanych 32, 44.1 lub 48 khz Pozwala na obsługę 1 lub 2 kanałów audio w trybach: mono, dual-mono, joint-stereo, stereo Sekwencja przetwarzania sygnału Podział na ramki po 384 (warstwa 1) lub 3 x 384 (warstwa 2 i 3) próbki Skierowanie na bank 32 filtrów analizujących podział na 32 podpasma Dzisiątkowanie sygnału ramka elementarna w podpaśmie zawiera 12 próbek Zastosowanie modelu psychoakustycznego wyliczenie maskowania oraz progów kwantyzacji w kaŝdym z podpasm Kwantyzacja i kodowanie entropijne sygnału podpasm, uformowanie strumienia bitowego

MPEG audio działanie c.d. Działanie modelu psychoakustycznego: Niech po podziale na podpasma poziomy pierwszych podpasm wynoszą: Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Poziom[dB] 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1 Pasmo 8 poziom 60 db daje maskowanie: kanał 7 12 db, kanał 9 15 db Poziom w kanale 7 równy 10 db (< 12 db) kanał 7 moŝna pominąć Poziom w kanale 9 równy 35 db (> 15 db). Poziom maskowania wyznacza szerokość przedziału kwantyzacji do zakodowania efektywnie tylko 20 db; to wymaga 20 db/6 db/bit 4 bity (zamiast 6 bitów bez uwzględniania maskowania).

Warstwa 1 Warstwy MPEG-1 Filtry typu DCT, równy podział w częstotliwości Na filtr jest podawana 1 ramka jednocześnie ( ok. 8 msek) Tylko maskowanie jednoczesne Daje jakość CD dla bitrate 384 kbps (kompresja 4:1) Warstwa 2 Podaje na filtr 3 ramki jednocześnie (1152 próbek) Pozwala na uwzględnienie pewnych elementów maskowania czasowego Daje jakość CD dla bitrate 256 kbps (kompresja 6:1) Warstwa 3 (MP3) Lepsze filtry (nierównomierne w częstotliwości, zbliŝone do pasm krytycznych Model psychoakustyczny zawiera maskowanie czasowe Stosuje kodowanie Huffmana wyjść kwantyzatorów Daje jakość CD dla bitrate 128 kbps (kompresja 12:1)