Reprezentacje danych multimedialnych - dźwięk. 1. Podstawowe fakty 2. Próbkowanie 3. Kwantyzacja 4. Formaty plików



Podobne dokumenty
Rozdział 5. Przetwarzanie analogowo-cyfrowe (A C)

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Dźwięk podstawowe wiadomości technik informatyk

O sygnałach cyfrowych

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Formaty plików audio

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Program wykładu. informatyka + 2

Transmisja analogowa i cyfrowa. Transmisja analogowa i cyfrowa

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Konwersja dźwięku analogowego do postaci cyfrowej

Przetwarzanie analogowo-cyfrowe sygnałów

Systemy multimedialne. Instrukcja 5 Edytor audio Audacity

Technika audio część 2

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Cechy karty dzwiękowej

Transformata Fouriera

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Technika audio część 1

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Wprowadzenie do cyfrowej obróbki dźwięku

Fale akustyczne. Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość. ciśnienie atmosferyczne

Formaty kompresji audio

Rodzaje fal. 1. Fale mechaniczne. 2. Fale elektromagnetyczne. 3. Fale materii. dyfrakcja elektronów

Standardowy zapis cyfrowego dźwięku

Przetwarzanie sygnałów w telekomunikacji

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

ODTWARZACZE CD ODTWARZACZE CD / PRZETWORNIKI DAC

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Bezprzewodowy system hi-fi dla całej rodziny

Dźwięk. Cechy dźwięku, natura światła

Pomiary i przyrządy cyfrowe

Technologie cyfrowe semestr letni 2018/2019

Ruch falowy. Parametry: Długość Częstotliwość Prędkość. Częstotliwość i częstość kołowa MICHAŁ MARZANTOWICZ

Nauka o słyszeniu Wykład IV Głośność dźwięku

Przesył mowy przez internet

Fal podłużna. Polaryzacja fali podłużnej

Wydajne, przenośne nagrywanie dźwięku o wysokiej rozdzielczości

Fale dźwiękowe. Jak człowiek ocenia natężenie bodźców słuchowych? dr inż. Romuald Kędzierski

Podstawy Akustyki. Drgania normalne a fale stojące Składanie fal harmonicznych: Fale akustyczne w powietrzu Efekt Dopplera

TECHNIKI MULTIMEDIALNE

2. Arytmetyka procesorów 16-bitowych stałoprzecinkowych

PCM-D100. Przenośny rejestrator dźwięku w wysokiej rozdzielczości

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Wybrane algorytmu kompresji dźwięku

Podstawy transmisji sygnałów

cennik detaliczny

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Przykładowe poziomy natężenia dźwięków występujących w środowisku człowieka: 0 db - próg słyszalności 10 db - szept 35 db - cicha muzyka 45 db -

Wzmacniacz stereofoniczny

Przetworniki analogowe / cyfrowe (A/C) gły analogowymi kodowane sygnały cyfrowe Przetwarzanie dyskretyzacji sygnału w czasie próbkowaniu)

Kompresja dźwięku w standardzie MPEG-1

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa

Architektura systemów komputerowych. dr Artur Bartoszewski

Szereg i transformata Fouriera

1. Po upływie jakiego czasu ciało drgające ruchem harmonicznym o okresie T = 8 s przebędzie drogę równą: a) całej amplitudzie b) czterem amplitudom?

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA

Cyfrowe przetwarzanie sygnałów Jacek Rezmer -1-

Kompresja Danych. Streszczenie Studia Dzienne Wykład 13, f(t) = c n e inω0t, T f(t)e inω 0t dt.

Przykładowe zadanie praktyczne

Fale w przyrodzie - dźwięk

Podstawy Akustyki. Drgania normalne a fale stojące Składanie fal harmonicznych: Fale akustyczne w powietrzu Efekt Dopplera.

1.5. Sygnały. Sygnał- jest modelem zmian w czasie pewnej wielkości fizycznej lub stanu obiektu fizycznego

Nazwa handlowa / Producent / Nr katalogowy

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PISEMNA

Dźwięk, gitara PREZENTACJA ADAM DZIEŻYK

Formaty plików. graficznych, dźwiękowych, wideo

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

TECHNIKI MULTIMEDIALNE

Percepcja dźwięku. Narząd słuchu

Kompresja danych DKDA (7)

Przetworniki A/C. Ryszard J. Barczyński, Materiały dydaktyczne do użytku wewnętrznego

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

ZAŁĄCZNIK NR Cyfrowy mikser foniczny z wyposażeniem ilość 1 kpl.

Fale dźwiękowe i zjawisko dudnień. IV. Wprowadzenie.

Wykład FIZYKA I. 11. Fale mechaniczne. Dr hab. inż. Władysław Artur Woźniak

2LO 6 lu L 92, 93, 94 T3.5.2 Matematyczny opis zjawisk falowych cd. Na poprzednich lekcjach już było mamy to umieć 1. Ruch falowy 1.

Wydział EAIiE Kierunek: Elektrotechnika. Wykład 12: Fale. Przedmiot: Fizyka. RUCH FALOWY -cd. Wykład /2009, zima 1

Rozkład materiału z przedmiotu: Przetwarzanie i obróbka sygnałów

Specyfikacja techniczna

Zastosowania mikrokontrolerów w przemyśle

Biblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann

Sygnał a informacja. Nośnikiem informacji mogą być: liczby, słowa, dźwięki, obrazy, zapachy, prąd itp. czyli różnorakie sygnały.

Ćwiczenie nr 25: Interferencja fal akustycznych

Nauka o słyszeniu. Wykład I Dźwięk. Anna Preis,

Wzmacniacz stereofoniczny

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

4.3 Wyznaczanie prędkości dźwięku w powietrzu metodą fali biegnącej(f2)

WIDMO, ELEMENTY SKŁADOWE DŹWIĘKU, ZAPIS DŹWIĘKU, SYNTEZA ADDYTYWNA

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 2 AiR III

Transkrypt:

Reprezentacje danych multimedialnych - dźwięk 1. Podstawowe fakty 2. Próbkowanie 3. Kwantyzacja 4. Formaty plików

Dźwięk podstawowe fakty Dźwięk ciągła fala zgęszczeń i rozrzedzeń rozchodząca się w powietrzu Wykazuje normalne własności falowe (odbicie, ugięcie itp.) Prędkość rozchodzenia w powietrzu v(t) = ( 331 + T [ C] ) m/sek Charakterystyki fali: częstotliwość, amplituda Człowiek moŝe słyszeć dźwięki z zakresu częstotliwości: 16 Hz 20 khz (długości fal 21.3 m 1.7 cm).

Dźwięk podstawowe fakty c.d. Miara intensywności: SPL = 10 log(p/p 0 ) db, P 0 = 10-12 W/m 2 Intensywność nieliniowa funkcja mocy (podwojenie mocy to zmiana o 10 log(2) db = 3 db Przykładowe intensywności: 0 db próg słyszalności 30 db cichy dom 60 db biuro, rozmowa 80 db głośna ulica 120 db koncert rockowy; dyskomfort 140 db granica bólu

V Digitalizacja Rejestrując dźwięk uzyskujemy sygnał analogowy. t

Digitalizacja zamiana na dyskretny ciąg liczb. Dyskretna siatka w kierunku czasowym próbkowanie, w kierunku sygnału kwantyzacja. t 1 3 4 5 6 3 0-3 -4 1 3 1 0 2 0-4 0

Jakość digitalizacji ZaleŜy od ilości poziomów kwantyzacji i częstości próbkowania Kwantyzacja zaleŝy od ilości bitów przeznaczonych na reprezentację numeru progu kwantyzacji Kwantyzacja N-bitowa 2 N poziomów 8 bitów 256 poziomów kwantyzacji 16 bitów 65536 poziomów kwantyzacji Błąd kwantyzacji = wartość sygnału wartość najbliŝszego poziomu kwantyzacji połowa odległości między poziomami Jak często naleŝy próbkować?

f o f p = f o f p = 1.5 f o aliasing

Aliasing Gdy częstość próbkowania za mała przekłamania w odtworzeniu częstości z próbek aliasing f = f f, dla f < f < 2 alias samp true true samp f true Ogólnie: obserwowana częstość najniŝsza moŝliwa częstość sinusoidy, która ma te same próbki co dana sinusoida wejściowa f samp = 8 khz

Twierdzenie Nyquista H.Nyquist (1928), C.E. Shanon (1949) Aby móc dokładnie odtworzyć ciągły sygnał o ograniczonym paśmie z jego próbek, naleŝy zastosować częstość próbkowania równą co najmniej podwojonej najwyŝszej częstości sygnału. Wnioski: aby przenieść całe pasmo akustyczne naleŝy wziąć f p 40 khz (stosuje się 44.1 khz) aby dobrze przenieść mowę (100 Hz 3.5 khz) naleŝy wziąć f p 7 khz (stosuje się 8 khz) aby uniknąć aliasingu naleŝy zastosować filtr dolnoprzepustowy z częstością obcięcia f o = f p /2

Jakość kwantyzacji Dla układów analogowych miara jakości sygnału SNR: SNR = 10 log (V s2 / V n2 ) Miara jakości kwantyzacji SQNR: SQNR = 10 log (V s2 / V qe2 ) Dla kwantyzacji N-bitowej: sygnał: 2 N-1 2 N-1 błąd kwantyzacji: ½ (w najgorszym razie) SQNR = 20 log(2 N ) = N * 20 log(2) = 6.02 * N (db) N=8, N=16, SQNR = 48 db SQNR = 96 db

Filtrowanie audio Przed próbkowaniem i konwersją AD filtr pasmowy (dolnoprzepustowy, 2 f high < f obc < f samp ) Po stronie dekodera DA pojawiają się znów wysokie częstości konieczny filtr dolnoprzepustowy

Kwantyzacja nieliniowa Do tej pory przedziały kwantyzacji równej szerokości (kwantyzacja liniowa) Nie odpowiada to ludzkiej wraŝliwości prawo Webera (związek miedzy zmianą wraŝenia i zmianą sygnału): Po scałkowaniu: r s s r = k ln( s / s0) Ze względów percepcyjnych lepiej kwantyzować tak, by uzyskać równe odstępy w r (więcej poziomów tam, gdzie większa wraŝliwość

Kwantyzacja nieliniowa c.d. Nieliniowa transformacja od sygnału s do teoretycznej wielkości r; kwantyzacja jednorodna w r Najczęściej stosowane w telefonii: u-law (USA, Japonia) A-law (Europa)

Kwantyzacja nieliniowa c.d.

Jakość przepustowość Typ f p [khz] Bit/ prób. Ile kan. Pasmo Przep. [kb/s] 1 min. danych Telefon 8 8 1 200 3.400 Hz 8 480 kb CD 44.1 16 2 20 Hz 172.3 10 MB 20 khz DVD audio 192 (max) 24 (max) 6 0 96 khz 1200 (max) 70 MB (max) Typowe formaty danych: *.wav, *.aiff, *.au pliki kodowane PCM dla Windows, Mac, Unix *.mp3, *.ra, *.wma, *.ogg formaty strumieniowe

Format WAVE Opracowany przez Microsoft format zapisu audio szczególny przypadek specyfikacji RIFF (pochodnej EA IFF) Ogólna struktura pliku nagłówek specyfikujący typ i rozmiar pliku, szereg róŝnego rodzaju porcji (chunks) opisujących strukturę i wartości danych W WAVE obowiązkowe porcje typu fmt i data ; segment formatu musi poprzedzać dane. Wszystkie liczby specyfikowane w porządku od najmłodszego do najstarszego bytu (little endian). Formaty AIFF i AU podobne

4 ChunkID napis "RIFF" 4 ChunkSize rozmiar pozostałej części pliku 4 Format napis "WAVE" ================================================================================ 4 Subchunk1ID napis "fmt " 4 Subchunk1Size rozmiar ozostałej części porcji (16 dla PCM) 2 AudioFormat PCM = 1 (i.e. Linear quantization) 2 NumChannels Mono = 1, Stereo = 2, etc. 4 SampleRate 8000, 44100, etc. 4 ByteRate = SampleRate * NumChannels * BitsPerSample/8 2 BlockAlign = NumChannels * BitsPerSample/8 2 BitsPerSample 8 bits = 8, 16 bits = 16, etc. 2 ExtraParamSize gdy PCM, to tego nie ma X ExtraParams ewentualne dodatkowe dane (gdy nie PCM) ================================================================================ 4 Subchunk2ID napis "data" 4 Subchunk2Size = NumSamples * NumChannels * BitsPerSample/8 * Data dane próbek dźwięku

Format WAVE c.d. Dodatkowe fakty: Dane próbek muszą się mieścić w parzystej liczbie bajtów Próbki 8-bitowe są składowane jako liczby bez znaku: 0.. 255 Próbki 16-bitowe są składowane jako liczby ze znakiem: -32768.. 32767 Przykład: nagłówek pewnego pliku ma postać: 52 49 46 46 24 08 00 00 57 41 56 45 66 6d 74 20 10 00 00 00 01 00 02 00 22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00 24 17 1e f3 3c 13 3c 14 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 11 ce 1a 0d