Konwersja dźwięku analogowego do postaci cyfrowej



Podobne dokumenty
Dźwięk podstawowe wiadomości technik informatyk

Cechy karty dzwiękowej

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Sygnał a informacja. Nośnikiem informacji mogą być: liczby, słowa, dźwięki, obrazy, zapachy, prąd itp. czyli różnorakie sygnały.

O sygnałach cyfrowych

Przetwornik analogowo-cyfrowy

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Teoria przetwarzania A/C i C/A.

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego

Samodzielnie wykonaj następujące operacje: 13 / 2 = 30 / 5 = 73 / 15 = 15 / 23 = 13 % 2 = 30 % 5 = 73 % 15 = 15 % 23 =

Wstęp do informatyki- wykład 1

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Kodowanie informacji. Przygotował: Ryszard Kijanka

Przetwarzanie analogowo-cyfrowe sygnałów

Technologie Informacyjne

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

TECHNIKI MULTIMEDIALNE

FFT i dyskretny splot. Aplikacje w DSP

Formaty kompresji audio

Wstęp do informatyki- wykład 1 Systemy liczbowe

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Techniki multimedialne

Podstawy Automatyki. Wykład 9 - Podstawy matematyczne automatyki procesów dyskretnych. dr inż. Jakub Możaryn. Instytut Automatyki i Robotyki

Arytmetyka liczb binarnych

ARCHITEKRURA KOMPUTERÓW Kodowanie liczb ze znakiem

Technika audio część 1

Notatka lekcja_#3_1; na podstawie W.Kapica 2017 Strona 1

Formaty plików audio

Kompresja dźwięku w standardzie MPEG-1

Wyznaczanie prędkości dźwięku w powietrzu

Wykład I: Kodowanie liczb w systemach binarnych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wprowadzenie do cyfrowej obróbki dźwięku

Zastowowanie transformacji Fouriera w cyfrowym przetwarzaniu sygnałów

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Przetwarzanie A/C i C/A

Operacje arytmetyczne

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

Kompresja video (MPEG)

Wstęp do informatyki- wykład 2

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

Rozkład materiału z przedmiotu: Przetwarzanie i obróbka sygnałów

Kodowanie informacji. Kody liczbowe

Standardowy zapis cyfrowego dźwięku

Zastosowania mikrokontrolerów w przemyśle

PAMIĘCI. Część 1. Przygotował: Ryszard Kijanka

Kompresja sekwencji obrazów - algorytm MPEG-2

Przetworniki analogowo-cyfrowe

0 + 0 = 0, = 1, = 1, = 0.

1.1. Pozycyjne systemy liczbowe

4.3 Wyznaczanie prędkości dźwięku w powietrzu metodą fali biegnącej(f2)

Arytmetyka komputera. Na podstawie podręcznika Urządzenia techniki komputerowej Tomasza Marciniuka. Opracował: Kamil Kowalski klasa III TI

dr inż. Piotr Odya dr inż. Piotr Suchomski

Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu

Percepcja dźwięku. Narząd słuchu

Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor

Funkcje liniowe i wieloliniowe w praktyce szkolnej. Opracowanie : mgr inż. Renata Rzepińska

Komunikujemy się z komputerem.

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Urządzenia Techniki. Klasa I TI. System dwójkowy (binarny) -> BIN. Przykład zamiany liczby dziesiętnej na binarną (DEC -> BIN):

3. Macierze i Układy Równań Liniowych

Arytmetyka komputera

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Standardy zapisu i transmisji dźwięku

12. Wprowadzenie Sygnały techniki cyfrowej Systemy liczbowe. Matematyka: Elektronika:

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

AKADEMIA MORSKA KATEDRA NAWIGACJI TECHNICZEJ

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Dwie proste mogą być względem siebie prostopadłe, równoległe albo przecinać się pod kątem innym niż prosty..

SCENARIUSZ LEKCJI. Fale akustyczne oraz obróbka dźwięku (Fizyka poziom rozszerzony, Informatyka poziom rozszerzony)

teoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

Systemy liczbowe. System dziesiętny

INSTRUKCJA PROGRAMOWANIA DZWONKA KAKADU.

Przetworniki cyfrowo analogowe oraz analogowo - cyfrowe

Specyfikacja WMfono Authoring Studio

Systemy liczbowe. 1. Przedstawić w postaci sumy wag poszczególnych cyfr liczbę rzeczywistą R = (10).

audiocd Rik Hemsley Benjamin Meyer : Michał Bendowski

Podstawowe operacje arytmetyczne i logiczne dla liczb binarnych

Przetworniki analogowo-cyfrowe - budowa i działanie" anie"

teoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015

ANALIZA HARMONICZNA DŹWIĘKU SKŁADANIE DRGAŃ AKUSTYCZNYCH DUDNIENIA.

Systemy liczenia. 333= 3*100+3*10+3*1

Radio z odtwarzaczem CD Lenco

Andrzej Leśnicki Laboratorium CPS Ćwiczenie 9 1/5 ĆWICZENIE 9. Kwantowanie sygnałów

Zajęcia nr. 5: Funkcja liniowa

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

Parametryzacja przetworników analogowocyfrowych

1. Operacje logiczne A B A OR B

Biblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

SYSTEMY LICZBOWE 275,538 =

1.5. Sygnały. Sygnał- jest modelem zmian w czasie pewnej wielkości fizycznej lub stanu obiektu fizycznego

Transkrypt:

Konwersja dźwięku analogowego do postaci cyfrowej

Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych pojęć związanych z postacią sygnału akustycznego w formie analogowej, przetwarzaniem AD oraz postacią sygnału akustycznego w formie cyfrowej.

Przetwornik analogowo-cyfrowy A/C (ang. A/D - analog to digital), to układ służący do zamiany sygnału analogowego (ciągłego) na dyskretny ciąg liczb, zależny od wykorzystywanego systemu. Działanie przeciwne do wyżej wymienionego wykonuje przetwornik cyfrowo-analogowy C/A.

Jak wiadomo, sygnał audio w postaci analogowej jest niczym innym jak przebiegiem wartości amplitudy prądu względem czasu

Wartość amplitudy sygnału (popularnie nazywane VU) przekłada się na poziom dbuczyli poziom akustyczny sygnału. Bierze się to stąd, że dźwięk będący efektem pracy muzyka w studio nagraniowym, odbierany jest przez mikrofony, które są elementem aktywnym przetwarzającym drgania fali akustycznej na falowe drgania elektryczne o częstotliwości i poziomie analogicznych do poziomu odebranej fali akustycznej. Tak otrzymujemy analogową postać sygnału dźwiękowego pod postacią przebiegu falowego prądu.

Teraz kiedy wiemy już czym jest dźwięk pod postacią analogową opisać trzeba sposób na przetworzenie go w ciąg zer i jedynek. Aby było to możliwe naukowcy opracowali trzystopniowy proces przekształcania sygnału analogowego na cyfrowy. PRÓBKOWANIE, KWANTYZACJA, KODOWANIE -oto te trzy stopnie.

Każdy z nas spotkał się niejednokrotnie z zestawem wartości opisujących np. plik.wav,.mp3,.wma,.mpc itd. Większość popularnych odtwarzaczy programowych takich jak np. Foobar2000 daje nam możliwość wglądu w te charakterystyczne dla pliku dźwiękowego właściwości. W Foobar2000 klikamy prawym przyciskiem myszy na dowolnej pozycji z listy utworów i wybieramy z menu kontekstowego "Properties... W dalszej części zajęć uczniowie ściągają z sieci instalkę footbar2000, instalują na swoim komputerze i postępują według powyższych wskazówek

Z prawej strony okna zobaczyć możemy właściwości techniczne pliku dźwiękowego. Są to: Bitrate, Samplerate, oraz Codec. Informacje te pomogą nam ocenić jakość i system kodowania wybranej ścieżki Teraz zajmiemy się procesem zamiany sygnału analogowego na postać cyfrową, opisując po drodze w/w właściwości plików dźwiękowych.

Bitrate Średnia bitowa (kompresja danych) średnia liczba bitów potrzebna na wyrażenie symbolu. Stosunek liczby bitów do liczby symboli. Innymi słowy można nim określić współczynnik, który mówi ile bitów danych zostało użytych do zapisu dźwięku lub obrazu w określonej jednostce czasu (zwykle 1sekunda)

Próbkowaniemnazywamy proces pomiaru wartości chwilowej danego sygnału ze stałą częstotliwością. Częstotliwość tą nazywamy CZĘSTOTLIWOŚCIĄ PRÓBKOWANIA (Samplerate). W przypadku częstotliwości 44100Hz, która jest standardową częstotliwością próbkowania dla materiału audio zapisywanego na płytach CD-Audio, próbkowanie jest wykonywane 44100 razy na sekundę co daje nam do dyspozycji 44100 próbek (z których każda ma pewną określoną wartość) w ciągu sekundy. Już teraz wyciągnąć możemy prosty wniosek, iż im większa będzie częstotliwość próbkowania, tym dokładniejszy obraz sygnału otrzymamy. Częstotliwość próbkowania zawsze określona była zasadą, iż musi być ona przynajmniej dwa razy większa niż maksymalna częstotliwość składowa sygnału na wejściu przetwornika. Częstotliwości próbkowania dla plików.mp3 i innych formatów przechowywania dźwięku (stratnych jak i bezstratnych) bardzo często osiąga wartość 48000Hz, jest to także standard dla dźwięku zawartego na płytach DVD.

KWANTYZACJA

Kwantyzacjajest to proces mający na celu przedstawienie nieskończonej wartości sygnału analogowego pod postacią skończonego ciągu zer i jedynek. Jest to proces niemożliwy z matematycznego punktu widzenia jednak stopień w jakim algebra binarna pozwala nam na odwzorowanie jest w zupełności wystarczający. Brzmi to dosyć niejasno więc małe objaśnienie:

Wyobraźmy sobie prosty układ dwóch współrzędnych. Oś X i oś Y, zupełnie jak na matematyce podstawówce. Oś X pozioma, oś Y pionowa. Na osi X opiszemy sobie czas w sekundach, od 0 (początek układu) do 1 sekundy. Na pionowej osi Y opiszemy poziom naszego sygnału w dbu. Nie trudno jest sobie wyobrazić teraz funkcję obrazującą sekundowy urywek naszego sygnału: linia falista wzdłużna do osi X, której wybrane punkty znajdują się na wysokości danych wartości na osi Y.:

Teraz rzecz odrobinę trudniejsza do wyobrażenia. Wyobraźmy sobie iż oś X od punktu 0 do punktu 1s podzielona jest na 44100 równych części. Taka jest podziałka osi X w tym przypadku 1/44100. Oznacza to, że mamy 44100 punktów które staną się naszymi punktami odniesienia do osi Y W przypadku gdybyśmy chcieli odczytać wartość każdej z 44100 próbek na osi Y w sposób analogowy, nie byłoby żadnego problemu. Prowadzimy dwie proste. Jedna prosta prostopadła do osi X, przechodząca przez jeden z 44100 punktów a druga prosta prostopadła do osi Y i równoległa do osi X. Proste te przeciąć się mają w punkcie którego wartość chcemy odczytać. Nic prostszego:

W przypadku gdy chcemy przedstawić wartość jednej z 44100 próbek w systemie binarnym sprawa się komplikuje. Już zauważyliśmy w krótki powtórzeniu wiadomości z zakresu techniki cyfrowej, wartość dziesiętna jaką możemy się posłużyć ograniczona jest ilością bitów w słowie binarnym. Co to oznacza w tym przypadku? Oznacza to, iż zakres wartości jakie będziemy mogli odczytać z osi Y opisanej w systemie binarnym uzależniony jest od długości słowa opisującego każdą pojedynczą wartość. Poniżej przedstawiony jest przykład opisania wartości sygnału w sposób binarny przy pomocy słowa 2-bitowego:

Jak widać zakres wartości sygnału opisanego słowem 2-bitowym wynosi od 0 do 3 jednostek. tutaj podkreślic trzeba że z badanego sygnału w przypadku opisywania go wartościami binarnymi do dyspozycji mamy tylko wartości reprezentowane przez słowa binarne i żadnych pośrednich między nimi! (w przypadku słowa 2- bitowego do dyspozycji mamy tylko 4 wartości!) Nasuwa sie prosty wniosek, że opisywanie jakiegokolwiek sygnału złożonego z więcej niż czterech wartości nie ma większego sensu gdyż błąd odwzorowania będzie tak duży, że nie pozwoli nam na nawet przybliżone odtworzenie sygnału wzorcowego.

Dopisywania wartości sygnału używamz słowa 16-bitowego. Tutaj sprawa ma się już lepiej, gdyż do dyspozycji mamy 65536 wartości (od 0 do 65535). Zakres ten jest olbrzymi i pozwala nam na wierne odwzorowanie wartości jednej z naszych 44100 próbek. Dla płyt Audio-CD wartości próbkowania i kwantyzacji to 44100Hz i 16 bitowe słowo opisujące każdą próbkę. Dla materiałów dźwiękowych zapisywanych na płytach DVD słowo opisujące każdą z 96000 lub 192000 próbek ma długość 24 bitów (daje nam to prawie 17 milionów możliwych wartości!). Pozostańmy jednak przy naszych 16 bitach i 44100 próbkach na każdą sekundę ścieżki.

KODOWANIE:

Zasada kodowania jest bardzo prosta: 16 bitów każdej z 44100 próbek tworzy ramkę w której każdy bit znajduje się w odpowiedniej szczelinie czasowej (każda szczelina trwa tyle samo) stąd wniosej iż każda ramka trwa tyle samo. Pozwala to na zachowanie pewności, iż każda sekunda naszej ścieżki będzie trwała tyle samo. W przypadku kodowania ścieżki audio w systemie PCM stereo do czynienia mamy tak na prawdę z dwoma ścieżkami które są poddawane próbkowaniu i kwantyzacji w identyczny sposób a następnie w procesie kodowania zapisywane pod postacią jednego ciągu informacji (np. plik.wav).

W przypadku dźwięku wielokanałowego PCM sytuacja jest podobna z tą różnicą, że ścieżki każdego z kanałów mapowane są podczas kodowania na każdy z kanałów (4 lub 6). Jest to definicja bartdzo uproszczona gdyż kodowanie dźwięku wielokanałowego jest duzo bardziej skomplikowane od kodowania dźwięku mono lub stereo. Wspomnieć trzeba jeszcze o takich systemach kodowania dźwięku przestrzennego jak DolbyDigital czy DTS w przypadku których algorytmy kodowania, w tym mapowania są bardziej skomplikowane niż w przypadku kodowania PCM.

Sygnał zakodowany pewnym algorytmem trafia na nośnik danych, opatrywany jest w piękna okładkę a następnie wyczekuje na swojego właściciela w sklepie. Kiedy kupujemy płytę a następnie wkładamy do odtwarzacza następuje proces odwrotny do opisanego powyżej. Dekodowanie, odczyt wartości próbek i rekombinacja sygnału analogowego który p[rzez głośniki trafia do naszych uszu.