Wprowadzenie do cyfrowej obróbki dźwięku

Podobne dokumenty

Formaty kompresji audio

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Dźwięk podstawowe wiadomości technik informatyk

Standardowy zapis cyfrowego dźwięku

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Formaty plików audio

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Cechy karty dzwiękowej

Kompresja dźwięku w standardzie MPEG-1

Ćwiczenie II. Edytor dźwięku Audacity

Formaty plików. graficznych, dźwiękowych, wideo

Konwersja dźwięku analogowego do postaci cyfrowej

Biblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Transformata Fouriera

Percepcja dźwięku. Narząd słuchu

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

SCENARIUSZ LEKCJI. Fale akustyczne oraz obróbka dźwięku (Fizyka poziom rozszerzony, Informatyka poziom rozszerzony)

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Audacity jest darmowym edytorem audio

Program wykładu. informatyka + 2

Systemy multimedialne. Instrukcja 5 Edytor audio Audacity

Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor

O sygnałach cyfrowych

Bezprzewodowy system hi-fi dla całej rodziny

Analiza plików dźwiękowych

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

PerfectCap - nagrywarka HDMI, następca VELOCAP-u

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Podstawy Przetwarzania Sygnałów

Kompresja sekwencji obrazów - algorytm MPEG-2

* w przypadku braku numeru PESEL seria i numer paszportu lub innego dokumentu potwierdzającego tożsamość

Audio i Audacity Formaty plików dźwiękowych. Strona 1 z 10

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2017 CZĘŚĆ PISEMNA

AIFF MP3 Wave Form Audio Format Windows Media Audio Vorbis Format WAVE Format MP3 Format WMA Format MIDI

PCM-D100. Przenośny rejestrator dźwięku w wysokiej rozdzielczości

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA. Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu

Technika audio część 1

TECHNIKI MULTIMEDIALNE

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Smart Pianist często zadawane pytania

Jak usunąć wokal z nagrania?

Kompresja sekwencji obrazów

Przesył mowy przez internet

Wzmacniacz stereofoniczny

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

Przetwornik analogowo-cyfrowy

Pliki audio mp3 w Alesis Fusion

Instrukcja obsługi FiiO X7

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.

HDR TBox Deluxe. HDR TBox Deluxe nagrywarka HDMI CV na USB PC z odtwarzaczem. Opis. HDR TBox Deluxe nagrywarka HDMI CV na USB PC z odtwarzaczem

Spis Treści. Co to jest? Budowa Próbkowanie Synteza FM Synteza WT MIDI

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Instrukcja obsługi programu PVR Manager v 2.2.

* w przypadku braku numeru PESEL seria i numer paszportu lub innego dokumentu potwierdzającego tożsamość

Yamaha NP-S303 MusicCast Silver. Od ręki. Skorzystaj z 30 rat 0% w salonie Ultimate Audio Konin kategoria: TOP > Multimedia > MusicCast

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE

Przykładowe zagadnienia na sprawdzian z wiedzy ogólnej. Linux to nazwa: A. Programu biurowego. B. Systemu operacyjnego. C. Przeglądarki internetowej.

Informacje na temat produktu C: Instalacja

Wielokanałowe systemy kodowania dźwięku

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA

Reprezentacje danych multimedialnych - dźwięk. 1. Podstawowe fakty 2. Próbkowanie 3. Kwantyzacja 4. Formaty plików

GSMONLINE.PL. Nokia Lumia pierwszy tablet Nokii Nokia zaprezentowała dziś pierwszy tablet - Nokia Lumia 2520.

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA

Spis treści. 3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42

TECHNIKI MULTIMEDIALNE

Cała prawda o plikach grafiki rastrowej

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego

Wydajne, przenośne nagrywanie dźwięku o wysokiej rozdzielczości

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

fazy tworzenia filmu preprodukcja szkice, rysunki, plany produkcji... produkcja nagrywanie scen postprodukcja montaż, korekcja, podkład dźwiękowy

INFORMATYKA GRAFIKA I MULTIMEDIA. Zbiór zadań

Techniki Tworzenia Plików Filmowych

Plan prezentacji. Tworzenie prezentacji multimedialnej. Piotr Odya

Formaty plików wideo DSI III

Wpisany przez Łukasz Nawrotek Niedziela, 08 Czerwiec :43 - Zmieniony Niedziela, 08 Czerwiec :44

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA

Wzmacniacz stereofoniczny

Technologie Informacyjne

Wielokanałowe systemy kodowania dźwięku

Szybkość transmisji Przepływność

Systemy multimedialne Kodowanie dźwięków.

Technologie cyfrowe semestr letni 2018/2019

Bit najmniejsza ilość informacji potrzebna do określenia, który z dwóch równie prawdopodobnych stanów przyjął układ. Jednostka logiczna.

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Wykład VII. Systemy kryptograficzne Kierunek Matematyka - semestr IV. dr inż. Janusz Słupik. Wydział Matematyki Stosowanej Politechniki Śląskiej

urządzenie elektroniczne służące do przetwarzania wszelkich informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.

Scalone dekodery audio firmy VLSI

BUDOWA KOMPUTERA. Monika Słomian

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

Transkrypt:

Wprowadzenie do cyfrowej obróbki dźwięku

Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana jest próbkowaniem Kolejne naniesienia tych liczb na wykres pozwalają na graficzne przestawienie przebiegu sygnału.

Częstotliwość próbkowania Wartość sygnału jest zapisywana z pewną częstotliwością zwaną "częstotliwością próbkowania". W przypadku płyty CD częstotliwość ta wynosi 44,1 khz, co oznacza, że w ciągu sekundy zapisywane jest 44 100 wartości sygnału audio. Mnożąc 16 bitów przez 44100 otrzymujemy konieczność zapisania nieco ponad 700 000 bitów na sekundę, czyli 88 200 bajtów na sekundę (1 bajt = 8 bitów). Ponieważ zazwyczaj zapis odbywa się dwukanałowo (stereo), to powyższą liczbę należy pomnożyć jeszcze przez 2, co da ostatecznie ok. 1 400 000 bitów na sekundę i 176 400 bajtów na sekundę - w przybliżeniu ok. 170 kb/s.

Rozdzielczość bitowa Drugim kluczowym czynnikiem wpływającym na jakość dźwięku jest rozdzielczość bitowa. Rozdzielczość bitowa określa liczbę bitów opisujących każdą próbkę dźwięku (czyli każdą liczbę reprezentującą chwilową wartość sygnału). Rozdzielczość bitowa rośnie wykładniczo, czyli 8-bitowy dźwięk może zawierać 2 8, czyli 256 różnych poziomów wartości, zaś dźwięk 16-bitowy może ich zawierać już 2 16, czyli 65 536. Z tego względu cyfrowy dźwięk 16-bitowy zawiera znacznie więcej informacji o pierwotnym sygnale niż dźwięk 8-bitowy o tej samej długości. W rezultacie, dzięki dodatkowej informacji zawartej w dźwięku 16-bitowym jest zredukowany szum występujący w tle, zaś sam dźwięk jest bogatszy i czystszy. Ten sam dźwięk nagrany z rozdzielczością 8-bitową jest zaszumiony i "płytki".

Rozmiar pliku Wzór, na podstawie którego możesz obliczyć rozmiar pliku dźwiękowego w bajtach przedstawia się następująco: czas trwania dźwięku w sekundach częstotliwość próbkowania w Hz liczba kanałów (rozdzielczość bitowa / 8) = rozmiar pliku rozdzielczość bitową dzielimy przez 8, ponieważ w jednym bajcie mieści się 8 bitów. Zgodnie z tym wzorem, 20-sekundowy stereofoniczny klip dźwiękowy o rozdzielczości 8-bitowej i częstotliwości próbkowania 11 khz zmieści się w pliku o wielkości: 20 s 11 025 Hz 2 kanały (8 bitów/8) = 441 000 Bajtów = 430 kb

Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze zwanej próbkowaniem. Próbkowanie, to nic innego, tylko odczytywanie poziomu sygnału akustycznego w danej chwili i zapisywanie jako liczby. Oczywiście, prawie zawsze liczba ta jest zapisywana w formacie dwójkowym.

Im większa częstotliwość próbkowania tym sygnał cyfrowy jest dokładniejszy

Dlatego zasadą jest, że im gęściej zapisywany jest sygnał (czyli im większa jest częstotliwość próbkowania), tym dokładniej opisze on brzmienie muzyki. W teorii przyjmuje się, że najwyższa zapisywana częstotliwość jest równa połowie częstotliwości próbkowania (tzw. kryterium Nyquist-a). Można to prześledzić na przykładzie sygnału o kształcie sinusa - widać, że można to w miarę dobrze zrobić zapisując jego skrajne wychylenia. Otrzymamy kanciasty (piłokształtny) sygnał, który z grubsza przypomina zapisywanego sinusa.

W przeciwnym wypadku otrzymamy sygnał mocno zniekształcony

Ostatecznie, mamy taką sytuację, że tylko z racji zapisywania dźwięku przy odtwarzaniu powstaje wiele nieprzyjemnych zniekształceń: pojawiają się tony, których w sygnale źródłowym w ogóle nie było (zjawisko aliassingu) znikają tony, które były powstają tzw. szumy próbkowania. Część z tych efektów da się co prawda złagodzić - np. poprzez ograniczenie zapisywanego pasma częstotliwości, czy wyrafinowane metody antyaliassingowe stosowane podczas zapisu. Poza tym układy scalone stosowane w odtwarzaczach CD wyraźnie poprawiają efekt końcowy eliminując niektóre powstające szumy i typowe zniekształcenia. Jednak oczywiście nie wszystkie, zaś wprowadzane techniki mają negatywne skutki uboczne, co objawia się zubażaniem odtwarzanej muzyki.

Wielkości charakteryzujące dźwięk Składowa prosty dźwięk o jednej częstotliwości w czasie Wysokość dźwięku częstotliwość, którą najmocniej słychać w danym sygnale dźwiękowym dla której występuje max. natężenia dźwięku w widmie tego dźwięku Widmo dźwięku zależność natężenia dźwięku od częstotliwości Barwa dźwięku charakterystyczny kształt widma sygnału

Widma dźwięków: skrzypiec, altówki, wiolonczeli, kontrabasu

Kompresja - "pakowanie" danych dźwiękowych. Są dwa rodzaje kompresji: kompresja bezstratna kompresja stratna

Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest oszczędniejszy. Możliwość stosowania tego rodzaju kompresji wynika z faktu, że standardowe sposoby zapisu dźwięku (np. pliki wav) są dość "rozrzutne" pod względem wykorzystania pamięci. Np. bez względu na to, czy w danym momencie dźwięk ma dużą amplitudę i skomplikowany przebieg, czy panuje absolutna cisza, dane w formacie stereo zajmują około 170 kb na każdą sekundę. Dlatego zmieniając sposób zapisu da się sporo danych "upakować". Dlatego kompresja bezstratna pozwala przeciętnie w np. w jednym bajcie danych skompresowanych zapisać więcej niż 1 bajt danych wyjściowych.

Możliwe do zastosowanie metody: - można np. oznaczać obszary ciszy i zapisywać je oszczędniej niż w 16 bitach na kanał i na jedną próbkę sygnału (w końcu większość rozpiętości przedziału od 0 do 32 768 dla cichych dźwięków się "marnuje") - dla muzyki w której różnice między kanałami stereo są nieznaczne można zapisywać dokładnie zsumowany sygnał (mono), a różnice (które będą niewielkie) kodować oszczędniejszym sposobem. - i inne, jakie tylko wymyślą mądrzy naukowcy... Niestety, kompresja bezstratna zazwyczaj nie daje dużych możliwości zmniejszenia rozmiaru plików - zysk na pojemności pamięci oscyluje w okolicy 2 razy (w najlepszych warunkach 3-4).

Formaty kompresji bezstratnej monkey's audio LPAC RKAU FLAC WavPack jeden z podformatów quicktime'a

Kompresja stratna Kompresja stratna wykorzystuje kilka uzupełniających się efektów i technik: po pierwsze - ten typ kompresji może wykorzystać prawie wszystkie metody kompresji bezstratnej po drugie - ponieważ ludzki narząd słuchu nie jest stuprocentowo dokładny (ludzkie ucho słyszy dźwięki w paśmie między częstotliwościami granicznymi od ok. 16 Hz do 20 khz.) to wiele dźwięków jest przezeń "gubionych" i można ich po prostu nie zapisywać, oszczędzając przy tym pasmo pamięci.

Ta druga metoda - wykorzystanie niedokładności słuchu jest właśnie kluczem do wydajności kompresji stratnej. W jej ramach sygnał dźwiękowy jest analizowany pod kątem owych niedostrzeganych słuchem elementów - np. maskowanie dźwięków cichych przez głośne, lub maskowanie gorzej słyszalnych dźwięków. Dzięki kompresji stratnej daje się (bez wyraźnego pogorszenia jakości dźwięku) upakować dane audio 10-cio, a nawet 20-to krotnie. W rezultacie typowe nagranie zajmuje nie kilkadziesiąt, a kilka megabajtów pamięci.

Formaty kompresji stratnej mp3 (także mp3 pro - twórca Instytut Fraunhoffera) wma, asf (MICROSOFT) mpeg ogg (Vorbis - projekt open source) atrac (SONY) aac (APPLE) vqf (YAMAHA) i inne

Jakość dźwięku cyfrowego W przypadku pliku zapisanego cyfrowo bez kompresji jego jakość zależy od częstotliwości próbkowania W przypadku dźwięku poddanego kompresji stratnej jego jakość zależy od częstotliwości próbkowania ale i od tzw. przepływności

Przepływność Przepływność to szybkość przesyłu (ang. bitrate) z jaką informacja przepływa przez pewien punkt. Mierzy się ją w bitach na sekundę (bps) lub bajtach na sekundę (B/s, 8 b/s = 1 B/s) i ich krotnościach (kb/s, Mb/s, Gb/s, kb/s, MB/s itd.) Im wyższy bitrate, tym lepsza jakość.

Programy do obróbki dźwięku GoldWave - zaawansowany program do obróbki plików audio. Program pozwala nam na zastosowanie kilkudziesięciu efektów, umożliwia wycinanie lub wstawianie części plików muzycznych. GoldWave radzi sobie z konwersją kilkudziesięciu formatów dźwiękowych, które obsługuje Easy CD-DA Extractor - program służący do konwersji nagrań audio z płyt CD na pliki dźwiękowe zapisane w formacie WAV, RAW, MP3, vqf oraz ogg. Audacity najnowsza wersja darmowego i łatwego w użyciu programu do nagrywania i edycji dźwięku dla systemów Windows, Mac OS X, GNU/Linux i innych. Audacity jest znaną i cenioną aplikacją przez wielu użytkowników. Program posiada polski, przejrzysty interfejs Virtual DJ - darmowy program do miksowania muzyki w czasie rzeczywistym. CDex - darmowy program do konwersji płyt Audio na dysk twardy w postaci plików MP3, WAV, OGG, APE, VGF.

Koniec