16th International Symposium on Sound Engineering and Tonmeistering

Wielkość: px
Rozpocząć pokaz od strony:

Download "16th International Symposium on Sound Engineering and Tonmeistering"

Transkrypt

1 Warszawa, 8-10 October 2015 AKUSTYCZNA BAZA SYGNAŁÓW MUZYCZNYCH KODOWANYCH WYBRANYMI TECHNIKAMI Stefan BRACHMAŃSKI Politechnika Wrocławska, Wyspiańskiego 27, Wrocław Rosnące zapotrzebowanie na transmisję wysokiej jakości sygnałów mowy, muzyki i video wymaga opracowywania nowych technik kodowania tych sygnałów. Celem kodowania jest zoptymalizowanie wykorzystania środków przekazu, tzn. uzyskanie prawie niezauważalnego pogorszenia jakości przesyłanych sygnałów dla jak najmniejszej szybkości bitowej. W artykule przedstawiono utworzoną bazę sygnałów muzycznych poddanych wybranym technikom kodowania ( AAC, mp2, mp3, ac3, ogg i wma) z różną szybkością bitową (od 32 kb/s do 320 kb/s). Zrealizowana baza może być wykorzystana nie tylko do analizy wpływu techniki kodowania i szybkości bitowej na jakość sygnału muzycznego, ale również m.in. do oceny jakości systemów transmisji sygnałów fonicznych i nagłośnieniowych, weryfikacji nowych obiektywnych metod oceny jakości. 1. WPROWADZENIE Badania dotyczące pozyskiwania różnych informacji z sygnałów muzycznych, a także na ich podstawie wymagają utworzenia akustycznej bazy takich sygnałów. Aby wyniki uzyskane przez różnych badaczy w różnych ośrodkach mogły być wzajemnie porównywane należy opracować uniwersalną akustyczną bazę sygnałów muzycznych. Baza powinna zawierać zarówno pliki źródłowe jak i poddane różnym technikom kodowania. W różnych ośrodkach tworzone są powszechnie dostępne bazy sygnałów muzycznych, np bazy dźwięków instrumentów muzycznych Master Samples na McGill University (za [2]), a także Musical Instrument Samples na University of Iowa [1] (za [2]). Niemniej jednak wciąż istnieje zapotrzebowanie na akustyczne bazy sygnałów muzycznych zawierające utwory instrumentalne oraz wokalne reprezentujące różne style muzyczne. W latach w Japonii w RealWorld Computing Partnership (RWCP) opracowano bazę sygnałów muzycznych o nazwie RWC Music Database (Real World Computing Music Database), która udostępniana jest bezpłatnie na cele naukowo-badawcze [2], [3]. Baza RWC Music Database spliki stereo w standardzie płyty CD czyli 16bit/44,1kHz, składa się z sześciu części: 1. Popular Music Database zawierająca 100 utworów, przy czym 20 z nich zawiera tekst w języku angielskim (amerykańskie przeboje lat 1980) i pozostałe (80) w języku japońskim (przeboje lat 1990); odnośnie do podziału na głosy, to 50 piosenek śpiewanych było 15 wokalistów, 14 piosenek - przez 13 wokalistek, a 6 utworów - przez 6 grup wokalnych. 2. Royalty-Free Music Database zawiera 15 utworów 10 bardzo znanych standardów popularnych piosenek angielskich i 5 barzdo znanych japońskich piosenek dla dzieci 3. Classical Music Database - 50 utworów, w tym 4 symfonie, 2 koncerty, 4 muzyka orkiestrowa, 10 muzyka kameralna, 24 wykonania solowe, 6 wykonania wokalne. Utwory zostały 1

2 wybrane tak, aby reprezentowały różne style, różną epokę, różną instrumentację, rożnych kompozytorów, różny nastrój. 4. Jazz Music Database zawiera 50 utworów; zmienność instrumentacji - 35 utworów (5 utworów 7 instrumentacji), zmienność stylów - 9 utworów, jazz fussion (jazz-rock) - 6 utworów W ramach zmienności instrumentacji uzyskano różne wersje tego samego utworu w różnych układach; pięć standardów jazzowych (modern-jazz) wykonano w siedmiu instrumentacjach, a mianowicie 1) fortepian solo, 2) solo, 3) duet (wibrafon + pianino, flet + fortepian lub pianino + bas), 4) trio fortepianowe, 5) trio fortepianowe + trąbka lub saksofon tenorowy, 6) oktet (trio fortepianowe + gitara + saksofon altowy + saksofon barytonowy + dwa saksofony tenorowy), 7) trio fortepianowe + wibrafon lub flet. W grupie zmienności stylów uwzględniono 2 utwory wokalne, 2 big band, 2 modal jazz, 2 funky jazz, 1 free jazz. Z kolei w grupie fusion jazz zawarte są utwory łączące muzykę jazzową z innymi popularnymi stylami, a więc reprezentujące jazz-pop, jazz-rock i latn jazz 5. Music Genre Database (100 utworów) składa się ze 100utworów muzycznych; po 3 dla każdego gatunku muzyki i 1 wykonany a capella. Ta baza została podzielona na 10 głównych kategorii (pop, rock, dance, jazz, muzyka latynoamerykańska, muzyka klasyczna, marsze, muzyka świat, muzyka wokalna i tradycyjnej muzyka japońska) i 33 podkategorie (muzyka popularna, ballady, rock, heavy metal, rap/hip-hop, house, techno, funky, soul/r & B, big band, modern jazz, fusion, bossa nova, samba, reggae, tango, muzyka barokowa, muzyka klasyczna, muzyka romantyczna, muzyka współczesna, orkiestra dęta, blues, folk, country, gospel, muzyka afrykańska, muzyka indyjska, flamenco, chanson, canzone, japońska muzyka popularna Enka, japońska muzyka ludowa Min'you i starożytna japońska muzyka dworska Gagaku). Autorzy bazy zastrzegają, iż ten podział nie jest obligatoryjny lecz został ustalony z uwagi na wygodne podczas nagrywania poszczególnych utworów muzycznych. [2] 6. Musical Instrument Sound Database zawiera sekwencje muzyczne grane w sumie przez 150 instrumentów - 50 rodzajów instrumentów muzycznych w 3 różnych wariantach (3 producenci instrumentów muzycznych, 3 muzycy; różne style; dla każdego stylu gry, muzyk grał poszczególne dźwięki w odstępach co pół tonu w całym zakresie tonów, które mogą być generowane przez ten instrumentu; trzy poziomy dynamiki (forte, mezzosopran, fortepian), obejmujących cały zakres dynamiki instrumentu). Główne założenia w procesie tworzenia powszechnych, akustycznych baz sygnałów muzycznych można sformułować następująco: - baza powinna być ogólnodostępna, bezpłatna na cele naukowo-badawcze i dydaktyczne, a więc pozwalać na korzystanie bez ograniczeń w publikacjach naukowych, prezentacjach oraz w dydaktyce, - baza powinna zachęcać do stosowania metod wnioskowania statystycznego i technik uczenia, jak jest to np. w przypadku rozpoznawania mowy i mówców, - czas trwania powinien umożliwić ekstrakcję podstawowych parametrów sygnału muzycznego, - czas trwania sygnału muzycznego powinien spełniać warunki ustawy o prawie autorskim, - sygnał muzyczny powinien być reprezentatywną próbką, a więc baza powinna zawierać fragmenty utworów o różnym stylu, różnej instrumentacji, różnej technice kodowania itp. 2

3 2. WYBRANE TECHNIKI KODOWANIA SYGNAŁÓW MUZYCZNYCH Tworząc akustyczną bazę sygnałów muzycznych wybrano 6 różnych technik kodowania. W kolejnych podrozdziałach przedstawiono bardzo skrótowo (encyklopedycznie) wybrane popularne współcześnie formaty plików dźwiękowych KODOWANIE MPEG AUDIO Standard MP3 (MPEG-1 Audio Layer 3), jeden z najpopularniejszych formatów plików dźwiękowych, został opracowany w Instytucie Fraunhofera przy współpracy z firmą Thomson w 1991 roku i zaaprobowany przez ISO jako międzynarodowy standard ((ISO ) [4]. Został on zrealizowany, w oparciu o algorytm zmodyfikowanej transformaty cosinusowej, w trzech wersjach rozwojowych nazywanych Layer 1, Layer 2 (mp2), Layer 3 (mp3), których podstawowe parametry podano w tabeli 1. Tab. 1. Podstawowe parametry kompresji MPEG audio dla sygnału stereofonicznego jakości CD Kodowanie Stopień kompresji Wymagana przepustowość sygnału PCM CD Quality Layer I Layer II 1 : 1 1 : 4 1 : 8 1,4 Mbit/s 384 kbit/s 192 kbit/s Layer III (MP3) 1 : kbit/s Wszystkie standardy MPEG audio używają takiego samego schematu kodowania polegającego na ograniczaniu wielkości strumienia audio poprzez usunięcie z niego tej części sygnału, która jest nieistotna z punktu widzenia słuchacza. W tym celu wykorzystuje się niedoskonałości ludzkiego ucha, a w szczególności tzw. efekt maskowania, czyli zjawisko zagłuszania słabego sygnału przez silny sygnał występujący w jego sąsiedztwie. Oznacza to, że można usunąć słabsze dźwięki występujące w okolicach dźwięków silnych i ucho tego nie zauważy. a jednocześnie pozostały sygnał użyteczny zawiera mniej informacji. Oprócz maskowania w standardzie MP3 wykorzystywany jest również inny efekt związany z percepcją dźwięków. Mianowicie, ze względu na małą szybkość transmisji bodźców nerwowych do mózgu, człowiek nie rozróżnia słabych dźwięków występujących na krótko przed oraz po wystąpieniu silnego sygnału. Standard MP3 wykorzystuje to zjawisko rozszerzając zakres maskowania, i tak: przed sygnałem maskującym maskowanie występuje w bardzo krótkim czasie od 2 do 5 ms (niektóre źródła podają 20 ms), a po sygnale w znacznie dłuższym czasie, bowiem od 50 ms do 200 ms KODOWANIE AAC Standard AAC (Advanced Audio Coding) jest formatem kompresji stratnej wykorzystującym rozwiązania zawarte w standardach MPEG-2 oraz MPEG-4 [9]. Kodek AAC pozwala na kodowanie z częstotliwością próbkowania do 96 khz, umożliwiając jednoczesną obsługę do 48 kanałów o pełnym pasmie przenoszenia w jednym strumieniu danych. Kodek ten oferuje cztery podstawowe profile kodowania, a mianowicie: LC (Low Complexity), MAIN (Main Profile), SRS (Sample-Rate Scalable) lub AAC-SSR (Advanced Audio Coding - Scalable Sample Rate) oraz LTP (Long Term Prediction). Kodowanie LC jest najprostszym i jednocześnie najpopularniejszym profilem, odtwarzanym przez wszystkie dekodery formatu AAC. Profil MAIN to nieco wyższy standard kodowania, który jest rozszerzeniem profilu LC. W profilach SRS lub AAC-SSR pasmo częstotliwości dzielone jest na cztery podpasma. W każdym z tych podpasm sygnał jest kompresowany oddzielnie. Efektem tego jest nieco 3

4 niższa jakość dźwięku niż w przypadku innych profili, ale za to stopień kompresji jest większy. Ostatni profil LTP jest rozszerzeniem profilu MAIN pozwalającym na uzyskanie lepszej jakości przetwarzanego dźwięku. Na bazie formatu AAC został opracowany również format HE-AAC (High Efficiency AAC (AAC+)) wykorzystujący technikę poszerzania pasma częstotliwości sygnału SBR (Spectral Band Replication), która sprawdza się szczególnie przy niskich szybkościach transmisji danych. Technika SBR polega na tym, że w koderze sygnał foniczny pozbawiony jest składowych wysokoczęstotliwościowych, a w dekoderze dokonuje się parametrycznej resyntezy górnej części widma sygnału metodą powtórzenia niskoczęstotliwościowych składowych, z odpowiednią korekcją energii na podstawie przesłanych parametrów obwiedni widmowej KODOWANIE OGG Kodowanie Ogg Vorbis jest formatem stratnej kompresji dźwięku opracowanym przez fundację Xpih.org. Format ogg złożony jest w dwóch rozwiązań, a mianowicie kodeka Vorbis i kontenera Ogg. Kodek Vorbis korzysta ze zmiennych wielkości strumieniowych, natomiast kontener Ogg przechowuje multipleksowe strumienie dźwięku oraz obrazu i napisów. Format ten występuję w postaci różnych rozszerzeń i tak pliki dźwiękowe mają rozszerzenie.ogg (dźwięk tylko w formacie Vorbis) bądź.oga, aplikacje -.ogx, pliki video -.ogv. Format Ogg wykorzystuje w zasadzie te same algorytmy co mp3. Pozwala obsłużyć 255 kanałów oraz 16-bitowy dźwięk w zakresie szybkości próbkowania 6-48 kpróbek/s. Dla sygnału stereofonicznego (2 kanały) próbkowanego z szybkością 44100próbek/s możliwa jest kompresja z szybkością z przedziału od 32kb/s do 499,9kb/c. Zaletą tego kodowania jest fakt, że nie został on opatentowany, a więc może być wykorzystywany zarówno do celów prywatnych, jak i komercyjnych bezpłatnie KODOWANIE AC3 Kodowanie AC3 (Audio Compression 3) znane również pod nazwami Dolby AC-3, Dolby Digatal AC3 czy też A/52 (nazwa przyjęta przez ATSC Advanced Television Systems Committe) [10] jest formatem kompresji stratnej wykorzystującym zmodyfikowaną dyskretną transformatę cosinusową (MDCT) do przeniesienia sygnału z dziedziny czasu do dziedziny częstotliwości. Współczynniki MDCT grupowane są w niejednorodne podpasma odpowiadające pasmom krytycznym słuchu człowieka. W każdym podpaśmie współczynniki MDCT przekształcane są na postać zmiennoprzecinkową z jedną lub wieloma mantysami na wykładnik Następnie model psychoakustyczmy wyznacza parametry percepcyjne potrzebne do kwantyzacji mantysy. Format AC3 pozwala na wielokanałowe zapisanie sygnału dźwiękowego próbkowanego z szybkością próbek/s i rozdzielczością 16 bitów lub 24 bitów. Zastosowana kompresja pozwala na zmniejszenie szybkości bitowej do 384 kb/s lub 448 kb/s dla zapisu wielokanałowego (5.1) albo do 192 kb/s dla dźwięku stereofonicznego (2.0) KODOWANIE WMA Standard WMA (Windows Media Audio) [12] jest formatem kompresji dźwięku opracowanym przez firmę Microsoft. Format ten, podobnie jak MP3, opiera się na algorytmie zmodyfikowanej transformaty cosinusowej oraz na modelu psychoakustycznym wykorzystującym niedoskonałości ucha ludzkiego. Kodowanie sygnału fonicznego może być realizowane ze stałą przepływnością strumienia bitowego CBR (Constant Bit Rate) bądź ze zmienną VBR (Variable Bit Rate). Dodatkowo w nowszych ge- 4

5 neracjach WMA wprowadzono możliwość kodowania ze średnią gęstością strumienia bitowego ABR (Average Bit Rate). Kodek WMA posiada opcję zapisu dźwięku próbkowanego z szybkością bitową próbek/s i rozdzielczością 24-bitów (w wersji WMA PRO), a także możliwość zapisu dźwięku wielokanałowego (7.1). W wersji WMA Lossless możliwy jest bezstratny zapis muzyki, wykorzystuje się VBR, a maksymalna liczba kanałów to sześć (5.1). Ostatnią wersją jest WMA Voice, który został opracowany do transmisji sygnału mowy. Nominalna szybkość próbkowania to próbek/s, przepływność CBR (do 20 kb/s), sygnał monofoniczny. 3. REALIZACJA AKUSTYCZNEJ BAZY SYGNAŁÓW MUZYCZNYCH Materiałem źródłowym była baza sygnałów muzycznych utworzona dla celów oceny jakości transmisji sygnałów audio, a także badań wpływy parametrów utworu muzycznego na wrażenia słuchacza. Składa się ze 160 fragmentów muzycznych reprezentujących różne gatunki muzyki. Wykorzystując sekwencje muzyczne opracowano listy testowe zgodnie z zaleceniem ITU [4], [6], [7]. Każda lista testowa składa się z 20 fragmentów muzycznych, których czas trwania nie przekracza 26s. Sekwencje muzyczne przedzielone są 8-10s okresami ciszy (rys.1). Parametry sygnałów muzycznych w bazie źródłowej są następujące: szybkość próbkowania próbek/s, rozdzielczość - 16 bitów, 2 kanały (stereo), format zapisu PCM. Rys. 1. Przykładowy przebieg czasowy listy 1 L Na potrzeby prezentowanej bazy sygnałów muzycznych poddanych wybranym technikom kodowania, oprócz list testowych wyselekcjonowano spośród wszystkich nagrań źródłowych 20 fragmentów muzycznych, reprezentujących różne style muzyki. Wyselekcjonowane sekwencje poddane zostały kodowaniu z różnymi przepływnościami. W tym celu wykorzystano program GermaniX Transcoder [10], który na cele niekomercyjny udostępniany jest na licencji Freeware. Konwersja plików wav na wybrane techniki kodowania została wykonana w ramach pacy dyplomowej inżynierskiej Bartosza Janusa [8]. W utworzonej bazie przyjęto następujące oznaczenia plików Mxxyyyzz Lxxyyyzz gdzie M oznacza plik muzyczny, natomiast L listę testową złożoną z 20 sekwencji muzycznych, xx liczba określająca rodzaj techniki kodowania, yyy - szybkość bitową, zz numer sekwencji audio. Tworząc bazę ograniczono się do 6 technik kodowania, a mianowicie mp3 (xx=01), mp2 (xx=02) ogg (xx=03), aac (xx=04), ac3 (xx=05) i wma (xx=06). Szybkość bitowa zawarta była w przedziale od 5

6 8 kb/s do 384 kb/s. przy czym, ze względu na możliwości konfiguracyjne użytego oprogramowania oraz ograniczenia wynikające ze standardów kodowania nie było możliwe stworzenie sekwencji audio dla wszystkich szybkości bitowych dla każdego kodeka. W tabeli poniżej przedstawiono zestawienie szybkości bitowych dla poszczególnych technik kodowania; oznaczenie + oznacza, że w danej technice kodowania określona szybkość bitowa została zastosowana, natomiast symbol - oznacza brak sygnału o tej wartości szybkości bitowej. Tab.1. Konfiguracja wartości szybkości bitowych [kb/s] (yyy) dla poszczególnych technik kodowania (xx) yyy xx Dla formatu AAC przy przepływności od 32 kb/s do 80 kb/s zastosowano kodowanie HE-AAC. W efekcie wykonanych konwersji utworzona została akustyczna baza sygnałów muzycznych poddanych wybranym technikom kodowania o złożonej strukturze katalogów zawierających wiele plików. Pierwszym poziomem jest podział na katalog zawierający pojedyncze sekwencje muzyczne (Folder Sekwencje muzyczne) oraz muzyczne listy testowe (Folder Listy muzyczne). W każdym z tych dwóch folderów utworzono foldery o nazwie będącej akronimem zastosowanej techniki kodowania. Każdy z folderów reprezentujących określoną technikę kodowania zawiera foldery odpowiadające szybkości bitowej zastosowanej podczas kodowania (rys. 2). Przykładowo ścieżka Listy muzyczne/mp3/064 oznacza, iż wybrana zostanie muzyczna lista testowa kodowana w formacie mp3 z szybkością bitową wynoszącą 64 kb/s. Rys. 2. Drzewo katalogów akustycznej bazy sygnałów muzycznych z wybranym przykładowo kodowaniem mp3; po prawej stronie foldery plików kodowanych z różną szybkością bitową. Celem zilustrowania różnic w charakterystykach sekwencji muzycznych z bazy poniżej przedstawiono na rysunkach 3 20 przykładowo wybraną sekwencję muzyczną kodowaną różnymi technikami. Na rysunkach przedstawiony został jeden kanał, natomiast rzeczywisty sygnał był sygnałem ste- 6

7 reofonicznym. Z kolei na rysunkach 21 i 22 przedstawiono przykładowe przebieg czasowy i gęstość widmową mocy wybranej listy testowej. Wszystkie prezentowane wykresy zostały otrzymane za pomocą skryptu napisanego w środowisku MATLAB [8]. Rys. 3. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 64kb/s). Rys. 4. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 96kb/s). Rys. 5. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 192kb/s). 7

8 Rys. 6. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 64kb/s). Rys. 7. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 96kb/s). Rys. 8. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 192kb/s). 8

9 Rys. 9. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AAC, 64kb/s). Rys. 10. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AAC, 96kb/s). Rys. 11. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie ACC, 192kb/s). 9

10 Rys. 12. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 64kb/s). Rys. 13. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 96kb/s). Rys. 14. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 192kb/s). 10

11 Rys. 15. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 64kb/s). Rys. 16. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 96kb/s). Rys. 17. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 192kb/s). 11

12 Rys. 18. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 64kb/s). Rys. 19. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 96kb/s). Rys. 20. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 192kb/s). 12

13 Rys. 21. Przebieg czasowy i gęstość widmowa mocy listy testowej L (kodowanie MP3, 64kb/s). Rys. 22. Przebieg czasowy i gęstość widmowa mocy listy testowej L (kodowanie MP3, 192kb/s). 4. PODSUMOWANIE Jak pokazały doświadczenia z bazą RWC Music Database jest ona stosowana w wielu ośrodkach w różnych dziedzinach jak np. analiza struktury muzycznej, analiza i identyfikacja instrumentów muzycznych, itp. [2]. Autorzy bazy RWC Music Database mają nadzieję, że będzie ona stosowana na całym świecie, a twórcy inny akustycznych baz sygnałów muzycznych pójdą w ich ślady, co przyczyni się do przyśpieszenia postępu w dziedzinie badań nad pozyskiwaniem informacji z sygnału muzycznego. Docelowa baza zostanie uzupełniona o różne metadane [2]. Prezentowana akustyczna baza sygnałów muzycznych jest pierwszym etapem w procesie tworzenia ujednoliconej, powszechnej bazy sygnałów muzycznych na potrzeby badań związanych z przetwarzaniem i oceną jakości sygnałów muzycznych. Docelowo przewidziane jest stworzenie akustycznej bazy sygnałów muzycznych z podziałem na styl muzyki m.in. muzyka poważna, kameralna, operowa, soul, jazz, rock, pop, blues, reggae itp. Baza będzie zawierać oprócz oryginalnych sygnałów muzycznych, również możliwie jak najszerszą grupę technik kodowania. Baza sygnałów muzycznych oryginalnych będzie zawierać sygnały próbkowane nie tylko z szybkością próbek/s, ale również próbek/s czy próbek/s. 13

14 LITERATURA [1] FRITTS L, University of Iowa musical instrument samples, [2] GOTO M., Development of the RWC Music Database, ICA 2004, [3] GOTO M., HASHIGUCHI H., NISHIMURA T., OKA R., RWC music database: Popular, classical, and jazz music databases, Proc. of ISMIR 2002, , [4] ISO/IEC, Information Technology - Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 3: Audio; Standard ISO/IEC , [5] ITU-R Recommendation BS.562-3, Subjective assessment of sound quality, 1990 [6] ITU-R Recommendation BS.1116, Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems, [7] ITU-R Recommendation BS.1284, General methods for the subjective assessment of sound quality, [8] JANUS B., Akustyczna baza sygnałów muzycznych poddanych wybranym technikom kodowania, Projekt inżynierski, Politechnika Wroclawska, Wroclaw [9] Li Z.N., Drew M.S., Fundamentals of multimedia, Pearsons Education Inc., 2004 [10] RFC 4184 RTP payload format for AC-3 audio, (LINK B., HAGER T., FLAKS J Proposed standard (dostęp ) [11] (dostęp ). [12] ACOUSTIC DATABASE OF MUSICAL SIGNALS ENCODED WITH CHOSEN TECHNIQUES The rising interest in high quality transmission of speech signal, music and video demands designing of new encoding techniques. The aim of the coding is the optimalisation of transmission, i.e. obtaining almost inperceptible quality worsening of transmitted signals for the lowest bitrate. In the paper the music signals database is presented where chosen coding techniques were applied (AAC, mp2, mp3, ac3, ogg and wma) with various bitrates (from 32 kb/s to 320 kb/s). The realized database can be used not only for the analysis of influence of the coding techniques and bitrates for the quality of music signal but also for the validation of quality of phonic signal transmission systems and amplifying or the verification of new objective quality evaluation techniques. 14

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da

Bardziej szczegółowo

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas

Bardziej szczegółowo

Kompresja dźwięku w standardzie MPEG-1

Kompresja dźwięku w standardzie MPEG-1 mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy

Bardziej szczegółowo

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików

Bardziej szczegółowo

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik Wykład VI Wydział Matematyki Stosowanej Politechniki Śląskiej Gliwice, 2014 c Copyright 2014 Janusz Słupik Kompresja dźwięku Kompresja dźwięku bezstratna podczas odtwarzania otrzymujemy wierne odwzorowanie

Bardziej szczegółowo

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania

Bardziej szczegółowo

Formaty plików audio

Formaty plików audio Formaty plików audio Spis treści 1.Formaty plików audio.... 2 Wav... 2 Aac... 2 AIFF... 2 Ogg... 2 Asf... 2 Mp1... 2 Mp2... 2 Mp3... 2 MP3PRO... 3 Mp4... 3 Wma... 3 Midi... 3 Ac3... 3 2. Różnica miedzy

Bardziej szczegółowo

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH 1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów

Bardziej szczegółowo

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK IV Konferencja Informatyka w Edukacji 31.01 01.02. 2007

Bardziej szczegółowo

Program wykładu. informatyka + 2

Program wykładu. informatyka + 2 Program wykładu 1. Jak słyszymy podstawy fizyczne i psychofizyczne, efekty maskowania 2. Sposoby zapisu sygnałów dźwiękowych 3. Sposoby kodowania sygnałów dźwiękowych ze szczególnym uwzględnieniem MP3

Bardziej szczegółowo

Formaty kompresji audio

Formaty kompresji audio Formaty kompresji audio Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest

Bardziej szczegółowo

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Dźwięk Co to jest dźwięk Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze

Bardziej szczegółowo

Wprowadzenie do cyfrowej obróbki dźwięku

Wprowadzenie do cyfrowej obróbki dźwięku Wprowadzenie do cyfrowej obróbki dźwięku Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana

Bardziej szczegółowo

Wielokanałowe systemy kodowania dźwięku

Wielokanałowe systemy kodowania dźwięku Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne

Bardziej szczegółowo

Dźwięk podstawowe wiadomości technik informatyk

Dźwięk podstawowe wiadomości technik informatyk Dźwięk podstawowe wiadomości technik informatyk I. Formaty plików opisz zalety, wady, rodzaj kompresji i twórców 1. Format WAVE. 2. Format MP3. 3. Format WMA. 4. Format MIDI. 5. Format AIFF. 6. Format

Bardziej szczegółowo

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr. Wymiana i Składowanie Danych Multimedialnych 2019 Mateusz Moderhak, matmod@biomed.eti.pg.gda.pl, EA 106, Pon. 11:15-12:00, śr. 12:15-13:00 Zaliczenie: 60% wykład, 40% laboratorium Zerówka w formie dwóch

Bardziej szczegółowo

Wielokanałowe systemy kodowania dźwięku

Wielokanałowe systemy kodowania dźwięku Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne

Bardziej szczegółowo

Ćwiczenie II. Edytor dźwięku Audacity

Ćwiczenie II. Edytor dźwięku Audacity Ćwiczenie II. Edytor dźwięku Audacity Sprzęt Aplikacja Komputer osobisty PC Karta dźwiękowa zainstalowana w PC Mikrofon Wzmacniacz z kolumnami Audacity Program Audacity jest wielościeżkowym edytorem dźwięku.

Bardziej szczegółowo

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg. Standard MP3 Historia Standard MPEG-1 - "Layer3" został opracowany w niemieckim instytucie Fraunhofer, a konkretnie w departamencie "Audio i Multimedia", gdzie około 30 inżynierów pracuje nad rozwojem

Bardziej szczegółowo

Standardowy zapis cyfrowego dźwięku

Standardowy zapis cyfrowego dźwięku Audio MoŜliwości współczesnych komputerów w zakresie obróbki materiałów multimedialnych są coraz większe. Komputer coraz częściej staje się elementem kina domowego lub zestawu stereo. Wybór programów moŝliwych

Bardziej szczegółowo

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. SYSTEMY MULTIMEDIALNE Co to jest system multimedialny? Elementy systemu multimedialnego Nośniki danych i ich wpływ na kodowanie Cele

Bardziej szczegółowo

Przesył mowy przez internet

Przesył mowy przez internet Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP

Bardziej szczegółowo

Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor

Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor DVD Audio Extractor jest programem za pomocą, którego możemy zgrać ścieżki dźwiękowe z płyt DVD w formacie w jakim są zapisane (LPCM,

Bardziej szczegółowo

Data wykonania Część praktyczna

Data wykonania Część praktyczna Grupa ćwicz. IIIb Nr ćwicz./ wersja 4 Imiona i nazwiska. Grupa lab. 7 Grzegorz Gliński Rok 3 IS Temat ćwiczenia. Internet Radio Broadcasting Data wykonania. 19.11.09 Data odbioru Ocena i uwagi Część praktyczna

Bardziej szczegółowo

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Pomiary w technice studyjnej. TESTY PESQ i PEAQ Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne

Bardziej szczegółowo

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład III: Kompresja danych 1 I. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010 101101001001 2 Kompresja

Bardziej szczegółowo

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011 109 ROZPOZNAWANIE MÓWCY W SYSTEMACH Z KODOWANIEM MOWY STEFAN BRACHMAŃSKI Politechnika Wrocławska, Instytut Telekomunikacji, Teleinformatyki i Akustyki Wybrzeże Wyspiańskiego 27, 50-370 Wrocław Stefan.brachmanski@pwr.wroc.pl

Bardziej szczegółowo

Systemy multimedialne Kodowanie dźwięków.

Systemy multimedialne Kodowanie dźwięków. Systemy multimedialne Kodowanie dźwięków. Paweł Szołtysek Spis treści 1 Wstęp 1 2 Analiza i omówienie formatów i narzędzi bezstratnego i stratnego kodowania dźwięków 2 2.1 Formaty zapisu danych dźwiękowych..............

Bardziej szczegółowo

Transformata Fouriera

Transformata Fouriera Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli

Bardziej szczegółowo

Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku

Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku Załącznik nr 7 do Uchwały nr 340/2014 Zarządu Spółki TVP S.A. z dnia 23 lipca 2014 r. Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku 1. Wymagania dotyczące

Bardziej szczegółowo

Metody kodowania i przechowywania sygnałów dźwiękowych. Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl

Metody kodowania i przechowywania sygnałów dźwiękowych. Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl < 74 > Informatyka + Wszechnica Popołudniowa > Metody kodowania i przechowywania sygnałów

Bardziej szczegółowo

Wybrane algorytmu kompresji dźwięku

Wybrane algorytmu kompresji dźwięku [1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji

Bardziej szczegółowo

Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego

Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego KODOWANIE PERCEPTUALNE Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego Wprowadzenie Cyfrowy sygnał foniczny w postaci nieskomprymowanej charakteryzuje się wysoką przepływnością strumienia

Bardziej szczegółowo

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Układ graficzny CKE 2019 Nazwa kwalifikacji: Montaż nagrań dźwiękowych Oznaczenie kwalifikacji: S.04 Wersja arkusza: X S.04-X-19.06

Bardziej szczegółowo

O sygnałach cyfrowych

O sygnałach cyfrowych O sygnałach cyfrowych Informacja Informacja - wielkość abstrakcyjna, która moŝe być: przechowywana w pewnych obiektach przesyłana pomiędzy pewnymi obiektami przetwarzana w pewnych obiektach stosowana do

Bardziej szczegółowo

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów 1. Przekształcenie sygnału analogowego na postać cyfrową określamy mianem: a. digitalizacji

Bardziej szczegółowo

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.

Bardziej szczegółowo

Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych

Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa

Bardziej szczegółowo

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010

Bardziej szczegółowo

Informacje na temat produktu C: Instalacja

Informacje na temat produktu C: Instalacja Informacje na temat produktu A: Analogowe wejścia i wyjścia B: Cyfrowe wejście i wyjście S/PDIF C: Wewnętrzne wejścia analogowe C A B Instalacja Przed przystąpieniem do instalacji: Jeśli karta główna posiada

Bardziej szczegółowo

Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych

Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa

Bardziej szczegółowo

Technika audio część 1

Technika audio część 1 Technika audio część 1 Wykład 9 Technologie na urządzenia mobilne Łukasz Kirchner Lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie technologii audio Próbkowanie Twierdzenie

Bardziej szczegółowo

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)

Bardziej szczegółowo

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych Plan wykładu Wprowadzenie 1. Wprowadzenie 2. Ilość informacji 3. Kodowanie

Bardziej szczegółowo

dr inż. Piotr Odya Kontener

dr inż. Piotr Odya Kontener dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura

Bardziej szczegółowo

Konwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux)

Konwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux) Konwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux) Wstęp W serwisie znajduje się już wiele opisów dotyczących konwersji plików AVI (DivX) do formatu DVD Video. Wszystkie te

Bardziej szczegółowo

Badanie jakości sygnałów audio

Badanie jakości sygnałów audio Badanie jakości sygnałów audio Przemysław Dymarski, Inst. Telekomunikacji PW Wykorzystano prace dypl. A.Kołodziejczyk, G. Kraciuk, M.Toczko, A.Sadowska Ocena jakości audio i wideo Metody subiektywne Metody

Bardziej szczegółowo

Audio i Audacity Formaty plików dźwiękowych. Strona 1 z 10

Audio i Audacity Formaty plików dźwiękowych. Strona 1 z 10 Audio i Audacity 1.1. Formaty plików dźwiękowych Aby można było odtworzyć dźwięk, musi on być zapisany w pliku we właściwym formacie. Do podstawowych formatów audio należą: plik audio AIFF (rozszerzenie.aiff),

Bardziej szczegółowo

Konwersja dźwięku analogowego do postaci cyfrowej

Konwersja dźwięku analogowego do postaci cyfrowej Konwersja dźwięku analogowego do postaci cyfrowej Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych

Bardziej szczegółowo

dr inż. Piotr Odya Wprowadzenie

dr inż. Piotr Odya Wprowadzenie dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów

Bardziej szczegółowo

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3

Bardziej szczegółowo

Standardy zapisu i transmisji dźwięku

Standardy zapisu i transmisji dźwięku Standardy zapisu i transmisji dźwięku dr inż. Piotr Odya Katedra Systemów Multimedialnych Cyfrowe standardy foniczne AES/EBU (Audio Eng. Society and the European Broadcast Union) połączenie za pomocą złącza

Bardziej szczegółowo

dr inż. Piotr Odya. Kontener

dr inż. Piotr Odya. Kontener dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura

Bardziej szczegółowo

SCENARIUSZ LEKCJI. Fale akustyczne oraz obróbka dźwięku (Fizyka poziom rozszerzony, Informatyka poziom rozszerzony)

SCENARIUSZ LEKCJI. Fale akustyczne oraz obróbka dźwięku (Fizyka poziom rozszerzony, Informatyka poziom rozszerzony) Autorzy scenariusza: SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH

Bardziej szczegółowo

Formaty plików. graficznych, dźwiękowych, wideo

Formaty plików. graficznych, dźwiękowych, wideo Formaty plików graficznych, dźwiękowych, wideo Spis treści: Wstęp: Co to jest format? Rodzaje formatów graficznych Właściwości formatów graficznych Porównanie formatów między sobą Formaty plików dźwiękowych

Bardziej szczegółowo

Percepcja dźwięku. Narząd słuchu

Percepcja dźwięku. Narząd słuchu Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;

Bardziej szczegółowo

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Zastosowanie kompresji w kryptografii Piotr Piotrowski Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

Kopia zapasowa DVD w programie DivX Converter

Kopia zapasowa DVD w programie DivX Converter Kopia zapasowa DVD w programie DivX Converter Słowo wstępne Pakiet dystrybucyjny DivX Create Bundle zawiera próbną wersję programu DivX Converter, którą możemy użytkować bezpłatnie przez pierwsze 15 dni

Bardziej szczegółowo

Wytwarzanie znaku wodnego w czasie rzeczywistym

Wytwarzanie znaku wodnego w czasie rzeczywistym Biuletyn WAT Vol. LV, Numer specjalny, 2006 Wytwarzanie znaku wodnego w czasie rzeczywistym BORYS BOGDAN, JERZY ŁOPATKA Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Telekomunikacji, 00-908

Bardziej szczegółowo

Standardy telewizji kolorowej (SD)

Standardy telewizji kolorowej (SD) dr inż. Piotr Odya Standardy telewizji kolorowej (SD) Europa PAL/SECAM standard 625linii/50Hz rozdzielczości: 768x576, 720x576, 704x576 (tzw. pełny PAL), 384x288, 352x288 (tzw. połówka PAL'u) Ameryka NTSC

Bardziej szczegółowo

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM

Bardziej szczegółowo

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA Układ graficzny CKE 2017 EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Nazwa kwalifikacji: Montaż

Bardziej szczegółowo

Tom 6 Opis oprogramowania

Tom 6 Opis oprogramowania Część 9 Narzędzie do wyliczania wskaźników statystycznych Diagnostyka Stanu Nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 31 maja 2012 Historia dokumentu Nazwa dokumentu Nazwa

Bardziej szczegółowo

Biblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann

Biblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann RGui Biblioteka: sound Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann Opracowała: Magdalena Wanat PLIKI.wav Format plików dźwiękowych stworzonych przez

Bardziej szczegółowo

Bose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe

Bose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe http://ultimateaudio.pl Bose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe Producent: Bose 999,00 zł Opcje produktu: Kod QR: Nasz najmniejszy system SoundTouch

Bardziej szczegółowo

Kompresja video (MPEG)

Kompresja video (MPEG) mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 1. Kompresja video (MEG) Zasadniczy schemat kompresora video Typy ramek przy kompresji czasowej Analiza ramek przez syntezę Sposób detekcji

Bardziej szczegółowo

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania

Bardziej szczegółowo

NOŚNIKI DŹWIĘKU I OBRAZU

NOŚNIKI DŹWIĘKU I OBRAZU NOŚNIKI DŹWIĘKU I OBRAZU PŁYTY CD, DVD, BLU-RAY PŁYTA CD 1 PŁYTA CD miała zastąpić kasetę analogową uboczny produkt prac laboratoriów firmy Philips nad LaserVision współpraca z SONY m (kodowanie sygnałów

Bardziej szczegółowo

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA. Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA. Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Układ graficzny CKE 2017 Nazwa kwalifikacji: Realizacja nagrań studyjnych Oznaczenie kwalifikacji: S.05 Numer zadania: 01 S.05-01-18.01

Bardziej szczegółowo

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze

Bardziej szczegółowo

Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych

Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych 1/65 Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych Paweł Forczmański pforczmanski@wi.zut.edu.pl 2/65 dr inż. Paweł Forczmański pforczmanski@wi.zut.edu.pl Kompresja a nośnik informacji

Bardziej szczegółowo

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Kodowanie podpasmowe Plan 1. Zasada. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania

Bardziej szczegółowo

Synchronizacja dźwięku i obrazu. Opracował: dr inż. Piotr Suchomski

Synchronizacja dźwięku i obrazu. Opracował: dr inż. Piotr Suchomski Synchronizacja dźwięku i obrazu Opracował: dr inż. Piotr Suchomski Wprowadzenie Technika integracji dźwięku i obrazu w multimediach ma niebagatelne znaczenie; Na jakość dzieła multimedialnego, w tym również

Bardziej szczegółowo

Synchronizacja dźwięku i obrazu

Synchronizacja dźwięku i obrazu Synchronizacja dźwięku i obrazu Opracował: dr inż. Piotr Suchomski Wprowadzenie Na jakość dzieła multimedialnego, w tym również filmowego, ma ogromny wpływ jakość synchronizacji dźwięku i obrazu; Zaawansowane

Bardziej szczegółowo

Jak usunąć wokal z nagrania?

Jak usunąć wokal z nagrania? Jak usunąć wokal z nagrania? Niektóre z edytorów audio posiadają funkcję usuwania wokali z nagrań (Voice Removal lub podobna). Może się ona przydać osobom pragnącym wykonać utwór karaoke bez ścieżki wokalnej.

Bardziej szczegółowo

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski Wprowadzenie do multimedialnych baz danych Opracował: dr inż. Piotr Suchomski Wprowadzenie bazy danych Multimedialne bazy danych to takie bazy danych, w których danymi mogą być tekst, zdjęcia, grafika,

Bardziej szczegółowo

5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD.

5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD. 5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD. Czym jest RMVB? Rmvb to kontener multimediów oferujący stratną metodę kompresji filmów, która pozwala na zmniejszenie wielkości

Bardziej szczegółowo

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które

Bardziej szczegółowo

Cechy karty dzwiękowej

Cechy karty dzwiękowej Karta dzwiękowa System audio Za generowanie sygnału dźwiękowego odpowiada system audio w skład którego wchodzą Karta dźwiękowa Głośniki komputerowe Większość obecnie produkowanych płyt głównych posiada

Bardziej szczegółowo

PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH

PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PRZETWARZANIE OBRAZÓW I DŹWIĘKÓW wykład 6 KOMPRESJA SYGNAŁÓW AKUSTYCZNYCH Prowadzący: Tomasz Kowalski Natura i percepcja dźwięków 2 Dźwięk - zarówno mowa, jak i

Bardziej szczegółowo

AIFF MP3 Wave Form Audio Format Windows Media Audio Vorbis Format WAVE Format MP3 Format WMA Format MIDI

AIFF MP3 Wave Form Audio Format Windows Media Audio Vorbis Format WAVE Format MP3 Format WMA Format MIDI A. Dźwięk i wideo 1. Dźwięk Aby można było odtworzyć dźwięk, musi on być zapisany w pliku we właściwym formacie. Do podstawowych fotmatów audio należą: Plik audio AIFF (rozszerzenie.aiff), Plik audio AU

Bardziej szczegółowo

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy

Bardziej szczegółowo

Kompresja sekwencji obrazów - algorytm MPEG-2

Kompresja sekwencji obrazów - algorytm MPEG-2 Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT

Bardziej szczegółowo

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1 Spis treści 1. Cyfrowy zapis i synteza dźwięku... 2 2. Schemat blokowy i zadania karty dźwiękowej... 4 UTK. Karty dźwiękowe. 1 1. Cyfrowy zapis i synteza dźwięku Proces kodowania informacji analogowej,

Bardziej szczegółowo

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego Bogdan Uljasz Wydział Elektroniki Wojskowej Akademii Technicznej ul. Kaliskiego 2 00-908 Warszawa Konferencja naukowo-techniczna Dzisiejsze

Bardziej szczegółowo

Podstawy Przetwarzania Sygnałów

Podstawy Przetwarzania Sygnałów Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech

Bardziej szczegółowo

Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku

Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku Matematyka i informatyka może i trudne, ale nie nudne Wykład 6 Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku prelegent: mgr inż Krzysztof Popowski 23 wrzesień 2009 Plan wykładu Podstawowe

Bardziej szczegółowo

Formaty plików wideo DSI III

Formaty plików wideo DSI III Formaty plików wideo DSI III Porównanie Statyczny obraz dobrej jakości w formacie bmp ma rozmiar 20 MB W typowym filmie wyświetla się ok. 25 klatek/s. Dla filmu trwającego 90 minut, czyli 90x60 = 5400

Bardziej szczegółowo

Specyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID

Specyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID Specyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID Prosimy o przesyłanie WSZYSTKICH reklam na następujący

Bardziej szczegółowo

I. Odbiór wypowiedzi i wykorzystanie zawartych w nich informacji.

I. Odbiór wypowiedzi i wykorzystanie zawartych w nich informacji. KARTA MONITOROWANIA PODSTAWY PROGRAMOWEJ KSZTAŁCENIA OGÓLNEGO III etap edukacyjny PG im. Tadeusza Kościuszki w Kościerzycach Przedmiot muzyka Klasa......... Rok szkolny Imię i nazwisko nauczyciela przedmiotu

Bardziej szczegółowo

Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.

Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski. Przetwarzanie i transmisja danych multimedialnych Wykład 10 Kompresja obrazów ruchomych MPEG Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych

Bardziej szczegółowo

Scalone dekodery audio firmy VLSI

Scalone dekodery audio firmy VLSI Scalone dekodery audio firmy VLSI Odtwarzacze muzyki zapisanej w plikach MP3 zdominowały rynek przenośnych urządzeń audio, większość z nich radzi sobie takŝe z innymi formatami zapisu sygnałów audio wysokiej

Bardziej szczegółowo

Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09

Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09 Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09 Zadanie 6. Zastosowanie technologii informatycznych w medycynie Sprawozdanie

Bardziej szczegółowo

Spis treści. 3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42

Spis treści. 3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42 3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42 Spis treści Wstęp...Z... 5 1. Zakup nagrywarki...z... 7 Wybór typu nagrywarki 7 Rodzaje złącz 8 Technologia Burn-Proof 8 Formaty

Bardziej szczegółowo

Technika audio część 2

Technika audio część 2 Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji

Bardziej szczegółowo

1. Wymagania dotyczące wizji. 2. Wymagania dotyczące fonii. 1.1 Standard wizji

1. Wymagania dotyczące wizji. 2. Wymagania dotyczące fonii. 1.1 Standard wizji Wymagania techniczne dotyczące audycji 3D HD przeznaczonych do emisji w TVP S.A. nagrywanych w formacie HD na taśmach HDCAM i HDCAM SR oraz dostarczanych w plikach 1. Wymagania dotyczące wizji 1.1 Standard

Bardziej szczegółowo