16th International Symposium on Sound Engineering and Tonmeistering
|
|
- Łukasz Kamiński
- 8 lat temu
- Przeglądów:
Transkrypt
1 Warszawa, 8-10 October 2015 AKUSTYCZNA BAZA SYGNAŁÓW MUZYCZNYCH KODOWANYCH WYBRANYMI TECHNIKAMI Stefan BRACHMAŃSKI Politechnika Wrocławska, Wyspiańskiego 27, Wrocław Rosnące zapotrzebowanie na transmisję wysokiej jakości sygnałów mowy, muzyki i video wymaga opracowywania nowych technik kodowania tych sygnałów. Celem kodowania jest zoptymalizowanie wykorzystania środków przekazu, tzn. uzyskanie prawie niezauważalnego pogorszenia jakości przesyłanych sygnałów dla jak najmniejszej szybkości bitowej. W artykule przedstawiono utworzoną bazę sygnałów muzycznych poddanych wybranym technikom kodowania ( AAC, mp2, mp3, ac3, ogg i wma) z różną szybkością bitową (od 32 kb/s do 320 kb/s). Zrealizowana baza może być wykorzystana nie tylko do analizy wpływu techniki kodowania i szybkości bitowej na jakość sygnału muzycznego, ale również m.in. do oceny jakości systemów transmisji sygnałów fonicznych i nagłośnieniowych, weryfikacji nowych obiektywnych metod oceny jakości. 1. WPROWADZENIE Badania dotyczące pozyskiwania różnych informacji z sygnałów muzycznych, a także na ich podstawie wymagają utworzenia akustycznej bazy takich sygnałów. Aby wyniki uzyskane przez różnych badaczy w różnych ośrodkach mogły być wzajemnie porównywane należy opracować uniwersalną akustyczną bazę sygnałów muzycznych. Baza powinna zawierać zarówno pliki źródłowe jak i poddane różnym technikom kodowania. W różnych ośrodkach tworzone są powszechnie dostępne bazy sygnałów muzycznych, np bazy dźwięków instrumentów muzycznych Master Samples na McGill University (za [2]), a także Musical Instrument Samples na University of Iowa [1] (za [2]). Niemniej jednak wciąż istnieje zapotrzebowanie na akustyczne bazy sygnałów muzycznych zawierające utwory instrumentalne oraz wokalne reprezentujące różne style muzyczne. W latach w Japonii w RealWorld Computing Partnership (RWCP) opracowano bazę sygnałów muzycznych o nazwie RWC Music Database (Real World Computing Music Database), która udostępniana jest bezpłatnie na cele naukowo-badawcze [2], [3]. Baza RWC Music Database spliki stereo w standardzie płyty CD czyli 16bit/44,1kHz, składa się z sześciu części: 1. Popular Music Database zawierająca 100 utworów, przy czym 20 z nich zawiera tekst w języku angielskim (amerykańskie przeboje lat 1980) i pozostałe (80) w języku japońskim (przeboje lat 1990); odnośnie do podziału na głosy, to 50 piosenek śpiewanych było 15 wokalistów, 14 piosenek - przez 13 wokalistek, a 6 utworów - przez 6 grup wokalnych. 2. Royalty-Free Music Database zawiera 15 utworów 10 bardzo znanych standardów popularnych piosenek angielskich i 5 barzdo znanych japońskich piosenek dla dzieci 3. Classical Music Database - 50 utworów, w tym 4 symfonie, 2 koncerty, 4 muzyka orkiestrowa, 10 muzyka kameralna, 24 wykonania solowe, 6 wykonania wokalne. Utwory zostały 1
2 wybrane tak, aby reprezentowały różne style, różną epokę, różną instrumentację, rożnych kompozytorów, różny nastrój. 4. Jazz Music Database zawiera 50 utworów; zmienność instrumentacji - 35 utworów (5 utworów 7 instrumentacji), zmienność stylów - 9 utworów, jazz fussion (jazz-rock) - 6 utworów W ramach zmienności instrumentacji uzyskano różne wersje tego samego utworu w różnych układach; pięć standardów jazzowych (modern-jazz) wykonano w siedmiu instrumentacjach, a mianowicie 1) fortepian solo, 2) solo, 3) duet (wibrafon + pianino, flet + fortepian lub pianino + bas), 4) trio fortepianowe, 5) trio fortepianowe + trąbka lub saksofon tenorowy, 6) oktet (trio fortepianowe + gitara + saksofon altowy + saksofon barytonowy + dwa saksofony tenorowy), 7) trio fortepianowe + wibrafon lub flet. W grupie zmienności stylów uwzględniono 2 utwory wokalne, 2 big band, 2 modal jazz, 2 funky jazz, 1 free jazz. Z kolei w grupie fusion jazz zawarte są utwory łączące muzykę jazzową z innymi popularnymi stylami, a więc reprezentujące jazz-pop, jazz-rock i latn jazz 5. Music Genre Database (100 utworów) składa się ze 100utworów muzycznych; po 3 dla każdego gatunku muzyki i 1 wykonany a capella. Ta baza została podzielona na 10 głównych kategorii (pop, rock, dance, jazz, muzyka latynoamerykańska, muzyka klasyczna, marsze, muzyka świat, muzyka wokalna i tradycyjnej muzyka japońska) i 33 podkategorie (muzyka popularna, ballady, rock, heavy metal, rap/hip-hop, house, techno, funky, soul/r & B, big band, modern jazz, fusion, bossa nova, samba, reggae, tango, muzyka barokowa, muzyka klasyczna, muzyka romantyczna, muzyka współczesna, orkiestra dęta, blues, folk, country, gospel, muzyka afrykańska, muzyka indyjska, flamenco, chanson, canzone, japońska muzyka popularna Enka, japońska muzyka ludowa Min'you i starożytna japońska muzyka dworska Gagaku). Autorzy bazy zastrzegają, iż ten podział nie jest obligatoryjny lecz został ustalony z uwagi na wygodne podczas nagrywania poszczególnych utworów muzycznych. [2] 6. Musical Instrument Sound Database zawiera sekwencje muzyczne grane w sumie przez 150 instrumentów - 50 rodzajów instrumentów muzycznych w 3 różnych wariantach (3 producenci instrumentów muzycznych, 3 muzycy; różne style; dla każdego stylu gry, muzyk grał poszczególne dźwięki w odstępach co pół tonu w całym zakresie tonów, które mogą być generowane przez ten instrumentu; trzy poziomy dynamiki (forte, mezzosopran, fortepian), obejmujących cały zakres dynamiki instrumentu). Główne założenia w procesie tworzenia powszechnych, akustycznych baz sygnałów muzycznych można sformułować następująco: - baza powinna być ogólnodostępna, bezpłatna na cele naukowo-badawcze i dydaktyczne, a więc pozwalać na korzystanie bez ograniczeń w publikacjach naukowych, prezentacjach oraz w dydaktyce, - baza powinna zachęcać do stosowania metod wnioskowania statystycznego i technik uczenia, jak jest to np. w przypadku rozpoznawania mowy i mówców, - czas trwania powinien umożliwić ekstrakcję podstawowych parametrów sygnału muzycznego, - czas trwania sygnału muzycznego powinien spełniać warunki ustawy o prawie autorskim, - sygnał muzyczny powinien być reprezentatywną próbką, a więc baza powinna zawierać fragmenty utworów o różnym stylu, różnej instrumentacji, różnej technice kodowania itp. 2
3 2. WYBRANE TECHNIKI KODOWANIA SYGNAŁÓW MUZYCZNYCH Tworząc akustyczną bazę sygnałów muzycznych wybrano 6 różnych technik kodowania. W kolejnych podrozdziałach przedstawiono bardzo skrótowo (encyklopedycznie) wybrane popularne współcześnie formaty plików dźwiękowych KODOWANIE MPEG AUDIO Standard MP3 (MPEG-1 Audio Layer 3), jeden z najpopularniejszych formatów plików dźwiękowych, został opracowany w Instytucie Fraunhofera przy współpracy z firmą Thomson w 1991 roku i zaaprobowany przez ISO jako międzynarodowy standard ((ISO ) [4]. Został on zrealizowany, w oparciu o algorytm zmodyfikowanej transformaty cosinusowej, w trzech wersjach rozwojowych nazywanych Layer 1, Layer 2 (mp2), Layer 3 (mp3), których podstawowe parametry podano w tabeli 1. Tab. 1. Podstawowe parametry kompresji MPEG audio dla sygnału stereofonicznego jakości CD Kodowanie Stopień kompresji Wymagana przepustowość sygnału PCM CD Quality Layer I Layer II 1 : 1 1 : 4 1 : 8 1,4 Mbit/s 384 kbit/s 192 kbit/s Layer III (MP3) 1 : kbit/s Wszystkie standardy MPEG audio używają takiego samego schematu kodowania polegającego na ograniczaniu wielkości strumienia audio poprzez usunięcie z niego tej części sygnału, która jest nieistotna z punktu widzenia słuchacza. W tym celu wykorzystuje się niedoskonałości ludzkiego ucha, a w szczególności tzw. efekt maskowania, czyli zjawisko zagłuszania słabego sygnału przez silny sygnał występujący w jego sąsiedztwie. Oznacza to, że można usunąć słabsze dźwięki występujące w okolicach dźwięków silnych i ucho tego nie zauważy. a jednocześnie pozostały sygnał użyteczny zawiera mniej informacji. Oprócz maskowania w standardzie MP3 wykorzystywany jest również inny efekt związany z percepcją dźwięków. Mianowicie, ze względu na małą szybkość transmisji bodźców nerwowych do mózgu, człowiek nie rozróżnia słabych dźwięków występujących na krótko przed oraz po wystąpieniu silnego sygnału. Standard MP3 wykorzystuje to zjawisko rozszerzając zakres maskowania, i tak: przed sygnałem maskującym maskowanie występuje w bardzo krótkim czasie od 2 do 5 ms (niektóre źródła podają 20 ms), a po sygnale w znacznie dłuższym czasie, bowiem od 50 ms do 200 ms KODOWANIE AAC Standard AAC (Advanced Audio Coding) jest formatem kompresji stratnej wykorzystującym rozwiązania zawarte w standardach MPEG-2 oraz MPEG-4 [9]. Kodek AAC pozwala na kodowanie z częstotliwością próbkowania do 96 khz, umożliwiając jednoczesną obsługę do 48 kanałów o pełnym pasmie przenoszenia w jednym strumieniu danych. Kodek ten oferuje cztery podstawowe profile kodowania, a mianowicie: LC (Low Complexity), MAIN (Main Profile), SRS (Sample-Rate Scalable) lub AAC-SSR (Advanced Audio Coding - Scalable Sample Rate) oraz LTP (Long Term Prediction). Kodowanie LC jest najprostszym i jednocześnie najpopularniejszym profilem, odtwarzanym przez wszystkie dekodery formatu AAC. Profil MAIN to nieco wyższy standard kodowania, który jest rozszerzeniem profilu LC. W profilach SRS lub AAC-SSR pasmo częstotliwości dzielone jest na cztery podpasma. W każdym z tych podpasm sygnał jest kompresowany oddzielnie. Efektem tego jest nieco 3
4 niższa jakość dźwięku niż w przypadku innych profili, ale za to stopień kompresji jest większy. Ostatni profil LTP jest rozszerzeniem profilu MAIN pozwalającym na uzyskanie lepszej jakości przetwarzanego dźwięku. Na bazie formatu AAC został opracowany również format HE-AAC (High Efficiency AAC (AAC+)) wykorzystujący technikę poszerzania pasma częstotliwości sygnału SBR (Spectral Band Replication), która sprawdza się szczególnie przy niskich szybkościach transmisji danych. Technika SBR polega na tym, że w koderze sygnał foniczny pozbawiony jest składowych wysokoczęstotliwościowych, a w dekoderze dokonuje się parametrycznej resyntezy górnej części widma sygnału metodą powtórzenia niskoczęstotliwościowych składowych, z odpowiednią korekcją energii na podstawie przesłanych parametrów obwiedni widmowej KODOWANIE OGG Kodowanie Ogg Vorbis jest formatem stratnej kompresji dźwięku opracowanym przez fundację Xpih.org. Format ogg złożony jest w dwóch rozwiązań, a mianowicie kodeka Vorbis i kontenera Ogg. Kodek Vorbis korzysta ze zmiennych wielkości strumieniowych, natomiast kontener Ogg przechowuje multipleksowe strumienie dźwięku oraz obrazu i napisów. Format ten występuję w postaci różnych rozszerzeń i tak pliki dźwiękowe mają rozszerzenie.ogg (dźwięk tylko w formacie Vorbis) bądź.oga, aplikacje -.ogx, pliki video -.ogv. Format Ogg wykorzystuje w zasadzie te same algorytmy co mp3. Pozwala obsłużyć 255 kanałów oraz 16-bitowy dźwięk w zakresie szybkości próbkowania 6-48 kpróbek/s. Dla sygnału stereofonicznego (2 kanały) próbkowanego z szybkością 44100próbek/s możliwa jest kompresja z szybkością z przedziału od 32kb/s do 499,9kb/c. Zaletą tego kodowania jest fakt, że nie został on opatentowany, a więc może być wykorzystywany zarówno do celów prywatnych, jak i komercyjnych bezpłatnie KODOWANIE AC3 Kodowanie AC3 (Audio Compression 3) znane również pod nazwami Dolby AC-3, Dolby Digatal AC3 czy też A/52 (nazwa przyjęta przez ATSC Advanced Television Systems Committe) [10] jest formatem kompresji stratnej wykorzystującym zmodyfikowaną dyskretną transformatę cosinusową (MDCT) do przeniesienia sygnału z dziedziny czasu do dziedziny częstotliwości. Współczynniki MDCT grupowane są w niejednorodne podpasma odpowiadające pasmom krytycznym słuchu człowieka. W każdym podpaśmie współczynniki MDCT przekształcane są na postać zmiennoprzecinkową z jedną lub wieloma mantysami na wykładnik Następnie model psychoakustyczmy wyznacza parametry percepcyjne potrzebne do kwantyzacji mantysy. Format AC3 pozwala na wielokanałowe zapisanie sygnału dźwiękowego próbkowanego z szybkością próbek/s i rozdzielczością 16 bitów lub 24 bitów. Zastosowana kompresja pozwala na zmniejszenie szybkości bitowej do 384 kb/s lub 448 kb/s dla zapisu wielokanałowego (5.1) albo do 192 kb/s dla dźwięku stereofonicznego (2.0) KODOWANIE WMA Standard WMA (Windows Media Audio) [12] jest formatem kompresji dźwięku opracowanym przez firmę Microsoft. Format ten, podobnie jak MP3, opiera się na algorytmie zmodyfikowanej transformaty cosinusowej oraz na modelu psychoakustycznym wykorzystującym niedoskonałości ucha ludzkiego. Kodowanie sygnału fonicznego może być realizowane ze stałą przepływnością strumienia bitowego CBR (Constant Bit Rate) bądź ze zmienną VBR (Variable Bit Rate). Dodatkowo w nowszych ge- 4
5 neracjach WMA wprowadzono możliwość kodowania ze średnią gęstością strumienia bitowego ABR (Average Bit Rate). Kodek WMA posiada opcję zapisu dźwięku próbkowanego z szybkością bitową próbek/s i rozdzielczością 24-bitów (w wersji WMA PRO), a także możliwość zapisu dźwięku wielokanałowego (7.1). W wersji WMA Lossless możliwy jest bezstratny zapis muzyki, wykorzystuje się VBR, a maksymalna liczba kanałów to sześć (5.1). Ostatnią wersją jest WMA Voice, który został opracowany do transmisji sygnału mowy. Nominalna szybkość próbkowania to próbek/s, przepływność CBR (do 20 kb/s), sygnał monofoniczny. 3. REALIZACJA AKUSTYCZNEJ BAZY SYGNAŁÓW MUZYCZNYCH Materiałem źródłowym była baza sygnałów muzycznych utworzona dla celów oceny jakości transmisji sygnałów audio, a także badań wpływy parametrów utworu muzycznego na wrażenia słuchacza. Składa się ze 160 fragmentów muzycznych reprezentujących różne gatunki muzyki. Wykorzystując sekwencje muzyczne opracowano listy testowe zgodnie z zaleceniem ITU [4], [6], [7]. Każda lista testowa składa się z 20 fragmentów muzycznych, których czas trwania nie przekracza 26s. Sekwencje muzyczne przedzielone są 8-10s okresami ciszy (rys.1). Parametry sygnałów muzycznych w bazie źródłowej są następujące: szybkość próbkowania próbek/s, rozdzielczość - 16 bitów, 2 kanały (stereo), format zapisu PCM. Rys. 1. Przykładowy przebieg czasowy listy 1 L Na potrzeby prezentowanej bazy sygnałów muzycznych poddanych wybranym technikom kodowania, oprócz list testowych wyselekcjonowano spośród wszystkich nagrań źródłowych 20 fragmentów muzycznych, reprezentujących różne style muzyki. Wyselekcjonowane sekwencje poddane zostały kodowaniu z różnymi przepływnościami. W tym celu wykorzystano program GermaniX Transcoder [10], który na cele niekomercyjny udostępniany jest na licencji Freeware. Konwersja plików wav na wybrane techniki kodowania została wykonana w ramach pacy dyplomowej inżynierskiej Bartosza Janusa [8]. W utworzonej bazie przyjęto następujące oznaczenia plików Mxxyyyzz Lxxyyyzz gdzie M oznacza plik muzyczny, natomiast L listę testową złożoną z 20 sekwencji muzycznych, xx liczba określająca rodzaj techniki kodowania, yyy - szybkość bitową, zz numer sekwencji audio. Tworząc bazę ograniczono się do 6 technik kodowania, a mianowicie mp3 (xx=01), mp2 (xx=02) ogg (xx=03), aac (xx=04), ac3 (xx=05) i wma (xx=06). Szybkość bitowa zawarta była w przedziale od 5
6 8 kb/s do 384 kb/s. przy czym, ze względu na możliwości konfiguracyjne użytego oprogramowania oraz ograniczenia wynikające ze standardów kodowania nie było możliwe stworzenie sekwencji audio dla wszystkich szybkości bitowych dla każdego kodeka. W tabeli poniżej przedstawiono zestawienie szybkości bitowych dla poszczególnych technik kodowania; oznaczenie + oznacza, że w danej technice kodowania określona szybkość bitowa została zastosowana, natomiast symbol - oznacza brak sygnału o tej wartości szybkości bitowej. Tab.1. Konfiguracja wartości szybkości bitowych [kb/s] (yyy) dla poszczególnych technik kodowania (xx) yyy xx Dla formatu AAC przy przepływności od 32 kb/s do 80 kb/s zastosowano kodowanie HE-AAC. W efekcie wykonanych konwersji utworzona została akustyczna baza sygnałów muzycznych poddanych wybranym technikom kodowania o złożonej strukturze katalogów zawierających wiele plików. Pierwszym poziomem jest podział na katalog zawierający pojedyncze sekwencje muzyczne (Folder Sekwencje muzyczne) oraz muzyczne listy testowe (Folder Listy muzyczne). W każdym z tych dwóch folderów utworzono foldery o nazwie będącej akronimem zastosowanej techniki kodowania. Każdy z folderów reprezentujących określoną technikę kodowania zawiera foldery odpowiadające szybkości bitowej zastosowanej podczas kodowania (rys. 2). Przykładowo ścieżka Listy muzyczne/mp3/064 oznacza, iż wybrana zostanie muzyczna lista testowa kodowana w formacie mp3 z szybkością bitową wynoszącą 64 kb/s. Rys. 2. Drzewo katalogów akustycznej bazy sygnałów muzycznych z wybranym przykładowo kodowaniem mp3; po prawej stronie foldery plików kodowanych z różną szybkością bitową. Celem zilustrowania różnic w charakterystykach sekwencji muzycznych z bazy poniżej przedstawiono na rysunkach 3 20 przykładowo wybraną sekwencję muzyczną kodowaną różnymi technikami. Na rysunkach przedstawiony został jeden kanał, natomiast rzeczywisty sygnał był sygnałem ste- 6
7 reofonicznym. Z kolei na rysunkach 21 i 22 przedstawiono przykładowe przebieg czasowy i gęstość widmową mocy wybranej listy testowej. Wszystkie prezentowane wykresy zostały otrzymane za pomocą skryptu napisanego w środowisku MATLAB [8]. Rys. 3. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 64kb/s). Rys. 4. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 96kb/s). Rys. 5. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 192kb/s). 7
8 Rys. 6. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 64kb/s). Rys. 7. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 96kb/s). Rys. 8. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 192kb/s). 8
9 Rys. 9. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AAC, 64kb/s). Rys. 10. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AAC, 96kb/s). Rys. 11. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie ACC, 192kb/s). 9
10 Rys. 12. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 64kb/s). Rys. 13. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 96kb/s). Rys. 14. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 192kb/s). 10
11 Rys. 15. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 64kb/s). Rys. 16. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 96kb/s). Rys. 17. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 192kb/s). 11
12 Rys. 18. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 64kb/s). Rys. 19. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 96kb/s). Rys. 20. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 192kb/s). 12
13 Rys. 21. Przebieg czasowy i gęstość widmowa mocy listy testowej L (kodowanie MP3, 64kb/s). Rys. 22. Przebieg czasowy i gęstość widmowa mocy listy testowej L (kodowanie MP3, 192kb/s). 4. PODSUMOWANIE Jak pokazały doświadczenia z bazą RWC Music Database jest ona stosowana w wielu ośrodkach w różnych dziedzinach jak np. analiza struktury muzycznej, analiza i identyfikacja instrumentów muzycznych, itp. [2]. Autorzy bazy RWC Music Database mają nadzieję, że będzie ona stosowana na całym świecie, a twórcy inny akustycznych baz sygnałów muzycznych pójdą w ich ślady, co przyczyni się do przyśpieszenia postępu w dziedzinie badań nad pozyskiwaniem informacji z sygnału muzycznego. Docelowa baza zostanie uzupełniona o różne metadane [2]. Prezentowana akustyczna baza sygnałów muzycznych jest pierwszym etapem w procesie tworzenia ujednoliconej, powszechnej bazy sygnałów muzycznych na potrzeby badań związanych z przetwarzaniem i oceną jakości sygnałów muzycznych. Docelowo przewidziane jest stworzenie akustycznej bazy sygnałów muzycznych z podziałem na styl muzyki m.in. muzyka poważna, kameralna, operowa, soul, jazz, rock, pop, blues, reggae itp. Baza będzie zawierać oprócz oryginalnych sygnałów muzycznych, również możliwie jak najszerszą grupę technik kodowania. Baza sygnałów muzycznych oryginalnych będzie zawierać sygnały próbkowane nie tylko z szybkością próbek/s, ale również próbek/s czy próbek/s. 13
14 LITERATURA [1] FRITTS L, University of Iowa musical instrument samples, [2] GOTO M., Development of the RWC Music Database, ICA 2004, [3] GOTO M., HASHIGUCHI H., NISHIMURA T., OKA R., RWC music database: Popular, classical, and jazz music databases, Proc. of ISMIR 2002, , [4] ISO/IEC, Information Technology - Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 3: Audio; Standard ISO/IEC , [5] ITU-R Recommendation BS.562-3, Subjective assessment of sound quality, 1990 [6] ITU-R Recommendation BS.1116, Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems, [7] ITU-R Recommendation BS.1284, General methods for the subjective assessment of sound quality, [8] JANUS B., Akustyczna baza sygnałów muzycznych poddanych wybranym technikom kodowania, Projekt inżynierski, Politechnika Wroclawska, Wroclaw [9] Li Z.N., Drew M.S., Fundamentals of multimedia, Pearsons Education Inc., 2004 [10] RFC 4184 RTP payload format for AC-3 audio, (LINK B., HAGER T., FLAKS J Proposed standard (dostęp ) [11] (dostęp ). [12] ACOUSTIC DATABASE OF MUSICAL SIGNALS ENCODED WITH CHOSEN TECHNIQUES The rising interest in high quality transmission of speech signal, music and video demands designing of new encoding techniques. The aim of the coding is the optimalisation of transmission, i.e. obtaining almost inperceptible quality worsening of transmitted signals for the lowest bitrate. In the paper the music signals database is presented where chosen coding techniques were applied (AAC, mp2, mp3, ac3, ogg and wma) with various bitrates (from 32 kb/s to 320 kb/s). The realized database can be used not only for the analysis of influence of the coding techniques and bitrates for the quality of music signal but also for the validation of quality of phonic signal transmission systems and amplifying or the verification of new objective quality evaluation techniques. 14
Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona
DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da
dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db
dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas
Kompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP
dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików
Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik
Wykład VI Wydział Matematyki Stosowanej Politechniki Śląskiej Gliwice, 2014 c Copyright 2014 Janusz Słupik Kompresja dźwięku Kompresja dźwięku bezstratna podczas odtwarzania otrzymujemy wierne odwzorowanie
Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Formaty plików audio
Formaty plików audio Spis treści 1.Formaty plików audio.... 2 Wav... 2 Aac... 2 AIFF... 2 Ogg... 2 Asf... 2 Mp1... 2 Mp2... 2 Mp3... 2 MP3PRO... 3 Mp4... 3 Wma... 3 Midi... 3 Ac3... 3 2. Różnica miedzy
2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH
1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów
Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK
Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK IV Konferencja Informatyka w Edukacji 31.01 01.02. 2007
Program wykładu. informatyka + 2
Program wykładu 1. Jak słyszymy podstawy fizyczne i psychofizyczne, efekty maskowania 2. Sposoby zapisu sygnałów dźwiękowych 3. Sposoby kodowania sygnałów dźwiękowych ze szczególnym uwzględnieniem MP3
Formaty kompresji audio
Formaty kompresji audio Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest
Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz
Dźwięk Co to jest dźwięk Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze
Wprowadzenie do cyfrowej obróbki dźwięku
Wprowadzenie do cyfrowej obróbki dźwięku Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana
Wielokanałowe systemy kodowania dźwięku
Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne
Dźwięk podstawowe wiadomości technik informatyk
Dźwięk podstawowe wiadomości technik informatyk I. Formaty plików opisz zalety, wady, rodzaj kompresji i twórców 1. Format WAVE. 2. Format MP3. 3. Format WMA. 4. Format MIDI. 5. Format AIFF. 6. Format
Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.
Wymiana i Składowanie Danych Multimedialnych 2019 Mateusz Moderhak, matmod@biomed.eti.pg.gda.pl, EA 106, Pon. 11:15-12:00, śr. 12:15-13:00 Zaliczenie: 60% wykład, 40% laboratorium Zerówka w formie dwóch
Wielokanałowe systemy kodowania dźwięku
Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne
Ćwiczenie II. Edytor dźwięku Audacity
Ćwiczenie II. Edytor dźwięku Audacity Sprzęt Aplikacja Komputer osobisty PC Karta dźwiękowa zainstalowana w PC Mikrofon Wzmacniacz z kolumnami Audacity Program Audacity jest wielościeżkowym edytorem dźwięku.
Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.
Standard MP3 Historia Standard MPEG-1 - "Layer3" został opracowany w niemieckim instytucie Fraunhofer, a konkretnie w departamencie "Audio i Multimedia", gdzie około 30 inżynierów pracuje nad rozwojem
Standardowy zapis cyfrowego dźwięku
Audio MoŜliwości współczesnych komputerów w zakresie obróbki materiałów multimedialnych są coraz większe. Komputer coraz częściej staje się elementem kina domowego lub zestawu stereo. Wybór programów moŝliwych
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. SYSTEMY MULTIMEDIALNE Co to jest system multimedialny? Elementy systemu multimedialnego Nośniki danych i ich wpływ na kodowanie Cele
Przesył mowy przez internet
Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP
Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor
Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor DVD Audio Extractor jest programem za pomocą, którego możemy zgrać ścieżki dźwiękowe z płyt DVD w formacie w jakim są zapisane (LPCM,
Data wykonania Część praktyczna
Grupa ćwicz. IIIb Nr ćwicz./ wersja 4 Imiona i nazwiska. Grupa lab. 7 Grzegorz Gliński Rok 3 IS Temat ćwiczenia. Internet Radio Broadcasting Data wykonania. 19.11.09 Data odbioru Ocena i uwagi Część praktyczna
Pomiary w technice studyjnej. TESTY PESQ i PEAQ
Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne
Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład III: Kompresja danych 1 I. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010 101101001001 2 Kompresja
58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011
109 ROZPOZNAWANIE MÓWCY W SYSTEMACH Z KODOWANIEM MOWY STEFAN BRACHMAŃSKI Politechnika Wrocławska, Instytut Telekomunikacji, Teleinformatyki i Akustyki Wybrzeże Wyspiańskiego 27, 50-370 Wrocław Stefan.brachmanski@pwr.wroc.pl
Systemy multimedialne Kodowanie dźwięków.
Systemy multimedialne Kodowanie dźwięków. Paweł Szołtysek Spis treści 1 Wstęp 1 2 Analiza i omówienie formatów i narzędzi bezstratnego i stratnego kodowania dźwięków 2 2.1 Formaty zapisu danych dźwiękowych..............
Transformata Fouriera
Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli
Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku
Załącznik nr 7 do Uchwały nr 340/2014 Zarządu Spółki TVP S.A. z dnia 23 lipca 2014 r. Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku 1. Wymagania dotyczące
Metody kodowania i przechowywania sygnałów dźwiękowych. Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl
Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl < 74 > Informatyka + Wszechnica Popołudniowa > Metody kodowania i przechowywania sygnałów
Wybrane algorytmu kompresji dźwięku
[1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji
Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego
KODOWANIE PERCEPTUALNE Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego Wprowadzenie Cyfrowy sygnał foniczny w postaci nieskomprymowanej charakteryzuje się wysoką przepływnością strumienia
EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA
Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Układ graficzny CKE 2019 Nazwa kwalifikacji: Montaż nagrań dźwiękowych Oznaczenie kwalifikacji: S.04 Wersja arkusza: X S.04-X-19.06
O sygnałach cyfrowych
O sygnałach cyfrowych Informacja Informacja - wielkość abstrakcyjna, która moŝe być: przechowywana w pewnych obiektach przesyłana pomiędzy pewnymi obiektami przetwarzana w pewnych obiektach stosowana do
Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów
Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów 1. Przekształcenie sygnału analogowego na postać cyfrową określamy mianem: a. digitalizacji
Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski
Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa
Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010
Informacje na temat produktu C: Instalacja
Informacje na temat produktu A: Analogowe wejścia i wyjścia B: Cyfrowe wejście i wyjście S/PDIF C: Wewnętrzne wejścia analogowe C A B Instalacja Przed przystąpieniem do instalacji: Jeśli karta główna posiada
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa
Technika audio część 1
Technika audio część 1 Wykład 9 Technologie na urządzenia mobilne Łukasz Kirchner Lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie technologii audio Próbkowanie Twierdzenie
PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09
RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)
Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński
Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych Plan wykładu Wprowadzenie 1. Wprowadzenie 2. Ilość informacji 3. Kodowanie
dr inż. Piotr Odya Kontener
dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura
Konwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux)
Konwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux) Wstęp W serwisie znajduje się już wiele opisów dotyczących konwersji plików AVI (DivX) do formatu DVD Video. Wszystkie te
Badanie jakości sygnałów audio
Badanie jakości sygnałów audio Przemysław Dymarski, Inst. Telekomunikacji PW Wykorzystano prace dypl. A.Kołodziejczyk, G. Kraciuk, M.Toczko, A.Sadowska Ocena jakości audio i wideo Metody subiektywne Metody
Audio i Audacity Formaty plików dźwiękowych. Strona 1 z 10
Audio i Audacity 1.1. Formaty plików dźwiękowych Aby można było odtworzyć dźwięk, musi on być zapisany w pliku we właściwym formacie. Do podstawowych formatów audio należą: plik audio AIFF (rozszerzenie.aiff),
Konwersja dźwięku analogowego do postaci cyfrowej
Konwersja dźwięku analogowego do postaci cyfrowej Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych
dr inż. Piotr Odya Wprowadzenie
dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów
Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech
Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3
Standardy zapisu i transmisji dźwięku
Standardy zapisu i transmisji dźwięku dr inż. Piotr Odya Katedra Systemów Multimedialnych Cyfrowe standardy foniczne AES/EBU (Audio Eng. Society and the European Broadcast Union) połączenie za pomocą złącza
dr inż. Piotr Odya. Kontener
dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura
SCENARIUSZ LEKCJI. Fale akustyczne oraz obróbka dźwięku (Fizyka poziom rozszerzony, Informatyka poziom rozszerzony)
Autorzy scenariusza: SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH
Formaty plików. graficznych, dźwiękowych, wideo
Formaty plików graficznych, dźwiękowych, wideo Spis treści: Wstęp: Co to jest format? Rodzaje formatów graficznych Właściwości formatów graficznych Porównanie formatów między sobą Formaty plików dźwiękowych
Percepcja dźwięku. Narząd słuchu
Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;
Zastosowanie kompresji w kryptografii Piotr Piotrowski
Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Kopia zapasowa DVD w programie DivX Converter
Kopia zapasowa DVD w programie DivX Converter Słowo wstępne Pakiet dystrybucyjny DivX Create Bundle zawiera próbną wersję programu DivX Converter, którą możemy użytkować bezpłatnie przez pierwsze 15 dni
Wytwarzanie znaku wodnego w czasie rzeczywistym
Biuletyn WAT Vol. LV, Numer specjalny, 2006 Wytwarzanie znaku wodnego w czasie rzeczywistym BORYS BOGDAN, JERZY ŁOPATKA Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Telekomunikacji, 00-908
Standardy telewizji kolorowej (SD)
dr inż. Piotr Odya Standardy telewizji kolorowej (SD) Europa PAL/SECAM standard 625linii/50Hz rozdzielczości: 768x576, 720x576, 704x576 (tzw. pełny PAL), 384x288, 352x288 (tzw. połówka PAL'u) Ameryka NTSC
KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP
KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM
EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA
Układ graficzny CKE 2017 EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Nazwa kwalifikacji: Montaż
Tom 6 Opis oprogramowania
Część 9 Narzędzie do wyliczania wskaźników statystycznych Diagnostyka Stanu Nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 31 maja 2012 Historia dokumentu Nazwa dokumentu Nazwa
Biblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann
RGui Biblioteka: sound Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann Opracowała: Magdalena Wanat PLIKI.wav Format plików dźwiękowych stworzonych przez
Bose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe
http://ultimateaudio.pl Bose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe Producent: Bose 999,00 zł Opcje produktu: Kod QR: Nasz najmniejszy system SoundTouch
Kompresja video (MPEG)
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 1. Kompresja video (MEG) Zasadniczy schemat kompresora video Typy ramek przy kompresji czasowej Analiza ramek przez syntezę Sposób detekcji
P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
NOŚNIKI DŹWIĘKU I OBRAZU
NOŚNIKI DŹWIĘKU I OBRAZU PŁYTY CD, DVD, BLU-RAY PŁYTA CD 1 PŁYTA CD miała zastąpić kasetę analogową uboczny produkt prac laboratoriów firmy Philips nad LaserVision współpraca z SONY m (kodowanie sygnałów
EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA. Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu
Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Układ graficzny CKE 2017 Nazwa kwalifikacji: Realizacja nagrań studyjnych Oznaczenie kwalifikacji: S.05 Numer zadania: 01 S.05-01-18.01
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych
1/65 Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych Paweł Forczmański pforczmanski@wi.zut.edu.pl 2/65 dr inż. Paweł Forczmański pforczmanski@wi.zut.edu.pl Kompresja a nośnik informacji
Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Synchronizacja dźwięku i obrazu. Opracował: dr inż. Piotr Suchomski
Synchronizacja dźwięku i obrazu Opracował: dr inż. Piotr Suchomski Wprowadzenie Technika integracji dźwięku i obrazu w multimediach ma niebagatelne znaczenie; Na jakość dzieła multimedialnego, w tym również
Synchronizacja dźwięku i obrazu
Synchronizacja dźwięku i obrazu Opracował: dr inż. Piotr Suchomski Wprowadzenie Na jakość dzieła multimedialnego, w tym również filmowego, ma ogromny wpływ jakość synchronizacji dźwięku i obrazu; Zaawansowane
Jak usunąć wokal z nagrania?
Jak usunąć wokal z nagrania? Niektóre z edytorów audio posiadają funkcję usuwania wokali z nagrań (Voice Removal lub podobna). Może się ona przydać osobom pragnącym wykonać utwór karaoke bez ścieżki wokalnej.
Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski
Wprowadzenie do multimedialnych baz danych Opracował: dr inż. Piotr Suchomski Wprowadzenie bazy danych Multimedialne bazy danych to takie bazy danych, w których danymi mogą być tekst, zdjęcia, grafika,
5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD.
5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD. Czym jest RMVB? Rmvb to kontener multimediów oferujący stratną metodę kompresji filmów, która pozwala na zmniejszenie wielkości
Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa
Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które
Cechy karty dzwiękowej
Karta dzwiękowa System audio Za generowanie sygnału dźwiękowego odpowiada system audio w skład którego wchodzą Karta dźwiękowa Głośniki komputerowe Większość obecnie produkowanych płyt głównych posiada
PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH
PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PRZETWARZANIE OBRAZÓW I DŹWIĘKÓW wykład 6 KOMPRESJA SYGNAŁÓW AKUSTYCZNYCH Prowadzący: Tomasz Kowalski Natura i percepcja dźwięków 2 Dźwięk - zarówno mowa, jak i
AIFF MP3 Wave Form Audio Format Windows Media Audio Vorbis Format WAVE Format MP3 Format WMA Format MIDI
A. Dźwięk i wideo 1. Dźwięk Aby można było odtworzyć dźwięk, musi on być zapisany w pliku we właściwym formacie. Do podstawowych fotmatów audio należą: Plik audio AIFF (rozszerzenie.aiff), Plik audio AU
Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
Kompresja sekwencji obrazów - algorytm MPEG-2
Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT
Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1
Spis treści 1. Cyfrowy zapis i synteza dźwięku... 2 2. Schemat blokowy i zadania karty dźwiękowej... 4 UTK. Karty dźwiękowe. 1 1. Cyfrowy zapis i synteza dźwięku Proces kodowania informacji analogowej,
Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego
Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego Bogdan Uljasz Wydział Elektroniki Wojskowej Akademii Technicznej ul. Kaliskiego 2 00-908 Warszawa Konferencja naukowo-techniczna Dzisiejsze
Podstawy Przetwarzania Sygnałów
Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech
Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku
Matematyka i informatyka może i trudne, ale nie nudne Wykład 6 Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku prelegent: mgr inż Krzysztof Popowski 23 wrzesień 2009 Plan wykładu Podstawowe
Formaty plików wideo DSI III
Formaty plików wideo DSI III Porównanie Statyczny obraz dobrej jakości w formacie bmp ma rozmiar 20 MB W typowym filmie wyświetla się ok. 25 klatek/s. Dla filmu trwającego 90 minut, czyli 90x60 = 5400
Specyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID
Specyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID Prosimy o przesyłanie WSZYSTKICH reklam na następujący
I. Odbiór wypowiedzi i wykorzystanie zawartych w nich informacji.
KARTA MONITOROWANIA PODSTAWY PROGRAMOWEJ KSZTAŁCENIA OGÓLNEGO III etap edukacyjny PG im. Tadeusza Kościuszki w Kościerzycach Przedmiot muzyka Klasa......... Rok szkolny Imię i nazwisko nauczyciela przedmiotu
Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 10 Kompresja obrazów ruchomych MPEG Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych
Scalone dekodery audio firmy VLSI
Scalone dekodery audio firmy VLSI Odtwarzacze muzyki zapisanej w plikach MP3 zdominowały rynek przenośnych urządzeń audio, większość z nich radzi sobie takŝe z innymi formatami zapisu sygnałów audio wysokiej
Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09
Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09 Zadanie 6. Zastosowanie technologii informatycznych w medycynie Sprawozdanie
Spis treści. 3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42
3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42 Spis treści Wstęp...Z... 5 1. Zakup nagrywarki...z... 7 Wybór typu nagrywarki 7 Rodzaje złącz 8 Technologia Burn-Proof 8 Formaty
Technika audio część 2
Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji
1. Wymagania dotyczące wizji. 2. Wymagania dotyczące fonii. 1.1 Standard wizji
Wymagania techniczne dotyczące audycji 3D HD przeznaczonych do emisji w TVP S.A. nagrywanych w formacie HD na taśmach HDCAM i HDCAM SR oraz dostarczanych w plikach 1. Wymagania dotyczące wizji 1.1 Standard