16th International Symposium on Sound Engineering and Tonmeistering
|
|
- Łukasz Kamiński
- 7 lat temu
- Przeglądów:
Transkrypt
1 Warszawa, 8-10 October 2015 AKUSTYCZNA BAZA SYGNAŁÓW MUZYCZNYCH KODOWANYCH WYBRANYMI TECHNIKAMI Stefan BRACHMAŃSKI Politechnika Wrocławska, Wyspiańskiego 27, Wrocław Rosnące zapotrzebowanie na transmisję wysokiej jakości sygnałów mowy, muzyki i video wymaga opracowywania nowych technik kodowania tych sygnałów. Celem kodowania jest zoptymalizowanie wykorzystania środków przekazu, tzn. uzyskanie prawie niezauważalnego pogorszenia jakości przesyłanych sygnałów dla jak najmniejszej szybkości bitowej. W artykule przedstawiono utworzoną bazę sygnałów muzycznych poddanych wybranym technikom kodowania ( AAC, mp2, mp3, ac3, ogg i wma) z różną szybkością bitową (od 32 kb/s do 320 kb/s). Zrealizowana baza może być wykorzystana nie tylko do analizy wpływu techniki kodowania i szybkości bitowej na jakość sygnału muzycznego, ale również m.in. do oceny jakości systemów transmisji sygnałów fonicznych i nagłośnieniowych, weryfikacji nowych obiektywnych metod oceny jakości. 1. WPROWADZENIE Badania dotyczące pozyskiwania różnych informacji z sygnałów muzycznych, a także na ich podstawie wymagają utworzenia akustycznej bazy takich sygnałów. Aby wyniki uzyskane przez różnych badaczy w różnych ośrodkach mogły być wzajemnie porównywane należy opracować uniwersalną akustyczną bazę sygnałów muzycznych. Baza powinna zawierać zarówno pliki źródłowe jak i poddane różnym technikom kodowania. W różnych ośrodkach tworzone są powszechnie dostępne bazy sygnałów muzycznych, np bazy dźwięków instrumentów muzycznych Master Samples na McGill University (za [2]), a także Musical Instrument Samples na University of Iowa [1] (za [2]). Niemniej jednak wciąż istnieje zapotrzebowanie na akustyczne bazy sygnałów muzycznych zawierające utwory instrumentalne oraz wokalne reprezentujące różne style muzyczne. W latach w Japonii w RealWorld Computing Partnership (RWCP) opracowano bazę sygnałów muzycznych o nazwie RWC Music Database (Real World Computing Music Database), która udostępniana jest bezpłatnie na cele naukowo-badawcze [2], [3]. Baza RWC Music Database spliki stereo w standardzie płyty CD czyli 16bit/44,1kHz, składa się z sześciu części: 1. Popular Music Database zawierająca 100 utworów, przy czym 20 z nich zawiera tekst w języku angielskim (amerykańskie przeboje lat 1980) i pozostałe (80) w języku japońskim (przeboje lat 1990); odnośnie do podziału na głosy, to 50 piosenek śpiewanych było 15 wokalistów, 14 piosenek - przez 13 wokalistek, a 6 utworów - przez 6 grup wokalnych. 2. Royalty-Free Music Database zawiera 15 utworów 10 bardzo znanych standardów popularnych piosenek angielskich i 5 barzdo znanych japońskich piosenek dla dzieci 3. Classical Music Database - 50 utworów, w tym 4 symfonie, 2 koncerty, 4 muzyka orkiestrowa, 10 muzyka kameralna, 24 wykonania solowe, 6 wykonania wokalne. Utwory zostały 1
2 wybrane tak, aby reprezentowały różne style, różną epokę, różną instrumentację, rożnych kompozytorów, różny nastrój. 4. Jazz Music Database zawiera 50 utworów; zmienność instrumentacji - 35 utworów (5 utworów 7 instrumentacji), zmienność stylów - 9 utworów, jazz fussion (jazz-rock) - 6 utworów W ramach zmienności instrumentacji uzyskano różne wersje tego samego utworu w różnych układach; pięć standardów jazzowych (modern-jazz) wykonano w siedmiu instrumentacjach, a mianowicie 1) fortepian solo, 2) solo, 3) duet (wibrafon + pianino, flet + fortepian lub pianino + bas), 4) trio fortepianowe, 5) trio fortepianowe + trąbka lub saksofon tenorowy, 6) oktet (trio fortepianowe + gitara + saksofon altowy + saksofon barytonowy + dwa saksofony tenorowy), 7) trio fortepianowe + wibrafon lub flet. W grupie zmienności stylów uwzględniono 2 utwory wokalne, 2 big band, 2 modal jazz, 2 funky jazz, 1 free jazz. Z kolei w grupie fusion jazz zawarte są utwory łączące muzykę jazzową z innymi popularnymi stylami, a więc reprezentujące jazz-pop, jazz-rock i latn jazz 5. Music Genre Database (100 utworów) składa się ze 100utworów muzycznych; po 3 dla każdego gatunku muzyki i 1 wykonany a capella. Ta baza została podzielona na 10 głównych kategorii (pop, rock, dance, jazz, muzyka latynoamerykańska, muzyka klasyczna, marsze, muzyka świat, muzyka wokalna i tradycyjnej muzyka japońska) i 33 podkategorie (muzyka popularna, ballady, rock, heavy metal, rap/hip-hop, house, techno, funky, soul/r & B, big band, modern jazz, fusion, bossa nova, samba, reggae, tango, muzyka barokowa, muzyka klasyczna, muzyka romantyczna, muzyka współczesna, orkiestra dęta, blues, folk, country, gospel, muzyka afrykańska, muzyka indyjska, flamenco, chanson, canzone, japońska muzyka popularna Enka, japońska muzyka ludowa Min'you i starożytna japońska muzyka dworska Gagaku). Autorzy bazy zastrzegają, iż ten podział nie jest obligatoryjny lecz został ustalony z uwagi na wygodne podczas nagrywania poszczególnych utworów muzycznych. [2] 6. Musical Instrument Sound Database zawiera sekwencje muzyczne grane w sumie przez 150 instrumentów - 50 rodzajów instrumentów muzycznych w 3 różnych wariantach (3 producenci instrumentów muzycznych, 3 muzycy; różne style; dla każdego stylu gry, muzyk grał poszczególne dźwięki w odstępach co pół tonu w całym zakresie tonów, które mogą być generowane przez ten instrumentu; trzy poziomy dynamiki (forte, mezzosopran, fortepian), obejmujących cały zakres dynamiki instrumentu). Główne założenia w procesie tworzenia powszechnych, akustycznych baz sygnałów muzycznych można sformułować następująco: - baza powinna być ogólnodostępna, bezpłatna na cele naukowo-badawcze i dydaktyczne, a więc pozwalać na korzystanie bez ograniczeń w publikacjach naukowych, prezentacjach oraz w dydaktyce, - baza powinna zachęcać do stosowania metod wnioskowania statystycznego i technik uczenia, jak jest to np. w przypadku rozpoznawania mowy i mówców, - czas trwania powinien umożliwić ekstrakcję podstawowych parametrów sygnału muzycznego, - czas trwania sygnału muzycznego powinien spełniać warunki ustawy o prawie autorskim, - sygnał muzyczny powinien być reprezentatywną próbką, a więc baza powinna zawierać fragmenty utworów o różnym stylu, różnej instrumentacji, różnej technice kodowania itp. 2
3 2. WYBRANE TECHNIKI KODOWANIA SYGNAŁÓW MUZYCZNYCH Tworząc akustyczną bazę sygnałów muzycznych wybrano 6 różnych technik kodowania. W kolejnych podrozdziałach przedstawiono bardzo skrótowo (encyklopedycznie) wybrane popularne współcześnie formaty plików dźwiękowych KODOWANIE MPEG AUDIO Standard MP3 (MPEG-1 Audio Layer 3), jeden z najpopularniejszych formatów plików dźwiękowych, został opracowany w Instytucie Fraunhofera przy współpracy z firmą Thomson w 1991 roku i zaaprobowany przez ISO jako międzynarodowy standard ((ISO ) [4]. Został on zrealizowany, w oparciu o algorytm zmodyfikowanej transformaty cosinusowej, w trzech wersjach rozwojowych nazywanych Layer 1, Layer 2 (mp2), Layer 3 (mp3), których podstawowe parametry podano w tabeli 1. Tab. 1. Podstawowe parametry kompresji MPEG audio dla sygnału stereofonicznego jakości CD Kodowanie Stopień kompresji Wymagana przepustowość sygnału PCM CD Quality Layer I Layer II 1 : 1 1 : 4 1 : 8 1,4 Mbit/s 384 kbit/s 192 kbit/s Layer III (MP3) 1 : kbit/s Wszystkie standardy MPEG audio używają takiego samego schematu kodowania polegającego na ograniczaniu wielkości strumienia audio poprzez usunięcie z niego tej części sygnału, która jest nieistotna z punktu widzenia słuchacza. W tym celu wykorzystuje się niedoskonałości ludzkiego ucha, a w szczególności tzw. efekt maskowania, czyli zjawisko zagłuszania słabego sygnału przez silny sygnał występujący w jego sąsiedztwie. Oznacza to, że można usunąć słabsze dźwięki występujące w okolicach dźwięków silnych i ucho tego nie zauważy. a jednocześnie pozostały sygnał użyteczny zawiera mniej informacji. Oprócz maskowania w standardzie MP3 wykorzystywany jest również inny efekt związany z percepcją dźwięków. Mianowicie, ze względu na małą szybkość transmisji bodźców nerwowych do mózgu, człowiek nie rozróżnia słabych dźwięków występujących na krótko przed oraz po wystąpieniu silnego sygnału. Standard MP3 wykorzystuje to zjawisko rozszerzając zakres maskowania, i tak: przed sygnałem maskującym maskowanie występuje w bardzo krótkim czasie od 2 do 5 ms (niektóre źródła podają 20 ms), a po sygnale w znacznie dłuższym czasie, bowiem od 50 ms do 200 ms KODOWANIE AAC Standard AAC (Advanced Audio Coding) jest formatem kompresji stratnej wykorzystującym rozwiązania zawarte w standardach MPEG-2 oraz MPEG-4 [9]. Kodek AAC pozwala na kodowanie z częstotliwością próbkowania do 96 khz, umożliwiając jednoczesną obsługę do 48 kanałów o pełnym pasmie przenoszenia w jednym strumieniu danych. Kodek ten oferuje cztery podstawowe profile kodowania, a mianowicie: LC (Low Complexity), MAIN (Main Profile), SRS (Sample-Rate Scalable) lub AAC-SSR (Advanced Audio Coding - Scalable Sample Rate) oraz LTP (Long Term Prediction). Kodowanie LC jest najprostszym i jednocześnie najpopularniejszym profilem, odtwarzanym przez wszystkie dekodery formatu AAC. Profil MAIN to nieco wyższy standard kodowania, który jest rozszerzeniem profilu LC. W profilach SRS lub AAC-SSR pasmo częstotliwości dzielone jest na cztery podpasma. W każdym z tych podpasm sygnał jest kompresowany oddzielnie. Efektem tego jest nieco 3
4 niższa jakość dźwięku niż w przypadku innych profili, ale za to stopień kompresji jest większy. Ostatni profil LTP jest rozszerzeniem profilu MAIN pozwalającym na uzyskanie lepszej jakości przetwarzanego dźwięku. Na bazie formatu AAC został opracowany również format HE-AAC (High Efficiency AAC (AAC+)) wykorzystujący technikę poszerzania pasma częstotliwości sygnału SBR (Spectral Band Replication), która sprawdza się szczególnie przy niskich szybkościach transmisji danych. Technika SBR polega na tym, że w koderze sygnał foniczny pozbawiony jest składowych wysokoczęstotliwościowych, a w dekoderze dokonuje się parametrycznej resyntezy górnej części widma sygnału metodą powtórzenia niskoczęstotliwościowych składowych, z odpowiednią korekcją energii na podstawie przesłanych parametrów obwiedni widmowej KODOWANIE OGG Kodowanie Ogg Vorbis jest formatem stratnej kompresji dźwięku opracowanym przez fundację Xpih.org. Format ogg złożony jest w dwóch rozwiązań, a mianowicie kodeka Vorbis i kontenera Ogg. Kodek Vorbis korzysta ze zmiennych wielkości strumieniowych, natomiast kontener Ogg przechowuje multipleksowe strumienie dźwięku oraz obrazu i napisów. Format ten występuję w postaci różnych rozszerzeń i tak pliki dźwiękowe mają rozszerzenie.ogg (dźwięk tylko w formacie Vorbis) bądź.oga, aplikacje -.ogx, pliki video -.ogv. Format Ogg wykorzystuje w zasadzie te same algorytmy co mp3. Pozwala obsłużyć 255 kanałów oraz 16-bitowy dźwięk w zakresie szybkości próbkowania 6-48 kpróbek/s. Dla sygnału stereofonicznego (2 kanały) próbkowanego z szybkością 44100próbek/s możliwa jest kompresja z szybkością z przedziału od 32kb/s do 499,9kb/c. Zaletą tego kodowania jest fakt, że nie został on opatentowany, a więc może być wykorzystywany zarówno do celów prywatnych, jak i komercyjnych bezpłatnie KODOWANIE AC3 Kodowanie AC3 (Audio Compression 3) znane również pod nazwami Dolby AC-3, Dolby Digatal AC3 czy też A/52 (nazwa przyjęta przez ATSC Advanced Television Systems Committe) [10] jest formatem kompresji stratnej wykorzystującym zmodyfikowaną dyskretną transformatę cosinusową (MDCT) do przeniesienia sygnału z dziedziny czasu do dziedziny częstotliwości. Współczynniki MDCT grupowane są w niejednorodne podpasma odpowiadające pasmom krytycznym słuchu człowieka. W każdym podpaśmie współczynniki MDCT przekształcane są na postać zmiennoprzecinkową z jedną lub wieloma mantysami na wykładnik Następnie model psychoakustyczmy wyznacza parametry percepcyjne potrzebne do kwantyzacji mantysy. Format AC3 pozwala na wielokanałowe zapisanie sygnału dźwiękowego próbkowanego z szybkością próbek/s i rozdzielczością 16 bitów lub 24 bitów. Zastosowana kompresja pozwala na zmniejszenie szybkości bitowej do 384 kb/s lub 448 kb/s dla zapisu wielokanałowego (5.1) albo do 192 kb/s dla dźwięku stereofonicznego (2.0) KODOWANIE WMA Standard WMA (Windows Media Audio) [12] jest formatem kompresji dźwięku opracowanym przez firmę Microsoft. Format ten, podobnie jak MP3, opiera się na algorytmie zmodyfikowanej transformaty cosinusowej oraz na modelu psychoakustycznym wykorzystującym niedoskonałości ucha ludzkiego. Kodowanie sygnału fonicznego może być realizowane ze stałą przepływnością strumienia bitowego CBR (Constant Bit Rate) bądź ze zmienną VBR (Variable Bit Rate). Dodatkowo w nowszych ge- 4
5 neracjach WMA wprowadzono możliwość kodowania ze średnią gęstością strumienia bitowego ABR (Average Bit Rate). Kodek WMA posiada opcję zapisu dźwięku próbkowanego z szybkością bitową próbek/s i rozdzielczością 24-bitów (w wersji WMA PRO), a także możliwość zapisu dźwięku wielokanałowego (7.1). W wersji WMA Lossless możliwy jest bezstratny zapis muzyki, wykorzystuje się VBR, a maksymalna liczba kanałów to sześć (5.1). Ostatnią wersją jest WMA Voice, który został opracowany do transmisji sygnału mowy. Nominalna szybkość próbkowania to próbek/s, przepływność CBR (do 20 kb/s), sygnał monofoniczny. 3. REALIZACJA AKUSTYCZNEJ BAZY SYGNAŁÓW MUZYCZNYCH Materiałem źródłowym była baza sygnałów muzycznych utworzona dla celów oceny jakości transmisji sygnałów audio, a także badań wpływy parametrów utworu muzycznego na wrażenia słuchacza. Składa się ze 160 fragmentów muzycznych reprezentujących różne gatunki muzyki. Wykorzystując sekwencje muzyczne opracowano listy testowe zgodnie z zaleceniem ITU [4], [6], [7]. Każda lista testowa składa się z 20 fragmentów muzycznych, których czas trwania nie przekracza 26s. Sekwencje muzyczne przedzielone są 8-10s okresami ciszy (rys.1). Parametry sygnałów muzycznych w bazie źródłowej są następujące: szybkość próbkowania próbek/s, rozdzielczość - 16 bitów, 2 kanały (stereo), format zapisu PCM. Rys. 1. Przykładowy przebieg czasowy listy 1 L Na potrzeby prezentowanej bazy sygnałów muzycznych poddanych wybranym technikom kodowania, oprócz list testowych wyselekcjonowano spośród wszystkich nagrań źródłowych 20 fragmentów muzycznych, reprezentujących różne style muzyki. Wyselekcjonowane sekwencje poddane zostały kodowaniu z różnymi przepływnościami. W tym celu wykorzystano program GermaniX Transcoder [10], który na cele niekomercyjny udostępniany jest na licencji Freeware. Konwersja plików wav na wybrane techniki kodowania została wykonana w ramach pacy dyplomowej inżynierskiej Bartosza Janusa [8]. W utworzonej bazie przyjęto następujące oznaczenia plików Mxxyyyzz Lxxyyyzz gdzie M oznacza plik muzyczny, natomiast L listę testową złożoną z 20 sekwencji muzycznych, xx liczba określająca rodzaj techniki kodowania, yyy - szybkość bitową, zz numer sekwencji audio. Tworząc bazę ograniczono się do 6 technik kodowania, a mianowicie mp3 (xx=01), mp2 (xx=02) ogg (xx=03), aac (xx=04), ac3 (xx=05) i wma (xx=06). Szybkość bitowa zawarta była w przedziale od 5
6 8 kb/s do 384 kb/s. przy czym, ze względu na możliwości konfiguracyjne użytego oprogramowania oraz ograniczenia wynikające ze standardów kodowania nie było możliwe stworzenie sekwencji audio dla wszystkich szybkości bitowych dla każdego kodeka. W tabeli poniżej przedstawiono zestawienie szybkości bitowych dla poszczególnych technik kodowania; oznaczenie + oznacza, że w danej technice kodowania określona szybkość bitowa została zastosowana, natomiast symbol - oznacza brak sygnału o tej wartości szybkości bitowej. Tab.1. Konfiguracja wartości szybkości bitowych [kb/s] (yyy) dla poszczególnych technik kodowania (xx) yyy xx Dla formatu AAC przy przepływności od 32 kb/s do 80 kb/s zastosowano kodowanie HE-AAC. W efekcie wykonanych konwersji utworzona została akustyczna baza sygnałów muzycznych poddanych wybranym technikom kodowania o złożonej strukturze katalogów zawierających wiele plików. Pierwszym poziomem jest podział na katalog zawierający pojedyncze sekwencje muzyczne (Folder Sekwencje muzyczne) oraz muzyczne listy testowe (Folder Listy muzyczne). W każdym z tych dwóch folderów utworzono foldery o nazwie będącej akronimem zastosowanej techniki kodowania. Każdy z folderów reprezentujących określoną technikę kodowania zawiera foldery odpowiadające szybkości bitowej zastosowanej podczas kodowania (rys. 2). Przykładowo ścieżka Listy muzyczne/mp3/064 oznacza, iż wybrana zostanie muzyczna lista testowa kodowana w formacie mp3 z szybkością bitową wynoszącą 64 kb/s. Rys. 2. Drzewo katalogów akustycznej bazy sygnałów muzycznych z wybranym przykładowo kodowaniem mp3; po prawej stronie foldery plików kodowanych z różną szybkością bitową. Celem zilustrowania różnic w charakterystykach sekwencji muzycznych z bazy poniżej przedstawiono na rysunkach 3 20 przykładowo wybraną sekwencję muzyczną kodowaną różnymi technikami. Na rysunkach przedstawiony został jeden kanał, natomiast rzeczywisty sygnał był sygnałem ste- 6
7 reofonicznym. Z kolei na rysunkach 21 i 22 przedstawiono przykładowe przebieg czasowy i gęstość widmową mocy wybranej listy testowej. Wszystkie prezentowane wykresy zostały otrzymane za pomocą skryptu napisanego w środowisku MATLAB [8]. Rys. 3. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 64kb/s). Rys. 4. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 96kb/s). Rys. 5. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP2, 192kb/s). 7
8 Rys. 6. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 64kb/s). Rys. 7. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 96kb/s). Rys. 8. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie MP3, 192kb/s). 8
9 Rys. 9. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AAC, 64kb/s). Rys. 10. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AAC, 96kb/s). Rys. 11. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie ACC, 192kb/s). 9
10 Rys. 12. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 64kb/s). Rys. 13. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 96kb/s). Rys. 14. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie OGG, 192kb/s). 10
11 Rys. 15. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 64kb/s). Rys. 16. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 96kb/s). Rys. 17. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie AC3, 192kb/s). 11
12 Rys. 18. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 64kb/s). Rys. 19. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 96kb/s). Rys. 20. Przebieg czasowy i gęstość widmowa mocy sygnału M (kodowanie WMA, 192kb/s). 12
13 Rys. 21. Przebieg czasowy i gęstość widmowa mocy listy testowej L (kodowanie MP3, 64kb/s). Rys. 22. Przebieg czasowy i gęstość widmowa mocy listy testowej L (kodowanie MP3, 192kb/s). 4. PODSUMOWANIE Jak pokazały doświadczenia z bazą RWC Music Database jest ona stosowana w wielu ośrodkach w różnych dziedzinach jak np. analiza struktury muzycznej, analiza i identyfikacja instrumentów muzycznych, itp. [2]. Autorzy bazy RWC Music Database mają nadzieję, że będzie ona stosowana na całym świecie, a twórcy inny akustycznych baz sygnałów muzycznych pójdą w ich ślady, co przyczyni się do przyśpieszenia postępu w dziedzinie badań nad pozyskiwaniem informacji z sygnału muzycznego. Docelowa baza zostanie uzupełniona o różne metadane [2]. Prezentowana akustyczna baza sygnałów muzycznych jest pierwszym etapem w procesie tworzenia ujednoliconej, powszechnej bazy sygnałów muzycznych na potrzeby badań związanych z przetwarzaniem i oceną jakości sygnałów muzycznych. Docelowo przewidziane jest stworzenie akustycznej bazy sygnałów muzycznych z podziałem na styl muzyki m.in. muzyka poważna, kameralna, operowa, soul, jazz, rock, pop, blues, reggae itp. Baza będzie zawierać oprócz oryginalnych sygnałów muzycznych, również możliwie jak najszerszą grupę technik kodowania. Baza sygnałów muzycznych oryginalnych będzie zawierać sygnały próbkowane nie tylko z szybkością próbek/s, ale również próbek/s czy próbek/s. 13
14 LITERATURA [1] FRITTS L, University of Iowa musical instrument samples, [2] GOTO M., Development of the RWC Music Database, ICA 2004, [3] GOTO M., HASHIGUCHI H., NISHIMURA T., OKA R., RWC music database: Popular, classical, and jazz music databases, Proc. of ISMIR 2002, , [4] ISO/IEC, Information Technology - Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 3: Audio; Standard ISO/IEC , [5] ITU-R Recommendation BS.562-3, Subjective assessment of sound quality, 1990 [6] ITU-R Recommendation BS.1116, Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems, [7] ITU-R Recommendation BS.1284, General methods for the subjective assessment of sound quality, [8] JANUS B., Akustyczna baza sygnałów muzycznych poddanych wybranym technikom kodowania, Projekt inżynierski, Politechnika Wroclawska, Wroclaw [9] Li Z.N., Drew M.S., Fundamentals of multimedia, Pearsons Education Inc., 2004 [10] RFC 4184 RTP payload format for AC-3 audio, (LINK B., HAGER T., FLAKS J Proposed standard (dostęp ) [11] (dostęp ). [12] ACOUSTIC DATABASE OF MUSICAL SIGNALS ENCODED WITH CHOSEN TECHNIQUES The rising interest in high quality transmission of speech signal, music and video demands designing of new encoding techniques. The aim of the coding is the optimalisation of transmission, i.e. obtaining almost inperceptible quality worsening of transmitted signals for the lowest bitrate. In the paper the music signals database is presented where chosen coding techniques were applied (AAC, mp2, mp3, ac3, ogg and wma) with various bitrates (from 32 kb/s to 320 kb/s). The realized database can be used not only for the analysis of influence of the coding techniques and bitrates for the quality of music signal but also for the validation of quality of phonic signal transmission systems and amplifying or the verification of new objective quality evaluation techniques. 14
Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoDŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona
DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da
Bardziej szczegółowodr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db
dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas
Bardziej szczegółowoKompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Bardziej szczegółowoFormaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP
dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików
Bardziej szczegółowoWykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik
Wykład VI Wydział Matematyki Stosowanej Politechniki Śląskiej Gliwice, 2014 c Copyright 2014 Janusz Słupik Kompresja dźwięku Kompresja dźwięku bezstratna podczas odtwarzania otrzymujemy wierne odwzorowanie
Bardziej szczegółowoKodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Bardziej szczegółowoFormaty plików audio
Formaty plików audio Spis treści 1.Formaty plików audio.... 2 Wav... 2 Aac... 2 AIFF... 2 Ogg... 2 Asf... 2 Mp1... 2 Mp2... 2 Mp3... 2 MP3PRO... 3 Mp4... 3 Wma... 3 Midi... 3 Ac3... 3 2. Różnica miedzy
Bardziej szczegółowo2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH
1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów
Bardziej szczegółowoNeurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK
Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK IV Konferencja Informatyka w Edukacji 31.01 01.02. 2007
Bardziej szczegółowoProgram wykładu. informatyka + 2
Program wykładu 1. Jak słyszymy podstawy fizyczne i psychofizyczne, efekty maskowania 2. Sposoby zapisu sygnałów dźwiękowych 3. Sposoby kodowania sygnałów dźwiękowych ze szczególnym uwzględnieniem MP3
Bardziej szczegółowoFormaty kompresji audio
Formaty kompresji audio Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest
Bardziej szczegółowoCo to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz
Dźwięk Co to jest dźwięk Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze
Bardziej szczegółowoWprowadzenie do cyfrowej obróbki dźwięku
Wprowadzenie do cyfrowej obróbki dźwięku Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana
Bardziej szczegółowoWielokanałowe systemy kodowania dźwięku
Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne
Bardziej szczegółowoDźwięk podstawowe wiadomości technik informatyk
Dźwięk podstawowe wiadomości technik informatyk I. Formaty plików opisz zalety, wady, rodzaj kompresji i twórców 1. Format WAVE. 2. Format MP3. 3. Format WMA. 4. Format MIDI. 5. Format AIFF. 6. Format
Bardziej szczegółowoWymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.
Wymiana i Składowanie Danych Multimedialnych 2019 Mateusz Moderhak, matmod@biomed.eti.pg.gda.pl, EA 106, Pon. 11:15-12:00, śr. 12:15-13:00 Zaliczenie: 60% wykład, 40% laboratorium Zerówka w formie dwóch
Bardziej szczegółowoWielokanałowe systemy kodowania dźwięku
Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne
Bardziej szczegółowoĆwiczenie II. Edytor dźwięku Audacity
Ćwiczenie II. Edytor dźwięku Audacity Sprzęt Aplikacja Komputer osobisty PC Karta dźwiękowa zainstalowana w PC Mikrofon Wzmacniacz z kolumnami Audacity Program Audacity jest wielościeżkowym edytorem dźwięku.
Bardziej szczegółowoPsychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.
Standard MP3 Historia Standard MPEG-1 - "Layer3" został opracowany w niemieckim instytucie Fraunhofer, a konkretnie w departamencie "Audio i Multimedia", gdzie około 30 inżynierów pracuje nad rozwojem
Bardziej szczegółowoStandardowy zapis cyfrowego dźwięku
Audio MoŜliwości współczesnych komputerów w zakresie obróbki materiałów multimedialnych są coraz większe. Komputer coraz częściej staje się elementem kina domowego lub zestawu stereo. Wybór programów moŝliwych
Bardziej szczegółowomgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. SYSTEMY MULTIMEDIALNE Co to jest system multimedialny? Elementy systemu multimedialnego Nośniki danych i ich wpływ na kodowanie Cele
Bardziej szczegółowoPrzesył mowy przez internet
Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP
Bardziej szczegółowoWyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor
Wyciąganie ścieżki dźwiękowej z płyty DVD za pomocą DVD Audio Extractor DVD Audio Extractor jest programem za pomocą, którego możemy zgrać ścieżki dźwiękowe z płyt DVD w formacie w jakim są zapisane (LPCM,
Bardziej szczegółowoData wykonania Część praktyczna
Grupa ćwicz. IIIb Nr ćwicz./ wersja 4 Imiona i nazwiska. Grupa lab. 7 Grzegorz Gliński Rok 3 IS Temat ćwiczenia. Internet Radio Broadcasting Data wykonania. 19.11.09 Data odbioru Ocena i uwagi Część praktyczna
Bardziej szczegółowoPomiary w technice studyjnej. TESTY PESQ i PEAQ
Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne
Bardziej szczegółowoWykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład III: Kompresja danych 1 I. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010 101101001001 2 Kompresja
Bardziej szczegółowo58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011
109 ROZPOZNAWANIE MÓWCY W SYSTEMACH Z KODOWANIEM MOWY STEFAN BRACHMAŃSKI Politechnika Wrocławska, Instytut Telekomunikacji, Teleinformatyki i Akustyki Wybrzeże Wyspiańskiego 27, 50-370 Wrocław Stefan.brachmanski@pwr.wroc.pl
Bardziej szczegółowoSystemy multimedialne Kodowanie dźwięków.
Systemy multimedialne Kodowanie dźwięków. Paweł Szołtysek Spis treści 1 Wstęp 1 2 Analiza i omówienie formatów i narzędzi bezstratnego i stratnego kodowania dźwięków 2 2.1 Formaty zapisu danych dźwiękowych..............
Bardziej szczegółowoTransformata Fouriera
Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli
Bardziej szczegółowoWymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku
Załącznik nr 7 do Uchwały nr 340/2014 Zarządu Spółki TVP S.A. z dnia 23 lipca 2014 r. Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku 1. Wymagania dotyczące
Bardziej szczegółowoMetody kodowania i przechowywania sygnałów dźwiękowych. Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl
Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl < 74 > Informatyka + Wszechnica Popołudniowa > Metody kodowania i przechowywania sygnałów
Bardziej szczegółowoWybrane algorytmu kompresji dźwięku
[1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji
Bardziej szczegółowoOpracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego
KODOWANIE PERCEPTUALNE Opracował: Dominik Tyniw, PG pod kier. Prof.. A. Czyżewskiego Wprowadzenie Cyfrowy sygnał foniczny w postaci nieskomprymowanej charakteryzuje się wysoką przepływnością strumienia
Bardziej szczegółowoEGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PISEMNA
Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Układ graficzny CKE 2019 Nazwa kwalifikacji: Montaż nagrań dźwiękowych Oznaczenie kwalifikacji: S.04 Wersja arkusza: X S.04-X-19.06
Bardziej szczegółowoO sygnałach cyfrowych
O sygnałach cyfrowych Informacja Informacja - wielkość abstrakcyjna, która moŝe być: przechowywana w pewnych obiektach przesyłana pomiędzy pewnymi obiektami przetwarzana w pewnych obiektach stosowana do
Bardziej szczegółowoSprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów
Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów 1. Przekształcenie sygnału analogowego na postać cyfrową określamy mianem: a. digitalizacji
Bardziej szczegółowoAudio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski
Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.
Bardziej szczegółowoWszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa
Bardziej szczegółowoWykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010
Bardziej szczegółowoInformacje na temat produktu C: Instalacja
Informacje na temat produktu A: Analogowe wejścia i wyjścia B: Cyfrowe wejście i wyjście S/PDIF C: Wewnętrzne wejścia analogowe C A B Instalacja Przed przystąpieniem do instalacji: Jeśli karta główna posiada
Bardziej szczegółowoWszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa
Bardziej szczegółowoTechnika audio część 1
Technika audio część 1 Wykład 9 Technologie na urządzenia mobilne Łukasz Kirchner Lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie technologii audio Próbkowanie Twierdzenie
Bardziej szczegółowoPL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09
RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)
Bardziej szczegółowoPodstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński
Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych Plan wykładu Wprowadzenie 1. Wprowadzenie 2. Ilość informacji 3. Kodowanie
Bardziej szczegółowodr inż. Piotr Odya Kontener
dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura
Bardziej szczegółowoKonwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux)
Konwersja AVI do DVD w programie Avidemux z napisami (również w systemie Linux) Wstęp W serwisie znajduje się już wiele opisów dotyczących konwersji plików AVI (DivX) do formatu DVD Video. Wszystkie te
Bardziej szczegółowoBadanie jakości sygnałów audio
Badanie jakości sygnałów audio Przemysław Dymarski, Inst. Telekomunikacji PW Wykorzystano prace dypl. A.Kołodziejczyk, G. Kraciuk, M.Toczko, A.Sadowska Ocena jakości audio i wideo Metody subiektywne Metody
Bardziej szczegółowoAudio i Audacity Formaty plików dźwiękowych. Strona 1 z 10
Audio i Audacity 1.1. Formaty plików dźwiękowych Aby można było odtworzyć dźwięk, musi on być zapisany w pliku we właściwym formacie. Do podstawowych formatów audio należą: plik audio AIFF (rozszerzenie.aiff),
Bardziej szczegółowoKonwersja dźwięku analogowego do postaci cyfrowej
Konwersja dźwięku analogowego do postaci cyfrowej Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych
Bardziej szczegółowodr inż. Piotr Odya Wprowadzenie
dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów
Bardziej szczegółowoRozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech
Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3
Bardziej szczegółowoStandardy zapisu i transmisji dźwięku
Standardy zapisu i transmisji dźwięku dr inż. Piotr Odya Katedra Systemów Multimedialnych Cyfrowe standardy foniczne AES/EBU (Audio Eng. Society and the European Broadcast Union) połączenie za pomocą złącza
Bardziej szczegółowodr inż. Piotr Odya. Kontener
dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura
Bardziej szczegółowoSCENARIUSZ LEKCJI. Fale akustyczne oraz obróbka dźwięku (Fizyka poziom rozszerzony, Informatyka poziom rozszerzony)
Autorzy scenariusza: SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH
Bardziej szczegółowoFormaty plików. graficznych, dźwiękowych, wideo
Formaty plików graficznych, dźwiękowych, wideo Spis treści: Wstęp: Co to jest format? Rodzaje formatów graficznych Właściwości formatów graficznych Porównanie formatów między sobą Formaty plików dźwiękowych
Bardziej szczegółowoPercepcja dźwięku. Narząd słuchu
Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;
Bardziej szczegółowoZastosowanie kompresji w kryptografii Piotr Piotrowski
Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Bardziej szczegółowoKopia zapasowa DVD w programie DivX Converter
Kopia zapasowa DVD w programie DivX Converter Słowo wstępne Pakiet dystrybucyjny DivX Create Bundle zawiera próbną wersję programu DivX Converter, którą możemy użytkować bezpłatnie przez pierwsze 15 dni
Bardziej szczegółowoWytwarzanie znaku wodnego w czasie rzeczywistym
Biuletyn WAT Vol. LV, Numer specjalny, 2006 Wytwarzanie znaku wodnego w czasie rzeczywistym BORYS BOGDAN, JERZY ŁOPATKA Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Telekomunikacji, 00-908
Bardziej szczegółowoStandardy telewizji kolorowej (SD)
dr inż. Piotr Odya Standardy telewizji kolorowej (SD) Europa PAL/SECAM standard 625linii/50Hz rozdzielczości: 768x576, 720x576, 704x576 (tzw. pełny PAL), 384x288, 352x288 (tzw. połówka PAL'u) Ameryka NTSC
Bardziej szczegółowoKOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP
KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM
Bardziej szczegółowoEGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA
Układ graficzny CKE 2017 EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 ZASADY OCENIANIA Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Nazwa kwalifikacji: Montaż
Bardziej szczegółowoTom 6 Opis oprogramowania
Część 9 Narzędzie do wyliczania wskaźników statystycznych Diagnostyka Stanu Nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 31 maja 2012 Historia dokumentu Nazwa dokumentu Nazwa
Bardziej szczegółowoBiblioteka: sound. RGui. Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann
RGui Biblioteka: sound Podstawowe funkcje do działań na plikach.wav i próbkach dźwięku. Autor biblioteki: Matthias Heymann Opracowała: Magdalena Wanat PLIKI.wav Format plików dźwiękowych stworzonych przez
Bardziej szczegółowoBose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe
http://ultimateaudio.pl Bose SoundTouch 10 Czarny Ultimate Audio Konin kategoria: TOP > Bose > Głośniki > Bezprzewodowe Producent: Bose 999,00 zł Opcje produktu: Kod QR: Nasz najmniejszy system SoundTouch
Bardziej szczegółowoKompresja video (MPEG)
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 1. Kompresja video (MEG) Zasadniczy schemat kompresora video Typy ramek przy kompresji czasowej Analiza ramek przez syntezę Sposób detekcji
Bardziej szczegółowoP R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
Bardziej szczegółowoNOŚNIKI DŹWIĘKU I OBRAZU
NOŚNIKI DŹWIĘKU I OBRAZU PŁYTY CD, DVD, BLU-RAY PŁYTA CD 1 PŁYTA CD miała zastąpić kasetę analogową uboczny produkt prac laboratoriów firmy Philips nad LaserVision współpraca z SONY m (kodowanie sygnałów
Bardziej szczegółowoEGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA. Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu
Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu Układ graficzny CKE 2017 Nazwa kwalifikacji: Realizacja nagrań studyjnych Oznaczenie kwalifikacji: S.05 Numer zadania: 01 S.05-01-18.01
Bardziej szczegółowoKwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Bardziej szczegółowoModele psychofizyczne w zastosowaniu do kompresji treści multimedialnych
1/65 Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych Paweł Forczmański pforczmanski@wi.zut.edu.pl 2/65 dr inż. Paweł Forczmański pforczmanski@wi.zut.edu.pl Kompresja a nośnik informacji
Bardziej szczegółowoKodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Bardziej szczegółowoSynchronizacja dźwięku i obrazu. Opracował: dr inż. Piotr Suchomski
Synchronizacja dźwięku i obrazu Opracował: dr inż. Piotr Suchomski Wprowadzenie Technika integracji dźwięku i obrazu w multimediach ma niebagatelne znaczenie; Na jakość dzieła multimedialnego, w tym również
Bardziej szczegółowoSynchronizacja dźwięku i obrazu
Synchronizacja dźwięku i obrazu Opracował: dr inż. Piotr Suchomski Wprowadzenie Na jakość dzieła multimedialnego, w tym również filmowego, ma ogromny wpływ jakość synchronizacji dźwięku i obrazu; Zaawansowane
Bardziej szczegółowoJak usunąć wokal z nagrania?
Jak usunąć wokal z nagrania? Niektóre z edytorów audio posiadają funkcję usuwania wokali z nagrań (Voice Removal lub podobna). Może się ona przydać osobom pragnącym wykonać utwór karaoke bez ścieżki wokalnej.
Bardziej szczegółowoWprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski
Wprowadzenie do multimedialnych baz danych Opracował: dr inż. Piotr Suchomski Wprowadzenie bazy danych Multimedialne bazy danych to takie bazy danych, w których danymi mogą być tekst, zdjęcia, grafika,
Bardziej szczegółowo5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD.
5 Konwersja RMVB do AVI w programie VirtualDubMod z użyciem kodeka XviD. Czym jest RMVB? Rmvb to kontener multimediów oferujący stratną metodę kompresji filmów, która pozwala na zmniejszenie wielkości
Bardziej szczegółowoPrzygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa
Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które
Bardziej szczegółowoCechy karty dzwiękowej
Karta dzwiękowa System audio Za generowanie sygnału dźwiękowego odpowiada system audio w skład którego wchodzą Karta dźwiękowa Głośniki komputerowe Większość obecnie produkowanych płyt głównych posiada
Bardziej szczegółowoPROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH
PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PRZETWARZANIE OBRAZÓW I DŹWIĘKÓW wykład 6 KOMPRESJA SYGNAŁÓW AKUSTYCZNYCH Prowadzący: Tomasz Kowalski Natura i percepcja dźwięków 2 Dźwięk - zarówno mowa, jak i
Bardziej szczegółowoAIFF MP3 Wave Form Audio Format Windows Media Audio Vorbis Format WAVE Format MP3 Format WMA Format MIDI
A. Dźwięk i wideo 1. Dźwięk Aby można było odtworzyć dźwięk, musi on być zapisany w pliku we właściwym formacie. Do podstawowych fotmatów audio należą: Plik audio AIFF (rozszerzenie.aiff), Plik audio AU
Bardziej szczegółowoWedług raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
Bardziej szczegółowoKompresja sekwencji obrazów - algorytm MPEG-2
Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT
Bardziej szczegółowoSpis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1
Spis treści 1. Cyfrowy zapis i synteza dźwięku... 2 2. Schemat blokowy i zadania karty dźwiękowej... 4 UTK. Karty dźwiękowe. 1 1. Cyfrowy zapis i synteza dźwięku Proces kodowania informacji analogowej,
Bardziej szczegółowoNowoczesne metody emisji ucyfrowionego sygnału telewizyjnego
Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego Bogdan Uljasz Wydział Elektroniki Wojskowej Akademii Technicznej ul. Kaliskiego 2 00-908 Warszawa Konferencja naukowo-techniczna Dzisiejsze
Bardziej szczegółowoPodstawy Przetwarzania Sygnałów
Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech
Bardziej szczegółowoKomputerowe modelowanie ludzkiego słuchu w kompresji dźwięku
Matematyka i informatyka może i trudne, ale nie nudne Wykład 6 Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku prelegent: mgr inż Krzysztof Popowski 23 wrzesień 2009 Plan wykładu Podstawowe
Bardziej szczegółowoFormaty plików wideo DSI III
Formaty plików wideo DSI III Porównanie Statyczny obraz dobrej jakości w formacie bmp ma rozmiar 20 MB W typowym filmie wyświetla się ok. 25 klatek/s. Dla filmu trwającego 90 minut, czyli 90x60 = 5400
Bardziej szczegółowoSpecyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID
Specyfikacja techniczna materiałów emisyjnych dla Discovery Channel, Animal Planet, Discovery Science, Discovery World, TLC, Discovery Historia, ID Prosimy o przesyłanie WSZYSTKICH reklam na następujący
Bardziej szczegółowoI. Odbiór wypowiedzi i wykorzystanie zawartych w nich informacji.
KARTA MONITOROWANIA PODSTAWY PROGRAMOWEJ KSZTAŁCENIA OGÓLNEGO III etap edukacyjny PG im. Tadeusza Kościuszki w Kościerzycach Przedmiot muzyka Klasa......... Rok szkolny Imię i nazwisko nauczyciela przedmiotu
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 10 Kompresja obrazów ruchomych MPEG Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych
Bardziej szczegółowoScalone dekodery audio firmy VLSI
Scalone dekodery audio firmy VLSI Odtwarzacze muzyki zapisanej w plikach MP3 zdominowały rynek przenośnych urządzeń audio, większość z nich radzi sobie takŝe z innymi formatami zapisu sygnałów audio wysokiej
Bardziej szczegółowoBiocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09
Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG 02.03.00-00-003/09 Zadanie 6. Zastosowanie technologii informatycznych w medycynie Sprawozdanie
Bardziej szczegółowoSpis treści. 3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42
3. Nośniki i nagrywarki...z...38 CD i DVD 38 Pojemność płyt 41 Format płyt 42 Spis treści Wstęp...Z... 5 1. Zakup nagrywarki...z... 7 Wybór typu nagrywarki 7 Rodzaje złącz 8 Technologia Burn-Proof 8 Formaty
Bardziej szczegółowoTechnika audio część 2
Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji
Bardziej szczegółowo1. Wymagania dotyczące wizji. 2. Wymagania dotyczące fonii. 1.1 Standard wizji
Wymagania techniczne dotyczące audycji 3D HD przeznaczonych do emisji w TVP S.A. nagrywanych w formacie HD na taśmach HDCAM i HDCAM SR oraz dostarczanych w plikach 1. Wymagania dotyczące wizji 1.1 Standard
Bardziej szczegółowo