WSTĘPNE PRZETWARZANIE DŹWIĘKU PRZEZNA- CZONEGO DO ODSŁUCHU WIELOKANAŁOWEGO



Podobne dokumenty
Teorie opisujące naturalne słyszenie przestrzenne

DZ.U. NR 150, POZ. 895

TECHNIKA WIRTUALIZACJI DŹWIĘKU WYKORZYSTUJĄCA ODPOWIEDZI IMPULSOWE ZAREJESTROWANE ZA POMOCĄ SZTUCZNEJ GŁOWY W KOMORZE BEZECHOWEJ

ZASTOSOWANIE PSYCHOAKUSTYKI ORAZ AKUSTYKI ŚRODOWISKA W SYSTEMACH NAGŁOŚNIAJĄCYCH

Demodulator FM. o~ ~ I I I I I~ V

Wyznaczanie prędkości dźwięku w powietrzu

ROZPORZĄDZENIE KRAJOWEJ RADY RADIOFONII I TELEWIZJI. z dnia 30 czerwca 2011 r.

Część I. Pomiar drgań własnych pomieszczenia

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,

Politechnika Śląska Wydział Automatyki, Elektroniki i Informatyki Instytut Automatyki PRACA MAGISTERSKA

System diagnostyki słuchu

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

PRZYKŁADY PRZETWARZANIA DŹWIĘKU W ŚRODOWISKU VISSIM

l a b o r a t o r i u m a k u s t y k i

POMIAR PRĘDKOŚCI DŹWIĘKU METODĄ REZONANSU I METODĄ SKŁADANIA DRGAŃ WZAJEMNIE PROSTOPADŁYCH

Dźwięk podstawowe wiadomości technik informatyk

Pomiar drogi koherencji wybranych źródeł światła

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

LABORATORIUM AUDIOLOGII I AUDIOMETRII

Katedra Elektrotechniki Teoretycznej i Informatyki

Podstawy Przetwarzania Sygnałów

Synchronizacja dźwięku i obrazu

Słyszenie w środowisku

Poznawcze znaczenie dźwięku

Przewodnik użytkownika produktu Apogee Mic

Profil dyplomowania: Systemy multimedialne

Zastosowanie ultradźwięków w technikach multimedialnych

Synchronizacja dźwięku i obrazu. Opracował: dr inż. Piotr Suchomski

Politechnika Warszawska

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

ARCHITEKTURA GSM. Wykonali: Alan Zieliński, Maciej Żulewski, Alex Hoddle- Wojnarowski.

Badanie widma fali akustycznej

4.3 Wyznaczanie prędkości dźwięku w powietrzu metodą fali biegnącej(f2)

4/4/2012. CATT-Acoustic v8.0

2.2 Opis części programowej

TRANSLACJA CYFROWEGO OBRAZU ŚCIEŻKI DŹWIĘKOWEJ NA DŹWIĘK CYFROWY

ANALIZA HARMONICZNA DŹWIĘKU SKŁADANIE DRGAŃ AKUSTYCZNYCH DUDNIENIA.

Modelowanie pola akustycznego. Opracowała: prof. dr hab. inż. Bożena Kostek

1.Wstęp W ćwiczeniu bada się zestaw głośnikowy oraz mikrofon pomiarowy z wykorzystaniem sekwencji MLS opis w załącznikui skrypcie- [1].oraz poz.

Badanie widma fali akustycznej

Percepcja dźwięku. Narząd słuchu

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Symulacja sygnału czujnika z wyjściem częstotliwościowym w stanach dynamicznych

INSTYTUT KONSTRUKCJI MASZYN POMIAR WSPÓŁCZYNNIKA POCHŁANIANIA DŹWIĘKU METODĄ FAL STOJĄCYCH

PL B1. Układ do lokalizacji elektroakustycznych przetworników pomiarowych w przestrzeni pomieszczenia, zwłaszcza mikrofonów

Akustyka pomieszczeń. Michał Bujacz Izabela Przybysz

(L, S) I. Zagadnienia. II. Zadania

Program V-SIM tworzenie plików video z przebiegu symulacji

Laboratorium techniki światłowodowej. Ćwiczenie 3. Światłowodowy, odbiciowy sensor przesunięcia

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

AKADEMIA GÓRNICZO HUTNICZA Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Katedra Elektroniki

Układ aktywnej redukcji hałasu przenikającego przez przegrodę w postaci płyty mosiężnej

PL B1. Sposób i układ do modyfikacji widma sygnału ultraszerokopasmowego radia impulsowego. POLITECHNIKA GDAŃSKA, Gdańsk, PL

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

AUDIOBILITY OF DANGER SIGNALS EMITTED BY EMERGENCY VEVICLES

Wydział Elektryczny. Katedra Automatyki i Elektroniki. Instrukcja. do ćwiczeń laboratoryjnych z przedmiotu: SYSTEMY CYFROWE 1.

Integracja CTI rejestratorów TRX z systemami radiowymi KENWOOD NEXEDGE. Cyfrowe rejestratory rozmów seria KSRC. TRX Krzysztof Kryński

Zakład Systemów Radiowych (Z-1)

Przygotowała: prof. Bożena Kostek

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)

Podstawy elektroniki i metrologii

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 SPRAWDZANIE PARAMETRÓW AUDIOMETRU TONOWEGO. AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

08 Stereodekoder, korekcja barwy dźwięku.

Symulacja akustyczna nagłośnienia sali wykładowej Polskiego Komitetu Normalizacyjnego

Ćwiczenie Nr 11 Fotometria

USTALANIE WARTOŚCI NOMINALNYCH W POMIARACH TOROMIERZAMI ELEKTRONICZNYMI

Ćwiczenie nr 25: Interferencja fal akustycznych

Instrukcja uruchomienia modulacji PSK w FT857D

Przełączanie źródła sygnału audio

Wykrywanie sygnałów DTMF za pomocą mikrokontrolera ATmega 328 z wykorzystaniem algorytmu Goertzela

5(m) PWSZ -Leszno LABORATORIUM POMIARY I BADANIA WIBROAKUSTYCZNE WYZNACZANIE POZIOMU MOCY AKUSTYCZNEJ MASZYN I URZĄDZEŃ 1. CEL I ZAKRES ĆWICZENIA

1 Moduł Inteligentnego Głośnika

Krzysztof Łapsa Wyznaczenie prędkości fal ultradźwiękowych metodami interferencyjnymi

CYFROWE PRZETWARZANIE SYGNAŁÓW

POMIAR CZĘSTOTLIWOŚCI NAPIĘCIA W URZĄDZENIACH AUTOMATYKI ELEKTROENERGETYCZNEJ

PRZYKŁADY PRZETWARZANIA DŹWIĘKU W ŚRODOWISKU VISSIM

3. WYNIKI POMIARÓW Z WYKORZYSTANIEM ULTRADŹWIĘKÓW.

1 Moduł Inteligentnego Głośnika 3

Efekt Dopplera. dr inż. Romuald Kędzierski

Temat ćwiczenia. Wyznaczanie mocy akustycznej

WYZNACZANIE PRĘDKOŚCI DŹWIĘKU METODĄ QUINCKEGO I KUNDTA

Politechnika Warszawska

Ochrona przeciwdźwiękowa (wykład ) Józef Kotus

Korelacje wzrokowo-słuchowe

Fal podłużna. Polaryzacja fali podłużnej

Wykorzystanie kontrolera Behringer X-Touch w Presonus Studio One Adam Pietruszko

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej

MATERIAŁY POMOCNICZE DO WYKŁADU Z REALIZACJI DŹWIĘKU

Wykład FIZYKA I. 11. Fale mechaniczne. Dr hab. inż. Władysław Artur Woźniak

Zaawansowana analiza mocy i jakości energii z wykorzystaniem wielokanałowych, synchronicznych systemów rejestracji danych firmy Dewetron

Projekt W ś wiecie dź więko w

Bazy danych do rejestracji termograficznych badań medycznych

1 Obsługa aplikacji sonary

Politechnika Gdańska WYDZIAŁ ELEKTRONIKI TELEKOMUNIKACJI I INFORMATYKI. Katedra Metrologii i Optoelektroniki. Metrologia. Ilustracje do wykładu

Laboratorium optycznego przetwarzania informacji i holografii. Ćwiczenie 4. Badanie optycznej transformaty Fouriera

ANALIZA PORÓWNAWCZA WŁASNOŚCI AKUSTYCZNYCH SALI KONFERENCYJNEJ NA PODSTAWIE POMIARÓW RZECZYWISTYCH I SYMULACJI KOMPUTEROWEJ W PROGRAMIE EASE 3.

Technologia informacyjna

I. Pomiary charakterystyk głośników

Transkrypt:

Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej Nr 20 XIV Seminarium ZASTOSOWANIE KOMPUTERÓW W NAUCE I TECHNICE 2004 Oddział Gdański PTETiS WSTĘPNE PRZETWARZANIE DŹWIĘKU PRZEZNA- CZONEGO DO ODSŁUCHU WIELOKANAŁOWEGO Przemysław MAZIEWSKI Katedra Systemów Multimedialnych, Wydział Elektroniki Telekomunikacji i Informatyki, Politechnika Gdańska, ul. G. Narutowicza 11/12, 80-952 Gdańsk tel: (058) 347-23-01 e-mail:p_maziewski@sound.eti.pg.gda.pl, W pracy opisano opracowane metody wstępnego przetwarzania plików dźwiękowych przeznaczonych do odsłuchu w systemie wielokanałowym. UmoŜliwiają one synchronizację i normalizację głośności. Normalizacja uwzględnia wpływ połoŝenia głośników w panoramie odsłuchowej. Opis metod poprzedza krótka analiza głównych mechanizmów odpowiedzialnych za lokalizację dźwięku przez człowieka. 1. WSTĘP Opisane poniŝej metody synchronizacji i normalizacji głośności potrzebne są ze względu na załoŝenia asynchroniczności i róŝnicy poziomów w rejestracji dźwięku. Taka sytuacja ma miejsce w przypadku rejestracji komunikacji radiowej za pomocą radiostacji ulokowanych w róŝnych miejscach. KaŜda z nich rejestruje nadawany dźwięk z innym poziomem wysterowania. MoŜe to być spowodowane róŝnym tłumieniem fal radiowych odbieranych w poszczególnych radiostacjach. Dodatkowo, ze względu na róŝne prędkości propagacji fali dźwiękowej w kierunku poszczególnych odbiorników i ich róŝną odległość od nadajnika momenty rozpoczęcia rejestracji są róŝne. Otrzymane w ten sposób wersje nagrania są więc asynchroniczne i posiadają róŝny poziom głośności. Przy ich prezentacji za pomocą głośników wielokanałowego systemu odsłuchowego wystąpi problem przesunięcia się miejsca najlepszego odsłuchu. By umoŝliwić prawidłowy odsłuch nagrań niezbędne jest przetworzenie sygnałów w celu wyrównania ich głośności oraz momentów rozpoczęcia i zakończenia. Dodatkowo prawidłowy odsłuch pozwala wyeliminować wpływ nieskorelowanych zakłóceń z poszczególnych kanałów rejestracji. 2. WYBRANE ASPEKTY ODSŁUCHU WIELOKANAŁOWEGO Jako odsłuch wielokanałowy rozumiany jest odsłuch przy pomocy pięciu głośników ustawionych w przestrzeni odsłuchowej zgodnie ze schematem z rysunku 1. Zgodnie z zaleceniami ITU odległość pomiędzy poszczególnymi głośnikami powinna być odpowiednio dobrana. Jeśli odległość pomiędzy prawym i lewym głośnikiem przednim

- 116 - Rys. 1 PołoŜenie głośników w pięciokanałowym systemie odsłuchowym [1] oznaczymy jako B to promień okręgu R powinien mieć długość równą 0,9B. Wartość B mieści się w przedziale od 2m do 4m. W przypadku takiej konfiguracji miejscem prawidłowego odsłuchu jest współśrodkowy okrąg o długości promienia do 0,8m. Znajduje się on wewnątrz duŝego okręgu o promieniu R [1]. Wśród głównych mechanizmów odpowiedzialnych za lokalizację dźwięku w miejscu prawidłowego odsłuchu, naleŝy wymienić: międzyuszne róŝnice czasu (ang. ITD - Interaural Time Differences), międzyuszne róŝnice w poziomach (ang. IID - Interaural Intensity Differences) oraz efekty filtrujące głowy, ramion, torsu i ucha [2]. Pierwszy mechanizm jest wynikiem róŝnic w czasie percepcji danego zdarzenia dźwiękowego pomiędzy dwoma uszami. Po lewej stronie rysunku 2 pokazano rzut z góry na sytuację odsłuchu pojedynczego źródła dźwięku. Wraz z przesuwaniem się źródła dźwięku w skrajnie prawe pozycje, rośnie róŝnica w czasie docierania fali dźwiękowej pomiędzy uchem lewym i prawym. Obrazuje to wykres przedstawiony po prawej stronie rysunku. Rys. 2 Wykres przedstawiający międzyuszne róŝnice czasowe (ITD) w funkcji zmian kąta azymutu dla wybranych częstotliwości i sygnałów akustycznych [3] ITD są znaczącym czynnikiem lokalizacyjnym dla częstotliwości dźwięku nie większych niŝ 1500Hz [2]. ZwaŜywszy na opisany mechanizm, asynchroniczne odtwarzanie plików dźwiękowych przez poszczególne głośniki systemu wielokanałowego spowoduje niekontrolowane przesunięcie się miejsca prawidłowego odsłuchu. W celu uniknięcia takiej sytuacji zaproponowano metodę synchronizacji. Została ona opisana w następnym punkcie pracy. Kolejnym mechanizmem lokalizacyjnym są róŝnice w natęŝaniu danego dźwięku, rejestrowane w obu uszach. Rysunek 3 zawiera wykres obrazujący względny poziom ciśnie-

- 117 - nia akustycznego w obu uszach dla róŝnych kątów padania fali dźwiękowej. Wykres obrazuje ponadto przebieg średniej róŝnicy poziomów w funkcji kąta padania fali. Zakres uwzględnionych w badaniach częstotliwości akustycznych wynosił od 500 do 2000 Hz. Rys. 3 Względny poziom ciśnienia dźwięku w obu uszach i średnia róŝnica poziomów w zaleŝności od kąta padania fali w zakresie częstotliwości 500-2000 Hz [4] Wraz z przesuwaniem się źródła dźwięku w skrajnie prawe pozycje rośnie róŝnica ciśnień fali dźwiękowej odbieranych przez ucho prawe i lewe. Widoczna na poprzednim wykresie symetria jest na tym wykresie złamana (na rysunku 2 krzywe czasowe od 0 do 90 i od 90 do 180 są symetryczne). Wynika to zapewne z kolejnego czynnika lokalizacyjnego jakim są efekty filtrujące głowy, ramion, torsu i samego ucha (np. małŝowiny usznej). Fala dźwiękowa odbija się, załamuje i jest tłumiona przez te elementy. Proces zniekształcania (filtracji) jest dobrze widoczny na wykresie z rysunku 4. Prezentowane są na nim odpowiedzi impulsowe zarejestrowane w lewym (ciemna linia) i prawym (jasna linia) uchu przy pobudzeniu odtwarzanym z prawej strony słuchacza [2]. Rys. 4 Odpowiedzi impulsowe zarejestrowane w uchu lewym (ciemna linia) i prawym (jasna linia) przy pobudzeniu ulokowanym z prawej strony słuchacza ZwaŜywszy na opisane mechanizmy, jednoczesne odtwarzanie plików dźwiękowych z róŝnym poziomem w wielokanałowym systemie odsłuchowym spowoduje niekontrolowane zaburzenie miejsca prawidłowego odsłuchu. Proponowana metoda normalizacji głośności stosowana w celu uniknięcie takiej sytuacji została opisana w punkcie numer cztery.

- 118-3. SYNCHRONIZACJA PLIKÓW DŹWIĘKOWYCH Synchronizacja jest niezbędna w przypadku wielokanałowego odtwarzania kilku wersji nagrania pochodzących np. z róŝnych stacji rejestrujących. Proponowana metoda opiera się na analizie funkcji korelacji. W wydzielonych buforach początkowych i końcowych wyszukiwane są podobieństwa pomiędzy poszczególnymi plikami dźwiękowymi. Lokalizacja najbardziej podobnych fragmentów nagrania pozwala określić wartości opóźnień i róŝnice w długościach plików. Następnie za pomocą odpowiedniego algorytmu moŝna dokonać próby wyrównania plików na osi czasu. Początkowy i końcowy bufor referencyjnego pliku dźwiękowego są porównywane z odpowiednikami z synchronizowanych plików dźwiękowych. Porównanie to obejmuje badanie maksimów funkcji korelacji skrośnej wyznaczonych dla ramek wybieranych z buforów. Maksima funkcji korelacji wskazują po dwie synchroniczne ramki w buforze początkowym i końcowym. Następnie wyrównywana jest długość plików (przepróbkowywanie) i wykonywana eliminacja opóźnień. Maksymalna wartość korelacji interpretowana jest jako stopień poprawności wykonanych operacji. Rysunek 4 przedstawia proces wyszukiwania synchronicznych ramek w dwóch przykładowych plikach dźwiękowych [5, 6]. Synchroniczne ramki początkowe ramki końcowe Bufor początkowy Bufor końcowy Rys.4 Proces wyszukiwania synchronicznych ramek w dwóch przykładowych plikach dźwiękowych Praktyczna realizacja opisanej metody moŝe przebiegać zgodnie z algorytmem przedstawionym schematycznie na rysunku 5. Pierwszy plik traktowany jest jako referencyjny (x1). Pozostałe będą do niego wyrównywane (x2.. xn). W kaŝdym pliku wyznaczane są bufory początkowy i końcowy. Następnie zgodnie z procedurą opisaną powyŝej badane są przesunięcia pomiędzy plikiem referencyjnym a kolejnymi (blok CrossKorelator). Ostatnim krokiem jest eliminacja wykrytych przesunięć oraz róŝnic w długościach plików. Rys. 5. Przykładowy schemat algorytmu synchronizacji

- 119-4. NORMALIZACJA GŁOŚNOŚCI PLIKÓW DŹWIĘKOWYCH W przypadku posiadania kilku nagrań moŝna je odtworzyć za pomocą oddzielnych głośników systemu wielokanałowego. Nagrania te powinny charakteryzować się zbliŝonym poziomem głośności, tak by panorama dookólna tworzona przez odgrywane dźwięki była prawidłowa. W proponowanej metodzie ujednolicenie głośności plików dźwiękowych realizowane jest w trzech etapach. Odpowiadają one głównym blokom schematu przedstawionego na kolejnym rysunku (rys. 6). Jako obiektywny parametr opisujący głośność skończonego sygnału wybrano jego wartość skuteczną. Ujednolicenie poziomów głośności następuje dzięki wyrównaniu ich wartości skutecznych. Poprzedzone jest ono wstępną filtracją symulującą efekty filtrujące opisane w punkcie 2. Rys. 6 Schemat blokowy algorytmu normalizacji głośności [7]. Pierwszy etap przetwarzania polega więc na wstępnej filtracji kopii sygnałów. Ma ona na celu uwzględnienie wpływu czynników takich jak: połoŝenie źródła dźwięku w stosunku do słuchacza, efekty filtrujące ramion, torsu oraz małŝowiny i kanału usznego (patrz punkt 2). W filtracji wykorzystywane są odpowiedzi impulsowe, rejestrowane w komorze bezechowej za pomocą mikrofonów umieszczonych w kanałach usznych manekina (ang. HRIR Head Related Impulse Response). Wybór zestawu HRIR podyktowany jest połoŝeniem głośników w pomieszczeniu odsłuchowym (powinien być zgodny z zaleceniami ITU-R [1]). W bloku filtracji monofoniczne ścieŝki dźwiękowe są równomiernie dzielone. Kolejnym krokiem jest ich filtracja w oparciu o charakterystyki częstotliwościowe otrzymane na podstawie wybranych odpowiedzi HRIR. Wcześniejszy podział ścieŝki na ucho lewe i prawe, pozwala na symulację słyszenia dwuusznego. Całość przetwarzania w bloku filtracji zakończona jest równomiernym miksem sygnałów. Drugi etap polega na wyrównaniu wartości skutecznych przetworzonych wcześniej kopii. W tym celu w bloku normalizacji liczone są wzmocnienia potrzebne do uzyskania jednolitego poziomu rms wszystkich przefiltrowanych sygnałów. By nie dopuścić do ewentualnych przesterowań korygowany jest maksymalny poziom szczytowy. W trzecim końcowym etapie, poziomy oryginalnych (nieprzefiltrowanych) sygnałów modyfikowane są zgodnie z otrzymanymi współczynnikami wzmocnień [7].

- 120-5. REALIZACJA Obie metody (w postaci algorytmów) zostały zaimplementowane jako części składowe systemu rekonstrukcji nagrań korespondencji pilotów lotniczych [8]. System został wykonany w Katedrze Systemów Multimedialnych Politechniki Gdańskiej. Obecnie testowany jest w WyŜszej Oficerskiej Szkole Sił Powietrznych w Dęblinie. 6. BIBLIOGRAFIA 1. ITU Recommendation BS. 775-1: Multichannel stereophonic sound system with and without accompanying picture, Geneva 1997. 2. Moore, B.C.J.: Wprowadzenie do psychologii słyszenia, Warszawa Poznań PWN 1999, ISBN 830112766X. 3. Benson, K.B.: Audio Engineering Handbook, New York Mc Graw-Hill 1988, ISBN 0070047774. 4. Steinberg,.C., Snow, W.B.: Physical factors in auditory perspective, Journal of SMPTE, Vol. 61, 1953, p. 420-430. 5. Maziewski P., Szczuko P.: System Synchronizacji nagrań wielokanałowych, Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej Nr.19, Seria: Zastosowanie Komputerów w Nauce i Technice 2003, Gdańsk 2003, s. 79 84. 6. Szczuko P., Maziewski P.: System synchronizacji nagrań wielokanałowych, Prace Naukowe Instytutu Telekomunikacji i Akustyki Politechniki Wrocławskiej, Seria: Konferencje - X Sympozjum InŜynierii i ReŜyserii Dźwięku ISSET 2003, Wrocław 2003, s. 23-28. 7. Maziewski P.: Algorytm normalizacji poziomów głośności dźwięku zarejestrowanego w plikach, Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej Nr. 3, Seria: Technologie Informacyjne, Gdańsk 2004, s. 161-168. 8. CzyŜewski A., Kaczmarek A., Kotus J., Pawlik A., Rypulak A., śwan P.: A System for Multitask Noisy Speech Enhancement, 116 Audio Engineering Society Convention., Berlin 2004. SOUND PREPROCESSING FOR MULTICHANNEL AUDIO MONITORING Methods of initial sound processing for multichannel audio monitoring are presented. They allow sound synchronization and loudness normalization with regards to loudspeaker placement in the listening area. Additional short analysis of human sound localization mechanism is also included.