PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22) Data zgłoszenia: 31.01.2003 (54) Sposób zwiększania wyrazistości dźwięku solowego na tle dźwięków tła akustycznego (43) Zgłoszenie ogłoszono: 09.08.2004 BUP 16/04 (76) Uprawniony i twórca wynalazku: Kleczkowski Piotr,Kraków,PL (45) O udzieleniu patentu ogłoszono: 30.04.2009 WUP 04/09 PL 201536 B1 (57) 1. Sposób zwiększania wyrazistości dźwięku solowego na tle dźwięków tła akustycznego, polegający na dynamicznym tłumieniu tła akustycznego w zależności od obecności dźwięku solowego, znamienny tym, że cyfrowe sygnały dźwięku solowego i tła akustycznego poddaje się analizie czasowo-częstotliwościowej w elektronicznym urządzeniu procesorowym, następnie według przyjętych algorytmów obliczeniowych wyznacza obszary koncentracji energii (F1) dźwięku solowego, odpowiadające im obszary tłumienia (F2) tła akustycznego oraz określa stopień tłumienia dla każdego z obszarów tłumienia (F2), po czym dokonuje tłumienia i resyntezy dźwięku tła akustycznego oraz miesza się go z dźwiękiem solowym.

2 PL 201 536 B1 Opis wynalazku Przedmiotem wynalazku jest sposób zwiększenia wyrazistości dźwięku solowego na tle dźwięków tła akustycznego, przeznaczony do stosowania w torze elektroakustycznym gdy występujące w nim dwa odrębne sygnały mają być zmieszane z nadrzędnością sygnału solowego. Wynalazek dotyczy zwłaszcza technologii nagrań muzycznych, ale może być również wykorzystywany w innych zakresach inżynierii dźwięku, przykładowo przy nagłaśnianiu. Zmieszanie dźwięku solowego z tłem akustycznym prowadzi nieuchronnie do pogorszenia wyrazistości obu tych dźwięków, a przyczyny tego zjawiska wyjaśnia szczegółowo wiedza z zakresu działania narządu słuchu. Oczywistym rozwiązaniem problemu jest zwiększenie głośności dźwięku solowego z jednoczesnym obniżeniem głośności tła, jednak dźwięk solowy dominuje wtedy nad całością - co najczęściej nie jest pożądane. W radiofonii oraz dyskotekach od dawna stosuje się dynamiczną wersję powyższego sposobu: tło jest silnie wyciszane wtedy, kiedy pojawia się słowny przekaz, stanowiący dźwięk solowy. Sposób ten - nazywany wśród specjalistów angielską nazwą ducker - powoduje jednak silne zniekształcenie tła, którego głośność faluje w takt pojawiania się mowy. Niemożliwe jest jego stosowanie dla zwiększania wyrazistości śpiewu na tle akompaniamentu. W praktyce realizacji dźwięku wykorzystuje się w tym celu zazwyczaj dwa inne sposoby. Pierwszy polega na niezależnym kształtowaniu barwy dźwięku solowego i barw dźwięków wchodzących w skład tła, tak aby wzmacniać inne pasma częstotliwości w dźwięku solowym a inne w dźwiękach tła. Dopuszczalność stosowania tego sposobu jest silnie ograniczona możliwym do zaakceptowania stopniem ingerencji w barwę tak w dźwięku solowym jak i w tle oraz jego niską ogólną wydajnością. W drugim sposobie dźwięk solowy poddaje się tak zwanej kompresji, czyli procesowi w wyniku którego zwiększa się głośność jego cichszych fragmentów. W zaawansowanej wersji proces ten przeprowadza się niezależnie w kilku pasmach częstotliwości. Sposób ten jest skuteczny, ale przy wysokim stopniu kompresji zmienia się brzmienie dźwięku solowego a cały sposób zbliża się do zwiększenia głośności dźwięku solowego kosztem tła. Istota wynalazku polega na dynamicznym tłumieniu tła akustycznego w zależności od obecności dźwięku solowego w taki sposób, że cyfrowe sygnały dźwięku solowego i tła akustycznego poddaje się analizie czasowo-częstotliwościowej w elektronicznym urządzeniu procesorowym, następnie według przyjętych algorytmów obliczeniowych wyznacza się obszary koncentracji energii dźwięku solowego i odpowiadające im obszary tłumienia tła akustycznego, określa stopień tłumienia dla każdego z obszarów tłumienia, a po dokonaniu tłumienia i resyntezy dźwięku tła akustycznego miesza się go z dźwiękiem solowym. Czynności analizy czasowo-częstotliwościowej i resyntezy mogą być przeprowadzone z wykorzystaniem filtrów adaptacyjnych. Wynalazek wykorzystuje znajomość budowy i działania słuchu. Jeżeli w zakresie częstotliwości zwanym pasmem krytycznym na słuch oddziałują jednocześnie składowe częstotliwościowe sygnału mowy i sygnału tła akustycznego o zbliżonych mocach, to składowe te wzajemnie konkurują w procesie słyszenia i w rezultacie odbiór każdego z obu dźwięków jest zakłócony. Wynalazek polega na tłumieniu składowych częstotliwościowych tła akustycznego konkurujących w zakresie danego pasma krytycznego ze składowymi częstotliwościowymi dźwięku solowego. W odpowiednich przedziałach czasu tłumione są wyłącznie te zakresy częstotliwości w których moce dźwięku solowego i tła akustycznego są zbliżone. We wszystkich obszarach na płaszczyźnie czasowo-częstotliwościowej, w których moc dźwięku solowego znacznie przewyższa moc tła akustycznego pogorszenie wyrazistości dźwięku solowego jest nieznaczne, a więc tłumienie przynosiłoby znikomy efekt. Z kolei w tych obszarach, gdzie występuje sytuacja odwrotna, to znaczy moc tła akustycznego znacznie przewyższa moc dźwięku solowego, uzyskanie zwiększenia wyrazistości wymagałoby bardzo silnego tłumienia tła, co z kolei wprowadzałoby słyszalne zmiany w dźwięku tła. Jeżeli w tle akustycznym tłumiony jest obszar dla którego moc dźwięku solowego jest znacząca, to wskutek działania zachodzącego w słuchu zjawiska nazywanego maskowaniem dźwięku słyszalność wywołanej tym tłumieniem zmiany barwy tła akustycznego jest silnie ograniczona. Tłumienie tła akustycznego w zakresie pasma częstotliwości węższym niż pasmo krytyczne byłoby niewystarczające dla zwiększenia wyrazistości dźwięku solowego. Tłumienie w paśmie szerszym niż pasmo krytyczne jeszcze lepiej zwiększa tę wyrazistość, ale zwiększając zakres tłumionych częstotliwości zwiększamy prawdopodobieństwo, że tłumienie tła stanie się słyszalne. Największą skuteczność osiąga się przy szerokości pasma tłumionego nieco większej od szerokości pasma krytycznego, przy czym, jak wynika ze znanych cech słuchu, szerokości pasm krytycznych są zależne od wartości częstotliwości środkowej tych pasm.

PL 201 536 B1 3 Sposób według wynalazku nie jest wielopasmowym duckerem, czyli duckerem działającym w osobnych pasmach częstotliwości. Cały proces przeprowadzany jest niezależnie dla różnych pasm częstotliwości. Tłumieniu podlegają dynamicznie kształtowane obszary na płaszczyźnie czasczęstotliwość, nie zaś wyznaczone na stałe pasma częstotliwości. Obszary koncentracji energii w sposobie według wynalazku wyznacza się w poszczególnych punktach płaszczyzny czasowo-częstotliwościowej według algorytmu obliczeniowego uwzględniającego co najmniej jeden z następujących parametrów: - wartości bezwzględnej mocy dźwięku solowego, - łącznej wartości mocy w określonej ilości sąsiadujących punktów, - stosunku mocy dźwięku solowego do mocy tła akustycznego, - położenia obszaru koncentracji energii wzdłuż osi częstotliwości, - maksymalnej ilości obszarów koncentracji energii wzdłuż osi częstotliwości, - przyjętych minimalnej i maksymalnej wartości energii obszaru koncentracji energii, - przyjętej minimalnej odległości między obszarami koncentracji energii (F1) dźwięku solowego zarówno wzdłuż osi czasu jak i częstotliwości. Stopień tłumienia jest różny w poszczególnych obszarach tłumienia, dobierany dynamicznie według algorytmów obliczeniowych uwzględniających co najmniej jeden z powyżej wymienionych parametrów. Stopień tłumienia we wszystkich obszarach tłumienia może również uwzględniać stały współczynnik proporcjonalności. Przy umiarkowanym tłumieniu globalnym uzyskuje się umiarkowane zwiększenie wyrazistości, a zmiany tła akustycznego spowodowane tłumieniem jego obszarów są niesłyszalne. Przy większych wartościach tłumienia globalnego uzyskuje się znaczny wzrost wyrazistości, ale tłumienie tła akustycznego może być słyszalne. Powierzchnia obszaru tłumienia może być równa powierzchni odpowiadającego mu obszaru koncentracji energii. Doskonalszy efekt zwiększenia wyrazistości osiąga się gdy powierzchnia obszaru tłumienia jest większa i określona według algorytmu obliczeniowego uwzględniającego co najmniej jeden z powyżej wymienionych parametrów. Dodatkowe kształtowanie pozwala uzyskać najlepszy końcowy efekt akustyczny, to znaczy możliwie największy wzrost wyrazistości przy możliwie najmniejszej słyszalności zmian tła akustycznego W systemach stereo i wielokanałowych stopień tłumienia tła akustycznego określany jest osobno dla każdego z kanałów. Korzystnym jest gdy stopień tłumienia dla wszystkich obszarów tłumienia w danym kanale uwzględnia stały współczynnik proporcjonalności, zależny od udziału dźwięku solowego w danym kanale, czyli położenia dźwięku solowego w panoramie stereofonicznej lub wielokanałowej. Sposób według wynalazku może być również wykorzystany w układzie hierarchicznym, z wyróżnieniem z dźwięków tła akustycznego - podrzędnego dźwięku solowego, którego wyrazistość jest zwiększana względem pozostałych dźwięków tła akustycznego. Rozwiązanie może być stosowane we wszelkich procesach produkcji nagrań dźwiękowych, tworzonych dla dowolnych celów i na dowolnych nośnikach - tak cyfrowych jak i analogowych, przy nagłośnieniu wszelkich wydarzeń, oraz przy tworzeniu cyfrowych plików dźwiękowych. Może być stosowany w torach i systemach elektroakustycznych monofonicznych, stereofonicznych i wielokanałowych o dowolnej ilości kanałów. Sposób według wynalazku wyjaśniony jest opisem przykładu wykonania zobrazowanego na rysunku. Fig. 1 przedstawia przykładowe fragmenty widma czasowo-częstotliwościowego odpowiednio dźwięku solowego i tła akustycznego, fig. 2 oba widma we wspólnym układzie współrzędnych natomiast fig. 3 schemat blokowo-funkcjonalny urządzenia zwiększającego wyrazistość dźwięku solowego sposobem według wynalazku. Cyfrowe sygnały dźwięku solowego i tła akustycznego podawane są na wejścia elektronicznego urządzenia procesorowego - komputera wyposażonego w interfejsy dla sygnałów dźwiękowych. Algorytmy obliczeniowe implementowane są w dowolnym języku programowania. Na płaszczyźnie czasowo-częstotliwościowej wyznaczane są obszary koncentracji energii F1 dźwięku solowego - pokazane na fig. 1a, odpowiadające im obszary tłumienia F2 tła akustycznego - na fig. 1b oraz dla każdego z obszarów tłumienia F2 wyliczany jest stopień tłumienia. W wyznaczonych obszarach tłumienia, zgodnie z obliczonymi parametrami dokonuje się tłumienia tła akustycznego, następnie resyntezy tak zmodyfikowanego tła akustycznego a na końcu miesza z sygnałem solowym. Algorytmy obliczeniowe mogą pracować w czasie rzeczywistym albo w trybie wsadowym (off-line). Przy pracy w czasie rze-

4 PL 201 536 B1 czywistym wejściowe i wyjściowe sygnały dźwiękowe muszą być dzielone na bardzo krótkie odcinki czasu. Na każdym z odcinków przeprowadza się kolejno oba przedstawione powyżej procesy, wykorzystując dowolne, przydatne do tego celu metody i realizujące je algorytmy analizy czasowoczęstotliwościowej sygnałów, jak np.: krótkookresową transformatę Fouriera, zmodyfikowane dyskretne przekształcenie kosinusowe (analizę Modified Discrete Cosine Transform ), transformatę falkową lub różne rodzaje adaptacyjnych filtrów cyfrowych. Urządzenie realizujące wynalazek może być całkowicie niezależne, może też stanowić element wyposażenia komputera, działa wtedy korzystając częściowo z jego zasobów. Może też być zrealizowane wyłącznie w postaci oprogramowania, jeżeli komputer na którym pracuje program wyposażony jest w odpowiednie interfejsy dla wprowadzania i wyprowadzania sygnałów dźwiękowych. Sposób według wynalazku może być stosowany także w analogowym torze elektroakustycznym. Realizacja wynalazku w technice analogowej jest jednak znacznie mniej dokładna a tym samym mniej skuteczna. Zastrzeżenia patentowe 1. Sposób zwiększania wyrazistości dźwięku solowego na tle dźwięków tła akustycznego, polegający na dynamicznym tłumieniu tła akustycznego w zależności od obecności dźwięku solowego, znamienny tym, że cyfrowe sygnały dźwięku solowego i tła akustycznego poddaje się analizie czasowo-częstotliwościowej w elektronicznym urządzeniu procesorowym, następnie według przyjętych algorytmów obliczeniowych wyznacza obszary koncentracji energii (F1) dźwięku solowego, odpowiadające im obszary tłumienia (F2) tła akustycznego oraz określa stopień tłumienia dla każdego z obszarów tłumienia (F2), po czym dokonuje tłumienia i resyntezy dźwięku tła akustycznego oraz miesza się go z dźwiękiem solowym. 2. Sposób według zastrz. 1, znamienny tym, że obszary koncentracji energii (F1) wyznacza się w poszczególnych punktach płaszczyzny czasowo-częstotliwościowej według algorytmu obliczeniowego uwzględniającego co najmniej jeden z następujących parametrów: - bezwzględnej wartości mocy dźwięku solowego, - łącznej wartości mocy w określonej ilości sąsiadujących punktów, - stosunku mocy dźwięku solowego do mocy tła akustycznego, - położenia obszaru koncentracji energii (F1) wzdłuż osi częstotliwości, - maksymalnej ilości obszarów koncentracji energii (F1) wzdłuż osi częstotliwości, - przyjętych minimalnej i maksymalnej wartości energii obszaru koncentracji energii (F1). - przyjętej minimalnej odległości między obszarami koncentracji energii (F1) dźwięku solowego zarówno wzdłuż osi czasu jak i częstotliwości. 3. Sposób według zastrz. 1, znamienny tym, że w poszczególnych obszarach tłumienia (F2) stopień tłumienia określa się według algorytmów obliczeniowych uwzględniających co najmniej jeden z następujących parametrów: - bezwzględnej wartości mocy dźwięku solowego, - stosunku mocy dźwięku solowego do mocy tła akustycznego, - położenia obszaru koncentracji energii (F1) wzdłuż osi częstotliwości. 4. Sposób według zastrz. 3, znamienny tym, że we wszystkich obszarach tłumienia (F2) stopień tłumienia uwzględnia stały współczynnik proporcjonalności. 5. Sposób według zastrz. 1, znamienny tym, że powierzchnia każdego obszaru tłumienia (F2) jest równa powierzchni odpowiadającego mu obszaru koncentracji energii (F1). 6. Sposób według zastrz. 1, znamienny tym, że powierzchnia danego obszaru tłumienia (F2) jest większa od powierzchni odpowiadającego mu obszaru koncentracji energii (F1), oraz określona według algorytmu obliczeniowego uwzględniającego co najmniej jeden z następujących parametrów: - bezwzględnej wartości mocy dźwięku solowego (DS). - stosunku mocy dźwięku solowego (DS) do mocy tła akustycznego (TA), położenia obszaru koncentracji energii (F1) wzdłuż osi częstotliwości, - maksymalnej ilości obszarów koncentracji energii (F1) wzdłuż osi częstotliwości, - przyjętej minimalnej odległości między obszarami koncentracji energii (F1) zarówno wzdłuż osi czasu jak i częstotliwości.

PL 201 536 B1 5 7. Sposób według zastrz. 1, znamienny tym, że w systemach stereo i wielokanałowych stopień tłumienia tła akustycznego określany jest osobno dla każdego z kanałów. 8. Sposób według zastrz. 7, znamienny tym, że dla wszystkich obszarów tłumienia (F2) w danym kanale stopień tłumienia uwzględnia stały współczynnik proporcjonalności zależny od udziału dźwięku solowego w danym kanale, czyli położenia dźwięku solowego w panoramie stereofonicznej lub wielokanałowej. 9. Sposób według zastrz. 1, znamienny tym, że stosowany jest w układzie hierarchicznym, z wyróżnieniem z dźwięków tła akustycznego - podrzędnego dźwięku solowego, którego wyrazistość jest zwiększana względem pozostałych dźwięków tła akustycznego. Rysunki

6 PL 201 536 B1

PL 201 536 B1 7

8 PL 201 536 B1 Departament Wydawnictw UP RP Cena 2,00 zł.