Politechnika Warszawska Wydział Elektroniki i Technik Informacyjnych Instytut Informatyki Realizacja Dolby Surround na DSP opracowali: Tomasz Filipek Radosław Suchożebrski Warszawa, czerwiec, 003 r.
Spis treści: 1. Złożenia techniczne 3. Wybór koncepcji układu 4.1. Dekoder Matrycowy 4.. Dekoder Pro Logic (aktywny) 4 3. Zasada działania 5 3.1. Kanał surround 5 3.. Kompensacja dynamiczna 6 4. Realizacja dekodera Dolby Surround na procesorze sygnałowym 7 ADSP1160. 4.1. Zasada działania 8 4.1.1. Kanał surround 8 4.1.. Kompensacja dynamiczna 9 4.1.3. Tutaj zamieść to co uważasz 9 4. Przegląd systemów dźwięku przestrzennego 13 4.1. Dźwięk przestrzenny 13 4.. Optyczne ścieżki dźwiękowe 13 4.3. Zapis magnetyczny 14 4.4. Dolby Stereo 15 4.5. Six Track Dolby Stereo 16 4.6. Dolby SR Dolby Digital 17 4.7. Dolby Stereo - system 18 4.8. Proces nagrywania w systemie Dolby Stereo 18 4.9. Koder Dolby MP Matrix 18 4.9.1. Kanał centralny 18 4.9.. Kanał surround 19 4.10. Dolby Surround Pro Logic 19 4.10.1. Koncepcja aktywnego dekodowania 19 4.10.. Dominacja wzmocnienia 19 4.10.3. Technika kompensacji sygnałów 0 4.10.4. Zachowanie stałej mocy akustycznej 0 4.10.5. Dominacja kierunkowa 1 4.10.6. Określenie dominacji 1 4.10.7. Macierz adaptacyjna Pro Logic
1. Złożenia techniczne Celem niniejszego projektu jest zaprojektowanie i zrealizowanie Procesora sygnału Dolby surround, według założeń Dolby Labolatories. Dekoder powinien zawierać w swej strukturze wewnętrznej: - podstawową dookólną matrycę L-R do wydobycia zdekodowanej fazowo informacji dookólnej, - linię opóźniającą, zapewniającą nie tylko zgodność czasową informacji głośników dookólnych z przednimi głośnikami, ale również do zmniejszenia odczuwalności niezamierzonego przenikania sygnału dookólnego, a zwłaszcza efektu seplenienia wywołanego czasem przez błędy azymutalne. Zalecany zakres opóźnienia dla dekoderów domowych wynosi 10...30[ms], - filtr dolnoprzepustowy 7[kHz]. Ta górna częstotliwość została wybrana przez Dolby Labolatories celu zapobiegania przykremu syczeniu głośników dookólych w kinach domowych w trakcie ciszy. Charakterystyka filtru, stosunkowo stromo opadająca od strony wysokich częstotliwości, sprzyja także ograniczeniu poziomu szumów linii opóźniającej i efektu seplenienia w kanale dookólnym, - zmodyfikowany dekoder Dolby B. Wzorce L-R zawierają sygnał zakodowany w systemie Dolby B do wspomagania filtru dolnoprzepustowego przy redukcji szumów i maskowaniu efektu seplenienia. Sygnał zakodowany w systemie Dolby B występuje tylko w kanale surround, - stopień wyjściowy ze sprzężonym głównym regulatorem poziomu. Procesor powinien charakteryzować się następującymi parametrami : - możliwością regulacji parametrów wpływających na charakterystykę pola akustycznego pomieszczenia, według zaleceń Dolby Labolatories, - odpornością na zakłócenia, - niezawodnością w działaniu, - prostotą obsługi.
. Wybór koncepcji układu Sygnały Dolby Surround są kodowane przez koder Dolby Stereo. W przypadku sygnału kanału centralnego koder tłumi sygnał o 3[dB] i sumuje w fazie z sygnałem kanału lewego i kanału prawego. Sygnał kanału dookólnego jest również tłumiony o 3[dB], po czym przechodzi przez filtr ograniczający jego pasmo do zakresu 100[Hz]...7[kHz]. Następnie jest kierowany do kompresora Dolby B, z niego, po przesunięciu w fazie o [rad], dodawany do sygnału kanału prawego, a po Π Π przesunięciu o + [rad] stopni do kanału sygnału lewego. Odcięcie częstotliwości po niżej 100[Hz] w kanale dookólnym ma na celu ochronę głośników dookólnych, które są zazwyczaj mniejsze od głośników przednich i nie są w stanie odtwarzać tak niskich tonów. Ograniczanie do 7[kHz] oraz kompresja sygnału służą do redukcji szumów. Obie procedury powodują, że sepleniące dźwięki, wywołane błędami fazy i amplitudy w kanale centralnym będą odtworzone w kanale dookólnym ( co jest nienaturalne i irytujące)..1. Dekoder Matrycowy Do odtworzenia z dwóch ścieżek sygnałów czterech pierwotnych kanałów potrzebny jest dekoder. Może być to układ aktywny albo bierny, zwany dekoderem matrycowym. Rekonstruuje on sygnały dwóch brakujących kanałów przez zastosowanie dodawania i odejmowania. Sygnały kanału lewego i prawego powstają wprost z lewej i prawej ścieżki, zaś sygnał kanału centralnego z sumowania sygnałów obu ścieżek. Proces tworzenia sygnału kanału dookólnego jest bardziej złożony. Różnica dwóch ścieżek dźwiękowych jest opóźniona o 0...60[ms], aby dekonspirować przed słuchaczem dokładnej lokalizacji (dźwiękowej) znajdujących się w jego pobliżu głośników. Jest to bardzo ważne, ponieważ pierwsza fala dźwiękowa musi dochodzić do niego od przodu, który powinien pozostawać podstawowym kierunkiem orientacji. Sygnał przechodzi przez filtr pasmowy, po czym ekspander Dolby przywraca mu pierwotną dynamikę. Główna zaleta dekodera biernego jest jego prostota, wadą natomiast jest nie zapewnianie dobrej separacji kanałów. Separacja w dekoderze matrycowym jest większa od 40[dB] pomiędzy kanałem centralnym a dookólnym, natomiast separacja między kanałem centralnym i dookólnym a kanałami prawym i lewym separacja jest odpowiednio równa 3[dB]... Dekoder Pro Logic (aktywny) Analiza sygnałów wyjściowych dekodera matrycowego wiele jego słabych punktów. Dwa główne kanały zawierają informację z lewej i prawej ścieżki, ale także nie odfiltrowane składowe z kanału centralnego i dookólnego. W kanale dookólnym
można także znaleźć składowe sygnału różnicowego, zaś w kanale centralnym ślady lewej i prawej ścieżki. Głównym zadaniem dekodera aktywnego stała się oczywiście znaczna poprawa separacji kanałów. Został on w tym celu zaopatrzony w dynamiczny kompensator kierunku (ang. dynamic direction compensation). Dekoder Pro Logic analizuje skład sygnału pod względem fazy, amplitudy i częstotliwości i generuje niezbędne sygnały korekcyjne. Jeżeli na przykład w pewnym sygnały lewy i prawy są identyczne w fazie i amplitudzie, dekoder działa tak, jak gdyby sygnał mono należał do kanału centralnego. Zwiększa on wtedy wzmocnienie tego kanału i na tyle obniża wzmocnienie kanału lewego i prawego, aby całkowita głośność nie uległa zmianie. Dekodery aktywne zawierają zwykle cztery wzmacniacze sterowane napięciowo których wzmocnienie jest regulowane w zaprogramowany sposób. Takie selektywne wzmocnienie poprawia separację z 3[dB] do 37[dB] kanałów głównych kanałów od kanałów pomocniczych. Chociaż niektórzy perfekcjoniści uważają, że to jeszcze za mało, to jednak praktyka wykazała, że lepsza separacja nie jest tu potrzebna, ponieważ wszystkie cztery kanały tworzą jedno zintegrowane źródło dźwięku. Dekoder Pro Logic skalda się z podstawowej matrycy, układ wstępnego układu przetwarzania sygnałów kanału dookólnego, jak ma to miejsce d dekoderze matrycowym. Dodatkowym elementem jest dynamiczny kompensator kierunku, który steruje czterema wzmacniaczami sterowanymi napięciowo. Separacja kanałów pomiędzy kanałem surround a centralnym jest większa od 40[dB], separacja kanałów surround, centralny a lewym i prawym jest większa od 35[dB]. Przy projekcie zalety układowe obydwu dekoderów - matrycowego i Dolby Pro Logic. Zastosowano dynamiczną kompensację wzmocnienia dla zrównoważenia poziomu sygnału słyszalnego, a przez co zwiększono separację kanałów, natomiast nie zastosowano kompensacji dynamicznej dla kanału lewego i prawego, ze względu na znaczny wzrost kosztów konstrukcji, a efekt finalny podczas dekodowania ścieżki filmowej jest podobny. Należy wzmocnić o podbić wzmocnienie kanału centralnego od 3[dB] do 6[dB], aby uwypuklić ten kanał nad kanał lewy i prawy. Scena jest trochę bardziej rozmyta, natomiast rozmówcę, aktora zawsze identyfikujemy na środku sceny, co jest w racji reżysera dźwięku. Rozwiązanie tego typu dostarcza bardzo podobnych wrażeń, przy spełnieniu większości najważniejszych założeń Dolby Labolatories i przy minimalnym nakładzie kosztów budowy tego typu dekodera. Ważnym elementem aby uzyskać powyżej opisane efekty jest odpowiednie rozstawienie zespołów głośnikowych; problem ten poruszono w dalszej części niniejszej pracy. 3. Zasada działania 3.1. Kanał surround Sygnały z wejść R i L są doprowadzone także do wejść układu różnicowego, którego sygnał wyjściowy (L-P) przechodzi przez dolnoprzepustowy filtr Butterwortha, ogranicza on górną granicę pasma do 7[kHz]. Filtr ten służy do zapobiegania zakłóceniom, wywołanym przez oddziaływanie na sygnał impulsów zegarowych linii opóźniającej. Linię opóźniającą tworzy 048-stopniowy układ łańcuchowy.
Ryc..1. Schemat blokowy dekodera sygnału Dolby Surround. Sygnał z wyjść linii jest skierowany do filtru dolnoprzepustowego, eliminującego pozostałości sygnału zegarowego. Jego częstotliwość graniczna wynosi 7[kHz]. Następnie sygnał podlega ekspansji w zmodyfikowanym dekoderze Dolby B, na którego wyjściu znajduje się filtr górnoprzepustowy o dolnej częstotliwości granicznej około 50[Hz]. Efektem nałożenia się charakterystyk obu filtrów powstaje filtr pasmowoprzepustowy. Sygnał dookólny (surround) zostaje następnie doprowadzony do VCA. 3.. Kompensacja dynamiczna Sygnały z wejść R i L są doprowadzane przez do dwóch komparatorów. każdego wyjścia z każdego z nich otrzymuje się sygnał prostokątny, którego częstotliwość jest miarą zmian potencjału sygnału wejściowego. Oba te sygnały zostają doprowadzone do bramki XOR, IC8c (stan wyjścia bramki XOR jest wysoki tylko wtedy, gdy stany obu wejść są nieidentyczne, przeciwne w stosunku do siebie). W wyniku całkowania sygnału wyjściowego z bramki otrzymuje się potencjał stały, proporcjonalny do różnicy faz pomiędzy kanałem lewym a prawym. Napięcie to dokonuje sterowania wzmocnieniem VCA. Gdy więc charakter sygnału na wejściu dekodera jest monofoniczny (różnica faz między kanałem lewym i prawym jest mała albo jej nie ma), wzmocnienie sygnału sterującego VCA kanału centralnego zostaje zwiększone. W przeciwnym przypadku, kiedy pojawia się sygnał surround ( różnica faz między kanałem lewym i prawym wynosi Π [rad] lub jest zbliżona do tej wartości), zostaje zwiększone wzmocnienie wzmacniacza VCA sterującego kanałem dookólnym. Stopień, w jakim sygnały sterujące wpływają na wzmocnienie VCA, jest dobierany za pomocą empirycznie dobranych współczynników.
4. Realizacja dekodera Dolby Surround na procesorze sygnałowym ADSP1160. Dekoder Dolby Surround zrealizowano w oparciu o zestaw uruchomieniowy ADSP-1160 EZ-KIT Lite. Schemat blokowy systemu przedstawiono na Ryc.4.1. Ryc.4.1. Schemat blokowy systemu uruchomieniowego ADSP-1160 EZ-KIT Lite. W celu przetwarzania (dekodowania) sygnału audio surround oraz centralnego wykorzystano w czasie rzeczywistym wykorzystano kodek AD1881. Na wejść Line In Stereo podawany jest sygnał stereo z zakodowaną ścierzką Dolby surround. Na wyjściu Line Outw procesie przetwarzania, otrzymywany jest na kanale prawym sygnał surrround, natomiast lewym sygnał centralny. Komunikacja z systemem uruchomieniowym jest wykonywana poprze port równoległy wraz z komputerem klasy PC. Do realizacji oprogramowania posłużono się środowiskiem programistycznym Visual C++ DSP.0. W celu implementacji wyżej wymienionych założeń, oraz omówionej zasady działania dekodera opracowano algorytm przetwarzania sygnałów, z uwzględnienie możliwości implementacji na ADSP1160.[Ryc.4..].
4.1. Zasada działania 4.1.1. Kanał surround Sygnały z wejść R i L są podawane na sumator, za pomocą którego dokonywane jest odejmowane sygnałów, w celu eliminacji sygnału centralnego oraz sygnałów kanału lewego prawego. W realizacji praktycznej zrezygnowano z filtru antyaliasingowego, ze względu na implementacje tego układu w kodeku AD 1881. Sygnał następnie jest filtrowany za pomocą filtru SOI (skończonej odpowiedzi impulsowej) ósmego rzędu co narzucone zostało prze specyfikację Dolby. W realizacjach analogowych wystarczy filtr czwartego rzędu Butterwortha. Aby uzyskać taką samą transmitancję w przypadku realizacji w oparciu o układy cyfrowe należy zastosować filtr wyższego rzędu. Ryc.4.. Algorytm przetwarzania sygnałów. Filtr ten ma za zadanie ograniczać pasmo do7[khz], ze względu na to że sygnały akustyczne po wyżej tej częstotliwości nie niosą informacji o kierunku i odległości źródła sygnału. Następnie sygnał jest podawany na linię opóźniającą w wykorzystując efekt Hassa, do eliminacji przesłuchów między kanałowych. Polega to na wykorzystaniu specyfikacji percepcji sygnałów akustycznych systemu detekcji systemu ludzkiego. Jeżeli sygnał akustyczny jest podawany w paczkach w odstępach mniejszych niż 0[ms] to sygnał jest uśredniany i defekowany jako ciągły przez system percepcji człowieka. W systemie Dolby surround przesłuchy między kanałowe są eliminowane prze odpowiednią eliminację przez odejmowanie. Polega to na tym, że przesłuchy powstające w kanale lewym i prawym są tłumione przez sygnał podawany w przeciwnej fazie z kanału surround. Punkt w którym sygnały wzajemnie się tłumią należy tak dobrać, aby w danym miejscu znajdował się środek pola podsłuchowego. W torze zrezygnowano z systemu zmodyfikowanego dekodera Dolby B, ze względu na brak wnoszonych zniekształceń prze tor elektroakustycznych ; nie wprowadzając dodatkowych szumów. Natomiast do ekspansji sygnału wykorzystano specyfikację transmitancji filtra w torze przetwarzania sygnału. Dookólny (surround) sygnał zostaje w ostatniej fazie przetwarzania jest wzmacniany dynamicznie w zależności od współczynników generowanych prze układ kompensacji dynamicznej.
4.1.. Kompensacja dynamiczna Sygnały z wejść R i L są porównywane z poziomem -60[dB]. W zależności od poziomu sygnału wejściowego otrzymywany jest sygnał sterujący funktorem EXOR. Sygnał z funktora jest wprost proporcjonalny do różnicy faz sygnałów prawego i lewego. Aby otrzymać sygnał ciągły dokonano filtracji składowych wyższego rzędu. Wartość współczynników filtru dobrano empirycznie, kierując się jak najwierniejszym przetwarzaniem różnicy faz na poziom sygnałów (konwersja ϕ na u(t)). Tego typu sygnał następnie jest wzmacniany i podawany w odpowiedniej fazy jako współczynnik wzmocnienia, w celu kompensacji dynamicznej systemu dekodera Dolby surround. 4.3. Charakterystyka filtru. Filtr powinien być jak najwyższego rzędu aby charakterystyka była jak najbardziej stroma przy częstotliwości granicznej. Lecz rząd filtru nie może być zbyt duży, ponieważ niewielkie odstępstwa od wartości współczynników, wynikłe z kwantowania współczynników przez procesor, mogą powodować niestabilność. Dla filtrów NOI (o nieskończonej odpowiedzi impulsowej) kwantowanie współczynników wpływa mocniej na stabilność filtru im rząd filtru jest większy. Ponieważ filtry NOI mają dość stromą charakterystykę, na granicach pasma, dla rzędu 4-ego, a kwantowanie ma jeszcze nie wielki wpływ, postanowiliśmy użyć filtru N=4 rzędu. Częstotliwość graniczna filtru aktywnego dolnoprzepustowego f [ khz] g = 7. Wykonując tego typu filtr opierano się na filtrze Sallena-Keya i wyprowadzono transmitancję filtru Butterwortha, aby móc dobrać wartości elementów. Transmitancja filtru o charakterystyce Butterwortha nie ma zer, natomiast bieguny są równomiernie rozłożone na lewym półokręgu o promieniu ω 0 (ryc.1.8.). Przy N nieparzystym transmitancja ma dodatkowy biegun rzeczywisty ω 0. Każdej parze sprzężonych biegunów odpowiada transmitancja zwana sekcją bikwadratową: k k () s = s 1 1 = ω Q s + + ω s sk s s 0 0 Przy czym s = ω ( α + j α ) k * ( )( ) k (4.1) ( k 1) Π N ( k = 1,,...,, gdy N jest k 0 cos k sin k, a kąt α k = N parzystym stopniem wielomianu) lub α = k k Π (k = 1,,..., ( N 1), gdy N jest N 1 nieparzystym stopniem wielomianu), więc Qk =. cosα k Iloczyn dwu takich sekcji jest poszukiwaną transmitancją filtru Butterwortha czwartego rzędu. Dla N = 4 : α 1 =, 5 i α = 67, 5 (wartości α1, α patrz ryc..7.) zatem dobroć każdej z sekcji Q1 = 11848, = 0, 541, Q = 1 0, 765 = 1, 307(patrz tablica 1.1.).
W celu doboru elementów układu należało wyznaczyć zespolony współczynnik wzmocnienia odpowiadający równaniu: ( ) ks = k 0 1 + s n (4.) Porównując powyższe równanie z funkcją przenoszenia filtru dolnoprzepustowego: ( ) ks k0 = + cs + 1 cs +... + cs 1 n n (4.3) Rozwiązanie: k 1 + 0 s n = k 1 + cs+ cs+... + cs 1 0 n n (4.4) n ( ) n k 1+ cs+ c s +... + c s = k 1+ s (4.5) 0 1 n n n ( 1+ + + + ) = ( 1+ ) 0 k c s c s... c s k s (4.6) 0 1 n n ( 1+ cs 1 + cs + + cs n ) = ( 1+ s ) n 0... (4.7) Wyniki powyższego równania dla n = 1, 34,, przedstawiono kolejno poniżej. 1+ s 1+ s+ s ( )( ) 1+ s+ s + s = 1+ s 1+ s+ s 3 ( )( ) 1+, 613s+ 3, 414s +, 613s + s = 1+ 1848, s+ s 1+ 0, 765s+ s 3 4 (4.8) Transmitancja znormalizowana względem pulsacji ω 0 czwartego rzędu ma zatem postać: =1 dla filtru Butterwortha ks ( ) = 1 ( s + 0756, s+ 1)( s+ 1848, S + 1), (4.9) natomiast pełna transmitancja filtru: () ks = 4 ω ( s + 1, 848ω s+ ω )( s + 0, 7654ω s+ ω ) 0 0 0 0 0, (4.10) przy czym ω 0 = Πf = 439897 1503[ rad s] G, jest pulsacją graniczną filtru.
Najprostszą realizacją sekcji bikwadratowej jest układ z jednym wzmacniaczem operacyjnym, zwanym układem Sallena-Keya. Rys..14. Realizacja filtru Sallena-Keya. Na ryc..14. przedstawiono jego ogólną postać ze wzmacniaczem nieodwracającym. Realizację dolnoprzepustowej sekcji bikwadratowej przedstawia ryc..15. Dla tego układu k0 = k +, a ω 0 1 = RRCC (4.11) 1 1 Dobroć poszczególnych sekcji: Q = RC ω 0 C R 1+ C R 1 1 (4.1) Wstępnie filtr wygenerowaliśmy i testowaliśmy programem matlab. Poniżej prezentujemy charakterystykę filtru testowego. Charakterystyka amplitudowa filtru fd=7khz 1 0.8 Wzmocnienie 0.6 0.4 0. 0 0.5 5 7.5 10 1.5 15 Czestotliowsc [khz]
Do implementacji filtru użyliśmy następujących współczynników, otrzymanych we wstępnych symulacjach: a = 1.0000-1.6365 1.3445-0.519 0.083 b = 0.0169 0.0678 0.1016 0.0678 0.0169 Wartości wektora a stanowią współczynniki mianownika transmitancji, zaś wektora b - współczynniki licznika transmitancji. Fragment kodu realizujący różnicę L-P oraz filtrację wyżej zaprojektowanym filtrem wygląda następująco: //dla filtru NOI float states[n], coeff_n[*n+1]={ -1.6365, 1.3445, -0.519, 0.083, 0.0678, 0.1016, 0.0678, 0.0169, 0.0169}; float b, *a, *wynik; int temp; RESULT rv = OK; UINT3 gusertxbuf1[6] = { AD1881_REG_TAG, /* ctrl */ 0x7c00 0x8000, /* addr */ 0, /* data */ 0, /* left channel */ 0, /* right channel */ 0 }; UINT3 guserrxbuf1[6] = { 0, 0, 0, 0, 0, 0}; a=(float *)malloc(sizeof(float)); wynik=(float *)malloc(sizeof(float)); if(!rv) rv = SHARC_OpenSerPort1( NO_FLAGS ); if(!rv) rv = HHEZL_SetupCodec( NO_FLAGS ); /* Set RECSEL to MIC IN L and R*/ HHEZL_WriteCodecReg( AD1881_RECSEL_ADDR, 0x0404 ); /* Set REC Volume L and R*/ HHEZL_WriteCodecReg( AD1881_RECGAIN_ADDR, 0x0000 ); /* Set LINE IN Volume L and R*/ HHEZL_WriteCodecReg( AD1881_LINEIN_VOL_ADDR, 0x8000 ); /* PCM OUT VOLUME */ HHEZL_WriteCodecReg( AD1881_PCM_VOL_ADDR, 0x0808 ); gusertxbuf1[0] = 0xf800; HHEZL_ReadFromCodec( guserrxbuf1 ); while(1) {
asm("#include <def1160.h>"); //Czytnie danych i różnica L-P temp = guserrxbuf1[3]; *a = (float)temp; temp = guserrxbuf1[4]; b = (float)temp; *a = *a - b; { // część filtrująca filtr NOI *wynik=0;b=0; for (i=0;i<n;i++) { *a -= states[init] * coeff_n[i]; checkup(&init); } for (j=0;j<n_n;j++) { b += states[init] * coeff_n[i]; i++; checkup(&init); } *wynik = *a * coeff_n[i] + b; checkdown(&init); states[init]=*a; } //Wyniki na wyjście, podawane do kodeka, w postaci INT-ów temp=(int)*wynik; gusertxbuf1[3]=temp; Deklaracja plików nagłówkowych do obsługi kodeka znajdującego się na płytce, oraz pliki nagłówkowe samej płytki znajdują się w pliku surround.h, który jest dołączany na początku. Jest tam również kilka zdefiniowanych na stałe wartości. 5. Przegląd systemów dźwięku kinowego 5.1. Dźwięk przestrzenny w kinie Korzenie współczesnych standardów kina domowego - Dolby Surround Pro Logic - tkwią w technice filmowej, która do niedawna była jedynym źródłem wielokanałowego dźwięku. Rozwój techniki dźwięku wielokanałowego odbywał się na przestrzeni wielu lat. 5.. Optyczne ścieżki dźwiękowe Pierwszy sposób uzupełnienia filmu dźwiękiem polegał na wykorzystaniu płyty gramofonowej. Krótki jej żywot skończył się w momencie wprowadzenia zapisu optycznego, prostego w realizacji i prostego w eksploatacji. Dźwięk zapisywano nanosząc między klatkami filmu a perforacją negatywową ścieżkę, której zmienna szerokość odpowiadała zmianom sygnału akustycznego. Podczas odtwarzania filmu dodatkowa lampa projekcyjna wytwarzała wąską wiązkę światła, która po przejściu przez przezroczystą ścieżkę oświetlała foto-czujnik, gdzie zachodziła konwersja zmian oświetlenia na w akustyczny sygnał elektryczny. Ze względu na jednakową
postać zapisu obrazu i dźwięku prosty był proces kopiowania filmu, który wykonywano równocześnie na specjalnych rekorderach z szybkością do 0 razy większą niż szybkość projekcji filmu. Filmy z optyczną rejestracją dźwięku pojawiały się na szerszą skalę w późnych latach dwudziestych. Lepsza jakość z optycznej ścieżki wymogła ulepszanie zestawów głośnikowych i akustyki sal kinowych. Duże ekrany prowadziły do prób stworzenia bardziej realistycznego obrazu akustycznego. W 1941 roku wytwórnia Walt Disneya zaprezentowała animowany film "Fantasia", któremu po raz pierwszy towarzyszył dźwięk stereofoniczny. Wykorzystano bardzo kosztowną technikę, gdyż synchronicznie z obrazem odtwarzano drugą taśmę z trzema optycznymi ścieżkami dźwiękowymi. 5.3. Zapis magnetyczny W latach pięćdziesiątych konkurencja kina z telewizją doprowadziła do wprowadzenia standardów szerokoekranowych w kinie. Panoramiczna prezentacja obrazu wiązała się z potrzebą większej liczby kanałów dźwięku towarzyszącego. Wraz z nowymi formatami pojawiły się nowe formaty dźwięku. Zastosowano technikę znaną z nagrań magnetofonowych. Po utrwaleniu obrazu, na taśmę filmową nanoszono ścieżki z tlenku żelaza, które zapisywano za pomocą głowicy magnetycznej. Większą rolę odegrały tu dwa systemy - Cinema Scope dla taśmy 35 mm i Todd AO dla taśmy 70mm. W Cinema Scope na czterech ścieżkach znalazły się cztery kanały: lewy, prawy, centralny i efektowy. Trzy głośniki kanałów głównych umieszczono za ekranem, zaś efekty specjalne odtwarzano przez wiele głośników umieszczonych na ścianach sali kinowej, dookoła widzów. Ryc.4.1. Łańcuch odtwarzania filmów z dźwiękiem Dolby Stereo. Format Todd AO wykorzystywał natomiast natomiast taśmę o szerokości 70 mm, wystarczającą do umieszczenia wszystkich sześciu śladów z dźwiękiem. Filmy 70 mm przeznaczone były dla bardzo dużych ekranów projekcyjnych i dlatego należało zapobiec tworzeniu się "dziur" w panoramie dźwiękowej, wynikających z ograniczeń charakterystyk głośników. Do standardowych kanałów przednich - lewego, centralnego i prawego dodawano dwa pośrednie - półlewy i półprawy. Prócz pięciu głośników przednich wokół sali kinowej umieszczono wiele głośników odtwarzających szósty kanał z efektami. Zapis magnetyczny zapewniał lepszą jakość, lecz po pierwszym boomie ( w latach 50) liczba filmów i kin przystosowanych do tych standardów stopniowo malała ( w latach 60 i na początku 70). Wiązało się to z przeminięciem mody na wielkie ekrany, ale przede wszystkim z wadami tych
systemów. Realizacja nagrań była droga dla producentów, gdyż nanoszenie ścieżek magnetycznych i ich zapis wymagały dużych nakładów pracy. W kinie z kolei uległ skomplikowaniu system projekcyjny, rozbudowany o złożony blok głowic magnetycznych. Istotną wadą była krótka żywotność nośnika, którego cząstki często odpadały od podłoża przy wielokrotnej projekcji. Wskutek tych problemów tylko największe premiery filmowe w niewielkiej liczbie kin prezentowane były z dźwiękiem "magnetycznym". Do połowy lat 70 większość miłośników kina zwykle zmuszona była słuchać niskiej jakości monofonicznego dźwięku, zarejestrowanego w sposób optyczny. Ryc.4.. Six Track Dolby Stereo a)rozmieszczenie ścieżek magnetycznych, b)ustawienie głośników. Zapis magnetyczny umożliwił jednak realizatorom nagrań eksperymentowanie z kanałem efektowym, ze względu na dobry stosunek sygnał/szum. Kanał ten można było wykorzystać do otoczenia słuchaczy dźwiękiem rozproszonym o niskim poziomie. Nie tylko. Nie tylko podkreślał on dramatyzm sceniczny, ale wydobywał ogólny realizm wydarzeń. W odniesieniu do tych, trzeba przyznać, bardziej naturalnych wrażeń zaczęto używać określenia dźwięk surround. 5.4. Dolby Stereo Przełom nastąpił kiedy Ray Dolby, wynalazca systemu redukcji szumu Dolby A, zajął się dźwiękiem filmowym. Wrócił do zapisu optycznego na taśmie 35 mm, z tym że dzięki zastosowaniu układu redukcji szumu i lepszemu ogniskowaniu głowicy odczytującej uzyskano o wiele wyższą jakość odtwarzania dźwięku. Na dwóch ścieżkach zarejestrowano nie tylko sygnał lewy i prawy, ale też centralny oraz surround. Osobny kanał centralny służył poprawnej lokalizacji dialogów przez widzów znajdujących się poza osią akustyczną zestawu przedniego. Kanał surround przeznaczono dla efektów specjalnych i tworzenia odpowiedniej atmosfery akustycznej zdarzeń. Zakodowanie czterech kanałów na dwóch ścieżkach możliwe było dzięki zastosowaniu techniki matrycowej. System nazwano Dolby Stereo, kojarząc kino stereo z efektami przestrzennymi, a nie z dwuwymiarową panoramą klasycznej stereofonii hifi. Pierwszym filmem w nowym standardzie były "Narodziny gwiazdy" (1976) z Barbarą Streisand, jednak to "Gwiezdne wojny" i "Bliskie spotkania trzeciego stopnia" utorowały drogę Dolby Stereo, wykorzystując w pełni zalety
dźwięku wielokanałowego połączonego z efektami wizualnymi. Optyczny zapis oraz kopiowanie obrazu i dźwięku na taśmie 35 mm odbywają się równocześnie, a trwałość jest nieporównywalnie lepsza od zapisu magnetycznego. Przejście kin na system Dolby Stereo było stosunkowo proste, należało dodać tylko procesor Dolby i zestawy głośnikowe odpowiedniej jakości, aby doświadczyć w pełni zalet nowej techniki. W rezultacie 5 tyś. kin przeszło na nowy standard. 5.5. Six Track Dolby Stereo Po sukcesie Dolby Stereo na taśmie 35 mm inżynierowie Dolby Labs zajęli się sześcioma ścieżkami dźwiękowymi taśmy 70 mm, a technikę nazwano 70 mm Six Track Dolby Stereo. Zastosowano system redukcji szumu Dolby A, a podstawowa zmiana dotyczyła rozdziału kanałów. Mniejsze wymiary ekranów i postęp w technice głośnikowej ograniczyły liczbę kanałów przednich do trzech: lewego, prawego i centralnego. Na pozostałych ścieżkach umieszczono dwa kanały niskich częstotliwości i jeden kanał surround. Ryc.4.3. Ścieżki dźwiękowe Dolby Digital na taśmie 35mm W laboratorium Dolby opracowano też opcjonalny wariant wykorzystania tych trzech ścieżek, w którym efekty surround były przenoszone przez dwa kanały, a jeden kanał pozostawiono dla niskich częstotliwości. Dwa rozdzielone kanały surround stworzyły podstawy do operowania precyzyjną lokalizacją efektów. Kanał niskich częstotliwości przeznaczono nie do przenoszenia basów wszystkich kanałów, lecz do specjalnych efektów, wymagających szczególnie silnego uderzenia i odpowiednich zestawów głośnikowych. Zachowanie kompatybilności z poprzednimi standardami 70 mm wymagało odpowiedniego zapisu na ścieżkach. Ślady 1,3,5 zarezerwowano dla kanału lewego, prawego i centralnego, informację na śladach i 4 rozdzielono - sygnały poniżej 100[Hz] przeznaczone były dla subwoofera, zaś powyżej 100[Hz] dla dwóch kanałów surround. Ślad 6 przenosił monofoniczny kanał surround, wykorzystywany w kinach, które nie zdecydowały się na stereo. Ze względu na wysokie koszty tylko największe produkcje końca lat 70 i początku 80 wykorzystały stereofoniczne efekty surround, m.in. "Czas Apokalipsy", "The Wall", "Superman". System ten stworzył jednak podstawy dla dyskretnych, cyfrowych standardów wielokanałowych.
5.6. Dolby SR Dolby Digital. W 1986 roku firma Dolby Labs wprowadziła nowy, profesjonalny proces nagrywania, zwany Dolby Spectral Recording (Dolby SR), który niósł wiele korzyści: większą redukcję szumu w porównaniu z Dolby A i możliwości przenoszenia sygnałów o wysokim poziomie w większym paśmie i z mniejszymi zniekształceniami. Z tego względu zastosowano go też w systemie Dolby Stereo (Dolby Stereo SR) podnosząc znacznie jakość dźwięku "optycznego". Technika SR jednak nie zdołała powstrzymać trendu ku cyfrowemu dźwiękowi na taśmie filmowej, po sukcesie, jaki odniosła płyta CD. Ryc.4.4. Łańcuch odtwarzania Dolby Digital. Cyfrowa rejestracja oznaczała w pełni dyskretne kanały i bardzo dużą dynamikę. Pierwszy powstał system CDS (Cinema Digital Sound), opracowany przez Kodaka w 1991 roku. Nie przyjął się on z kilku względów, m.in. z powodu braku kompatybilności ze starszymi formatami 35 mm, gdyż dane cyfrowe zajęły w nim miejsce ścieżek analogowych. Odpowiedzią laboratoriów Dolby na CDS był Dolby SR Digital, którego premiera odbyła się w 199 roku. Nauczeni porażką CDS inżynierowie Dolby Labs pozostawili sygnały analogowe SR na swoim miejscu, natomiast znaleźli nowe miejsce dla danych cyfrowych reprezentujących sześć kanałów - powierzchnie ok.,5 mm między otworami perforacji filmu. Dzięki takiej strukturze jakość dźwięku towarzyszącego filmowi zależała od wyposażenia kina. W najgorszym przypadku jest to dźwięk monofoniczny, w najlepszym - wielokanałowy dźwięk dyskretny z wszechstronnymi możliwościami efektów specjalnych. Dźwięk cyfrowy odtwarzany jest przez dodatkową optyczną głowicę z półprzewodnikowym sensorem CCD, a następnie przetwarzany w dekoderze procesora, do którego docierał też sygnał analogowy. Równoległy zapis ma ważną zaletę, która ujawnia się w przypadku uszkodzenia toru cyfrowego, wówczas procesor natychmiast przełącza się na odtwarzanie ścieżek analogowych. Dolby SR Digital nazwani z czasem Dolby Stereo Digital, aż w końcu pozostawiono określenie Dolby Digital, aby uniknąć kojarzenia z klasyczną stereofonią dwukanałową. W przypadku Dolby Digital mówi się o liczbie kanałów 5.1, gdyż pięć kanałów: lewy, prawy, centralny, lewy surround, prawy surround (L, R, C, LS, RS) przenosi pełne pasmo 0[Hz] do 0[kHz], zaś szósty kanał przeznaczony jest tylko do specjalnych efektów najniższych częstotliwości (Low Frequency Effects - LFE) ograniczonych pasmowo do 100[Hz]. Zapis bardzo dużego strumienia danych
cyfrowych na małej powierzchni (76/76 punktów) byłby niemożliwy, dlatego opracowano system kodowania AC-3, redukujący 10-krotnie pierwotną liczbę danych. 5.7. Dolby Stereo - system Ludzki zmysł słuchu cechuje zdolność określania kierunku docierającego dźwięku w pełnym zakresie 360 stopni. Na podstawie tej właściwości działają kinowe systemy wielokanałowe, w tym Dolby Stereo. W Dolby Stereo wykorzystuje się cztery kanały - lewy (L), centralny (C), prawy (R) oraz surround (S). Głośnik kanału centralnego przenosi głównie dialogi oraz dźwięki dobiegające ze środka sceny. Jest on także pomocny przy tworzeniu iluzji ruchu, np. człowieka przechodzącego z jednej na drugą stronę ekranu. Szereg głośników surround otaczających salę kinową wytwarza odpowiednią atmosferę i przenosi np. odgłosy deszczu, wiatru, miejskiego zgiełku. Kanał dookólny (surround) wykorzystuje się też do efektów specjalnych z których najbardziej znanym przykładem jest samolot przelatujący nad głowami widzów. Podkład muzyczny filmu miksowany jest we wszystkich czterech ścieżkach. 5.8. Proces nagrywania w systemie Dolby Stereo Jednym z zadań, jakie postawili sobie inżynierowie Dolby Labs, było stworzenie formatu który zapewniałby poprawne odtwarzanie dźwięku także w kinach z aparaturą stereofonii dwu kanałowej lub monofoniczną, Sygnały czterech kanałów (L, C, R, S) są więc odpowiednio kodowane na dwóch ścieżkach optycznych przenoszących złożone kanały transmisyjne Lt i Rt (Left total. Right total) Proces konwersji 4/ z zachowaniem pełnej informacji zachodzi w koderze Dolby MP Matrix, Stosuje się go w studiu nagraniowym. gdzie dokonuje się udźwiękowienia filmu (MP = Motion Picture = film kinowy), a określenie Matrix związane jest z macierzowymi operacjami, którym podlegają sygnały L, C, R, S tworzące ostatecznie sygnały sumacyjne. Sygnały Lt i Rt z wyjścia kodera kierowane są do układu redukcji szumu Dolby A lub SR, Tak ukształtowane sygnały elektryczne sterują urządzeniem naświetlającym taśmę filmową, które wytwarza dwie optyczne ścieżki dźwiękowe 5.9. Koder Dolby MP Matrix Sygnały lewego i prawego kanału wchodzą w skład Lt i Rt bez dodatkowych modyfikacji, Na sygnałach kanału centralnego i dookólnego wykonywane są natomiast operacje mające na celu zapewnienie kompatybilności oraz odpowiednie kształtowanie pola akustycznego. 5.9.1. Kanał centralny Sygnał kanału centralnego jest tłumiony o 3 [db] i wprowadzany w obie ścieżki Lt i Rt przez sumowanie z sygnałem kanału lewego oraz prawego Tłumienie 3 [db], odpowiadające równemu podziałowi na dwie części, ma na celu utrzymanie stałej mocy akustycznej w całkowitym materiale. Obie części kanału C (w Lt i Rt) są zgodne w fazie, dlatego odtwarzanie w systemie klasycznej stereofonii będzie poprawne, Dwa głośniki będą promieniowały dźwięki, które zsumują się w każdym uchu i w rezultacie kanał
centralny będzie lokalizowany tam, gdzie powinien, tj. pośrodku między głośnikami. Nie ma problemu w przypadku odtwarzania monofonicznego, gdyż wtedy sumowane będą trzy sygnały L, C, R. 5.9.. Kanał surround Pierwszą operacją wykonywaną na sygnale surround jest stłumienie o 3 [db], z tych samych względów, co w przypadku przenoszenia kanału centralnego. Później dokonuje się filtracji pasmowoprzepustowej, Wytłumiane są częstotliwości poniżej 100 [Hz], gdyż zawierają one bardzo mało informacji o kierunku i wymagałyby większych głośników dla sprawnego przetwarzania. Wytłumiane są też częstotliwości powyżej 7 [khz], aby ograniczyć zdolność lokalizacji źródeł dookólnych. Sygnał jest następnie przetwarzany w koderze Dolby NR, będącym zmodyfikowanym układem Dolby B, o ograniczonym do 5 [db] stopniu kompresji (w Dolby B 10 [db]). Sygnał surround przed wprowadzeniem do kanałów Lt i Rt jest jeszcze przesuwany w fazie o +Π [rad] Π [rad], co w rezultacie daje przesunięcie faz obu składników względem siebie o Π[rad]. Celem tego procesu jest stworzenie rozproszonego pola dźwiękowego. Łatwo to zrozumieć na przykładzie pary głośników. Kiedy zasilane są one sygnałami o tej samej częstotliwości, ale o przeciwnej fazie, ich membrany drgają dokładnie w przeciwnych kierunkach i słuchacz nie może określić lokalizacji źródła, w przypadku dużej liczby głośników dookólnych dyfuzja pola akustycznego jest naturalna. Jeśli jednak kino wyposażone jest tylko w dwa przednie głośniki, to dzięki przesunięciu faz wytworzą one także rozproszone pole. Przy odtwarzaniu monofonicznym suma obu składników surround będzie zerem, gdyż przebiegi skompensują się wzajemnie. Biorąc to pod uwagę, realizatorzy nagrań dodają część informacji surround do kanałów przednich, tak aby pozostała ona także przy odtwarzaniu monofonicznym. 5.10.Dolby Surround Pro Logic 5.10.1.Koncepcja aktywnego dekodowania W procesie dekodowania systemu Pro Logic, mającym na celu uzyskanie wysokiego stopnia separacji między kanałami, stosuje się tzw. technikę uwydatniania kierunkowego. Dekoder aktywny rozważa się najprościej jako połączenie dekodera pasywnego i układu uwydatniania kierunkowego. Poniżej opisano różne metody prowadzące do prawidłowego ogniskowania w przestrzeni sygnałów odtwarzanych z dwóch zakodowanych kanałów. 5.10..Dominacja wzmocnienia Najprostszą metodą uwydatniania kierunkowego jest tzw. dominacja wzmocnienia. Realizuje ją układ czterech wzmacniaczy sterowanych napięciem VCA. Kiedy dialog jest obecny w kanale centralnym (Lt = Rt), to zgodnie z zależnościami systemu pasywnego pojawia się także w lewym i prawym kanale z poziomem o 3 [db] niższym. Układ sterujący może wyeliminować szkodliwe przesłuchy przez redukcję wzmocnienia lewego i prawego kanału, pozostawiając słyszalnym tylko kanał
centralny. Podobnej procedury można użyć dla izolacji kanału lewego przez wyłączenie wyjść kanału centralnego i surround, kiedy obecny jest tylko sygnał Lt. Tym prostym sposobem może zostać w pełni przywrócona dobra separacja dla sygnału o każdej lokalizacji. Niestety, ścieżki dźwiękowe filmów rzadko składają się z pojedynczych, izolowanych dźwięków. Dialogi są najczęściej zmiksowane ze stereofonicznym podkładem muzycznym. Widz chciałby słyszeć dialogi z głośnika centralnego, a muzykę z głośnika lewego czy prawego. Wskutek przesłuchów powstających w dekoderze pasywnym dialogi dochodzą też z kanału lewego i prawego, muzyka natomiast dociera także z kanału centralnego i surround. Dialog dominuje w nagraniu i kontroluje układ uwydatniania, aby zredukować przesłuchy w kanale lewym i prawym. Ta operacja odcina jednak stereofoniczną muzykę, pozostawiając tylko monofoniczną sumę w kanale centralnym i sygnał różnicy w kanale surround. Kiedy ustaje dialog, układ sterowania przywraca wzmocnienie w kanale lewym i prawym, umożliwiając stereofoniczną emisję muzyki. Dialog nie maskuje wytłumienia muzyki, a jeszcze gorszy efekt występuje, gdy dialog nagie rozpoczyna się i kończy. Muzyka dochodząca z kanałów głównych jest wówczas wyłączana i włączana, co słychać wyraźnie jako tzw. "pompowanie" dźwięku, gdyż występują nagłe skoki w poziomie całkowitej mocy akustycznej. Tak realizowana technika dominacji wzmocnienia nadaje dźwiękom niestabilny charakter i powoduje przemieszczanie się sceny dźwiękowej. Była ona stosowana w systemie kwadrofonii, który nie przyjął się m.in. ze względu na te niekorzystne cechy. W aktywnym dekoderze Pro Logic stosuje się także zmienne wzmocnienie, ale tutaj znajduje ono zastosowanie w bloku kompensacji uzupełnionym układem zachowania stałej mocy akustycznej. 5.10.3.Technika kompensacji sygnałów Technika kompensacji jest inną metodą, która eliminuje przenikanie dialogów do lewego i prawego kanału. Odwracając fazę sygnału kanału prawego i wprowadzając go do kanału lewego uzyskuje się usunięcie składników kanału centralnego w kanale lewym, gdyż występuje sumowanie sygnałów o przeciwnych polaryzacjach. Tak przedstawia się podstawowa koncepcja kompensacji. Nieuchronną konsekwencją procesu kompensacji jest jednak zakłócenie obrazu muzycznego w kanałach głównych. W kanale lewym pojawi się bowiem odwrócony w fazie sygnał kanału prawego i odpowiednio w kanale prawym odwrócony sygnał kanału lewego. W głośniku centralnym pojawi się muzyka w postaci składnika sumy L+R. Fakt wtórnego rozdziału przestrzennego muzyki nie oznacza jednak zmiany całkowitego poziomu, jak to było w przypadku układu uwydatniania wzmocnienia. Stosując odpowiednie rozwiązanie można utrzymać stałą moc akustyczną dla wszystkich elementów dźwiękowych. 5.10.4.Zachowanie stałej mocy akustycznej Podczas pracy dekodera dźwięki dominujące są ogniskowane w konkretnym punkcie, natomiast dźwięki niedominujące są promieniowane przez pozostałe głośniki. Dźwięki dominujące ograniczają czasowo percepcję zmian kierunkowości dźwięków niedominujących. Jeśli nie ma zmian całkowitej głośności, to nie występują szkodliwe efekty "pompowania" i modulacji sygnałów.
Efekt maskowania sygnałów jest powszechnie wykorzystywany w układach redukcji szumu Dolby NR (maskowanie szumu sygnałem użytecznym). W ścieżkach filmowych różnice poziomów poszczególnych elementów dźwiękowych są jednak często mniejsze od 0 [db], a w dłuższym przedziale mogą się w ogóle niwelować, więc dźwięki dominujące są mato efektywnym środkiem maskowania zmian poziomów dźwięków niedominujących. W opisanym przykładzie dialog jest wiele głośniejszy od podkładu muzycznego, dlatego wymaga maksymalnej akcji dekodera. Gdy poszczególne dźwięki są zbliżone poziomem, to każdy z nich maskuje przesłuchy pochodzące od innych, przesłaniając fakt, że separacja nie jest doskonała. Potrzebne jest wówczas mniejsze uwydatnienie kierunkowe, a mogą zdarzyć się sytuacje, kiedy jest ono w ogóle zbędne i wtedy dekoder przekształca się w system pasywny. Tak jest w przypadku odgłosów deszczu czy wiatru, które powinny dobiegać równomiernie ze wszystkich głośników. Utrzymując stałą moc sygnału i stosując odpowiednie uwydatnienie kierunkowe można uznać niewielkie maskowanie sygnałów za wystarczające. 5.10.5.Dominacja kierunkowa sygnału Dźwięk dominujący to taki, który najbardziej wyróżnia się w zmiksowanym materiale. Konieczne jest wyczucie, kiedy występuje zjawisko dominacji, gdyż wpływa ono na percepcję dyskretności sceny czy efektywną separację. Najwyższy stopień dominacji występuje wtedy, kiedy źródła wszystkich dźwięków są umiejscowione w jednym punkcie. Taki sygnał odtworzony zostanie przez pasywny dekoder w odpowiednim miejscu, ale jego części pojawią się w sąsiednich kanałach. Nie będzie innych dźwięków, które pomogłyby maskować przesłuchy. Czysty dominujący sygnał uwydatnia więc najbardziej przesłuchy, ale także stwarza sytuację, w jakiej uboczne efekty uwydatniania kierunkowości mogą być łatwo i w pełni stłumione. W przypadku dźwięków o zbliżonej intensywności następuje ograniczenie zdolności ich precyzyjnej lokalizacji, dlatego też wymagane jest małe uwydatnienie kierunkowości lub w ogóle jego brak. Dwa różne dźwięki mogą wydawać się takie same pod względem średniej głośności, ale obserwując ich chwilowe wartości zauważymy ciągłą zmianę dominacji. Biorąc pod uwagę stosunek wartości szczytowej do średniej, można określić, czy konieczne jest uwydatnienie kierunkowe. Dekoder musi mieć dwie cechy, aby móc pracować efektywnie. Po pierwsze, powinien być wystarczająco szybki, aby zapewnić w czasie rzeczywistym uwydatnienie między dwoma lub więcej zakodowanymi pozycjami, kiedy wartości szczytowe sygnału wyróżniają się na tyle, że słyszalne są jako osobne zdarzenia. Druga cecha to zdolność wykrywania, kiedy względna dominacja spada poniżej wartości, przy której uwydatnienie kierunkowe staje się niepotrzebne, a szybkie działanie dałoby niewyraźny i nerwowy obraz dźwiękowy. Z tych powodów dekoder Pro Logic musi reagować na poziom dominacji w ścieżce dźwiękowej. Kiedy dominacja jest na niskim poziomie, dekoder pozostaje w tzw. "wolnym" trybie pracy, tworząc stabilne pole dźwiękowe. Powyżej pewnego punktu dekoder przełącza się w "szybki" tryb pracy, aby przetworzyć dokładnie każdy indywidualny element dźwiękowy. 5.10.6. Określanie dominacji Odczucie separacji dwóch dźwięków jest zdeterminowane stosunkiem ich poziomów, dlatego układ detekcji musi działać na podstawie pomiaru tych wartości. Określenie
relatywnej dominacji realizuje się na drodze elektronicznej przez zlogarytmowanie dwóch sygnałów i ich odjęcie, co odpowiada stosunkowi wyrażonemu w [db]. Zmiany wynikowego napięcia sterującego zbliżone są do odczuwanych zmian głośności. Proces ten zapewnia zwiększenie separacji, które jest bezpośrednio związane z wartością potrzebną do obniżenia przesłuchów poniżej słyszalnego poziomu i proporcjonalne do zdolności maskujących dźwięku dominującego. Określenie, który dźwięk jest dominujący, wymaga wyznaczenia lokalizacji źródła, czyli azymutu i amplitudy dominacji. W tym jednym kierunku powinno zachodzić uwydatnienie. Z definicji, dominacja może wystąpić tylko w jednym punkcie w danej chwili. Nie może zaistnieć w dwóch miejscach równocześnie, gdyż równość amplitud dwóch sygnałów oznaczałaby, że żaden nie jest dominujący. Za pomocą dwóch niezależnych, ortogonalnych par sygnałów dostępnych w zakodowanych ścieżkach (pary L/R i C/S ) można wyznaczyć dowolny punkt na płaszczyźnie X-Y Dominację prezentuje się jako wielkość wektorową. Jeśli na osi X odłożymy wartość dominacji L/P a na osi Y wartość dominacji C/S, to w wyniku złożenia otrzymamy wektor, którego kierunek jest kierunkiem dominującego dźwięku, a jego amplituda odpowiada względnej dominacji. 5.10.7. Macierz adaptacyjna Pro Logic Ogólnie można powiedzieć, że system Pro Logic monitoruje ciągle zakodowane ścieżki, szacując dominację pola dźwiękowego i wprowadzając uwydatnienie w tym samym kierunku, proporcjonalnie do wartości dominacji. Macierz zawiera dwie równoległe ścieżki: prawie bezpośrednią ścieżkę audio ( Lt i Rt podawane są bezpośrednio do sieci kombinacyjnej) i skomplikowaną ścieżkę sterującą. Większa część elektroniki dekodera jest raczej używana do analizy sygnałów wejściowych niż do właściwego przetwarzania sygnałów audio. Głównym zadaniem jest wytworzenie sygnału wektora dominacji. Pierwszym krokiem w tym procesie jest przygotowanie sygnałów wejściowych, aby zabezpieczyć się przed błędami dekodowania. Sygnały Lt i Rt przechodzą przez filtr pasmowoprzepustowy, który odcina niskie częstotliwości nie niosące informacji o kierunku oraz wysokie częstotliwości obarczone nieraz zniekształceniami fazowymi i amplitudowymi pochodzącymi z torów transmisyjnych. Następnie określa się amplitudy dwóch par ortogonalnych sygnałów. Po wyprostowaniu każdego podstawowego sygnału otrzymuje się napięcia stałe, które w parach ulegają wzmocnieniu we wzmacniaczu logarytmującym i ostatecznie tworzy się ich różnice. Otrzymane dwa niezależne sygnały sterujące reprezentują dominację na osi L/R i dominację na osi C/S. Te dwa napięcia sterujące są bipolarne. Dla przykładu, jeśli napięcie dominacji L/R jest dodatnie, to wskazuje ono na położenie dźwięku dominującego w kierunku lewego głośnika. Każde z napięć sterujących szacowane jest ciągle, by ustalić, czy względna dominacja przekracza określoną wartość progową. Jeśli to następuje, wtedy układ kontrolny przełącza układy na "szybki" tryb operacji. Dzielnik polaryzacji rozbija dwa bipolarne sygnały dominacji na cztery unipolarne napięcia: EL, ER, EC i ES. Reprezentują one dominację kierunku, więc mogą być podane do stopnia kompensacji złożonego ze wzmacniaczy sterowanych napięciem (VCA). Są dwa kanały wejściowe (Lt i Rt) oraz cztery napięcia sterujące, stąd używa się 8 wzmacniaczy do generacji 8 zmiennych członów. Wraz z sygnałami Lt i Rt mamy więc 10 członów. Proces tworzenia sygnałów wyjściowych jest realizowany w tzw. sieci kombinacyjnej, gdzie części każdego z tych członów są sumowane lub
odejmowane z ustalonym współczynnikiem wagi. Analiza odpowiednich amplitud i polaryzacji czterdziestu sum komponentów określa wymagane uwydatnienie kierunkowe i wtórny rozdział sygnałów niedominujących, a wszystko to z zachowaniem stałej mocy akustycznej.