RZECZPOSPOLITA POLSKA Urząd Patentowy Rzeczypospolitej Polskiej (12) OPIS PATENTOWY (19) PL (11) 185318 (21) Numer zgłoszenia: 331238 (13)B 1 (22) Data zgłoszenia: 21.07.1997 (5 1) IntCl7 (86) Data i numer zgłoszenia międzynarodowego: H04M 9/08 21.07.1997, PCT/US97/12717 H04B 3/23 (87) Data i numer publikacji zgłoszenia międzynarodowego: 29.01.1998, W098/04079, PCT Gazette nr 04/98 Sposób tłumienia sygnału echa w układzie akustycznym zawierającym mikrofon i głośnik (30) Pierwszeństwo: 24.07.1996,US,08/685495 (73) Uprawniony z patentu: ERICSSON INC., Research Triangle Park, US (43) Zgłoszenie ogłoszono: 05.07.1999 BUP 14/99 (72) Twórcy wynalazku: Eric D. Romesburg, Chapell Hill, US (45) O udzieleniu patentu ogłoszono: 30.04.2003 WUP 04/03 (74) Pełnomocnik: Bury Lech, PATPOL Spółka z o.o. PL 185318 B1 (57) 1. Sposób tłumienia sygnału echa w układzie akustycznym zawierającym mikrofon i głośnik, w którym mikrofon wychwytuje sygnał mowy od użytkownika na bliskim końcu łącza, a głośnik odbiera sygnał mowy z dalekiego końca łącza i generuje związany z nim sygnał echa, który też jest wychwytywany przez mikrofon, znamienny tym, że w kolejnych etapach wykrywa się sygnał echa i sygnał mowy na bliskim końcu łącza, estymuje się zbiór transmitancji akustycznych w zbiorze filtrów adaptacyjnych (14, 40, 50, 60, 72), z których każdy charakteryzuje się zbiorem współczynników, przy czym w przynajmniej jednym z adaptacyjnych filtrów wykorzystuje się sygnał mowy z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawiania jego współczynników, filtruje się sygnały wyjściowe z przynajmniej jednego z mikrofonów (22, 36, 68), przy użyciu współczynników z przynajmniej jednego filtra adaptacyjnego oraz sumuje się filtrowane i/lub nie filtrowane wyjściowe sygnały mikrofonowe do zasadniczego wytłumienia sygnału echa (L'), przy jednoczesnym zasadniczym zachowaniu sygnału mowy (L). FIG. 3
Sposób tłumienia sygnału echa w układzie akustycznym zawierającym mikrofon i głośnik Zastrzeżenia patentowe 1. Sposób tłumienia sygnału echa w układzie akustycznym zawierającym mikrofon i głośnik, w którym mikrofon wychwytuje sygnał mowy od użytkownika na bliskim końcu łącza, a głośnik odbiera sygnał mowy z dalekiego końca łącza i generuje związany z nim sygnał echa, który też jest wychwytywany przez mikrofon, znamienny tym, że w kolejnych etapach wykrywa się sygnał echa i sygnał mowy na bliskim końcu łącza, estymuje się zbiór transmitancji akustycznych w zbiorze filtrów adaptacyjnych (14, 40, 50, 60, 72), z których każdy charakteryzuje się zbiorem współczynników, przy czym w przynajmniej jednym z adaptacyjnych filtrów wykorzystuje się sygnał mowy z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawiania jego współczynników, filtruje się sygnały wyjściowe z przynajmniej jednego z mikrofonów (22, 36, 68), przy użyciu współczynników z przynajmniej jednego filtra adaptacyjnego oraz sumuje się filtrowane i/lub nie filtrowane wyjściowe sygnały mikrofonowe do zasadniczego wytłumienia sygnału echa (L'), przy jednoczesnym zasadniczym zachowaniu sygnału mowy (L). 2. Sposób według zastrz. 1, znamienny tym, że w etapie filtrowania filtruje się przynajmniej jeden mikrofonowy sygnał wyjściowy w filtrze stałym (32, 42, 48, 74), którego współczynniki kopiuje się z przynajmniej jednego filtra adaptacyjnego. 3. Sposób według zastrz. 1, znamienny tym, że w etapie filtrowania filtruje się przynajmniej jeden mikrofonowy sygnał wyjściowy w filtrze adaptacyjnym (50, 52), którego współczynniki ustawia się przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego. 4. Sposób według zastrz. 1, znamienny tym, że w etapie filtrowania filtruje się przynajmniej jeden mikrofonowy sygnał wyjściowy w filtrze adaptacyjnym (60), w którym wykorzystuje się sygnał wyjściowy innego filtra adaptacyjnego (14) w charakterze sygnału referencyjnego. 5. Sposób według zastrz. 1, znamienny tym, że estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (14), przy wykorzystaniu sygnału (L) z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (40) przy wykorzystaniu sygnału (L) z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy pierwszego mikrofonu (22) w pierwszym stałym filtrze (42) przy wykorzystaniu współczynników drugiego filtra adaptacyjnego (40), filtruje się sygnał wyjściowy drugiego mikrofonu (36) w drugim filtrze stałym (32) przy wykorzystaniu współczynników pierwszego filtra adaptacyjnego (14) oraz odejmuje się sygnał wyjściowy z drugiego filtra stałego (32) od sygnału wyjściowego pierwszego filtra stałego (42). 6. Sposób według zastrz. 5, znamienny tym, że umiejscawia się pierwszy i drugi mikrofon (22, 36) w zależności od położenia użytkownika bliższego końca łącza (4) i głośnika (20) tak, żeby pierwszy mikrofon (22) odbierał zasadniczo wyższy poziom sygnału mowy (T) od użytkownika bliskiego końca łącza niż drugi mikrofon (36) i aby drugi mikrofon odbierał zasadniczo wyższy poziom sygnału echa (L') niż pierwszy mikrofon (22). 7. Sposób według zastrz. 5, znamienny tym, że umiejscawia się pierwszy i drugi m i- krofon (22, 36) w zasadniczo równych odległościach od głośnika (20) i tłumi się szum otoczenia (8), odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. 8. Sposób według zastrz. 1, znamienny tym, że estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (14) przy wykorzystaniu sygnału mowy (L) z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2
185 318 3 drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (40) przy wykorzystaniu sygnału mowy (L) z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy z drugiego m i- krofonu (36) w filtrze stałym (48), w którym estymuje się H 1/H 2 przy wykorzystaniu współczynników pierwszego i drugiego filtra adaptacyjnego (14, 40) oraz odejmuje się sygnał wyjściowy filtra stałego (48) od sygnału wyjściowego pierwszego mikrofonu (22). 9. Sposób według zastrz. 8, znamienny tym, że pierwszy i drugi mikrofon (22, 36) umiejscawia się w zależności od położenia użytkownika (4) na bliskim końcu łącza i głośnika (20) tak, że pierwszy mikrofon (22) odbiera zasadniczo wyższy poziom sygnału mowy (T) od użytkownika na bliskim końcu łącza niż drugi mikrofon (36), drugi natomiast mikrofon odbiera zasadniczo wyższy poziom sygnału echa (L') niż pierwszy mikrofon. 10. Sposób według zastrz. 8, znamienny tym, że pierwszy i drugi mikrofon (22, 36) umiejscawia się w jednakowej odległości od głośnika (20) i likwiduje się także szum otoczenia (8), odbierany w zasadzie identycznie przez pierwszy i drugi mikrofon. 11. Sposób według zastrz. 1, znamienny tym, że estymuje się odwrotność transmitancji akustycznej 1/H 1 pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (50) przy wykorzystaniu sygnału mowy (L) z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się odwrotność transmitancji akustycznej 1/H2 drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (52) przy wykorzystaniu sygnału mowy (L) z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy z pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (50), filtruje się sygnał wyjściowy z drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (52) oraz odejmuje się sygnał wyjściowy drugiego filtra adaptacyjnego (52) od sygnału wyjściowego pierwszego filtra adaptacyjnego (50). 12. Sposób według zastrz. 11, znamienny tym, że umiejscawia się pierwszy i drugi m i- krofon (22, 36) w zależności od położenia użytkownika (4) na bliższym końcu łącza i głośnika (20) tak, że pierwszy mikrofon (22) odbiera zasadniczo wyższy poziom sygnału mowy (T) od użytkownika na bliższym końcu łącza niż drugi mikrofon (36), drugi mikrofon natomiast odbiera zasadniczo wyższy poziom sygnału echa (L') niż pierwszy mikrofon. 13. Sposób według zastrz. 11, znamienny tym, że umiejscawia się pierwszy i drugi m i- krofon (22, 36) w jednakowej odległości od głośnika (20) i tłumi się szum otoczenia (8), odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. 14. Sposób według zastrz. 1, znamienny tym, że w kolejnych etapach estymuje się transmitancję akustyczną Hi pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (14) przy wykorzystaniu sygnału mowy (L) w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się odwrotność transmitancji akustycznej 1/H2 drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (52) przy wykorzystaniu sygnału mowy (L) w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (52), filtruje się sygnał wyjściowy drugiego filtra adaptacyjnego (52) w filtrze stałym (32) przy wykorzystaniu współczynników pierwszego filtra adaptacyjnego (14) oraz odejmuje się sygnał wyjściowy filtra stałego (32) od sygnału wyjściowego pierwszego mikrofonu (22). 15. Sposób według zastrz. 14, znamienny tym, że umiejscawia się pierwszy i drugi m i- krofon (22, 36) w zależności od położenia użytkownika (4) na bliższym końcu łącza i głośnika (20) tak, że pierwszy mikrofon (22) odbiera zasadniczo wyższy poziom sygnału mowy (T) od użytkownika na bliższym końcu łącza niż drugi mikrofon (36), drugi mikrofon natomiast odbiera zasadniczo wyższy poziom sygnału echa (L') niż pierwszy mikrofon. 16. Sposób według zastrz. 14, znamienny tym, że umiejscawia się pierwszy i drugi mikrofon (22, 36) w jednakowej odległości od głośnika (20) i tłumi szum otoczenia (8), odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. 17. Sposób według zastrz. 1, znamienny tym, że w kolejnych etapach estymuje się transmitancję akustyczną H1pierwszego mikrofonu (22) wpierwszym filtrze adaptacyjnym (14) przy wyko-
4 185 318 rzystaniu sygnału mowy (L) z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną Hi pierwszego mikrofonu (22) podzieloną przez transmitancję akustyczną H2 drugiego mikrofonu w drugim filtrze adaptacyjnym (60) przy wykorzystaniu sygnału wyjściowego z pierwszego filtra adaptacyjnego (14) w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (60) oraz odejmuje się sygnał wyjściowy drugiego filtra adaptacyjnego (60) od sygnału wyjściowego pierwszego mikrofonu (22). 18. Sposób według zastrz. 17, znamienny tym, że umiejscawia się pierwszy i drugi m i- krofon (22, 36) w zależności od położenia użytkownika (4) na bliższym końcu łącza i głośnika (20) tak, że pierwszy mikrofon (22) odbiera zasadniczo wyższy poziom sygnału mowy (T) od użytkownika na bliższym końcu łącza niż drugi mikrofon (36), drugi mikrofon natomiast odbiera zasadniczo wyższy poziom sygnału echa (L') niż pierwszy mikrofon. 19. Sposób według zastrz. 17, znamienny tym, że umiejscawia się pierwszy i drugi mikrofon (22, 36) w jednakowej odległości od głośnika (20) i tłumi szum otoczenia (8), odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. 20. Sposób według zastrz. 1, znamienny tym, że w kolejnych etapach estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (14) przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (40) przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, estymuje się transmitancję akustyczną H5 trzeciego mikrofonu (68) w trzecim filtrze adaptacyjnym (72) przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy pierwszego mikrofonu (22) w pierwszej parze filtrów stałych (42, 74), wykorzystujących współczynniki, odpowiednio, drugiego i trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu (36) w drugiej parze filtrów stałych (32, 74), wykorzystujących współczynniki, odpowiednio, pierwszego i trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy trzeciego mikrofonu (68) w trzeciej parze filtrów stałych (32, 42), wykorzystujących współczynniki, odpowiednio, pierwszego i drugiego filtra adaptacyjnego, mnoży się sygnał wyjściowy pierwszej pary filtrów stałych (42, 74) przez stałą c w pierwszym układzie mnożącym (78), przy czym 0 c 1, mnoży się sygnał wyjściowy drugiej pary filtrów stałych (32, 74) przez stałą 1 - c w drugim układzie mnożącym (80) oraz odejmuje się sygnał wyjściowy trzeciej pary filtrów stałych (32, 42) od sygnałów wyjściowych pierwszego i drugiego układu mnożącego (78, 80). 21. Sposób według zastrz. 20, znamienny tym, że dobiera się wartość stałej c dla minimalizowania szumu wykrywanego przez mikrofony. 22. Sposób według zastrz. 20, znamienny tym, że wartość stałej c reguluje się tak, żeby zróżnicować czułość mikrofonów na sygnał mowy z bliższego końca łącza. 23. Sposób według zastrz. 1, znamienny tym, że w kolejnych etapach estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu (22) w pierwszym filtrze adaptacyjnym (14) przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu (36) w drugim filtrze adaptacyjnym (40) przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, estymuje się transmitancję akustyczną H5 trzeciego mikrofonu (68) w trzecim filtrze adaptacyjnym (72) przy wykorzystaniu sygnału mowy (L) z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy pierwszego mikrofonu (22) w pierwszym filtrze stałym (42), wykorzystującym współczynniki drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu (36) w drugim filtrze stałym (32), wykorzystującym współczynniki pierwszego filtra adaptacyjne-
185 318 5 go, mnoży się sygnał wyjściowy pierwszego filtra stałego (42) przez stałą c w pierwszym układzie mnożącym (78), przy czym 0 c 1, mnoży się sygnał wyjściowy drugiego filtra stałego (32) przez stałą 1 - c w drugim układzie mnożącym (80), dodaje się wymnożone sygnały wyjściowe pierwszego i drugiego filtra stałego w sumatorze (80), filtruje się sygnał wyjściowy sumatora (82) w trzecim filtrze stałym (74) przy wykorzystaniu współczynników trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy trzeciego mikrofonu (68) w parze filtrów stałych (32, 42), wykorzystujących współczynniki, odpowiednio, pierwszego i drugiego filtra adaptacyjnego oraz odejmuje się sygnał wyjściowy pary filtrów stałych (32, 42) od sygnału wyjściowego trzeciego filtra stałego (74). 24. Sposób według zastrz. 23, znamienny tym, że wartość stałej c dobiera się tak, żeby minimalizować szum wykrywany przez mikrofony. 25. Sposób według zastrz. 23, znamienny tym, że wartość stałej c dobiera się tak, żeby zróżnicować czułość mikrofonów na sygnał mowy z bliższego końca łącza. 26. Sposób według zastrz. 1, znamienny tym, że do estymacji transmitancji akustycznej w filtrach adaptacyjnych stosuje się algorytm spadku gradientu i/lub estymacji najmniejszych kwadratów LSE. 28. Sposób według zastrz. 1, znamienny tym, że zniekształca się sygnał mowy (L) z dalszego końca łącza w głośniku (20) i/lub wzmacniaczu (18), i/lub przetworniku cyfrowo - -analogowym DAC (16) podłączonym do głośnika. * * * Przedmiotem wynalazku jest sposób tłumienia sygnału echa w układzie akustycznym zawierającym mikrofon i głośnik. Wynalazek dotyczy tłumienia echa w układach nieliniowych, stosowanych w systemach telekomunikacyjnych, a zwłaszcza w ruchomych, głośnomówiących telefonach. W systemach telekomunikacyjnych, służących do dwustronnej transmisji mowy między dwoma użytkownikami za pośrednictwem linii naziemnych i telefonicznych łączy bezprzewodowych, akustyczny sygnał od lokalnego użytkownika jest zwykle wychwytywany przez mikrofon umieszczony na jednej końcówce łącza telekomunikacyjnego i przekazywany za pośrednictwem połączenia telekomunikacyjnego na drugi koniec łącza, gdzie jest odtwarzany przez głośnik dla znajdującego się w jego pobliżu drugiego użytkownika. I odwrotnie - sygnał akustyczny od oddalonego użytkownika jest odbierany przez mikrofon znajdujący się na drugim końcu łącza, przekazywany poprzez łącza telekomunikacyjne do odbiornika mieszczącego się na tym końcu łącza, gdzie jest odtwarzany przez głośnik dla znajdującego się tu użytkownika. N a każdym końcu łącza telekomunikacyjnego pierwotny sygnał akustyczny transmitowany z drugiego końca łącza i odtwarzany przez głośnik może ulegać zakłóceniom pod wpływem dźwięków pochodzących z otoczenia i z głośnika i może być wychwytywany przez mikrofon. Sygnał z głośnika może więc być przekazywany z powrotem do nadawcy, gdzie przybędzie z opóźnieniem w stosunku do pierwotnego sygnału (wielkość opóźnienia jest funkcją czasu niezbędną dla sygnału do dokonania podróży w obie strony). Ten opóźniony sygnał może tworzyć dokuczliwe echo, które może być słyszalne na drugim końcu łącza. Jak wiadomo znawcom przedmiotu, słyszalność sygnału echa powrotnego, otrzymywanego na przykład od dalszego końca łącza telekomunikacyjnego jest funkcją dwóch czynników: po pierwsze amplitudy (natężenia albo głośności) sygnału echa przekazywanego przez odległą końcówkę łącza do końcówki bliższej, a po drugie od wielkości opóźnienia sygnału echa otrzymywanego w odległej końcówce łącza w stosunku do pierwotnego sygnału przekazywanego z odległej do bliskiej końcówki łącza. Generalnie rzecz biorąc wzrost amplitudy i opóźnienia odbieranego sygnału echa powoduje wzrost jego słyszalności. Amplituda sygnału echa otrzymywanego w odległej końcówce łącza zależy z kolei od czułości mikrofonu, znajdującego się w bliższej końcówce łącza, na sygnał lokalnego głośnika, który tworzy sygnał echa. Z drugiej strony opóźnienie sygnału echa zależy od środków łączności (na przykład telefon bezprzewodowy w rozmowie z telefonem bezprzewodowym, telefon analogowy w roz-
6 185 318 mowie z telefonem cyfrowym). Te dwa aspekty (amplituda i opóźnienie) sygnału echa opisane zostaną w dalszej części. W konwencjonalnych aparatach telefonicznych, na przykład w telefonach przewodowych, mikrofon jest tak zaprojektowany, żeby się znajdował w pobliżu ust mówiącego, głośnik zaś jest zwykle zasłonięty uchem użytkownika. W takich warunkach nie ma potrzeby dążyć do znacznego zwiększenia czułości mikrofonu, żeby sprawniej przechwytywał sygnał mowy i dlatego mikrofony nie są zbyt czułe na sygnał pochodzący z lokalnego głośnika. Z drugiej strony stałe zmniejszanie rozmiarów przenośnych telefonów i coraz częstsze stosowanie telefonów głośno mówiących sprawia, że mikrofon znajduje się coraz dalej od ust rozmawiającego i dlatego powinien mieć stosunkowo wysoką czułość, żeby zachować żądany poziom odbieranego sygnału mowy, pochodzącego ze stosunkowo większej odległości. To jednak oznacza, że mikrofon jest też bardziej czuły na sygnały pochodzące z lokalnego głośnika. W przypadku zestawów głośnomówiących, używanych w telefonach samochodowych, sprawa jest jeszcze bardziej skomplikowana, ponieważ mikrofony w nich mogą być jeszcze bardziej oddalone od ust rozmawiającego. Dlatego ich czułość powinna być jeszcze wyższa, co sprawia, że m ogą one być nadzwyczaj czułe na sygnały z lokalnego głośnika. Podsumowując musimy stwierdzić, że sygnał echa w nowoczesnych aparatach telefonicznych może być dobrze słyszalny. Łatwo dostrzegalne może być także opóźnienie związane z sygnałem echa. Dla danej głośności echa jego percepcja wzrasta proporcjonalnie do wzrostu opóźnienia echa aż do 50 ms. Ogólnie rzecz biorąc opóźnienie większe niż 50 ms jest nieznośne. Sygnał echa powstający w telefonach analogowych, pracujących w sieciach przewodowych, albo miał stosunkowo niewielkie opóźnienie (np. poniżej 50 ms) i dlatego jego percepcja nie była dokuczliwa, albo tam gdzie mógł być słyszalny podlegał jedynie zakłóceniom liniowym, które można było stosunkowo efektywnie wygłuszać w ramach sieci. Nowsze telefony cyfrowe, włączając w to cyfrowe telefony bezprzewodowe i komórkowe, przetwarzają sygnały akustyczne w tak zwanych wokoderach, które nie tylko dają znaczące opóźnienie (rzędu 200 ms.), ale wprowadzają także zakłócenia nieliniowe, które uniemożliwiają efektywne eliminowanie sygnałów echa w sieci. Dlatego w nowoczesnych telefonach sygnał echa musi być eliminowany u źródła, czyli przed transmisją. W celu uniknięcia transmisji niepożądanych sygnałów echa, to jest tych, które trafiają do mikrofonu z sygnału generowanego przez głośnik i mogą być przezeń odbierane i przekazane powrotnie do nadawcy, czyli żeby użytkownik na oddalonym końcu łącza nie słyszał opóźnionej wersji swoich własnych słów, niezbędnym jest odizolowanie sygnału z głośnika. Upraszczając osiągnięto to przez proces tłumienia echa lub jego redukcję, czyli proces usuwania sygnału echa z wejściowego sygnału mikrofonu, kierując w ten sposób do transmisji jedynie sygnał użytkownika (dla celów tego opisu terminy tłumienie echa i redukcja echa są używane zamiennie dla opisania funkcji eliminowania lub redukowania sygnałów echa). Podczas gdy potrzeba tłumienia echa występuje do pewnego stopnia we wszystkich systemach telefonicznych, włączając w to aparaty telefoniczne podłączone do naziemnych linii przesyłowych, potrzeba ta jest szczególnie ostra w aparatach głośnomówiących, a staje się imperatywem w montowanych w samochodach systemach telefonicznych przewidzianych do użytkowania bez użycia rąk. Środowisko zamkniętej przestrzeni kabiny samochodu jest szczególnie podatne na pojawianie się wielokrotnego odbicia sygnału z głośników i docieranie ich do wysokoczułych mikrofonów, jakie są stosowane w zestawach głośnomówiących. Zadanie eliminowania echa w tym otoczeniu jest dodatkowo komplikowane przez ruch pojazdu i względne zmiany kierunku i mocy głosu użytkownika i sygnału echa, w zależności od tego, czy okna są otwarte, czy zamknięte i ponieważ rozmawiający porusza głową podczas prowadzenia samochodu. W dodatku nowoczesne, cyfrowe radiotelefony są wyposażone w nieliniowe elementy (np. wokodery), które wprowadzają zakłócenia nieliniowe do sygnału echa, jeszcze bardziej utrudniając usunięcie tego ostatniego za pom ocą prostych technik eliminacji echa. Znane rozwiązania dotyczące eliminacji echa, szczególnie w radiotelefonach ruchomych, zostały ujawnione na przykład w amerykańskich patentach o numerach US 4 468 641,
185 318 7 4 584 441, 4 712 235, 5 062 102, 5 084 865, 5 305 309, 5 307 309, 5 307 405, 5 131 032, 5 193 112, 5 237 562, 5 263 019, 5 263 020, 5 274 705, 5 280 525, 5 315 585, 5 319 585 oraz 5 475 731. Zdając sobie sprawę z ograniczeń, którym podlegają znane układy tłumienia echa, usiłowano je usunąć przez stosowanie elementów nie zniekształcających, takich jak głośniki dynamiczne, albo przez dodawanie nowych urządzeń, które miały usuwać albo blokować resztkowy sygnał echa na linii. Były to układy wycinające, tłumiki adaptacyjne, spektralne układy odejmujące, detektory głosu, detektory rozmowy dwustronnej, detektory rozbieżności i analizatory szumu. Podzespoły nie zniekształcające są jednak kosztowne, niezupełnie eliminują zniekształcenia i w sumie niezadowalająco poprawiają efektywność działania systemu jako całości. Co więcej, niektóre z tych dodatkowych urządzeń wprowadzają swoje własne zakłócenia, a inne negatywnie wpływają na działanie układu. N a przykład detektory głosu są czasami wprowadzane w błąd przez szumy pochodzące z otoczenia, czego skutkiem bywa nieodwracalne usunięcie sygnału mowy zamiast sygnału echa. Podobne niedogodności pojawiają się także w związku z używaniem innych typów detektorów. Problem tłumienia echa w telefonicznych systemach głośnomówiących związany jest z problemem eliminowania szumu akustycznego, czyli usuwaniem szumu tła z poddawanego transmisji sygnału mowy. Jedną z metod mających na celu usunięcie szumu w środowisku pojazdu jest ta prezentowana w EP-A-729-288, gdzie osobne dwa mikrofony są używane do wyłapywania głosu jeden - kierowcy, drugi - pasażera. Kiedy jeden z nich odbiera sygnał m o- wy, drugi służy do odbioru sygnału szumu z otoczenia. W ten sposób jeżeli mikrofon kierowcy odbiera mowę, mikrofon pasażera wychwytuje szum używany przez pierwszy adaptacyjny filtr do estymacji szumowej składowej sygnału mowy, odbieranej przez mikrofon kierowcy. Dzięki temu szumowa składowa może być wycięta z sygnału akustycznego w pierwszym sumatorze. Podobnie, kiedy mikrofon pasażera odbiera sygnał mowy, mikrofon kierowcy odbiera szum, który jest używany przez drugi filtr adaptacyjny do estymacji szumowej składowej w sygnale akustycznym odbieranym przez mikrofon pasażera. Dzięki temu szumowa składowa może być wyeliminowana w drugim sumatorze. To podejście ma jednak na celu eliminowanie szumu, a nie eliminowanie szumu i echa. Najnowsze rozwiązanie w dziedzinie eliminowania zarówno szumu jak i echa zostało zaprezentowane w pracy Kuo i jego współpracowników zatytułowanej Acoustic Noise and Echo Cancellation Microphone System for Desktop Conferencing, (Eliminujące szum akustyczny i echo systemy mikrofonowe dla skomputeryzowanych sal konferencyjnych) protokoły z 6. międzynarodowej konferencji poświęconej przetwarzaniu sygnału i technologii (ICSPAT), która odbyła się 24-26 października 1995 r. - str. 41-45. Projekt wymaga jednak użycia rozbudowanych detektorów głosu w celu zdefiniowania różnicy między mową, a hałasem występującym podczas pracy na biegu jałowym, pracy w trybie nadawania, odbioru i podczas połączenia dwustronnego. W hałaśliwym środowisku takie detektory m ogą być łatwo wprowadzone w błąd przez szum, szczególnie podczas prowadzenia rozmowy między dwoma samochodami. W dodatku projekt ten wymaga, żeby filtry były włączane i wyłączane podczas pracy w różnych trybach, czego efektem są dokuczliwe odgłosy przełączania, słyszalne także przez rozmówcę na odległym krańcu łącza. Sposób tłumienia sygnału echa w układzie akustycznym zawierającym mikrofon i głośnik, w którym mikrofon wychwytuje sygnał mowy od użytkownika na bliskim końcu łącza, a głośnik odbiera sygnał mowy z dalekiego końca łącza i generuje związany z nim sygnał echa, który też jest wychwytywany przez mikrofon, według wynalazku wyróżnia się tym, że w kolejnych etapach wykrywa się sygnał echa i sygnał mowy na bliskim końcu łącza, estymuje się zbiór transmitancji akustycznych w zbiorze filtrów adaptacyjnych, z których każdy charakteryzuje się zbiorem współczynników, przy czym w przynajmniej jednym z adaptacyjnych filtrów wykorzystuje się sygnał mowy z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawiania jego współczynników, filtruje się sygnały wyjściowe z przynajmniej jednego z mikrofonów, przy użyciu współczynników z przynajmniej jednego filtra adaptacyjnego oraz sumuje się filtrowane i/lub nie filtrowane wyjściowe sygnały mikrofono-
8 185 318 we do zasadniczego wytłumienia sygnału echa, przy jednoczesnym zasadniczym zachowaniu sygnału mowy. W etapie filtrowania korzystnie filtruje się przynajmniej jeden mikrofonowy sygnał wyjściowy w filtrze stałym, którego współczynniki kopiuje się z przynajmniej jednego filtra adaptacyjnego. W innym, korzystnym rozwiązaniu w etapie filtrowania filtruje się przynajmniej jeden mikrofonowy sygnał wyjściowy w filtrze adaptacyjnym, którego współczynniki ustawia się przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego. W jeszcze innym, korzystnym rozwiązaniu w etapie filtrowania filtruje się przynajmniej jeden mikrofonowy sygnał wyjściowy w filtrze adaptacyjnym, w którym wykorzystuje się sygnał wyjściowy innego filtra adaptacyjnego w charakterze sygnału referencyjnego. Transmitancję akustyczną H 1 pierwszego mikrofonu korzystnie estymuje się w pierwszym filtrze adaptacyjnym, przy wykorzystaniu sygnału z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy pierwszego mikrofonu w pierwszym stałym filtrze przy wykorzystaniu współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu w drugim filtrze stałym przy wykorzystaniu współczynników pierwszego filtra adaptacyjnego oraz odejmuje się sygnał wyjściowy z drugiego filtra stałego od sygnału wyjściowego pierwszego filtra stałego. Pierwszy i drugi mikrofon korzystnie umiejscawia się w zależności od położenia użytkownika bliższego końca łącza i głośnika tak, żeby pierwszy mikrofon odbierał zasadniczo wyższy poziom sygnału mowy od użytkownika bliskiego końca łącza niż drugi mikrofon i aby drugi mikrofon odbierał zasadniczo wyższy poziom sygnału echa niż pierwszy mikrofon. W korzystnym rozwiązaniu umiejscawia się pierwszy i drugi mikrofon w zasadniczo równych odległościach od głośnika i tłumi się szum otoczenia, odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. Transmitancję akustyczną H 1 pierwszego mikrofonu korzystnie estymuje się w pierwszym filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z dalekiego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy z drugiego mikrofonu w filtrze stałym, w którym estymuje się H 1/H2 przy wykorzystaniu współczynników pierwszego i drugiego filtra adaptacyjnego oraz odejmuje się sygnał wyjściowy filtra stałego od sygnału wyjściowego pierwszego mikrofonu. Pierwszy i drugi mikrofon korzystnie umiejscawia się w zależności od położenia użytkownika na bliskim końcu łącza i głośnika tak, że pierwszy mikrofon odbiera zasadniczo wyższy poziom sygnału mowy od użytkownika na bliskim końcu łącza niż drugi mikrofon, drugi natomiast mikrofon odbiera zasadniczo wyższy poziom sygnału echa niż pierwszy m i- krofon. W bardziej korzystnym rozwiązaniu pierwszy i drugi mikrofon umiejscawia się w jednakowej odległości od głośnika i likwiduje się także szum otoczenia, odbierany w zasadzie identycznie przez pierwszy i drugi mikrofon. Odwrotność transmitancji akustycznej 1/H1 pierwszego mikrofonu w pierwszym filtrze adaptacyjnym korzystnie estymuje się przy wykorzystaniu sygnału mowy z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się odwrotność transmitancji akustycznej 1/H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego. Sygnał wyjściowy z pierwszego mikrofonu korzystnie filtruje się w pierwszym filtrze adaptacyjnym, filtruje się sygnał wyjściowy z drugiego mikrofonu w drugim filtrze adaptacyj-
185318 9 nym oraz odejmuje się sygnał wyjściowy drugiego filtra adaptacyjnego od sygnału wyjściowego pierwszego filtra adaptacyjnego. Pierwszy i drugi mikrofon korzystnie umiejscawia się w zależności od położenia użytkownika na bliższym końcu łącza i głośnika tak, że pierwszy mikrofon odbiera zasadniczo wyższy poziom sygnału mowy od użytkownika na bliższym końcu łącza niż drugi mikrofon, drugi mikrofon natomiast odbiera zasadniczo wyższy poziom sygnału echa niż pierwszy m i- krofon. W korzystnym rozwiązaniu umiejscawia się pierwszy i drugi mikrofon w jednakowej odległości od głośnika i tłumi się szum otoczenia, odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. Transmitancję akustyczną H 1pierwszego mikrofonu w pierwszym filtrze adaptacyjnym korzystnie estymuje się przy wykorzystaniu sygnału mowy w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się odwrotność transmitancji akustycznej 1/H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu w drugim filtrze adaptacyjnym, filtruje się sygnał wyjściowy drugiego filtra adaptacyjnego w filtrze stałym przy wykorzystaniu współczynników pierwszego filtra adaptacyjnego oraz odejmuje się sygnał wyjściowy filtra stałego od sygnału wyjściowego pierwszego mikrofonu. Pierwszy i drugi mikrofon korzystnie umiejscawia się w zależności od położenia użytkownika na bliższym końcu łącza i głośnika tak, że pierwszy mikrofon odbiera zasadniczo wyższy poziom sygnału mowy od użytkownika na bliższym końcu łącza niż drugi mikrofon, drugi mikrofon natomiast odbiera zasadniczo wyższy poziom sygnału echa niż pierwszy mikrofon. W korzystnym rozwiązaniu umiejscawia się pierwszy i drugi mikrofon w jednakowej odległości od głośnika i tłumi szum otoczenia, odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. W kolejnych etapach korzystnie estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu w pierwszym filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z dalszego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu podzieloną przez transmitancję akustyczną H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału wyjściowego z pierwszego filtra adaptacyjnego w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu w drugim filtrze adaptacyjnym oraz odejmuje się sygnał wyjściowy drugiego filtra adaptacyjnego od sygnału wyjściowego pierwszego m i- krofonu. Pierwszy i drugi mikrofon korzystnie umiejscawia się w zależności od położenia użytkownika na bliższym końcu łącza i głośnika tak, że pierwszy mikrofon odbiera zasadniczo wyższy poziom sygnału mowy od użytkownika na bliższym końcu łącza niż drugi mikrofon, drugi mikrofon natomiast odbiera zasadniczo wyższy poziom sygnału echa niż pierwszy mikrofon. W korzystnym rozwiązaniu umiejscawia się pierwszy i drugi mikrofon w jednakowej odległości od głośnika i tłumi szum otoczenia, odbierany zasadniczo identycznie przez pierwszy i drugi mikrofon. W kolejnych etapach korzystnie estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu w pierwszym filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, estymuje się transmitancję akustyczną H5 trzeciego mikrofonu w trzecim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników trzeciego filtra adaptacyjnego, filtruje się sygnał wyj-
10 185 318 ściowy pierwszego mikrofonu w pierwszej parze filtrów stałych, wykorzystujących współczynniki, odpowiednio, drugiego i trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu w drugiej parze filtrów stałych, wykorzystujących współczynniki, odpowiednio, pierwszego i trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy trzeciego mikrofonu w trzeciej parze filtrów stałych, wykorzystujących współczynniki, odpowiednio, pierwszego i drugiego filtra adaptacyjnego, mnoży się sygnał wyjściowy pierwszej pary filtrów stałych przez stałą c w pierwszym układzie mnożącym, przy czym 0 c 1, mnoży się sygnał wyjściowy drugiej pary filtrów stałych przez stałą 1 - c w drugim układzie mnożącym oraz odejmuje się sygnał wyjściowy trzeciej pary filtrów stałych od sygnałów wyjściowych pierwszego i drugiego układu mnożącego. Wartość stałej c korzystnie dobiera się dla minimalizowania szumu wykrywanego przez mikrofony. W korzystnym rozwiązaniu wartość stałej c reguluje się tak, żeby zróżnicować czułość mikrofonów na sygnał mowy z bliższego końca łącza. W kolejnych etapach korzystnie estymuje się transmitancję akustyczną H 1 pierwszego mikrofonu w pierwszym filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników pierwszego filtra adaptacyjnego, estymuje się transmitancję akustyczną H2 drugiego mikrofonu w drugim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników drugiego filtra adaptacyjnego, estymuje się transmitancję akustyczną H5 trzeciego mikrofonu w trzecim filtrze adaptacyjnym przy wykorzystaniu sygnału mowy z odległego końca łącza w charakterze sygnału referencyjnego do ustawienia współczynników trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy pierwszego mikrofonu w pierwszym filtrze stałym, wykorzystującym współczynniki drugiego filtra adaptacyjnego, filtruje się sygnał wyjściowy drugiego mikrofonu w drugim filtrze stałym, wykorzystującym współczynniki pierwszego filtra adaptacyjnego, mnoży się sygnał wyjściowy pierwszego filtra stałego przez stałą c w pierwszym układzie mnożącym, przy czym 0 c 1, mnoży się sygnał wyjściowy drugiego filtra stałego przez stałą 1 - c w drugim układzie mnożącym, dodaje się wymnożone sygnały wyjściowe pierwszego i drugiego filtra stałego w sumatorze, filtruje się sygnał wyjściowy sumatora w trzecim filtrze stałym przy wykorzystaniu współczynników trzeciego filtra adaptacyjnego, filtruje się sygnał wyjściowy trzeciego mikrofonu w parze filtrów stałych, wykorzystujących współczynniki, odpowiednio, pierwszego i drugiego filtra adaptacyjnego oraz odejmuje się sygnał wyjściowy pary filtrów stałych od sygnału wyjściowego trzeciego filtra stałego. Wartość stałej c korzystnie dobiera się tak, żeby minimalizować szum wykrywany przez mikrofony. W korzystnym rozwiązaniu wartość stałej c dobiera się tak, żeby zróżnicować czułość mikrofonów na sygnał mowy z bliższego końca łącza. Do estymacji transmitancji akustycznej w filtrach adaptacyjnych korzystnie stosuje się algorytm spadku gradientu i/lub estymacji najmniejszych kwadratów LSE. W korzystnym rozwiązaniu sygnał mowy z dalszego końca łącza zniekształca się w głośniku i/lub wzmacniaczu i/lub przetworniku cyfrowo-analogowym DAC podłączonym do głośnika. Rozwiązanie według wynalazku umożliwia efektywne usuwanie sygnału echa w obecności zakłóceń nieliniowych i nie wymaga stosowania kosztownych urządzeń ani dodatkowych detektorów. Możliwa jest także eliminacja echa nawet w hałaśliwym i zmiennym otoczeniu oraz eliminacja szumu tła. Obecne rozwiązanie zapewnia pożądany poziom tłumienia echa bez nadmiernych kosztów, które by wynikały ze stosowania wysokiej jakości podzespołów takich jak głośniki liniowe, które musiałyby być zastosowane w znanym układzie i bez potrzeby stosowania układów detekcyjnych, takich jak detektory głosu, które musiałyby się znaleźć w układzie prezentowanym w pracy Kuo i wywoływanych przez nie kłopotów. Generalnie rzecz ujmując tłumienie echa w prezentowanym rozwiązaniu jest osiągane przez użycie zakłóconego sygnału w znanym układzie zawierającym jeden mikrofon, ale nie w charakterze sygnału wyjściowego
185 318 11 z układu tłumienia echa, a w charakterze sygnału błędu dla adaptacyjnego filtra, który estymuje pożądaną transmitancję akustyczną; i użycie przynajmniej jednego innego mikrofonu i przynajmniej jednego innego filtra adaptacyjnego, który daje estymację innej pożądanej transmitancji akustycznej, tak jak to się dzieje w układzie dwumikrofonowym, podczas gdy unika się stosowania detektorów głosu przez użycie nadchodzącego sygnału jako sygnału referencyjnego dla ustawienia współczynników przynajmniej jednego z filtrów adaptacyjnych i filtrowanie wychodzącego zakłóconego sygnału echa z jednego lub więcej mikrofonów (które same naprawdę nie wprowadzają żadnych zakłóceń) przy użyciu współczynników jednego lub więcej filtrów adaptacyjnych, oraz liniowe kombinowanie filtrowanych i/lub nie filtrowanych sygnałów wyjściowych mikrofonów do eliminowania nieliniowo zakłóconego sygnału echa. W ten sposób zakłócony sygnał echa akustycznego, wykrywany przez jeden mikrofon, może być znacznie wytłumiony przez zakłócony sygnał echa akustycznego odbierany przez drugi mikrofon, zamiast być tylko częściowo wyeliminowany przez elektryczną estymację echa opartą o niezakłócony sygnał echa, tak jak to się na przykład dzieje w znanym układzie. Przy różnorodnych konstrukcjach układów zgodnych z założeniami obecnego wynalazku pożądany efekt filtrujący sygnału wyjściowego z dowolnego mikrofonu może być osiągnięty w filtrze nie adaptacyjnym, którego współczynniki są kopiowane z jednego lub więcej filtrów adaptacyjnych, w filtrze adaptacyjnym, którego współczynniki są regulowane w relacji z odbieranym sygnałem, albo w adaptacyjnym filtrze, który korzysta z sygnału wyjściowego z innego filtra adaptacyjnego jako z sygnału referencyjnego. Dodatkową zaletą jest, że w takich zestawieniach szum z otoczenia może być także automatycznie wykasowany przy okazji usuwania sygnału echa przez właściwe umieszczenie, albo skierowanie mikrofonu. W przeciwieństwie do poprzednich rozwiązań nowe i liniowe podejście do usuwania echa i szumu nie jest wrażliwe na to, który rozmówca, z odległego, czy bliskiego końca łącza jest aktywny w danym czasie. Co więcej układ ten nie może być rozregulowany przez szum z otoczenia i sam nie zawiera żadnych elementów, które mogłyby wprowadzić zakłócenia nieliniowe. Przedmiot wynalazku, w przykładzie wykonania, został bliżej objaśniony na załączonym rysunku, na którym fig. 1 przedstawia schemat blokowy zwykłego układu tłumienia echa, skonstruowanego w oparciu o dotychczasową wiedzę, fig. 2 - schemat blokowy przykładowego układu tłumienia echa i szumu, fig. 3 - schemat blokowy przykładowego rozwiązania dwumikrofonowego układu tłumienia echa, zbudowanego zgodnie z prezentowanym wynalazkiem, fig. 4-7 prezentują różne, alternatywne rozwiązania dwumikrofonowych układów tłumienia echa z fig. 3, fig. 8-9 - dwa schematy blokowe przykładowej konfiguracji dwóch mikrofonów w dowolnym z układów z fig. 3-7 (ta konfiguracja stosowana jest do tłumienia zarówno echa jak i szumu w urządzeniu głośnomówiącym stosowanych w telefonii komórkowej montowanym w konwencjonalnym pojeździe), natomiast fig. 10 i 11 przedstawiają alternatywne rozwiązania układu tłumienia echa z trzema mikrofonami, skonstruowane zgodnie ze sposobem według wynalazku. Powszechnie stosowane podejście do problemu eliminowania echa w cyfrowym radiotelefonie prezentuje układ z fig. 1. Ten układ, służący do eliminowania echa, jest podłączany do systemu telefonicznego, takiego jak cyfrowy telefon komórkowy (nie pokazany). Sygnał L, wchodzący do układu z systemu telefonicznego jest odbierany na linii 10 układu. Sygnał L jest modulowaną impulsowo (pulse code modulated = PCM) łub inną cyfrową reprezentacją sygnału mowy pochodzącego od rozmawiającego na oddalonym końcu łącza (nie pokazanym). Ten cyfrowy sygnał jest poddawany grupowej kombinacji w przetworniku cyfrowo- -analogowym (digital-to-analog converter - DAC) 16, wzmacniaczu 18 i głośniku 20, gdzie jest przetwarzany z sygnału cyfrowego na analogowy, wzmacniany i przetwarzany z sygnału elektrycznego na sygnał akustyczny (audio). Każde z urządzeń widocznych na fig. 1: DAC - 16, wzmacniacz - 18 i głośnik - 20 może, przynajmniej do pewnego stopnia, wprowadzać do odbieranego sygnału L pewne zakłócenia nieliniowe. W efekcie w wyjściowym sygnale głośnika - 20 otrzymujemy nie w pełni wierne odtworzenie sygnału L, ale jego zniekształconą wersję L'. Akustyczny sygnał L' będzie się rozchodził w przestrzeni otaczającej urządzenie, odbijając od jednej lub więcej po-
12 185 318 wierzchni, zmieniał kierunek, amplitudę, częstotliwość i/lub fazę zanim zostanie odebrany przez mikrofon - 22, który został w tym miejscu umieszczony po to, by rejestrować wychodzący sygnał T, pochodzący od rozmówcy 4 znajdującego się na bliższym końcu łącza. Jak dobrze wiadomo znawcom powstające na skutek wielokrotnego przejścia fali głosowej i zależne od częstotliwości i amplitudy zmiany i opóźnienia, którym podlega sygnał L' podczas pokonywania drogi od głośnika 20 do mikrofonu 22 mogą być opisane przy pomocy pojedynczej, liniowej transmitancji akustycznej, tu opisanej jako H 1. W podobny sposób opisana jest inna transmitancja akustyczna - tu oznaczona jako H2 i zdefiniowana jako wynikowe przejście sygnału głosowego T od rozmówcy 4 do mikrofonu 22. Mikrofon 22, pokazany na fig. 1, który jest wmontowany albo podłączony do wzmacniacza i przetwornika analogowo-cyfrowego (dla uproszczenia nie pokazano żadnego z tych urządzeń) przetwarza echo akustyczne i sygnał pochodzący od rozmówcy w elektryczne, cyfrowe sygnały. Na wyjściu mikrofonu 22 otrzymujemy złożony sygnał M 1 = L'*H1 + T*H3 (gdzie symbol oznacza mnożenie albo splot tych sygnałów odpowiednio w funkcji częstotliwości i czasu). Sygnał M 1 jest wprowadzany do wejścia sumatora (lub odpowiednio układu odejmującego - subtraktora) 24. Innym sygnałem, który na wejściu otrzymuje sumator 24, jest sygnał wyjściowy z adaptacyjnego filtra FIR 14, który jest używany do modelowania, albo inaczej estymacji transmitancji akustycznej H1przy uwzględnieniu współczynników tłumienia filtrów, jak to zostało na przykład zademonstrowane w patencie USA nr 5 475 731. Sygnałem wejściowym filtra 14 jest nadbiegający sygnał L (przed jego cyfrowo-analogową konwersją w DAC 16), i dlatego na wyjściu z filtra 14 występuje sygnał L*H1 stanowiący estymację sygnału echa L'H 1. Zakłada się, że filtr 14 może skompensować, albo dopasować opóźnienie sygnału L powodowane przez DAC 16, wzmacniacz 18, głośnik 20, ścieżkę akustyczną H 1 i mikrofon 22 tak, że na wyjściu filtra 14 otrzymujemy sygnał zestrojony czasowo z sygnałem M 1. W ten sposób przez odjęcie w sumatorze 22 sygnału wyjściowego z filtra 14 od sygnału M 1, akustyczny sygnał echa L'*H1w M 1powinien być efektywnie wytłumiony przez (elektryczną) esłymatę echa L*H1, pozostawiając do transmisji za pośrednictwem linii 12 do systemu telefonicznego jedynie potrzebny sygnał pochodzący od mówiącego T*H3. Tam sygnał może zostać dalej przetworzony i przekazany do rozmówcy na odleglejszym końcu łącza. Na uwagę zasługuje to, że transmitancja akustyczna realizowana przez filtr 14 jest estymatą, a nie dokładnym odtworzeniem H 1 i że H 1jest funkcją dynamiczną na którą wpływają zmiany w środowisku wnętrza pojazdu (np. otwarcie okna lub jego zamknięcie). Gdy takie zmiany następują, kiedy aktywny jest odbierany sygnał L, na wyjściu z filtra 16 mogą się pojawić odstępstwa od prawdziwej estymaty echa i dlatego na linii 12 pojawi się resztkowy sygnał echa E 1. Oczywiście jeżeli rozmawiający T wówczas mówi, sygnał E 1 będzie w sobie zawierał sygnał głosowy T*H3. Zakłada się jednak, że sygnał echa i sygnał mowy są ze sobą stosunkowo słabo skorelowane i dlatego sygnału E 1 można użyć jako zniekształconego sygnału sprzężenia zwrotnego do korekty współczynników filtra 14 dla zminimalizowania sygnału E 1. Dobrze znaną techniką, którą można zastosować do tego celu, jest algorytm najmniejszych kwadratów (Least Mean Squares = LMS). Stopień w jakim algorytm LMS m inimalizuje sygnał E 1może być podwyższony jak to zostało wykazane w EP-A-709-958. Naturalnym dla poprzednich układów tłumienia echa w układzie przedstawionym na fig. 1 jest założenie, że sygnał echa L ', który występuje na wyjściu głośnika 20, jest w zasadzie tożsamy z odbieranym sygnałem L, występującym na wejściu filtra 14. Mówiąc innymi słowy, wygaszanie echa egzekwowane przez układ prezentowany na fig. 1 wymaga, żeby zniekształcenia wprowadzane do sygnału L przez DAC 16, wzmacniacz 18 i głośnik 20 były stosunkowo nieznaczące. Jeżeli tak jest, wtedy dopóki transmitancja akustyczna H 1 dla sygnału L'*H) może być skutecznie usunięta z wychodzącego sygnału M 1 = L'*H1 + T*H3 przez odjęcie od M 1 sygnału wyjściowego L*H1 filtra 14. W ten sposób kiedy rozmówca znajdujący się na bliższym końcu łącza milczy, sygnał zakłócający E1będzie w takich idealnych warunkach zerowy. Jednak założenie dotyczące nieznaczącego efektu zniekształcenia sygnału (np. L'*H1 = L*H1) w układzie przedstawionym na fig. 1 nie zawsze jest prawdziwe w rzeczywistości. W praktyce na otrzymywany sygnał L mogą się nałożyć dosyć znaczne zniekształcenia pochodzące z jednego, a nawet dwóch urządzeń: DAC 16, wzmacniacz 18 i głośnik 20. W ta-
185 318 13 kich przypadkach charakterystyki przenoszenia filtra adaptacyjnego 14 ograniczą wytłumienie na sumatorze 24 jedynie do tych składowych sygnału L, które nie uległy zniekształceniu i w ten sposób na linii 12 pozostanie nam znaczny resztkowy sygnał echa E 1= L '*H 1 - L*H1, który może być słyszalny przez użytkownika znajdującego się na dalszym końcu łącza. M ó- wiąc innymi słowy, ponieważ sygnały L i L' nie są liniowo skorelowane, sygnał E 1 będzie zawierał nieliniowe zakłócenia, które zostaną przetransmitowane do rozmówcy na odległym końcu łącza. W wielu praktycznych zastosowaniach znaczące zakłócenia wprowadza głośnik 20. Typowe głośniki w urządzeniach głośnomówiących, używanych na przykład w telefonii komórkowej, wprowadzają zakłócenia amplitudy dochodzące do 10 procent na skutek rezonansu w paśmie przenoszenia. W dodatku wzmocnienie sygnału, uzyskiwane w głośniku i mikrofonie, może osiągnąć wartość 12 db. To ogranicza tłumienie echa przez układ prezentowany na fig. 1 do około 20-12 = 8 db, co jest wynikiem znacznie poniżej wymagań stawianych przez przemysł, a wynoszących 45 db. Nawet jeżeli zastosowany zostanie droższy (bo wyższej jakości), liniowy (dynamiczny) głośnik z niewielkim lub zerowym rezonansem w paśmie przenoszenia, zniekształcenie nadal będzie miało wartość rzędu 1procenta i sam głośnik ograniczy wytłumianie echa do około 28 db. Oczywiście inne elementy układu (DAC i wzmacniacz) wprowadzają dodatkowe zakłócenia powodując w ten sposób, że efektywność układu tłumienia echa będzie jeszcze bardziej rozbieżna w stosunku do akceptowanych standardów. Podsumowując, musimy stwierdzić, że wyidealizowany układ prezentowany na fig. 1 nie spełnia standardów przemysłowych ani wymagań użytkowników. Jak pokazano to na fig. 2 w najnowszym znanym rozwiązaniu są stosowane dwa mikrofony kierunkowe 22 i 26, umieszczone obok siebie, ale przeciwnie skierowane. Pierwszy m i- krofon 24 skierowany jest w stronę rozmówcy na bliższym końcu łącza 4 i używany jako mikrofon główny. Drugi mikrofon 26 skierowany jest od tegoż rozmówcy i używany do odbierania sygnału porównawczego, służącego do wygaszania sygnału szumu tła N wytwarzanego przez źródło szumu 8. Między mikrofonami 22 i 26 umieszczana jest bariera akustyczna (nie pokazana), której zadaniem jest redukowanie przenikania sygnału T, pochodzącego od rozmówcy do porównawczego mikrofonu 26. Kiedy układ z fig. 2 pracuje na biegu jałowym, nie ma wtedy ani sygnału od rozmówcy na bliskim, ani od rozmówcy na dalszym końcu łącza, więc na wyjściach Mp i Mr obu mikrofonów 22 i 26 mamy jedynie szum tła N, pochodzący ze źródła 8. Sygnał szumu Mp z głównego mikrofonu 24 jest przekazywany do sumatora 27. Sygnał szumu Mr z mikrofonu referencyjnego 26 jest wprowadzany do filtra adaptacyjnego 28 mającego transmitancję A (z). Sygnał wyjściowy z filtra adaptacyjnego 28 jest odejmowany od sygnału szumu Mp w sumatorze 27. Podczas pracy jałowej filtr adaptacyjny 28 dopasowuje swoje współczynniki przy pomocy algorytmu LMS dla zminimalizowania sygnału błędu Ea na wyjściu z sumatora 27 i wyeliminowania w ten sposób sygnału szumu Mp z mikrofonu głównego 24. Filtr adaptacyjny 28 przestroi się w końcu na optimum transmitancji A*(z), która minimalizuje resztkowy szum Ea. Kiedy układ z fig. 2 pracuje w trybie odbioru oprócz szumu tła N ze źródła 8 pojawia się sygnał echa L' z głośnika 20. Ustalone optimum filtra A* (z), którego współczynniki uzyskano podczas pracy na biegu jałowym, są używane w filtrze adaptacyjnym 28 do wygłuszenia szumu w pierwotnym sygnale Mp. Składowa echowa sygnału Mp jest likwidowana w sumatorze 29, który otrzymuje sygnał z wyjścia filtra adaptacyjnego 30, mającego transmitancję B (z). Filtr adaptacyjny 30 koryguje swoje współrzędne i emituje sygnał akustyczny znoszący echo przy użyciu metody najmniejszych kwadratów LMS po to by zminimalizować resztkowy błędny sygnał Eb na wyjściu z sumatora 29. Filtr adaptacyjny 30 ustawi na optimum transmitancję B*(z) tak, żeby zminimalizowane zostało resztkowe echo Eb. Kiedy układ z figury 2 pracuje w trybie nadawania, w odbieranym przezeń sygnale oprócz szumu tła N ze źródła 8 pojawi się sygnał mowy T pochodzący od rozmówcy na bliższym końcu łącza 4 (ale najprawdopodobniej nie będzie sygnału echa). Zafiksowany na optimum filtr A*(z), ale nie B*(z), jest znowu stosowany do wytłumienia hałasowej składowej w sygnale Mp. W tym trybie zakłada się, że dzięki opisanemu ustawieniu mikrofonów 22 i 26 i ich odseparowaniu barierą akustyczną bardzo ograniczone będzie przenikanie sygnału mo-