WYZNACZANIE FILTRÓW SŁUCHOWYCH METODĄ SZUMU PRZESTRAJANEGO Fast method for auditory filter shapes measurements Karolina Kluk, kkluk@amu.edu.pl Instytut Akustyki, Uniwersytet im. Adama Mickiewicza Institute of Acoustics, Adam Mickiewicz University Umultowska 85, 61-614 Poznań STRESZCZENIE Niniejsza praca dotyczy nowej metody wyznaczania charakterystyk filtrów słuchowych, określanej mianem "fast". Zaproponowana metoda bazuje na zjawisku maskowania tonu szumem pasmowozaporowym, którego względna szerokość pasma zaporowego opisana za pomocą względnej dewiacji częstotliwości (w odniesieniu do częstotliwości tonu maskowanego) zmienia się w sposób ciągły od wartości 0.6 do 0.0. Uzyskane wyniki testowania osób ze słuchem normalnym wskazują na poprawność i zgodność metody "fast" z metodą klasyczną wyznaczania filtrów słuchowych. W przypadku osób ze słuchem uszkodzonym, konieczne jest dalsze testowanie i udoskonalanie metody "fast". SUMMARY This paper is concerned with a new method of the auditory filter shapes determination. The method - called "fast" - is based on the masking phenomenon. Pure tone is being masked with a notched-noise. The bandwidth of the notch is changing continuously from relative frequency deviation of 0.6 to 0.0. The results of the new method are in agreement with the results of the classical one for normal-hearing people. For people with sensori-neural hearingloss further studies are necessary. 1.WSTĘP Peryferyjny układ słuchowy człowieka przyrównać można do układu liniowych, pasmowoprzepustowych filtrów. Prace nad fizjologią układu słuchowego pozwalają stwierdzić, że podstawą procesu filtrowania jest błona podstawna w ślimaku, a każdemu punktowi błony podstawnej można przypisać wielkość nazywaną częstotliwością charakterystyczną, która równa jest częstotliwości tonu wytwarzającego maksymalne wychylenie w tym właśnie punkcie błony podstawnej [1] [2]. Dzięki takiej funkcji ślimak zachowuje się w przybliżeniu jak analizator
częstotliwości rozkładając złożone bodźce akustyczne na poszczególne składowe sinusoidalne. Z fizycznego punktu widzenia, tę funkcję ślimaka można opisać za pomocą procesu filtrowania, tj. przepuszczania bodźca akustycznego przez układ filtrów. Jeśli każdy punkt błony podstawnej zachowuje się w przybliżeniu jak pasmowoprzepustowy filtr o określonej częstotliwości środkowej, szerokości pasma przepustowego i nachyleniu zboczy, to zbiór takich filtrów (po jednym filtrze dla każdego punktu błony podstawnej) może stanowić model funkcjonowania tej części układu słuchowego. Filtry te określa się mianem filtrów słuchowych. Sygnały wyjściowe z filtrów słuchowych, jako funkcja ich częstotliwości środkowej, są odwzorowaniem aktywności układu słuchowego, którą można wyznaczyć w pomiarach psychofizycznych. Znacząca liczba publikacji naukowych z psychoakustyki poświęcona jest właśnie zagadnieniu wyznaczania charakterystyk filtrów słuchowych człowieka, ponieważ ich parametry określają najważniejsze właściwości słuchu tj. rozdzielczość częstotliwościową oraz jego dynamikę. Rozdzielczość częstotliwościowa opisuje możliwość rozłożenia dźwięku złożonego na składowe sinusoidalne i odgrywa znaczącą rolę w wielu aspektach percepcji słuchowej. Zagadnienie to jest szczególnie ważne w przypadku osób ze słuchem uszkodzonym, bowiem wiedza na temat rozdzielczości częstotliwościowej uszkodzonego narządu słuchu jest nieodzownym elementem odpowiedniego dopasowania aparatu słuchowego. Jedną z wielu konsekwencji utraty rozdzielczości częstotliwościowej jest bardzo duża podatność na maskowanie przez dźwięki zakłócające. Gdy słuchacz próbuje spostrzec sygnał na tle szumu, wykorzystuje wówczas filtr słuchowy o najlepszym stosunku sygnału do szumu [2]. W uchu normalnym, w którym filtry słuchowe są stosunkowo wąskie, cały szum tła z wyjątkiem wąskiego pasma wokół częstotliwości sygnału tłumiony jest na wyjściu tego filtru. W uchu uszkodzonym, w którym filtry są poszerzone, przez filtr przechodzi o wiele więcej szumu i dlatego spostrzeganie sygnału staje się znacznie trudniejsze. Zatem szumy w znacznym stopniu zakłócają zdolność spostrzegania i dyskryminacji dźwięków, w tym również mowy, dlatego osoby z odbiorczym uszkodzeniem słuchu mają często duże trudności w zrozumieniu mowy na tle szumu, pomimo, że jest ona dla nich słyszalna (tj. powyżej progu słuchu słuchacza). Należy zauważyć, że dostarczenie aparatu słuchowego, który po prostu wzmocni dźwięk, nie wyeliminuje opisanych trudności. Taki aparat może czynić dźwięk słyszalnym, lecz nie poprawi uszkodzonej selektywności częstotliwościowej. Rutynowym sposobem oceny uszkodzenia słuchu jest badanie audiometryczne. Niestety na podstawie audiogramu nie można określić rozdzielczości częstotliwościowej słuchu. Rozdzielczość tę można natomiast określić na podstawie kształtu filtrów słuchowych, która jest odzwierciedleniem funkcjonowania mechanizmu aktywnego ślimaka, a tym samym sprawności zewnętrznych komórek rzęsatych. Najbardziej precyzyjną metodą wyznaczania charakterystyk filtrów słuchowych jest zaproponowana w 1976 roku przez Pattersona metoda szumu pasmowozaporowego zakładająca, że spostrzeganie sygnału następuje w oparciu o jeden filtr słuchowy, którego częstotliwość środkowa równa jest częstotliwości
sygnału. Zmieniając szerokość pasma zaporowego szumu wyznacza się próg detekcji sygnału o częstotliwości przypadającej na zakres pasma zaporowego, jako funkcję szerokości tego pasma. Metoda ta pozwala uniknąć słyszenia za pomocą filtru o częstotliwości środkowej innej niż częstotliwość sygnału. Jest ona wprawdzie bardzo dokładna, lecz niestety zbyt czasochłonna, aby mogła być zastosowana w praktyce klinicznej. Dlatego celem eksperymentu było opracowanie i przetestowanie metody równie precyzyjnej jak metoda Pattersona, lecz wymagającej znacznie krótszego czasu pomiaru, co umożliwiłoby wprowadzenie wyznaczania charakterystyk filtrów słuchowych w zakres standardowych badań słuchu. 2. EKSPERYMENT W ramach eksperymentu opracowano i przetestowano metodę wyznaczania charakterystyk filtrów słuchowych określaną jako fast (ze względu na bardzo krótki czas potrzebny na wyznaczenie progów detekcji sygnału na tle szumu pasmowozaporowego). Zasadniczym celem eksperymentu było sprawdzenie metody fast bazującej na zjawisku maskowania tonu przestrajanym szumem pasmowozaporowym i porównanie jej z metodą Pattersona wyznaczania charakterystyk filtrów słuchowych [3]. Eksperyment przebiegał w dwóch etapach. W etapie pierwszym po uprzednim określeniu progu słuchu słuchacza, wyznaczone zostały w oparciu o klasyczną metodę Pattersona charakterystyki filtrów słuchowych. Wyznaczone zostały progi detekcji tonu o częstotliwościach 1000, 2000, 3000 i 4000 Hz maskowanego szumem pasmowozaporowym o zmiennej szerokości pasma zaporowego. Pasmo zaporowe szumu maskującego usytuowane było symetrycznie względem tonu maskowanego. Szerokość pasma zaporowego, wyrażana za pomocą ilorazów różnicy jego częstotliwości granicznych i częstotliwości tonu do częstotliwości tonu, była równa 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6. Względna szerokość maskujących pasm szumu (odniesiona do częstotliwości tonu) wynosiła 0.4. Widmowa gęstość mocy szumu maskującego wynosiła 41 db/hz i 51 db/hz dla pasma zaporowego o częstotliwości środkowej 1000 Hz oraz 38 i 48, 36 i 46 35 i 45 db/hz odpowiednio dla częstotliwości środkowych 2000, 3000 oraz 4000 Hz. Odsłuchiwanie eksperymentu odbywało się w kabinie izolowanej akustycznie. Zarówno ton jak i szum generowane były za pomocą systemu Tucker-Davis-Technology (TDT) i prezentowane słuchaczom monauralnie za pomocą słuchawek Sennheiser HD 580. Każdorazowo prezentowane były dwa interwały o czasie trwania 500 ms każdy, odstęp między kolejnymi interwałami obserwacji wynosił 200 ms. W interwale prezentowany był szum pasmowo zaporowy i ton o częstotliwości równej częstotliwości środkowej pasma zaporowego, lub sam szum pasmowozaporowy. Zadaniem słuchacza było wskazanie interwału zawierającego sygnał tonalny. W badaniach zastosowano procedurę 2AFC (71% poprawnych odpowiedzi). Próg detekcji tonu na tle szumu pasmowozaporowego wyznaczono jako średnią arytmetyczną ośmiu ostatnich pomiarów z 12 każdorazowo wyznaczonych punktów zwrotnych. Charakterystyki filtrów słuchowych, tzn. wartości p l nachylenie zboczy filtru od strony małych i p u
od strony dużych częstotliwości, r - dynamikę filtru, oraz jego ekwiwalentną szerokością prostokątną: 1 1 ERB = 2 f 0 + (1) p l p u określono za pomocą funkcji roex(p,r): pg W ( g) = (1 r)(1 + pg) e + r (2) f f0 gdzie W(g) jest funkcją ważącą, g względną dewiacją częstotliwości g =, f0 f, f 0 częstotliwością odpowiednio graniczną i środkową pasma zaporowego, p określa nachylenie zboczy filtru oddzielnie od strony dużych (p u ) i małych (p l ) częstotliwości względem częstotliwości środkowej, a r dynamikę filtru. Etapem drugim było wyznaczenie dla tych samych parametrów tonu i szumu jak w etapie pierwszym eksperymentu charakterystyk filtrów słuchowych za pomocą metody fast, której założenia oparte są na wyznaczeniu progów detekcji tonu na tle przestrajanego szumu pasmowozaporowego Szerokość pasma zaporowego wyrażona za pomocą ilorazów różnicy jego częstotliwości granicznych i częstotliwości tonu do częstotliwości tonu zmieniała się automatycznie od wartości maksymalnej 0.6 do 0.0 w ciągu 60 s (liczba kroków - 3751) z zachowaniem stałej (0.4) względnej szerokości maskujących pasm szumu (odniesionej do częstotliwości tonu). Widmowa gęstość mocy szumu maskującego była taka sama jak w etapie pierwszym eksperymentu. Zarówno szum jak i maskowany ton generowane były za pomocą 16 bitowego przetwornika cyfrowo-analogowego TDT z szybkością próbkowania 16 khz i po dolnoprzepustowym filtrowaniu filtrem o częstotliwości odcięcia 8 khz prezentowane słuchaczom przez słuchawki Sennheiser HD 580 w kabinie izolowanej akustycznie. Zadaniem słuchacza było takie sterowanie poziomem tonu prezentowanego na tle przestrajanego pasmowozaporowego szumu, aby przez cały czas ton ten był zaledwie słyszalny. Szybkość zmian poziomu tonu była niezależna od słuchacza (2 db/s), decydował on wyłącznie o kierunku zmian jego poziomu. Każdy pomiar dla kolejnych częstotliwości tonu powtarzany był czterokrotnie w celu uniknięcia przypadkowych zmian progu detekcji tonu. Podobnie jak w części pierwszej eksperymentu określono charakterystyki filtrów słuchowych, a następnie porównano uzyskane wyniki z wynikami otrzymanymi metodą klasyczną wyznaczania charakterystyk filtrów słuchowych. 3. ANALIZA WYNIKÓW I WNIOSKI Na rysunku 1 przedstawiono przebieg progów detekcji sygnałów o częstotliwościach odpowiednio 1000, 2000, 3000 i 4000 Hz dla jednej z sześciu przetestowanych osób normalnie słyszących w zależności od połowy względnej różnicy częstotliwości odcięcia pasm szumu i częstotliwości tonu, uzyskanych za pomocą metody klasycznej (symbole - kółka). Linią przerywaną zaznaczono oryginalne rezultaty testowania za pomocą szumu przestrajanego uzyskane metodą fast a linią ciągłą średnie poziomy progowe sygnału, uśrednione po czterech
powtórzeniach. Progi detekcji sygnału na tle szumu pasmowozaporowego wyznaczone metodą fast są o ok. 10 db wyższe od progów uzyskanych metodą klasyczną. Przesunięcie jest jednak symetryczne dla wszystkich testowanych względnych szerokości a kształt krzywych jest zachowany. Podwyższenie progów wynika najprawdopodobniej z faktu, iż słuchacze testowani metodą fast nie mieli czasu potrzebnego na zastanowienie się przed podjęciem decyzji na temat słyszalności sygnału. Poza tym sygnał maskowany w przypadku metody fast prezentowany był na tle stale przestrajającego się szumu, przez co próg detekcji sygnału uległ nieznacznemu podwyższeniu. Nie wpłynęło to jednak znacząco na kształt filtrów słuchowych, których charakterystyki przedstawiono na rysunku 2. Linią przerywaną zaznaczono charakterystyki filtrów słuchowych uzyskanych metodą fast, linią ciągłą dla porównania pokazano filtry wyznaczone metodą klasyczną. Zauważyć należy, że kształt filtrów słuchowych wyznaczonych metodą fast niewiele różni się od kształtu uzyskanego za pomocą metody klasycznej. Porównując wartości p l i p u nachylenia zboczy filtrów, oraz szerokości ERB filtrów słuchowych wyznaczonych dwiema testowanymi metodami, uzyskuje się dużą zgodność. Wartości ERB dla częstotliwości tonu maskowanego równych 1000, 2000, 3000 i 4000 Hz uzyskane metodą klasyczną i fast wynoszą odpowiednio: 298 i 336, 182 i 191, 158 i 127, 148 i 121 Hz; co procentowo odpowiada kolejno wartościom 88%, 95%, 124%, 120%. Rys. 1. Przebieg progów detekcji sygnałów o częstotliwościach 1, 2, 3 i 4 kh dla jednej z sześciu osób normalnie słyszących w zależności od połowy względnej różnicy częstotliwości odcięcia pasm szumu i częstotliwości tonu uzyskane za pomocą metody klasycznej (symbole - kółka) oraz za pomocą metody fast ; linią przerywaną zaznaczono oryginalne rezultaty testowania za pomocą szumu przestrajanego a linią ciągłą średnie poziomy progowe sygnału, uśrednione po czterech powtórzeniach. Częstotliwości środkowe pasma zaporowego, a tym samym częstotliwości sygnału maskowanego pokazane są w każdym z paneli rysunku. Całkowity poziom szumu wynosił 80 db SPL.
Rys. 2. Charakterystyki filtrów słuchowych osoby normalnie słyszącej uzyskane za pomocą metody klasycznej (linia ciągła) oraz za pomocą metody fast (linia przerywana) Częstotliwości środkowe pasma zaporowego, a tym samym częstotliwości sygnału maskowanego pokazane są w każdym z paneli rysunku. Całkowity poziom szumu wynosił 80 db SPL. Uzyskane wyniki testowania osób ze słuchem normalnym pozwalają stwierdzić, że zaproponowana metoda fast wyznaczania charakterystyk filtrów słuchowych jest metodą poprawną i równie dokładną jak metoda klasyczna Pattersona. W przypadku osób ze słuchem uszkodzonym, konieczne jest dalsze testowanie i udoskonalanie tej metody. Zauważyć należy, iż czas potrzebny do wyznaczenia 4 filtrów słuchowych metodą fast wynosi ok. 20 minut, podczas gdy na wyznaczenie takich samych charakterystyk metodą klasyczną należy przeznaczyć ok. 8 godzin. Reasumując, metoda fast jest metodą szybką i dokładną, dzięki czemu możliwe jest łatwe wykorzystanie jej w praktyce klinicznej. Ze względu na dużą czasochłonność metody klasycznej, badanie kształtu filtrów słuchowych nie jest obecnie stosowane w diagnostyce otolaryngologicznej oraz w badaniach służących optymalnemu dopasowaniu aparatów słuchowych. Wprowadzenie metody fast w zakres standardowych badań słuchu z pewnością poprawi jakość dopasowania aparatów słuchowych, a tym samym wpłynie na komfort słyszenia i życia (poprawa zrozumiałości mowy) osoby z uszkodzonym słuchem. Praca została wykonana częściowo w ramach projektów KBN Nr 8T11E01717 i Nr 8T07B06020. LITERATURA 1. Pickles, J.O., An Introduction to the Physiology of Hearing, 2nd Ed. 2nd ed. 1988, London: Academic Press. 2. Moore, B.C.J., An Introduction to the Psychology of Hearing, 4th Ed. 1997, London: Academic Press. 3. Patterson, R.D., Auditory filter shape. J. Acoust. Soc. Am., 1974. 55: p. 802-809.