FREQUENCY COMPOSITION, NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI MARTIN KURIGER, INŻYNIER DSP CHRISTOPHE LESIMPLE, AUDIOLOG KLINICZNY Techniki przenoszenia częstotliwości dostępne są na rynku audioprotetycznym od wielu lat. Przez ten czas algorytmy przenoszenia składowych wysokotonowych podlegały ciągłym modyfikacjom i ulepszeniom. Co wiecej, zmieniał się też odbiór tej technologii przez branżę i Pacjentów. Zasadniczym tematem niniejszej publikacji jest ewolucja algorytmów transpozycji częstotliwości. Ponadto w artykule omówiono zastosowanie tych systemów u Pacjentów z martwymi polami ślimaka. Szczególny nacisk położono nie tylko na techniczne aspekty działania algorytmu, ale przede wszystkim na percepcyjne korzyści stosowania transpozycji częstotliwościowej w audioprotetyce. GRUDZIEŃ 2012
2 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI Technologia cyfrowa oraz transpozycja częstotliwościowa W ostatnich latach na rynku audioprotetycznym pojawiło się wiele aparatów słuchowych posiadających system obniżania wysokich częstotliwości. Tego typu algorytmy transpozycji przenoszą wysokoczęstotliwościową informację akustyczną, która jest niedostępna percepcyjnie dla Użytkownika, w pasmo średniotonowe w obrębie którego próg słyszenia jest o wiele lepszy. Transpozycja częstotliwościowa oferuje nowe możliwości w korygowaniu głębokich niedosłuchów wysokoczęstotliwościowych. Systemy transpozycji są zazwyczaj dedykowane Pacjentom z głębokimi wysokotonowymi niedosłuchami lub częściową głuchotą w zakresie wysokich częstotliwości. Ponadto, wyniki ostatnich badań wskazują na korzyści, które mogą odnosić również Pacjenci z mniejszymi ubytkami słuchu (McDermott, 2010). Obecnie sama koncepcja przenoszenia częstotliwości nie jest niczym nowym, jakkolwiek Bentler (2010) w swojej pracy wskazuje na to, że możliwości najnowszej techniki cyfrowej mogą sprawić, iż korzyści z transpozycji będą o wiele większe niż w przeszłości. Martwe obszary ślimaka Wysokoczęstotliwościowe i niskopoziomowe składowe mowy, bardzo ważne dla prawidłowej jej zrozumiałości, są bardzo często niesłyszalne przez osoby z uszkodzonym słuchem (Bentler, 2010). Percepcja tych pasm może być zazwyczaj skorygowana poprzez zastosowanie odpowiedniego wzmocnienia. Jednakże w przypadku martwych obszarów ślimaka wzmacnianie tych częstotliwości wydaje się być bezcelowe (Vickers i in., 2001). Terminu martwe pole (lub matwy obszar ) w kontekście dysfunkcji narządu słuchu użyto pierwszy raz w pracy Moore i in. (1996). Martwym polem określa się obszar narządu Cortiego, na którym komórki słuchowe lub/i odpowiadające im neurony nie funkcjonują. Innymi słowy, ucho staje się głuche na pewne częstotliwości, tak więc korekcja niedosłuchu poprzez zastosowanie wzmocnienia w tym paśmie częstotliwościowym nie przynosi pożądanego efektu (Vickers i in., 2001). Martwe obszary mają niebagatelne konsekwencje percepcyjne. Pacjenci z martwymi polami ślimaka nie tylko nie słyszą wielu istotnych dźwięków wysokotonowych (w tym różnych spółgłosek), lecz również odnoszą o wiele mniejsze korzyści z konwencjonalnego wzmocnienia dźwięku. To właśnie z myślą o tej grupie Pacjentów zaprojektowano systemy przenoszenia częstotliwości. Systemy transpozycji częstotliwościowej rys historyczny Dość wcześnie zauważono, iż problem martwych obszarów może być rozwiązany poprzez zastosowanie transpozycji częstotliwości, czyli obniżenia dźwięków wysokotonowych, tak aby były one usłyszane (jako składowe średnioczęstotliwościowe).
3 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI Pierwsze próby zastosowania tego typu technik datowane są na lata 60-te XX wieku. Niestety, w związku ze znacznymi ograniczeniami technicznymi w implementacji procedury, doświadczenia te poza kilkoma przypadkami nie zakończyły się sukcesem (Braida i in., 1979). Do koncepcji tej powrócono kilka dekad później, wraz z upowszechnieniem się technologii cyfrowej. To właśnie wtedy wprowadzono pierwsze komercyjnie dostępne aparaty słuchowe z pierwszymi generacjami transpozycji częstotliwościowej (Rys. 1). Jak widać na Rys. 1, poszczególne generacje algorytmów transpozycji częstotliwościowej różni podejście do przetwarzania sygnału. I generacja II generacja III generacja Wysokie Wysokie Wysokie Wysokie Systemy III generacji nie zawężają pasma dźwięku. Częstotliwość Średnie Wysokie Średnie Częstotliwość Wysokie Wysokie + Średnie Średnie Średnie Średnie Niskie Niskie Niskie Niskie Niskie Niskie Częstotliwość Wejście Wejście Wejście Wejście Wejście Wejście Rys. 1. Systemy transpozycji częstotliwościowej różnych generacji. I generacja (lata 90-te XX wieku) redukcja całego pasma sygnału (liniowa kompresja częstotliwości) II generacja (pierwsza dekada XXI wieku) kompresja częstotliwościowa wysokich częstotliwości z zawężeniem pasma sygnału (nieliniowa kompresja częstotliwości) III generacja (druga dekada XXI wieku) kompresja częstotliwościowa wysokich częstotliwości bez redukcji pasma sygnału (nieliniowa kompresja częstotliwości) i bez usuwania żadnej oryginalnej informacji Przez ostatnie dekady ewolucji podlegał nie tylko sam algorytm, ale również spojrzenie na jego pożądane właściwości percepcyjne. W przeszłości głównie koncentrowano się na efektywnym przesunięciu składowych wysokotonowych, podczas gdy w ostatnich latach więcej uwagi poświęcono również zniekształceniom oraz jakości dźwięku. Dlatego też systemy III generacji zachowują oryginalną informację wysokoczęstotliwościową w sygnale. Z drugiej strony, najgorzej oceniane przez branżę audioprotetyczną systemy I generacji kompresowały całe pasmo sygnału, również składowe niskoczęstotliwościowe. Kolejny istotnym i często dyskutowanym zagadnieniem jest sposób przetworzenia oryginalnej informacji wysokotonowej. Vickers i in. (2001) sugerują, iż w przypadku martwych obszarów powinno się redukować wzmocnienie wysokich częstotliwości. Z drugiej strony, inni autorzy wskazują na pewne korzyści wynikające z aplikowania dodatkowego
4 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI wzmocnienia wysokich częstotliwości u Pacjentów z ubytkami wysokotonowymi (Cox i in., 2012). Przytoczone prace wskazują na dwa zupełnie inne podejścia do korekcji głębokich niedosłuchów wysokotonowych oraz wskazują na różne możliwości obróbki dźwięku w aparacie słuchowym. Dlatego też wydaje się, że najlepszym rozwiązaniem jest algorytm, który umożliwia zastosowanie obydwóch omówionych strategii, tj. zawężenia lub pozostawienia oryginalnego pasma sygnałowego. Obiektywnie oraz subiektywnie mierzalne konsekwencje transpozycji częstotliwościowej Obiektywna weryfikacja działania systemu wydaje się być o wiele prostsza, niż demonstracja percepcyjnych korzyści przeniesienia częstotliwości. Co więcej, lepsza słyszalność składowych wysokotonowych nie musi oznaczać jednocześnie polepszenia zrozumiałości mowy. Transpozycja częstotliwości może zniekształcić barwę dźwięku; przetransponowane składowe wysokotonowe mogą też maskować ważną informację zawartą w oryginalnym w paśmie średnich częstotliwości. Wstępne dane doświadczalne wskazały na potencjalną poprawę rozumienia mowy przetworzonej przez układy transpozycji częstotliwościowej. Percepcyjne korzyści wynikające z zastosowania transpozycji częstotliwości były przedmiotem wielu badań klinicznych. Jakkolwiek wyniki tych doświadczeń nie zawsze były zbieżne, wiele z nich sugerowało, że algorytmy tego typu mogą poprawiać rozumienie mowy prezentowanej w ciszy. Poprawę rozumienia mowy zinterpretowano głównie w kategoriach m.in. lepszej identyfikacji spółgłosek trących (Simpson i in., 2005; Robinson i in., 2007; Glista i in., 2009). Co więcej, niektóre prace wykazały również pozytywny wpływ transpozycji na rozumowienie mowy prezentowanej w szumie (Bohnert i in., 2010). Ogólnie wnioski z tych doświadczeń przedstawiają się następująco: korzyści z algorytmów transpozycji charakteryzowały duże różnice międzyosobnicze, dopasowanie tego typu systemów zawsze wiąże się z kompromisem pomiędzy rozumieniem mowy a jakością dźwięku, układy tego typu mają korzystny wpływ na rozumienie głosek bezdźwięcznych, podczas mogą wystąpić niekorzystne efekty dla fonemów dźwięcznych, akceptacja brzmienia zmodyfikowanego dźwięku wymaga aklimatyzacji. Kolejną wartą rozważenia kwestią jest podział na adaptacyjne oraz stacjonarne systemy transpozycji. Układy należące do pierwszej grupy powinny odpowiednio obrabiać fonemy bezdźwięczne, natomiast głoski dźwięczne powinny pozostać nieprzetworzone. W ten sposób systemy adaptacyjne minimalizują zniekształcenia fonemów, niemniej jednak, w związku z ciągłymi zmianami trybu pracy, aklimatyzacja okazuje się bardziej problematyczna niż w przypadku układów stacjonarnych.
5 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI Częściowe podsumowanie: optymalny układ transpozycji częstotliwościowej powinien spełniać następujące kryteria: minimalizować zniekształcenia w paśmie poniżej 1,5 khz, utrzymywać wzmocnienie w zakresie wysokich częstotliwości (przydatne w przypadku resztkowego słyszenia), wskazany jest również model nieadaptacyjny, dla którego aklimatyzacja jest o mniej problematyczna. Frequency Composition transpozycja częsotliwościowa III generacji Frequency Composition jest zupełnie nowym na rynku systemem transpozycji częstotliwościowej. Jako układ III generacji zachowuje on oryginalną informację wysokoczęstotliwościową. Frequency Composition duplikuje składowe wysokotonowe, przenosi je w pasmo średnich częstotliwości oraz dodaje (superpozycja) do sygnału. Frequency Composition zachowuje całe 10-kilohercowe pasmo dźwięku i nie usuwa żadnych składowych z oryginalnego sygnału. Frequency Composition przetwarza głównie wysokotonowe spółgłoski, nie modyfikując samogłosek, które są zazwyczaj dobrze słyszalne przez Pacjentów z martwymi polami. Parametry pracy Frequency Composition są całkowicie programowalne z poziomu środowiska Oasis. Jeśli zajdzie taka konieczność, Oasis automatycznie aktywizuje Frequency Composition oraz dobiera najlepsze ustawienia układu. Ponadto istnieje możliwość konwencjonalnego wzmocnienia wysokich częstotliwości oraz zmiany intensywności przetransponowanych składowych wysokotonowych. Podczas dopasowania, Oasis analizuje dane audiometryczne Klienta oraz typuje kandydatów Pacjentów, dla których wskazane jest włączenie transpozycji. Następnie określane są optymalne ustawienia algorytmu w zakresie pasma źródłowego i docelowego (Baer i in., 2002; Vinay i Moore, 2007; Salorio-Corbetto i in., 2012). Należy zauważuć, że w Oasis zawsze istnieje możliwość manualnego włączenia/wyłączenia Frequency Composition. Określenie pasma źródłowego uwzględnia również właściwości przetwarzanych sygnałów, zwłaszcza różnice pomiędzy spółgłoskami i samogłoskami. W związku z różnicą maksymalnej granicy pasma dla różnych fonemów, Frequency Composition przetwarza głównie wysokotonowe (szerokopasmowe) spółgłoski, nie modyfikując struktury niskotonowych samogłosek. Pozwala to zminimalizować zniekształcenia dźwięku oraz znacznie skraca proces aklimatyzacji.
6 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI Unikalne właściwości Frequency Composition przekładają się na realne korzyści dla Użytkownika aparatu: 1. Lepsza identyfikacja wysokoczęstotliwościowych fonemów, 2. Większa jakość dźwięku, 3. Precyzja dopasowania. Rys. 2 przedstawia wyniki pomiarów laboratoryjnych dotyczących różnych aspektów funkcjonowanania Frequency Composition. 100 a) *** b) *** * Inferiority 80 Mowa 60 Przestrzenność 40 Jakość 20 Gorzej 0 Rozpoznawanie spółgłosek Bez apar. Non-Inferiority Lepiej FC wył. FC wł. -2-1 0 1 2 Rys. 2 Wyniki testów Frequency Composition a) identyfikacja spółgłosek b) wyniki SSQ. Statystycznie udowodniona poprawa identyfikacji wysokoczęstotliwościowych fonemów Rys. 2a przedstawia wyniki pomiaru procentowanego rozpoznawania spółgłosek. W doświadczeniu zastosowano test logatomowy (tj. bazujący na wyrazach bez sensu) o strukturze VCV (samogłoska-spółgłoskasamogłoska) oraz skoncentrowano się na rozpoznawaniu bezdźwięcznych fonemów - /s/, /f/, /sz/ oraz /c/. Wygenerowano 12 logatomów, nagrania zrealizowano dla głosu męskiego i żeńskiego (w sumie 24 sygnały testowe). W sesjach doświadczalnych uczestniczyło 13 słuchaczy z głębokim niedosłuchem wysokotonowym (średni HTL=81,1 db HL; SD=9,1 db HL), czyli kandydatów na Użytkowników Frequency Composition. Pomiary przeprowadzono dla trzech warunków: bez aparatu słuchowego, z aparatem bez Frequency Composition oraz dla aparatu z włączonym Frequency Composition. Otrzymane dane poddano nieliniowej transformacji typu arcus sinus opisanej w pracy Studebaker (1985). Wykazano, że Frequency Composition poprawia identyfikację fonemów wysokoczęstotliwościowych. Jak widać na Rys. 2a procent poprawnych odpowiedź jest najmniejszy dla pomiaru niewspomaganego aparatem słuchowym. Identyfikacja spółgłosek jest lepsza dla pomiaru z aparatem bez transpozycji częstotliwościowej, natomiast zdecydowanie najwyższe rozumienie mowy otrzymano dla percepcji wspomaganej aparatem słuchowym z Frequency Composition. Ponadto stwierdzono statystycznie istotne różnice pomiędzy proporcjami otrzymanymi dla poszczególnych warunków pomiarowych. Rezultaty przeprowadzonych testów jednoznacznie wskazują więc na statystycznie istotny wpływ Frequency Composition na percepcję wysokotonwych głosek.
7 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI Jakość dźwięku Rys. 2b przedstawia dane otrzymane dla testu SSQ (kwestionariusz Speech, Spatial, and Qualities of Hearing; Gatehouse i Noble, 2004). Badania obejmowały 14 respondentów, połowa z nich kwalifikowała się do Frequency Composition, podczas gdy pozostali słuchacze ze względu na mniejszy niedosłuch nie byli kandydatami na Użytkowników Frequency Composition. Frequency Composition zachowuje jakość dźwięku. Doświadczenia przeprowadzono stosując tzw. metodę ślepej próby. Słuchaczy podzielono na dwie równoliczne grupy badawcze pierwsza z nich używała przez 3 tygodnie aparatu RITE z włączonym, natomiast druga z niewłączonym Frequency Composition. Następnie Użytkownicy zostali poproszeni o wypełnienie kwestionariusza SSQ oraz wyznaczono różnice ich odpowiedzi. Rys. 2b przedstawia dane kwestionariuszowe opisujące następujące aspekty percepcyjne: mowa, przestrzenność oraz jakość. Różnice te są bliskie 0 (95 %-przedział ufności zawiera się w ±1 jednostce skali). Analiza statystyczna wykazała brak statystycznie istotnych różnic ocen uzyskanych w obydwóch grupach badawczych. Trafność doboru Kandydatów Ostatnią kwestią jest precyzja analizy danych audiometrycznych w aspekcie doboru Użytkowników Frequency Composition. Dobrze zaprojektowana procedura dopasowania powinna rozróżniać Pacjentów, którzy mogą odnieść potencjalną korzyść z Frequency Composition od tych, dla których włączenie tego algorytmu nie jest konieczne. Wyniki przedstawionych powyżej doświadczeń wskazują na znaczną poprawę identyfikacji wysokotonowych fonemów w grupie kandydatów. Ten sam pomiar przeprowadzono dla grupy nie-kandydatów wskazał również na pewien przyrost poprawy rozumienia mowy, ale odsetek poprawnych odpowiedzi nie był wyższy niż w grupie kandydatów. Frequency Composition przetestowany klinicznie oraz gotowy do użycia Niniejszy artykuł dotyczył ewolucji oraz porównania różnych algorytmów transpozycji częstotliwości stosowanych w audioprotetyce. Począwszy od pierwszych prototypowych systemów układy te stawały się coraz bardziej zaawansowane oraz efektywne w działaniu. Podczas tych lat zmieniły się nie tylko same algorytmy, ale również ich odbiór przez środowisko audiologiczne. Frequency Composition jest systemem najnowszej generacji, zaprojektowanym w oparciu o wyniki wieloletnich doświadczeń i zmagań z układami transpozycji. Frequency Composition jest dostępny w aparatach słuchowych Bernafon Acriva 9 7.
8 FREQUENCY COMPOSITION : NOWY SYSTEM TRANSPOZYCJI CZĘSTOTLIWOŚCI Literatura Baer, T., Moore, B. C. J., & Kluk, K. (2002). Effects of lowpass filtering on the intelligibility of speech in noise for people with and without dead regions at high frequencies. Journal of the Acoustical Society of America, 112, 1133-1144. Bentler, R. (2010). Frequency-lowering hearing aids: verification tools and research needs. The ASHA Leader. Retrieved December 18, 2012, from http://www.asha.org/ Publications/leader/2010/100406/Frequency-Lowering-Hearing-Aids.htm Bohnert, A., Nyffeler, M., & Keilmann, A. (2010). Advantages of a non-linear frequency compression algorithm in noise. European Archives of Oto-Rhino-Laryngology, 267(7), 1045-1053. Braida, L. D., Durlach, N. L., Lippmann, R. P., Hicks, B. L., Rabinowitz, W. M., & Reed, C. M. (1979). Hearing aids a review of past research on linear amplification, amplitude compression, and frequency lowering. ASHA Monographs, 19 (Chapter IV, 87-113). Cox, R. M., Johnson, J. A., & Alexander, G. C. (2012). Implications of high-frequency cochlear dead regions for fitting hearing aids to adults with mild to moderately severe hearing loss. Ear and Hearing, 33(5), 573-587. Gatehouse, S., & Noble, W. (2004). The speech, spatial and qualities of hearing scale (SSQ). International Journal of Audiology, 43(2), 85-99. Glista, D., Scollie, S., Bagatto, M., Seewald, R., Parsa, V., & Johnson, A. (2009). Evaluation of nonlinear frequency compression: clinical outcomes. International Journal of Audiology, 48(9), 632 644. McDermott, H. (2010). The benefits of nonlinear frequency compression for a wide range of hearing losses. Audiology Online. Retrieved December 18, 2012, from http://www. audiologyonline.com/articles/benefits-nonlinearfrequency-compression-for-867 Moore, B. C. J., Glasberg, B. R., & Vickers, D. A. (1996). Factors influencing loudness perception in people with cochlear hearing loss. In B. Kollmeier (Ed.), Psychoacoustics, speech and hearing aids. Singapore: World Scientific. Robinson, J. D., Baer T., & Moore, B. C. J. (2007). Using transposition to improve consonant discrimination and detection for listeners with severe high-frequency hearing loss. International Journal of Audiology, 46(6), 293-308. Salorio-Corbetto, M., Baer, T., & Moore, B. C. J. (2012). Aiding consonant identification with frequency-compression hearing aids for listeners with high-frequency cochlear dead regions. Poster presented at the International Hearing Aid Research Conference, Lake Tahoe. Simpson, A., Hersbach, A. A., & McDermott, H. (2005). Improvements in speech perception with an experimental nonlinear frequency compression hearing device. International Journal of Audiology, 44(5), 281-292. Studebaker, G. A. (1985). A rationalized arcsine transform. Journal of Speech and Hearing Research, 28, 455 462. Vickers, D. A., Moore, B. C. J., & Baer, T. (2001). Effects of lowpass filtering on the intelligibility of speech in quiet for people with and without dead regions at high frequencies. Journal of the Acoustical Society of America, 110, 1164-1175. Vinay, S. N., & Moore, B. C. J. (2007). Prevalence of dead regions in subjects with sensorineural hearing loss. Ear and Hearing, 28(2), 231 241. Światowa siedziba Szwajcaria Bernafon AG Morgenstrasse 131 3018 Bern Phone +41 31 998 15 15 Fax +41 31 998 15 90