Wyrazistość logatomów prezentowanych na tle szumu mowopodobnego dla osób z niedosłuchem typu martwe pola



Podobne dokumenty
Przygotowała: prof. Bożena Kostek

TEORIA WYTWARZANIA DŹWIĘKÓW

System diagnostyki słuchu

WYZNACZANIE FILTRÓW SŁUCHOWYCH METODĄ SZUMU PRZESTRAJANEGO. Karolina Kluk,

Mowa w protetyce słuchu

Laboratorium Elektronicznej Aparatury Medycznej I

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do

Percepcja dźwięku. Narząd słuchu

Nauka o słyszeniu. Wykład III +IV Wysokość+ Głośność dźwięku

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

1.Klasyfikacja głosek języka polskiego. 2.Układ narządów artykulacyjnych przy wymowie wybranych głosek.

Instrukcja dopasowania SoundRecover2 u dorosłych

Głos. Proces generacji dźwięku płuca, fałdy głosowe, kanał głosowy rezonatory i artykulatory. Ton krtaniowy Częstotliwości formantowe dla mowy

POMIARY AUDIOMETRYCZNE

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 SPRAWDZANIE PARAMETRÓW AUDIOMETRU TONOWEGO. AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

LABORATORIUM AUDIOLOGII I AUDIOMETRII

Nauka o słyszeniu Wykład IV Wysokość dźwięku

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 SPRAWDZANIE PARAMETRÓW AUDIOMETRU TONOWEGO. AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie


Nauka o słyszeniu Wykład IV Głośność dźwięku

Systemy multimedialne. Instrukcja 5 Edytor audio Audacity

Wstęp do Językoznawstwa

Instrukcja do laboratorium z Fizyki Budowli. Temat laboratorium: CZĘSTOTLIWOŚĆ

Klasyfikacja ze względu na konstrukcję

Efekt Lombarda. Czym jest efekt Lombarda?

Diagnostyka i protetyka słuchu i wzroku APARATY SŁUCHOWES

Opis akustyczny samogłosek Wprowadzenie

Implanty słuchowe jako nowoczesna metoda leczenia niedosłuchu

Przekształcenia sygnałów losowych w układach

Podstawy biofizyki zmysłu słuchu. Badanie progu pobudliwości ucha ludzkiego.

Politechnika Warszawska

ZROZUMIEĆ UBYTEK SŁUCHU

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Neuromodulacja akustyczna CR

Nauka o słyszeniu Wykład II System słuchowy

Odbiorniki superheterodynowe

Informator logopedyczny dla nauczycieli

PROGRAM TERAPII LOGOPEDYCZNEJ W PUBLICZNEJ SZKOLE PODSTAWOWEJ

Teorie opisujące naturalne słyszenie przestrzenne

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Wzmacniacze operacyjne

NAJCZĘŚCIEJ WYSTĘPUJĄCE WADY WYMOWY oraz ZABURZENIA ROZWOJU MOWY U DZIECI

Dźwięk. Cechy dźwięku, natura światła

AUDIOPMETRIA MOWY OPIS SLAJDÓW

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Dźwięk podstawowe wiadomości technik informatyk

Demodulator FM. o~ ~ I I I I I~ V

Jak pracują systemy implantów ślimakowych?

Akustyka muzyczna. Wykład 8 Instrumenty dęte. dr inż. Przemysław Plaskota

Z tego rozdziału dowiesz się:

CHARAKTERYSTYKA WAD WYMOWY

Ćwiczenie 2: pomiar charakterystyk i częstotliwości granicznych wzmacniacza napięcia REGIONALNE CENTRUM EDUKACJI ZAWODOWEJ W BIŁGORAJU

CZWÓRNIKI KLASYFIKACJA CZWÓRNIKÓW.

Psychofizyka. Klasyfikacja eksperymentów psychofizycznych

Mapa akustyczna Torunia

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,

TEMAT: OBSERWACJA ZJAWISKA DUDNIEŃ FAL AKUSTYCZNYCH

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

LABORATORIUM Sygnałów, Modulacji i Systemów ĆWICZENIE 2: Modulacje analogowe

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO

Sposoby opisu i modelowania zakłóceń kanałowych

Nazwa kwalifikacji: Świadczenie usług medycznych w zakresie protetyki słuchu Oznaczenie kwalifikacji: Z.18 Numer zadania: 01

Budowa. Metoda wytwarzania

5 Filtry drugiego rzędu

Działania służby medycyny pracy w aspekcie profilaktyki narażenia na hałas w miejscu pracy

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2017 CZĘŚĆ PRAKTYCZNA

Dźwięk i słuch. Percepcja dźwięku oraz funkcjonowanie narządu słuchu

Fale dźwiękowe. Jak człowiek ocenia natężenie bodźców słuchowych? dr inż. Romuald Kędzierski

Dynamiczne badanie wzmacniacza operacyjnego- ćwiczenie 8

LABORATORIUM ELEKTROAKUSTYKI. ĆWICZENIE NR 1 Drgania układów mechanicznych

Terminologia, definicje, jednostki miar stosowane w badaniach audiologicznych. Jacek Sokołowski

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

FONETYKA. Co to jest fonetyka? Język polski Klasa III Gim

Podstawy transmisji sygnałów

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0,

LABORATORIUM PODSTAW TELEKOMUNIKACJI

załącznik nr 2 do SIWZ nr SPZOZ/PN/15/ formularz cenowy przedmiotu zamówienia Zadanie 2 Zestaw do badania układu równowagi i narządu słuchu

Parametry elektryczne anteny GigaSektor PRO BOX 17/90 HV w odniesieniu do innych rozwiązań dostępnych obecnie na rynku.

LABORATORIUM ELEKTRONIKI ĆWICZENIE 4 POLITECHNIKA ŁÓDZKA KATEDRA PRZYRZĄDÓW PÓŁPRZEWODNIKOWYCH I OPTOELEKTRONICZNYCH

Elektromiograf NMA-4-01

Fal podłużna. Polaryzacja fali podłużnej

Drgania i fale sprężyste. 1/24

Jeszcze bardziej dostepne, badania przesiewowe!

Laboratorium Metrologii

Fale dźwiękowe - ich właściwości i klasyfikacja ze względu na ich częstotliwość. dr inż. Romuald Kędzierski

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 14 Pomiar zniekształceń nielinearnych głośnika

Podstawy Przetwarzania Sygnałów

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

środkowego bez towarzyszących cech ostrego stanu zapalnego prowadzi środkowego, ale również w pływać niekorzystnie rozwój mowy oraz zdolności

Analiza sygnału mowy pod kątem rozpoznania mówcy chorego. Anna Kosiek, Dominik Fert

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA

PL B3. BORCZYK MONIKA, Bielsko-Biała, PL BUP 13/09. MONIKA BORCZYK, Bielsko-Biała, PL WUP 12/13 RZECZPOSPOLITA POLSKA

Dwa w jednym teście. Badane parametry

Drgania wymuszone - wahadło Pohla

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej

Diagnostyka i protetyka słuchu i wzroku IMPLANTY. Implanty ślimakowe i inne

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PRAKTYCZNA

Transkrypt:

Wydział Fizyki Uniwersytet im. Adama Mickiewicza w Poznaniu Praca magisterska Wyrazistość logatomów prezentowanych na tle szumu mowopodobnego dla osób z niedosłuchem typu martwe pola Karolina Kluk Promotor i opiekun pracy: Prof. dr hab. Aleksander Sęk Wydział Fizyki UAM Zakład Psychoakustyki Poznań 2001

WSTĘP WSTĘP Jednym z najczęstszych problemów występujących u osób z odbiorczym niedosłuchem są trudności w prowadzeniu konwersacji wynikające z niedostatecznego rozumienia mowy zwłaszcza, gdy prezentowana jest na tle szumu lub w hałaśliwym środowisku. Zakres i natura tych trudności zależy od rodzaju i głębokości niedosłuchu. Osoby z głębokim niedosłuchem odbiorczym, mają zwykle duże trudności w rozumieniu mowy, nawet, gdy słuchają tylko pojedynczego mówcy w cichym pomieszczeniu. Dlatego ich zdolność rozumienia mowy polega w dużym stopniu na czytaniu z ust i używaniu informacji płynących z kontekstu wypowiedzi. Problematyka niniejszej pracy dotyczy dość nowego zagadnienia, a mianowicie, specyficznego uszkodzenia słuchu nazywanego martwym polem (z ang. Dead Region). Pod pojęciem tym rozumiany jest niedosłuch, który związany jest z całkowitą utratą wewnętrznych komórek rzęsatych w określonych obszarach błony podstawnej i/lub neuronów aferentnych połączonych z tymi komórkami. Praca moja dotyczy wyrazistości logatomów (rozumienia logatomów) prezentowanych na tle szumu dla osób, które mają niedosłuch typu martwe pola. Ze względu na fakt, że eksperyment przeprowadzony był na osobach z odbiorczym ubytkiem słuchu, w pierwszym rozdziale mojej pracy przedstawiłam zagadnienia związane z tego typu niedosłuchem oraz jego metody diagnostyczne. Ponieważ materiałem testowym były logatomy typu VCV (z ang. Vowel-Consonant- Vowel), opisałam również artykulacyjną klasyfikację fonemów. W rozdziale poświęconym metodzie eksperymentalnej, zamieściłam opis słuchaczy, materiału testowego i aparatury użytej w eksperymencie. Przeprowadzenie eksperymentu i analiza statystyczna pozwoliły pokazać, że wzmocnienie sygnałów o częstotliwościach przypadających na zakres martwego pola, nie wpływa na poprawę wyrazistości logatomów, a czasami może wiązać się z jej pogorszeniem, czego szeroką dyskusję przedstawiłam w rozdziale na temat analizy wyników, oraz we Wnioskach. 2

WPROWADZENIE I. WPROWADZENIE I.1. Czym jest martwe pole Odbiorcze uszkodzenie słuchu jest często związane z uszkodzeniem komórek rzęsatych zewnętrznych i/lub wewnętrznych. Konsekwencją uszkodzenia zewnętrznych komórek rzęsatych jest upośledzenie aktywnego mechanizmu ślimaka, co powoduje, że odpowiedzi błony podstawnej na dźwięki o niskim poziomie natężenia są mniejsze niż w warunkach normalnych (Yates 1995; Moore, 1998). Uszkodzenie wewnętrznych komórek rzęsatych powoduje natomiast zmniejszenie wydajności procesu przetwarzania (zamiany ruchów mechanicznych błony podstawnej na aktywność neuronów). W wielu przypadkach uszkodzenie słuchu związane jest z całkowitą utratą wewnętrznych komórek rzęsatych w określonych obszarach błony podstawnej i/lub neuronów aferentnych połączonych z tymi obszarami. Gdy wewnętrzne komórki rzęsate w ogóle nie funkcjonują w pewnym miejscu błony podstawnej, wówczas proces przetwarzania ruchów błony podstawnej na potencjały czynnościowe nerwu słuchowego również nie funkcjonuje. Dlatego takie miejsca określa się jako martwe pola (Moore i in., 2000b). Martwe pole można przedstawić w jednostkach miejsca na błonie podstawnej, które zostało uszkodzone (brak wewnętrznych komórek rzęsatych lub ich całkowita dysfunkcja). Z tego punktu widzenia martwe pole można określić jako martwe pole podstawy ślimaka lub wierzchołkowe martwe pole. W niniejszej pracy, martwe pole zdefiniowane zostało w jednostkach częstotliwości charakterystycznych (CFs) wewnętrznych komórek rzęsatych i/lub neuronów bezpośrednio przylegających do tego pola. (Moore, 2001). Jeśli martwe pole występuje na przykład w podstawie ślimaka, a częstotliwość charakterystyczna (CF) wewnętrznych komórek rzęsatych/neuronów bezpośrednio przylegających do tego pola wynosi 2000 Hz, wówczas mówi się o martwym polu rozciągającym się od 2000 Hz wzwyż. 3

WPROWADZENIE I.2. Znaczenie off frequency listening Off-frequency listening oznacza detekcję tonu o określonej częstotliwości za pomocą wewnętrznych komórek rzęsatych i neuronów o częstotliwości charakterystycznej innej niż częstotliwość prezentowanego tonu (Patterson i Nimmo Smith, 1980). Off-frequency listening może występować również u ludzi normalnie słyszących i oznacza zdolność do słyszenia za pomocą filtru słuchowego o częstotliwości środkowej innej niż częstotliwość sygnału. Gdy częstotliwość maskera jest większa od częstotliwości sygnału, wówczas słuchacz prawdopodobnie wykorzysta filtr, którego częstotliwość środkowa jest nieco mniejsza od częstotliwości sygnału. Jeśli filtr ten ma względnie płaski wierzchołek i opadające zbocza, to na jego wyjściu masker będzie znacząco tłumiony, a sam sygnał będzie tłumiony nieznacznie. Zatem słuchacz może usprawnić wykonanie zadania poprzez wykorzystanie filtru o częstotliwości środkowej innej niż częstotliwość sygnału. Zjawisko to wykorzystywane jest przez osoby z niedosłuchem typu martwe pola. Drgania błony podstawnej w obszarze martwego pola wywołują pobudzenia nie neuronów związanych z tym polem (o częstotliwości charakterystycznej równej częstotliwości bodźca), lecz neuronów o innej częstotliwości charakterystycznej spoza zakresu martwego pola. W przypadku niedosłuchu typu martwe pola w zakresie dużych częstotliwości, w obszarze martwego pola nie ma wewnętrznych komórek rzęsatych strojonych na te częstotliwości charakterystyczne. Jeśli w takim przypadku zaprezentowany zostanie sygnał sinusoidalny o dużej częstotliwości, to spostrzeżony on będzie za pomocą wewnętrznych komórek rzęsatych strojonych na mniejszą częstotliwość (spoza martwego pola ) niż częstotliwość bodźca. Ta zdolność wynika z poszerzenia zakresu pobudzenia w kierunku małych częstotliwości. Ze względu na możliwość poszerzenia zakresu pobudzenia w kierunku małych częstotliwości, rzeczywisty niedosłuch dla danej częstotliwości może być większy niż wynikałoby to z audiogramu. Koncepcja off-frequency listening odgrywa kluczową rolę w interpretowaniu danych psychoakustycznych, uzyskanych dla osób z martwymi polami. 4

WPROWADZENIE I.3. Martwe pole a audiogram Audiogram tonalny 1 w przypadku niedosłuchu typu martwe pola mylnie pokazuje głębokość niedosłuchu w zakresie częstotliwości przypadających na zakres martwego pola. Spowodowane jest to istnieniem zjawiska pobudzenia resztkowego błony podstawnej, tzn. ton o częstotliwości przypadającej na zakres martwego pola (w zakresie dużych częstotliwości), wywoła pobudzenie resztkowe dla częstotliwości poniżej częstotliwości granicznej martwego pola. Badając próg słuchu dla tej częstotliwości uzyskuje się w ten sposób próg wprawdzie bardzo wysoki, lecz mierzalny, podczas gdy w rzeczywistości uzyskana wartość progowa jest poziomem dźwięku o częstotliwości z zakresu martwego pola koniecznym do wywołania pobudzenia resztkowego w zakresie częstotliwości poniżej częstotliwości granicznej martwego pola. Czyli rzeczywisty próg słuchu słuchacza z niedosłuchem typu martwe pola w zakresie dużych częstotliwości, dla częstotliwości przypadających na zakres tego pola jest wyższy niż próg wyznaczony w badaniu audiometrycznym, a w wielu przypadkach nawet niemierzalny. Jednak na podstawie audiogramu można wstępnie oszacować możliwość wystąpienia martwego pola. Dane fizjologiczne otrzymane z badań na zwierzętach sugerują, że maksymalne wzmocnienie aktywnego mechanizmu ślimaka, (za którego sprawność odpowiedzialne są zewnętrzne komórki rzęsate), wynosi ok. 50 db dla małych częstotliwości i 65 db dla dużych częstotliwości (Yates, 1995). Psychofizyczne dane uzyskane w badaniach przeprowadzonych na ludziach sugerują wzmocnienie o wartości takiej samej, jaka wynikała z badań przeprowadzonych na zwierzętach. Dane te potwierdzają założenie, że wzmocnienie dla dużych częstotliwości jest większe niż wzmocnienie dla częstotliwości małych (Moore i in., 1999b). Wynika stąd, że niedosłuch wywołany dysfunkcją tylko zewnętrznych komórek rzęsatych nie może być większy niż 50 db dla małych częstotliwości i 65 db dla dużych częstotliwości. Dlatego, każdy niedosłuch ślimakowy większy niż opisany powyżej, musi wynikać, chociaż częściowo z uszkodzenia 1 Audiogram med. graficzny zapis wyniku badania słuchu za pomocą audiometru, mający postać krzywej wykreślanej osobno dla każdego ucha (PWN, 1996). 5

WPROWADZENIE wewnętrznych komórek rzęsatych i/lub neuronów aferentnych połączonych z tymi obszarami. Zdiagnozowanie występowania martwego pola tylko na podstawie audiogramu nie jest możliwe. Można jednak w wielu przypadkach przypuszczać obecność takiego pola, jeśli: Ubytek słuchu jest większy niż 90 db w zakresie dużych częstotliwości lub większy niż 75 80 db w zakresie małych częstotliwości. Ubytek słuchu wynosi ok. 40 50 db w zakresie małych częstotliwości, w zakresie średnich i dużych częstotliwości słuch jest w normie (taki typ audiogramu prawdopodobnie wskazuje martwe pole w zakresie małych częstotliwości). Ubytek słuchu jest większy niż 50 db w zakresie małych częstotliwości, a w zakresie dużych częstotliwości ubytek jest niewiele mniejszy (taki typ audiogramu również prawdopodobnie wskazuje martwe pole w zakresie małych częstotliwości). Ubytek słuchu powiększa się bardzo szybko (ponad 50 db/oktawę) wraz ze wzrostem częstotliwości (taki typ audiogramu prawdopodobnie wskazuje martwe pole w zakresie dużych częstotliwości). I.4. Wykorzystanie zjawiska maskowania do diagnozowania niedosłuchu typu martwe pola Jak zasygnalizowano w poprzednim rozdziale, jednoznaczne zdiagnozowanie martwego pola na podstawie audiogramu nie jest możliwe. Istnieje jednak kilka metod umożliwiających wykrycie tego typu niedosłuchu. Należy do nich: pomiar psychofizycznych krzywych strojenia tzw. PTC (z ang. Psychophysical Tuning Curve), (Small, 1959) oraz pomiar progu maskowania sinusoidy na tle szumu zrównującego próg tzw. TEN (z ang. Threshold Equalizing Noise), (Moore i in., 2000b). Test TEN, którego główną zaletą jest to, że można go wykonać bardzo szybko, bazuje na detekcji sinusoidy na tle szumu szerokopasmowego, zaprojektowanego w taki sposób, aby wytwarzać równe progi maskowania (w db SPL) w szerokim paśmie częstotliwości (250 10000 Hz), dla słuchaczy normalnie słyszących oraz dla słuchaczy z odbiorczym uszkodzeniem słuchu bez martwych pól. Szum taki nosi nazwę szumu zrównującego 6

WPROWADZENIE próg (tzw. TEN, z ang. Threshold Equalizing Noise). W celu uzyskania wymaganej charakterystyki widmowej szumu zrównującego próg (TEN), określono jego widmową gęstość mocy N o jako: N Ps = K ERB 0 (1) gdzie, P s jest mocą sygnału na progu, K jest stosunkiem sygnału do szumu na wyjściu filtru słuchowego, wymaganym dla osiągnięcia progu, ERB natomiast jest ekwiwalentną szerokością prostokątną filtru słuchowego. Kształt widma szumu zrównującego próg (TEN) jest taki, aby N 0 K ERB było stałe w całym przedziale częstotliwości od 125 Hz aż do 15000 Hz. Poziom szumu zrównującego próg TEN, określany jest mianowicie jako poziom w paśmie o szerokości 1 ERB i częstotliwości środkowej 1000 Hz (tj. poziom w paśmie od 935 1065 Hz). Przykład widma szumu TEN dla poziomu w paśmie o szerokości 1 ERB równego 70 db przedstawiony jest na rysunku 1 (Moore i in., 2000b). Próg detekcji dla słuchaczy normalnie słyszących jest w przybliżeniu równy poziomowi szumu w paśmie o szerokości 1 ERB i częstotliwości środkowej równej 1000 Hz. Normalna szerokość ERB dla 1000 Hz wynosi 130 Hz, dlatego np. szum o poziomie 70 db/erb wywołuje próg maskowania równy ok. 70 db SPL. Progi maskowania na tle szumu TEN wyrażone w db SPL, dla poziomów TEN równych 30, 50 i 70 db/erb, uśrednione dla słuchaczy normalnie słyszących, przedstawione są na rysunku 2. Rys. 1. Widmo szumu TEN dla poziomu/erb równego 70 db (Moore i in., 2000b). 7

WPROWADZENIE Próg maskowania nietypowo podwyższony dla pewnej częstotliwości uważany jest za wskaźnik występowania martwego pola w tym miejscu. Na przykład, jeśli próg maskowania na tle szumu zrównującego próg (TEN) jest o 10 db lub więcej wyższy niż poziom TEN/ERB, oraz szum zrównujący próg (TEN) daje 10 db lub więcej maskowania, to jest to wskaźnikiem do występowania martwego pola dla częstotliwości równej częstotliwości sygnału testowego. Drugą, dokładniejszą, lecz niestety dość czasochłonną metodą diagnostyczną, jest pomiar psychofizycznych krzywych strojenia, tzw. PTC (z ang. Psychophysical Tuning Curve). Rys. 2. Progi maskowania na tle szumu TEN, wyrażone w db SPL, dla poziomów szumu TEN równych 30, 50, i 70 db/erb, uśrednione dla słuchaczy normalnie słyszących (Moore i in., 2000b). Aby wyznaczyć psychofizyczną krzywą strojenia należy poziom sygnału maskowanego ustalić na 10 db SL 2 dla danej częstotliwości. Maskerem może być albo sygnał sinusoidalny, albo wąskie pasmo szumu. Gdy maskerem jest sygnał sinusoidalny, wówczas pomiędzy sygnałem i maskerem występują dudnienia, wskazujące na obecność sygnału. 2 SL z ang. Sensation Level poziom dźwięku powyżej progu słuchu danego słuchacza dla danej częstotliwości. 8

WPROWADZENIE Efektywność dudnień, jako symptomu obecności sygnału, zmienia się z odstępem częstotliwości pomiędzy sygnałem a maskerem, ponieważ powolne dudnienia (występujące dla małych różnic częstotliwości) są wykrywane łatwiej niż dudnienia szybkie. Ta zmieniająca się czułość na dudnienia zaburza jedno z założeń modelu maskowania opartego na widmie mocy. Problemu tego można uniknąć poprzez zastosowanie jako maskera szumu wąskopasmowego. Wewnętrzne fluktuacje amplitudy takiego szumu zapobiegają detekcji dudnień. Dla każdej z kilku częstotliwości maskera dobiera się jego poziom tak, by zaledwie maskować sygnał. Ponieważ poziom sygnału jest bardzo niski, więc zakłada się, że sygnał ten pobudza tylko jeden filtr słuchowy. Zakłada się także, że na progu detekcji sygnału masker wywołuje stałą odpowiedź tego filtru, wystarczającą, by maskować stały sygnał. Dla normalnie słyszących osób, wierzchołek PTC (tzn. częstotliwość, dla której poziom maskera jest najniższy) zawsze leży blisko częstotliwości sygnału maskowanego (Moore, 1978). Gdy wierzchołek PTC jest przesunięty od częstotliwości sygnału (Moore i in., 2000b; Moore, 2001) oznacza to, że sygnał wykrywany jest przez wewnętrzne komórki rzęsate przyległe do martwego pola. Psychofizyczne krzywe strojenia dostarczają użytecznego sposobu wykrywania martwego pola i definiowania jego granic. Gdy wierzchołek psychofizycznej krzywej strojenia (PTC) jest znacznie przesunięty (więcej niż kilkaset Hz) od częstotliwości sygnału testowego, wówczas częstotliwość, dla której przypada wierzchołek psychofizycznej krzywej strojenia (PTC), wskazuje granicę martwego pola. Jeśli częstotliwość sygnału oddalona jest tylko o kilkaset Hz od częstotliwości granicznej martwego pola, wówczas wierzchołek psychofizycznej krzywej strojenia (PTC) może nie wskazywać poprawnie jego granicy (Moore, 2001). I.5. Percepcja dźwięków nie będących mową przez osoby z niedosłuchem typu martwe pola Tony o częstotliwościach przypadających na zakres martwego pola, percypowane przez osoby z niedosłuchem typu martwe pola, często opisywane są jako brzmiące bardzo nieczysto, jako zniekształcone, czy nawet szumowe. Badania przeprowadzone przez Huss i in. (2000) wskazują, że percypowanie tonów jako brzmiących szumowo, przez osoby z odbiorczym niedosłuchem, często związane jest z 9

WPROWADZENIE występowaniem u tych osób martwych pól. Uwagi słuchaczy na temat szumowego brzmienia tonów mogą być uważane jako wskazówki na temat obecności martwego pola, lecz nie mają one wartości diagnostycznej. Dopasowanie wysokości (tonu w jednym tylko uchu) jest często bardzo nieregularne, a próg różnicowy częstotliwości tzw. DLF (z ang. Difference Limens for Frequency, tzn. odstęp pomiędzy tonami w dziedzinie częstotliwości, dla którego słuchacz osiąga zadany procent poprawnych odpowiedzi, np. 75 %), dla tonów, których częstotliwości przypadają na zakres martwego pola jest stosunkowo wysoki. Wskazuje to na fakt, iż tony o częstotliwościach przypadających na zakres martwego pola, nie wywołują tzw. normalnej percepcji wysokości. Binauralne dopasowanie wysokości pomiędzy uszami dla słuchaczy z asymetrycznym niedosłuchem typu martwe pola, wskazuje, że tony o częstotliwościach przypadających na zakres martwego pola czasami spostrzegane są jako dźwięki o normalnej wysokości (Florentine i Houstma, 1983; Turner i in., 1983), a czasami jako dźwięki o wysokości zupełnie różnej od normalnej (Huss i in., 2000). Badania przeprowadzone przez McDermotta i in. (1998), na osobach z niedosłuchem typu martwe pola w zakresie dużych częstotliwości, dotyczące wyznaczania krzywych równej głośności, wykazały obecność zjawiska super-recruitment (nadmiernego wyrównania głośności). Dla tonów o częstotliwościach przypadających na zakres martwego pola, krzywe równej głośności leżały bardzo blisko siebie, co wskazuje na bardzo szybki wzrost głośności wraz ze wzrostem poziomu natężenia dźwięku, czyli na bardzo mały zakres dynamiki. I.6. Percepcja mowy przez osoby z niedosłuchem typu martwe pola Przeprowadzono wiele badań dotyczących percepcji mowy przez osoby z martwymi polami w zakresie małych częstotliwości (Thornton i Abbas, 1980), które wskazują na fakt, że osoby z tego typu niedosłuchem mogą wykorzystać tylko ograniczoną ilość informacji zawartych w paśmie małych częstotliwości sygnału mowy. Jest to jednocześnie wskazówką, że jednak pewna ilość informacji, zawartych w paśmie małych częstotliwości może być percypowana za pomocą wewnętrznych komórek rzęsatych i neuronów strojonych na średnie i duże częstotliwości. 10

WPROWADZENIE Istnieje wiele publikacji sugerujących, że osoby z głębokim niedosłuchem w zakresie dużych częstotliwości nie wykorzystują informacji zawartych w paśmie dużych częstotliwości sygnału mowy, a czasami percypują nawet gorzej w warunkach wzmocnienia dźwięków z zakresu tego pasma (Villchur, 1973; Moore i in., 1985; Hogan i Turner, 1998; Ching i in., 1998; Vickers i in., 2000). Murray i Byrne (1986) przetestowali pięciu słuchaczy z prawie normalnym słuchem do 1000 Hz i niedosłuchem od 65 do 80 db HL pomiędzy 4000 i 8000 Hz. Prezentowali oni mowę ciągłą wzmocnioną wg reguły NAL(R) 3 (Byrne i Dillon, 1986). Wzmocnienie określone było dla każdego ucha indywidualnie. Następnie mowa poddana była dolnoprzepustowemu filtrowaniu o częstotliwościach odcięcia równych 4.5, 3.5, 2.5, lub 1.5 khz. i prezentowana na tle szumu mowopodobnego tzw. SSN (z ang. Speech Shaped Noise). Poziom wejściowy szumu ustalony był na 70 dba. Zadanie słuchaczy polegało na takim dopasowaniu poziomu mowy, aby 50 % prezentowanej mowy mogło być zrozumiałe. Tak ustalony poziom mowy określony został jako próg rozumienia mowy tzw. SRT 4 (z ang. Speech Reception Threshold). Trzech z pięciu przetestowanych słuchaczy wykazało tendencję lepszego rozumienia mowy (niższa wartość progu rozumienia mowy, tzw. SRT) poddanej dolnoprzepusotwemu filtrowaniu o częstotliwości odcięcia filtru dolnoprzepustowego równej 2.5 khz lub 3.5 khz, niż mowy filtrowanej za pomocą filtru dolnoprzepustowego o częstotliwości odcięcia równej 4.5 khz. Dla pozostałych dwóch słuchaczy zaobserwowano niewielką tylko zmianę progu rozumienia mowy, tzw. SRT, spowodowaną zmniejszeniem częstotliwości odcięcia filtru dolnoprzepustowego z 4.5 khz na 2.5 khz. Wyniki te wskazują na fakt, że dla osób ze średnim do głębokiego niedosłuchu w zakresie dużych częstotliwości, wzmocnienie dźwięków z zakresu tych częstotliwości nie zawsze jest korzystne, a czasami może nawet pogarszać rozumienie mowy prezentowanej na tle szumu mowopodobnego. 3 NAL(R) metoda dopasowania aparatów słuchowych (skrót pochodzi od nazwy laboratorium, w którym została opracowana, tj. National Acoustic Labolatory, Australien). Zakłada ona, że wyliczane wzmocnienie zapewni pacjentowi z aparatem słuchowym dla całego pasma widma mowy optymalny poziom odsłuchu mowy. Wartości wzmocnienia dla kolejnych częstotliwości uwzględniają przebieg progu słyszalności w paśmie 500 2000 Hz (Hojan, 1997). 4 SRT z ang. Speech Reception Threshold próg, przy którym badany prawidłowo powtarza 50% elementów testu (Demenko i Pruszewicz, 1994). 11

CEL PRACY Hogan i Turner (1998) przetestowali dziewięciu słuchaczy z prawie normalnym słuchem w zakresie małych częstotliwości i niedosłuchem sięgającym od 40 do 110 db HL w zakresie dużych częstotliwości. Słuchacze proszeni byli o identyfikowanie logatomów, poddanych dolnoprzepustowemu filtrowaniu o różnych częstotliwościach odcięcia filtru dolnoprzepustowego. Dla osób z niedosłuchem do 40 db HL w zakresie dużych częstotliwości, wzmocnienie pasma tych częstotliwości, dostarczało takich samych korzyści jak w przypadku osób ze słuchem normalnym. Natomiast dla osób z niedosłuchem w zakresie dużych częstotliwości, powyżej 55 db HL, zwiększanie częstotliwości odcięcia filtru dolnoprzepustowego wiązało się z niewielką poprawą wyrazistości logatomowej, a czasami nawet powodowało jej pogorszenie. Ching, Dillon i Byrne (1998) przetestowali czternastu normalnie słyszących słuchaczy i czterdziestu słuchaczy z odbiorczym niedosłuchem. Dziewiętnastu z nich miało średni niedosłuch (średni ubytek dla 0.5, 1 i 2 khz był mniejszy od 65 db HL). Dwudziestu jeden słuchaczy miało głęboki niedosłuch (średni ubytek dla 0.5, 1 i 2 khz był powyżej 65 db HL). Badali oni związek pomiędzy słyszalnością i zrozumiałością mowy. W tym celu porównali zmierzony procent poprawnych odpowiedzi na filtrowaną mowę, z wartościami oszacowanymi na podstawie Indeksu Zrozumiałości Mowy tzw. SII (z ang. Speech Intelligibility Index). Uzyskane wyniki wykazały, że dla wielu osób z uszkodzonym słuchem zrozumiałość mowy, nie zależy tylko od jej słyszalności, czyli prezentowania jej o poziomie wyższym od progu słuchu słuchacza, lecz zależy również od wielu innych czynników mających znacznie większe znaczenie. Dane te sugerują również, że dla osób z głębokim niedosłuchem w zakresie dużych częstotliwości, wzmocnienie dźwięków z zakresu dużych częstotliwości powinno być bardzo małe lub nawet zerowe. II. CEL PRACY Jednym z najczęstszych problemów występujących u osób z odbiorczym niedosłuchem są trudności w rozumieniu mowy. Zakres i natura tych trudności zależy od głębokości i rodzaju niedosłuchu. Ludzie, których niedosłuch związany jest z całkowitym brakiem lub dysfunkcją wewnętrznych komórek rzęsatych mają zwykle bardzo duże trudności 12

ARTYKULACYJNA KLASYFIKACJA FONEMÓW w rozumieniu mowy zwłaszcza, gdy prezentowana jest ona na tle szumu lub w hałaśliwym środowisku. Zasadniczym celem mojej pracy było wykazanie wpływu dolnoprzepustowego filtrowania na wyrazistość logatomów, które prezentowane były na tle szumu mowopodobnego, dla osób z niedosłuchem typu martwe pola w zakresie dużych częstotliwości. Sądzę, że przeprowadzone badania pozwolą mi odpowiedzieć na kilka zasadniczych pytań związanych z percepcją mowy u osób z niedosłuchem typu martwe pola, przede wszystkim określić: jaki jest wpływ wzmocnienia sygnałów o częstotliwościach przypadających na zakres martwego pola, na wyrazistość logatomową; jaki wpływ wywiera szum mowopodobny na tę wyrazistość; jaką ilość i jaki rodzaj informacji niesionych w logatomach mogą oni wykorzystać; na którą z cech artykulacyjnych filtrowanie za pomocą filtru dolnoprzepustowego ma największy wpływ, a na którą nie wywiera właściwie żadnego wpływu? Uzyskane wyniki eksperymentu mogą mieć ważne znaczenie w dziedzinie dopasowania aparatów słuchowych. Dlatego zasadniczym celem mojej pracy było określenie takiego zakresu częstotliwości, w którym wzmocnienie dźwięków poprawi wyrazistość logatomów prezentowanych na tle szumu dla osób z niedosłuchem typu martwe pola w zakresie dużych częstotliwości. Określenie takiego zakresu może pozwolić protetykowi słuchu skupić uwagę na dopasowaniu odpowiedniego wzmocnienia w tym ważnym dla poprawy zrozumiałości mowy zakresie, pomijając jednocześnie pasmo tzw. częstotliwości nieistotnych. III. ARTYKULACYJNA KLASYFIKACJA FONEMÓW 5 Najbardziej znanymi cząstkami mowy są słowa. Są one rozkładane na mniejsze cząstki, tzw. sylaby. Sylaby mogą być z kolei rozważane jako sekwencje mniejszych cząstek, tzw. głosek lub fonemów. Fonemy same w sobie nie mają żadnego znaczenia, ani nie 5 Fonem jęz. dźwięk, element systemu dźwiękowego języka, pełniący funkcję dystynktywną, tj. funkcję różnicowania znaczeń wyrazów i form wyrazowych (PWN, 1996). 13

ARTYKULACYJNA KLASYFIKACJA FONEMÓW symbolizują żadnego obiektu, ale w połączeniu z innymi fonemami pozwalają rozróżnić jedno słowo od drugiego. Łączenie fonemów daje w konsekwencji sylaby i słowa. Fonemy zdefiniowane są na podstawie tego co percypujemy, a nie na podstawie przebiegów akustycznych. Język angielski zawiera około 40 różnych fonemów, w języku polskim natomiast wyróżnia się 37 fonemów (Jassem, 1973). Dźwięki mowy wytwarzane są w tzw. aparacie głosowym, którego zasadniczymi elementami są płuca, tchawica, krtań (zawierająca fałdy głosowe), gardło, nos, jama nosowa oraz usta. Część drogi głosowej leżącą powyżej krtani nazywa się kanałem głosowym. Kształt jego przekroju poprzecznego może się znacznie zmieniać pod wpływem ruchów języka, warg i szczęki. Przestrzeń pomiędzy fałdami głosowymi nazywa się głośnią. Fałdy głosowe mogą się otwierać i zamykać, zmieniając w ten sposób rozmiary głośni, co wpływa na przepływ powietrza z płuc. Dźwięk wytwarzany w trakcie wydostawania się powietrza z płuc przez fałdy głosowe, które wykonują szybkie ruchy (periodyczne lub quasi-periodyczne) zamykające i otwierające głośnię, nazywa się tonem krtaniowym. Dźwięki wytwarzane poprzez drgania fałdów głosowych nazywa się dźwięcznymi. Tony krtaniowe są dźwiękami periodycznymi o dość małej częstotliwości podstawowej, zawierającymi harmoniczne ze znacznego zakresu częstotliwości. Większa część energii tonu krtaniowego przypada na składowe o małych częstotliwościach. Widmo tego sygnału jest następnie modyfikowane przez kanał głosowy. Kanał głosowy zachowuje się jak układ filtrów o określonych częstotliwościach rezonansowych (formantach). Formanty zostały ponumerowane: formant o najmniejszej częstotliwości jest nazywany pierwszym formantem (F1), następny drugim formantem (F2) itd. Częstotliwość środkowa każdego z formantów jest inna i ściśle związana jest z kształtem kanału głosowego. III.1. Samogłoski Samogłoski są to takie fonemy, które powstają podczas swobodnego przepływu powietrza wzdłuż środkowej linii języka. Są one zazwyczaj dźwięczne (mogą być także szeptane), a ich formanty są dość stabilne w czasie. Ogólna klasyfikacja samogłosek oparta jest na układzie tzw. samogłosek podstawowych. Język wewnątrz jamy ustnej może 14

ARTYKULACYJNA KLASYFIKACJA FONEMÓW przybierać różne położenia, kształt jego powierzchni jest takiego rodzaju, iż zawsze wyznaczyć można określone miejsce, w którym środkowa lub tylna jego część jest najsilniej wzniesiona. Wyróżnia się cztery pozycje skrajne. Skrajnie przednią i zarazem skrajnie wysoką w tej pozycji wybrzuszenie powierzchni języka powstaje w jego części środkowej, /i/ np. pol. igła. Skrajnie przednią i zarazem skrajnie niską wybrzuszenie powierzchni języka powstaje w jego części środkowej z tym, że wynikające z jego budowy anatomicznej wybrzuszenie znajduje się możliwie w jak najbardziej przedniej części jamy ustnej, /a/ np. pol. ala. Skrajnie tylną a zarazem skrajnie wysoką wybrzuszenie języka powstaje w jak najbardziej tylnej części jamy ustnej i wzniesione jest jak najwyżej w górę, /α/. Skrajnie tylną i zarazem skrajnie niską język spoczywa jak najniżej w jamie ustnej, z tym że wybrzuszenie powstaje w jak najbardziej tylnej jego części, /ш/. III.2. Spółgłoski Spółgłoski wytwarzane są w wyniku zawężania lub zaciskania pewnych części kanału głosowego. Dźwięki takie dzielą się na wiele różnych rodzajów w zależności od natury i miejsca zwężenia. Wyróżnia się spółgłoski zwarte, trące, zwarto-trące (afrykaty), nosowe, boczne i drżące Istotą spółgłosek zwartych jest to, że na krótki moment wydobywające się z płuc powietrze zostaje całkowicie zatrzymane. Ponieważ jednak wydychanie powietrza nie ustaje, powstaje w określonym miejscu nadciśnienie. W większości przypadków narządy mowy po tym krótkim momencie blokady zwanym zwarciem, raptownie się rozchylają i wtedy powstaje niezwykle krótki (trwający ok. 10 msek.) dźwięk, określany mianem plozji. Podczas artykulacji wszystkich spółgłosek zwartych, z jednym wyjątkiem, podniebienie miękkie jest uniesione, zmykając jamę nosową. Poszczególne rodzaje spółgłosek zwartych klasyfikuje się według tego, gdzie blokowane jest ujście powietrza przez jamę ustną. Spółgłoski zwarte wargowe blokadę ustną tworzą wargi, np. pol. pas, bas; ang. pet, bet. 15

ARTYKULACYJNA KLASYFIKACJA FONEMÓW Spółgłoski zwarte zębowe blokadę ustną tworzy przedni brzeg języka w zetknięciu z przednimi zębami oraz boczne brzegi języka w zetknięciu z zębami i dziąsłem górnej szczęki, pol. tom, dom. Spółgłoski zwarte dziąsłowe blokada ustna jak przy zębowych, lecz przedni brzeg języka styka się z dziąsłami przednich zębów górnej szczęki, np. pol. trzeba, drzewo, ang. two, do. Spółgłoski zwarte cerebralne blokada podobna jak przy spółgłoskach zwartych dziąsłowych, lecz przedni brzeg języka silnie uniesiony w górę tworzy zwarcie z twardym podniebieniem, np. szwedzkie snart, bord. Spółgłoski zwarte podniebienne (środkowojęzykowe) blokadę tworzy środkowa część języka w zwarciu z podniebieniem, np. pol. kino, ginąć. Spółgłoski zwarte tylnojęzykowe blokadę tworzą więzadła głosowe. Podniebienie miękkie z reguły blokuje drogę do jamy nosowej. Istnieje tylko fonem bezdźwięczny, gdyż więzadła głosowe są aż do momentu plozji zwarte, a zatem nie mogą wykonywać ruchu drgającego. Artykulacja taka, jak przy spółgłosce zwartej krtaniowej jest używana w języku polskim, jednakże nie stanowi ona tutaj oddzielnej głoski, a jedynie segment lub zespół dwóch segmentów (zwarcie i plozja) wchodzących w skład samogłoski. Dlatego w odniesieniu do języka polskiego mówi się o zwarciu krtaniowym, a nie o zwartej spółgłosce krtaniowej. Zwarcie krtaniowe występuje w języku polskim regularnie przed samogłoską w nagłosie, tzn. w pozycji początkowej po przerwie, np. ojciec, as, idę, wymawianych oddzielnie. Zwarcie krtaniowe w języku polskim występuje również na końcu wyrazu w kilku przypadkach: w wyrazie nie wymówionym z naciskiem oraz w pseudowyrazie ee, wyrażającym niechęć, zniecierpliwienie lub zlekceważenie. Plozja zwarcia krtaniowego jest szczególnie wyraźnie słyszalna w szepcie. Jako samodzielna głoska reprezentująca określony fonem występuje spółgłoska zwarta krtaniowa w licznych formach brytyjskiej angielszczyzny potocznej i regionalnej w takich wyrazach, jak: mutton, rotten. Spółgłoski zwarte mogą być dźwięczne (/b/, /d/, /g/) lub bezdźwięczne (/p/, /t/, /k/). Dla spółgłosek zwartych dźwięcznych więzadła głosowe drgają tuż przed momentem otwarcia kanału głosowego lub w momencie jego otwierania; mogą jednak również drgać w czasie zamknięcia. Dla spółgłosek zwartych bezdźwięcznych więzadła głosowe nie drgają w czasie zamknięcia oraz przez chwilę po uwolnieniu. Spółgłoski trące ( szczelinowe ) powstają, gdy cząsteczki powietrza zostają wprowadzone w nieregularne ruchy wirowe wywołujące drgania o charakterze szumu. 16

ARTYKULACYJNA KLASYFIKACJA FONEMÓW Spółgłoski te mają charakter szumu i mogą zawierać wyłącznie szum (jak w /s/) lub też mogą zawierać szum wraz z tonem krtaniowym jak w /z/ i /v/ będących dźwięcznymi odpowiednikami /s/ i /f/. W zależności od m i ej sca, w którym powstaje szum, rozróżnia się znaczną liczbę spółgłosek trących: Spółgłoski trące dwuwargowe szczelina powstaje między bardzo nieznacznie rozchylonymi wargami. Izolowaną spółgłoskę bezdźwięczną trącą dwuwargową wymawia się gasząc dmuchnięciem świecę. Spółgłoski trące zębowo-wargowe szczelina tworzy się między górnymi siekaczami a dolną wargą, np. pol. frak, wrak, ang. file, vile. Spółgłoski trące zębowe szczelina powstaje między przednim brzegiem języka a górnymi siekaczami, np. ang. thin, though. Spółgłoski trące zazębowe szczelina powstaje między przodem języka a górnymi siekaczami oraz tuż za nimi, np. pol. kosa, koza. Spółgłoski trące dziąsłowe podłużna szczelina powstaje między górnym dziąsłem ponad siekaczami a przednią częścią języka, np. ang. so, zoo. Spółgłoski trące cerebralne szczelina powstaje pomiędzy przednim brzegiem silnie w górę wygiętego języka a przednią częścią podniebienia twardego, np. try, dry. Spółgłoski trące zadziąsłowe podłużna szczelina powstaje między przednią częścią podniebienia twardego tuż za dziąsłem górnym siekaczy oraz wklęsłością wzdłuż środkowej linii przodu języka, np. pol. szary, żar. Spółgłoski trące środkowojęzykowo-dziąsłowe długa szczelina powstaje pomiędzy przednią oraz środkową częścią języka a przednią częścią podniebienia twardego, np. ang. pressure, measure. Spółgłoski trące dziąsłowo-środkowojęzykowe szczelina powstaje nieco bardziej w tyle niż przy środkowojęzykowo-dziąsłowych, np. pol. siano, ziarno. Spółgłoski trące środkowojęzykowe szczelina powstaje pomiędzy środkową częścią języka a pograniczem między podniebieniem twardym i miękkim. Spółgłoski trące tylnojęzykowe szczelina powstaje między tylną częścią języka z podniebieniem miękkim, np. niech przyjdzie, niech będzie. Spółgłoski trące języczkowe szczelina powstaje między tylną częścią języka a języczkiem, np. w niemieckim lachen, groβ. Spółgłoska zwarto-trąca (afrykaty) składa się z zespołu kolejnych segmentów wchodzących w skład głoski zwartej oraz trącej. W takiej głosce można wyróżnić najpierw element zwarcia artykulacyjnego, a następnie element analogiczny do głoski trącej, lecz 17

ARTYKULACYJNA KLASYFIKACJA FONEMÓW z reguły krótszy. Oba elementy mają to samo miejsce artykulacji. W wielu językach brak jest w ogóle głosek zwarto-trących, np. we francuskim, w innych np. w angielskim, uważane są za zestawienie głosek: zwarta plus trąca. Spośród stosunkowo lepiej zbadanych fonetycznie języków europejskich polski wykazuje największą liczbę głosek zwarto-trących sześć: zazębowe, np. praca, sadza; dziąsłowe, np. płaszczyk, móżdżek; dziąsłowo-środkowojęzykowe, np. ciało, działo. Istotą natomiast spółgłosek nosowych jest to, że wydobywające się z płuc powietrze uchodzi wyłącznie poprzez jamę nosową. Część powietrza dociera również do jamy ustnej, odbywając w ten sposób podróż okrężną. Podniebienie miękkie, zakończone języczkiem, które w przypadku spółgłosek zwartych i trących jest podniesione, blokując w ten sposób drogę do jamy nosowej, przy artykulacji spółgłosek nosowych jest opuszczone w dół. Wyróżnia się: Spółgłoski nosowe dwuwargowe, np. pol. matka, ang. mother Spółgłoski nosowe zębowe, np. pol. nos Spółgłoski nosowe dziąsłowe, np. pol. tęcza Spółgłoski cerebralne nosowe, występuje w językach aryjskich używanych w Indii Spółgłoski nosowe dziąsłowo-środkowojęzykowe, np. pol. kręcić Spółgłoski nosowe środkowojęzykowe, np. pol. miękki Spółgłoski nosowe tylnojęzykowe, np. pol. ręka, ang. long Wspólną cechą spółgłosek bocznych jest to, że powietrze uchodzi przez jamę ustną bokiem (bądź jedną stroną prawą lub lewą, bądź po obu stronach). Zablokowana jest przy tym całkowicie jama nosowa poprzez uniesienie podniebienia miękkiego, jak przy artykulacji głosek zwartych lub trących. Język blokuje centralną drogę wzdłuż środkowej linii jamy ustnej. W zależności od tego, która część języka wykonuje tę czynność, rozróżnia się następujące odmiany: Spółgłoska boczna zębowa, np. pol. las Spółgłoska boczna dziąsłowa, np. pol. kolczyk Spółgłoska boczna cerebralna, występuje w różnych językach aryjskich Indii Spółgłoska boczna środkowojęzykowa, np. pol. włos Spółgłoski boczne zębowe i dziąsłowe dzielą się poza tym na dwie odmiany, tzw. ciemna i jasną. Przy odmianie jasnej, środkowa i tylna część języka przybiera pozycję względnie płaską, natomiast przy ciemnej tył języka wzniesiony jest w górę. Wszystkie powyższe spółgłoski były jasne. Ciemne zębowe, np. w polskiej wymowie scenicznej i recytacyjnej np. łza; dziąsłowa boczna ciemna występuje w języku angielskim, np. call. 18

METODA Spośród głosek używanych w języku polskim i innych bardziej znanych językach europejskich wymienić należy również jeszcze dwie odmiany spółgłoski drżącej: /r/ przedniojęzykowa oraz /R/ języczkowa. Obie głoski powstają przez wprowadzenie w dość wolne (rzędu 25 na sekundę) drgania bądź przodu języka opartego na dziąsłach ponad siekaczami, bądź języczka wspartego na tyle języka, (Jassem, 1973). Przedstawione powyżej różne klasy spółgłosek różnią się od siebie sposobem ich wytwarzania. Sposób artykulacji odnosi się do stopnia i typu przewężenia kanału głosowego. Dodatkowe różnice pomiędzy spółgłoskami w obrębie każdej z klas związane są z miejscem artykulacji (tzn. miejscem, w którym występuje maksymalne przewężenie, np. w okolicy zębów, warg, podniebienia). Wszystkie te różnice odzwierciedlone są we właściwościach akustycznych dźwięku mowy, co ujawnia jego widmo. IV. METODA IV.1. Słuchacze W ramach przeprowadzonego eksperymentu przetestowałam dziesięciu słuchaczy (16 uszu) z wysokoczęstotliwościowym ubytkiem słuchu. Wyniki badań audiometrycznych testowanych uszu przedstawione są w tabeli I, która pokazuje również wiek słuchaczy. Niedosłuch słuchaczy zdiagnozowany był jako odbiorczy na podstawie braku większych niż 10 db różnic pomiędzy krzywą przewodnictwa kostnego i przewodnictwa powietrznego w audiometrii tonalnej. Obecność i zakres martwych pól określone zostały przez pomiar psychofizycznych krzywych strojenia (używając słuchawek Sennheiser HD580), w sposób opisany przez Moore a i in. (2000b). Gdy częstotliwość odpowiadająca wierzchołkowi PTC przesunięta była względem częstotliwości sygnału testowego, wówczas częstotliwość, dla której przypadał wierzchołek PTC, traktowana była jako częstotliwość graniczna martwego pola. W celu potwierdzenia występowania i zakresu martwych pól, dla wszystkich słuchaczy przeprowadzony został również test TEN. Progi maskowania na tle szumu zrównującego próg (TEN) wyznaczone zostały w sposób opisany przez Moore a i in., (2000b) (używając słuchawek TDH49). Jeśli dla pewnej częstotliwości sygnału testowego, 19

METODA próg maskowania na tle szumu zrównującego próg (TEN) był o 10 db lub więcej wyższy od poziomu szumu TEN przypadającego na 1 ERB o częstotliwości środkowej 1000 Hz i szum TEN produkował przynajmniej 10 db maskowania dla przynajmniej jednego poziomu maskera, to traktowane to było jako wskaźnik występowania martwego pola dla częstotliwości równej częstotliwości sygnału testowego. Tabela I. Progi przewodnictwa powietrznego uzyskane w audiometrii tonalnej dla testowanych słuchaczy, w db HL. Symbol * wskazuje częstotliwości przypadające na zakres wyznaczonego martwego pola. Symbol wskazuje, że próg przewodnictwa powietrznego był niemierzalny. Pokazano również wiek słuchaczy. Częstotliwość, khz Słuchacz Ucho Wiek 0.25 0.5 0.75 1.0 1.5 2.0 3.0 4.0 6.0 8.0 JC L 82 10 5 20 30 35 35 50 60 70 JC R 20 10 20 30 35 40 40 60 70 KC L 65 10 10 10 40 65 70 75 70 65 KC R 10 10 10 15 45 60 60 60 55 VW L 73 50 60 70 60 70 60 65 VW R 40 55 70 75 65 75 85 75 90 MR L 49 5 0 25 55 60 60 45 40 30 MR R 5 0 10 65 75 70 65 55 45 DT L 76 25 15 15 45 45 50 DT R 20 10 5 60 65 60 60 CA L 55 25 30 45 65* 110* * * * * * MW L 62 30 55 60 65 85* 105* 105* 100* * * RC L 71 15 10 5 60* 75* 105* 90* LR R 48 10 55 65 80 90* 110* 95* * * NC L 76 20 25 30 35 60* 70* 95* 110* * * NC R 25 25 55 70* 90* 95* 95* 110* * * Wyniki uzyskane za pomocą testu TEN zawsze pokrywały się z wynikami otrzymanymi z pomiaru psychofizycznych krzywych strojenia (PTC). Przykłady psychofizycznych 20

METODA krzywych strojenia i wyniki testu TEN (dla słuchaczy MR-L 6, DT-L, KC-P, KC-L, CA-L, RC-L) zamieszczone są w Dodatku 1. Wartości psychofizycznych krzywych strojenia (PTC) oraz testu TEN uzyskane zostały przez Huss (prywatna konsultacja). Pięciu z dziesięciu testowanych słuchaczy miało niedosłuch typu martwe pola. Wyniki audiometrii tonalnej wskazują na występowanie głębszego ubytku słuchu dla tych słuchaczy niż dla słuchaczy z wysokoczęstotliwościowym niedosłuchem bez martwych pól. Częstotliwości przypadające na zdiagnozowane martwe pola pokazane zostały w tabeli I i zaznaczone symbolem *. Częstotliwości graniczne martwych pól uzyskane z pomiarów PTCs, oraz testu TEN zostały zaznaczone również na rysunku 7 za pomocą strzałek. Dla wszystkich słuchaczy, martwe pole rozciągało się od wyznaczonej częstotliwości granicznej aż do najwyższej testowanej częstotliwości (10 khz). Każde ucho testowane było osobno. Ogólnie, przetestowanych zostało sześć uszu słuchaczy z martwymi polami, oraz dziesięć uszu słuchaczy bez martwych pól. IV.2. Materiał testowy i warunki przeprowadzonego eksperymentu Słuchacze testowani byli przy użyciu logatomów (sylab nie niosących żadnej informacji) typu VCV (z ang. Vowel Consonant Vowel), utworzonych z trzech samogłosek (/i/, /a/, /u/) i 21 różnych spółgłosek (/p, t, k, b, d, g, f, th, s, sh, h, v, z, r, l, y, w, ch, j, n, m/). Początkowa samogłoska była zawsze taka sama jak samogłoska końcowa, np. iti, ata, utu, imi, ama, umu. Każda kombinacja samogłoski i spółgłoski prezentowana była raz w każdej z dwunastu list w sposób przypadkowy, dając w sumie 63 logatomy na listę. Kolejność logatomów w poszczególnych listach była różna. Logatomy wypowiadane były przez spikera płci żeńskiej z południowo-brytyjskim akcentem. Wszystkie listy nagrane były na jeden kanał CD (płyty kompaktowej) i odtwarzane z tego CD (płyty kompaktowej) w celu prezentacji ich słuchaczom. Logatomy prezentowane były na tle szerokopasmowego szumu mowopodobnego (szerokość pasma 7500 Hz), którego długoterminowe widmo było takie samo jak widmo mowy (tzn. widmo logatomów typu VCV). Poziom wejściowy szumu i logatomów 6 MR-L MR inicjały słuchacza, L- ucho lewe (P ucho prawe). 21

METODA wynosił 65 db SPL. Względny poziom szumu (względem poziomu wejściowego logatomów) zależny był od wybranego w danej prezentacji stosunku sygnału do szumu, tzw. SNR (z ang. Signal to Noise Ratio). Następnie zarówno szum jak i logatomy poddane zostały wzmocnieniu, którego wartość zależy od częstotliwości oraz od niedosłuchu słuchacza. Wartość tego wzmocnienia określona jest przez regułę Cambridge : IG ( f ) = 0.48HL( f ) + INT (2) gdzie IG(ƒ) jest skutecznym wzmocnieniem akustycznym aparatu słuchowego w db dla częstotliwości ƒ, HL(ƒ) jest ubytkiem słuchu w db dla częstotliwości ƒ, INT jest stałą zależną od częstotliwości. Wartości INT dla każdej częstotliwości audiometrycznej podane są w tabeli II. Ze względu na ograniczenie wzmocnienia w aparatach słuchowych do 5 khz, INT podane są tylko do tej częstotliwości (Peters i in., 2000). Tabela II. Wartości stałej INT w formule Cambridge dla każdej z częstotliwości audiometrycznych (khz), (Peters i in., 2000). Częstotliwość 0.125 0.25 0.5 0.75 1.0 1.5 2.0 3.0 4.0 5.0 INT -11-10 -8-6 0-1 1-1 0 1 Celem formuły Cambridge jest nadanie mowie o poziomie 65 db SPL takiego wzmocnienia, aby jej głośność całkowita, dla słuchaczy z uszkodzonym słuchem była taka sama jak dla osób normalnie słyszących, zachowując jednocześnie założenie, aby średnia głośność właściwa 7 mowy była taka sama dla wszystkich częstotliwości z zakresu ważnego dla zrozumiałości mowy, tzn. od 400 do 5000 Hz (dla słuchaczy bez martwego pola w tym paśmie częstotliwości). Dla osób z martwym polem, głośność właściwa jest równa zero we wszystkich wstęgach krytycznych przypadających na zakres martwego pola. Celem zastosowania metody Cambridge było nadanie logatomom takiego wzmocnienia, aby możliwa była ich prezentacja o poziomie powyżej progu słuchu 7 średnia głośność właściwa - głośność przypadająca na ERB, lub wstęgę krytyczną (Moore i Glasberg, 1997) 22

METODA słuchacza, czyli aby logatomy mogły być usłyszane przez danego słuchacza, unikając jednocześnie nadmiernej głośności. Jest to bardzo ważne w przypadku osób z odbiorczym niedosłuchem. Ze względu na fakt, iż osoby te charakteryzują się bardzo małą dynamiką słuchu, tzn. dźwięki o niskim poziomie są dla tych słuchaczy niesłyszalne, natomiast dźwięki prezentowane o poziomie niewiele wyższym mogą być już zbyt głośne. Tabela III. Wartości wzmocnienia obliczone wg formuły Cambridge dla każdej z częstotliwości audiometrycznych, dla szesnastu słuchaczy. Podkreślenie wskazuje przypadki, dla których wartość wzmocnienia przekraczała 50 db. Wartość wzmocnienia wg formuły Cambridge Częstotliwość, khz Słuchacz Uch Wiek 0.25 0.5 0.75 1.0 1.5 2.0 3.0 4.0 6.0 8.0 o JC L 82-5,2-5,6 9,6 13,4 17,8 15,8 24 28,8 33,6 JC R -0,4-3,2 9,6 13,4 17,8 18,2 19,2 28,8 33,6 KC L 65-5,2-3,2 4,8 18,2 32,2 32,6 36 33,6 31,2 KC R -5,2-3,2 4,8 6,2 22,6 27,8 28,8 28,8 26,4 VW L 73 14 20,8 33,6 29,8 32,6 28,8 31,2 VW R 9,2 18,4 33,6 35 32,2 35 40,8 36 43,2 MR L 49-7,6-8 12 25,4 29,8 27,8 21,6 19,2 14,4 MR R -7,6-8 4,8 30,2 37 32,6 31,2 26,4 21,6 DT L 76 2-0,8 7,2 22,6 21,6 24 DT R -0,4-3,2 2,4 29,8 31,2 28,8 28,8 CA L 55 2 6,4 15,6 31,2 51,8 MW L 62 4,4 18,4 22,8 31,2 39,8 51,4 49,4 48 RC L 71-2,8-3,2 2,4 27,8 37 50,4 43,2 LR R 48-5,2 18,4 31,2 37,4 44,2 51,8 45,6 NC L 76-0,4 4 8,4 16,8 27,8 34,6 44,6 52,8 NC R 2 4 20,4 33,6 42,2 46,6 44,6 52,8 23

METODA Dla każdego ze słuchaczy obliczyłam wzmocnienie wg wyżej opisanej formuły Cambridge. Uzyskane wartości wzmocnienia przedstawione zostały w tabeli III. Największe zastosowane wzmocnienie wynosiło 50 db. W przypadku, gdy zgodnie z formułą Cambridge wzmocnienie powinno być większe niż 50 db, było ono wówczas ograniczane do 50 db. W praktyce, sytuacja taka występowała, tylko wtedy, gdy niedosłuch w zakresie wysokich częstotliwości wynosił 105 lub więcej db (CA-L, MW-L, RC-L, LR-R, NC-L, NC-R). Wzmocnieniu poddane zostały zarówno logatomy jak i szum, na tle którego były one prezentowane. Szum charakteryzował się tym, że jego długoterminowe widmo było takie samo jak widmo prezentowanych logatomów. Szum taki określany jest jako szum mowopodobny. Ponieważ głównym celem pracy było zbadanie wyrazistości logatomów prezentowanych na tle szumu mowopodobnego, zarówno logatomy jak i szum zostały przepuszczone przez filtr dolnoprzepustowy o różnych częstotliwościach odcięcia. Częstotliwości odcięcia filtru dolnoprzepustowego wybrane zostały indywidualnie dla każdego ze słuchaczy w taki sposób, aby pokryć zakres od zaledwie poniżej częstotliwości granicznej martwego pola (f e ), aż do częstotliwości znacznie powyżej częstotliwości granicznej martwego pola (f e ) (częstotliwości odcięcia FDP były równe: 0.8f e, 1.0f e, 1.2f e, 1.4f e oraz 1.7f e ). Dla słuchaczy bez martwych pól, częstotliwości odcięcia FDP zostały tak wybrane, aby pokryć zakres od 800 do 7500 Hz (800, 1000, 2000, 3000 i 7500 Hz). Do odpowiedniego przetworzenia logatomów i szumu użyłam układu TDT (z ang. Tucker-Davis Technologies) sterowanego za pomocą komputera typu PC. Schemat blokowy tego układu przedstawiony jest na rysunku 3. Zarówno logatomy jak i szum odtwarzane były z płyty kompaktowej (CD). Względny poziom szumu (w odniesieniu do poziomu prezentowanych logatomów) kontrolowany był za pomocą programowalnego tłumika (PA4). Przed wzmocnieniem, logatomy i szum były sumowane w sumatorze (SM3). Po wzmocnieniu były natomiast przepuszczane przez filtr dolnoprzepustowy o częstotliwości odcięcia równej 7500 Hz, a następnie przez układ PD1 zawierający 16-bitowy przetwornik analogowo cyfrowy (ADC), 6 cyfrowych procesorów (DSP) i 16-bitowy przetwornik cyfrowo analogowy (DAC). Jeden z sześciu cyfrowych procesorów DSP (z ang. Digital Signal Processor) funkcjonował jako filtr, którego charakterystyka określona była za pomocą formuły Cambridge (Camfilter), a każdy z pozostałych pięciu procesorów DSP zaprojektowany został tak by działać jako filtr dolnoprzepustowy (FDP) o zadanych częstotliwościach odcięcia, którego odpowiedź 24

METODA spadała o ponad 50 db, gdy częstotliwość zwiększana była z częstotliwości równej częstotliwości odcięcia filtru dolnoprzepustowego, na częstotliwość o 0.25 oktawy powyżej tej częstotliwości. Po przejściu przez układ PD1 bodziec był ponownie poddawany dolnoprzepustowemu filtrowaniu o częstotliwości odcięcia równej 7500 Hz (KEMO VBF8 mk4), wzmacniany w celu wyeliminowania wpływu otoczenia i w takiej postaci był ostatecznie prezentowany słuchaczowi przez słuchawki Sennheiser HD580. Rys. 3. Schemat blokowy aparatury eksperymentu. IV.3. Procedura Wszystkich słuchaczy testowałam za pomocą testu logatomowego typu VCV, prezentowanego na tle szumu mowopodobnego. Zadanie słuchaczy polegało na napisaniu usłyszanej w logatomie spółgłoski (ignorując samogłoski), np. jeśli zaprezentowanym logatomem było ata, to należało napisać t, w przypadku np. iki należało napisać k, itp. Przykładowy arkusz odpowiedzi oraz treść informacji udzielanej słuchaczowi umieszczone są w Dodatku 2. Każdemu słuchaczowi prezentowałam przez pierwszych 10 minut sesji odsłuchowej listy, które traktowane były jako listy treningowe, a uzyskane odpowiedzi nie były uwzględniane w późniejszej analizie wyników. Ostatecznie, każdemu słuchaczowi, dla każdej częstotliwości odcięcia filtru dolnoprzepustowego, prezentowałam minimum dwie listy VCV (maksymalnie pięć, gdy wyniki odbiegały od reszty uzyskanych dla danego słuchacza), które zawsze odsłuchiwane były podczas dwóch różnych sesji. Eksperyment przebiegał w dwóch etapach. Pierwszym krokiem było (korzystając z wcześniej uzyskanych w Laboratorium w Cambridge danych) wybranie takiej częstotliwości odcięcia filtru dolnoprzepustowego, dla której wyrazistość logatomów prezentowanych w ciszy była najlepsza, np. dla słuchacza RC-L z niedosłuchem typu martwe pola, wyrazistość logatomów prezentowanych w ciszy była najlepsza dla 25

METODA częstotliwości odcięcia filtru dolnoprzepustowego równej 2000 Hz, w przypadku słuchaczy bez martwych pól wybranie takiej częstotliwości odcięcia filtru dolnoprzepustowego, dla której procent poprawnych odpowiedzi wynosił ok. 70%, np. dla słuchacza MR-L częstotliwość ta wynosiła 2000 Hz. Tabele wartości, na podstawie których dokonywałam wyboru częstotliwości odcięcia filtru dolnoprzepustowego w pierwszym etapie eksperymentu, zamieszczone są w Dodatku 3 (Tabela D3-I i D3-II). Następnie dla tej częstotliwości odcięcia filtru dolnoprzepustowego zmierzyłam procent poprawnych odpowiedzi w funkcji stosunku sygnału do szumu tzw. SNR (z ang. Signal to Noise Ratio) i wybrałam taki SNR, który redukował wyrazistość logatomów o ok. 15% w porównaniu z takim samym pomiarem wykonanym w ciszy. Uzyskane w tym etapie wyniki przedstawione są w tabeli IV. Tabela IV. Procent poprawnych odpowiedzi uzyskanych w zależności od wielkości stosunku sygnału do szumu. dla każdego z testowanych uszu słuchaczy, Słuchacz Ucho Częstotl. Stosunek sygnału do szumu (SNR), db odcięcia FDP, Hz -3 0 3 5 6 7 9 10 12 15 30 W ciszy Wybrany SNR JC L 2400 48 55 59 70 3 JC R 2000 45 48 59 58 62 3 KC L 1400 48 48 54 59 59 3 KC R 1200 44 46 49 52 59 3 VW L 2000 48 53 57 60 63 3 VW R 1400 35 43 40 40 46 0 MR L 2000 50 56 63 64 71 3 MR R 2000 58 57 65 67 68 0 DT L 2000 50 49 58 59 68 6 DT R 2000 58 67 65 67 70 0 CA L 900 35 37 45 51 57 56 6 MW L 1680 21 24 23 32 33 44 6 RC L 2000 37 44 54 55 59 68 3 LR R 2000 30 31 41 45 41 42 47 0 NC L 1400 36 41 38 41 45 0 NC R 980 21 29 30 26 32 36 42 6 26