Maskowanie równoczesne

Podobne dokumenty
Przygotowała: prof. Bożena Kostek

LABORATORIUM AUDIOLOGII I AUDIOMETRII

Percepcja dźwięku. Narząd słuchu

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do

Psychoakustyka w pigułce. Aleksander Sęk Ewa Skrodzka Mariusz Marszałkiewicz

Zmysł słuchu i równowagi

Nauka o słyszeniu Wykład II System słuchowy

Nauka o słyszeniu Wykład IV Głośność dźwięku

Biologiczne mechanizmy zachowania - fizjologia. zajecia 6 :

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,

WYZNACZANIE FILTRÓW SŁUCHOWYCH METODĄ SZUMU PRZESTRAJANEGO. Karolina Kluk,

Dźwięk i słuch. Percepcja dźwięku oraz funkcjonowanie narządu słuchu

1.Stosunek sygnału do szumu kwantyzacji dla n-bitowego kwantyzatora jest równy w przybliżeniu:

Nauka o słyszeniu. Wykład III +IV Wysokość+ Głośność dźwięku

gdzie: c prędkość rozchodzenia się dźwięku w powietrzu L długość kanału słuchowego

Podstawy biofizyki zmysłu słuchu. Badanie progu pobudliwości ucha ludzkiego.

Fal podłużna. Polaryzacja fali podłużnej

a/ narząd słuchu b/ narząd statyczny

Fale dźwiękowe. Jak człowiek ocenia natężenie bodźców słuchowych? dr inż. Romuald Kędzierski

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

POMIARY AUDIOMETRYCZNE

Mapa akustyczna Torunia

Laboratorium Elektronicznej Aparatury Medycznej I

Ruch falowy. Parametry: Długość Częstotliwość Prędkość. Częstotliwość i częstość kołowa MICHAŁ MARZANTOWICZ

Instrukcja do laboratorium z Fizyki Budowli. Temat laboratorium: CZĘSTOTLIWOŚĆ

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0,

Dźwięk. Cechy dźwięku, natura światła

4.3 Wyznaczanie prędkości dźwięku w powietrzu metodą fali biegnącej(f2)

gdzie: c prędkość rozchodzenia się dźwięku w powietrzu L długość kanału słuchowego

w drgania mechaniczne, a drgania w impulsy nerwowe. Odpowiada także za zmył równowagi (błędnik).

Fale dźwiękowe - ich właściwości i klasyfikacja ze względu na ich częstotliwość. dr inż. Romuald Kędzierski

Drgania i fale sprężyste. 1/24

Teorie opisujące naturalne słyszenie przestrzenne

Wzmacniacze operacyjne

Fale akustyczne. Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość. ciśnienie atmosferyczne

5.1. Powstawanie i rozchodzenie się fal mechanicznych.

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

TEMAT: OBSERWACJA ZJAWISKA DUDNIEŃ FAL AKUSTYCZNYCH

ZASTOSOWANIE PSYCHOAKUSTYKI ORAZ AKUSTYKI ŚRODOWISKA W SYSTEMACH NAGŁOŚNIAJĄCYCH

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 SPRAWDZANIE PARAMETRÓW AUDIOMETRU TONOWEGO. AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

LABORATORIUM ELEKTROAKUSTYKI ĆWICZENIE NR 3 SPRAWDZANIE PARAMETRÓW AUDIOMETRU TONOWEGO. AUDIOMETRIA TONOWA DLA PRZEWODNICTWA POWIETRZNEGO I KOSTNEGO

voice to see with your ears

Automatyka i pomiary wielkości fizykochemicznych. Instrukcja do ćwiczenia III. Pomiar natężenia przepływu za pomocą sondy poboru ciśnienia

AKUSTYKA. Matura 2007

BADANIE PODŁUŻNYCH FAL DŹWIĘKOWYCH W PRĘTACH

Oddziaływanie hałasu na człowieka w środowisku pracy i życia, metody ograniczania. dr inż. Grzegorz Makarewicz

Wykład FIZYKA I. 11. Fale mechaniczne. Dr hab. inż. Władysław Artur Woźniak

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 14 Pomiar zniekształceń nielinearnych głośnika

CZWÓRNIKI KLASYFIKACJA CZWÓRNIKÓW.

ĆWICZENIE 5 EMC FILTRY AKTYWNE RC. 1. Wprowadzenie. f bez zakłóceń. Zasilanie FILTR Odbiornik. f zakłóceń

Nauka o słyszeniu. Wykład I Dźwięk. Anna Preis,

Wyznaczanie prędkości dźwięku w powietrzu

Analiza właściwości filtra selektywnego

A6: Wzmacniacze operacyjne w układach nieliniowych (diody)

Przetworniki cyfrowo analogowe oraz analogowo - cyfrowe

Przykładowe poziomy natężenia dźwięków występujących w środowisku człowieka: 0 db - próg słyszalności 10 db - szept 35 db - cicha muzyka 45 db -

ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI

Ćwiczenie 2: pomiar charakterystyk i częstotliwości granicznych wzmacniacza napięcia REGIONALNE CENTRUM EDUKACJI ZAWODOWEJ W BIŁGORAJU

PL B1. Politechnika Warszawska,Warszawa,PL BUP 25/03. Mateusz Turkowski,Warszawa,PL Tadeusz Strzałkowski,Warszawa,PL

Badanie widma fali akustycznej

Demodulator FM. o~ ~ I I I I I~ V

Dźwięk podstawowe wiadomości technik informatyk

Sposoby opisu i modelowania zakłóceń kanałowych

WZMACNIACZ OPERACYJNY

Własności dynamiczne przetworników pierwszego rzędu

Ćwiczenie nr 65. Badanie wzmacniacza mocy

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

Podstawy Przetwarzania Sygnałów

Aby nie uszkodzić głowicy dźwiękowej, nie wolno stosować amplitudy większej niż 2000 mv.

Statyczne badanie wzmacniacza operacyjnego - ćwiczenie 7

PRACOWNIA ELEKTRONIKI

Modele systemu słuchowego buduje się ze względu na różne motywacje. Na przykład można mówić o modelach tworzonych dla potrzeb ochrony słuchu

5 Filtry drugiego rzędu

WZMACNIACZ NAPIĘCIOWY RC

LIGA klasa 2 - styczeń 2017

Dynamiczne badanie wzmacniacza operacyjnego- ćwiczenie 8

Ma x licz ba pkt. Rodzaj/forma zadania

Zakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych

Ćwiczenie 2 LABORATORIUM ELEKTRONIKI POLITECHNIKA ŁÓDZKA KATEDRA PRZYRZĄDÓW PÓŁPRZEWODNIKOWYCH I OPTOELEKTRONICZNYCH

Budowa i zróżnicowanie neuronów - elektrofizjologia neuronu

Wzmacniacz operacyjny

WYDZIAŁ EKOLOGII LABORATORIUM FIZYCZNE

Podstawy Akustyki. Drgania normalne a fale stojące Składanie fal harmonicznych: Fale akustyczne w powietrzu Efekt Dopplera

System diagnostyki słuchu

CEL ĆWICZENIA: Celem ćwiczenia jest zapoznanie się z zastosowaniem diod i wzmacniacza operacyjnego

Terminologia, definicje, jednostki miar stosowane w badaniach audiologicznych. Jacek Sokołowski

A3 : Wzmacniacze operacyjne w układach liniowych


Przetwarzanie A/C i C/A

obszary o większej wartości zaburzenia mają ciemny odcień, a

Podstawy transmisji sygnałów

1. Po upływie jakiego czasu ciało drgające ruchem harmonicznym o okresie T = 8 s przebędzie drogę równą: a) całej amplitudzie b) czterem amplitudom?

Politechnika Warszawska

ANALIZA HARMONICZNA DŹWIĘKU SKŁADANIE DRGAŃ AKUSTYCZNYCH DUDNIENIA.

Cechy karty dzwiękowej

Jak pracują systemy implantów ślimakowych?

Projekt Inżynier mechanik zawód z przyszłością współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego

Kompresja dźwięku w standardzie MPEG-1

Transkrypt:

II Pracownia fizyczna Maskowanie równoczesne Aleksander Sęk Andrzej Wicher Instytut Akustyki UAM Poznań, 2005

WSTĘP...3 1. BUDOWA UKŁADU SŁUCHOWEGO...4 1.1. DROGA FALI AKUSTYCZNEJ W UKŁADZIE SŁUCHOWYM...4 1.2. PROCES PRZETWARZANIA...9 1.2.1. Wzmacniacz ślimakowy...9 1.2.2. Nieliniowość układu słuchowego...11 1.3. NERW SŁUCHOWY...13 2. PSYCHOFIZYKA ZMYSŁU SŁUCHU...16 2.1. MASKOWANIE...16 2.2. PRÓG SŁYSZALNOŚCI, KRZYWE RÓWNEJ GŁOŚNOŚCI...17 2.3. WSTĘGI KRYTYCZNE, FILTRY SŁUCHOWE...20 2.4. POBUDZENIE I JEGO ZWIĄZEK ZE EFEKTEM MASKOWANIA...23 3. BADANIA PSYCHOAKUSTYCZNE...25 3.1. METODY BADAWCZE...26 3.2. APARATURA...28 4. PRZEBIEG ĆWICZENIA...29 4.1. CEL...29 4.2. OPIS PROGRAMU REALIZUJĄCEGO EKSPERYMENT MASKOWANIA...29 4.3. EKSPERYMENT...32 4.4. OPRACOWANIE WYNIKÓW POMIARÓW...33 5. LITERATURA...36 2

WSTĘP Opracowanie niniejsze dotyczy ćwiczenia wykonywanego przez studentów Wydziału Fizyki UAM w ramach II Pracowni Fizycznej. Jest ono związane z psychofizycznymi właściwościami organu słuchu (układu słuchowego), a w szczególności z efektem maskowania. W ramach tego ćwiczenia studenci zapoznają się z podstawowymi zasadami funkcjonowania układu słuchowego oraz wykonują jeden z podstawowych eksperymentów psychofizycznych. Ponieważ zagadnienia związane z psychofizjologią słuchu nie są omawiane w ramach kursu licencjackiego, więc niniejsze opracowanie zawiera szereg najistotniejszych wiadomości dotyczących zarówno fizjologii, jak i psychologii słyszenia, które są niezbędne dla poznania i zrozumienia podstawowych procesów analizy dźwięku w układzie słuchowym. 3

1. BUDOWA UKŁADU SŁUCHOWEGO Rozważanie zasad funkcjonowania układu słuchowego nie jest możliwe bez opisu anatomicznej struktury tego organu. Dlatego też zmierzając do odpowiedzi na pytanie: Jak ucho zamienia mechaniczną falę akustyczną na wrażenie słuchowe? Należy przedstawić przede wszystkim zasadnicze elementy anatomii i fizjologii układu słuchowego. 1.1. Droga fali akustycznej w układzie słuchowym Zanim rozchodzące się w czasie zaburzenie ośrodka w postaci fali akustycznej wywoła wrażenie słuchowe, musi ono przebyć drogę, wiodącą od ucha zewnętrznego poprzez ucho środkowe, i dalej poprzez nerw słuchowy do pól słuchowych znajdujących się w mózgu. Małżowina Kość Kowadełko Strzemiączko Kanały półkoliste Młoteczek Okienko owalne Nerw słuchowy Okienko okrągłe Kanał słuchowy zewnętrzny Błona bębenkowa Ślimak Rys. 1.1. Peryferyjny układ słuchowy człowieka: ucho zewnętrzne, środkowe i wewnętrzne. Do ucha zewnętrznego zalicza się małżowinę uszną i przewód słuchowy zewnętrzny, których zadaniem jest przewodzenie fali akustycznej. Przewód słuchowy zewnętrzny wraz z zamykającą go błoną bębenkową tworzą komorę rezonansową wzmacniającą dźwięk w paśmie 2000-3000 Hz. Wartość tego wzmocnienia może dochodzić do 10-20 db. Odpowiednie kształty i wielkości tych elementów mają również istotne znaczenie w lokalizacji źródła dźwięku: gdyby nie ucho zewnętrzne, nie bylibyśmy w stanie zlokalizować dźwięków o częstotliwościach większych od 1500 Hz. Małżowina uszna zbudowana jest z 4

chrząstki sprężystej pokrytej skórą. W dolnej swej części małżowina uszna przechodzi w przewód słuchowy zewnętrzny. Skóra wyścielająca przewód słuchowy zewnętrzny zawiera liczne gruczoły łojowe wytwarzające woskowinę. Zasadniczym elementem ucha środkowego jest jama bębenkowa, która zawiera łańcuch kosteczek słuchowych najmniejszych kości w organizmie ludzkim. Duża elastyczność błony bębenkowej, a także znaczna wartość współczynnika tłumienia, umożliwia jej przyjmowanie i przekazywanie szybko po sobie następujące drgań. Pomiędzy ścianami jamy bębenkowej rozpięty jest łańcuch kosteczek słuchowych, do których należą: młoteczek, kowadełko i strzemiączko, zamykające swą podstawą tzw. okienko owalne ślimaka. Ich zadaniem jest transformowanie ciśnienia akustycznego fali dźwiękowej na ciśnienie mogące pobudzić do drgań płyny ślimaka, co prowadzi do wywołania wrażenia słuchowego. Jak funkcjonuje ucho środkowe? Z codziennego doświadczenia wiadomo, że gdy będąc na basenie zanurzymy głowę pod wodę to nie słyszymy głosów osób siedzących na krawędzi basenu. Fizycznie oznacza to, że opór stawiany falom akustycznym przez wodę jest większy od oporu stawianego przez powietrze, lub ściślej - że impedancja wody jest znacznie większa niż impedancja powietrza. Aby fale akustyczne wniknęły do wody należy je przetransformować w taki sposób, by istniejąca różnica impedancji przestała mieć znaczenie. Analogiczną sytuację mamy w przypadku organu słuchu: dźwięk z powietrza musi być dostarczony do wypełnionego cieczami ślimaka. Ucho środkowe pełni rolę układu transformującego drgania powietrza na drgania cieczy tak, że pomimo znacznej różnicy impedancji powietrza i cieczy ślimaka, dźwięk wytwarza wystarczające drgania cieczy ślimakowych by były one odebrane jako wrażenie słuchowe. Bez jego obecności tylko 0.1% energii fali docierającej bezpośrednio z powietrza byłaby transmitowana do ślimaka. Transformacja dźwięku dokonywana w uchu środkowym, nazywana też wyrównaniem (dopasowaniem) impedancji, polega na zwiększeniu ciśnienia wywieranego na płyn ślimakowy przez podstawę strzemiączka w stosunku do ciśnienia, działającego na błonę bębenkową, co odbywa się kosztem zmniejszenia amplitudy ruchu. Możliwe jest to m.in. dzięki różnicy powierzchni czynnych błony bębenkowej i podstawy strzemiączka, pozostających w stosunku ok. 35:1, oraz mechanizmowi dźwigniowemu, będącego rezultatem różnych długości ramion kowadełka i młoteczka, pozwalającemu na dodatkowe wzmocnienie odbieranej fali rzędu ok. 1.3 razy. Dopasowanie impedancji przez ucho środkowe jest najlepsze w zakresie średnich częstotliwości (1-4 khz) i dlatego też w tym właśnie zakresie ucho jest najbardziej czułe. Dodatkową funkcją układu kosteczek jest zabezpieczenie ślimaka przed dźwiękami o zbyt dużym natężeniu i małych częstotliwościach. Jeżeli natężenie odbieranego bodźca jest zbyt duże, to proces transmisji dźwięku może być osłabiony przez mięsień - naprężacz błony 5

bębenkowej i mięsień strzemiączkowy, które napinają się i ograniczają ruchy kosteczek słuchowych. Mechanizm ten, zwany również odruchem strzemiączkowym, jest inicjowany przez dźwięki o poziomie o ok. 80 db powyżej progu słyszalności z pewnym opóźnieniem względem początku nadmiernie głośnego dźwięku i w związku z tym nie jest, niestety, skuteczny dla dźwięków impulsowych, takich jak strzał z pistoletu, czy uderzenie młotka. Ucho wewnętrzne tworzone jest przez błędnik kostny znajdujący się w kości skroniowej. Część błędnika to kanały półkoliste związane z narządem równowagi, podczas gdy część ślimakowa z narządem słuchu. Ślimak jest zwężającą się, uformowaną z kości czaszki rurką, która zwinięta jest w formie skorupy ślimaka i ma 2 3 / 4 zwoja. Za początek ślimaka (tzw. bazę) przyjmuje się okienko owalne, do którego przylega strzemiączko. Analiza drgań cieczy i błon ślimaka jest dość trudna, jeśli dokonuje się jej na zwiniętym ślimaku, tj. takim, jakim jest on w rzeczywistości. Dlatego też drgania te ilustruje się na rozwiniętym ślimaku, co pozwala na znacznie lepszą wizualizację i pełniejsze zrozumienie procesów tam zachodzących i co nie mniej ważne, jest całkowicie zgodne z zachowaniem się nierozwiniętego ślimaka. Przekrój poprzeczny ślimaka przedstawia Rys. 1.2, a przekrój podłużny rozwiniętego ślimaka Rys. 1.3. Przez całą jego długość biegną dwie błony: podstawna i przedsionkowa (błona Reissnera), dzieląc go na 3 komory nazywane odpowiednio schodami ślimaka i bębenka oraz przewodem (kanałem) ślimakowym, które wypełnione są prawie nieściśliwymi cieczami. Schody ślimaka i schody bębenka, zawierające perylimfę, łączą się ze sobą na końcu ślimaka przez mały otwór szparę osklepka (helikotremę). Przewód ślimakowy wypełniony jest endolimfą i biegnie niezależnie wzdłuż błędnika błoniastego. Gdy okienko owalne porusza się do wewnątrz ślimaka, to chwilowa gęstość cieczy ślimaka w bezpośrednim sąsiedztwie okienka owalnego wzrasta. To zaburzenie ciśnienia rozchodzi się wzdłuż ślimaka w kierunku szpary osklepka i dalej schodami bębenka do okienka okrągłego usytuowanego poniżej okienka owalnego (patrz Rys. 1.3). Z uwagi na dość dużą prędkość fal akustycznych w cieczach, wychylenia okienek owalnego i okrągłego są niemalże w przeciwfazie: ruch okienka owalnego do wewnątrz ślimaka powoduje ruch okienka okrągłego na zewnątrz. Jest to możliwe dzięki temu, że okienko okrągłe oddziela ciecze ślimaka od powietrza zawartego w jamie bębenkowej a dźwięk dociera do ślimaka tylko poprzez okienko owalne. 6

Zaburzenie gęstości cieczy, które propaguje się w schodach bębenka i w schodach przedsionka jest przyczyną lokalnych, chwilowych różnic ciśnienia perylimfy po obu stronach błony podstawnej. Propagujące się różnice ciśnienia, powodują powstawanie fali biegnącej na błonie podstawnej, w wyniku czego błona ta podlega niewielkim odkształceniom, przemieszczającym się wraz z zaburzeniami ciśnienia perylimfy od okienka owalnego do okienka okrągłego (por. Rys. 1.3). W przypadku, gdy dźwiękiem wymuszającym jest ton (a nie pojedynczy impuls jak na Rys. 1.3), to cykliczne zagęszczenia i rozrzedzenia perylimfy, propagujące się wzdłuż ślimaka, powodują cykliczne wychylenia znacznych obszarów błony podstawnej. Jednak nie cała błona podstawna drga w jednakowym stopniu: to, która część błony podstawnej wychyla się w największym stopniu zależy od częstotliwości dźwięku, zaś amplituda tych drgań zależy od natężenia dźwięku. Rys. 1.2. Przekrój poprzeczny ślimaka ukazujący trzy jego podstawowe partycje, błonę pokrywkową oraz organ Cortiego. Błona podstawna ma 33-35 mm długości a jej właściwości fizyczne zmieniają się wzdłuż jej długości. U podstawy (tj. blisko okienka owalnego) błona ta jest wąska i sztywna, a w miarę posuwania się w kierunku wierzchołka (sąsiedztwo osklepka) staje się coraz szersza i mniej sztywna. W rezultacie położenie miejsca o największym wychyleniu zależy od częstotliwości tonu: dźwięki o dużych częstotliwościach najsilniej wzbudzają obszary w pobliżu okienka owalnego a dźwięki o małych częstotliwościach w pobliżu szpary osklepka, co schematycznie ilustruje Rys. 1.4. 7

Rys. 1.3. Podłużny przekrój rozwiniętego ślimaka. Rys. 1.4. Obwiednie wychylenia błony podstawnej w zależności od częstotliwości. Błona podstawna dokonuje więc pewnej konwersji częstotliwości sygnału na miejsce jej maksymalnego wychylenia. Mamy tu do czynienia z przyporządkowaniem częstotliwość miejsce, a sposób tego przyporządkowania jest następujący: tony o małych częstotliwościach wytwarzają maksymalne wychylenie blisko osklepka, a tony o dużych częstotliwościach blisko okienka owalnego. Dzięki temu ślimak zachowuje się tak jak analizator dźwięku: sygnał akustyczny złożony z tonów o różnych częstotliwościach i amplitudach pobudza w różnym stopniu różne obszary błony podstawnej. Natomiast każdy z jej punktów można traktować jako filtr pasmowoprzepustowy. Właściwość ślimaka, pozwalająca nam w na percepcyjne rozseparowanie dwóch tonów o różnej częstotliwości (usłyszenie dwóch różnych wysokości w dźwięku złożonym), nazywa się selektywnością częstotliwościową. Warto jednak pamiętać, że analiza dźwięku zachodząca na błonie podstawnej nie jest doskonała: jeśli częstotliwości dwóch tonów są nieznacznie, różne to mechanizm analizy dźwięku nie pozwala na ich percepcyjne rozseparowanie i słyszymy wówczas jeden dźwięk. 8

1.2. Proces przetwarzania 1.2.1. Wzmacniacz ślimakowy Aby wyjaśnić proces zamiany drgań mechanicznych na ciągi impulsów czynnościowych należy wniknąć głębiej w budowę i fizjologię ucha wewnętrznego. Mechaniczne drgania błony podstawnej są zamieniane na potencjały czynnościowe włókien nerwu słuchowego (impulsy neuronowe) w organie Cortiego usytuowanym wzdłuż całej błony podstawnej w środowisku dodatnio naładowanej endolimfy wypełniającej kanał ślimakowy. Przekrój poprzeczny organu Cortiego przedstawia Rys. 1.5. Zasadniczymi elementami tego organu, z punktu widzenia omawianych zagadnień, są komórki rzęsate wewnętrzne i zewnętrzne, umieszczone po obu stronach tzw. tunelu Cortiego oraz błona pokrywkowa. Błona Pokrywkowa Włókna eferentne Rzęski Zewnętrzne komórki rzęskowe Wewnętrzne komórki rzęskowe Komórki Hensena Włókna eferentne Włókna aferentne Błona podstawna Komórki Pillars Tunel Cortiego Tunel Nuela Rys. 1.5. Przekrój organu Cortiego. Komórki Deitersa Wewnętrzne komórki rzęskowe u ludzi umieszczone są w jednym rzędzie, po wewnętrznej stronie tunelu Cortiego. Jest ich ok. 3500, a każda z nich ma ok. 40 tzw. rzęsek formujących proste rzędy. Do każdej z tych komórek dochodzi ok. 20 neuronów aferentnych, przekazujących impulsy elektryczne ze ślimaka na wyższe piętra drogi słuchowej i dalej do mózgu. Rzęski tych komórek nie mają najprawdopodobniej bezpośredniej styczności z błoną pokrywkową, która jest utwierdzona tylko po swej jednej, wewnętrznej stronie. Ruchy błony podstawnej w górę i w dół, przedstawione schematycznie na Rys. 1.6, powodują cykliczne zbliżanie organu Cortiego i błony pokrywkowej oraz powstanie pomiędzy nimi sił ścinających. Dzięki temu bezpośredni kontakt rzęsek wewnętrznych komórek rzęskowych z błoną pokrywkową staje się bardziej możliwy i prowadzi do przeginania rzęsek raz w jedną raz w drugą stronę. Przeginanie to połączone jest z cyklicznym otwieraniem i zamykaniem kanałów znajdujących się w rzęskach, którymi do ujemnie spolaryzowanych komórek rzęskowych mogą napływać dodatnie jony potasu z endolimfy wypełniającej kanał 9

ślimakowy. Na Rys. 1.6 przedstawiono schematyczne trzy zasadnicze fazy ruchu błony podstawnej z jednoczesnym zaznaczeniem kierunku przegięcia rzęsek a na Rys. 1.7 proces otwierania i zamykania kanałów jonowych. Choć rysunek ten prezentuje zachowanie komórek rzęskowych zewnętrznych, to w dobrym stopniu oddaje on również funkcję wewnętrznych komórek rzęskowych. Wywoływane w ten sposób chwilowe zmiany potencjału komórek rzęskowych odbierane są przez synapsy włókien neuronowych i w postaci impulsów transmitowane do wyższych pięter układu słuchowego. Panuje powszechne przekonanie, że znakomita większość informacji o bodźcu akustycznym jaka dostępna jest na różnych piętrach drogi słuchowej pochodzi wyłącznie z wewnętrznych komórek rzęskowych. Rys. 1.6. Trzy fazy ruchu błony podstawnej i ich wpływ na przegięcie rzęsek. Rys. 1.7. Komórka rzęsata. Zewnętrzne komórki rzęskowe uporządkowane są w pięciu rzędach (u ludzi), umieszczonych po zewnętrznej stronie tunelu Cortiego. Jest ich ok. 25 000 a każda z nich ma 10

ok. 140 rzęsek uformowanych w kształcie litery V. Do komórek tych dochodzi ok. 1800 neuronów eferentnych tj. takich, które przekazują sygnały z mózgu. Organ Cortiego odpowiedzialny jest więc zarówno za transmisję informacji o fali dźwiękowej do mózgu jak i za zwrotną transmisję rozkazów mózgu do ucha wewnętrznego. Ponadto komórki te charakteryzują się kurczliwością pod wpływem zmiany potencjału: jeśli zwiększymy potencjał takiej komórki (która w normalnych warunkach jest spolaryzowana ujemnie) to ulegnie ona skróceniu. To właśnie kurczliwość oraz specyficzny sposób unerwienia zewnętrznych komórek rzęskowych odpowiedzialne są za wysoką czułość i dobrą selektywność częstotliwościową słuchu normalnego. Mechanizm ten funkcjonuje następująco. Jak już powiedziano, ruchy błony podstawnej w górę i w dół powodują zbliżanie się organu Cortiego i błony pokrywkowej oraz powstanie sił ścinających na styku tych organów. Siły te powodują m.in. przeginanie rzęsek zewnętrznych komórek rzęskowych raz w jedną raz w drugą stronę. Przeginanie to powoduje cykliczne otwieranie i zamykanie kanałów znajdujących się w rzęskach, którymi mogą napływać dodatnie jony potasu do ujemnie spolaryzowanych komórek rzęskowych. Ruch błony podstawnej ku górze (por. Rys. 1.7) połączony jest z otwarciem kanałów jonowych dzięki czemu jony potasu, których znaczące stężenie obserwuje się w endolimfie, napływają do zewnętrznych komórek rzęskowych. Jony te powodują wzrost potencjału komórek, a w związku z ich kurczliwością również ich skrócenie. Skrócenie to jest największe w szczytowym wychyleniu błony podstawnej, kiedy to kanały jonowe są maksymalnie otwarte. Z Rys. 1.6 łatwo wywnioskować, że skrócenie zewnętrznych komórek rzęskowych prowadzi do lepszego wzajemnego zbliżenia się wewnętrznych komórek rzęskowych (a właściwie całego organu Cortiego) i błony pokrywkowej, a więc do znacznie bardziej intensywnego ich stymulowania. W konsekwencji obserwuje się też zwiększenie liczby impulsów czynnościowych neuronów unerwiających te komórki. Jak wynika z najnowszych badań kurczliwość zewnętrznych komórek rzęskowych ma zasadnicze znaczenie zwłaszcza w przypadku najcichszych dźwięków, bowiem to właściwie dzięki temu mechanizmowi możemy je w ogóle usłyszeć. 1.2.2. Nieliniowość układu słuchowego Charakterystyka dynamiczna lub tzw. funkcja wejścia-wyjścia, opisuje dynamiczne właściwości badanego układu. Jest to zależność amplitudy sygnału na wyjściu układu od amplitudy sygnału wejściowego, przy stałej częstotliwości. Dla układu liniowego zależność ta jest liniowa. Nie wnikając w szczegółową definicje układu liniowego zapamiętajmy tylko, że jeśli amplitudy sygnału wejściowego i wyjściowego wyrazi się w mierze logarytmicznej (db), to charakterystyka jest linią prostą o kącie nachylenia 45 0 (lub inaczej: 10-cio 11

decybelowy przyrost sygnału na wejściu wywołuje również 10-cio decybelowy przyrost sygnału na wyjściu). Rys. 1.8 przedstawia charakterystyki dynamiczne punktu błony podstawnej (dla którego obserwuje się największe wychylenie dla częstotliwości 9 khz), pobudzanego do drgań sygnałami o częstotliwościach 1 i 9 khz, wyznaczone w różnych momentach czasowych od chwili podania furosemidu, leku wytwarzającego chwilowe zaburzenie czynności zewnętrznych komórek rzęskowych. Wypełnione kwadraty ilustrują funkcję wejścia-wyjścia analizowanego miejsca błony podstawnej przed podaniem leku, dla częstotliwości sygnału 9 khz. Funkcja ta charakteryzuje się znaczną nieliniowością o charakterze kompresji: duży zakres poziomu sygnału wejściowego odwzorowany jest w znacznie mniejszy zakres amplitudy prędkości drgań błony podstawnej (zmianie sygnału wejściowego o 95-20=75 db SPL odpowiada zmiana prędkości drgań błony podstawnej od40 do 9000 m/s, co jest równoważne 47 db). Rys. 1.8. Charakterystyki dynamiczne punktu błony podstawnej o częstotliwości charakterystycznej 9 khz. Największą nieliniową kompresję obserwuje się dla średnich poziomów dźwięku (40-80 db SPL). Jednak po 15 min od podania furosemidu funkcja wejścia-wyjścia (wypełnione trójkąty skierowane do góry) jest równoległa do funkcji liniowej przedstawionej na tym rysunku za pomocą linii bez żadnych punktów. Zatem furosemid spowodował zanik nieliniowych właściwości błony podstawnej oraz znacznie ograniczył funkcjonowanie wzmacniacza ślimakowego: aby teraz wywołać określoną reakcję obserwowanego punktu błony podstawnej (w tym przypadku prędkość drgań) należy zastosować znacznie większe poziomy dźwięku; tak funkcjonowałby nasz słuch gdyby funkcje zewnętrznych komórek rzęskowych były trwale uszkodzone. Nieliniowej kompresji nie stwierdzono jednak w 12

przypadku, gdy obserwowano punkt błony podstawnej nastrojony na częstotliwość 9 khz a częstotliwość sygnału pobudzającego była równa 1 khz, co dowodzi, że nieliniowość drgań błony podstawnej występuje wyłącznie w otoczeniu jej maksymalnego wychylenia. Wydaje się zatem, że wzmacniacz ślimakowy funkcjonuje w ten sposób, że wzmacnia w największym stopniu drgania błony podstawnej wywołane bardzo cichymi dźwiękami (do ok. 40 db). Powyżej tego poziomu, tj. dla dźwięków o poziomach 40-80 db, udział tego procesu staje się coraz mniej efektywny, co prowadzi do mniejszego nachylenia (kompresji) charakterystyki dynamicznej błony podstawnej. Dla dużych poziomów (powyżej 70 db) udział tego mechanizmu jest niezauważalny, dzięki czemu charakterystyka dynamiczna staje się znowu funkcją liniową. Jedną z najistotniejszych cech układu liniowego jest to, że w sygnale wyjściowym z takiego układu mogą występować tylko sygnały o częstotliwościach równych częstotliwościom sygnałów podanych na wejście. Jeśli w sygnale wyjściowym obecne będą takie sygnały, których nie ma w sygnale wejściowym, to układ jest nieliniowy. Peryferyjny układ słuchowy człowieka jest w ogólności układem nieliniowym a najbardziej spektakularną demonstracją tej nieliniowości jest możliwość dość łatwego usłyszenia zniekształceń intermodulacyjnych (tzw. tonów kombinacyjnych). Jeśli słuchamy dwutonu o częstotliwościach np. 1 i 1.2 khz, to na skutek nieliniowości naszego układu słuchowego, we wrażeniu słuchowym obecny jest także sygnał o częstotliwości ok. 0.8 khz. Nie jest to bynajmniej efekt psychologiczny: ton o częstotliwości 0.8 khz został wygenerowany przez ślimak. Obecność tej dodatkowej składowej (a więc tonu kombinacyjnego o częstotliwości 0.8 khz) nie jest jednak oczywista, bowiem dopiero zdudnienie jej poprzez dodanie do dwutonu 1 i 1.2 khz tonu o częstotliwości nieznacznie różniącej się od 800 Hz (np. 804 Hz) pozwala stwierdzić obecność tej składowej, która nie występuje w sygnale. 1.3. Nerw słuchowy Zasadnicza część informacji o sygnale akustycznym dostępna w nerwie słuchowym pochodzi z komórek rzęsatych wewnętrznych. Do każdej z tych komórek dochodzi ok. 20 neuronów aferentnych i każdy z nich dochodzi wyłącznie do jednej komórki. Dzięki temu informacja o aktywności poszczególnych wewnętrznych komórek rzęsatych transmitowana jest do wyższych pięter układu słuchowego za pomocą 25-30 tys. (niezależnych kanałów), co schematycznie ilustruje górna część Rys. 1.9. W odpowiedzi na ton, będący sygnałem monochromatycznym, znaczna liczba komórek rzęskowych wykazuje aktywność, dlatego, że wychylenie błony podstawnej nie jest punktowe. Wiele neuronów dochodzących do pobudzonych komórek rzęskowych będzie również wykazywało aktywność, wyrażaną zazwyczaj liczbą impulsów na sekundę. Zatem informacja o częstotliwości dźwięku 13

zamieniana jest (kodowana) na pobudzenie grupy neuronów dochodzących do komórek rzęsatych znajdujących się w pobudzonych obszarach błony podstawnej, podczas gdy informacja o natężeniu dźwięku zawarta jest przede wszystkim w liczbie tych impulsów na sekundę. Nie ma jednak prostej zależności pomiędzy natężeniem, a liczbą impulsów w jednostce czasu: wzrost natężenia prowadzi bowiem do wzrostu częstotliwości wyładowań neuronów, ale również do wzrostu liczby aktywnych neuronów. Rozkład aktywności neuronów pod wpływem sygnału o niewielkim natężeniu (do ok. 40-50 db SPL) ilustruje układ najgrubszych pionowych linii w lewej dolnej części Rys. 1.9. Dla średnich wartości poziomu pewna liczba neuronów słuchowych osiąga stan nasycenia: dalszy wzrost poziomu dźwięku (powyżej 50 db) nie wywołuje zmiany aktywności tych neuronów. Wzrost poziomu natężenia sygnalizowany jest w tym przypadku przez nienasycone neurony po obu stronach (w skali częstotliwości) względem nasyconych neuronów oraz przez wzrost liczby aktywnych neuronów, co schematycznie ilustruje układ najcieńszych pionowych linii w lewej dolnej części Rys. 1.9. Liczba impulsów czynnościowych na sekundę w poszczególnych neuronach (typach neuronów) nie jest jedyną informacją o bodźcu dostępną w nerwie słuchowym. Dla częstotliwości bodźca akustycznego mniejszych od 5 khz czasowy przebieg wyładowań neuronów odzwierciedla strukturę czasową bodźca, co zilustrowano w prawej dolnej części Rys. 1.9. Wyładowania te mają tendencję do występowania dla ściśle określonej fazy bodźca, choć nie muszą występować w każdym jego okresie. Zjawisko to nazywane jest synchronicznością fazową. Zatem interwały czasowe między kolejnymi wyładowaniami są całkowitymi wielokrotnościami okresu bodźca. Odstępy te zawierają jednoznaczną informację o częstotliwości sygnału. Dokonując określenia częstotliwości sygnału układ słuchowy może bazować na informacji o tym, które z neuronów są aktywne (każdy aferentny neuron dochodzi tylko do jednej wewnętrznej komórki rzęskowej) oraz na odstępach czasowych pomiędzy impulsami w aktywnych neuronach. Synchroniczność fazowa ma również znaczenie dla kodowania informacji o natężeniu dźwięku. Natężenie, do poziomów ok. 40-50 db, kodowane jest poprzez częstotliwość wyładowań neuronów. Powyżej tego natężenia liczba impulsów w nasyconych neuronach jest stała i zmiany częstotliwości wyładowań obserwuje się tylko w mniej licznej grupie neuronów nienasyconych. Jednak dalszy wzrost natężenia powoduje wzrost liczby aktywnych neuronów. Biorąc pod uwagę fakt, że synchroniczność fazową obserwuje się niezależnie od nasycenia neuronów można stwierdzić, że wzrost natężenia (powyżej 40-50 db) prowadzi do powiększania regularności wyładowań obserwowanych w nerwie słuchowym. Wzrost tej regularności może być wykorzystywany przez wyższe piętra układu słuchowego do dyskryminacji natężenia. 14

BAZA Wewnętrzne komórki rzęskowe HELIKOTREMA Neurony aferentne, ok. 20 neuronów na każdą komórkę. Razem ok. 25-30 tys. włókien. Błona pokrywkowa Wewnętrzne komórki. rzęskowe, ok. 3500, w Błona podstawna 20-30 tys. 'niezależnych' kanałów informacji. Każdy kanał transmituje informację o 'innej' Liczba impulsów t min = 1 f Częstotliwość, lub numer kanału transmisji Czas Rys. 1.9. Schemat transmisji sygnału akustycznego w nerwie słuchowy Rys.9. Schematyczne przedstawienie procesu przetwarzania drgań mechanicznych na impulsy neuronowe oraz rozkładu aktywności neuronów w czasie. 15

2. PSYCHOFIZYKA ZMYSŁU SŁUCHU Celem badań psychoakustycznych jest wyznaczenie zależności pomiędzy fizycznymi parametrami bodźca akustycznego a wrażeniem słuchowym wywołanym przez ten bodziec. Najczęściej do mierzonych wrażeń słuchowych zaliczamy progi percepcji (absolutne lub różnicowe). W ogólności próg to najmniejsza wartość fizycznej wielkości bodźca, dla której występuje zaledwie spostrzegana zmiana wrażenia. Progiem słyszalności jest taka wartość poziomu ciśnienia akustycznego dźwięku, przy której powstaje zaledwie słyszane wrażenie słuchowe. Próg różnicowy natomiast określa zaledwie spostrzeganą różnicę pomiędzy dwoma dźwiękami, dla których występuje różnica danej wielkości fizycznej. Zgodnie z teorią detekcji sygnałów nie można dokładnie wyznaczyć wartości progu. Wartość progu może być jedynie wyznaczona z określonym prawdopodobieństwem. 2.1. Maskowanie Maskowanie jest jednym z procesów związanych z funkcjonowaniem układu słuchowego. W otaczającym nas środowisku na co dzień mamy do czynienia z sytuacją w której dźwięk, który słyszymy w momencie pojawienia się innych dźwięków staje się mniej wyraźny lub nie słyszymy go w ogóle. Mówimy wówczas o zjawisku maskowania. Według Amerykańskiej Organizacji Normalizacyjnej (lit.) maskowanie definiuje się jako proces, w wyniku którego próg słyszalności określonego dźwięku ( sygnału ) wzrasta na skutek obecności innego dźwięku (tzw. dźwięku maskującego, maskera ). Miarą maskowania jest wzrost progu słyszalności sygnału w obecności maskera. Jednostką miary maskowania jest decybel. Można także stwierdzić, że maskowanie związane jest z rozdzielczością częstotliwościową układu słuchowego. Rozdzielczość częstotliwościowa jest tą własnością układu słuchowego, która pozwala wyodrębniać z dźwięku złożonego składowe o różnych częstotliwościach tzn. usłyszeć w dźwięku złożonym dwie różne wysokości. Procesy odpowiedzialne za rozdzielczość częstotliwościową zachodzą głównie na poziomie błony podstawnej ślimaka ucha wewnętrznego. Jeśli rozdzielczość ta jest niewystarczająca wówczas nie możemy rozdzielić sygnału od maskera. Innymi słowy maskowanie może posłużyć do ilościowego opisu rozdzielczości częstotliwościowej. W zależności od skuteczności maskowania wyróżniamy maskowanie częściowe i całkowite. Maskowanie częściowe występuje wówczas, gdy głośność sygnału maskowanego

ulega zmniejszeniu w obecności maskera. Z kolei, gdy sygnał w obecności maskera przestaje być słyszalny wówczas występuje efekt maskowania całkowitego. Skuteczność efektu maskowania zależy od poziomu natężenia, struktury widmowej, wzajemnego usytuowania na skali częstotliwości, sposobu prezentacji oraz czasowego rozkładu sygnału i maskera. Gdy sygnał (s) i masker (M) prezentowane są do tego samego ucha, wówczas mówimy o maskowaniu jednousznym, jeśli sygnał podawany jest do jednego ucha a masker do drugiego to mamy do czynienia z tzw. maskowaniem centralnym. W przypadku, gdy sygnał (s) i masker (M) pojawiają się równocześnie w czasie to występuje maskowanie równoczesne. Jeśli sygnał pojawia się po maskerze to mówimy o maskowaniu resztkowym lub pobodźcowym (resztkowym), gdy sygnał pojawia się przed maskerem to mamy do czynienia z maskowaniem wstecznym lub przedbodźcowym (wstecznym) (por. Rys. 2.1). Wsteczne Równoczesne Resztkowe s M M s M s Rys. 2.1. Rodzaje maskowania ze względu na kolejność występowania w czasie sygnału (s) i maskera (M). 2.2. Próg słyszalności, krzywe równej głośności Próg słyszalności, inaczej próg absolutny, definiuje się jako najmniejszą wartość poziomu ciśnienia akustycznego która wywołuje zaledwie spostrzegalne wrażenie dźwiękowe. Ze względu na sposób pomiaru natężenia bodźca wywołującego wrażenie dźwiękowe, rozróżnia się dwie metody wyznaczania progu słyszalności. Pierwsza z nich polega na pomiarze poziomu ciśnienia akustycznego w okolicy błony bębenkowej za pomocą małej sondy mikrofonowej. Wyznaczony w ten sposób próg nazywany jest zaledwie spostrzegalną zmianą ciśnienia (MAP minimum audible pressure). W drugiej metodzie sygnał prezentowany jest przez głośniki, umieszczone w komorze bezechowej. Pomiar poziomu ciśnienia akustycznego dokonywany jest w punkcie, w którym uprzednio usytuowany był środek głowy słuchacza. Uzyskany w ten sposób próg nazywany jest progiem w polu swobodnym (MAF minimum audible field) [[2]. 17

Najczęściej progi słyszalności przedstawia się jako zależność poziomu ciśnienia akustycznego dźwięku wywołującego zaledwie spostrzegane wrażenie słuchowe od częstotliwości tego dźwięku. Na Rys. 2.2 zamieszczono krzywe słyszalności dla zaledwie spostrzeganych zmian poziomu ciśnienia typu MAP i MAF oraz krzywe dyskomfortu i bólu. Krzywa progowa typu MAF leży poniżej krzywej MAP. Różnice pomiędzy tymi wartościami progów wynikają z wpływu małżowiny usznej, kanału słuchowego oraz głowy na propagację fali akustycznej. Charakterystyczne minimum i maksimum krzywej progowej MAF wynika z rezonansu akustycznego małżowiny i zewnętrznego przewodu słuchowego oraz właściwości impedancyjnych ucha środkowego i wewnętrznego [[2]. Próg słyszalności, db SPL Częstotliwość, khz Rys. 2.2. Progi słyszalności w funkcji częstotliwości typu MAF i MAP. Zakres zmian poziomu ciśnienia akustycznego w funkcji częstotliwości, ograniczony krzywą progu słyszalności i progu dyskomfortu nazywany jest obszarem słyszalności. Do wyznaczania progów stosuje się sygnały tonalne o częstotliwościach z zakresu od 20 do 20000 Hz. Jedną z najważniejszych cech wrażenia słuchowego jest głośność. Pozwala ona uporządkować dźwięki na skali od cichych do głośnych. Głośność jest wielkością subiektywną i zależy od poziomu ciśnienia akustycznego, częstotliwości, czasu trwania bodźca oraz widmowej struktury dźwięku. 18

Dwa tony o tym samym poziomie ciśnienia akustycznego i różnych częstotliwościach nie są w ogólności oceniane przez słuchacza jako jednakowo głośne. Istnieje możliwość ilościowej oceny głośności danego dźwięku przez porównanie głośności dźwięku badanego z głośnością dźwięku wzorcowego. Dźwiękiem wzorcowym jest ton o częstotliwości 1 khz. Pomiar głośności dźwięku badanego odbywa się poprzez naprzemienne prezentowanie słuchaczowi dźwięku badanego i wzorcowego. Słuchacz dobiera głośność dźwięku wzorcowego tak, aby był on równo głośny z dźwiękiem badanym. Uzyskana w ten sposób wartość poziomu ciśnienia akustycznego wzorca odpowiada poziomowi głośności dźwięku badanego. Jednostką poziomu głośności jest fon. Badany dźwięk ma tyle fonów ile decybeli ma równogłośny z nim wzorzec. Rys. 2.3. Krzywe równej głośności. Jeśli dla określonego poziomu ciśnienia akustycznego wzorca dokonane zostaną pomiary zrównania głośności tonów o różnych częstotliwościach, to otrzymuje się dla tych tonów krzywą równej głośności, inaczej nazywaną krzywą izofoniczną. Na Rys. 2.3 przedstawiono krzywe izofoniczne dla różnych poziomów głośności, w zakresie od 0 do 110 fonów. Z danych zamieszczonych na Rys. 2.3 wynika, że dla małych poziomów ciśnienia akustycznego (rzędu 20, 30 db SPL) dźwięki o częstotliwościach niskich mogą nie być w ogóle słyszalne. Krzywe równej głośności znalazły swoje zastosowanie w urządzeniach elektroakustycznych, m. in. w miernikach poziomu dźwięku, często nazywanymi sonometrami. W miernikach tych pomiar poziomu ciśnienia akustycznego korygowany jest poprzez zastosowanie odwróconych krzywych równej głośności. I tak krzywa korekcyjna A jest odwróceniem krzywej izofonicznej dla 30 fonów. Korekcję tą stosuje się przy pomiarach 19

niskich poziomów ciśnienia akustycznego. Krzywa korekcyjna B odpowiada odwróconej krzywej izofonicznej dla 70 db i uwzględnia się ją przy pomiarach średnich poziomów ciśnienia akustycznego. Przy pomiarach dużych poziomów ciśnienia akustycznego stosuje się krzywą korekcyjną typu C, która jest praktycznie płaska w danym zakresie częstotliwości. Niestety stosowanie krzywych korekcyjnych nie pozwala do końca odzwierciedlić subiektywnego odczucia głośności mierzonego dźwięku. 2.3. Wstęgi krytyczne, filtry słuchowe. Zasadniczymi procesami decydującymi o maskowaniu jednoczesnym i jednousznym są procesy zachodzące w peryferyjnej części układu słuchowego (ślimak). Procesy zamiany fali mechanicznej na drgania błony podstawnej i dalej na impulsy czynnościowe nerwu słuchowego opisywane są poprzez modele które bazują na mechanizmach filtrowania sygnału wejściowego. Jednym z pierwszych badaczy, który powiązał efekt maskowania z procesami zachodzącymi na poziomie błony podstawnej ślimaka był Fletcher [[1]. Przeprowadził on eksperyment maskowania, w którym sygnałem podlegającym detekcji był ton a maskerem pasmo szumu o stałej widmowej gęstości mocy, zmiennej szerokości oraz częstotliwości środkowej równej częstotliwości tonu. Eksperyment polegał na wyznaczeniu progu detekcji sygnału na tle szumu o zmieniającej się szerokości pasma. Z przeprowadzonego eksperymentu wynikało, że próg detekcji sygnału na tle maskera wzrasta tylko do pewnej określonej szerokości pasma szumu, powyżej której próg się ustala. W celu interpretacji uzyskanych wyników, Fletcher założył, że każdy punkt błony podstawnej ślimaka odpowiada (ulega wychyleniu) na dźwięk o określonej częstotliwości. W związku z tym każdemu punktowi błony podstawnej można przyporządkować filtr o ustalonej częstotliwości środkowej i szerokości. W opisywanym powyżej eksperymencie zwiększanie szerokości pasma szumu przy jego stałej gęstości widmowej powodowało wzrost całkowitej mocy szumu. Dlatego też rezultat ten jest o tyle zaskakujący, że wzrost mocy szumu powinien odpowiadać wzrostowi głośności maskera a więc i ciągłemu wzrostowi progów wraz z poszerzaniem pasma szumu. Szerokość pasma szumu, powyżej której próg detekcji nie ulega zmianie Fletcher nazwał wstęgą krytyczną. Model Fletchera opisujący proces filtrowania peryferyjnego zawierał kilka uproszczeń. Mianowicie m. in. przyjęto w nim, że filtr ma kształt prostokątny. Zatem filtr taki przepuszczał wszystkie składowe sygnału z zakresu jego pasma przepustowości z jednakową wagą oraz usuwał wszystkie składowe spoza pasma przepustowości. Podsumowując, Fletcher założył, że w maskowaniu tonu bierze udział tylko 20

pasmo szumu o szerokości nie większej niż szerokość jednej wstęgi krytycznej. Ponadto jeśli założymy, że szum zaledwie maskuje ton, wówczas stosunek mocy tonu P do mocy szumu zawartego we wstędze krytycznej jest stały i wynosi K. Jeśli przez oznaczymy widmową gęstość mocy, W szerokość wstęgi krytycznej wówczas: N 0 P K = (2.1) WN 0 Wyznaczona przez Fletchera wartość współczynnika K wynosiła 0. Późniejsze badania (lit EO) pokazały, że K=0.4 i zależy od częstotliwości. Przekształcając odpowiednio rów. 2. 1 można wyznaczyć szerokość wstęgi krytycznej (W). Na Rys. 2.4 przedstawiono w jaki sposób szerokość pasma krytycznego zależy od częstotliwości. Rys. 2.4. Zależność szerokości pasma krytycznego (wstęgi krytycznej) od częstotliwości. Zamieszczone tam dane uzyskane zostały przez Zwickera [[5] a wyznaczone zostały głównie na podstawie ilorazu krytycznego. Okazuje się, zdefiniowane przez Fletchera szerokości pasm krytycznych nie pokrywają się z szerokościami pasm wyznaczonych przez Zwickera. Ponadto Fletcher i Zwicker założyli, że pasma krytyczne stanowią skończony zbiór nakładających się pasm o zdefiniowanych częstotliwościach środkowych. Wyniki badań fizjologicznych dotyczących funkcjonowania ślimaka ucha środkowego nie dają podstaw do tworzenia modelu filtrowania peryferyjnego w oparciu o skończony (nieciągły) zbiór prostokątnych filtrów. Zatem zaproponowany przez Zwickera model funkcjonowania peryferyjnej części układu słuchowego wymagał pewnego uzupełnienia. W 1976 r Patterson [[4] zaproponował metodę wyznaczania charakterystyki filtru słuchowego. W metodzie tej wykorzystano zjawisko maskowania sygnału w postaci tonu pasmowozaporowym szumem białym w którym występowała przerwa widmowa o szerokości 2 f umieszczona symetrycznie względem maskera (Rys. 2.5). 21

Rys. 2.5. Schemat metody Pattersona do wyznaczania kształtu (charakterystyki) filtru słuchowego. Eksperyment Pattersona polegał na wyznaczeniu progów detekcji sygnału tonalnego w funkcji szerokości pasma szumu zaporowego ( 2 f ). Na Rys. 2.6 przedstawiono charakterystykę częstotliwościową filtru słuchowego w funkcji częstotliwości oraz, dla porównania, charakterystykę filtru prostokątnego o szerokości jednej wstęgi krytycznej. Rys. 2.6. Kształt (charakterystyka) filtru słuchowego wyznaczonego metodą Pattersona. Widać, że wyznaczony tą metodą filtr słuchowy ma zaokrąglony wierzchołek i opadające dość stromo zbocza. Szerokość filtra słuchowego można wyznaczyć określając jego szerokość połówkową, lub też wyrazić ją za pomocą ekwiwalentnej szerokości prostokątnej (ERB). Ekwiwalentna szerokość prostokątna filtru słuchowego oznacza, że w przypadku sygnału wejściowego w postaci szumu białego, moc sygnału mierzona na wyjściu filtru słuchowego i odpowiadającego mu filtru prostokątnego będzie taka sama. Zależność pomiędzy ekwiwalentną szerokością prostokątną a częstotliwością środkową f wyrażoną w khz, dana jest wyrażeniem: ( 4.37 1) ERB = 24.7 f + (2.2) 22

Rys. 2.7 przedstawia porównanie ekwiwalentnych szerokości prostokątnych filtru słuchowego oraz szerokości wstęg krytycznych w funkcji częstotliwości środkowej uzyskanych przez różnych autorów. Rys. 2.7. Zależność ekwiwalentnej szerokości prostokątnej od częstotliwości środkowej. Linią przerywaną zaznaczono wyznaczone przez Zwickera wartości szerokości wstęg krytycznych, natomiast linia ciągła przedstawia wartości ERB uzyskane na podstawie równania (2.2). Aproksymacja wartości ERB za pomocą równania (2.2) wydaję się być najbliższa wynikom badań uzyskanych przez różnych autorów. Reasumując można stwierdzić, że obecny model funkcjonowania peryferyjnej części układu słuchowego zakłada istnienie nieskończonej liczby filtrów słuchowych. Charakterystyki tych filtrów mają zaokrąglone wierzchołki i dość stromo opadające zbocza. Szerokość filtrów słuchowych wyznaczona jest poprzez podanie wartości ekwiwalentnej szerokości prostokątnej (ERB). Przedstawiony powyżej model pozwala na dość dobrą interpretację wyników badań dotyczących zjawiska maskowania. 2.4. Pobudzenie i jego związek ze efektem maskowania Eksperymenty polegające na wyznaczeniu progu detekcji maskowanego sygnału tonalnego o zmieniającej się częstotliwości, w obecności maskera (tonu lub szumu) o ustalonej częstotliwości (częstotliwości środkowej), pozwalały na wyznaczenie tzw. krzywych maskowania (audiogramów maskowania). Na Rys. 2.8 przedstawiono krzywe maskowania dla pasma szumu o częstotliwości środkowej 410 Hz 23

Rys. 2.8. Krzywe maskowania dla pasma szumu o częstotliwości środkowej 410 Hz i szerokości 90 Hz. Parametrem każdej krzywej jest całkowity poziom szumu maskera. Każda z krzywych przedstawia podwyższenie progu detekcji tonu w zależności od częstotliwości sygnału. Wraz ze wzrostem poziomu maskera krzywe maskowania stają się coraz bardziej niesymetryczne (rośnie stromość zbocza po stronie niskich częstotliwości i jednocześnie maleje stromość zbocza krzywej maskowania po stronie dużych częstotliwości). Można przyjąć tezę, że podczas detekcji sygnału na tle maskera słuchacz dla każdej częstotliwości sygnału wykorzystuje filtr słuchowy o częstotliwości środkowej zbliżonej do częstotliwości tego sygnału. Bazując na tej tezie Moore i Glasberg [[3] przedstawili metodę wyznaczania pobudzenia opartą na koncepcji filtrów słuchowych. Pobudzenie jest tutaj rozumiane jako zależność odpowiedzi filtrów słuchowych na sygnał wejściowy w funkcji częstotliwości środkowych tych filtrów. Rys. 2.9 przedstawia metodę wyznaczania pobudzenia wywołanego sygnałem tonalnym o częstotliwości 1 khz. 24

Rys. 2.9. Sposób wyznaczania pobudzenia wywołanego sygnałem sinusoidalnym o częstotliwości 1 khz. Względna odpowiedź filtru o najmniejszej częstotliwości środkowej wynosi 40 db (punkt a). Kolejne względne odpowiedzi pozostałych filtrów słuchowych zaznaczono punktami od b do e. Poziomy pobudzenia wyrażono względem pobudzenia maksymalnego. Wyznaczony przebieg pobudzenia jest asymetryczny, podobnie jak audiogramu maskowania dla sygnału o zbliżonym poziomie ciśnienia akustycznego. Reasumując, przebieg pobudzenia ma w ogólności ten sam kształt, co audiogram maskowania. 3. BADANIA PSYCHOAKUSTYCZNE Jak już wcześnie powiedziano zasadniczym celem psychofizycznych badań słuchu jest poszukiwanie i wyznaczanie zależności pomiędzy fizycznymi parametrami bodźca akustycznego a wrażeniem słuchowym wywołanym przez ten bodziec. Badania tego typu sprowadzają się najczęściej do wyznaczania różnorodnych progów. W niniejszym ćwiczeniu jednym z celów jest wyznaczenie tzw. krzywych maskowania, czyli takiego poziomu ciśnienia akustycznego wytwarzanego przez ton prezentowany na tle pasma szumu, przy którym ton ten jest zaledwie słyszalny. Wyznaczany w ten sposób próg jest progiem absolutnym, o którym mówi się najczęściej próg maskowany. Jest wiele metod eksperymentalnych pozwalających na wyznaczenie progu, choć nieliczne z nich są powszechnie stosowane. Do najczęściej stosowanej i najefektywniejszej z 25

metod należy metoda dwualternatywnego wyboru w połączeniu z jedną z wielu procedur adaptacyjnych, które w zarysie przedstawia następny podrozdział. 3.1. Metody badawcze Eksperyment wykonywany w ramach tego ćwiczenia oparty jest na metodzie dwualternatywnego wymuszonego wyboru. Metoda ta polega na prezentowaniu słuchaczowi dwóch następujących po sobie w czasie interwałów obserwacyjnych, z których musi on wybrać jeden według ściśle sprecyzowanej i jednoznacznie brzmiącej instrukcji. W przypadku tego eksperymentu interwałami obserwacyjnymi są dwa następujące po sobie sygnały a więc interwał obserwacyjny oznacza w tym przypadku tyle samo, co sygnał w tym interwale. Jeden z interwałów obserwacji zawiera pasmo szumu i sygnał tonalny podlegający detekcji a drugi interwał zawiera wyłącznie pasmo szum. Czasy trwania sygnałów, oddzielonych krótką przerwą ciszy, są jednakowe a kolejność ich występowania w czasie - losowa: w połowie prezentacji (jest ich zazwyczaj kilkadziesiąt w ramach jednej serii pomiarowej) szum z tonem występuje jako pierwszy sygnał a w połowie - jako drugi. Oba interwały obserwacji sygnalizuje się słuchaczowi bądź za pomocą świateł bądź też za pomocą informacji na ekranie monitora. Zadaniem słuchacza, który znajduje się w dźwiękoszczelnej kabinie, jest wskazanie tego interwału obserwacji, w którym stwierdził on obecność sygnału tonalnego na tle szumu i naciśnięcie odpowiedniego klawisza na klawiaturze bądź pulpicie odpowiedzi. W metodzie tej słuchacz musi udzielić odpowiedzi na każdą parę interwałów obserwacji, które ocenia i nie ma możliwości odpowiedzieć nie wiem lub prosić o ponowną prezentację tych samych bodźców. Brak odpowiedzi słuchacza wstrzymuje bowiem eksperyment: następna para bodźców jest prezentowana ok. 1 sekundę po tym jak słuchacz udzieli odpowiedzi na bieżącą parę sygnałów. Jeśli słuchacz odpowiada to jego odpowiedź może być poprawna (poprawnie wskazany interwał z tonem, wówczas, gdy poziom tonu jest wysoki) lub niepoprawna (niepoprawnie wskazany interwał, np. wówczas, gdy ton jest całkowicie maskowany przez szum i słuchacz musi po prostu zgadywać). Żeby poprawić dokładność odpowiedzi słuchacza dość często stosuje się tzw. sprzężenie zwrotne, tzn. informuje się słuchacza o tym czy jego odpowiedź na każdą parę bodźców była poprawna czy nie. Sprzężenie to zastosowane jest w niniejszym ćwiczeniu: po udzieleniu odpowiedzi na ekranie monitora lub na pulpicie odpowiedzi pojawia się informacja dotycząca udzielonej odpowiedzi. Ponieważ celem tego eksperymentu jest wyznaczenie takiego poziomu sygnału, przy którym jest on zaledwie spostrzegany to sygnał ten należy prezentować słuchaczowi 26

wielokrotnie dobierając jego poziom tak, by określić tę wartość poziomu, przy której prawdopodobieństwo odpowiedzi poprawnej jest równe prawdopodobieństwu odpowiedzi niepoprawnej. By tego dokonać trzeba prezentować słuchaczowi ton o takim poziomie, który jest zaledwie słyszalny, ale też i o takim poziomie, który już nie wywołuje wrażenia słyszalnego. Eksperyment rozpoczyna się zawsze od takiego poziomu sygnału (tzw. wartość inicjująca poziomu), przy którym sygnał ten jest zawsze spostrzegany. (Jeśli na pierwszych 3-5 prezentacji bodźca słuchacz odpowiada niepoprawnie należy eksperyment rozpocząć ponownie z większą wartością poziomu sygnału). Jeśli dla danego poziomu sygnału maskowanego słuchacz odpowiada poprawnie, to w następnej prezentacji należy w ogólności poziom ten zmniejszyć. Jeśli jednak odpowiedź słuchacza jest niepoprawna to poziom sygnału w następnej prezentacji powinien być zwiększony. Jednak tak prosta manipulacja parametrami sygnału nie jest najlepszym rozwiązaniem i dlatego też zmiana parametrów prezentowanego sygnału dokonywana jest zgodnie z tzw. procedurą adaptacyjną (Levitt, 1971): poziom sygnału zmienia się wówczas, gdy kilka kolejnych odpowiedzi słuchacza spełnia określone warunki. Poziom sygnału zwiększa się, jeśli m kolejno następujących po sobie odpowiedzi słuchacza było niepoprawnych, a zmniejsza się, gdy n kolejno następujących po sobie odpowiedzi słuchacza było poprawnych. Najczęściej stosowana jest metoda dla m=1 i n= 2 lub 3: poziom sygnału zwiększa się po każdej niepoprawnej odpowiedzi słuchacza, niezależnie od odpowiedzi poprzedzającej tę odpowiedź. Poziom sygnału zmniejsza się natomiast, jeśli dwie (n=2) lub trzy (n=3) kolejno po sobie następujące odpowiedzi były poprawne. Wielokrotne prezentowanie bodźców prowadzi do określania, tzw. punktów zwrotnych, tj. tych wartości poziomu sygnału, dla których następuje odwrócenie kierunku zmian poziomu sygnału: ze zmniejszania na zwiększanie lub odwrotnie. Np. dla n=2, sześć kolejno następujących po sobie odpowiedzi poprawnych powoduje, że poziom bodźca zostanie zmniejszony trzy razy (jeden raz po każdych dwóch kolejnych odpowiedziach poprawnych). Jeśli po tych sześciu poprawnych odpowiedziach następują np. dwie odpowiedzi niepoprawne to poziom bodźca musi ulec zwiększeniu dwa razy (po każdej odpowiedzi niepoprawnej). A zatem dla pewnej wartości poziomu bodźca następuje przełączenie zmniejszania poziomu bodźca na zwiększanie lub vice versa. Poziom sygnału przy którym następuje to przełączenie nazywa się punktem zwrotnym. W pojedynczej serii pomiarowej określa się zazwyczaj 8-12 punktów zwrotnych, przy czym próg oblicza się zazwyczaj, jako średnią arytmetyczną lub geometryczną, na podstawie 4-8 ostatnich punktów zwrotnych, pomijając cztery pierwsze. 27

Wartość o jaką zmienia się poziom bodźca nazywa się krokiem. Stanowi on również ważny element metody badań: zbyt mała jego wartość wydłuża niepotrzebnie eksperyment a zbyt duża - nie pozwala na precyzyjne wyznaczenie wartości progowej. W przypadku czterech pierwszych punktów zwrotnych wartość kroku jest zazwyczaj większa (tzw. duży krok) niż w przypadku pozostałych punktów zwrotnych (mały krok). W przypadku niniejszego ćwiczenia duży krok ustalono na wartość 4 db a mały krok na 2 db. Próg oblicza się na podstawie co najmniej czterech pojedynczych pomiarów. 3.2. Aparatura Zestaw aparatury wykorzystywany do tego ćwiczenia to komputer z procesorem sygnałowym oraz układ Tucker-Davis Technology (TDT). Układ TDT składa się z dwukanałowego przetwornika cyfrowo-analogowego (16 bitów), dwóch tłumików sterowanych cyfrowo, sumatora oraz wzmacniacza wyjściowego, do którego podłączone są słuchawki (w przypadku tego ćwiczenia są to słuchawki Sennheiser HD 580). Procesor sygnałowy zainstalowany w komputerze oblicza każdorazowo sygnał (sygnały) zgodnie z zadanym algorytmem i wysyła je do dwukanałowego przetwornika cyfrowo-analogowego. W jednym z kanałów przetwornika wytwarzane jest pasmo szumu (sygnał maskujący) o określonych parametrach a w drugim kanale sygnał sinusoidalny podlegający detekcji. Po przetworzeniu cyfrowo-analogowym sygnały przesyłane są do dwóch oddzielnych tłumików sterowanych z komputera, co pozwala na niezależnie sterowanie poziomami sygnału maskowanego i maskującego, nie tracąc maksymalnej rozdzielczości przetwarzania cyfrowoanalogowego, co jest dość istotne dla zachowania możliwie największej dynamiki sygnału. Następnie sygnały te, mające już odpowiednie poziomy, przekazywane są do sumatora, który dodaje je i przesyła już jako jeden sygnał do wzmacniacza słuchawkowego. Wzmocniony sygnał doprowadzony jest do jednej słuchawki by umożliwić w ten sposób jednouszny odsłuch. Generując cyfrowo sygnały akustyczne, a potem zamieniając je na postać analogową. Konieczne jest stosowanie filtru dolnoprzepustowego o częstotliwości odcięcia równej w przybliżeniu połowie częstotliwości próbkowania, po to by usunąć z sygnału wszystkie te składniki związane z częstotliwością próbkowania. Sytuacja taka ma miejsce zwłaszcza wówczas, gdy częstotliwość próbkowania jest niewielka, np. kilkanaście kiloherców i gdy zakłócenia związane z częstotliwością próbkowania są wyraźnie słyszane. W niniejszym ćwiczeniu, z uwagi na dość dużą wartość częstotliwości próbkowania (50 khz), nie zachodzi konieczność stosowania filtru dolnoprzepustowego, bowiem połowa wartości tej 28