Восприятие звуков человеком

Восприятие звуков человеком
1. Особенности восприятия звуков ухом человека
Все программы, передаваемые по системам вещания, связи и звукозаписи предназначены для восприятия информации человеком. Поэтому требования к основным характеристикам этих систем не могут быть обоснованно сформулированы без точных сведений о свойствах слуха. Любое совершенствование системы, которое не будет ощущаться на слух, будет приводить к бессмысленной потере средств и времени. Следовательно, специалист, занимающийся разработкой или эксплуатацией систем звукозаписи и воспроизведения, должен знать основные особенности восприятия звуков ухом человека.
Орган слуха человека расположен в толще височных костей и делится на наружное ухо, среднее ухо и внутреннее ухо. К наружному уху относят ушную раковину и слуховой проход, слепо заканчивающийся барабанной перепонкой. Слуховой проход имеет слабо выраженный резонанс на частоте около 3 кГц и усиление на частоте резонанса ~ 3. Барабанная перепонка образована упругой соединительной тканью, которая колеблется под действием звуковых волн. За барабанной перепонкой находится среднее ухо, в состав которого входят: барабанная полость, заполненная воздухом; слуховые косточки и слуховая (евстахиева) труба, которая соединяет полость среднего уха с полостью глотки. Слуховые косточки: молоточек, наковальня и стремя – образуют рычажную систему, которая передаёт колебания барабанной перепонки мембране овального окна, разделяющей среднее и внутреннее ухо. Эта рычажная система трансформирует колебания барабанной перепонки с большой амплитудой скорости и небольшой амплитудой давления в колебания мембраны с малой амплитудой скорости и большой амплитудой давления. Коэффициент трансформации этой системы около 50 – 60. Барабанная полость имеет слабо выраженный резонанс на частоте ~ 1200 Гц. За мембраной овального отверстия находится внутреннее ухо, состоящее из преддверия, трех полукружных каналов и улитки, заполненных жидкостью. Полукружные каналы входят в состав органа равновесия, а улитка – в состав органа слуха. Улитка представляет собой канал длинной ~32 мм, свернутый спиралью. Канал разделен по всей длине двумя перегородками: рейснеровой мембраной и базилярной (основной) мембраной (см. рис. 1).
/>

/>/>/>/>/>
/>/>/>/>/>/>/>/>

/>/>/>

/>/>/>/>/>/>/>/>/>/>/>/>

/>/>/>

/>/>/>/>/>

/>/>/>

/>/>

1- мембрана овального окна, 2 – вестибулярный ход, 3 – геликотрема, 4 – базилярная мембрана, 5 –орган Корти, 6 – барабанный ход, 7 – мембрана круглого окна, 8 – рейснерова мембрана.
Рисунок 1. Схема строения улитки
Базилярная мембрана состоит из нескольких тысяч волокон, натянутых поперек улитки, и слабо связанных между собой. Базилярная мембрана расширяется по мере удаления от овального окна. С базилярной мембраной связан орган Корти, состоящий из~23500 нервных клеток, которые называют волосковыми. С каждым волокном слухового нерва связано несколько волосковых клеток, так что в центральную нервную систему приходит около 10000 волокон. При появлении звука мембрана овального окна возбуждает колебания лимфы в вестибулярном ходе, которые заставляют колебаться волокна базилярной мембраны. Колебания волокон, в свою очередь, возбуждают волосковые клетки. Информация о возбуждении клеток, т.е. о наличии звука, по нервным волокнам передаётся в головной мозг.
2. Восприятие частоты звуковых колебаний
Волокна базилярной мембраны имеют разную длину и, соответственно, разную резонансную частоту. Самые короткие волокна расположены около овального окна, их резонансная частота ~ 16000 Гц. Самые длинные – около геликотремы, имеют резонансную частоту ~ 20 Гц.
Таким образом, внутреннее ухо осуществляет параллельный спектральный анализ приходящих колебаний и позволяет ощущать звуки с частотами от ~20 Гц до ~ 20000 Гц. Эквивалентную электрическую схему анализатора можно изобразить следующим образом (см. рис. 2).
/>/>/>/>/>/>

/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>
/>/>/>/>/>/>/>/>/>/>

/>/>/>/>/>/>/>/>/>/>/>

/>/>/>

/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>

/>/>/>/>/>/>/>/>/>/>/>/>/>

/>/>/>/>/>/>/>/>

/>

Рисунок 2. Эквивалентная электрическая схема слухового анализатора.
Эквивалентная схема содержит ~ 140 параллельных звеньев – резонаторов, моделирующих волокна базилярной мембраны, включенные последовательно индуктивности L’i эквивалентны массе лимфы, ток в резонаторах пропорционален скорости колебаний волокон. Избирательность резонаторов невелика.
Так, для частоты 250 Гц полоса пропускания резонатора равна ~ 35 Гц (Q = 7), для частоты 1000 Гц – 50 Гц (Q = 20) и для частоты 4000 Гц – 200 Гц (Q = 20). Эти полосы пропускания характеризуют т.н. критические полоски слуха. Понятие о критических полосках слуха используется при расчете разборчивости речи и т.п.
Поскольку с одним нервным волокном связано несколько волосковых клеток, то человек может запомнить во всём частотном диапазоне не более 250 градаций, С уменьшением интенсивности звука это число уменьшается и, в среднем, составляет 150 градаций.
Соседние значения частоты отличаются не менее чем на 4 %. Что примерно совпадает с шириной критических полосок слуха (По этой причине кинофильмы, снятые со скоростью 24 кадра в секунду, можно демонстрировать по телевидению со скоростью -25 кадров в секунду. Даже искушенные музыканты не замечают разницы в звучании).
Однако, при одновременном присутствии двух колебаний ухо обнаруживает разницу в частотах ~ 0.5 Гц благодаря появлению биений.
Частота звуковых колебаний вызывает ощущение такого качества звука, которое называют высотой тона. Постепенное повышение частоты колебаний вызывает ощущение изменения тона от низкого (басового) до высокого. Высота тона описывается музыкальной нотной шкалой, однозначно связанной со шкалой частот.
Интервал между двумя частотами определяет величину изменения высоты тона. Основной единицей изменения высоты тона является октава. Одной октаве соответствует изменение частоты в два раза: 1 октава />/>. Число октав, на которое изменился тон можно определить так: />. Октава – крупный интервал высоты тона, поэтому используют более мелкие интервалы: терции, полутоны, центы. октава = 3 терции = 12 полутонов = 1200 центов. Отношение частот: в терции — 1.26, для полутона – 1.06, для цента – 1.0006.
3. Восприятие амплитуды звуковых колебаний
Порог слышимости. Звуки вызывают колебания волокон базилярной мембраны. Если колеблющееся волокно не касается волосковых клеток, то клетки не возбуждаются и звук не воспринимается. При увеличении амплитуды колебаний волокна начинают касаться волосковых клеток и они начинают посылать сигналы в головной мозг.
Звук будет услышан. Этот скачкообразный переход называют порогом слышимости. Порог слышимости оценивают величиной звукового давления или интенсивностью звука. Стандартному порогу слышимости на частоте 1000 Гц соответствует звуковое давление />Па или интенсивность звука />Вт/м2. При понижении частоты порог слышимости растет и на частоте 100 Гц он в 104 раз выше. При повышении частоты от 1000 Гц порог слышимости сначала понижается в 8 – 10 раз на частотах 2000 – 4000 Гц, а затем начинает расти.–PAGE_BREAK–
Порог различения интенсивности звука. При дальнейшем увеличении амплитуды начнут колебаться соседние волокна базилярной мембраны и, как только они коснутся волосковых клеток, слуховое ощущение снова возрастет.
Постепенно область возбуждения базилярной мембраны расширяется и слуховые ощущения скачками нарастают. Величину приращения звукового давления или интенсивности звука, соответствующую скачку, называют порогом различения интенсивности звука.
Число градаций интенсивности, различаемое на средних частотах, не превышает 250, на низких и высоких частотах резко уменьшается и в среднем по диапазону составляет ~150.
Болевой порог. Дальнейшее увеличение амплитуды колебаний приводит к появлению болевых ощущений. Они наблюдаются при звуковом давлении ~ 20 Па или интенсивности звука ~ 1 Вт/м2. Эти значения характеризуют болевой порог.
Уровень звукового давления и уровень интенсивности. Ощущение силы звука подчиняется закону Вебера-Фехнера: абсолютное приращение ощущения пропорционально относительному приращению раздражения, т.е.:
/>,
где /> — абсолютное приращение ощущения, А – постоянная величина. Проинтегрировав это выражение, получим:
/>.
На пороге слышимости, т.е. при />слуховое ощущение равно нулю. Тогда:
/>,
откуда:
/>
и
/>.
Пусть изменению интенсивности звука в 10 раз соответствует единица приращения ощущения, т.е. А = 1. Эту единицу назвали «Бел». Более мелкая единица – децибел (дБ), равная 0.1 Бела. Тогда:
/>(дБ). (1)
Звуковое давление, выраженное в децибелах, называют уровнем звукового давления />, а интенсивность звука, выраженную в децибелах, называют уровнем интенсивности звука />
Громкость.Т.к. порог слышимости на разных частотах неодинаков, то уровень звукового давления или уровень интенсивности звука не совсем правильно характеризуют субъективное ощущение звуков. Поэтому введено понятие громкостьи уровень громкости.
Уровень громкости звука любой частоты равен уровню громкости чистого тона с частотой 1000 Гц, ощущаемого с такой же громкостью, выраженному в Дб. Единицу громкости называют фон. 1 фон равен 1 Дб на частоте 1000 Гц.
Кривые равной громкости. В результате исследования слуха большой группы людей в возрасте 18 – 25 лет были построены кривые равной громкости (изофоны).В 1958 году
Международная организация по стандартизации (ISO) рекомендовала эти кривые как стандарт (см. рис. 3).
/>
Рисунок 3. Кривые равной громкости
Из анализа этих кривых следует:
Частотная характеристика слуха равномерна при высоких уровнях звукового давления. Поэтому профессиональное прослушивание фонограмм следует производить при высоких (85 – 95 Дб) уровнях.
. С понижением уровня сигнала полоса воспринимаемых частот сужается. Поэтому при прослушивании фонограммы необходимо поднимать высокие и низкие частоты, чтобы получить одинаковое ощущение всех составляющих спектра сигнала.
В современных усилителях это достигается при помощи частотно-зависимых регуляторов громкости.
Кривые равной громкости удобны при работе с гармоническими сигналами. Реальные звуки обладают более или менее широким спектром. Сложение громкостей составляющих спектра происходит в разных критических полосках слуха.
Громкость при этом выступает как субъективный параметр. Для её количественной оценки ввели единицу громкости – 1 сон равный 40 фонам. Громкость в n сон соответствует случаю, когда слушатель оценивает сигнал, как в n раз более громкий. Для оценки громкости можно воспользоваться формулой:
/>сон
где /> — уровень громкости в фонах.
Уровень громкости некоторых звуков приведен в таблице 1.
Таблица 2. Средний уровень громкости некоторых звуков и шумов
Источники звука
Уровень громкости, фон
Громкость, сон
Шум в кабине самолета
128 — 130
875 — 1400
Шум в поезде метро
85 — 90
25 — 38
Трамвай на расстоянии 10 – 20 м
80 — 85
17 — 25
Легковой автомобиль на расстоянии 2 – 20 м
50 — 65
2 – 6
Шум на улице
40 — 60
1 — 4
Оркестр
80 — 100
17 — 88
Аплодисменты
60 – 75
4 — 11
Разговор на расстоянии 1 м
55 — 70
3 — 8
Шум в аудитории
25 – 30
0.36 – 0.46
4. Временные характеристики слуха
Согласно проведенным исследованиям (Гельмгольц, Флетчер), ухо почти не реагирует на фазовые соотношения в спектре сигнала. Два сигнала с одинаковым спектром амплитуд, но с разными спектрами фаз воспринимаются одинаково, если уровень сигнала не превышает 60 Дб. При больших уровнях на восприятие влияют нелинейные эффекты.
Слуховой аппарат инерционен. При исчезновении звука ощущение исчезает не сразу, а постепенно спадает до нуля. Время, в течение которого уровень громкости уменьшается на 8.7 фон (точнее – 8.6859), называется постоянной времени слуха. Эта постоянная равна 150 – 200 мс.
Два короткие импульса одного уровня воспринимаются слитно, если интервал времени между ними менее 50 мс. Однако, при величине интервала более 30 мс появляется изменение звучания. Этим объясняется тот факт, что явление эхо наблюдается только тогда, когда расстояние до отражающего звук препятствия не менее 9 м.
Нелинейные свойства слуха
При воздействии чистого тона с уровнем интенсивности 100 Дб прослушивается вторая гармоника с уровнем 88 Дб и третья гармоника с уровнем 74 Дб. Их выявляют при помощи «ищущего» тона, частота которого плавно меняется. Эти гармоники называют субъективными. На кратных частотах прослушивают биения.
При воздействии двух чистых тонов с частотами, не попадающими в одну критическую полоску, прослушиваются комбинационные частоты.
Нелинейность позволяет обнаружить разницу фазовых спектров сигналов с одинаковыми спектрами амплитуд.
Эффект маскировки
В тишине хорошо слышны даже слабые звуки (тиканье часов, писк комара и т.п.). В шумной компании можно не услышать даже звонок телефона. Следовательно, при наличии громких звуков порог слышимости возрастает. Повышение порога слышимости слабых звуков при наличии громких называют маскировкой.
Бинауральный эффект
Бинауральным (от лат. bini – два + auris – ухо) эффектом называют возможность определять направление на источник звука благодаря восприятию звука двумя ушами. Этот эффект объясняется тем, что звук приходит к ушам не одновременно и с разной интенсивностью. Бинауральный эффект позволяет определять направление на источник звука (с точностью 30÷ 40), поперечные размеры и глубину источника звука, т.е. создавать акустическую перспективу. Точность определения направления на источник в вертикальной плоскости хуже (~ 200).
При прослушивании двух источников, расположенных на одинаковом расстоянии от слушателя и расстоянии друг от друга в 3 ÷ 5 раз меньшем расстояния до слушателя, возникает ощущение кажущегося источника звука (КИЗ), расположенного посредине, если уровни звука источников одинаковы.
На бинауральном эффекте основана возможность создания стереофонических систем и систем пространственного звучания.
Эффект первой волны (эффект Хааса)
Если разность времен прихода сигналов от двух источников не превышает 30 мс, то направление на источник определяется по первой из приходящих волн. Эффект наблюдается и при большей разности, если отсутствует эхо. Этот эффект необходимо учитывать при озвучивании помещений, т.к. может произойти отрыв звука от его источника, что создаст дискомфорт для слушателей.