Элементы психоакустики

dmitre · 24.Декабрь.2018 21:51:58

Часть 1

Без грамотного использования арсенала средств, наработанных наукой о восприятии звука человеком — психоакустикой, — невозможны определение адекватных критериев качества помещения и их правильное применение на практике. Поэтому, мы решили провести небольшой ликбез по психоакустике. Представляется, что он поможет в дальнейшем глубже почувствовать смысловую нагрузку известных и, может быть, не до конца понятных акустических характеристик комнат прослушивания, студий звукозаписи, концертных залов и т. д. В первой части вкратце описано устройство слуховой системы, рассказано об основных признаках звукового образа (громкости и высоты), обсуждаются границы возможностей слуха.

Задача психоакустики — выяснить, как представляется звуковой образ, описываемый в терминах объективно измеряемых физических параметров, в многомерном пространстве слухового ощущения. В идеале желательно построить функциональную модель слуховой системы, которая позволяла бы установить однозначное соответствие между произвольным акустическим воздействием и его слуховым ощущением. Правда, перспектива решения задачи в такой постановке вряд ли ограничивается ближайшим будущим (как и перспектива создания искусственного интеллекта).

Главный метод психоакустики — психоакустический эксперимент (опыт), в котором, помимо исследователей, участвует, как правило, группа испытуемых. Именно в ходе таких экспериментов были выявлены основные характеристики и постоянные слуховой системы, используемые, в частности, при построении элементов (подсистем) вышеупомянутой модели. Модели слуховых подсистем тем точнее, чем в большей мере учтены объективные процессы, происходящие в периферических и центральных отделах слухового канала связи человека с окружающей действительностью. По понятным причинам работа периферических отделов изучена гораздо лучше, чем центральных, и дальнейшие исследования могут сильно скорректировать некоторые устоявшиеся представления. Но и в отношении периферии далеко не все вопросы сняты.

КОНСТРУКЦИЯ УХА

Опишем вкратце, как устроена периферия слуховой системы. Как правило, ее представляют состоящей из трех отделов: наружного, среднего и внутреннего уха.

К наружному уху принято относить ушную раковину и наружный слуховой проход до барабанной перепонки. Среднее ухо — это воздушная полость, отделенная от наружного уха барабанной перепонкой, а от внутреннего — двумя мембранами овального и круглого окон (да, для выравнивания давления при медленном его изменении во внешней среде существует канал евстахиевой трубки, связывающий среднее ухо с дыхательной системой). Работающий механизм — система рычагов из трех косточек: молоточка, наковаленки и стремечка. Первый одним своим концом прикреплен к барабанной перепонке и через наковаленку и стремечко передает колебания барабанной перепонки мембране овального окна.

Кривые равной громкости Флетчера и Мансона (стандарт ISO 226)

Внутреннее ухо представляет собой сложный лабиринт связанных и заполненных жидкостью каналов, находящихся в височной кости. Часть лабиринта образует сенсорный отдел вестибулярной системы; один из каналов, имеющий спиралевидную форму (улитка), относится к слуховой системе. Вдоль улитки расположены прикрепленные к ее костным стенкам две мембраны — Рейснерова и базилярная. Они делят улитку на три части (канала). Средний канал замкнутый. Два внешних (вестибулярный и тимпанальный) соединяются между собой у вершины улитки. В среднем канале находится рецепторный аппарат улитки — кортиев орган: система волосковых клеток (рецепторов), равномерно распределенных вдоль базилярной мембраны. Имеются две группы рецепторов: одна группа состоит из внутренних волосковых клеток, выстроенных в ряд вдоль мембраны (3500 штук), другая — из трех рядов внешних (12 000 штук). Каждая внутренняя клетка (посредством синаптических контактов) соединяется приблизительно с 10 волокнами слухового нерва. Остальные нервные волокна связаны с внешними волосковыми клетками. Здесь ситуация обратная: каждое нервное волокно одновременно связано с большим количеством волосковых клеток. Такова, очень грубо, схема устройства периферического отдела слуховой системы.

Теперь о том, как это работает. Сигнал звукового давления преобразуется в наружном ухе — единственном линейном звене системы. Характер этого преобразования определяется акустическими свойствами ушной раковины и резонансными свойствами наружного слухового прохода. Последний можно рассматривать в качестве четвертьволнового резонатора. В итоге в целом ровная частотная характеристика (передаточная функция) наружного уха имеет максимум в области около 3 кГц, которая совпадает с областью наивысшей чувствительности слуховой системы (здесь порог слышимости в тишине достигает минимальных значений).

Пульсации давления в наружном слуховом канале приводят в движение барабанную перепонку, которая через систему косточек возбуждает мембрану овального окна улитки. Передаточная функция совпадает с частотной характеристикой фильтра нижних частот: на нижних и средних частотах график идет практически параллельно частотной оси, после приблизительно 1 кГц начинает спадать с крутизной около 12 дБ на октаву. Смещения мембраны овального окна улитки приводят к пульсациям давления жидкости (перилимфы) в вестибулярном и тимпанальном каналах. Разность давлений в перилимфе у мембран овального и круглого окон провоцирует возникновение в базилярной мембране бегущей изгибной волны, распространяющейся от основания к вершине улитки. В силу специфики вязкоупругих свойств базилярной мембраны при возбуждении слуховой системы тональным сигналом амплитуда поперечных смещений имеет максимум в некоей точке, положение которой зависит от частоты входного сигнала. Чем выше частота, тем ближе этот максимум к основанию улитки.

Затем в дело вступают волосковые клетки, преобразующие механические смещения базилярной мембраны в электрический сигнал (внутриклеточный потенциал волосковых клеток). То есть на этом этапе происходит механоэлектрическое преобразование, причем с весьма специфическими свойствами: положительная часть «выходного» электрического сигнала практически повторяет положительную часть входного воздействия (сигнала звукового давления), а отрицательная уменьшается в три раза — такое неполное детектирование. Потенциал волосковой клетки вызывает смещение потенциала дендрита скоммутированного с ней нейрона, что, в свою очередь, приводит к генерации нервного импульса. Итак — свершилось аналого-цифровое преобразование.

Далее поток импульсов направляется на обработку в центральные отделы мозга. Заметим, что повышение амплитуды смещения базилярной мембраны в данной точке приводит к увеличению плотности потока нервных импульсов в окончаниях, связанных с этой точкой нервных волокон. Таким образом, в ответ на произвольное акустическое воздействие на выходе периферического отдела слуховой системы мы получаем пространственно-временной рельеф импульсации волокон слухового нерва, который можно рассматривать как прообраз формирующегося в центральных отделах слухового образа. Черновая работа выполнена, теперь к делу подключаются структуры высшего порядка, в конечном итоге отвечающие за наши суждения о звуке.

ПРИЗНАКИ СЛУХОВОГО ОБРАЗА

Основными параметрами простейшего звукового стимула — колебания звукового давления по синусоидальному закону — являются частота и амплитуда. Этим параметрам в пространстве слухового образа отвечают ощущения высоты и громкости тона.

Область слышимости

При увеличении частоты элементарного стимула повышается и высота тона, но изменение высоты тона отнюдь не везде пропорционально изменению частоты. Субъективную шкалу высот принято градуировать в мелах (или барках: 1 барк = 100 мел), договорившись считать высоту тона с частотой 1 кГц и уровнем звукового давления 40 дБ равной 1000 мел. Если на средних частотах зависимость высоты тона от частоты можно считать пропорциональной, то, например, при изменении частоты сигнала от 1000 Гц до 3000 Гц (то есть в три раза) высота тона лишь удваивается — от 1000 до 2000 мел.

С громкостью ситуация не лучше. Оказывается, что, во-первых, громкость тональных сигналов одинаковой амплитуды зависит от частоты, а во-вторых, она не пропорциональна изменению амплитуды звукового давления. То обстоятельство, что слуховая система человека способна выделять громкость как самостоятельный признак слухового образа, позволяет сравнивать по громкости звуки, в частности с различным спектральным содержанием, или, в простейшем случае, тональные сигналы разной частоты. В этой связи в качестве меры громкости произвольного сигнала логично принять, например, уровень звукового давления некоего эталонного сигнала, равногромкого исследуемому. Нетрудно догадаться, что эталоном был выбран синусоидальный сигнал с популярной частотой 1000 Гц. Единицу уровня громкости назвали фоном. Таким образом, уровень громкости тональной посылки частотой 1000 Гц и с уровнем звукового давления, скажем, 56 дБ составит ровно 56 фон. Чтобы определить громкость произвольного сигнала, достаточно определить уровень равногромкого ему килогерцевого тона.

Известные кривые равной громкости ставят в соответствие каждому уровню громкости кривую зависимости уровней звукового давления равногромких тональных сигналов от их частоты. Впервые эти кривые были получены в 1930-х годах Флетчером и Мансоном и к настоящему моменту претерпели существенные изменения. Сейчас пользуются вариантом, стандартизованным в 2003 году (ISO226).

В качестве чисто субъективной шкалы громкости используется шкала, отградуированная в сонах: тону с частотой 1 кГц и уровнем звукового давления 40 дБ присваивается значение громкости 1 сон; громкость в 2 сона присваивается сигналу, который звучит в два раза громче (слух способен устойчиво фиксировать субъективное ощущение удвоения громкости) и т. д. Оказалось, что для того, чтобы повысить громкость килогерцевого тона в два раза, следует увеличить уровень звукового давления на 10 дБ. Напомним, при удвоении звукового давления уровень сигнала повышается на 6 дБ.

Возрастные изменения чувствительности слуха человека

АБСОЛЮТНЫЕ ПОРОГИ

Возможности слуховой системы грандиозны, но не безграничны. Границы обозначаются так называемыми слуховыми порогами. Различают абсолютные и дифференциальные пороги. Абсолютные определяют верхние и нижние границы слышимости. Дифференциальные — разрешающую способность слуха.

Нижняя кривая в системе кривых равной громкости соответствует нулевому уровню громкости (0 фон). Сигналы с уровнями звукового давления, лежащими ниже этой кривой, не воспринимаются слуховой системой. Это и есть порог слышимости в тишине. Самая верхняя кривая равной громкости устанавливает болевой порог, так что ее вполне можно трактовать как верхний предел возможностей нашего слуха. Диапазон уровней, ограниченный двумя этими кривыми, огромен — он достигает 140 дБ! Впрочем, критерии установления верхнего предела не так однозначны, как в случае с порогом слышимости в тишине. К примеру, кривую равной громкости 100 фон (что для тона частотой 1000 Гц соответствует уровню звукового давления 100 дБ) принято считать порогом возникновения неприятных ощущений. Звуки с уровнем громкости выше приблизительно 130 фон вызывают нетипичные для слуховой системы ощущения — здесь включаются неслуховые сенсорные системы. Этот уровень называют порогом осязания.

Строение уха человека

Если замкнуть контур, намечаемый порогом слышимости в тишине и кривой, соответствующей болевому порогу, то мы получим фундаментальные границы слышимости по частоте: 20—20 000 Гц. То есть ни при каких уровнях громкости сигналы частотой ниже 20 Гц и выше 20 кГц не воспринимаются человеком как слуховые ощущения. Здесь следует отметить, что как инфра-, так и ультразвуковые стимулы при высоких амплитудах все же могут восприниматься человеком, но в подобном случае включаются иные неслуховые механизмы восприятия, и это уже совсем другая история.

Конечно, пороговые кривые очень индивидуальны, и стандартизованные характеристики — результат усреднения данных, полученных при участии большого количества испытуемых. Более того, возможности слуха с годами серьезно сужаются. Так, по некоторым данным, каждые прожитые человеком 10 лет (после двадцатилетнего возраста) снижают верхнюю границу слышимости по частоте на 1 кГц. Кстати, способность к адекватной аудиоэкспертизе очень сильно зависит от индивидуальных пороговых характеристик эксперта. Необратимая деградация слуха происходит и в том случае, если на слуховую систему длительное время систематически воздействуют звуковые сигналы высокой амплитуды (выше 100 дБ). Тут в зону риска часто попадают как раз те специалисты, для кого собственные уши являются одним из основных инструментов профессиональной деятельности.

Пребывание в условиях высокой шумности приводит к временному повышению порога слышимости. И это всего лишь одна из причин, по которой истинный аудиолюбитель должен отказаться от прослушивания музыки при повышенных уровнях громкости, — сужается динамический диапазон восприятия, уходят детали.

ДИФФЕРЕНЦИАЛЬНЫЕ ПОРОГИ

Дифференциальные пороги устанавливают минимальные изменения признаков (параметров) звукового образа, которые способна уловить слуховая система, — изменения уровня, частоты, длительности звукового стимула; положения источника звука при бинауральном слушании.

Величина фиксируемых слухом минимальных изменений в уровнях звукового давления, определяемая в психоакустических опытах при прямом сравнении испытуемыми по громкости двух тональных сигналов одинаковой частоты, разумеется, зависит как от уровней, так и от частоты тестовых сигналов. Наиболее тонко слух чувствует разницу в уровнях приблизительно в середине (в геометрическом масштабе) частотного диапазона, где максимальным является динамический диапазон слуховой системы. Здесь мы способны уловить разницу в 0,5 дБ. На низких и высоких частотах разрешающая способность ушей хуже. В большей мере она зависит от уровня звукового давления — уменьшается с его понижением. Максимальное разрешение достигается при уровнях звукового давления около 100 дБ. Для совсем тихих звуков улавливаемая разница в уровнях сигналов составляет от 1,5 до 3 дБ. Отсюда самым непосредственным образом следуют обоснованность повышенных требований аудиолюбителей к гладкости амплитудно-частотных характеристик (АЧХ) воспроизводящего электроакустического тракта и необоснованность пренебрежительного отношения к акустической обработке комнат прослушивания. Ведь эти последние доводят упомянутые АЧХ до неузнаваемости — перепады могут достигать 15—20 дБ.

Разрешающая способность по частоте также может определяться путем непосредственного сравнения испытуемым двух равных по амплитуде, но различающихся по частоте тональных посылок. Как и следовало ожидать, частотные дифференциальные пороги зависят от амплитуды и частоты звукового стимула. С повышением амплитуды сигнала разрешающая способность слуха растет. При комфортно высоком уровне громкости на низких и средних частотах, по данным разных авторов, разрешающая способность слуха составляет от 1 до 3 Гц. С повышением частоты разрешение ухудшается (в абсолютных значениях), в процентном же отношении (отношении замечаемой слушателем разницы частот сравниваемых тональных посылок к частоте опорного тона) оно выше 800 Гц выходит на приблизительно постоянный уровень около 0,5%. Вообще наш слух способен различить свыше 600 градаций высот тональных сигналов. Для сравнения: весь слуховой диапазон можно уложить в 10 октав (с запасом); в октаве — 12 полутонов; таким образом, в системе равномерно темперированного музыкального строя можно насчитать максимум 120 градаций. Есть куда расти.

Изучение способности человека чувствовать тонкие различия во временнóй структуре сигнала вызывают повышенный интерес. Слуховой анализатор является принципиально нелинейной системой, и мы не можем поставить во взаимно однозначное соответствие временные и амплитудно-частотные характеристики слуха с помощью стандартных методов анализа линейных систем, например, с помощью метода анализа Фурье. И именно исследования в этой области преподнесли немалые сюрпризы. Похоже, можно надеяться, что в ближайшем будущем появится шанс объяснить ряд, казалось бы, необъяснимых возможностей слуха…

Минимальный временной интервал между двумя одинаковыми сигналами (например, короткими тональными посылками), при котором слушатель начинает различать отдельные импульсы, можно считать нижним пределом временнóго интегрирования слуховой системы. Этот предел, как полагают многие исследователи, составляет всего 2 мс.

Не менее интересно выяснить, когда слух начинает чувствовать разницу в длительности двух излучаемых последовательно сигналов. Оказалось, необходимое для различения приращение длительности сильно зависит от длительности исходного импульса. Так, для коротких импульсов длительностью до 1 мс, чтобы различить два сигнала, длительность одного из них нужно приблизительно удвоить. Для сигналов длительностью 0,05—0,5 с приращение должно составлять 5—50 мс.

по материалам журнала “Hi-Fi.ru”, июль 2015 г. www.hi-fi.ru

dmitre · 24.Декабрь.2018 21:53:16

Элементы психоакустики. Часть 2

Мы совершенно справедливо считаем, что одним из главных достоинств звуковоспроизводящего тракта является его линейность. С глубоким удовлетворением отмечаем тот факт, что помещение с хорошей точностью можно считать системой линейной. И в этой связи в продолжение психоакустической темы обязательно следует обсудить вопросы, связанные с нелинейностью восприятия звуковых образов как неотъемлемом свойстве слуховой системы. Здесь же уместно будет сказать несколько слов и об эффекте маскировки.

НЕЛИНЕЙНОСТЬ

Одним из наиболее неприятных последствий воздействия аппаратуры звуковоспроизведения на сигнал первоисточника принято считать нелинейные искажения. То есть те, что обусловлены нелинейностью тракта, одно из проявлений которой — искажение формы элементарного гармонического воздействия. Если тракт линеен, то при подаче на его вход простого тонального сигнала на выходе мы получим такой же чистый тон, который может отличаться от входного только амплитудой и фазой. Изменение же формы гармонического синусоидального сигнала всегда есть следствие нелинейности передающего тракта. Если мы применим к искаженному таким образом сигналу преобразование Фурье, то обнаружим, что кроме основной составляющей (с частотой входного сигнала) в спектре искаженного присутствует в простейшем случае набор гармонических компонент (гармоник) с частотами, кратными частоте входного сигнала.

В простейшем случае музыкальный сигнал включает основной тон и набор гармонических компонент (гармоник или обертонов) с частотами, кратными его частоте

Для многих систем (в общем случае нелинейных) существует некоторый диапазон амплитуд входного воздействия, в пределах которого эти системы можно считать вполне линейными (или пренебречь имеющимися искажениями за их малостью). К таковым смело можно отнести и компоненты системы звуковоспроизведения. Как правило, с повышением амплитуды входного сигнала нелинейные искажения увеличиваются. Так, например, у обычных колонок нелинейность становится тем существеннее, чем больше смещение диффузора электродинамического преобразователя — перестает работать «школьный» закон Гука, устанавливающий линейную зависимость между деформацией упругого подвеса (смещением диффузора) и силами упругости. Именно поэтому нелинейные искажения АС растут с понижением частоты сигнала, ведь для создания одного и того же уровня звукового давления амплитуда смещения диффузора на низких частотах должна быть больше, чем на высоких. В качестве меры нелинейных искажений используют, в частности, коэффициент гармоник (Кг), который определяется как отношение квадратного корня суммы мощностей (квадратов среднеквадратичных значений) гармонического набора (за вычетом мощности основной гармоники) к среднеквадратичному значению основной гармоники. Выражается Кг обычно в процентах. Напомним на всякий случай, что искажения, вносимые помещением, мы договорились считать сугубо линейными.

НЕЛИНЕЙНОСТЬ ТРАКТА И СЛУХ

Восприимчивость слуха к нелинейным искажениям сильно зависит от их характера, проявляющегося, в частности, в структуре гармонического рисунка. Так, основная энергетика искажений может концентрироваться во второй и третьей гармониках, а может быть распределена между гармониками более высоких порядков. По мнению ряда исследователей, слух более чуток именно к последним. При раскладе в пользу старших гармонических компонент слух будто бы способен замечать искажения с коэффициентом гармоник, составляющим чуть ли не сотые и даже тысячные доли процента, что, конечно, должно оправдывать повышенные требования к полупроводниковым элементам тракта, для которых характерна именно такая специфика искажений. А те, что связаны с перекачкой энергии в гармоники низких порядков, становятся заметными на слух при Кг около 1%.

Заметность искажений сильно зависит от характера музыкального материала и способа его обработки при записи. Так, при воспроизведении многих записей (например, рок концерта на стадионе) слушатель может не почувствовать и 10-процентных искажений тракта. Гораздо более высока чувствительность слуха к искажениям т. н. акустической музыки (оркестр)

Следует иметь в виду, что заметность искажений сильно зависит от характера музыкального материала… и от способа обработки исходного сигнала при формировании звуковых дорожек в студии звукозаписи. Скажем, при воспроизведении многих записей, выполненных в современной стилистике, слушатель может не почувствовать и 10-процентных искажений тракта. Заметность нелинейных искажений в значительной степени связана с тем, что в нелинейных системах спектральные составляющие, присутствующие во входном сигнале, начинают взаимодействовать между собой, порождая в спектре выходного сигнала компоненты разностных и суммарных частот. Особенно хорошо слышны разностные…

ПСИХОАКУСТИКА НЕЛИНЕЙНОСТИ

Казалось бы, чувствительность слуха к появлению паразитных призвуков должна означать высокую меру линейности самой слуховой системы, по крайней мере до этапа аналого-цифрового преобразования в спиральном ганглии (см. раздел «Конструкция уха»). Однако это совершенно не так. Единственный более или менее линейный элемент в периферических отделах — наружное ухо (фрагмент от ушной раковины до барабанной перепонки). Более того, нелинейность различных звеньев слуховой системы не только выявляется в ходе нетривиальных измерений на биологических препаратах и на живых организмах животных, но и обнаруживается в ходе сравнительно несложных психоакустических экспериментов. Музыканты с хорошо тренированным слухом отлично улавливают объективно отсутствующие тоны разностных частот, имеющихся в спектре исходного сигнала тональных компонент. Проделать соответствующий эксперимент совсем нетрудно, достаточно лишь воспроизвести одновременно две ноты на, скажем, струнном смычковом инструменте. Наличие, как их иногда называют, фантомных гармоник у чистого тона с фиксированной частотой устанавливают с помощью дополнительного тонального сигнала, частота которого плавно меняется. Опыт основывается на способности слуховой системы четко реагировать на эффект биений, возникающий при наличии двух тональных сигналов с очень близкими значениями частот. Именно эта способность используется при настройке музыкальных инструментов по камертону (исчезновение биений соответствует совпадению частот камертона и настраиваемого инструмента). При приближении частоты дополнительного тона к тем, что кратны частоте основного, слух уверенно регистрирует упомянутый эффект биений, что подтверждает факт наличия субъективных гармоник. Более того, можно достаточно точно оценить амплитуду эквивалентного гармонического сигнала, чей уровень ощущения совпадает с уровнем ощущения гармонических компонент: эффект биений максимален при совпадении амплитуд двух сигналов.

Эффект биений, возникающий при наличии двух тональных сигналов с очень близкими значениями частот, используется при настройке музыкальных инструментов по камертону (исчезновение биений соответствует совпадению частот камертона и настраиваемого инструмента)

Нелинейные искажения слуха резко увеличиваются при росте амплитуды сигнала, но, главное, они заметны и при весьма умеренных уровнях звукового давления. По мнению ряда исследователей, фантомные гармонические компоненты, компоненты суммарных и особенно разностных частот регистрируются уже при уровнях исходных стимулов ниже 40 дБ. Так, коэффициент «наведенных» гармоник, выявленных методом биений с помощью дополнительного стимула, для чистого тона частотой 1 кГц и с уровнем звукового давления 60 дБ составляет приблизительно 4%. А эквивалентный уровень сигнала, вызывающий тот же уровень ощущения, что и вторая субъективная гармоника, чье возникновение обусловлено воздействием сигнала с уровнем звукового давления 100 дБ, составляет 88 дБ. То есть коэффициент гармоник здесь можно считать равным приблизительно 25%. На графике (рис. 1) показана зависимость эквивалентных уровней субъективных гармоник различных порядков от уровня чистого тона, измеренного у входа в слуховую систему. Невооруженным глазом видно, что нелинейность слуховой системы в целом выше, чем нелинейность средней аудиосистемы. Но не надо делать поспешных выводов. Хотя бы потому, что характер нелинейности слуховой системы в отдельных моментах сильно отличается от типичных проявлений в элементах аудиотракта.

О том, что преобразование смещений мембраны овального окна в деформации базилярной мембраны через происходящие в улитке гидродинамические процессы имеет нелинейный характер, написано немало формул самыми разными специалистами, начиная с основателя принятой в настоящее время модели этого преобразования (модели бегущей волны) физика Дьёрдя Бекеши (на фото)

МЕХАНИЗМЫ НЕЛИНЕЙНОСТИ СЛУХА

Механизмов нелинейности в слуховой системе предостаточно, в том числе и гипотетических. При относительно линейном поведении наружного уха среднее ухо при повышенных уровнях звукового давления уверенно проявляет свой нелинейный характер. Форма сигнала смещений мембраны овального окна отличается от чистой гармонической формы колебаний барабанной перепонки (при строго тональном воздействии на входе слуховой системы). По мнению большинства исследователей, это связано с рефлекторным сокращением одной из двух мышц, находящихся в полости среднего уха, а именно мышцы, прикрепленной к стремечку (m. stapedius), при больших уровнях сигнала. Его пороговое значение, при котором регистрируется это сокращение, составляет 80 дБ. Дальше упругость stapedius только возрастает, оберегая мембрану овального окна улитки от чрезмерных деформаций.

Нелинейность преобразования смещений мембраны овального окна в деформации базилярной мембраны через происходящие в улитке гидродинамические процессы описывается немалым числом формул, созданных самыми разными специалистами, начиная с венгерского (по рождению) физика Бекеши, отца-основателя принятой в настоящее время модели этого преобразования (модели бегущей волны). Однако полной ясности в данном вопросе нет и по сей день. Некоторые эксперименты, проведенные на препаратах улитки человека, вообще показали, что улитка ведет себя как вполне линейная система. Вместе с тем опыты на живых мартышках свидетельствуют о существенной нелинейности этого преобразования. Не будем вдаваться в детали деятельности экспериментаторов, отметим лишь их вполне однозначный вывод, что в отличие от препаратов живая улитка как при повышенных амплитудах звуковых стимулов, так и, наоборот, при низких уровнях звукового давления ведет себя как существенно нелинейная система. В общем-то, на поверхности лежит вывод о причастности к процессу эфферентных связей, то есть тех, что обеспечивают контроль центральными отделами слуховой системы движений базилярной мембраны через посредничество наружных волосковых клеток. Уточним, что внутренние волосковые клетки, как рецепторы, передают информацию о смещении мембраны в центральные отделы по афферентным (восходящим) каналам. При низких уровнях звуковых стимулов центральные отделы как бы подгоняют слух, искусственно повышая его чувствительность, а на высоких — придерживают, охраняя хрупкие сенсорные структуры.

Рис. 1. Зависимость эквивалентных уровней звукового давления субъективных гармоник различных порядков от уровня чистого тона, измеренного у входа в наружное ухо. Параметр кривых — порядок гармоник

В целом можно сказать, что нелинейность слуха как неотъемлемое его свойство, включенное в систему формирования звуковых образов, скорее расширяет возможности слуховой системы, чем сужает их. Однако если вы, тестируя домашнюю аудиосистему, подадите на ее вход одновременно два чистых тона с частотами, например, 1 и 1,5 кГц и явно обнаружите присутствие постороннего на частоте 500 Гц, не торопитесь сразу осуждать электронику…

МАСКИРОВКА

Вдогонку несколько слов об эффекте маскировки. Порог слышимости сигналов различной частоты в тишине определяется нижним графиком в системе кривых равной громкости. Он, напомним, устанавливает значения уровней звукового давления, ниже которых сигналы не воспринимаются слухом. В присутствии мешающих звуковых стимулов порог слышимости полезного сигнала может возрастать. Это смещение порога (разница между порогом слышимости в присутствии мешающего стимула (маскера) и порогом слышимости в тишине) называется маскировкой. В роли мешающих стимулов могут выступать как широкополосные шумы, так и тональные сигналы. Отдельные спектральные компоненты сигнала со сложной структурой способны маскировать другие, менее выраженные, входящие в состав того же сигнала.

Рис. 2. Кривые маскировки тональных сигналов различных частот и уровней. По оси абсцисс отложена частота маскируемого тона, по оси ординат — величина маскировки. Параметр кривых — превышение уровня маскируемого тона над его порогом слышимости в тишине, в децибелах. Над каждым графиком указана частота маскируемого тона

Для примера на рис. 2 приведены кривые маскировки тональных сигналов в присутствии маскирующих тонов различной амплитуды и частоты. Первое, что бросается в глаза, — асимметрия (по частотной оси относительно частоты маскирующего тона) кривых маскировки, проявляющаяся более отчетливо с повышением уровня маскера. Оказывается, существенно более эффективной является маскировка высокочастотных сигналов низкочастотными, чем наоборот. Это важнейшее свойство слуховой системы весьма актуально, в частности, в приложении к проблемам акустики небольших помещений. Сильнейшая неравномерность частотной характеристики (передаточной функции) помещения в нижней части спектра, обусловленная явлениями низкочастотных резонансов и антирезонансов, приводит к тому, что нижние компоненты спектра воспроизведенного в этом помещении сигнала маскируют соседние более высокочастотные, которые в иных условиях были бы отлично слышны. Именно поэтому эффект бубнения столь раздражает квалифицированного аудиолюбителя.

Второй момент, обращающий на себя внимание при изучении кривых маскировки, это наличие локальных минимумов, совпадающих по частоте с частотами субъективных гармоник. То есть здесь мы начинаем обнаруживать замаскированный сигнал по эффекту биений с фантомными гармоническими составляющими маскирующего тона. Таким образом, наличие минимумов на кривых маскировки является прямым следствием нелинейности слуховой системы. Кстати, чувствительность сильно нелинейной слуховой системы к значительно меньшей нелинейности звуковоспроизводящего тракта отчасти объясняется реакцией слуха на вполне линейные биения объективных и субъективных гармоник.

Если два коротких сигнала следуют один за другим, то различимость одного на фоне другого зависит от разности амплитуд сигналов, их длительности и интервала. Тут мы сталкиваемся с явлением временной маскировки. Причем имеют место эффекты как прямой, так и обратной маскировки. В первом случае предшествующий сигнал маскирует следующий за ним, а при обратной маскировке роль маскера выполняет второй сигнал.

Продолжение следует…

по материалам журнала “Hi-Fi.ru”, август 2015 г

dmitre · 24.Декабрь.2018 21:54:09

Элементы психоакустики. Часть 3

Как ни пытаются ученые выстроить модели слухового анализатора или хотя бы каких-то его подсистем, например той, что отвечает за восприятие громкости, неизбежно возникают противоречия с объективной реальностью, данной нам в слуховых ощущениях. Даже отдельные устоявшиеся, казалось бы, понятия и характеристики трактуются порой не вполне однозначно.

Как ни пытаются ученые выстроить модели слухового анализатора или хотя бы каких-то его подсистем, например той, что отвечает за восприятие громкости, неизбежно возникают противоречия с объективной реальностью, данной нам в слуховых ощущениях. Даже отдельные устоявшиеся, казалось бы, понятия и характеристики трактуются порой не вполне однозначно. К таким загадочным, многоплановым понятиям относится идея критических полос. А сколько сюрпризов преподносит подсистема объемного восприятия… Попробуем, пусть в общих чертах, осветить эти проблемы.

КРИТИЧЕСКИЕ ПОЛОСЫ СЛУХА

В первом разделе, рассказывая о конструкции уха, мы упоминали, что тональный сигнал провоцирует формирование в базилярной мембране бегущей волны, причем амплитуда поперечных смещений имеет максимум в некоей точке, положение которой зависит от частоты входного сигнала. По факту в ответ на тональный стимул возбуждается целый фрагмент мембраны с максимумом смещений в этой самой точке, и задействованными оказывается множество связанных с данным участком нейронных каналов. Огибающая области возбуждения несимметрична относительно максимума: в направлении к основанию улитки ее характер гораздо более пологий, что, кстати, объясняет несимметричность эффекта маскировки (высокие частоты лучше маскируются низкими). Понятно, что картина восприятия двух близких по частоте тональных сигналов, когда две области возбуждения в существенной мере пересекаются, и далеко отстоящих друг от друга будет разной. Ширине этого участка мембраны соответствует некоторый частотный интервал, имеющий для психоакустики фундаментальное значение.

Кривые частотной зависимости ширины критических полос Δf в герцах (правые ординаты) и в децибелах 10 lgΔf (левые ординаты) для моноурального (А) и бинаурального (Б) слушания по Флетчеру, бинаурального слушания по Цвиккеру (В). График Г — зависимость от частоты ширины 1/3-октавных полос

Наличие характерных частотных областей или полос заметили, в частности, в психоакустических экспериментах по маскировке тональных сигналов шумом. Допустим, мы пытаемся замаскировать узкополосным шумом с равномерной спектральной плотностью (белый шум, пропущенный через полосовой фильтр) тональный сигнал с частотой, находящейся в центре этой полосы. Тогда мы замечаем, что при увеличении ширины полосы шума (спектральная плотность при этом не меняется) степень маскировки растет — нам приходится повышать амплитуду маскируемого тонального сигнала, чтобы его расслышать. Однако когда ширина шумовой полосы становится больше определенного значения, маскировка перестает усиливаться. Да, громкость шума растет, но это не влияет на заметность маскируемого тонального сигнала на его фоне. Это предельное значение полосы Флетчер назвал «критической полосой слуха». При этом он полагал, что сигнал перестает быть заметным на фоне шума, когда мощности сигнала и шума в критической полосе сравняются. Таким образом, зная, какова величина смещения порога слышимости в условиях широкополосного белого шума для тонального сигнала любой частоты, мы легко можем вычислить соответствующие критические полосы. Однако Цвиккер показал, что для различения тона его мощность должна быть меньше суммарной мощности шума, и критические полосы Цвиккера оказались существенно шире, чем у Флетчера. Ширина критических полос меняется с частотой; по Цвиккеру, на низких частотах вплоть до 500 Гц она примерно постоянна и составляет около 100 Гц, далее — около 20% значения частоты. То есть выше 500 Гц ширина критической полосы пропорциональна частоте.

В некоторых случаях одни звуки маскируются другими, более громкими. Например, во время поездки в автобусе можно не слышать речи собеседника, если мотор работает очень громко. Этот феномен называется маскировкой

В пределах критической полосы громкость сигнала остается неизменной при расширении его спектра и при неизменности его мощности. Но как только ширина полосы сигнала превышает критическую, громкость начинает расти. При формировании ощущения громкости сложного сигнала его мощность суммируется в пределах критической полосы, и результирующая громкость оценивается по этой сумме. Если те же сигналы попали в разные (но не сильно удаленные друг от друга) критические полосы, суммируется их громкость. Это совсем не одно и то же: если два разных узкополосных шумовых сигнала с одинаковыми уровнями попали в одну критическую полосу, то итоговый уровень будет на 3 дБ больше уровня суммируемых. А если два сигнала с равными амплитудами попали в разные полосы (недалеко от 1 кГц), то суммарная громкость будет в два раза больше громкости каждого из них. Напомним, что для удвоения громкости сигнала надо повысить его уровень на 10 дБ (а не на 3 дБ).

Весь слуховой диапазон может быть разделен на 24 примыкающие друг к другу граничными частотами критические полосы. В этой связи введена новая частотная шкала, отградуированная в барках (в честь известного ученого Баркхаузена, который ввел единицу измерения уровня громкости «фон»). Таким образом, частотный диапазон слуха делится на 24 барка. Но это не нужно понимать таким образом, что слуховой анализатор можно представить в виде системы из 24 полосовых фильтров. Для каждой частоты слухового диапазона существует своя критическая полоса, свой фильтр, в котором интегрируется мощность звукового стимула, преобразованного в смещения базилярной мембраны. Но отсюда опять же не следует, что слуховая система — это фиксированный набор пусть и большого количества фильтров. Мы вынуждены согласиться с мнением Уоткинсона, что при моделировании слуховой системы необходимо рассматривать реальные движения базилярной мембраны, спровоцированные звуковым стимулом.

Зависимость громкости сигнала от его ширины полосы с центральной частотой 1 кГц и при неизменном уровне звукового давления 60 дБ

Критические полосы можно обнаружить и иным способом. Предъявляя слушателю одновременно два тональных сигнала, в разной мере отличающихся по частоте, ему предлагают сравнить ощущения. Когда частоты сигналов совпадают (сигналы звучат в унисон), имеет место полный консонанс. Если частота одного из сигналов начинает повышаться (или понижаться), то возникает явление биений, которые особенно хорошо слышны при равенстве амплитуд двух сигналов. Напомним, биения — модулированный по амплитуде сигнал с несущей частотой, равной среднеарифметической для двух сигналов и с разностной частотой огибающей. Глубина модуляции определяется соотношением амплитуд двух сигналов; если амплитуды равны, глубина модуляции равняется удвоенной амплитуде сигналов. Для большинства слушателей биения ощущаются при разнице частот сигналов меньше 12,5 Гц. При увеличении разности больше чем на 15 Гц слушатель продолжает воспринимать два сигнала как один, но как бы размытый шероховатый звук. При дальнейшем увеличении дистанции наступает момент, когда начинают различаться оба сигнала, но воспринимаются они как крайне диссонансные. Диссонанс переходит в консонанс, когда второй сигнал (частота которого меняется) покидает пределы критической полосы. В этой связи уместно вспомнить определение критической полосы, данное Шарфом: «Критическая — это такая полоса, в пределах которой слуховые ощущения довольно резко меняются».

ВОСПРИЯТИЕ КОРОТКИХ СИГНАЛОВ

Поскольку базилярную мембрану правомерно рассматривать как резонансную систему, то ее отклик на звуковое раздражение имеет время как нарастания, так и спада. Отсюда, в свою очередь, как минимум следует, что громкость коротких звуков зависит от их длительности.

Для тональных импульсов, длительность которых превышает 200 мс, порог слышимости в тишине совпадает с порогом слышимости длительного тонального воздействия. Для более коротких импульсов порог повышается. Чтобы услышать сигнал длительностью, скажем, 20 мс, его уровень должен быть на 10 дБ выше порогового значения для непрерывного сигнала. При невысоких уровнях громкость тональных импульсов растет с повышением длительности также приблизительно до 200 мс, когда она становится равной громкости протяженного во времени сигнала. Например, звук длительностью 1 мс на 22 фона тише непрерывного тона той же частоты и амплитуды, а при достижении 10 мс — приблизительно на 12 фон. Зависимость громкости от длительности сигнала меняется с повышением уровня. Так, для высоких уровней громкость перестает меняться при длительности, превышающей 70—100 мс.

Зависимость громкости тонального сигнала от его длительности. По оси ординат отложена разность громкости короткого сигнала и непрерывного тона той же амплитуды

Для узкополосных шумовых импульсов (с шириной полосы меньше критической) зависимость громкости от длительности та же, что и для тональных импульсов. Для широкополосных шумовых импульсов установление громкости происходит уже после 50 мс, то есть у шумовых импульсов длительностью больше 50 мс она совпадает с громкостью непрерывного шума. При уменьшении длительности в 10 раз — до 5 мс — порог слышимости повышается не на 10 дБ, как в случае тонального импульса, а на 7 дБ.

Становится понятным, почему звук выстрела из «калашникова» не вызывает болевых ощущений: при амплитуде звукового давления около 140 дБ его длительность составляет всего несколько миллисекунд. Однако следует иметь в виду, что адаптационные механизмы слуха тоже инертны и не всегда успевают включаться при коротком одиночном воздействии. Поэтому импульсные сигналы большой амплитуды представляют особую опасность для здоровья слуховой системы.

ПРОСТРАНСТВЕННАЯ ЛОКАЛИЗАЦИЯ

Наличие двух ушей позволяет нам ориентироваться в звуковом пространстве, локализуя различные источники звука. Эта способность называется бинауральным эффектом. Для локализации по крайней мере в горизонтальной плоскости логично предположить наличие двух механизмов. Первый из них связан с оценкой слуховой системой разности времени прибытия сигнала от источника к одному и ко второму уху. Второй — с оценкой разности интенсивности сигнала у разных ушей. Можно добавить смешанный механизм — когда слуховая система оценивает изменения спектра сигнала.

Зависимость разности времени прибытия сигнала к левому и правому уху от угла (в горизонтальной плоскости) между медианной плоскостью и направлением на источник

Если принять, что диаметр головы равен 18 см, то кратчайшее расстояние от уха до уха составит 26 см. Стало быть, максимальная разница времени прибытия звукового сигнала (в случае расположения источника строго напротив одного из ушей) составит 673 мкс (0,000673 с). Соответственно, при положении источника точно напротив человека она будет равна нулю. При всей ничтожности этой величины именно временной сдвиг является основным механизмом для определения положения источника на низких частотах. Обратим внимание на то, что максимальная разница (источник напротив правого или левого уха) во времени прибытия сигнала с частотой 743 Гц к разным ушам совпадает с половиной его периода, и, таким образом, во временном механизме локализации возникает сбой — он (механизм) не видит никакой разницы между двумя сигналами. Ясно, что с повышением частоты фазовая неопределенность возрастает. Это некритично: на таких частотах начинает эффективно работать механизм локализации, улавливающий разницу в интенсивности.

Естественно, что перепад интенсивности максимален, когда источник расположен напротив одного из ушей — в этом случае противоположное ухо находится в зоне тени головы. Также понятно, что с повышением частоты перепад интенсивности выше — дифракция на низких частотах (когда длина волны превышает размеры головы) практически сводит этот эффект на нет. На высоких же частотах (выше 5 кГц) соответствующая разница в уровнях может превышать 20 дБ.

Известно, что наибольшее число ошибок при определении местоположения источника происходит в диапазоне частот 2—4 кГц, что, возможно, связано со сменой механизмов локализации, приходящейся на эту область. С повышением и понижением частоты (относительно указанного участка) качество оценок растет. Казалось бы, что все более эффективная работа временного механизма на низких частотах должна привести к отличному угловому разрешению на басах, а увеличение разности интенсивности на ушах, которое неизбежно происходит с повышением частоты, — к прекрасной локализации у верхней границы слухового диапазона. Тем не менее источники басов (ниже 150 Гц) вообще не поддаются локализации, а источники тональных сигналов выше 8 кГц локализуются с большим трудом.

Зависимость разности в уровнях сигналов у правого и левого ушей от угла (в горизонтальной плоскости) между медианной плоскостью и направлением на источник для сигналов разной частоты

Если источник сигнала находится напротив слушателя, то в тепличных экспериментальных условия можно обнаружить изменение его положения в горизонтальной плоскости всего на 2°. Если же источник находится справа или слева от слушателя, то образуется так называемый конус неопределенности, в пределах которого мы вообще не замечаем его перемещений. Надо упомянуть, что излучатели спектрально сложных звуков (щелчки, речь и т. п.) поддаются локализации лучше, чем излучатели чистых тональных сигналов. Вообще же в обычных условиях слух замечает угловое перемещение источника в горизонтальной плоскости на 3—4°, а точность локализации (определения направления на источник) составляет около 12°.

Гораздо хуже обстоит дело с локализацией по вертикали. Направление прихода звуковых волн определяется в этом случае с точностью не более 20°. Такой же показатель получается и при одноухом слушании, что, в частности, свидетельствует о высокой роли строения ушной раковины в ориентации по вертикали. Локализация по глубине в условиях заглушенной камеры, как правило, выходит невысокой. Весь сложный аппарат локализации привязывается только к изменению амплитуды сигнала удаляющегося или приближающегося источника. Разностные механизмы здесь не помогают. Вместе с тем в обычных помещениях, в концертных залах чувствительность к глубине сильно возрастает, поскольку появляются многочисленные отражения и к делу подключается бинауральный процессор.

То есть стрелять в цель на слух можно, но только с очень небольшого расстояния и заведомо зная высоту цели. И еще: попробуйте определить координаты соловья…

ЭФФЕКТ ХААСА

Данная особенность слухового восприятия была детально изучена немецким ученым Хаасом и описана в его докторской (PhD) диссертации в 1949 году. И хотя об этом эффекте знали и ранее, свое имя он приобрел после того, как в 1972 году был опубликован английский перевод диссертации. Эффект является причудливым следствием одновременного существования двух механизмов локализации.

Хаас выполнил следующий эксперимент. Чтобы свести к минимуму роль отражений, опыт проводился на свежем воздухе на крыше лабораторного корпуса. Перед испытуемым на расстоянии 3 м была установлена пара громкоговорителей, разнесенная по отношению к слушателю на 45°. На каждый громкоговоритель подавался одинаковый, равный по амплитуде речевой сигнал. В воспроизводящую цепь одного из громкоговорителей была введена линия задержки. Если время прихода сигнала одно и то же, то звуковой образ располагается где-то по центру между колонками. При введении задержки фокус начинает смещаться в направлении громкоговорителя, сигнал с которого приходит раньше. Когда задержка достигает 0,6—1 мс, положение образа совпадает с положением громкоговорителя, звук с которого приходит с опережением. В интервале задержек 0—1 мс говорят о суммирующей локализации, которую используют в стереофонии для создания образов, локализуемых в пространстве между правым и левым громкоговорителями. При дальнейшем увеличении задержки вплоть до 30 мс образ сохраняет единство и его положение совпадает с источником опережающего звука. В диапазоне задержек от 1 до 30 мс мы имеем дело с эффектом предшествования. Когда задержка начинает превышать 30 мс, слушатель постепенно осознает наличие второго образа, положение которого совпадает с положением громкоговорителя с задержкой, однако сигнал из первого громкоговорителя продолжает доминировать. После 50 мс звук запаздывающей системы воспринимается как эхо. Не следует думать, что эффект предшествования обусловлен маскировкой запаздывающего сигнала опережающим. Все задержанные звуки воспринимаются слуховой системой, оказывают влияние на тембр, громкость… Просто мы не ощущаем задержанный и опережающий звуки как пространственно разделенные события. И локализованы они в зоне излучения опережающего сигнала.

Оказывается, для того чтобы заставить слушателя «увидеть» источник задержанного сигнала (в интервале задержек 1—30 мс), нужно повысить его уровень на 10—12 дБ. То есть задержанный сигнал должен быть в два раза громче незадержанного. Разумеется, описанные эффекты существенно зависят от характера сигналов, соотношения их интенсивностей. Совершенно очевидно огромное значение эффекта Хааса для архитектурной акустики. Ведь в помещении слушатель имеет дело как с прямыми, так и с отраженными сигналами, которые правомерно рассматривать в контексте данного эксперимента.

На этом мы завершаем наше трехчастное введение в психоакустику . Не будем обольщаться: то, что удалось осветить, — лишь самая вершина айсберга очень непростой и весьма увлекательной науки. Нетривиальной, как и все области знания, связанные с изучением человеческого восприятия. Здесь особенно четко осознаешь тезис о бесконечности движения к истине. Но у нас столько времени нет, пора применять имеющиеся знания в архитектурной акустике.

по материалам журнала “Hi-Fi.ru”, август 2015 г

Versum · 24.Декабрь.2018 22:13:13

Предлагаю добавить сюда “Основы психоакустики” И. Алдошиной.
Сюда, к сожалению, не загружается, поэтому ссылка на Yandex Disk

birdie · 25.Декабрь.2018 01:51:40

Ко всему выше изложенному надо добавить, что мы пытаемся это всё применять к записанному микрофонами (неизвестно как расположенными), сведённому в студии и излученному акустикой (в некой усреднённой комнате).

Вспоминаем про четыре коробочки Алана Шо.

И о какой оценке аппаратуры по измерениям в таких условиях можно говорить?

valankon · 25.Декабрь.2018 09:37:43

dmitre
Прекрасно! Вы предвосхитили моё желание сделать то же. Надо повышать профессиональный уровень участников. Но есть одно замечание (предложение) - давайте соберём всё в одной ветке. А то есть, что написать - куда. А так всё растворяется и со временем становится недоступно, пойди отыщи в разных ветках. Там “аномалии” здесь “психоакустика”. Ваше мнение.

dmitre · 25.Декабрь.2018 22:34:12

А создал тэг для тем Темы, отмеченные тегом психоакустика
и не страшно, не потеряется.

dmitre · 25.Декабрь.2018 22:35:07

Самый сильный заход-метафора из видео, конечно.

anon37831563 · 26.Декабрь.2018 06:11:18

Есть перевод этого фрагмента?

dmitre · 26.Декабрь.2018 06:20:36

Есть текстовые титры. Можно их вытащить с youtube.

anon37831563 · 26.Декабрь.2018 06:42:42

В каком периоде времени он об этом говорит?

dmitre · 26.Декабрь.2018 07:07:54

fearer · 26.Декабрь.2018 07:14:22

чтобы лучше слушать музыку надо слушать ее вечером а не утром. вечером у меня например восприятие куда лучше чем утром, слышно больше звуков

Vladimir_Khristenko · 26.Декабрь.2018 07:28:01

у меня наоборот.
Утром услышу больше.

anon37831563 · 26.Декабрь.2018 07:29:47

Не в наушниках

fearer · 26.Декабрь.2018 07:35:41

простите но не все тут голубых кровей. некоторые - простые пацанчики как я с соткой (тысяч) в кармане на всю систему, я - человек простой. хочу звук, беру наушники.

DoozBoo · 26.Декабрь.2018 07:40:36

Тут скорее о влиянии на органы слуха. К сорокету прожженный хэдфайщик может быть фрустрирован всякими неприятными штуками. Псевдоотсутствием ВЧ в ушах, например.

palomnik · 03.Май.2019 21:11:16

Вот и я тоже утренний человек. Вечером какая-то слуховая усталость наваливается…

Enfolio · 03.Май.2019 21:14:51

А еще можно прокатиться в метро (минут 40-час, не меньше).
А потом сразу послушать музыку. Не узнаете))
Особенно на низких. Но в течении получаса эффект пропадает.

VVG · 03.Май.2019 21:46:31

А в чем состоит эффект? (Хотя у нас в Минске, чтоб прям час, это нужно туда-сюда, масштаб не тот )