John Atkinson (Stereophile) — слушать и измерять, измерять и слушать!

Джон Аткинсон (легенда!) внес в аудиоиндустрию конструктивный конфликт. В противостоянии «уши против приборов» он сформулировал и десятилетиями придерживался подхода, при котором измерительный прибор задаёт физические пределы, а слух — финальный фильтр значимости.

Именно микс субъективного прослушивания и измерений с конца 1980-х стал визитной карточкой журнала Stereophile, где Джон проработал главным редактором с мая 1986 года по март 2019 года. И в 2026 году он всё там же работает, готовит премию года и выдаёт мощные обзоры, например Dynaudio Contour 20.

По образованию Джон — инженер. Напряжение между академическими успехами в естественных науках в университете и страстью к музыке достигло пика, когда в 24 года он отказался от стабильной работы в научных исследованиях, чтобы отправиться в тур в качестве бас-гитариста рок-группы и записать альбом на Abbey Road Studios.


1972 г. фото в лаборатории прямо перед тем, как бросить науку ради музыки

Карьера профессионального музыканта потерпела крах из-за того, что играл он хорошо, но зарабатывал плохо. В 1976 году он подал заявку и получил должность редакционного ассистента в Hi-Fi News & Record Review — британском журнале, который читал с тех пор, как собрал свою первую аудиосистему.

В 1986 году, менее чем через четыре года после назначения главным редактором Hi-Fi News, в возрасте 38 лет он отказался от достигнутого успеха, чтобы в мае 1986 года присоединиться к тогдашнему Stereophile, выходившему в существенно меньшем формате и нерегулярно. Занимал должность главного редактора до марта 2019 года. За это время Stereophile стал журналом с наибольшим тиражом среди изданий, полностью посвящённых аудио и музыке, в англоязычном мире.

Есть чем гордиться!

Работая в Stereophile, он последовательно разрушал подход индустрии high-end о том, что «уши важнее приборов», показывая случаи, когда восторженные субъективные отзывы коррелировали с измеримыми аномалиями: резонансами корпусов, высокочастотным звоном, нестабильной нагрузочной зависимостью усилителей. В то же время он защищал субъективное прослушивание от упрощения и сведения измерений только к THD+N, подчёркивая, что стереосцена, микродинамика и временная когерентность не сводятся к одной метрике.

Подход Stereophile к обзорам

Две независимые линии:

  1. Субъективное прослушивание — сцена, микродинамика, тембральная целостность;
  2. Измерения — АЧХ, импеданс, спектры искажений, интермодуляция, CSD/«водопады», джиттер, устойчивость на реактивной нагрузке.

ВАЖНО: смысл не в совпадении, а в выявлении расхождения. Если устройство «магически» нравится и одновременно демонстрирует резонансы, подъёмы ВЧ или нестабильность, это фиксируется. Вкус не отменяет физику.

Джон лично выполнял большую часть измерений для журнала десятилетиями, сохраняя методологическую преемственность: сопоставимость графиков разных лет обеспечивалась одним и тем же измерительным подходом.

Но даже такой подход всё равно находил критику и ограничения. Журнал зависит от рекламных денег, поэтому радикальных разносов «икон жанра» практически не было. Условно «плохие» измерения не становились основанием для жёсткого отрицательного вердикта при сильных субъективных впечатлениях. Метод остаётся компромиссным: он показывает, где проблема, но не всегда объясняет, почему именно этот дефект субъективно воспринимается как «характер».

Вклад в культуру дискуссии сложно измерить! Аткинсон снял ложную дихотомию «уши против приборов». И ещё он любит музыку — а это в нашем деле половина успеха.

30 лайков

Это во-многом так. После 1500-го обзора, приходит понимание его логики и психологии с вычетом рекламных материалов. Один из самых авторитетных для меня экспертов, реалист :red_exclamation_mark:

3 лайка

Да, Аткинсон прекрасен! Я же всегда зачитывался обзорами Арта Дадли, мой эталон в аудио-журналистике, который отвечал за субъективное прослушивание в Stereophile. Но каждый шикарный обзор Дадли заканчивался цифрами Аткинсона… после чего приходилось перечитывать Дадли снова и снова )))

4 лайка

A Matter of Dimensions / Вопрос измерений

Джон Аткинсон 5 июня 1989 г.

В последнее время я много читаю. Не знаю, связано ли это со снижением привлекательности записанной музыки из-за всё более редеющих полок с LP в нашем местном специализированном музыкальном магазине (владелец объясняет, что по-прежнему хочет продавать LP; это звукозаписывающие компании всё больше затрудняют ему это карательной политикой возвратов и глухотой к дополнительным заказам), или с тем, что сейчас весна. Но факт остаётся фактом: недавно я обнаружил, что поглощаю целую полку книг, порой лишь отдалённо связанных — ужас! — с высококачественным звуковоспроизведением. Например, «The Tyranny of Words» Стюарта Чейза, впервые опубликованная в 1938 году, — более тонкого исследования того, что впоследствии стали называть семантикой, трудно пожелать; это должно быть обязательным чтением для каждого, кто пишет статьи, всё ещё предназначенные для передачи смысла.

Мне также было трудно оторваться от второй и, предположительно, последней книги покойного Ричарда Фейнмана, не являющейся автобиографией — «What Do You Care What Other People Think?». Этот сборник а) доказывает, что из всех учёных именно теоретические физики, по-видимому, наиболее твёрдо стоят на фундаменте реальности, и б) благодаря включению полного текста приложения Фейнмана к официальному отчёту о катастрофе «Челленджера» демонстрирует, насколько крупные институты начинают больше заботиться о сохранении собственного существования, чем о выполнении своего предназначения (ловушка, которой high-end-компании пока почти все сумели избежать).

Но книга, которая продолжала возвращаться в мою жизнь, — это исчерпывающее собрание опубликованных работ покойного Ричарда Хайзера, изданное Обществом аудиоинженеров под в целом точным, но всё же несколько вводящим в заблуждение названием «Time Delay Spectrometry» (примечание 1). Каждые 10 минут чтения этого доступного тома неизбежно приводили к 10 часам размышлений. Она должна быть в списке обязательных покупок каждого инженера и каждого серьёзного аудиофила.

Я говорю «вводящим в заблуждение», потому что хотя значительная часть академической работы Ричарда Хайзера в области аудио действительно касалась спектрометрии временной задержки, которую он разработал как средство оценки безэховой характеристики громкоговорителя в обычной комнате ещё в 1967 году (примечание 2), философский вектор его текстов, как и у Ричарда Фейнмана, касался более широких последствий того, что поначалу может показаться тривиальным. В частности, Хайзер, который не случайно был также физиком, занимался исследованием вопроса, напрямую затрагивающего этот журнал: социального конфликта между теми, кто слушает, и теми, кто измеряет, и кажущейся дихотомии между измеренным и услышанным. Чтобы дать представление о его мыслях (и пищу для ваших собственных), приведу не совсем случайную подборку цитат из «Time Delay Spectrometry»:

«Оценка акустики громкоговорителей и помещения, в котором они находятся, оказалась микрокосмом всех сложных проблем распространения волн».

«Природа не решает уравнения».

«То, что мы называем временем в аудиоизмерениях, и то, что мы называем частотой, — это разные координаты для описания одного и того же сигнала».

«Высота тона — это не частота».

«На нынешнем этапе развития технологий звуковоспроизведения аудиоинженер разделяет профессиональную цель фокусника».

«Эффект, к которому стремится современное звуковоспроизведение, — это создание приемлемой иллюзии в сознании слушателя».

«Если мы хотим понять, как “измерить” то, что мы “слышим”, мы должны иметь дело с субъективным восприятием и иллюзией звука».

«Реальное звуковое поле в среде прослушивания не тождественно звуковому полю, которое мы можем воспринимать…»

«Конечный продукт — это опыт прослушивания».

«Один из худших секретов аудиоинженерии состоит в том, что то, что мы слышим, не всегда коррелирует с тем, что мы измеряем».

«Те, чья основная профессиональная вовлечённость основана на опыте прослушивания, склонны вырабатывать субъективную точку зрения с оценочными суждениями, редко связанными с инструментальными измерениями».

«Одно из самых унизительных переживаний — высмеивать “чёрное искусство” мастера, который добивается стабильных результатов посредством определённого ритуала, не умея его объяснить, а затем обнаружить, что его действия на самом деле имели более глубокое техническое значение, чем мы понимали тогда, исходя из нашей упрощённой модели».

«Если мы измеряем частотную характеристику системы и делаем это правильно, то мы знаем всё о её отклике. У нас есть вся техническая информация, необходимая для описания того, как эта система будет “звучать”. Но эта информация представлена не в той системе координат, которая будет узнаваема слушателем, ориентированным субъективно… В этом и заключается коренная причина продолжающейся борьбы между субъективным и объективным в аудио. Не в том, что одна сторона более права, чем другая… а в том, что они не говорят на одном языке».

«В следующий раз, когда вы услышите спор между технологом и обладателем “золотых ушей” о слышимости определённых типов искажений… возможно ли, что они не согласны, потому что каждый смотрит через разное окно?»

«Вы там, обладатели “золотых ушей”, те, кому безразличны нынешние технические измерения и кто воспринимает звук как целостный опыт. Вы правы, знаете ли».

Если вам кажется, что моя подборка предвзята в пользу субъективистской точки зрения и что сам Хайзер, должно быть, был безумным обладателем «золотых ушей», то ни то ни другое не соответствует действительности. Если вы, как и я, восхищались обзорами акустических систем Ричарда Хайзера в журнале Audio (полный указатель включён в TDS), вы помните, что он был одним из немногих обозревателей, пытавшихся провести полный технический анализ тестируемого продукта. Перечитайте два его последних отчёта — о Quad ELS-63 (последняя версия которых подвергается испытаниям Сэмом Теллигом и мной в этом номере) и Thiel CS3 — в июньском и ноябрьском выпусках Audio за 1985 год соответственно; это, пожалуй, наиболее исчерпывающее техническое изложение, какое только можно найти. (Его краткие комментарии о прослушивании в обзорах, однако, всегда оставляли у меня ощущение, что он хотел сказать больше, но по каким-то причинам счёл это неуместным.)

Хайзер, по-видимому, страстно верил, что опыт, возникающий при включении нового компонента в систему, может быть объяснён измерениями, отсюда и изобретение TDS. Но ни одно отдельное измерение или даже какой-либо ограниченный набор измерений не может описать то, что услышит слушатель. Его тексты убеждают меня, что когда речь идёт об оценке конечной ценности компонента, имеет значение целое — то есть прослушивание, — а не сумма любых рутинно измеряемых частей.

Цитаты, на мой взгляд, сжато иллюстрируют общий вывод, который вытекает из этого собрания работ Ричарда Хайзера: конфликт между измерением и прослушиванием возникает из-за того, что сторонники обеих позиций используют разные системы отсчёта. Коммуникация невозможна, если не согласован общий язык; именно в этом и состоял тезис Стюарта Чейза.

Может ли автор-субъективист рассчитывать на серьёзное отношение со стороны инженеров, отвечающих за разработку компонентов, которые он слушает, если он говорит лишь о возросшей способности компонента передавать эмоциональное содержание музыки? И ожидает ли он вообще, что его преданные читатели будут воспринимать его тексты всерьёз, когда он пишет нечто вроде «это увеличивает специфичность образа — расположение инструментов и голосов, точные границы между источником звука и окружающим воздухом — примерно на 200%…» (примечание 3). (Звучит для меня как весьма уникальное наблюдение.)

С другой стороны, может ли обозреватель, ограничивающийся испытательным стендом, всерьёз ожидать, что кто-то воспользуется его оценками для принятия решения о покупке, если весь его обзор состоит лишь из уверения, что компонент соответствует набору чисел, которые, по-видимому, произвольно выбраны для обозначения «хорошести»?

«Произвольно?» А какое ещё слово можно использовать, чтобы описать список спецификаций, которые цитируются повсюду — от каталогов до даже заголовков обзоров в Stereophile? Последнее, чего ожидал бы любой рациональный читатель, — это что спецификации могут «описать» звук компонента. Как тогда можно ожидать, что такие спецификации дадут предполагаемый коэффициент «хорошести»? И если они не релевантны, то зачем вообще с ними возиться, кроме того факта, что некоторые из них — чувствительность акустической системы, уровень шума предусилителя и выходная мощность усилителя на различных нагрузках — могут указывать на проблемы согласования системы?

Проблема в том, что традиционные измерения развивались не в направлении, продиктованном их полезностью, а в направлении, продиктованном возможностью их выполнения. Как отмечает Хайзер в TDS, например, измерения акустической фазы были чрезвычайно трудны до появления современных методов TDS и FFT. Поэтому они были исключены из традиционного набора измерений и считались несущественными. Даже тот набор измерений, который мы регулярно проводим для обзоров Stereophile, продиктован тем, что достижимо; мы можем лишь пытаться на их основе объяснить «почему» услышанного «что».

Разумеется, по моему мнению, именно так и правильно: сначала отметить услышанное, затем пытаться объяснить. В ранние дни звуковоспроизведения вся оценка проводилась на слух; испытательной аппаратуры не существовало. По мере развития методов тестирования каждый из них предполагал редукцию сложной смеси параметров, представляющих опыт прослушивания, к одному, который можно измерить и построить график в зависимости от другого: напряжение или давление, отложенные по времени, чтобы получить традиционную частотную характеристику, например, или общий коэффициент гармонических искажений в зависимости от уровня выхода на фиксированной резистивной нагрузке.

Но я уверен, что для тех инженеров, которые разрабатывали подобные тесты 50 и более лет назад, по-прежнему имело значение целостное переживание; измерение использовалось скорее как средство диагностики, чем как инструмент определения качества этого переживания. Однако теперь, в последние годы XX века, возникла целая культура, настаивающая на том, что измерения и есть переживание. Если я когда-либо сталкивался с более вопиющим случаем подмены посланника самим посланием, я уже не помню когда.

Как Хайзер повторял снова и снова в своих эссе и статьях, воспроизведение музыки — событие многомерное. Музыка состоит из мгновенного уровня звукового давления, который изменяется в соответствии с логическими требованиями двух вещей, не имеющих физической реальности: того, как музыка структурирована во времени и по высоте, и того, как эта структура упорядочена композитором/музыкантом. Реальные аспекты конкретной основы, поддерживающей эти две абстракции, по словам Хайзера, по меньшей мере пятимерны, поскольку ни одно измерение причинно не связано с другим (примечание 4).

Звук имеет «где», что уже охватывает три измерения. У него есть «тон», включающий высоту и тембр, сами по себе независимые переменные. Его интенсивность — «сколько?» — изменяющаяся во времени, представляет его динамику. У него есть аспект «когда». Мгновенное восприятие слушателем музыкальных значений в большой степени зависит от того, что было прежде. И то, какой из этих аспектов окажется наиболее важным при оценке качества, будет различным для каждого слушателя.

И вообще, является ли «объективность» подходящим инструментом для оценки ценности в области, где технология служит искусству? Невозможно измерить разницу между хорошим и посредственным исполнением, скажем, фортепианного концерта Моцарта. Редукционизм, присущий научному методу, проинформирует вас о том, «как» были сконструированы два исполнения, но не скажет, какое из них «лучше». «Качество» может быть выведено только посредством целостного подхода, который по необходимости субъективен.

Когда мы покидаем привычный мир электроники и громкоговорителей и обращаемся к компонентам, для которых ещё предстоит разработать набор измерений, позволяющий оценить их ценность, инженер испытательного стенда оказывается в серьёзном затруднении, как видно из обсуждения Питером Митчеллом недавнего обзора CD SoundRings в Consumer Reports в разделе «Industry Update» этого номера. Означает ли тот факт, что их эффект пока не может быть измерен, что они не имеют ценности? Нет, разумеется, нет. Как указывает письмо Стю Глика на стр. 27, если SoundRings действительно вносят звуковое различие, этого достаточно, чтобы оправдать их использование. (При условии, г-н Глик, что они на самом деле не ухудшают звучание — с чем Сэм Теллиг борется в своей колонке «Audio Anarchist».)

Агония и разгорячённая риторика в ответах на комментарии Питера от Ноэла Ли, Билла Лоу и Майка Голдфилда в разделе «Manufacturers’ Comments» этого номера, на мой взгляд, лишь подтверждают, что всё, что требуется кольцам для оправдания своего применения, — это факт изменения звука. Если бы существовали абсолютные доказательства способности SoundRing улучшать качество звучания, мы получили бы три куда более коротких письма.

Подождите, слышу я ваше возражение. Ответ Стивена Симса действительно описывает измерение, демонстрирующее благотворный эффект колец. Похоже, они уменьшают величину джиттера в исходном FM-сигнале, считываемом с компакт-диска. Но, при всём уважении к г-ну Симсу, это может быть правдой, однако его письмо лукаво в том смысле, что полностью уклоняется от вопроса, приведёт ли надевание кольца на диск к лучшему звучанию. Он пытается перескочить от доказательства того, что A = B, к звуковому результату C, не показывая никакой первичной связи ни между A и C, ни между B и C.

Рассмотрим его аргументы подробнее. Временной джиттер в FM-сигнале увеличивает вероятность того, что код «1» будет принят за «0» и наоборот. Следовательно, частота ошибок в исходном сигнале, считываемом с диска, при использовании кольца будет снижена. Но это не имеет значения, поскольку такие ошибки всегда на 100% корректируются, так что они не могут — повторяю, не могут — привести к ухудшению качества звучания! Только в случае, когда собственная частота ошибок на диске уже настолько высока, что дополнительная ошибка из-за джиттера выводит систему коррекции проигрывателя за предел, вынуждая её интерполировать или заглушать сигнал, такие ошибки смогут повлиять на звук (примечание 5).

В этом и заключалась суть собственных экспериментов Питера; если г-н Симс действительно считает, что именно это измерение способно выявить звуковую пользу от использования кольца, то, на мой взгляд, на нём лежит обязанность показать почему. До тех пор у нас есть лишь анекдотические свидетельства, подобные приведённому в письме на той же стр. 27 от читателя Stereophile Бернарда Энгхольма, который обнаружил, что применение CD SoundRing позволило обоим его CD-проигрывателям лучше справляться с катастрофическими провалами в записанных данных на тестовом диске Пьера Верани.

Но помните (перефразируя Хайзера): то, что никто не может убедительно найти измеряемую причину, по которой Rings должны приводить к звуковым улучшениям, не означает, что этого не происходит. Я считаю, что они, как правило, дают улучшение; Сэм Теллиг считает, что они, как правило, приводят к ухудшению. Что думаете вы?

https://www.stereophile.com/content/matter-dimensions


Примечание 1: «Time Delay Spectrometry», мягкая обложка, 280 страниц, формат 8,25" × 11,25", доступна в Audio Engineering Society Inc., 60 East 42nd Street, Room 2520, New York, NY 10165-0075. Цена — 27 долларов для членов AES, 30 долларов для нечленов.

Примечание 2: Идея настолько проста, что для её появления потребовался гений. Метод TDS, ныне коммерчески реализованный в анализаторах компаний Brüel & Kjaer и Techron (Crown), использует перестраиваемый по частоте тон (swept tone) для возбуждения тестируемого громкоговорителя и синхронизированный, но задержанный по времени перестраиваемый полосовой фильтр. Когда временная задержка точно соответствует времени прохождения сигнала от громкоговорителя до измерительного микрофона, любые отражения этого тона от помещения, а также общая реверберация комнаты и т.п., подавляются тем, что к моменту их прихода к микрофону фильтр уже смещён на другую центральную частоту. В результате влияние помещения полностью (в пределах способности фильтра подавлять внеполосные сигналы) устраняется из измерения.

Примечание 3: John W. Cooledge, The Absolute Sound, сентябрь/октябрь 1988 г., стр. 63, как цитируется Майклом Голдфилдом из Euphonic Technology в разделе «Manufacturers’ Comments» данного номера.

Примечание 4: Наилучшим образом описано в статье «A View Through Different Windows», перепечатанной в TDS из журнала Audio, февраль 1979 г.

Примечание 5: С учётом тринадцатилетнего ретроспективного взгляда я рассматривал ситуацию слишком упрощённо. Ошибка временной базы в исходном FM-сигнале, считанном с диска, распространяется через CD-проигрыватель как джиттер тактовой частоты слов (word-clock jitter); хотя этот джиттер можно ослабить с помощью низкочастотной фильтрации, полностью устранить его невозможно, и, следовательно, он будет влиять на восстановленную аналоговую форму сигнала.

6 лайков

Должны ли мы тестировать? Да, должны!

Джон Аткинсон, 5 августа 1989 г.

«Тестировать мы обязаны», — воскликнул бывший редактор журнала High Fidelity Майкл Риггс в передовой статье январского номера 1989 года, осуждая рост субъективного тестирования. (См. боковую колонку с некрологом журнала HF, написанным Питером Митчеллом; теперь издание фактически объединено с Stereo Review.) За исключением акустических систем, где по-прежнему необходимо слушать, писал он, «лабораторные испытания (если они выполнены должным образом) могут рассказать нам практически всё, что нужно знать о характеристиках типичного электронного компонента… Мы знаем, какие параметры важны, как их измерять и как интерпретировать результаты».

При всём уважении к мистеру Риггсу, который, помимо прочего, по-видимому, всё ещё считает, что журналы должны содержать передовые статьи и потому стоит выше заурядного редактора, — это последнее утверждение нелепо. Нелепо. Я бросаю вызов любому: попробуйте взглянуть на полный набор технических характеристик CD-проигрывателя или усилителя и правильно предсказать качество его звучания (сноска 1). Однако я вспомнил эту редакционную статью, когда посетил пресс-конференцию, организованную NAD на выставке SCES 1989 года. (Полный отчёт «коммандос» журнала Stereophile вы найдёте в этом номере.)

Если существует одна фундаментальная характеристика усилителя, которая, казалось бы, должна однозначно коррелировать с тем, что мы слышим, — это его номинальная мощность. Усилитель, рассчитанный на 100 Вт, естественно, должен играть громче (на 3 дБ — для всех технофанатов), чем модель, способная выдать 50 Вт на ту же нагрузку. Однако на CES компания NAD продемонстрировала убедительный пример того, что их ресивер 7100 с паспортной мощностью 50 Вт по стандарту FTC способен выдавать больше вольт без клиппинга на типичную нагрузку (представленную акустикой B&W), чем конкурирующий продукт, рассчитанный даже на 90 Вт. Из этого следовало, что 50-ваттный аппарат NAD будет играть громче без искажений, чем усилитель, официально оценённый почти вдвое мощнее. «Где же теперь ваша аккуратная корреляция между номинальной мощностью и возможной громкостью?» — словно бы воскликнула Злая Ведьма Запада. (Кажется, я перепутал «Десять заповедей» с «Волшебником страны Оз», который NAD демонстрировала на своём впечатляющем новом 13-дюймовом ТВ-мониторе непосредственно перед пресс-конференцией.)

Реальная ситуация, разумеется, гораздо сложнее, чем может показаться на первый взгляд. (Не обращайте внимания на человека за занавесом.) Номинальная мощность по стандарту FTC, задуманная как основной показатель усилителя, относится к максимальной непрерывной мощности. Существует и вторичный показатель — динамический запас мощности IHF («Dynamic Headroom»), который представляет собой отношение максимальной мощности, выдаваемой усилителем в течение короткого импульса длительностью всего 20 мс, к его непрерывной мощности. Усилитель, способный выдать 200 Вт в течение 20 мс, но лишь 50 Вт непрерывно, будет иметь динамический запас 6 дБ. В сочетании с рейтингом FTC этот вторичный показатель должен указывать, насколько громко усилитель сможет играть на заданную нагрузку. (Разумеется, речь идёт о резисторе, а не о реальной акустической системе — а это уже совсем другая история.)

В чём же претензия NAD к FTC? Насколько я понимаю, прежде всего в том, что потребители массового рынка — сокращённо MMC — принимают решение о покупке, ориентируясь исключительно на количество ватт по FTC. Это ставит коммутируемые усилители NAD — как и продукцию Proton и Carver, где используются многорельсовые блоки питания, позволяющие выдавать мощность, во много раз превышающую номинал FTC, при музыкальных транзиентах длительностью до одной секунды и более — в коммерчески невыгодное положение. (Боже упаси, чтобы кто-нибудь из этих MMC действительно послушал, на что собирается потратить свои всё более тяжело зарабатываемые деньги (сноска 2).)

Однако непрерывный рейтинг FTC был выбран не произвольно. Он был навязан индустрии hi-fi, которая доказала свою полную безответственность в способах оценки собственной продукции. Такие мистические величины, как «Peak Power» и «Music Power», использовались направо и налево для создания ориентированных на продажи характеристик, не имеющих ничего общего с реальностью. (Современная автомобильная аудиоиндустрия, где отсутствуют подобные нормативы и где усилитель, способный выдать максимум около 6 Вт RMS на нагрузке 4 Ом, рекламируется как обеспечивающий более 20 Вт (сноска 4), служит примером точности, типичной для индустрии потребительской электроники.)

NAD предлагает новый основной показатель мощности усилителя — такой, который по крайней мере коррелировал бы с тем, насколько громко усилитель действительно играет на музыке. Такой показатель — возможно, под названием «Burst Power», «Music Transient Power» или «Equivalent Loudness Power» (NAD предлагает громоздкое «Musically Effective Burst Power») — должен стать основным указываемым параметром усилителя мощности. Он будет определяться как максимальная мощность на стандартной нагрузке, измеренная с использованием 200-миллисекундного тонового импульса, наложенного на фоновый сигнал уровнем –12 дБ. Рабочий цикл 10% (то есть пик повторяется каждые две секунды) даст отношение пик/среднее 15%, что соответствует наибольшему соотношению, встречающемуся в музыке. Период 200 мс был выбран на основании исследований Питера Митчелла из Stereophile, который установил, что именно такой длительности достигают самые продолжительные транзиенты в музыке. Это также соответствует средней длительности ноты в музыкальном материале, перемежаемой участками на 6 дБ ниже по уровню мощности.

Что ещё важнее, такой импульс достаточно длинный, чтобы его клиппинг был отчётливо слышен. Тест IHF с 20-миллисекундным импульсом не учитывает динамику слухового восприятия. По данным NAD, психоакустические исследования показали, что система ухо/мозг определяет субъективную громкость, интегрируя поступающую энергию в окне длительностью около 200 мс. Следовательно, такой рейтинг напрямую коррелировал бы с тем, насколько громко усилитель будет играть.

Честно говоря, я думаю, что у предложения NAD изменить основное определение мощности по FTC примерно столько же шансов на успех, сколько у меня — стать президентом (сноска 5). Я помню, как в конце 1979 года воодушевился идеей выражать мощность усилителя в дБВт (dBW), что позволило бы напрямую отражать субъективную разницу в громкости. Усилитель мощностью 100 Вт, который MMC считают значительно более мощным, чем 50-ваттный, получил бы рейтинг 20 dBW на 8 Ом. Но поскольку 100-ваттный усилитель на самом деле лишь немного громче 50-ваттного, рейтинг последнего в 17 dBW точнее отражал бы субъективную разницу. В то время мой журнал Hi-Fi News & Record Review публиковал характеристики усилителей именно в dBW. Добавление поправки –3 дБ при каждом уменьшении сопротивления нагрузки вдвое также демонстрировало бы качество блока питания усилителя. Аппарат, выдающий 20 dBW на 8, 4 и 2 Ом, был бы явно лучше того, который показывает соответственно 20, 17 и 14 dBW. Мне казалось, что это блестящая идея.

Никому не было дела. Никто даже не заметил!

Конечно, я должен был понимать лучше. Достаточно было взглянуть на тот факт, что линейные и потому искажённые рейтинги светочувствительности плёнки ASA так и не были вытеснены гораздо более разумными логарифмическими значениями ISO или DIN, чтобы понять: правота ещё не делает идею неотразимой. И всё же мне немного стыдно, что я не настоял на включении мощности усилителей в dBW в заголовки обзоров Stereophile. Возможно, начну со следующего номера. Слушайте внимательно, рецензенты.

Однако важно отметить следующее: оставив в стороне коммерческие мотивы, NAD предложила основной рейтинг мощности, связанный с субъективной громкостью различных усилителей. Основывая систему на психоакустических параметрах уха/мозга, они создают измерение, которое действительно что-то означает — в отличие от коктейля традиционных тестов, подразумеваемых формулой «лабораторные испытания (выполненные должным образом)» из High Fidelity, ни один из которых — если только в нём нет грубой ошибки — сам по себе ничего не значит.

NAD решила бросить вызов FTC и наносить обозначение «Musically Effective Burst Power» на все свои усилители и ресиверы. Купив продукт NAD, вы получите «Extra Loudness» или какое-нибудь подобное маркетинговое украшательство. Это, конечно, может оказаться смелым, но пустым жестом, поскольку, как я понимаю, FTC, как и другие федеральные регулирующие органы, в наши дни страдает от сокращения ресурсов. Но я всё равно аплодирую NAD — браво! — за попытку внести здравый смысл в фундаментальную, но ныне пустую спецификацию.

Всё это — окольный путь к главной теме этого месяца в рубрике «As We See It»: моему восторгу по поводу доклада, представленного на недавней конференции AES Луисом Филдером из Dolby Labs (сноска 6). Сидя среди серьёзных делегатов в огромном канадском конференц-зале, я едва удерживался от желания вскочить и закричать: «Вот именно!», «Говорите правду!» и другие типично английские выражения поддержки. Мистер Филдер, чьи предыдущие работы на AES (о реальном динамическом диапазоне музыки и о корректной спецификации для акустической системы, называемой «сабвуфером» (сноска 7)) показывают, что он обладает по-настоящему праведным складом ума, похоже, намерен едва ли не в одиночку привнести рациональность в измерения, применяемые к CD-проигрывателям.

Мистер Филдер начинает с двух базовых наборов данных: динамического диапазона реального звука и возможностей человеческого слуха. На их основе он определяет, насколько хорошей должна быть система ЦАП, чтобы не вносить слышимых искажений или модуляции шума. Это правильный подход: вместо произвольного выбора числа — скажем, 0,1% КНИ — и объявления всего ниже «хорошим», а выше «плохим», следует вывести абсолютные пределы производительности из первых принципов. Тогда можно понять, почему усилитель с 1% искажений только второй гармоники (типичный классический ламповый дизайн) объективно хуже, но субъективно лучше транзисторной модели с 0,1% искажений, состоящих из гармоник от 7-й до 17-й.

Рассматривая сначала динамический диапазон реальной музыки, Филдер экспериментировал с определением минимального слышимого уровня, используя прерывистый белый шум. Он оказался около 4 дБ SPL — значительно ниже типичного фонового шума в 20–40 дБ SPL. Затем он изучил литературу и провёл собственные измерения пиковых уровней живой музыки. Обычно они составляют примерно 112 дБ пика для классической музыки и до 129 дБ пика для рока. Это означает, что для домашнего воспроизведения необходим динамический диапазон 98 дБ, а для профессионального — целых 122 дБ (!).

Следующая часть исследования касалась остроты человеческого слуха. Хотя Кларк Джонсен категорически не согласен (см. колонку «Letters» в этом номере), Филдер убеждён, что система ухо/мозг действительно действует как многополосный спектральный анализатор, разделяя аудиодиапазон на 25 отдельных зон разной ширины — так называемых «критических полос». Звук, энергия которого сосредоточена в одной критической полосе, всё хуже маскирует звуки в других полосах по мере удаления их центральной частоты. Именно поэтому гул так раздражает в записях камерной музыки: в критической полосе гула почти нет музыкального содержания, поэтому он совсем не маскируется. Сочетание понятий критических полос и маскирования с измеренной чувствительностью слуха по всему диапазону даёт основной критерий слышимости искажений в присутствии основного сигнала.

Рассмотрим пример из статьи Филдера (рис. 23). Возьмём бытовую систему воспроизведения с максимальным уровнем синусоиды 102 дБ SPL (эквивалент 105 дБ пика) — вполне типичный показатель для полночастотных high-end систем. Проиграем тон 500 Гц на уровне –60 дБ относительно 102 дБ, то есть на 52 дБ SPL, и оценим слышимость его гармоник по описанным выше критериям. Относительно высокие уровни низших гармоник всё равно останутся неслышимыми из-за сочетания порога слышимости и маскирования основным сигналом. Даже 1% второй гармоники не будет услышан.

Однако поскольку чувствительность слуха достигает максимума в диапазоне 2,5–5 кГц, а сигналы в этой области лежат в критических полосах, удалённых от полосы 500 Гц, даже очень малые побочные составляющие будут слышимы. Например, седьмая гармоника на 3500 Гц у сигнала, уже ослабленного на 60 дБ от максимума, должна быть ещё как минимум на 50 дБ ниже — то есть ниже –110 дБ — чтобы остаться неслышимой. А если система воспроизведения имеет изменяющийся шумовой фон, как это часто бывает у CD-проигрывателей, то любой сигнал в этой области также должен быть ниже –110 дБ относительно максимума, чтобы шум не был слышен.

Возьмём типичный CD-проигрыватель. Да, на полном уровне его искажения исчезающе малы, и в любом случае они эффективно маскируются высоким уровнем основного сигнала. Но для среднечастотных тонов на уровне –60 дБ ситуация совершенно иная. По критериям Филдера, даже если искажения находятся на 40 дБ ниже основного сигнала (что типично) и состоят преимущественно из высоких гармоник, они всё равно будут слышны — и проигрыватель оказывается недостаточным.

Если вы когда-либо задавались вопросом, почему ламповый усилитель с относительно высоким уровнем искажений на больших уровнях звучит менее искажённо, чем CD-проигрыватель без искажений на больших уровнях, — вот ответ. Искажения усилителя маскируются в большей части динамического диапазона и уменьшаются с уровнем, тогда как CD-проигрыватель по мере снижения уровня вводит всё больше наиболее слышимых и наименее маскируемых типов искажений — именно в тех областях, где традиционно считалось, что такие искажения несущественны.

Учитывая всё вышесказанное, вас может удивить, что я намерен увеличить объём традиционных измерений в поддержку фундаментально субъективных отчётов Stereophile. В последние месяцы мы потратили пятизначную сумму на измерительное оборудование, включая полную двухканальную систему измерений Audio Precision, и наняли технического редактора Роберта Харли для работы в нашей новой лаборатории. (См. рубрику «Industry Update» в этом номере для обсуждения Бобом проблемы CD Soundrings.) Боб будет регулярно измерять каждый компонент, представленный журналу на обзор, принимая во внимание самые современные исследования (включая работы Филдера), какие мы только сможем найти.

В отличие от «глянцевых» изданий, где измерения должны определять или даже заменять опыт прослушивания, работа Боба будет направлена на то, чтобы: а) выявлять откровенно плохие аппараты до отправки их обозревателю; б) накапливать базу измерений, которая со временем выявит корреляции со слышимым; в) удостовериться, что нет простой технической причины для особенностей звучания. (Предусилитель с возрастающей АЧХ фонокорректора всегда будет звучать ярко; тратить большие деньги на компонент со встроенным «темброблоком» — не лучшая идея.) Должен признаться — посмотрите, как легко можно разделить инфинитив, даже не задумываясь — что мне нравится детективная сторона рецензирования, как это было в измерениях в моём обзоре MartinLogan Sequel II в этом номере:

Уотсон: (Ибо это он.) Чёрт побери, Холмс, нет очевидной причины, почему Sequel звучит именно так — но он звучит!

Холмс: (сноска 8) [Глубоко задумавшись: он и та женщина, миссис Ирен Адлер, совершают величайшее преступление, чтобы профинансировать покупку системы WAMM по рекомендации «Audio Anarchist» в колонке этого месяца.] Ха! [Быстрая полуулыбка в сторону сцены — женщины в зале падают в обморок.]

Видите ли, Уотсон, я написал монографию на эту тему. Исследование импульсной характеристики электростатической панели и басового динамика по отдельности всё прояснит. [Квиксотически хмурится.] Именно. [Мужчины в зале вскакивают и аплодируют.]

Я заключаю, что профессор Мориарти — урождённый Гарри Пирсон? — будет очень недоволен. [Сильно затягивается сигаретой; тянется к скрипке и т. д.]

Возможно, этот конкретный приём не сделал абсолютно ясным, почему Sequel II звучит именно так — Холмсу повезло иметь под рукой deus ex machina в лице Конан Дойла, который мог упростить мир, — но у измерений есть своя роль. Они создают базовую структуру для отчёта, основанного на воздействии компонента на музыку, хотя услышанное всегда будет важнее измеренного.

«Мы не верим в магию», — сказал Майкл Риггс в январе. Но за исключением работы Луиса Филдера и ему подобных, современное состояние звуковоспроизведения напоминает мне известный афоризм писателя-фантаста Артура Кларка: «Для примитивного народа любая достаточно развитая технология неотличима от магии». Измерения — да, выполненные «должным образом», но, что ещё важнее, правильно задуманные — поднимут нас над уровнем примитивности. Тогда воспроизведённая музыка не будет магией — она просто будет звучать волшебно.

https://www.stereophile.com/content/must-we-test-yes-we-must


Сноска 1: Возможно, журнал Stereophile должен учредить приз?

Сноска 2: Знаю, знаю: я закончил предложение предлогом. Должно быть, это из-за близости штата Одинокой Звезды к офису Stereophile в Нью-Мексико. Я действительно знаю, где находится мой синтаксис! (сноска 3)

Сноска 3: Конечно, знаешь. — Редактор-корректор

Сноска 4: Чтобы соответствовать требованиям профессии продавца автомобильных усилителей, прежде всего нужно понимать, как получается рейтинг мощности RMS. (Знай своего врага!) При питании, скажем, от автомобильной сети 14 В типичный одноконечный усилитель может обеспечить размах около 12 В пик-пик на акустической системе с сопротивлением 4 Ом. Это напряжение эквивалентно среднеквадратичному напряжению 12 / (2 × √2) = 4,24 В RMS. Это постоянное напряжение, эквивалентное данному переменному напряжению пик-пик, если рассматривать его как источник резистивного нагрева. Согласно закону Ома.

При нагрузке 4 Ом это среднеквадратичное напряжение 4,24 В даст мощность 4,24 × 4,24 / 4 Вт, то есть всего лишь 4,5 Вт! Знаю, знаю, в сезон «прибавь громкость» вы не продадите много 4,5-ваттных усилителей, поэтому давайте воспользуемся мощностью, которая получилась бы, если бы это напряжение пик-пик было, вместо этого, значением RMS. (Ваши покупатели вряд ли являются выпускниками электротехнических факультетов.) Тогда получится — давайте придумаем звучное название — например, «Maximum Peak Burst Power»; нет, заменим слово «Burst», оно намекает, что усилитель не может долго это поддерживать — «Maximum Peak Music Power» величиной 36 Вт! Вот это уже звучит как настоящий мужской автомобильный усилитель! Вы на пути к своей первой продаже. Joe Isuzu гордился бы вами.

Сноска 5: Как постоянно проживающий иностранец, я не могу ни голосовать, ни стать президентом. Но федеральное правительство и штат Нью-Мексико любезно позволяют мне платить много, очень много налогов. Даже налог на грех. Никакого налогообложения без представительства, говорю я.

Сноска 6: Луис Д. Филдер: «Human Auditory Capabilities and Their Consequences in Digital-Audio Converter Design», 7-я Международная конференция AES, Торонто, май 1989 года, доклад 4A. Обратите внимание на список литературы — около 65 источников — как на обязательный перечень актуальных исследований в области психоакустики.

Сноска 7: «Dynamic-Range Requirement for Subjectively Noise-Free Reproduction of Music» и «Subwoofer Performance for Accurate Reproduction of Music» (совместно с Э. М. Бенджамином), Journal of the Audio Engineering Society, июль/август 1982 года и июнь 1988 года соответственно.

Сноска 8: В исполнении Jeremy Brett, а не Basil Rathbone. Я когда-нибудь рассказывал вам, что мистер Бретт однажды помахал рукой моей жене? Нет? Возможно, когда-нибудь…

4 лайка

Заменив «примитивного» на неопытного» и «народа на аудиофила», получаем правду, ответ на многие вопросы и вводные для манипуляции производителей. Впрочем, повторяюсь. О опыте было написано выше как о одном из базовых факторов.

1 лайк

Музыка и фракталы

Джон Аткинсон, 24 ноября 1990 года

«Почему ритмы и мелодии, состоящие из звука, напоминают чувства, тогда как этого нельзя сказать о вкусах, цветах или запахах?» — Аристотель.

Я не претендую на оригинальность следующей идеи, которая, возможно, отвечает на вопрос Аристотеля (сноска 1); впервые я встретил её изложенной в письме некоего Джона Лэмбсхеда, опубликованном в английском журнале Hi-Fi Review (сноска 2). Тем не менее, она настолько тесно перекликается с моим собственным опытом работы с цифровым аудио, что подействовала на меня как сатори.

Прежде чем продолжить, необходимо объяснить, что означает слово «фрактал». Если говорить кратко, формальная геометрия имеет дело с объектами одно-, двух- или трёхмерной природы — математики и астрофизики спокойно оперируют объектами с числом измерений больше трёх; остаётся лишь радоваться, что одно из таких существ не сидит рядом с вами в баре — однако существуют объекты с дробной размерностью. Облака, береговые линии, ветвление деревьев, кровеносные сосуды тела — это объекты или системы, определяемые размерностью между единицей и двумя или между двумя и тремя. Общее у этих математически необычных объектов — самоподобная природа: их макроскопические особенности повторяются в более тонкой структуре, та — в микроскопической, и так далее до бесконечности, своего рода бесконечная изломанность. Без внешней системы отсчёта невозможно оценить их размер или расстояние до них. Такие системы или объекты воспринимаются глазом как «естественные», и использование алгоритмов генерации фракталов значительно повысило правдоподобие компьютерной графики.

В письме мистера Лэмбсхеда отмечалось, что здания традиционного стиля приятны глазу, поскольку обладают псевдофрактальной природой: чем ближе наблюдатель подходит к ним, тем больше деталей он различает. Напротив, «современное» сооружение выглядит тем же самым, только более крупным, по мере приближения. Наследие школы Bauhaus и деятельность популярных модернистов, таких как Ludwig Mies van der Rohe и Cesar Pelli, привели к появлению городских центров, лишённых деталей человеческого масштаба, придающих зданиям интерес и дружелюбие; вместо этого — крупномасштабные, безличные высказывания, лишённые всего, что могло бы говорить с человеком на человеческом уровне. Как однажды выразился Charles III, современная архитектура производит здания «без характера, кроме высокомерия» (сноска 3).

Как в архитектуре, так и в музыке. Мистер Лэмбсхед предположил в своём письме, что звуки естественного происхождения обладают псевдофрактальным характером; то есть их волновые формы содержат богатство тонких деталей, а сами эти детали имеют ещё более тонкую структуру, и так далее, пока изломанность волны не растворяется в аналоговом шуме, сопровождающем любой слышимый звук. Я согласен, что «псевдофрактальный» — корректное определение, поскольку любой звук, кроме шума, не может быть полностью фрактальным: это означало бы отсутствие ограничения полосы частот. Тем не менее, поверхностное изучение музыкальных волновых форм показывает, что без указания временной или амплитудной шкалы невозможно определить ни громкость, ни частоту, что указывает на фракталоподобную природу, по крайней мере в пределах звукового диапазона. Я также добавил бы к гипотезе мистера Лэмбсхеда утверждение, что сама музыка также псевдофрактальна. Крупная структура произведения отражается в меньших масштабах внутри него, вплоть до отдельных нот, формирующих его сущность. А при исполнении эти ноты воплощаются в звуках, продолжающих фрактальный характер.

Отвечая Аристотелю: именно способность музыки содержать в себе — как интеллектуально, так и звуково — слои всё возрастающей детализации, характер, отражающий фрактальную природу реальности, позволяет ей взаимодействовать со слушателем на столь фундаментальном и одновременно сложном уровне. Для понимания и оценки визуального искусства необходим культурный контекст; для понимания музыки достаточно быть человеком.

Помимо возможности набрать очки в споре с давно умершими греческими философами, гипотеза мистера Лэмбсхеда имеет прямое отношение к непрекращающейся дискуссии «аналог против цифры». Аналоговый процесс записи и воспроизведения сохраняет естественный псевдофрактальный характер звука ценой увеличения уровня уже присутствующего шума, который сам по себе фрактален. Цифровой процесс записи и воспроизведения по своей природе неестественен, поскольку не сохраняет псевдофрактальную природу реальных звуков ниже определённого порога. Мелкие детали исходного сигнала просто не записываются.

Кроме того, шум, добавляемый процессом квантования (при отсутствии дизеринга), также неестественен, поскольку напрямую связан с формой входного сигнала, а не носит случайный характер; следовательно, это искажение. Однако если отсечение деталей в цифровой системе происходит на достаточно низком уровне — если система имеет достаточное количество бит — слушатель не осознаёт фундаментального изменения характера музыки и звука. Как неоднократно подчёркивал Стэнли Липшиц перед профессиональным сообществом, корректное применение дизеринга на этапе первичного аналого-цифрового преобразования позволяет сохранить детали сигнала, которые иначе оказались бы ниже номинального порога системы.

Сравнение архитектуры и звукозаписи уместно. При аналоговом сигнале чем ближе вы «подходите» к звуку — чем выше уровень прослушивания — тем больше деталей слышите; единственная плата — рост уровня собственного фонового шума сигнала. В цифровой записи это не так. Независимо от уровня воспроизведения невозможно различить больше деталей, чем было захвачено в момент аналого-цифрового преобразования. Цифровое аудио подобно телевизионному изображению: существует оптимальная дистанция; приблизившись слишком близко, вы начинаете видеть «стыки» изображения.

Это стало для меня очевидным около восьми лет назад, когда я приобрёл компакт-диск Bop Till You Drop музыканта Ry Cooder (Warner Bros. 03358-2), записанный в 1979 году на раннюю цифровую машину 3M. Вступительные гитарные фразы композиции «I Think It’s Going to Work Out Fine» имеют характерное бумажно-гребёнчатое звучание; зернистый фон «пульсирует», изменяя тембр в зависимости от уровня гитары — классическое проявление искажений квантования, сопровождающих сигналы, оцифрованные с недостаточным числом бит. Машина 3M использовала 16-битное кодирование, что теоретически обеспечивало достаточную точность для отсутствия слышимых искажений квантования. Где произошла ошибка?

По имеющейся версии, гитара была записана на слишком низком уровне во время исходных сессий, поэтому при сведении цифровой многодорожечной записи в стерео инженер поднял уровень гитарной дорожки так же, как сделал бы это с аналоговой лентой. Но при цифровой записи слишком низкий уровень эквивалентен использованию аналого-цифрового преобразователя с меньшим числом бит — на один бит меньше при каждом двукратном снижении уровня сигнала. В результате искажения квантования, которые должны были оставаться ниже порога слышимости, стали слышимыми из-за повышения усиления, тогда как в аналоговой системе такое повышение не влечёт потери разрешения.

Чтобы наглядно продемонстрировать это, я использовал запоминающий осциллограф Heath для захвата 20 миллисекунд фрагмента голоса Дж. Гордона Холта с тестового компакт-диска Stereophile с 8-битной точностью. Восстановленная форма волны, синтезированная из 256 уровней, показана на рис. 1. Затем я уменьшил аналоговый уровень в восемь раз, то есть на 18 дБ, вновь захватил голос Холта и умножил цифровые данные на восемь, чтобы получить прежний уровень (рис. 2), фактически повторив ситуацию с записью Рай Кудера. Снижение уровня на 18 дБ эквивалентно уменьшению разрешения на 3 бита, то есть квантованию с 32 уровнями вместо 256. Как видно по более «квадратной» форме рис. 2 по сравнению с рис. 1, увеличение уровня цифрового сигнала на 18 дБ не повышает разрешение деталей, как это происходит в аналоговой системе, а лишь делает ограниченное 5-битное разрешение более заметным.


Рис. 1. Голос Дж. Гордона Холта, закодированный с 8-битной точностью (окно 20 мс).


Рис. 2. Голос Дж. Гордона Холта, закодированный с 5-битной точностью при том же общем уровне, что и на рис. 1 (окно 20 мс). Дополнительную асимметрию следует игнорировать, она случайна.

Можно возразить, что это крайний пример. Цифровое аудио не использует 5- или 8-битное квантование. Речь идёт о шестнадцати битах. Однако 16-битное квантование не является оптимальным для воспроизведения звука. Это лишь уровень, который десять лет назад можно было реализовать массово и относительно недорого, когда спецификация компакт-диска была окончательно утверждена. Прослушивания показали, что человеческое ухо различает искажения квантования при линейной цифровой системе с точностью менее 14 бит; даже 14 бит, применявшиеся в первых видеопроцессорах PCM, оказались близки к пределу приемлемости. Использование 16-битных слов обеспечило в четыре раза более высокое амплитудное разрешение по сравнению с 14-битным и отодвинуло неестественные, немузыкальные эффекты квантования ниже порога слышимости.

Однако это минимальный стандарт, и любое ухудшение, как в примере с голосом Холта, делает систему слышимо неприемлемой. Проблема 16-битной цифровой записи по сравнению с аналоговой, сформулированная несколько лет назад Тони Гриффитсом из Decca, одним из пионеров цифровой записи в Великобритании, заключается в фактическом отсутствии «профессионального запаса». Необходимо заранее знать всё, что планируется делать с сигналом до аналого-цифрового преобразования. Если позже возникает необходимость увеличить уровень, редактировать в цифровой области, добавить эквализацию или свести многодорожечную запись в стерео, каждая из этих операций снижает разрешение, в результате чего то, что должно было оставаться ниже порога слышимости — нефрактальная структура цифрово восстановленной волны — становится очевидным.

По этой причине многие компакт-диски звучат немузыкально по сравнению даже с 30-летними аналоговыми записями. Спецификация может указывать «16-битное кодирование», но после всей постпродакшн-обработки фактическое разрешение данных на диске может составлять 13 бит или меньше. Ларри Арчибальд задавался вопросом, почему компакт-диски звучат немузыкально, тогда как PCM-мастер-ленты Дж. Гордона Холта звучали великолепно. По моему мнению, ответ — в раскрытии цифровым производственным процессом фоновых искажений системы (сноска 4). Добавьте к этому джиттер цифрового потока в проигрывателе или декодере, который фактически возвращает эквивалент искажений квантования, и становится удивительным, что компакт-диски вообще могут звучать музыкально.

Последний фактор — джиттер — как утверждается, частично смягчается различными модификациями компакт-дисков. В послесловии к статье Роберта Харли о таких модификациях (том 13, № 5, стр. 90–91) я описал эксперименты по исследованию шума аналогового сигнала после обработки диска средством CD Stoplight. Хотя сторонники принципа «биты есть биты» утверждают, что улучшить качество считываемых данных невозможно — несмотря на то, что сигнал, представляющий цифровые данные, физически является аналоговым — я обнаружил воспроизводимые изменения формы шумового фона рядом с записанным тоном и небольшое снижение общего уровня шума. Поскольку эти эффекты находятся на границе слышимости, возможно, они позволяют восстановленному аналоговому сигналу сохранять больше исходной псевдофрактальной изломанности. Отмечу также, что сообщающие о субъективном улучшении от подобных модификаций утверждают, что звук становится более реалистичным и более похожим на аналоговый.

https://www.stereophile.com/content/music-fractals


Сноска 1: Из 29-й задачи, как цитируется Германом Гельмгольцем в его классическом труде 1885 года On the Sensations of Tone (стр. 251 издания Dover).

Сноска 2: Hi-Fi Review, январь 1990 года, стр. 5.

Сноска 3: В книге A Vision of Britain: A Personal View of Architecture (Doubleday, 1989), стр. 35.

Сноска 4: Важно различать аналоговые и цифровые системы. В аналоговой системе фон представляет собой случайный шум, не коррелирующий с музыкальным сигналом. В цифровой системе при отсутствии сигнала царит абсолютная тишина; однако при наличии сигнала фон состоит из гармонических и негармонических продуктов искажения, причинно связанных с этим сигналом. Именно поэтому корректное применение дизеринга имеет принципиальное значение. Помимо повышения разрешающей способности цифровой системы в области тонких деталей, он делает то, что иначе было бы связанными с сигналом продуктами искажения, значительно более похожими на естественный шумовой фон аналоговой системы.

2 лайка

Головоломка восприятия

Джон Аткинсон, 7 февраля 1992 года

«Ничто не реально, и не о чем беспокоиться». — John Lennon
«Реальность — не более чем коллективная догадка». — Lily Tomlin

Изображённый выше объект — поюйт? потребие? — озадачил меня чрезвычайно, когда я впервые увидел его в журнале MAD в начале шестидесятых. Разумеется, это трюк: двумерный рисунок даёт противоречивые подсказки мозгу, пытающемуся представить его как трёхмерное твёрдое тело. Я использую этот пример для начала разговора потому, что, несмотря на накопленные знания, чем больше мы узнаём о человеческом восприятии, тем яснее становится, что неизвестного ещё больше. Сэр Francis Crick, открывший вместе с James Watson двойную спираль ДНК, в 1979 году назвал восприятие «величайшей загадкой науки». Сетчатка глаза не функционирует как фотоплёнка, видеотрубка или ПЗС-матрица; уши — не микрофоны. После трёх десятилетий исследований в области искусственного интеллекта не существует способа сделать микрофон осознающим, что он слышит, или видеокамеру — что она видит (сноска 1). В своей книге 1991 года (сноска 2) Эдмунд Блэр Боллс сформулировал эту загадку так:
• «Наши базовые научные представления не способны ухватить нечто фундаментальное для повседневной жизни.
• Мир, который описывают физики, не похож на тот чувственный мир, который мы воспринимаем.
• Мир, который мы ощущаем как несомненно существующий вне нас, по-видимому, зависит от внутренней конструкции, создаваемой нами самими».

Упоминание Боллсом «внутренних конструкций» перекликается с тем, о чём недавно говорил Боб Стюарт из Meridian Audio (сноска 3) и к чему я обращался во вступлении к обзорам акустических систем в прошлом месяце. Когда человек слушает запись через стереосистему, в реальности из громкоговорителей исходят две сложные звуковые волны звукового диапазона. Ощущение того, что инструменты и голоса «висят» в пространстве между и позади колонок, — иллюзия: мозг решает, что именно так это звучало бы на исходном событии. По словам Стюарта, мозг создаёт «акустические модели» на основе информации, поступающей к ушам; эти модели полностью субъективны.

Это происходит автоматически — так же, как при восприятии реальных звуков. Поэтому не кажется странным, что иллюзия звучания и пространственных характеристик симфонического оркестра может быть воспроизведена парой колонок в комнате. При этом не существует измерения двух каналов сигнала, которое показало бы, что они представляют один или все инструменты оркестра. Обычные измерения в обзорах анализируют изменения напряжения или звукового давления лишь в одном канале за раз, тогда как дефекты записи и воспроизведения затрагивают оба канала. Их слышимый эффект проявляется не как прямое измеряемое изменение сигнала, а как изменение характера тех хрупких акустических моделей.

Искажения системы, которые могут казаться незначительными по сравнению с общим уровнем звука, становятся существенными, если соотнести их с подсказками, зачастую очень низкоуровневыми, позволяющими слушателю сформировать конкретную акустическую модель. И наоборот, крупное измеряемое различие может оказаться несущественным, если не влияет на восприятие этой модели.

Мы можем измерять физические различия, но почти не понимаем, как изменения в этих измерениях трансформируют субъективную карту, создаваемую процессами восприятия. Тони Ротман в книге A Physicist on Madison Avenue (сноска 4) показал, что анализ спектров флейт не выявляет субъективных различий между инструментами. Более того, он утверждает, что общепринятое мнение о том, будто тембровые различия определяются спектрами гармоник, ошибочно. Да, существует корреляция между различием звуков и различием их гармонических спектров, записанных в безэховой камере. Однако, по словам Ротмана, «спектры одной и той же ноты гобоя, измеренные в двух разных точках зала, различаются больше, чем спектры одной ноты гобоя и трубы». При этом субъективная разница между «гобойностью» и «трубностью» — идентичностями их акустических моделей — огромна.

Нас учат, что «карта — не территория», но в восприятии субъективная карта и есть территория. Это единственное свидетельство о природе реальности, которым мы располагаем. Когда карта перестаёт соответствовать реальности, мы говорим о безумии или галлюцинации.

Формирование таких акустических или визуальных моделей не тривиально; оно зависит от опыта и обучения. В феврале 1985 года программа «Horizon» на BBC, написанная Хилари Лоусон (в США показанная как часть серии «Nova» на PBS), продемонстрировала, что «видение» и «наблюдение» — разные вещи. Наблюдение требует интерпретации на основе ожиданий и уже сформированных структур. В английском языке различаются «hearing» и «listening» — по наличию осознанности. По словам Лоусон: «То, что мы видим, определяется тем, что мы уже знаем о его существовании».

Без достаточного объёма информации трудно осмыслить услышанное. В четырнадцать лет я на несколько недель поехал в Париж, чтобы улучшить французский. Прибыв, я обнаружил, что не понимаю ни слова устной речи, хотя мог читать. Я не различал границы слов; слышал лишь непрерывный поток мелодичного звука, не более осмысленный, чем пение птиц. Лишь через неделю смысл начал постепенно выстраиваться из хаоса. Аналогично, первое прослушивание «Лондонской» симфонии Воган-Уильямса было для меня хаотичным — набором произвольных звуков (сноска 5). Со второго раза музыка начала структурироваться: фрагмент народной темы здесь, знакомая фраза там. Со временем произведение стало ясным и любимым.

Когда компакт-диск появился почти десять лет назад, многие аудиофилы объявили его «совершенным». И для них он действительно звучал совершенным: сталкиваясь с чем-то полностью вне прежнего опыта, человек не слышит недостатков. Они не вписываются в карту восприятия и игнорируются. Лишь по мере привыкания возникает осознание дефектов и словарь для их описания.

Оценка качества аудиокомпонента — это оценка качества акустических моделей, которые он позволяет создать. Сосредотачиваясь на деталях — локализации, чёткости, точности средних частот, глубине баса, протяжённости верхов — аудиофилы часто забывают главный вопрос: передаёт ли звук музыкальный смысл? Базовое правило: лучший компонент — тот, который облегчает погружение в музыку и открывает слух к новому, а не тот, который соответствует произвольным стандартам (сноска 6).

Текст приближается к болоту семантики «музыкальность против эвфонии против точности». Поэтому напомню заявление Айвора Тифенбруна десятилетней давности: плохая аппаратура затрудняет следование мелодии, хорошая — облегчает подпевание (сноска 7). Мелодия — абстракция, но предмет спора — не она, а восприятие высоты звука.

Часто путают высоту и частоту. Частота — объективна, измерима, одномерна: число гребней волны в секунду. Высота — субъективна, различается между людьми, многомерна; частота — лишь один из факторов (сноска 8).

Она нелинейно связана с громкостью. Воспроизведите синус 440 Гц на умеренном уровне — услышите ноту ля первой октавы. Увеличьте громкость — выше определённого порога высота понизится. Частота не изменится, но нота станет восприниматься ниже. До появления визуальных тюнеров рок-гитаристы, стоя в мощном звуковом поле усилителей, слышали себя «плоско» и настраивались выше строя.

Послушайте речь человека (сноска 9). Высота голоса постоянно меняется, интонации подчёркивают смысл. Воспроизведите запись через плохие колонки — естественные интонации сглаживаются или исчезают. Голос становится монотонным; его формантная структура искажается резонансами динамиков и корпусов, тянущими высоты к собственным частотам.

Когда сторонник Linn Products предлагает «подпевать мелодии», речь не о превращении одной мелодии в другую и не об изменении частот аппаратурой. Речь о проекции субъективной карты высот на реальность и проверке совпадения. Несоответствия становятся очевидными. Как писал Тони Грегори в The Absolute Sound: «Подпевание — прямой способ заставить слушателя относиться к воспроизводимой музыке как к музыке, по одному из её фундаментальных признаков, и оценивать её таким образом».

Звучит естественно. Не так ли?

https://www.stereophile.com/content/puzzle-perception


Сноска 1: Для дальнейшего чтения о сознании и искусственном интеллекте см. январский номер Scientific American за 1990 год, а также второе издание книги Дэвида Берлински Black Mischief (Harcourt Brace Jovanovich, 1988). Также имеет смысл обратиться к работе Дугласа Хофштадтера Gödel, Escher, Bach: An Eternal Golden Braid (Vintage Books, 1979).

Сноска 2: Эдмунд Блэр Боллс, A Second Way of Knowing: The Riddle of Human Perception, Prentice Hall Press. Эта книга также содержит обширную библиографию.

Сноска 3: В интервью с Робертом Харли «The Increasing Importance of the Smaller Difference», Stereophile, том 14, № 9, сентябрь 1991 года.

Сноска 4: Princeton University Press, 1991. Тони Ротман цитирует флейтиста Роберта Дика, отмечая, что лучшие флейты неразличимы для 99-го процентиля слушателей: «Но искусство происходит в оставшемся 1%». Как и в high-end аудио.

Сноска 5: Я упоминаю это произведение, поскольку к своему удивлению нашёл его менее доступным, чем почти современную ему работу Малера Das Lied von der Erde.

Сноска 6: «Проблема сосредоточения на… периферийных качествах воспроизводимой музыки заключается в том, что легко забыть отслеживать, остаётся ли звук верным наиболее фундаментальным качествам музыки, таким как мелодия или даже ритм». — Энтони М. Грегори из Audiophile Systems, The Absolute Sound, выпуск 32, декабрь 1983 года, стр. 9–11.

Сноска 7: См. «Views», Hi-Fi News & Record Review, февраль 1983 года, стр. 21–22, а также «How To Judge a Hi-Fi System», доступно в Audiophile Systems, 8709 Castle Park Drive, Индианаполис, штат Индиана 46256. Телефон: (317) 849-7103.

Сноска 8: Подробное обсуждение субъективной природы восприятия высоты звука см. в статье Дианы Дойч (с приложенным диском примеров) в сентябрьском выпуске Journal of the AES за 1983 год.

Сноска 9: Речь идёт о носителе индоевропейского языка, например английского. Теоретически носители японского языка выражают смысл изменением окончаний слов или добавлением частиц, а не интонационными изменениями высоты.

2 лайка

«Если это звучит хорошо…»

Джон Аткинсон, 26 декабря 1992 года

«…и измеряется плохо, значит, вы измеряете не то!» Если бы один девиз мог суммировать философию Stereophile, это был бы он. Слишком часто мы сталкивались с компонентами, звучавшими музыкально великолепно при измерениях, которые были в лучшем случае просто приемлемыми. Однако в последнее время я начинаю терять уверенность в этой формуле.

Не раз я или кто-то из обозревателей Stereophile слышали в продукте недостатки, которые затем подтверждались измерениями. Казалось бы, вопрос закрыт. Но рассмотрим акустическую систему NEAR-50M, рассмотренную Диком Олшером в этом номере. Услышав в её звучании много хорошего, Дик был обеспокоен проблемой тонального баланса в нижней области верхних частот. Его также тревожило отсутствие интеграции между твитером и среднечастотным динамиком. Когда я измерил 50M, мои графики отклика (сноска 1) практически объяснили, почему Дик услышал именно это. Тем не менее в других обзорах эта система удостоилась восторженных похвал; в одном из них её даже назвали «одной из самых прозрачных и сбалансированных динамических акустических систем, доступных по любой цене».

Возникает вопрос: слышат ли эти другие обозреватели то же, что услышали мы с Диком? Ответ должен быть утвердительным. Если отложить в сторону проблему того, что язык плохо передаёт идеи, то без предположения о возможности разделяемого опыта у разных слушателей сама публикация обзорного журнала лишается философского основания.

Почему одних слушателей беспокоят, по их мнению, серьёзные дефекты, тогда как другие настолько очарованы иными аспектами звучания, что полностью игнорируют то, что первым кажется тревожным? Разница должна заключаться в калибровке их слуха.

Ранее я писал, что наиболее надёжный индикатор качества аудиокомпонента — это целостная реакция слушателя на звук (сноска 2). Но на каком основании строится эта реакция? «Наблюдение требует от наблюдателя значительной доли интерпретации, основанной на ожиданиях и уже сформированных моделях и структурах», — писал я ранее в этом году (сноска 3).

Чтобы реакция действительно отражала качество компонента, слушатель должен предварительно сформировать своё подсознательное восприятие: а) ознакомившись с диапазоном характеристик, доступных «по любой цене», иначе это выражение превращается в пустую риторику; и б) максимально познакомившись с реальными звуками реальных музыкальных инструментов в реальных акустических пространствах.

Последнее — ключевая часть аудиофильского образования. Если человек не научился различать, например, тембровое качество гобоя и сопрано-саксофона или разницу между электрогитарой Fender Stratocaster и Gibson Les Paul, он не заметит, что акустическая система может спутать их звучание — тему, к которой обращался Дж. Гордон Холт в эссе 1964 года, перепечатанном в разделе «30 Years Ago» этого номера.

Если аудиофил знаком с атрибутами живого звучания, он способен оценивать изменения качества звука соответственно. Это верно даже тогда, когда используются искусственные, многомикрофонные и многодорожечные записи. Без такой базы его оценочные суждения будут столь же перевёрнутыми, как и в обзорах некоторых компонентов в других журналах.

Возвращаясь к исходному тезису: когда вы читаете, что компонент «звучит хорошо, но измеряется плохо», необходимо понять, на чём основано понимание слова «хорошо» у автора. Чтобы звучать хорошо, продукт должен по крайней мере демонстрировать компетентную инженерную реализацию. И может оказаться, что «звучит хорошо» для некоторых слушателей не означает «нейтрально» или «точно». Моя задача как редактора Stereophile — следить за тем, чтобы для авторов журнала эти понятия совпадали. — Джон Аткинсон

https://www.stereophile.com/content/if-it-sounds-good


Сноска 1: График выше относится не к акустике NEAR. Однако это также пример системы с плохими измерительными характеристиками, которую редактор другого журнала объявил новым эталоном в своей ценовой категории.

Сноска 2: «The Puzzle of Perception», том 15, № 2, февраль 1992 года, стр. 7.

Сноска 3: См. A Second Way of Knowing: The Riddle of Human Perception Эдмунда Блэра Боллса (Prentice Hall Press, 1991) и Consciousness Explained Дэниела К. Деннета (Little, Brown & Co., 1991).

1 лайк

Джон Аткинсон про важность измерений в аудио

Важное интервью из которого видны совершенно разные подходы.

Интервью с John Atkinson — это системное обоснование роли измерений в аудио, а не их защита как самоцели. Его позиция строится на нескольких жестких тезисах.

1. Измерения — фильтр профессионализма.
Первая функция измерений — не корреляция со звуком, а проверка компетентности разработчика. Базовый набор тестов сразу показывает: перед тобой инженер или любитель, «живущий мечтой». Если параметры хаотичны, если поведение устройства нестабильно, это не обязательно означает плохой звук, но означает непродуманность конструкции. Об этом рецензент обязан сообщать. Измерения — инструмент выявления инженерной дисциплины.

2. Корреляция есть, но она сложная.
Atkinson не ищет прямой формулы «плоская АЧХ = хороший звук». Он анализирует, объясняют ли измерения субъективные впечатления. Если колонка меняет тембр инструментов — это ошибка. Его принцип: если система делает Stratocaster похожим на Telecaster, скрипку — на альт, Jaco Pastorius — на Jack Bruce, значит, есть искажение, даже если слушателю «нравится». Нравится — не критерий корректности. Корректность — это сохранение идентичности инструмента на множестве записей.

3. Баланс ошибок возможен, но это осознанная стратегия.
Он приводит пример колонок Zoo: измерения «странные», но дизайнер сознательно балансирует недостатки, усиливая сильные стороны. Atkinson проверяет это лично: слышит измеренные дефекты, но также слышит динамику и присутствие. Вывод: измерения не отменяют прослушивание, они задают рамку понимания.

4. Усилители: важна стабильность искажения.
Его текущий фокус — не просто уровень гармоник, а их поведение при изменении мощности и частоты. Допустимо наличие второй или третьей гармоники, если их соотношение стабильно и нет высоких порядков. Главное — чтобы усилитель не менял характер в зависимости от сигнала. Он говорит об идеале: устройство делает свою работу и не трансформируется под нагрузкой. Немногие усилители этому соответствуют.

5. Лампы против транзисторов — вопрос архитектуры.
Он цитирует Peter Walker из Quad: плохую ламповую схему трудно сделать — либо работает, либо нет. Транзисторную можно «исправить» глубокой отрицательной обратной связью, скрыв плохую открыточную характеристику. Это не романтизация ламп, а указание на инженерную прозрачность схемы.

6. Прозрачность — не отдельный параметр.
Он определяет ее как «чистое окно» в событие. Загрязняют окно три вещи: искажения, резонансы, модуляционный шум. Прозрачность — не магия, а отсутствие этих артефактов. Если колонка шумит только во время сигнала — это измеримо и слышимо. Он описывает случай электростатической системы с хаотическим поведением диафрагмы, создающим модуляционный шум. Оба рецензента это услышали.

7. Диагностика предшествует музыке.
Atkinson мыслит как инженер. Он сравнивает каждое устройство с экзаменационной задачей: коробка с двумя клеммами — выясни, что это и что она делает. Сначала диагностические сигналы, потом музыка. Музыка сложна и изменчива; тестовые сигналы изолируют поведение. Пример — двойной моно розовый шум для оценки фокусировки образа: если центр размыт, есть проблема с фазой или резонансами.

8. Самокритичность измерителя.
Он описывает случаи тройных проверок, смены микрофонов и методик. Если данные странные, сначала подозрение падает на себя. Только после повторяемости выводы становятся окончательными. Производители иногда подтверждали дефекты — вплоть до ошибки в строке кода.

9. Размер колонок и физика.
Большие системы дают больше баса, динамики и масштаб сцены. Но это не гарантия лучшего звука. Малые мониторы могут быть корректными в пределах ограничений. Большая система создает «большое окно» в зал, маленькая — уменьшенную модель. Вопрос не в «лучше», а в масштабе и возможностях.

10. Опыт живого звука как эталон.
Он подчеркивает свою музыкальную биографию: знание реальных тембров — фундамент оценки. Если на десяти записях скрипка звучит как альт, проблема в системе, а не в записи. Эталон — акустическая реальность, а не предпочтение.

Главная мысль Atkinson: измерения — не противоположность слуху. Это способ понять, что именно делает устройство. Они выявляют характер, ограничения и ошибки. Субъективное удовольствие не отменяется, но должно быть объяснено. Его позиция не «верить приборам», а «знать, что происходит».

2 лайка