Цифровой аудиоформат 24/192, и почему в нем нет смысла

Бывает не нужна (например, в соответствии со стандартом производства продукции), а бывает что нужна. Если ориентироваться на достижение максимально возможного технического качества в результате - то на сегодняшний день ограничиваться стандартами прошлого века не вижу смысла.

Например - для моей работы общепринятый стандарт 24/48, соответственно плодить сотни гигабайт исходных данных и постоянно иметь проблемы с разножопицей клоков и конвертацией форматов в студии, да ещё и как правило в режиме ограниченного времени - нет никакого резона. И вся работа ведётся в этом формате.
А если вдруг нужно будет записать какую-нибудь музыку, или оцифровать ленту, или ещё что-то подобное вне ( рабочего) стандарта - однозначный выбор будет максимальное разрешение поддерживаемое железом. 24/192, а может даже и DSD5,6.
Вот такая вот практика. Зависит от.

Да, сразу скажу - не все мои друзья-коллеги придерживаются такой позиции, у некоторых тоже есть другое мнение.

3 лайка

Речь о присутствии в реальном сигнале внеполосных составляющих. Упомянутый @Dmitry меандр просто показательный пример тестового сигнала с бесконечным спектром. Если убрать предварительную фильтрацию (мы же сейчас о классической импульсно-кодовой модуляции?) в слышимом диапазоне получим побочные низкочастотные составляющие (Аналого-цифровой преобразователь АЦП, Analog-to-digital converter, ADC | Основы электроакустики).

Думаю для примера можно взять прямоугольный сигнал, спектр которого тоже бесконечен.
Он определяется формулой

Также можно представить суммой 2 сигналов
4V/Pi * Σ(1, N ) sin(kwt)/k
4V/Pi * Σ(N+1,∞ ) sin(kwt)/k

При w=1 ограничиваем N до 22050. Спектр первого сигнала не шире 22050 - он конечен, значит по т. Котельникова его можно без потерь дискретизировать с частотой 2*22050 = 44100.

Спектр второй составляющей начинается от 22050 и до бесконечности. Поэтому мы его не слышим - им можно пренебречь.

Так как в акустике и в любых других волновых теориях действует принцип суперпозиций, то нам никто не мешает представить исходный сигнал (бесконечной суммы) в виде 2 сумм, одна их которых - конечная. Далее, так как спектр второй за гранью восприятия уха (мы её не слышим) - её можно просто убрать и никаких потерь мы не заметим. Но это всё касается конечной обработки для прослушивания, а не для работы. Так как в процессе работы и применения фильтров, сдвигов и прочих операторов… часть границы спектра бесконечного будет отображаться и в слышимую область (и наоборот)

1 лайк

Ряд Фурье, как давно это всё было. )
По мне, 16/44 достаточно, что бы слушать музыку в бытовых условиях. )
Если это по максимому реализовать конечно.
Но и от 24/192 хуже не будет, всё дело в волшебном мастеринге. )
Но вот на моём втором Беркли лучше всего звучат записи HDCD и 24/96.
Возможно, это особенность.

Мое мнение, что качество звучания зависит прежде всего от качества записи, т.е. какие были использованы микрофоны, какое было оборудование, насколько умело был сделан мастеринг и т.д. Если запись качественная, то она отлично звучит и на CD, а если нет, то никакой hi-res здесь не поможет. Когда я сравнивал звучание одних и тех же альбомов в 16/44.1 и 24/96 или 24/192, то очевидно было, что звучат они по-разному, но однозначно сказать что именно звучит лучше зачастую уже достаточно сложно. Хотя часто звучание хай-реза более детальное и в определенных сетапах это может давать ощущение слишком резкого, цифрового звука. Может поэтому к хай-резу у многих возникает негатив.

4 лайка

Хайрез, в данном случае, может помочь и часто помогает тем что под него может быть сделан новый, более аккуратный ре/мастеринг.

Не очень последовательный тезис.

Если речь о “чистой” математике, то это так. Но тогда “заметность” - то есть субъективное понятие, не очень подходит для развития мысли.

Это может показаться семантическими придирками, но нет - как было покзано выше вот так вот взять и “просто убрать” неслышимую часть спектра (от 20КГц) не получится. Любая фильтрация перед АЦП так или иначе, но будет вмешиваться и вносить искажения во вполне слышимую часть спектра.

Поэтому развитие мысли:

Не соответствует реальности - заметим (точнее, можем заметить) и это подтверждается тестами. Таких иследований лет 15 назад было проведено достаточно, и даже под эгидой AES.

Но вот сами для себя - наверняка слушали некий массив записей 16/44 и hires - можете отметить субъективные преимущества (или отсутствие таковых) на форматах высокого разрешения?

1 лайк

HDCD - 99% маркетинга, 1% звука.

А 176 и 192 поддерживаются?

Это вы всё правильно пишете конечно, но разговор-то совсем, совсем не об этом.

Ваши предположения совершенно не верны. Всё обстоит строго наоборот - именно формат высокого разрешения цифровой записи позволяет максимально и с наименьшими искажениями приблизиться к исходной (аналоговой) форме сигнала.

2 лайка

У себя дома слышу все наоборот: никакой рези, никакого цифрового звука… что я делаю не так?

Кстати. Вы же наверняка можете легко построить графики распределения по частотам в реальном файле со 192Khz и 44.1Khz. Или даже график вычитания первого из второго. Много там остается ?

Вопрос сложнее. Он не сводится к тому, есть ли что то выше 20К в оцифрованном (дискретизированном) сигнале.

С технической точки зрения использование апсемплинга до очень высоких частот (мегагерцы) внутри ЦАП абсолютно правильно. Именно поэтому на текущий момент мейнстрим - дельта-сигма.

При апсемплинге (увеличение частоты дискретизации до целевой) со спектром сигнала происходят забавные вещи - он дублируется и отражается в отрицательную область частот (ниже показаны только частотные составляющие >0).
В литературе часто частота Котельникова/Найквиста-Шеннона считается равной 1/2 частоты дискретизации, что и видно на рисунке.

image

В случае HiRes - расстояние между основным спектром и его отражением значительно больше. Т.к. “полезная” составляющая спектра условно 0-20К, а частота дискретизации 192К (например) вместо 44К. Значит, ЦАП значительно лучше выполнит работу по подавлению отражений (интерполирующий фильтр).

Т.е. с технической стороны - HiRes + ЦАП с передискретизацией оптимальный подход, имеющий огромные преимущества. Дельта-сигма - еще более продвинутая вещь.

Но это техническая часть вопроса, не связанная с восприятием слушателя.

3 лайка

Уже упоминал выше по топику, например верхние гармоники группы медных духовых в БСО легко могут доходить до 35-40КГц.

Вот просто два скрина со спектрами, найденные на скорою руку в инете - хайрез и даунсемпл в 44:

Конечно, разница на всегда такая явная, но тем не менее.

1 лайк

Я думаю это три разных вопроса.

  1. Какие частоты нужно сохранять для максимально качественного воспроизведения.
  2. Какие технические методы применять для того что бы сначала сохранить желаемое
  3. Какие технические методы применять для того что бы извлечь сохраненное.
1 лайк

Вопроса три, ответ - один
Хайрез - вот наша тема!
Используя его всегда
Решим мы все проблемы!

:slight_smile:
Шутка конечно, проблем всё равно выше крыши :slight_smile:

Практически - 40-50КГц нормально будет.

Просто консервировать звук в высоком разрешении.

Просто воспроизводить звук в высоком разрешении.

Всё просто :slight_smile:

Да.

TRUCDEOUF

Назовём это разумным минимумом.

Я слышал конечно слухи, что студийные бобинники, на мастер ленте давали диапазон до 100 Кгц.
Но вот тот, что применялся в Совке повсеместно, STM-610 имел частотку от 40гц до 16 Кгц.
Зазор головки не отдаст болше 20Кгц, хоть тресни. )

В этой битве другой интересный момент. Возьмем другой орган с ограничениями - глаза. Они как и ухо имеют свои ограничения снизу и сверху спектра, т.е. условно есть свой видимый диапазон волн.
Так вот, если взять хороший ИК диод (в том же пульте управления телеком или усилком), уйти с ним в темную комнату и жать на кнопки - мы не сможем увидеть мигание диода, сколько бы ярким он не был.

То же самое и с хай-резом - мы не сможем услышать ультразвук выше 20-22кГц (хотя говорят есть заболевание ушей, сдвигающие чувствительность вверх, но мы равняемся на среднестатического фила лет 30-50) вне завимости от того, насколько бы сильным он не был.
Если взять файлик на 192кГц выше, отрезать от него все до 20кГц, а все что выше сдвинуть в слышимую область - интересно что же мы услышим?

2 лайка

Можно светить фонариком в ухо так что бы глаз видел :smile:
Извините, не удержался

А если серьезно, то вопрос по сути сместился из области “чего слышим”, в область как воспроизводим. И тут выигрыш иногда есть.

1 лайк

Очевидно что будем воспроизводить честным цапом - без оверсемплинга и фильтрации