Цифровой аудиоформат 24/192, и почему в нем нет смысла

Если Вы не отличаете с/ш аппаратуры от с/ш записи я то здесь при чём? С/ш самой записи и определяет её динамический диапазон, и характеристики аппаратуры динамический диапазон записи не меняют.

Дичь не пишите. И не тратьте силы на ответы, мне они уже не интересны.

2All

Для остальных читателей ветки объясню, почему так важна bit depth при оцифровке аналоговых лент, да и вообще при любой звукозаписи. Дело в том, что у аналоговой и цифровой звукозаписи существует принципиальное, я бы сказал краеугольное различие.
У аналоговой техники - приборов, обработки, ленты и тп искажения сигнала растут с повышением его уровня, в то время как у цифровой строго наоборот - с понижением.
Это соотношение не линейно и нельзя рассчитать однозначные пропорции (прежде всего со стороны аналогового домена).
То есть оцифровывая тихий сигнал (на аналоговом носителе) мы в цифровом домене получаем бОльшие искажения, чем оцифровывая аналоговый сигнал уровнем близким к 0dBfs. Эти искажения можно обозначить как quantisation error в математическом смысле, или quantisation noise в физическом.

Насколько это заметно в субъективном смысле, сравнивая 16 и 24(20) бит оцифровки? На мой взгляд - заметно. Именно глубина битности определяет правильное и качественное воспроизведения т.н. subtle sounds - тончайших послезвучий, реверберционных откликов, нюансов, деталей и тд и тп.
А ведь именно эти параметры в сумме и отличают качественный трансфер. И определяют уровень записи в целом.

13 лайков

И вам того же.
Прежде чем сигнал оцифровать его необходимо получить. Даже в солидных студиях невозможно записать музыкальное исполнение в сотношении с/ш более 100дб (обычно не более 96). Этот шум отлично слышно на студийных мониторах с высокой чуствительностью и его дальнейшее преобразование в АЦП ничего не изменят, будь это даже 48 бит. Уровень шумов в пиках ( разница между максимальной апмлитудой сигнала и шума) будет не более 96дб.
Приведённые Вами расчёты основаны на идеальном сигнале и не имеют отношения к теме, потому что при правильной и грамотной реализации Вы не услышите разницы между 16 и 24 бит. Просто реализация с 24 бит проще.

@Dmitry , простите за возможно дурацкий вопрос - а почему нельзя оцифровывать сигнал в логарифмической шкале? Тогда на диапазон тихих сигналов будет приходиться больше бит, и они будут оцифровываться точнее.
Или оно так и оцифровывается?

1 лайк

Попытался расслушать разницу - не вышло. Надо бы проверить содержимое файлов, может там просто ноликов до 24 бит добили.

Согласно стандарту PCM цифровой аудиосигнал представлен в двоичной форме, где понятие разряда представляет из себя степень в которую нужно возвести число 2. Очевидно, что изменение разряда на единицу предполагает увеличение в 2 раза. То есть представленный в двоичной “цифре” звуковой сигнал с каждым битом увеличивает амплитуду в 2 раза. Таким образом каждый дополнительный бит, выраженный после ЦАПа в вольтах выходного напряжения - как раз на 6дБ.

Это отсюда:

Тема уже поднималась, можно в целом ту ветку почитать для информации.

1 лайк

Давайте мне какой-нибудь аудиофайл, я его в 64-бит станции пересчитаю по пикам, ну например -60dBfs, и результат представлю его в виде 24 бит и 16. А вы послушаете и попробуете понять разницу?

Я знаю, что такое двоичная система счисления. Я имел в виду другое:

Допустим, у нас есть 16 разрядов, это означает, что мы располагаем 2^16 = 65536 разными уровнями громкости. Предположим для простоты, что сигнал на вход в АЦП имеет амплитуду от -1V до +1V. Это означает, что на каждый наш уровень громкости будет приходиться изменение уровня входного сигнала 2/65536 V ~ 3E-5 V. То есть изменение уровня сигнала меньше, чем на 3E-5 V, мы вообще не сможем записать, если уровень сигнала линейно отображается на цифровые значения в PCM кодировке.
Я правильно рассуждаю?

1 лайк

Отлично!

Тогда без труда обнаружите свою ошибку в этом тезисе:

:slight_smile:

Ссылка в помощь (была пару постов назад):

Честно говоря, не увидел ошибки в своих рассуждениях.
Но ответ на свой изначальный вопрос нашёл в разделе “Floating point” - в таком представлении ошибка квантизации распределена как раз логарифмически, т.е. на малых уровнях и на больших уровнях ошибка одна и та же относительно уровня сигнала.

Следующий вопрос - а почему всё аудио не записывают во floating point представлении? Но это видимо уже не к вам )

1 лайк

Изменение напряжения на входе (если АD) или выходе (если DA) при изменении амплитуды цифрового сигнала на 1 бит - это не постоянная величина, а относительная (кратная). 1bit = 6dB = 2 раза по напряжению.

Нет таких устройств :slight_smile: А вот в большинстве цифровых рабочих станций такой режим внутреннего представления аудиосигнала присутствует (32bit float) и частенько используется (я правда его не применяю).

Так, давайте всё таки оперировать физическими величинами и конкретными числами, так будет понятнее.
Вот у нас ноль вольт на входе в АЦП (рассчитанного на амплитуду -1V…+1V). Какое это будет число в 16-bit PCM кодировке?
Потом у нас стал не ноль вольт, а +0.5V. Во сколько раз +0.5V больше, чем 0V? В бесконечное количество раз. Что запишется в PCM?

Нет, потому что сложно/дорого, или просто никому не сдались эти тихие звуки?

1 лайк

Да. Это вы были правы, а я недопонял мысль. Вот теоретическая картинка для 3-х битного АЦП:

Ага, значит там всё таки простое линейное отображение вольтажа на числовое значение в PCM.

И очевидно да, такая схема хреново записывает тихие звуки, и с избыточным разрешением записывает звуки громкие. Почему все на это забили и не стали использовать представление с плавающей точкой или логарифмическую шкалу вместо линейной - непонятно.
:man_shrugging:

ну это очень сильное предположение :slight_smile: громкие звуки все же незаслуживают грубого с ним обхождения

Заслуживают, у человека чувствительность слуха логарифмическая, а не линейная. Т.е. разницу на одну “единицу абсолютной энергии” между двумя громкими звуками мы различаем гораздо хуже, чем разницу на одну “единицу энергии” между двумя тихими.

1 лайк

это все понятно. Но если ближе к реальности, то следует открыть в любом простейшем звуковом редакторе музыку (которая вам нравится) и посмотреть как эти громкие звуки там выглядят. С точки зрения реального сигнала по амплитуде нет разницы между тихими и громкими звуками - гребешки гармоник везде. Собственно потому то вся современная дельта-сигма гибридная. Там верхние значимые разряды всегда мультибитные.


Я бы не сказал, что нет разницы по амплитуде…

Не только тихие звуки, но и (относительно) небольшая разница между уровнями сигнала тоже не отражается в низко-битном представлении сигнала. И это как раз потеря в разрешении оцифровки аналогового сигнала, называется “ошибка квантования” (quantisation error), которую можно представить как “шум квантования” (q. noise).

Ну и “избыточным” разрешение тоже нельзя назвать, тк оно определяет точность амплитуды в максимальных значениях.

Потому что это (float) уже рассчётное представление, аналогичное представлению графики в векторном виде, например.
И ещё, технически на сегодняшний день максимально достижимое (в готовых приборах и схемах) максимальное фактическое разрешение в 20-22 бита. Там много причин, в тч тепловые (джонсоновские) шумы элементов схемы, которые определяют шумовой порог снизу.

Но (самое главное!) и этих 20-22 бит для записи-воспроизведения звука вполне достаточно. 120-132 дБ ДД и SNR обеспечивают самое высокое качество. Помните, выше я отмечал, что лучшие средства звукозаписи аналоговой эпохи давали 105дБ С/Ш и при этом до сих пор считаются непревзойдёнными по субъективному качеству.
Поэтому резюме - для первичной записи формат 16 бит скорее недостаточен (зависит от исходников конечно), 24 fixed-point бита - достаточен всегда и везде при грамотной реализации.
32bit float (1528 dB DR!) может использоваться только для внутренней обработки рабочих станций (так зачастую удобней и быстрей для математики DSP) и как промежуточный формат хранения/переноса файлов.

2 лайка

Ну конечно, только вы не вступление смотрите, а серединку