Цифровой аудиоформат 24/192, и почему в нем нет смысла

Alex_S · 01.Февраль.2020 23:10:00

Если Вы не отличаете с/ш аппаратуры от с/ш записи я то здесь при чём? С/ш самой записи и определяет её динамический диапазон, и характеристики аппаратуры динамический диапазон записи не меняют.

Dmitry · 02.Февраль.2020 15:02:03

Дичь не пишите. И не тратьте силы на ответы, мне они уже не интересны.

2All

Для остальных читателей ветки объясню, почему так важна bit depth при оцифровке аналоговых лент, да и вообще при любой звукозаписи. Дело в том, что у аналоговой и цифровой звукозаписи существует принципиальное, я бы сказал краеугольное различие.
У аналоговой техники - приборов, обработки, ленты и тп искажения сигнала растут с повышением его уровня, в то время как у цифровой строго наоборот - с понижением.
Это соотношение не линейно и нельзя рассчитать однозначные пропорции (прежде всего со стороны аналогового домена).
То есть оцифровывая тихий сигнал (на аналоговом носителе) мы в цифровом домене получаем бОльшие искажения, чем оцифровывая аналоговый сигнал уровнем близким к 0dBfs. Эти искажения можно обозначить как quantisation error в математическом смысле, или quantisation noise в физическом.

Насколько это заметно в субъективном смысле, сравнивая 16 и 24(20) бит оцифровки? На мой взгляд - заметно. Именно глубина битности определяет правильное и качественное воспроизведения т.н. subtle sounds - тончайших послезвучий, реверберционных откликов, нюансов, деталей и тд и тп.
А ведь именно эти параметры в сумме и отличают качественный трансфер. И определяют уровень записи в целом.

Alex_S · 02.Февраль.2020 15:20:39

И вам того же.
Прежде чем сигнал оцифровать его необходимо получить. Даже в солидных студиях невозможно записать музыкальное исполнение в сотношении с/ш более 100дб (обычно не более 96). Этот шум отлично слышно на студийных мониторах с высокой чуствительностью и его дальнейшее преобразование в АЦП ничего не изменят, будь это даже 48 бит. Уровень шумов в пиках ( разница между максимальной апмлитудой сигнала и шума) будет не более 96дб.
Приведённые Вами расчёты основаны на идеальном сигнале и не имеют отношения к теме, потому что при правильной и грамотной реализации Вы не услышите разницы между 16 и 24 бит. Просто реализация с 24 бит проще.

asuilin · 02.Февраль.2020 16:13:56

@Dmitry , простите за возможно дурацкий вопрос - а почему нельзя оцифровывать сигнал в логарифмической шкале? Тогда на диапазон тихих сигналов будет приходиться больше бит, и они будут оцифровываться точнее.
Или оно так и оцифровывается?

audiofun · 02.Февраль.2020 16:24:44

Попытался расслушать разницу - не вышло. Надо бы проверить содержимое файлов, может там просто ноликов до 24 бит добили.

Dmitry · 02.Февраль.2020 16:27:13

Согласно стандарту PCM цифровой аудиосигнал представлен в двоичной форме, где понятие разряда представляет из себя степень в которую нужно возвести число 2. Очевидно, что изменение разряда на единицу предполагает увеличение в 2 раза. То есть представленный в двоичной “цифре” звуковой сигнал с каждым битом увеличивает амплитуду в 2 раза. Таким образом каждый дополнительный бит, выраженный после ЦАПа в вольтах выходного напряжения - как раз на 6дБ.

Это отсюда:

Цифровая регулировка выходного уровня громкости в ЦАПах. Хорошо это или плохо? Разбираемся в нюансах. Цифровые источники

Вы не профессор, а я не студент чтобы строить дискуссию в таком тоне. И после вашей хамской выходки к меня вообще нет желания как-то с вами общаться. Дать ответ на ваши вопросы (понятно что это дешёвая попытка меня подловить) я собираюсь только из уважения к остальным участникам беседы, возможно им это будет интересно. Разрешение - это в данном случае субъективное понятие (основанное, однако на вполне объективных показателях), заключающее в себе способность формата, носителя, ЦАПа (и всей другой техники тоже) предавать нюансы записи. То есть по сути - способность максимально точно воспроизводить исходный и записанный сигнал. Цифровой звуковой сигнал представлен в двоичной форме (можно я не буду рассказывать что это такое и для чего нужно, а самые любознательные могут скачать в сети замечательную книжку Яна Синклера “Введение в цифровую звукотехнику” и прочитать это там), где понятие разряда представляет из себя степень в которую нужно возвести число 2. Очевидно, что изменение разряда на единицу предполагает увеличение в 2 раза. То есть представленный в двоичной “цифре” звуковой сигнал с каждым битом увеличивает амплитуду в 2 раза. Таким образом каждый дополнительный бит, выраженный после ЦАПа в вольтах выходного напряжения - как раз на 6дБ. Что такое децибел и как с его помощью измерять соотношение громкости, напряжения, тока, мощности и тп - можно ознакомиться в википедии и других источниках. Именно так. В тихих моментах разрешение (точнее точность цифрового представления) сигнала падает. И это не “по-моему”, а согласно законам физики и математике. И это, кстати, краеугольная проблема цифровой звукозаписи в целом (в отличии от аналоговой), когда искажения увеличиваются, а точность представления сигнала снижается вместе со снижением уровня. Именно поэтому и при AD и при DA конверсии стараются использовать максимальный уровень сигнала - для максимального разрешения. “Битность” (то есть одна из двух основных характеристик представления цифрового звукового формата PCM, точнее LPCM) сигнала не меняется, а вот разрешение - вполне может, как написано выше.

Тема уже поднималась, можно в целом ту ветку почитать для информации.

Dmitry · 02.Февраль.2020 16:31:14

Давайте мне какой-нибудь аудиофайл, я его в 64-бит станции пересчитаю по пикам, ну например -60dBfs, и результат представлю его в виде 24 бит и 16. А вы послушаете и попробуете понять разницу?

asuilin · 02.Февраль.2020 16:41:30

Я знаю, что такое двоичная система счисления. Я имел в виду другое:

Допустим, у нас есть 16 разрядов, это означает, что мы располагаем 2^16 = 65536 разными уровнями громкости. Предположим для простоты, что сигнал на вход в АЦП имеет амплитуду от -1V до +1V. Это означает, что на каждый наш уровень громкости будет приходиться изменение уровня входного сигнала 2/65536 V ~ 3E-5 V. То есть изменение уровня сигнала меньше, чем на 3E-5 V, мы вообще не сможем записать, если уровень сигнала линейно отображается на цифровые значения в PCM кодировке.
Я правильно рассуждаю?

Dmitry · 02.Февраль.2020 17:15:25

Отлично!

Тогда без труда обнаружите свою ошибку в этом тезисе:

Ссылка в помощь (была пару постов назад):

asuilin · 02.Февраль.2020 17:26:15

Честно говоря, не увидел ошибки в своих рассуждениях.
Но ответ на свой изначальный вопрос нашёл в разделе “Floating point” - в таком представлении ошибка квантизации распределена как раз логарифмически, т.е. на малых уровнях и на больших уровнях ошибка одна и та же относительно уровня сигнала.

Следующий вопрос - а почему всё аудио не записывают во floating point представлении? Но это видимо уже не к вам )

Dmitry · 02.Февраль.2020 17:37:29

Изменение напряжения на входе (если АD) или выходе (если DA) при изменении амплитуды цифрового сигнала на 1 бит - это не постоянная величина, а относительная (кратная). 1bit = 6dB = 2 раза по напряжению.

Нет таких устройств А вот в большинстве цифровых рабочих станций такой режим внутреннего представления аудиосигнала присутствует (32bit float) и частенько используется (я правда его не применяю).

asuilin · 02.Февраль.2020 17:45:15

Так, давайте всё таки оперировать физическими величинами и конкретными числами, так будет понятнее.
Вот у нас ноль вольт на входе в АЦП (рассчитанного на амплитуду -1V…+1V). Какое это будет число в 16-bit PCM кодировке?
Потом у нас стал не ноль вольт, а +0.5V. Во сколько раз +0.5V больше, чем 0V? В бесконечное количество раз. Что запишется в PCM?

Нет, потому что сложно/дорого, или просто никому не сдались эти тихие звуки?

Dmitry · 02.Февраль.2020 18:06:38

Да. Это вы были правы, а я недопонял мысль. Вот теоретическая картинка для 3-х битного АЦП:

asuilin · 02.Февраль.2020 18:15:21

Ага, значит там всё таки простое линейное отображение вольтажа на числовое значение в PCM.

И очевидно да, такая схема хреново записывает тихие звуки, и с избыточным разрешением записывает звуки громкие. Почему все на это забили и не стали использовать представление с плавающей точкой или логарифмическую шкалу вместо линейной - непонятно.

bloodykot · 02.Февраль.2020 18:19:33

ну это очень сильное предположение громкие звуки все же незаслуживают грубого с ним обхождения

asuilin · 02.Февраль.2020 18:27:58

Заслуживают, у человека чувствительность слуха логарифмическая, а не линейная. Т.е. разницу на одну “единицу абсолютной энергии” между двумя громкими звуками мы различаем гораздо хуже, чем разницу на одну “единицу энергии” между двумя тихими.

bloodykot · 02.Февраль.2020 18:32:02

это все понятно. Но если ближе к реальности, то следует открыть в любом простейшем звуковом редакторе музыку (которая вам нравится) и посмотреть как эти громкие звуки там выглядят. С точки зрения реального сигнала по амплитуде нет разницы между тихими и громкими звуками - гребешки гармоник везде. Собственно потому то вся современная дельта-сигма гибридная. Там верхние значимые разряды всегда мультибитные.

asuilin · 02.Февраль.2020 18:43:58

Я бы не сказал, что нет разницы по амплитуде…

Dmitry · 02.Февраль.2020 19:27:11

Не только тихие звуки, но и (относительно) небольшая разница между уровнями сигнала тоже не отражается в низко-битном представлении сигнала. И это как раз потеря в разрешении оцифровки аналогового сигнала, называется “ошибка квантования” (quantisation error), которую можно представить как “шум квантования” (q. noise).

Ну и “избыточным” разрешение тоже нельзя назвать, тк оно определяет точность амплитуды в максимальных значениях.

Потому что это (float) уже рассчётное представление, аналогичное представлению графики в векторном виде, например.
И ещё, технически на сегодняшний день максимально достижимое (в готовых приборах и схемах) максимальное фактическое разрешение в 20-22 бита. Там много причин, в тч тепловые (джонсоновские) шумы элементов схемы, которые определяют шумовой порог снизу.

Но (самое главное!) и этих 20-22 бит для записи-воспроизведения звука вполне достаточно. 120-132 дБ ДД и SNR обеспечивают самое высокое качество. Помните, выше я отмечал, что лучшие средства звукозаписи аналоговой эпохи давали 105дБ С/Ш и при этом до сих пор считаются непревзойдёнными по субъективному качеству.
Поэтому резюме - для первичной записи формат 16 бит скорее недостаточен (зависит от исходников конечно), 24 fixed-point бита - достаточен всегда и везде при грамотной реализации.
32bit float (1528 dB DR!) может использоваться только для внутренней обработки рабочих станций (так зачастую удобней и быстрей для математики DSP) и как промежуточный формат хранения/переноса файлов.

bloodykot · 02.Февраль.2020 19:38:25

Ну конечно, только вы не вступление смотрите, а серединку