Если Вы не отличаете с/ш аппаратуры от с/ш записи я то здесь при чём? С/ш самой записи и определяет её динамический диапазон, и характеристики аппаратуры динамический диапазон записи не меняют.
Дичь не пишите. И не тратьте силы на ответы, мне они уже не интересны.
2All
Для остальных читателей ветки объясню, почему так важна bit depth при оцифровке аналоговых лент, да и вообще при любой звукозаписи. Дело в том, что у аналоговой и цифровой звукозаписи существует принципиальное, я бы сказал краеугольное различие.
У аналоговой техники - приборов, обработки, ленты и тп искажения сигнала растут с повышением его уровня, в то время как у цифровой строго наоборот - с понижением.
Это соотношение не линейно и нельзя рассчитать однозначные пропорции (прежде всего со стороны аналогового домена).
То есть оцифровывая тихий сигнал (на аналоговом носителе) мы в цифровом домене получаем бОльшие искажения, чем оцифровывая аналоговый сигнал уровнем близким к 0dBfs. Эти искажения можно обозначить как quantisation error в математическом смысле, или quantisation noise в физическом.
Насколько это заметно в субъективном смысле, сравнивая 16 и 24(20) бит оцифровки? На мой взгляд - заметно. Именно глубина битности определяет правильное и качественное воспроизведения т.н. subtle sounds - тончайших послезвучий, реверберционных откликов, нюансов, деталей и тд и тп.
А ведь именно эти параметры в сумме и отличают качественный трансфер. И определяют уровень записи в целом.
И вам того же.
Прежде чем сигнал оцифровать его необходимо получить. Даже в солидных студиях невозможно записать музыкальное исполнение в сотношении с/ш более 100дб (обычно не более 96). Этот шум отлично слышно на студийных мониторах с высокой чуствительностью и его дальнейшее преобразование в АЦП ничего не изменят, будь это даже 48 бит. Уровень шумов в пиках ( разница между максимальной апмлитудой сигнала и шума) будет не более 96дб.
Приведённые Вами расчёты основаны на идеальном сигнале и не имеют отношения к теме, потому что при правильной и грамотной реализации Вы не услышите разницы между 16 и 24 бит. Просто реализация с 24 бит проще.
@Dmitry , простите за возможно дурацкий вопрос - а почему нельзя оцифровывать сигнал в логарифмической шкале? Тогда на диапазон тихих сигналов будет приходиться больше бит, и они будут оцифровываться точнее.
Или оно так и оцифровывается?
Попытался расслушать разницу - не вышло. Надо бы проверить содержимое файлов, может там просто ноликов до 24 бит добили.
Согласно стандарту PCM цифровой аудиосигнал представлен в двоичной форме, где понятие разряда представляет из себя степень в которую нужно возвести число 2. Очевидно, что изменение разряда на единицу предполагает увеличение в 2 раза. То есть представленный в двоичной “цифре” звуковой сигнал с каждым битом увеличивает амплитуду в 2 раза. Таким образом каждый дополнительный бит, выраженный после ЦАПа в вольтах выходного напряжения - как раз на 6дБ.
Это отсюда:
Тема уже поднималась, можно в целом ту ветку почитать для информации.
Давайте мне какой-нибудь аудиофайл, я его в 64-бит станции пересчитаю по пикам, ну например -60dBfs, и результат представлю его в виде 24 бит и 16. А вы послушаете и попробуете понять разницу?
Я знаю, что такое двоичная система счисления. Я имел в виду другое:
Допустим, у нас есть 16 разрядов, это означает, что мы располагаем 2^16 = 65536 разными уровнями громкости. Предположим для простоты, что сигнал на вход в АЦП имеет амплитуду от -1V до +1V. Это означает, что на каждый наш уровень громкости будет приходиться изменение уровня входного сигнала 2/65536 V ~ 3E-5 V. То есть изменение уровня сигнала меньше, чем на 3E-5 V, мы вообще не сможем записать, если уровень сигнала линейно отображается на цифровые значения в PCM кодировке.
Я правильно рассуждаю?
Отлично!
Тогда без труда обнаружите свою ошибку в этом тезисе:
Ссылка в помощь (была пару постов назад):
Честно говоря, не увидел ошибки в своих рассуждениях.
Но ответ на свой изначальный вопрос нашёл в разделе “Floating point” - в таком представлении ошибка квантизации распределена как раз логарифмически, т.е. на малых уровнях и на больших уровнях ошибка одна и та же относительно уровня сигнала.
Следующий вопрос - а почему всё аудио не записывают во floating point представлении? Но это видимо уже не к вам )
Изменение напряжения на входе (если АD) или выходе (если DA) при изменении амплитуды цифрового сигнала на 1 бит - это не постоянная величина, а относительная (кратная). 1bit = 6dB = 2 раза по напряжению.
Нет таких устройств А вот в большинстве цифровых рабочих станций такой режим внутреннего представления аудиосигнала присутствует (32bit float) и частенько используется (я правда его не применяю).
Так, давайте всё таки оперировать физическими величинами и конкретными числами, так будет понятнее.
Вот у нас ноль вольт на входе в АЦП (рассчитанного на амплитуду -1V…+1V). Какое это будет число в 16-bit PCM кодировке?
Потом у нас стал не ноль вольт, а +0.5V. Во сколько раз +0.5V больше, чем 0V? В бесконечное количество раз. Что запишется в PCM?
Нет, потому что сложно/дорого, или просто никому не сдались эти тихие звуки?
Ага, значит там всё таки простое линейное отображение вольтажа на числовое значение в PCM.
И очевидно да, такая схема хреново записывает тихие звуки, и с избыточным разрешением записывает звуки громкие. Почему все на это забили и не стали использовать представление с плавающей точкой или логарифмическую шкалу вместо линейной - непонятно.
ну это очень сильное предположение громкие звуки все же незаслуживают грубого с ним обхождения
Заслуживают, у человека чувствительность слуха логарифмическая, а не линейная. Т.е. разницу на одну “единицу абсолютной энергии” между двумя громкими звуками мы различаем гораздо хуже, чем разницу на одну “единицу энергии” между двумя тихими.
это все понятно. Но если ближе к реальности, то следует открыть в любом простейшем звуковом редакторе музыку (которая вам нравится) и посмотреть как эти громкие звуки там выглядят. С точки зрения реального сигнала по амплитуде нет разницы между тихими и громкими звуками - гребешки гармоник везде. Собственно потому то вся современная дельта-сигма гибридная. Там верхние значимые разряды всегда мультибитные.
Не только тихие звуки, но и (относительно) небольшая разница между уровнями сигнала тоже не отражается в низко-битном представлении сигнала. И это как раз потеря в разрешении оцифровки аналогового сигнала, называется “ошибка квантования” (quantisation error), которую можно представить как “шум квантования” (q. noise).
Ну и “избыточным” разрешение тоже нельзя назвать, тк оно определяет точность амплитуды в максимальных значениях.
Потому что это (float) уже рассчётное представление, аналогичное представлению графики в векторном виде, например.
И ещё, технически на сегодняшний день максимально достижимое (в готовых приборах и схемах) максимальное фактическое разрешение в 20-22 бита. Там много причин, в тч тепловые (джонсоновские) шумы элементов схемы, которые определяют шумовой порог снизу.
Но (самое главное!) и этих 20-22 бит для записи-воспроизведения звука вполне достаточно. 120-132 дБ ДД и SNR обеспечивают самое высокое качество. Помните, выше я отмечал, что лучшие средства звукозаписи аналоговой эпохи давали 105дБ С/Ш и при этом до сих пор считаются непревзойдёнными по субъективному качеству.
Поэтому резюме - для первичной записи формат 16 бит скорее недостаточен (зависит от исходников конечно), 24 fixed-point бита - достаточен всегда и везде при грамотной реализации.
32bit float (1528 dB DR!) может использоваться только для внутренней обработки рабочих станций (так зачастую удобней и быстрей для математики DSP) и как промежуточный формат хранения/переноса файлов.
Ну конечно, только вы не вступление смотрите, а серединку