24 бита: 24 бита в байтах

Содержание

Тест ЦАП на корректное воспроизведение 24 бит в Reference Audio Analyzer

На страницах Stereophile можно встретить для многих «загадочные» тесты на форму волны для 16 и 24 бит. Поклонники «меандров» с нулевым знанием иностранного языка от них в полном восторге и готовы делать далеко идущие выводы. Но что же реально тестируется и как трактовать эти графики?



Этот тест позволяет выяснить, воспроизводит ли устройство реальные 24 бит при воспроизведении 24-битного сигнала или сводит все данные к 16 бит с грубым округлением (с деградацией качества).

С выхода ЦАП делается запись:

  • Полноценного синуса с разрешением 24 бит и амплитудой -90.31 dBFS
  • Синуса с амплитудой -90.31 dBFS, но грубо округленного до 16 бит, где из-за уровня в -90.31 dBFS получаются ступеньки с приращением в один разряд, ограниченный разрешением 16 битного сигнала. Этот вариант показывает, каким должен быть сигнал при грубом понижении разрядности.
Если при записи два сигнала различаются, значит все работает корректно, а если оба сигнала образуют заметные «ступеньки», значит полноценные 24 бита не воспроизводятся. Если же ступеньки отсутствуют для первого и второго сигнала, то или присутствует обработка сигнала, или шум слишком велик, что бы что-то разглядеть.

Вид тестовых сигналов 24 бит и 24>16 бит

Вид записанных сигналов 24 бит и 24>16 бит


Ни один ЦАП или алгоритм из грубо округленного синуса до 16 бит полноценный синус как 24 бит не сделает, а будет воспроизводить как совокупность меандров малой амплитуды.

Вид тестовых сигналов 24 бит и 24>16 бит


Вид записанных сигналов 24 бит и 24>16 бит

В реальном сигнале всегда есть шум и вид волны всегда будет далек от красивого референсного сигнала. В примере серым показан шум на выходе ЦАП, без сигнала. Черным – те самые «ступеньки», а голубым синус в разрядности 24 бит. Т.е. видно, что конечная форма волны, это референсная форма волны с наложенным шумом. В примере выше мы видим как ступеньки для сигнала с транкейтом 24>16 бит и отсутствие ступенек для 24 бит. Данный ЦАП 24 бит воспроизводит корректно.

Из-за малой амплитуды сигнал всегда зашумлен и поэтому увидеть различные пре/пост искажения или другое поведение ЦАП невозможно, это все тонет под обычным шумом. Пре/пост искажения смотрятся исключительно на импульсной характеристике и реакции на ступенчатый сигнал.

Почему бессмысленно на таких графиках делать оценку о качестве по уровню шума или «неравномерности»?

Потому что графики для анализа «подчищаются» от «лишнего шума» и на анализе совсем не тот вид волны, который воспроизводит ЦАП. Для наглядности ниже примеры с Asus Essence One Muses Edition, графики которого есть на Stereophile.com

У Asus Essence One есть два режима, прямой и с апсемплингом. В режиме с апсемплингом выше 20 кГц на выходе добавляется шум от ноизшейпинга и его уровень выше, чем уровень тона с амплитудой в 90.31 dBFS.

Что бы высокочастотный шум не портил “картину», запись сигнала необходимо делать в нижней частоте семплирования при записи, т.е. если воспроизводим в 44.1 кГц, то запись надо делать не в 192 кГц, а в 44.1кГц или вообще в 22 кГц. Либо делать запись в 192 кГЦ, а после накладывать фильтр (EQ), который срежет высокие частоты.

Посмотрим ниже на графики для обычного режима для One.



Запись в 192 кГц для частоты 1 кГц, без какой-либо фильтрации. Синий и черный – это воспроизведение референсного 24 бит. Оранжевый и зеленый – это референсный для транкейта 24>16 бит. Серый – шум.
Отфильтрованная запись в 192 кГц от высоких частот. Смотреть на много приятнее и линии более понятные. Но вся неравномерность, это всего лишь недофильтрованные шумы. Если сделать фильтрацию еще более сильной, что может слишком сгладится сигнал с транкейтом. Нам важно лишь отфильтровать сигнал так, что бы было ясно наличие или отсутствие ступенек как таковых.
Посмотрим на результаты со Stereophile.com

Как видно, запись или в 44.1 кГц (где высокие частоты отфильтровывает АЦП), или программная фильтрация.

В примере для обычного режима воспроизведения в целом хорошо различимы ступеньки как с фильтрацией высоких частот, так и без. Другое дело с наличием ноизшейпинга.



Так выглядит форма волны при записи в 192 кГц в режиме апсемплинга с Asus Essence One (синяя и зеленая линия). Разглядеть нельзя ни синус, ни ступеньки. После фильтрации высоких частот мы получаем черную и оранжевую линию, на которых напрягая зрение в таком же масштабе мы уже можем разглядеть синус и «ступеньки».
Весь шум не вычистился, но хорошо видно, что одни линии являются «синусом», а другие «ступеньками».
Что же показывает Stereophile.com?

Как видим, аналогичный «отфильтрованный» результат. Если не видеть, что из себе представляет сигнал без фильтра, можно сделать вывод, что в режиме апсемплинга сигнал стал лишь чуть более шумным.

Вполне очевидно, что для выявления лишь ответа на воспроизведения 24 бит надо оперировать отфильтрованным сигналом, однако как это обычно случается, неподготовленные полуграмотные пользователи, готовы делать далеко идущие выводы из собственных соображений того, что видят и порой принимают отфильтрованный сигнал за исходный. А вслед за этим делают выводы о том, как работает фильтр ЦАП или делает вывод о количестве шума.

Ранее казалось, что этот тест давно изжил себя и измеряется на Stereophile.com «по старинке», но в современных плеерах грубый транкейт встречается довольно часто, а на графиках гармонических искажений он не всегда очевиден. И возможно, если проблема будет показана наглядно, то производители будут более добросовестно относится к заявлениям, что поддерживается «Hi-Rez» не только на чтение файла, но и корректное воспроизведение?


Так выглядит АЧХ фильтра от высокочастотных шумов в примерах выше.

AD1938 CODEC, Аудио АЦП/ЦАП. 4 входа/8 выходов. Разрешение 24 бита, частота дискретизации 192kHz. SigmaStudio, Электронные войска

Описание

Сторона аналого-цифрового преобразователя.

Входы АЦП AD1938 настроены таким образом, что полная шкала составляет 2,8 В от пика до пика, что составляет приблизительно 1 В среднеквадратичного значения для синусоидальной волны. Любой сигнал, который превышает 2,8 В от пика до пика на аудиовходе, обрезается, создавая искажения. Поэтому аналоговые сигналы поступают на активные фильтры нижних частот собранные на ОУ ADA4841 с низким уровнем шума и искажений, преобразуются в дифференциальные сигналы и подаются на аналоговые входы АЦП. Фильтры рассчитаны на частоту дискретизации системы 44,1 кГц или 48 кГц. Далее сигналы проходят через АЦП AD1938 и затем отправляются в формате I2S на порты последовательного вывода. Сопоставление входных сигналов с входными каналами показано на рис 2.

Сторона цифро-аналогового преобразователя.

Цифровые сигналы в формате I2S подаются на четыре последовательных порта ЦАП AD1938, где они преобразуются в аналоговые сигналы. Четыре стереофонических выхода соответствуют восьми аналоговым выходным сигналам линейного уровня. Выходы ЦАП AD1938 сконфигурированы таким образом, что уровень сигнала  на них составляет 2,8 В от пика до пика, что составляет приблизительно 1 В среднеквадратичного значения для синусоидальной волны. Учтите это в своих проектах. Выходные сигналы ЦАП, поступают на RC фильтры нижних частот, а затем на разъемы. Сопоставление входных каналов с входными сигналами также показано на рис 2.

Электрическая схема Рис.1

Назначение разъемов Рис.2

Пример подключения к RDC4-0027v1 автономный режим.

Пример подключения к RDC4-0027v1 через Control Port.

Это открытый проект! Лицензия, под которой он распространяется – Creative Commons — Attribution — Share Alike license.

Технические параметры

Техническая документация

Видео

16 Бит и 24 бит звука разница

Внимание: Ниже дан текст, упрощенный для понимания. В связи с этим, использовались не академически точные формулировки, а «бытовые». Например, «громкость» вместо «уровня», «частота» синуса вместо «период» синуса, «музыка» вместо «сигнал». Всё это сделано намеренно ! Приоритетная задача — донести смысл до читателя.

24 бита. Правды и неправды

Вокруг форматов аудио есть много споров, и в связи с этим, самый интересный вопрос: «Почему они возникают?». С одной стороны и ежу понятно, что 24 бита 96кГц это лучше, чем 16 бит и 44,1кГц. Но, тем не менее, споры не умолкают, а людям «поддерживающим» 44,1/16 как формат минимально достаточный, часто приходится бежать с поля боя(споров) за неимением аргументов против железной логики: 24 больше 16, а 44,1 меньше 96.
Я не буду доказывать, что 44,1/16 лучше 96/24. Я не буду писать, что 44,1/16 это само по себе круто. Я напишу, что именно эти цифры обозначают, и самое главное, как они проявляются не на бумаге, а в жизни. Что стоит за их рекламой.

Немного основ
Звуковой сигнал (или для простоты «музыка») в электронике представляет собой электрические колебания. Например, «синус» сигнал с уровнем 1dBV означает колебание напряжения от «плюс» 1,4142 вольта до «минус» 1,4142 вольта. То есть напряжение плавно изменяется от плюса к минусу по закону синуса. Чтобы этот сигнал «записать» в цифру, нужно сделать несколько замеров напряжения и «записать» их. И здесь два главных вопроса: 1) Когда сделать замеры; 2) Как записать.

Из теоремы Котельникова (Найквиста) следует, что замеры нужно делать как минимум вдвое чаще, чем частота самого синуса. То есть если у нас сигнал 50Гц (50 колебаний в секунду), то замеров нужно сделать 100 в секунду. Вот эти 100Гц и называются частотой дискретизации.
Теперь «Как записать».
Допустим у нас супер вольтметр, который измеряет вольты до десятой точки после запятой. Вот он нам выдаёт показание 1,0000000001 вольт, затем 0,0000000009 вольт. И так 100 раз в секунду он нам выдает значения. Если музыкальный диапазон равен ±1dBV, то есть громкость на максимуме в пиках даёт ± 1,4142135623 вольт, то чтобы записать наш сигнал с точностью до десятого знака, нам понадобится почти 28,3 млрд. значений. Это 35 бит! Динамический диапазон 204 децибела! Ну да ладно. Это абстракция. Глянем, что нам предлагают производители ЦАПов, и всё станет понятнее.

24 бита, как они есть
Большинство ЦАПов звуковых карт питаются от 5 вольт. На своём выходе, они могут обеспечить колебания напряжения равные 4,5 вольта*. То есть когда играет музыка, то самое максимальное значение которое сможет поймать вольтметр будет 4,5 вольта, а самое минимальное 0 вольт.

Вообще, ЦАП это такая вещь, которая на вход принимает «цифру», а на выходе выдаёт напряжение. Если в ЦАП постоянно посылать одну и ту же цифру, то на выходе у нас будет постоянное напряжение. Для наглядности возьмём 3-битный ЦАП. В него можно загружать 8 различных цифр (напомню, это 000, 111, 100, 101, 001, 010, 110 и 011). На выходе он нам также сможет выдавать 8 различных напряжений. То есть если загрузить цифру 000, то на выходе у нас будет 0 вольт. Если загрузить 111, то на выходе у нас будет 4,5 вольта. А все остальные «цифры» будут выдавать напряжения, лежащие между нулём и 4,5В.

Например:
000 – 0 вольт
001 – 0,6428 вольт
011 – 1,2856 вольт
010 – 1,9284 вольт
110 — 2,5712 вольт
101 – 3,214 вольт
100 – 3,8568 вольт
111 – 4,4996 вольт

Если ЦАП сделать 4-х битный, то таких напряжений на выходе будет уже не восемь, а 16. Ну, а если у нас 16 битный ЦАП, то таких напряжений будет 65,5 тысяч. Фактически это значит, что наш чудо-ЦАП может выдавать напряжения от 0 вольт до 4,5 вольт с шагом 68,66 микровольт (0,00006866 вольт)! А шаг 24-битного ЦАПа, при его 16,77 миллионах значениях, будет равен 0,26822 микровольт.

От теории к практике
Вот это всё на бумаге. В реальности мы должны учитывать такое неприятное явление как шум. Любая, повторяю — ЛЮБАЯ, электрическая схема шумит. Это значит, что на выходе ЦАПа будет не только напряжение, которое он генерировал, но ещё и напряжение шума.

Представим, что рядом с ЦАПом находится возбудитель помех, который наводит шум на выход ЦАПа. Громкость шума возьмём от 0 мкВ (микровольт) до 10 мкВ (кому интересно, это уровень шума (SNR) для нашего ЦАПа равный -113dB). То есть наш ЦАП выдаёт какое-то «музыкальное» значение согласно той «цифре», что в него поступила, и к этому значению прибавляется случайное напряжение шума. Например, ЦАПу надо выдать ноль вольт, самое первое значение. Он выдаёт ноль, а возбудитель наводит помеху, и вместо нуля у нас на выходе получится, например 5мкВ. А затем ЦАПу надо выдать 5мкВ, а плюс помеха, у нас получится 12мкВ или 15мкВ!

Таким образом, из-за шума у нас на выходе получаются значения, которые «залезают» на соседей. Опять же пример: для 24 битного ЦАПа самое первое значение – это ноль вольт. А если появится помеха, то на выходе вместо нуля будет 10мкВ, а это значение 37-е по счёту! Первое значение – ноль вольт, второе значение 0,26822 мкВ, третье значение 0,53644 мкВ. а 37 значение как раз 9,92414 мкВ. У нас из-за шума ЦАП перепрыгнул 36 значений! А когда ЦАПу надо будет сыграть это 37-е значение, то прибавится помеха и на выходе будет вместо 37 какое-нибудь 50-ое! Ну и так далее. Смысл понятен? Конечно, сам ЦАП нам честно выдаёт то, что от него и требуется (если ноль – то ноль, если 10мкВ — то 10мкВ), но из-за шума все «старания» перечёркиваются.

Давайте теперь разберемся, с каким шумом мы имеем дело.

Может ну его?
Конечно, я немного наврал, когда сказал, что сам ЦАП не шумит. Он тоже шумит! Потому что тепловой шум никто не отменял, это раз. И сам ЦАП питается далеко не от стабильного источника напряжения (который не шумит), и все референсные и опорные напряжения тоже идут с шумом. Откуда ему взять «чистое» напряжение? Это два. Величину шума самого ЦАПа можно увидеть в его спецификации. Залезаете на сайт производителя и ищете datasheet к ЦАПу. К примеру CS4396, который стоит на звуковых Lynx Two и Lynx L 22 имеет Dynamic Range = 120dB. Это значит, что от самого громкого до самого тихого звука у нас 120dB. Самый громкий звук – 4,5 вольта. Самый тихий звук – это отсутствие звука (ноль вольт), но из-за шума у нас будет не ноль, а 4,5 мкВ. То есть у нас шум идёт от 0 до 4,5мкВ. Но это на бумаге – а в реальности больше.

А мы ведь помним, что наш 24 битный ЦАП может выдавать напряжения с шагом 0,26822 мкВ. Получается, что только из-за собственного шума ЦАП может перепрыгивать через 15 значений!

Но и на этом не всё. После ЦАПа обязательно стоит «миниусилитель», и даже не один. И каждый шумит. Опять же возьмём «миниусилитель» из Lynx’ов. Он называется OP275. Смотрим в его спецификацию и видим шум 1,186 мкВ. А до того, как этот звук заиграет в мониторах, он ещё пройдёт через усилитель. Возьмём усилитель на микросхеме LM3886, т.к. считается, что это хай перфоманс микруха, и на её основе делают усилители для таких мониторов как Yamaha HS50M и HS80M, KRK Systems V4, V6 и V8, Roland DS-5 и многие Другие. Смотрим спецификацию, и видим шум — от 2мкВ до 10мкВ!

То есть все эти шумы сложатся, а затем в усилителе усилятся вместе с полезным сигналом.

Ну и давайте посмотрим как бы самый худший вариант:

На ЦАП поступает «цифра», которая требует от ЦАПа ноль вольт. Но из-за собственных шумов он выдаёт нам 4,5мкВ. Далее два «миниусилителя» — и шум у нас уже 6,872мкВ. Далее сигнал отправляется по симметричной линии в мониторы, и там обязательно будет сумматор для балансной линии. Потому что в усилитель звук поступает несимметричный. Вот здесь два пути – либо стоит специальная микросхемка, либо простой «миниусилитель», но поверьте, в обоих случаях этот дивайс будет хуже, чем в Lynx Two. Возьмём хороший ресивер балансной линии INA2134 – его шум 7мкВ. Итого 13,872мкВ. И плюс собственно усилитель мониторов. В сумме, повторюсь в наихудшем случае, у нас шум будет 23,872 мкВ. То есть для 24 битного ЦАПа это равносильно перескакиванию через 88 значений! А для 16 битного ЦАПа с его шагом 68,66 мкВ этого не хватит, чтобы дотянуться до соседнего значения. И у 16 битного ЦАПа есть ещё Dither, суть которого самому шуметь в случайном порядке в пределах 1 шага. То есть всем известный Dither сам, то прибавляет 68,66 мкВ, то вычитает из музыкального сигнала (хотя на деле он не «вычитает», а просто «не прибавляет»).

Кто все эти люди?
Ну и последнее — что всё это значит, и какой вывод напрашивается? Давайте для начала всё подытожим.

Хотим мы или не хотим, но в реальной жизни мы сталкиваемся с таким явлением как шум. В самом хорошем случае (а если быть честным, то 23,872 мкВ – это хороший случай, и ниже будет понятно почему) у нас всегда есть шум громкостью -106dB.

Для борьбы с шумом придумали Dither, суть которого прибавлять один шаг и отнимать (в случайном порядке). (прим. — На самом деле дитер не борется с шумом в смысле его подавления!)

А теперь смотрим, у нас есть шум 23,872 мкВ, который в случайном порядке то прибавляется к сигналу, то не прибавляется. То есть это как бы естественный Dither! И если создать ЦАП с шагом в 23,872 мкВ, то ЦАП будет «таким как надо». А это всего 18 бит!

Вывод 1: Из-за естественных шумов ограничивается динамический диапазон звука. 24 битные ЦАПы могут читать «цифру», но на выходе из-за шума у нас будет только 18 битный звук.

Вывод 2: Из-за того, что я не учёл: наводки (помехи), которые можно нахватать проводами, медными дорожками на плате, помехи пассивных компонентов (конденсаторов, резисторов), помехи в ключах и реле — картина получилась слегка приукрашенной. В реале немножко хуже.

Вывод 3: Из-за того, что я не включил в рассмотрение такие явления как гармонические искажения, интермодуляционные искажения, искажения при переходных процессах, то реальная картина будет ещё немножко хуже, чем в Выводе 2.

Вывод 4: Всё написаное относится только к случаю, когда звук выходит из звуковой карты. Сами «цифры» шуметь не могут**, во всяком случае, пока они находятся в программе. Таким образом, 24 бита для обработки сигнала – шаг вполне оправданный. Как и 32 бита с плавающей точкой.

Далее. Не торопитесь покупать фильтры питания, сетевые фильтры. Не торопитесь покупать внешние звуковые, дабы оградиться от помех. От этого толку будет мало. Потому что мы имеем дело с естественными шумами, которые возникают по причинам, которые Производителям преодолеть не удалось (влияние температуры, тепловой шум колебания молекул и пр.). Но имейте ввиду, что грамотная разводка аппаратуры всегда нужна! Гляньте в левый нижний угол на Lynx Two и L 22. Видите там стоят два чёрных бочонка с подписями L1 и L2, а также два алюминиевых бочонка с надписью Nichicon 1000uF – вот это и есть фильтр питания, который стоит от силы пару баксов. Именно он помогает карте получать отличные шумовые характеристики. Но, несмотря на его низкую стоимость, никто кроме Lynx Studio их не ставит. Хотя может и ставят, но я не видел.

Ну, вот собственно и всё, что я хотел написать. Почему я не стал рассматривать частоту дискретизации? Лень. Но по большому счёту там нечего писать. Лично моё мнение – 48кГц нормально. 96кГц – идеально и даже многовато. Но что касается звуковых карт – то в ЦАПах стоят передискретизаторы (oversampling). Они умножают раз в 8 имеющуюся частоту дискретизации, и только после этого переводят в непрерывный «аналоговый» сигнал. Эта операция «сглаживает» звучание. Но такие цифровые фильтры стоят не везде. Там, где они есть – 48кГц звука за глаза хватит, а там, где нет – и 192кГц будет мало 🙂 Его наличие можно увидеть в спецификации (datasheet) к ЦАПу. А сам datasheet ищите или на сайте производителя, или в инете вообще. Фича называется 8x Oversampling Digital Filter – или как-то так.

Надеюсь теперь картина для кого-то прояснится. Ну если остались вопросы – пишите. Текст могу (и может буду) дополнять.

Примечания:
* — есть ЦАПы, у которых выход токовый. Но сразу после такого ЦАПа ставят преобразователь тока в напряжение.
** — на самом деле «цифры» тоже могут «шуметь». Это называется jitter – когда цифра либо приходит раньше, либо позже.

Частота дискретизации в два раза выше максимально записываемой. Т. е. при преобразовании в последовательность чисел из звуковой волны при записи требуется «делать отметки», считывать, вдвое чаще.

Материал в аудио-CD формате — 16-бит 44,1кГц. Это практически весь материал. Так что при воспроизведении разницы не будет.

Формат DVD-аудио поддерживает до 24 на 192.

Есть предположения, что человек может фиксировать более высокочастотные звуки, нежели 20кГц, однако вряд ли ушами.

Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.

Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка «субербас») что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только «растягивает» амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
Примерно такая же картина с высокими частотами — есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
В итоге получается ситуация ка с mpз звуком — вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.

Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.

Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка «субербас») что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только «растягивает» амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
Примерно такая же картина с высокими частотами — есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
В итоге получается ситуация ка с mpз звуком — вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.

Сохранить и прочитать потом —

Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

Частота 192 кГц считается вредной

Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.

График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

Есть несколько способов избежать дополнительных искажений:

  1. Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
  2. Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
  3. Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
  4. Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

Тесты для измерения нелинейных искажений:

  • Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) [5-секундный WAV] [30-секундный FLAC]
  • Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) [10-секундный WAV]
  • Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) [10-секундный WAV]
  • Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) [10-секундный WAV] (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

Недопонимание процесса дискретизации

Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.

Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.

Это только так выглядит. Эти убеждения неверны!

Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.

Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].

Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

16 бит против 24 бит

Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

Примечания к Части 2

6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

Рекомендуем к прочтению

1. RGB (24 бита). Тест PNG с прозрачностью

1. RGB (24 бита). Тест PNG с прозрачностью

ВикиЧтение

Тест PNG с прозрачностью
Тигра Рыжий

1. RGB (24 бита)

Читайте также

Бита и блоки

Бита и блоки Исходный файл: Paddlebricks.fla Следующая игра намного сложнее двух предыдущих, хотя в ней используются те же основные элементы: мяч, бита и стены. Это классическая игра изначально называлась «Breakout» [14] .На рис. 11.4 показан фрагмент игры. В дополнение к мячу и бите вверху

Бита и блоки: три измерения

Бита и блоки: три измерения Исходный файл: 3Dpaddlebricks.fla Итак, в этой главе вы видели, как шар движется по плоскости. А что если шар должен будет двигаться в третьем измерении: в глубину?На рис. 11.5 показано, как это может выглядеть. Бита – это полупрозрачный квадрат на переднем

ТЕМА НОМЕРА: 64 бита для всех

ТЕМА НОМЕРА: 64 бита для всех История знает много разных компьютеров и много разных технологических решений, применявшихся в них. Лампы, транзисторы, ИС, БИС и СБИС; CISC, RISC и VLIW; компьютеры большие и маленькие; процессоры удачные и неудачные. Компьютеры на троичной логике,

1. RGB (24 бита)

1. RGB (24 бита)

2. RGB (24 бита) + альфа (8 бит)

2. RGB (24 бита) + альфа (8 бит)

LEXICON MX200 двухканальный ревербератор / процессор эффектов 24 бита, 2 эффекта о

18390 руб

Арктикул: 0000013206


ДВА ПРОЦЕССОРА. ДВА УНИКАЛЬНЫХ ПРИМЕНЕНИЯ. 32 ЛЕГЕНДАРНЫХ ЭФФЕКТА LEXICON®. БЕСКОНЕЧНЫЕ ВОЗМОЖНОСТИ. Нужна ли Вам только вычислительная мощность с удобным доступом с передней панели для живого звука, или Вы ищите богатые комплексные алгоритмы для работы в студии, знайте — Lexicon® обьединила лучшее из этих двух применений в двойном ревербераторе/эффект-процессоре MX200. Созданный с учетом применения для живого звука и для звукозаписи, MX200 имеет глубокий богатый ревербератор и алгоритмы эффектов, в сочетании с универсальостью эффектов и динамики dbx®. Каждый из 32 ревербов и эффектов и их параметры доступны всего-лишь посредством нажатия одной кнопки или поворота рукоятки на специально спроектированной передней панели, нет необходимости пробираться через многочисленные пункты меню. РАБОТА В СТУДИИ В современных студиях преимущества записи с использованием компьютера привели к тому, что многие звукорежиссеры перешли на использование данной технологии, которая обеспечивает беспрецедентный контроль и огромный выбор плагинов, но многие все еще полагаются на богатый всеобъемлющий звук, обеспечиваемый специальным аппаратым процессором. Lexicon предлагает USB интерфейс с интуитивными кросс-платформенными VST® и Audio Unit плагинами, позволяющий MX200 функционировать как «аппаратый плагин», распознающий и работающий с совместимыми с VST и Audio Units рабочими станциями для обработки звука, все еще оставаясь отдельным аппаратным блоком. Эта уникальная возможность позволяет пользователям легко управлять MX200 в процессе звукозаписи при помощи компьютера посредством графического интерфейса, предоставляемого приложением записи в качестве плагина, с полной автоматизацией и возможностями возврата. Теперь звукоинженеры должны фокусироваться только на сердце их студии — окне приложения ПО звукозаписи. Мощное кросс-платформенное ПО библиотеки/редактирования включено в комплект поставки. MX-Edit™ позволит Вам создавать, редактировать, сравнивать, сохранять и загружать реверб и эффект-программы для использования с MX200 на Вашем компьютере Mac® или РС.



Артикул:

0000013206

Модель:

LEXICON MX200 двухканальный ревербератор / процессор эффектов 24 бита, 2 эффекта о

Производитель:

Характеристики LEXICON MX200 двухканальный ревербератор / процессор эффектов 24 бита, 2 эффекта о

РАБОТА С ЖИВЫМ ЗВУКОМ

Те, кто используют MX200 на площадках с живым звуком, отметят его интуитивную раскладку передней панели с матрицей реверб/эффектов, которая постоянно отображает два активных в настоящий момент эффекта из 32 имеющихся в наличии, все функции доступны посредством нажатия кнопки или поворота рукоятки. Двойной независимый процесор контролирует области при помощи выделенных эффектовSelect, Tempo, Bypass,а три рукоятки управления параметрами обеспечивают мгновенный доступ с точным и всесторонним контролем за самыми критичными параметрами выбранного эффекта. Светодиоды изменения параметров сигнализируют о любом изменении 99
заводских или 99 пользовательских программ.Можно выбрать один из пяти цифровых сэмплов для озвучания выбранных эффектов.

РАЗДЕЛЬНАЯ ПЕРСОНАЛИЗАЦИЯ

Какой бы способ использования MX200 Вы бы не выбрали – живой звук или работа в студии – Вы можете выбирать легендарный реверб и эффект Lexicon®
одновременно в одном из четырех вариантов маршрутизации, включая: двойное моно, каскад, двойное стерео (Parallel) или раздельное моно. Наличие 99 заводских программ и 99 пользовательских позволяет создавать свои собственные эффекты.

Реальная глубина записи, или За каждый бит двух небитых дают • Stereo.ru

Всем известные параметры цифрового аудиопотока 16 и 24 бит — всего лишь официально заявленные мундиры, под которыми может оказаться рубашка с прорехами. Ищем надежный инструмент для диагностики.

Пытливые люди, которым интересно узнать фонетическую подноготную музыкального релиза, более или менее приловчились. Теорему Котельникова-Найквиста знает каждый ребенок, не говоря уже о том, что любое дитя сможет уточнить протяженность спектра в аудиофайле. Про оценку динамического диапазона тоже было рассказано немало, даже целое сообщество имеется – пишет петиции и стыдит издателей, злоупотребляющих компрессией. А уверены ли вы, что в 24-битовом хайрезе честно задействованы все разряды? Как это узнать?

На первый взгляд ситуация совершенно герметичная и неподконтрольная. Как показывает статистика официальных продавцов HD-аудио вроде Qobuz или HD Tracks, наиболее распространенными в ассортименте являются релизы в 24 бит / 44.1 кГц. То есть мы имеем ту же частотку и пики уровней, что на компакт-диске, просто в более точном и подробном изложении. И не надо удивляться скромности технических параметров таких вот Studio Master Files. Работает принцип разумной достаточности. Doctor Dre, тот самый, который маячит на популярных наушниках, одно время возился с сессионными записями в 24 бит / 88 кГц, а потом плюнул и перешел на 24/44.1 – так, говорит, места больше остается для работы с мультитреком. Да-да, музрынок харчуется не с аудиофильской аудитории. Чтобы пополнять закрома айтюнса, вполне хватает и таких вот студийных исходников. А раз найдутся гусики, кому туманит голову от 24 бит, отчего бы не продать то, что осталось?

В числе HD-релизов после 24/44.1 распространены издания в 24 бит/48 кГц. На них также сложно убедиться в хорошей родословной — верхний предел (т.е. половина частоты дискретизации) составляет 24 кГц — совсем близко от обычного компакт-диска. И, повторюсь, нет никаких гарантий, что запись не велась по образцу и стандарту DAT-рекордеров — в 16 бит / 48 кГц, а потом с помощью несложной программной процедуры была поднадута до благопристойных 24 разрядов. Выявить эти и другие подозрительные случаи поможет опция Bit Meter в аудиоредакторе WaveLab.

Анализатор цифровой глубины аудиопотока представляет собой пронумерованную по битам вертикальную шкалу и работает следующим образом. Загрузите испытуемые WAV или AIFF образцы в WaveLab и включите воспроизведение. Шкала Bit Meter отобразит каждый разряд в 16 или 24-битовом слове, которые будут выстроены по строгой иерархии согласно уровню сигнала. Сначала идут старшие биты, и надо сказать, что на спокойных ненасыщенных композициях четыре младших разряда не всегда-то и задействованы. Таким образом, будьте уверены, что сидишки со сладостным камерным джазком, которым любят тешить покупателей в аудиосалоне, на деле имеют глубину от силы в 12-14 бит.

Интересно будет на Bit Meter проверить пресловутые издания HDCD. Сграбленный на компьютер «как есть» такой диск ничем не будет отличаться от классического Red Book. Но с помощью программного HDCD-эмулятора (они имеются и в Foobar, и в dBpoweramper) можно раскодировать спрятанную информацию и перевести все в 24-битовые wav-файлы, которые станут объектом исследования Bit Meter. Опыт показывает, что те записи, на этапе HDCD-производства которых применялась функция Peak Extension (расширение динамического диапазона), показывают реальное увеличение разрядности от 17 до 20 бит — как и было сказано в рекламных проспектах на заре HDCD-технологии.

Примером успешной реализации могут послужить, например, CD-издания первых трех альбомов The Beatles загадочной конторой Fabulus Sound Lab, которые на сегодняшний момент мне представляются наиболее предпочтительными из целого вороха разномастных «битловских» релизов раннего периода.

В то же время такие компакт-диски, как например, Beck “Mutations” или одноименный сольник Nancy Sinatra 2004 года зажгут HDCD-метку на индикаторе совместимого CD-проигрывателя, но даже переведенные в 24 бита, разрядность сохранят прежнюю — 16 бит. Почему? Хотя в студии и использовался тот самый АЦП Pacific Microsonics (очень хороший, к слову!), но все его HDCD-цепи были отключены, осталась лишь метка в цифровом коде, от которой CD-плеер дурак и обрадовался.

Bit Meter поможет раскрыть и посрамить не только ворох престарелых компакт-дисков, но и хитрые HD-аудио, которые упоминались в начале материала. Никакая частота дискретизации не скроет от Bit Meter реальное состояние ячеек в разряде. Например, на альбоме Tricky “Mixed Race” (официально 24/44.1) отсчет начинается только с 20-го бита. Если в 24-битовом потоке в восьми старших разрядах остаются нули, так и будет показано на шкале. И значит, перед нами обычный апконверт из 16-битовой записи.

К счастью, подобные случаи относительно редки, однако от накладок не избавлены даже уважаемые B&W Society of Sound, под сенью которых были выпущены HD-издания The Unthanks “A Retrospective” и одноименный альбом Portico Quartet – оба показали 16-бит при анализе. Впрочем, это не значит, что подобные записи ужасно играют – на свете множество компакт-дисков с прекрасным звуком. Можно забить все разряды и спектр громким перегруженным саундом — такой файл будет тяжелым не только по размеру, но и на слух.

Не забывайте, что равно как и прочие инструменты аудиоредакторов, Bit Meter — это лишь один из элементов технической экспертизы, которые пусть и не ответят на все вопросы, но дополнят и обогатят ваш филофонический опыт.

microcontroller — Почему регистры 24 бита?

В своей работе я имею дело с различными микроконтроллерами, микропроцессорами и процессорами DSP. Многие из них имеют 24-битные регистры и счетчики.

Я умею ими пользоваться, это не мой вопрос.

У меня вопрос, почему у них 24-битный регистр! почему бы не сделать его 32-битным? и насколько я знаю, это не проблема размера, потому что регистры уже 32-битные, но имеют максимум 0xFFFFFF.

Обеспечивает ли это более легкую реализацию HW? Более быстрые расчеты? Или это просто «хммм, давайте поставим 24-битные регистры, чтобы усложнить работу программистов»?

5

Yousf 23 Фев 2010 в 16:06

4 ответа

Лучший ответ

Я предполагаю, что большинству приложений DSP просто не нужны 32-битные. В цифровом аудио больше всего используется 24-битная точность воспроизведения. Для реализации 32-битной технологии потребуется больше транзисторов, что приведет к более высоким затратам.

Почему программисту будет проще 32 бита?

Кроме того, вы заявляете, что регистры имеют максимум 0xFFFFFF, что делает их 24-битными по определению , а не 32-битными, как вы предлагаете.

7

Tomas 23 Фев 2010 в 13:16

Для звука обычно требуется 16-битный вывод. Поскольку вы теряете некоторую точность во время обработки, они выбирают разумный размер, который несколько больше 16 бит, что составляет 24 бит.

Причина, по которой не следует переходить на полные 32 бита, заключается в том, что для этого потребуется значительно больше оборудования, особенно для умножения.

2

starblue 8 Сен 2010 в 06:05

Отмечая ответ Томаса, некоторые DSP имеют режим регистров, в котором переполнение блокирует значение в наивысшем состоянии. Если данные 24-битные и они переходят на 25-й бит, они должны быть заблокированы там, а не при 32-битном переходе.

2

Robert 23 Фев 2010 в 13:21

Нет особой причины для 8/16/32/64 бит. Есть 24-битные DSP, 18-битные PIC, 36-битные PDP … Каждый бит требует времени, денег и энергии, поэтому достаточно иметь достаточное количество битов. Не нужно переусердствовать. Достаточно взглянуть на оригинальные ПК с 20 адресными строками, хотя указатели памяти могут быть до 32 бит.

4

e8johan 25 Фев 2010 в 07:25

Объяснение битовой глубины: все, что вам нужно знать

В современную эпоху аудио вы не можете двигаться от упоминания музыки «Hi-Res» и 24-битной «студийного качества». Если вы еще не заметили тенденцию в смартфонах высокого класса — кодек Sony LDAC Bluetooth — и потоковые сервисы, такие как Qobuz, то вам действительно нужно больше читать этот сайт.

Обещание простое — превосходное качество прослушивания благодаря большему количеству данных, также известному как битовая глубина. Это 24 бита цифровых единиц и нулей по сравнению с жалким 16-битным пережитком эпохи компакт-дисков.Конечно, вам придется доплачивать за эти продукты и услуги более высокого качества, но чем больше битов, тем лучше, верно?

Звук «низкого разрешения» часто демонстрируется в виде лестничной волны. Это не то, как работает сэмплирование звука, и это не то, как выглядит звук, выходящий из устройства.

Не обязательно. Потребность во все большей и большей битовой глубине основана не на научной реальности, а скорее на искажении правды и использовании неосведомленности потребителей о науке о звуке.В конечном счете, компании, продающие 24-битное аудио, могут получить гораздо больше прибыли, чем вы от превосходного качества воспроизведения.

Примечание редактора: эта статья была обновлена ​​13 июля 2021 г., чтобы обновить некоторые технические формулировки и добавить меню содержания.

Битовая глубина и качество звука: шагать по лестнице — не проблема

Чтобы предположить, что 24-битный звук является обязательным, маркетологи (и многие другие, кто пытается объяснить эту тему) выставляют очень знакомую лестницу качества звука в небеса.16-битный пример всегда показывает неровное, зубчатое воспроизведение синусоиды или другого сигнала, в то время как 24-битный эквивалент выглядит красиво и с более высоким разрешением. Это простое наглядное пособие, но оно опирается на незнание темы и науки, чтобы привести потребителей к неверным выводам.

Прежде чем кто-нибудь откусит мне голову, технически говоря, эти ступенчатые примеры довольно точно отображают звук в цифровой области. Тем не менее, диаграмма основы/леденец-диаграмма является более точным графическим изображением для визуального аудиосемплирования, чем эти ступенчатые ступени.Подумайте об этом так: сэмпл содержит амплитуду в определенный момент времени, а не амплитуду, удерживаемую в течение определенного промежутка времени.

Использование ступенчатых диаграмм намеренно вводит в заблуждение, поскольку стержневые диаграммы обеспечивают более точное представление цифрового звука. Эти два графика отображают одни и те же точки данных, но ступенчатый график выглядит гораздо менее точным.

Однако верно то, что аналого-цифровой преобразователь (АЦП) должен умещать бесконечно переменный аналоговый аудиосигнал в конечное число бит.Бит, который находится между двумя уровнями, должен быть округлен до ближайшего приближения, которое известно как ошибка квантования или шум квантования . (Запомните это, мы к этому еще вернемся.)

Однако, если вы посмотрите на аудиовыход любого аудиоцифро-аналогового преобразователя (ЦАП), построенного в этом веке, вы не увидите никаких ступенек. Даже если вы выводите 8-битный сигнал. Так что дает?

8-битный синусоидальный сигнал с частотой 10 кГц, полученный с недорогого смартфона Pixel 3a.Мы можем видеть некоторый шум, но никаких заметных ступенек, которые так часто изображают аудиокомпании.

Во-первых, то, что описывают эти ступенчатые диаграммы, если мы применим их к аудиовыходу, называется ЦАП нулевого порядка. Это очень простая и дешевая технология ЦАП, в которой сигнал переключается между различными уровнями каждый новый семпл для получения выходного сигнала. Это не используется ни в каких профессиональных или полуприличных потребительских аудиопродуктах. Вы можете найти его в микроконтроллере за 5 долларов, но уж точно не где-либо еще.Искажение аудиовыхода таким образом подразумевает искаженную, неточную форму волны, но это не то, что вы получаете.

На самом деле выход современного ∆Σ ЦАП представляет собой 1-битный сигнал PDM с передискретизацией (справа), а не сигнал удержания нуля (слева). Последний производит более низкий уровень шума на аналоговом выходе при фильтрации.

АЦП и ЦАП аудиокласса

в основном основаны на дельта-сигма (∆Σ) модуляции. Компоненты этого калибра включают интерполяцию и передискретизацию, формирование шума и фильтрацию для сглаживания и уменьшения шума.Дельта-сигма ЦАП преобразуют аудиосэмплы в 1-битный поток (модуляция плотности импульсов) с очень высокой частотой дискретизации. При фильтрации это дает гладкий выходной сигнал с шумом, далеко выходящим за пределы слышимых частот.

В двух словах: современные ЦАП не выводят грубо выглядящие зубчатые аудиосэмплы — они выводят битовый поток, который отфильтрован от шумов, в очень точный, гладкий выходной сигнал. Эта ступенчатая визуализация неверна из-за так называемого «шума квантования».

Понимание шума квантования

В любой конечной системе случаются ошибки округления.Это правда, что 24-битный АЦП или ЦАП будет иметь меньшую ошибку округления, чем 16-битный эквивалент, но что это на самом деле означает? Что еще более важно, что мы на самом деле слышим? Это искажение или пух, детали потеряны навсегда?

На самом деле это немного и то, и другое, в зависимости от того, находитесь ли вы в цифровой или аналоговой сферах. Но ключевой концепцией для понимания обоих является понимание минимального уровня шума и того, как он улучшается по мере увеличения битовой глубины. Чтобы продемонстрировать, давайте отойдем от 16 и 24 бит и посмотрим на примеры с очень маленькой битовой глубиной.

Разница между глубиной 16 и 24 бита заключается не в точности формы сигнала, а в доступном пределе, прежде чем цифровой шум будет мешать нашему сигналу.

В приведенном ниже примере нужно проверить довольно много вещей, поэтому сначала краткое объяснение того, что мы рассматриваем. У нас есть входные (синие) и квантованные (оранжевые) сигналы на верхних диаграммах с разрядностью 2, 4 и 8 бит. Мы также добавили к нашему сигналу небольшое количество шума, чтобы лучше имитировать реальный мир.Внизу у нас есть график ошибки квантования или шума округления, который вычисляется путем вычитания квантованного сигнала из входного сигнала.

Шум квантования увеличивается, чем меньше битовая глубина, из-за ошибок округления.

Очевидно, что увеличение разрядности делает квантованный сигнал более подходящим для входного сигнала. Однако это не главное, обратите внимание на гораздо больший сигнал ошибки/шума для более низких разрядностей. Квантованный сигнал не удаляет данные из нашего ввода, они фактически добавляются в этот сигнал ошибки.Аддитивный синтез говорит нам, что сигнал может быть воспроизведен суммой любых двух других сигналов, включая несовпадающие по фазе сигналы, которые действуют как вычитание. Так работает шумоподавление. Таким образом, эти ошибки округления вносят новый шумовой сигнал.

Это не просто теория, вы можете услышать все больше и больше шума в аудиофайлах с более низкой битовой глубиной. Чтобы понять почему, изучите, что происходит в 2-битном примере с очень маленькими сигналами, например, до 0,2 секунды. Щелкните здесь для увеличения изображения.Очень небольшие изменения во входном сигнале вызывают большие изменения в квантованной версии. Это ошибка округления в действии, которая приводит к усилению шума слабого сигнала. Таким образом, шум снова становится громче по мере уменьшения битовой глубины.

Квантование не удаляет данные из нашего ввода, а фактически добавляет зашумленный сигнал ошибки.

Подумайте об этом и в обратном порядке: невозможно захватить сигнал меньше размера шага квантования, который по иронии судьбы называется младшим значащим битом.Небольшие изменения сигнала должны переходить к ближайшему уровню квантования. Большие битовые глубины имеют меньшие шаги квантования и, следовательно, меньшие уровни усиления шума.

Самое главное, обратите внимание, что амплитуда шума квантования остается неизменной, независимо от амплитуды входных сигналов. Это демонстрирует, что шум возникает на всех различных уровнях квантования, поэтому существует постоянный уровень шума для любой заданной битовой глубины. Большая битовая глубина производит меньше шума.Поэтому мы должны думать о различиях между 16- и 24-битной глубиной не как о точности формы сигнала, а как о доступном пределе, прежде чем цифровой шум будет мешать нашему сигналу.

Битовая глубина зависит от шума

Kelly Sikkema Нам нужна битовая глубина с достаточным соотношением сигнал-шум, чтобы приспособиться к нашему фоновому шуму, чтобы записать наш звук так же идеально, как он звучит в реальном мире.

Теперь, когда мы говорим о битовой глубине с точки зрения шума, давайте в последний раз вернемся к приведенному выше графику.Обратите внимание, как 8-битный пример выглядит почти идеально для нашего зашумленного входного сигнала. Это связано с тем, что его 8-битного разрешения на самом деле достаточно для захвата уровня фонового шума. Другими словами: размер шага квантования меньше, чем амплитуда шума, или отношение сигнал/шум (SNR) лучше, чем уровень фонового шума.

Уравнение 20log(2 n ) , где n — битовая глубина, дает нам SNR. 8-битный сигнал имеет SNR 48 дБ, 12-битный — 72 дБ, 16-битный — 96 дБ, а 24-битный — колоссальные 144 дБ.Это важно, потому что теперь мы знаем, что нам нужна только битовая глубина с достаточным SNR, чтобы согласовать динамический диапазон между нашим фоновым шумом и самым громким сигналом, который мы хотим захватить, чтобы воспроизвести звук так же идеально, как он выглядит в реальном мире. Немного сложно перейти от относительных масштабов цифрового царства к масштабам физического мира, основанным на звуковом давлении, поэтому мы постараемся сделать это проще.

CD-качество может быть «всего» 16-битным, но это слишком много для качества.

Чувствительность вашего уха варьируется от 0 дБ (тишина) до примерно 120 дБ (мучительно громкий звук), а теоретическая способность (в зависимости от нескольких факторов) различать громкость составляет всего 1 дБ.Таким образом, динамический диапазон вашего уха составляет около 120 дБ или около 20 бит.

Однако вы не можете услышать все это сразу, так как барабанная перепонка или барабанная перепонка сжимается, чтобы уменьшить количество громкости, фактически достигающее внутреннего уха в шумной обстановке. Вы также не будете слушать музыку на такой громкости, , потому что оглохнете . Кроме того, среда, в которой вы и я слушаем музыку, не такая тихая, как может слышать здоровое ухо. В хорошо оборудованной студии звукозаписи уровень фонового шума может быть ниже 20 дБ, но прослушивание в шумной гостиной или в автобусе, очевидно, ухудшит условия, и r выявит полезность широкого динамического диапазона.

Человеческое ухо имеет огромный динамический диапазон, но не весь одновременно. Маскировка и собственная защита слуха нашего уха снижает ее эффективность.

Вдобавок ко всему: по мере увеличения громкости в вашем ухе начинает действовать маскировка более высоких частот. При низкой громкости от 20 до 40 дБ маскировка не происходит, за исключением звуков близкой по высоте. Однако при 80 дБ звуки ниже 40 дБ будут маскироваться, а при 100 дБ звуки ниже 70 дБ услышать невозможно. Динамический характер уха и материала для прослушивания затрудняет определение точного числа, но реальный динамический диапазон вашего слуха, вероятно, находится в районе 70 дБ в среднем окружении и всего до 40 дБ в очень громком окружении.Битовая глубина всего 12 бит, вероятно, охватила бы большинство людей, поэтому 16-битные компакт-диски дают нам достаточно места.

гиперфизика Маскировка высоких частот происходит при высокой громкости прослушивания, что ограничивает наше восприятие более тихих звуков.

Инструменты и записывающее оборудование также создают шум (особенно гитарные усилители) даже в очень тихих студиях звукозаписи. Также было проведено несколько исследований динамического диапазона различных жанров, включая это, которое показывает типичный динамический диапазон 60 дБ.Неудивительно, что жанры с большей близостью к тихим партиям, такие как хор, опера и фортепиано, показали максимальный динамический диапазон около 70 дБ, в то время как «более громкие» жанры рок, поп и рэп имели тенденцию к 60 дБ и ниже. В конечном счете, музыка создается и записывается только с такой точностью.

Возможно, вы знакомы с «войнами за громкость» в музыкальной индустрии, что, безусловно, противоречит цели современных аудиоформатов Hi-Res. Интенсивное использование сжатия (которое усиливает шум и ослабляет пики) уменьшает динамический диапазон.У современной музыки значительно меньший динамический диапазон, чем у альбомов 30-летней давности. Теоретически современная музыка может распространяться с более низким битрейтом, чем старая музыка. Вы можете проверить динамический диапазон многих альбомов здесь.

16 бит — это все, что вам нужно

Это было довольно сложное путешествие, но, надеюсь, вы получили гораздо более детальное представление о битовой глубине, шуме и динамическом диапазоне, чем те вводящие в заблуждение примеры лестницы, которые вы так часто видите.

Битовая глубина полностью связана с шумом, и чем больше битов данных у вас есть для хранения аудио, тем меньше шума квантования будет введено в вашу запись.Кроме того, вы также сможете более точно захватывать меньшие сигналы, помогая снизить уровень цифрового шума ниже уровня записи или прослушивания. Это все, для чего нам нужна битовая глубина. Нет никакой пользы в использовании огромной битовой глубины для мастер-аудио.

Алексей Рубан Из-за того, что шум суммируется в процессе микширования, имеет смысл записывать звук в 24-битном формате. Это не обязательно для окончательного мастер-стерео.

Удивительно, но 12 бит, вероятно, достаточно для приличного звучания музыкального мастера и для удовлетворения динамического диапазона большинства условий прослушивания.Однако цифровое аудио передает больше, чем просто музыку, и такие примеры, как запись речи или окружающей среды для телевидения, могут использовать более широкий динамический диапазон, чем большинство музыки. Плюс небольшой запас для разделения громкого и тихого звука еще никому не помешал.

В целом, 16 бит (96 дБ динамического диапазона или 120 дБ с применением дизеринга) подходят для широкого спектра типов звука, а также ограничений человеческого слуха и типичных условий прослушивания. Перцепционное увеличение 24-битного качества весьма спорно, если не просто плацебо, как, надеюсь, я продемонстрировал.Кроме того, увеличение размеров файлов и пропускной способности делает их ненужными. Тип сжатия, используемый для уменьшения размера файла вашей музыкальной библиотеки или потока, оказывает гораздо более заметное влияние на качество звука, чем 16- или 24-битный файл.

В чем разница между 16-битным, 24-битным и 32-битным цветом?

Обновлено: 13.11.2018, автор: Computer Hope

Почти все компьютеры за последние пять-десять лет стандартно поставлялись с поддержкой как минимум 16-битного цвета, а новые компьютеры поддерживают 24-битный и 32-битный цвет.Есть ли разница между разными уровнями цвета? Короткий ответ: да. Все три глубины цвета используют красный, синий и зеленый цвета в качестве стандартных цветов, но разница заключается в количестве цветовых комбинаций и альфа-канале. Независимо от того, просматриваете ли вы изображения, смотрите видео или играете в видеоигры, более высокая глубина цвета выглядит более привлекательно.

16-битный цвет

Благодаря 16-битному цвету, также называемому High color, компьютеры и мониторы могут отображать до 65 536 цветов, чего достаточно для большинства применений.Тем не менее, видеоигры с интенсивным использованием графики и видео с более высоким разрешением могут извлечь выгоду из более высокой глубины цвета.

24-битный цвет

Используя 24-битный цвет, также называемый True color, компьютеры и мониторы могут отображать до 16 777 215 различных цветовых комбинаций.

32-битный цвет

Как и 24-битный цвет, 32-битный цвет поддерживает 16 777 215 цветов, но имеет альфа-канал, позволяющий создавать более убедительные градиенты, тени и прозрачность. С альфа-каналом 32-битный цвет поддерживает 4 294 967 296 цветовых комбинаций.

По мере увеличения поддержки большего количества цветов требуется больше памяти. Однако сегодня почти все компьютеры оснащены видеокартами с достаточным объемом памяти для поддержки 32-битных цветов при большинстве разрешений. Старые компьютеры и видеокарты могут поддерживать только 16-битный цвет.

Могут ли мои глаза отличить?

Большинство пользователей не видят большой разницы между 16-битной и 32-битной версиями. Однако, если вы используете программу с градиентами, тенями, прозрачностью или другими визуальными эффектами, требующими широкого диапазона цветов, вы можете заметить разницу.

Каковы преимущества более высокой глубины цвета?

Благодаря большей глубине цвета вы получаете более привлекательные функции, такие как градиенты и прозрачность. Многие люди сообщают, что изображение становится ярче и меньше утомляет глаза при работе с более высокой глубиной цвета.

Каковы недостатки более высокой глубины цвета?

Как было сказано выше, при более высокой глубине цвета требуется больше системных ресурсов, что заставляет компьютер работать больше.Если на вашем компьютере недостаточно памяти, это может замедлить работу системы. Кроме того, в играх более высокая глубина цвета может снизить FPS в зависимости от вашей видеокарты и игры, в которую вы играете.

Что такое битовая глубина звука? Объяснение 16-битного, 24-битного и 32-битного числа с плавающей запятой

В этом уроке мы разберем разрядность. Битовая глубина является ключевым компонентом цифрового звука. Вы, вероятно, замечали список доступных битовых глубин, когда создавали новую сессию или восстанавливали свою музыку.В этом уроке мы разберем, что такое битовая глубина. Мы также рассмотрим ключевые разрядности, включая 16-битные, 24-битные и 32-битные числа с плавающей запятой, чтобы узнать, какую разрядность использовать и когда.

Прежде чем мы двинемся дальше, если вы хотите создавать лучшую музыку в своей домашней студии, обязательно загрузите бесплатный комплект для домашней студии здесь (шпаргалка по эквалайзеру, шпаргалка по компрессии и руководство по вокалу).

Что такое битовая глубина звука

Для записи звука в цифровом виде ваш аналого-цифровой преобразователь каждую секунду захватывает тысячи выборок аналогового сигнала.Каждому образцу присваивается значение, которое используется для представления амплитуды этого образца. Битовая глубина определяет количество значений, доступных в каждом образце. В результате битовая глубина определяет динамический диапазон цифрового звука. Давайте посмотрим, как он это делает…

Шум квантования

При дискретизации аналогового сигнала его амплитуда согласуется с ближайшим из доступных цифровых значений. Этот процесс называется квантованием. Однако независимо от того, сколько значений доступно, амплитуда аналогового сигнала не всегда будет полностью соответствовать доступному значению.Иногда амплитуда сигнала будет находиться между двумя значениями. Это потому, что аналоговый сигнал имеет бесконечное разрешение. Но мы вписываем его в цифровую систему с конечным числом значений.

Если амплитуда аналогового сигнала не полностью совпадает с доступным значением, амплитуда аналогового сигнала должна быть округлена до ближайшего доступного значения. Это называется ошибкой квантования. Эти ошибки квантования вносят шум квантования в сигнал.Шум квантования слышен как белый шум низкого уровня. Уровень шума квантования мы называем уровнем шума. Термин «минимальный уровень шума» относится к сигналу, который существует в аудиосистеме в результате комбинации любого собственного шума или нежелательного звука.

Важно отметить, что чем выше битовая глубина, тем ниже уровень шума. Таким образом, более высокая битовая глубина обеспечивает больший динамический диапазон. Динамический диапазон относится к разнице между самыми громкими и самыми тихими звуками, которые могут быть захвачены и воспроизведены.Верхним пределом динамического диапазона является 0dBFS, выше которого любой сигнал будет обрезаться. На нижнем пределе динамического диапазона находится уровень шума. Любой сигнал тише, чем уровень шума, будет маскироваться уровнем шума.

16 бит против 24 бит

Наиболее распространенные битовые глубины для записи и рикошетирования звука — 16 бит и 24 бит. 16 бит предоставляет каждому образцу 65 536 возможных значений амплитуды. 24-битная предоставляет каждой выборке 16 777 216 возможных значений амплитуды. Таким образом, 16 бит обеспечивает динамический диапазон 96 дБ между уровнем шума и 0 дБ полной шкалы.24 бит обеспечивает динамический диапазон 144 дБ между уровнем шума и 0 дБ полной шкалы.

Как разрядность влияет на качество звука?

Существует некоторое заблуждение, что более высокая битовая глубина приводит к лучшему качеству звука или более высокой точности звука. Люди задают вопрос: «24-битное звучание лучше, чем 16-битное»? Эта путаница, вероятно, возникает из-за того, что более высокая битовая глубина называется более высоким «разрешением». Это заставляет задуматься о разрешении цифровых изображений, у которого чем выше разрешение, тем четче и детальнее картинка.Но это не так.

Здесь разрешение, о котором мы говорим, является информационным разрешением. Таким образом, 24-битный аудиофайл не будет звучать более детально и четко, чем 16-битный аудиофайл. Вместо этого, как мы уже установили, это просто означает, что более высокая битовая глубина будет иметь более низкий уровень шума. На самом деле, даже при преобразовании из высокой разрядности в меньшую, при условии, что вы используете дизеринг, единственная разница должна заключаться в том, что версия с меньшей разрядностью имеет более высокий уровень шума. Это связано с тем, что дизеринг исправит возникновение искажения усечения при преобразовании в более низкую разрядность.

Какую разрядность следует использовать для записи?

Когда дело доходит до записи, даже при 16 битах, уровень шума очень низкий. Таким образом, вы можете записывать в 16-битном формате и при этом иметь приличный динамический диапазон. Однако более распространенной практикой и чем-то вроде стандарта является запись в 24-битном формате. Просто потому, что запись в 24-битном формате дает вам больший динамический диапазон для работы. Он предлагает вам возможность записи на более консервативных уровнях, чтобы не приближаться к уровню отсечения, но при этом оставаться значительно выше уровня шума.

Недавно на рынке появилось несколько интерфейсов, которые предлагают 32-битную запись. Обратите внимание, что я говорю здесь о 32-битной фиксированной точке, а не о 32-битной плавающей запятой, к которой мы перейдем через мгновение. 32 бит предлагает 4 294 967 296 значений и динамический диапазон 192 дБ. Но действительно ли нам нужен такой большой динамический диапазон? При 24 битах у вас уже есть динамический диапазон, превышающий динамический диапазон человеческого уха. В слуховой системе человека порог слышимости составляет 0 дБ SPL, в то время как порог боли составляет около 120 дБ SPL.Таким образом, динамический диапазон в 144 дБ, предлагаемый 24-битным форматом, уже достаточно высок, чтобы улавливать звуки ниже, чем мы можем слышать, и громче, чем мы можем вынести. Таким образом, 192 дБ динамического диапазона, предлагаемого 32-битной фиксированной точкой, совершенно не нужны.

Какую разрядность мне следует использовать для воспроизведения моей песни?

Итак, какую битовую глубину следует использовать для окончательного отскока вашей песни? Это аудиофайл, который вы загрузите дистрибьютору для выпуска в iTunes, Spotify и т. д. Ну, стандартная разрядность для этого долгое время была 16 бит.Это было связано с тем, что для записи аудиофайла на аудио компакт-диск файл должен быть 16-битным. Но многие онлайн-платформы теперь позволяют загружать файлы в 24-битном формате. Но так ли это необходимо? Что ж, даже если бы вы работали с действительно динамичным материалом, например, с классической музыкой, он все равно использовал бы не более 50–60 дБ динамического диапазона. Большинство других жанров будут использовать гораздо меньше. Таким образом, 96 дБ динамического диапазона 16 бит более чем достаточно для идеального представления динамического диапазона вашей музыки.

Что такое 32-битная плавающая точка в аудио?

Ознакомившись с основами, давайте перейдем к 32-битным вычислениям с плавающей запятой. Вы, вероятно, видели это как один из вариантов наряду с 16-битным и 24-битным, когда вы создаете новый сеанс или восстанавливаете звук.

Во-первых, важно знать, что битовая глубина бывает двух разных форм. Первый — это «фиксированная точка», также известная как «целое число». Второй — «с плавающей запятой». До сих пор мы говорили о 16-битной, 24-битной и 32-битной битовой глубине с фиксированной запятой.В отличие от битовой глубины с фиксированной запятой, битовая глубина с плавающей запятой используется только для внутренней обработки в DAW. Они не подходят для использования в качестве разрядности вашего окончательного трека, который вы затем загрузите на цифровой дистрибьютор. Этот отскок должен иметь фиксированную битовую глубину. Таким образом, вы бы действительно отскочили до 32-битного числа с плавающей запятой только в том случае, если аудиофайл собирался импортировать в DAW.

В отличие от битовой глубины с фиксированной запятой, которая имеет потолок на уровне 0dBFS и минимальный уровень шума на определенном расстоянии ниже, 32-битное число с плавающей запятой использует свой динамический диапазон по-другому.32-битное число с плавающей запятой имеет огромный динамический диапазон 1528 дБ, но вместо потолка на уровне 0 дБ полной шкалы верхний предел динамического диапазона составляет 770 дБ выше 0 дБ полной шкалы, а нижний предел — 758 дБ ниже 0 дБ полной шкалы. Таким образом, эта система предоставляет вам возможность увеличивать и уменьшать уровни таких вещей, как ваши инструментальные каналы и вход/выход плагинов в вашей DAW, не беспокоясь ни о падении ниже уровня шума, ни об отсечении.

32-битное число с плавающей запятой против 24-битного

Итак, лучше ли работать с 32-битными файлами с плавающей запятой, чем с 16- или 24-битными? Ну, вы можете создать 32-битные файлы с плавающей запятой с самого начала, если хотите.Вы делаете это, устанавливая битовую глубину вашего сеанса на 32-битное число с плавающей запятой перед записью. Таким образом, вы будете записывать звук с фиксированной битовой глубиной, на которую способен ваш интерфейс, но он будет сохранен как 32-битный файл с плавающей запятой.

Но в этом нет необходимости. И вот почему… Все современные DAW обрабатывают звук внутри с 32-битной плавающей запятой независимо от разрядности ваших аудиофайлов. Таким образом, вы получите преимущества 32-битной обработки с плавающей запятой в вашей DAW, даже если ваши аудиофайлы сами по себе не являются 32-битными файлами с плавающей запятой.Таким образом, я рекомендую вам установить сеанс на 24 бита при записи, а не на 32 бит с плавающей запятой. Вы по-прежнему получите преимущества 32-битной обработки с плавающей запятой, но не увеличите размер файла.

Подпрыгивание при 32-битной плавающей запятой

У вас также есть возможность преобразовать звук в виде 32-битного файла с плавающей запятой. Как я упоминал ранее, это следует использовать только в том случае, если аудиофайл будет импортирован в DAW. Это не подходит для окончательного возврата, который вы загрузите в цифровой дистрибьютор.

Подпрыгивание 32-битных файлов с плавающей запятой дает вам преимущество, которого нет у файла с битовой глубиной с фиксированной запятой. С 32-битным файлом с плавающей запятой, если файл обрезается выше 0dBFS, файл может быть импортирован в сеанс и «отсечен». Это связано с тем, что звук с пиком выше 0dBFS не был потерян. Он по-прежнему присутствует, и его можно воспроизводить без искажений, ослабив усиление клипа до уровня, при котором самые громкие пики не превышают 0dBFS.

Однако при фиксированной битовой глубине это невозможно.Если звук отскакивает до фиксированной битовой глубины и имеет место отсечение, то обрезанный звук будет потерян, а любое возникающее в результате искажение будет неразрешимым при импорте в DAW. Конечно, если вы правильно ставите усиление и не небрежно относитесь к своим уровням, то вы не должны оказаться в ситуации, когда вы что-то отскакиваете, а позже понимаете, что оно обрезано. Но 32-битное число с плавающей запятой может предложить такую ​​подстраховку.

Дополнительным преимуществом является то, что при переключении на 32-битную разрядность с плавающей запятой сглаживание не требуется.Таким образом, если вы собираетесь отражать звук несколько раз, перемещая его от сеанса к сеансу, то 32-битное плавание дает вам возможность не применять дизеринг к аудио.

Слово предупреждения

Кое-что о 32-битной обработке с плавающей запятой, на которую стоит обратить внимание, заключается в следующем… Хотя у вас есть возможность с 32-битной обработкой с плавающей запятой позволить вашему звуку превысить 0dBFS в вашей DAW без отсечения, я все же рекомендую вам относиться к 0dBFS как к потолку. Это по двум причинам.

Во-первых, у вас могут быть старые сторонние плагины, которые вы используете, которые не работают с 32-битным числом с плавающей запятой. Таким образом, эти плагины будут обрезаться, если сигнал превысит 0dBFS.

Во-вторых, у некоторых плагинов есть «золотое пятно», которое следует учитывать. Обычно это происходит в плагинах, предназначенных для моделирования аналогового оборудования. Таким образом, вы получите различные тональные характеристики в зависимости от уровня, на котором вы отправляете сигналы в плагин. Добавление действительно высоких уровней в такие плагины вряд ли приведет к лучшему звуку, даже если они работают с 32-битным числом с плавающей запятой.

Можно ли записывать звук с 32-битной плавающей запятой?

Совсем недавно на рынке появилась пара аудиорекордеров, которые предлагают возможность записи в 32-битном формате с плавающей запятой. Одним из таких рекордеров является Zoom F6. Это очень новое достижение в области аудиозаписи, и в настоящее время оно доступно в портативных полевых рекордерах. Будет ли эта возможность распространяться на аудиоинтерфейсы для студий звукозаписи? Время покажет.

Эти устройства записи объединяют несколько 32-битных преобразователей с фиксированной запятой, а затем сохраняют захваченный звук в виде 32-битного файла с плавающей запятой.Благодаря большому динамическому диапазону они дают возможность записывать, не беспокоясь о настройках усиления. Затем уровни могут быть увеличены или уменьшены по мере необходимости в постобработке.

Возможность захвата звука, не беспокоясь об усилении, может быть очень полезна для людей, которые записывают звуки с чрезвычайно высокими и/или непредсказуемыми уровнями. Возможно, от этого выиграет запись природы, неожиданно прерванная внезапным раскатом грома.Или, возможно, аудио для интервью или подкаста, где нет возможности «сделать еще один дубль», если вы обнаружите, что не правильно установили усиление. Однако для тех из нас, кто записывает музыкальные инструменты в студиях звукозаписи, будет ли это необходимо? Пока вы намеренно устанавливаете уровни усиления и записываете 24-битный звук, я не вижу, чтобы это требовалось пользователям студии звукозаписи.

Заключение

Очень много информации, которую нужно взять на вооружение.Подведем итоги…

Битовая глубина определяет динамический диапазон цифрового звука, определяя уровень минимального шума.

Запись в формате 24 бит. Это даст вам больше возможностей для работы, чем 16 бит. Нет смысла записывать с 32-битной фиксированной точкой, поскольку 24-битной уже более чем достаточно. Также нет никакой реальной пользы в создании 32-битных файлов с плавающей запятой при записи. Это связано с тем, что ваш звук будет обрабатываться в 32-битной DAW, даже если ваши аудиофайлы имеют фиксированную битовую глубину.

Когда дело доходит до рикошета, единственный раз, когда вы должны прыгать на 32-битное число с плавающей запятой, это если звук будет импортирован в DAW. Это не подходит для финального отскока. Это должно иметь битовую глубину с фиксированной точкой. Преимущество перехода на 32-битное число с плавающей запятой заключается в том, что если есть какое-либо отсечение, звук может быть ослаблен при импорте в DAW и «отсечении». 32-битное число с плавающей запятой также не требует сглаживания.

Когда вы отправляете свой последний трек для выпуска, выберите 16 бит. 16 бит обеспечивает более чем достаточный динамический диапазон для воспроизведения даже очень динамичной музыки.Нет смысла проигрывать финальный трек в 24-битном формате.

Какой битовой разрядности вы обычно придерживаетесь при записи и отражении звука и почему? Оставьте свои мысли и предложения в поле для комментариев ниже.

Сборка

— Как переместить 3 байта (24 бита) из памяти в регистр?

Если вы знаете, что 3-байтовое целое не находится в конце страницы, обычно вы выполняете 4-байтовую загрузку и маскируете высокий мусор , который пришел с нужными вам байтами, или просто игнорирует его. , если вы делаете что-то с данными, которым не важны старшие биты.Какие целочисленные операции с дополнением до 2 можно использовать без обнуления старших битов во входных данных, если требуется только младшая часть результата?


В отличие от store 1 , загрузка данных, которые вы «не должны» никогда не будет проблемой для корректности, если вы не переходите на несопоставленную страницу. (Например, если db "pip" находится в конце страницы, а следующая страница не сопоставлена.) Но в этом случае вы знаете, что является частью более длинной строки, поэтому единственным возможным недостатком является производительность, если широкая нагрузка распространяется на следующую строку кэша (поэтому нагрузка пересекает границу строки кэша).Безопасно ли читать дальше конца буфера на одной странице на x86 и x64?

Любой байт до или байт после всегда будет безопасным для доступа для любых 3 байтов (даже без пересечения границы строки кэша, если сами 3 байта не были разделены между двумя строками кэша). Выяснять это во время выполнения, вероятно, не стоит, но , если вы знаете выравнивание во время компиляции , вы можете сделать либо

  mov eax, [ИмяСобаки-1] ; если предыдущий байт находится в той же строке страницы/кэша
шр экс, 8

mov eax, [имя собаки] ; если следующий байт находится в той же строке страницы/кэша
и eax, 0x00FFFFFF
  

Я предполагаю, что вы хотите обнулить результат в eax/rax, например, 32-битный размер операнда, вместо слияния с существующими старшими байтами EAX/RAX, такими как 8 или 16-битный размер операнда регистрация пишет.Если вы хотите объединиться, замаскируйте старое значение и ИЛИ . Или, если вы загрузили из [DogsName-1] , поэтому нужные вам байты находятся в верхних 3 позициях EAX, и вы хотите объединить их в ECX: сдвиньте старый верхний байт вниз, а затем сдвиньте его обратно, сдвигая 3 новых байта. (К сожалению, нет формы источника памяти shld . Наполовину связанная: эффективная загрузка из двух отдельных двойных слов в qword.) shld работает быстро на процессорах Intel (особенно Sandybridge и более поздних версиях: 1 мкп), но не на AMD (http://agner.org/optimize/).


Комбинация 2 отдельных нагрузок

Есть много способов сделать это, но, к сожалению, нет единого самого быстрого способа для всех процессоров. Запись частичного регистра ведет себя по-разному на разных процессорах. Ваш способ (байтовая загрузка / сдвиг / загрузка слов в ax ) довольно хорош на процессорах, отличных от Core2/Nehalem (который остановится до вставки слияния uop, когда вы прочитаете eax после его сборки).Но начните с movzx eax, byte [DogsName + 2] , чтобы разорвать зависимость от старого значения rax .

Классический «безопасный везде» код, который вы ожидаете от компилятора, будет выглядеть так:

  ОТНОС. ПО УМОЛЧАНИЮ ; компиляторы используют относительную RIP-адресацию для статических данных; вы тоже должны.
movzx eax, байт [имя_собаки + 2] ; избежать ложной зависимости от старого EAX
movzx ecx, слово [имя собаки]
шл эакс, 16
или eax, ecx
  

Это требует дополнительной инструкции, но позволяет избежать записи частичных регистров.Однако на процессорах, отличных от Core2 или Nehalem, лучший вариант для 2-х загрузок — запись x . (Intel P6 до Core2 не может запускать код x86-64, а процессоры без переименования частичного регистра будут сливаться в rax при записи ax ). Sandybridge по-прежнему переименовывает AX, но слияние стоит всего 1 микрооперацию без задержек, т. е. то же самое, что и OR, но на Core2/Nehalem внешний интерфейс останавливается примерно на 3 цикла при вставке слияния мопов.

Ivybridge и более поздние версии переименовываются только в AH , а не в AX или AL , поэтому на этих процессорах загрузка в AX представляет собой микроплавкую загрузку + слияние.Agner Fog не перечисляет дополнительные штрафы за mov r16, m на Silvermont или Ryzen (или любые другие вкладки в электронной таблице, которую я просмотрел), поэтому, по-видимому, другие процессоры без частичного переименования reg также выполняют mov ax, [mem ] как загрузка+слияние.

  movzx eax, байт [имя собаки + 2]
шл эакс, 16
mov топор, слово [ИмяСобаки]

; при чтении eax:
  ; * Sandybridge: для слияния вставлена ​​дополнительная 1 моп.
  ; * core2 / nehalem: остановка ~3 цикла (если вы не используете его до тех пор, пока нагрузка не уйдет)
  ; * все остальное (включая IvB+): без штрафа, слияние уже сделано
  

На самом деле, тестирование выравнивания во время выполнения может быть выполнено эффективно .Учитывая указатель в регистре, предыдущий байт находится в той же строке кэша, если только последние несколько 5 или 6 бит адреса не равны нулю. (т. е. адрес выравнивается по началу строки кэша). Предположим, что строки кэша имеют размер 64 байта; все современные процессоры используют это, и я не думаю, что какие-либо процессоры x86-64 с 32-байтовыми строками существуют. (И мы по-прежнему определенно избегаем пересечения страниц).

  ; указатель на m24 в RSI
    ; результат: EAX = zero_extend(m24)

    испытательная сила, 111111б; проверить все 6 младших бит.Там нет TEST r32, imm8, поэтому REX r8, imm8 короче и никогда не медленнее.
    jz .aligned_by_64

    mov eax, [rsi-1]
    шр экс, 8
.загружено:

    ...
    рет ; конец любой большой функции, частью которой это является

 ; маловероятный блок, помещенный за пределы строки, чтобы ускорить общий случай
.aligned_by_64:
    mov eax, [rsi]
    и eax, 0x00FFFFFF
    jmp .загружен
  

Таким образом, в общем случае дополнительная стоимость составляет только одну непройденную операцию проверки и ответвления.

В зависимости от ЦП, входных данных и окружающего кода тестирование младших 12 бит (только для того, чтобы избежать пересечения границ 4 КБ) могло бы пожертвовать лучшим прогнозированием ветвлений для некоторых разбиений строк кэша внутри страниц, но никогда не разбиения строк страниц.(В этом случае test esi, (1<<12)-1 . В отличие от тестирования sil с imm8 , тестирование si с imm16 не стоит остановки LCP на процессорах Intel для экономии 1 байт кода.И, конечно, если вы можете иметь свой указатель в ra/b/c/dx, вам не нужен префикс REX, и есть даже компактная 2-байтовая кодировка для test al, imm8 .)

Вы могли бы сделать это даже без ответвления, но явно не стоит того, чтобы просто делать 2 отдельные загрузки!

  ; указатель на m24 в RSI
    ; результат: EAX = zero_extend(m24)

    xor ecx, ecx
    испытательная сила, 7 ; могли бы также оставить его в qword, если мы не разветвляемся
    setnz cl ; ecx = (not_start_of_line) ? : 1 : 0

    суб rsi, rcx ; обычно rsi-1
    mov eax, [rsi]

    шл экх, 3 ; кл = 8 : 0
    шр акс, кл ; eax >>= 8 : eax >>= 0

                          ; с BMI2: shrx eax, [rsi], ecx более эффективен

    и eax, 0x00FFFFFF ; снимите маску, чтобы справиться со случаем, когда мы не изменились. 

Настоящая архитектурная 24-битная загрузка или сохранение

Архитектурно x86 не имеет 24-битных загрузок или хранилищ с целочисленным регистром в качестве места назначения или источника. Как указывает Брэндон, маскированные хранилища MMX/SSE (например, MASKMOVDQU , не путать с pmovmskb eax, xmm0 ) могут хранить 24 бита из регистра MMX или XMM, учитывая векторную маску только с младшими 3 набор байтов. Но они почти никогда не бывают полезными, потому что они медленные и всегда имеют намек на NT (поэтому они пишут в кэш и принудительно удаляют, например movntdq ).(Инструкция загрузки/сохранения в маске AVX dword/qword не подразумевает NT, но недоступна с побайтовой гранулярностью.)

AVX512BW (Skylake-server) добавляет vmovdqu8 , который дает вам маскирование байтов для загрузки и сохраняет с подавлением ошибок для байтов, которые замаскированы. (То есть вы не будете segfault, если 16-байтовая загрузка включает байты на несопоставленной странице, если для этого байта не установлены биты маски. Но это вызывает большое замедление). Таким образом, с точки зрения микроархитектуры — это по-прежнему 16-байтная загрузка, но влияние на состояние архитектуры (т.е. все, кроме производительности) точно так же, как настоящая 3-байтовая загрузка/сохранение (с правильной маской).

Вы можете использовать его для регистров XMM, YMM или ZMM.

  ;; вероятно, медленнее, чем целочисленный способ, особенно если вы на самом деле не хотите, чтобы результат был в векторе
мов акс, 7 ; установлены младшие 3 бита
kmovw k1,eax ; поднять установку маски из цикла


; load: оставьте {z}, чтобы слиться со старым xmm0 (или ymm0 / zmm0)
vmovdqu8 xmm0{k1}{z}, [rsi] ; {z}замаскированная 16-байтовая загрузка в xmm0 (с подавлением ошибок)
вмовд еах, хмм0

; хранить
вмовд хмм0, еах
vmovdqu8 [rsi]{k1}, xmm0 ; 16-байтовое хранилище с маской слияния (с подавлением ошибок)
  

Собирается с помощью NASM 2.13.01. IDK, если ваш NASM достаточно новый для поддержки AVX512. Вы можете играть с AVX512 без оборудования, используя Intel Software Development Emulator (SDE)

.

Выглядит круто, потому что требуется всего 2 операции, чтобы получить результат в eax (после настройки маски). (Тем не менее, http://instlatx64.atw.hu/ таблица данных от IACA для Skylake-X не включает vmovdqu8 с маской, только формы без маски. Это указывает на то, что это все еще одиночная загрузка uop. , или магазин с микропредохранителем как обычный vmovdqu/a )

Но остерегайтесь замедления, если загрузка 16 байтов приведет к ошибке или пересечению границы строки кэша .Я думаю, что внутри выполняет загрузку, а затем отбрасывает байты с потенциально дорогостоящим особым случаем, если необходимо подавить ошибку.

Кроме того, для версии с магазином обратите внимание на то, что маскированные хранилища не так эффективно перенаправляют на загрузку. (Дополнительную информацию см. в руководстве по оптимизации Intel).


Примечания:

  1. Широкие хранилища являются проблемой, потому что даже если вы замените старое значение, вы будете выполнять неатомарное чтение-модификацию-запись, что может привести к поломке, если, например, возвращаемый вами байт был блокировкой. Не храните вне объектов, если вы не знаете, что будет дальше и что это безопасно, т.е. padding, который вы поместили туда, чтобы разрешить это. Вы могли бы заблокировать cmpxchg измененное 4-байтовое значение на месте, чтобы убедиться, что вы не наступаете на обновление дополнительного байта другим потоком, но очевидно, что 2 отдельных сохранения намного лучше для производительности, чем atomic cmpxchg повторить цикл.

c++ - Почему сдвиг 0xff влево на 24 бита приводит к неправильному значению?

Давайте разобьем вашу проблему на две части.Первая — операция сдвига, а вторая — преобразование в uint64_t .

Что касается сдвига влево, вы вызываете неопределенное поведение на 32-разрядных (или меньших) архитектурах. Как уже упоминалось, операнды int . 32-битный int с заданным значением будет 0x000000ff . Обратите внимание, что это число со знаком, поэтому крайний левый бит является знаком. Согласно стандарту, если сдвиг влияет на знаковый бит, результат не определен.Это зависит от прихотей реализации, оно может быть изменено в любой момент и даже может быть полностью оптимизировано, если компилятор распознает его во время компиляции. Последнее нереально, но фактически разрешено. Хотя вы никогда не должны полагаться на код такой формы, на самом деле это не корень поведения, которое вас озадачило.

Теперь вторая часть. Неопределенный результат операции сдвига влево должен быть преобразован в uint64_t . Стандартные состояния для целочисленных преобразований со знаком в беззнаковое:

Если целевой тип беззнаковый, результирующее значение является наименьшим беззнаковым значением, равным исходному значению по модулю 2n, где n — количество битов, используемых для представления целевого типа.

То есть, в зависимости от того, является ли целевой тип более широким или более узким, целые числа со знаком дополняются знаком [сноска 1] или усекаются, а целые числа без знака дополняются нулем или усекаются соответственно.

В сноске поясняется, что расширение знака верно только для представления с дополнением до двух, которое в настоящее время используется на каждой платформе с компилятором C++.

Расширение знака означает, что все, что осталось от бита знака в переменной назначения, будет заполнено битом знака, что дает все f в вашем результате.Как вы заметили, вы можете оставить сдвиг 0x7f на 3 байта без этого, потому что 0x7f=0b01111111 . После сдвига вы получите 0x7f000000 , что является наибольшим целым числом со знаком, т.е. наибольшим числом, которое не влияет на бит знака. Поэтому при преобразовании был расширен 0 .

Преобразование левого операнда в достаточно большой тип решает эту проблему.

  uint64_t темп = uint64_t (0xff) << 24
  

16-бит против.24-битное и 32-битное аудио

При работе с цифровым звуком вы часто будете встречать такие термины, как разрешение звука, частота дискретизации и другие, которые описывают характеристики файла. Важно знать, что отличает хороший звук от плохого, поэтому полезно ознакомиться с этими терминами.

Один термин называется битовая глубина , и в настоящее время его часто используют без особых объяснений. Когда кто-то говорит, что это 16-битный или 24-битный звук, они имеют в виду разрядность звука.Поскольку битовая глубина равна аудио 101, вот объяснение того, что означает этот термин и необходимо ли выбирать более высокую битовую глубину.

Что такое битовая глубина?

Каждая цифровая звуковая волна разбивается на сэмплы, подобно тому, как цифровое изображение разбивается на сэмплы. Каждый образец имеет диапазон возможных амплитуд (объемов), которые можно воспроизвести. Этот диапазон амплитуд называется динамическим диапазоном .

Ниже приведен пример 4-битного цифро-аналогового преобразователя (ЦАП).Каждому образцу присваивается комбинация из четырех двоичных цифр, соответствующая количеству выходных контактов. Различные комбинации двоичных цифр соответствуют разным суммарным напряжениям, подаваемым на динамик или наушники.

В 4-битном ЦАП можно назначить 16 возможных комбинаций двоичных цифр, что означает, что на динамик можно подавать 16 различных напряжений.Более высокие напряжения означают более высокие амплитуды и наоборот.

Однако более высокая битовая глубина не означает более высокое качество звука. Важным моментом в более высоких битовых глубинах является уменьшение цифрового шума. При более низкой битовой глубине вы слышите гораздо больше цифрового шума. Если вы слушаете музыку с использованием вышеупомянутого 4-битного ЦАП, вы услышите массу шума.

Связанный: Лучшие ЦАПы для Hi-Res Audio

Что такое 16-битный звук?

Когда дело доходит до прослушивания музыки, вам понадобится как минимум 16-битный звук.Даже 8-битный звук содержит много шума, как показано в примере ниже. Это заметное шипение на заднем плане — это цифровой шум, который присутствует в низкобитовом звуке.

Десятилетиями мы наслаждались 16-битным звуком, так как звук на компакт-дисках 16-битный. Вот тот же музыкальный пример ниже, но с 16-битным звуком; шипения не слышно. Это связано с тем, что 8-битный звук имеет 256 возможных комбинаций двоичных цифр, а 16-битный звук имеет 65 536, что является экспоненциальным увеличением.

Несмотря на то, что мир в значительной степени покончил с компакт-дисками, 16-битный звук по-прежнему является стандартом для всех. Многие медиа по-прежнему распространяются в виде 16-битных аудиофайлов. Прослушивание 16-битного звука — это хорошо, но редактирование может быть проблемой, где необходима более высокая битовая глубина.

Что такое 24-битный звук?

Переход от 16-битного звука к 24-битному.Обычно люди путают битовую глубину с реальным качеством звука. Таким образом, когда они видят 24-битный звук, они автоматически предполагают более четкое или более высокое качество звука, но на самом деле это не так. 24-битный звук имеет более высокий динамический диапазон (16 777 216 возможных двоичных комбинаций) и уменьшенный шум. Возникает вопрос: если мы не слышим весь спектр шума в 16-битном звуке, то какой смысл в 24-битном звуке?

Хотя между обеими битовыми глубинами шума практически нет, 24-битный звук лучше подходит для студийного редактирования звука.При более высокой громкости звук начинает искажаться. Более высокий динамический диапазон означает, что звук может достигать большей громкости до того, как начнутся искажения. 24-битный звук оптимален для редактирования в этом отношении.

Что такое 32-битное аудио? Нам действительно это нужно?

У нас есть неслышимый шум с 16-битным звуком и лучшее редактирование с 24-битным звуком, но что делать с 32-битным звуком? Вы получаете 4 294 967 296 различных комбинаций двоичных цифр с 32-битным звуком, но так ли это необходимо? Честно говоря, не особо.

Единственным реальным преимуществом 32-битного звука является дополнительный запас при редактировании. В то время как вы получаете меньше искажений с 32-битным звуком, у вас есть достаточный запас мощности с 24-битным звуком, и еще есть место. Различия между битовыми глубинами не слышны и не стоят такой шумихи.

16-битный звук по-прежнему в приоритете

Многие термины не укладываются в голове, и многие компании делают ставку на это, и существует много путаницы в отношении разницы между звуком высокого разрешения и звуком без потерь.

Люди склонны думать, что чем больше число, тем лучше качество, но на самом деле прослушивание старого доброго 16-канального звука не является шагом назад. Вы слушали его с компакт-дисков, и сейчас нет причин останавливаться.

Превратите свой телефон в аудиоплеер высокого разрешения с Ztella DAC

Если вы чувствуете, что ваш телефон или компьютер подводит ваши наушники, это доступный способ улучшить качество звука.

Читать Далее

Об авторе Артур Браун (опубликовано 38 статей)

Артур — технический журналист и музыкант, живущий в Америке.Он работает в индустрии уже почти десять лет, написав статьи для онлайн-изданий, таких как Android Headlines. Он хорошо разбирается в Android и ChromeOS. Помимо написания информационных статей, он также умеет сообщать технические новости.

Более От Артура Брауна
Подпишитесь на нашу рассылку

Подпишитесь на нашу рассылку технических советов, обзоров, бесплатных электронных книг и эксклюзивных предложений!

Нажмите здесь, чтобы подписаться

24-битная иллюзия - Mojo Audio

ОБНОВЛЕНО: 7.25.21

Введение:

Все больше и больше музыки становится доступной в цифровых форматах «высокой четкости» (HD), таких как 24-битная загрузка 192 кГц, 24-битная потоковая передача MQA 88,2 кГц и DSD. Теперь я слышу разговоры о разработке нового 32-битного стандарта 384 кГц для HD-музыки. Интересно, что не все согласны с тем, что большая разрядность и более высокая частота дискретизации — это хорошо.

Этот блог объяснит математику и физику цифровой записи и музыкального воспроизведения с точки зрения непрофессионала, чтобы вы могли решить для себя, является ли это прогрессом или просто маркетинговым безумием.

Если вы не уверены, стоит ли вам верить утверждениям в этом блоге, которые противоречат большей части маркетинговой шумихи, мифов и легенд аудиофильской индустрии, не стесняйтесь проверять ссылки в конце.

Вы также можете обратиться к другому моему блогу на «DSD против PCM: миф против правды».


Биты, байты и цифровые слова:

Так почему же 24-бит стал новым стандартом?

Когда цифровые данные передаются и обрабатываются, они перемещаются в байтах, а не в виде отдельных битов.В байте 8 бит, а байт называется цифровым словом. Вот почему все в цифровом мире делится на 8. Таким образом, 16 бит = 2 байта и 24 бита = 3 байта. И 16-битные, и 24-битные стали стандартами, потому что каждый из них представлял следующее цифровое слово.

Историческая справка: 16-битный формат существовал задолго до появления 16-битных цифро-аналоговых преобразователей (ЦАП).


Частота дискретизации и разрядность:

Процесс преобразования аналоговых звуковых волн в цифровой формат известен как «квантование», которое часто представляется в виде точек, нанесенных на ось XY.Горизонтальная ось X представляет время или частоту дискретизации, а вертикальная ось Y представляет амплитуду или разрядность. На приведенном ниже рисунке белая форма волны представляет собой квантируемый музыкальный сигнал, а наложенный зеленый ступенчатый паттерн представляет квантованные значения.

Частота дискретизации — это частота, на которой дискретизируется амплитуда аналоговой звуковой волны. Частота дискретизации 44,1 кГц, указанная для компакт-дисков Red Book, определяет амплитуду музыки 44 100 раз в секунду.Частота дискретизации 96 кГц, используемая в 7.1-канальном звуке, встроенном в DVD и Blu-Ray, сэмплирует амплитуду 96 000 раз в секунду.

Битовая глубина означает количество шагов, на которые делится амплитуда аналоговой звуковой волны при каждой выборке. 16-битная запись содержит 65 536 шагов, 20-битная запись — 1 048 576 шагов, а 24-битная запись — 16 777 216 шагов. Да, вы правильно прочитали: 24-битная запись имеет в 256 раз больше шагов амплитуды, чем 16-битная запись.

Чем больше битов и/или чем выше частота дискретизации, используемая при квантовании, тем выше теоретическое разрешение. Таким образом, 16-битный компакт-диск Red Book 44,1 кГц имеет 28 901 376 точек дискретизации в секунду (44 100 x 65 536). А 24-битная запись 192 кГц имеет 32 212 254 000 000 точек дискретизации в секунду (192 000 x 16 777 216). Это означает, что 24-битные записи 192 кГц имеют теоретическое разрешение более чем в 111 455 раз больше, чем 16-битные записи 44,1 кГц. Не маленькая разница.

Так почему же записи HD звучат лишь немногим лучше, чем 16-битные 44.Записи 1 кГц, сделанные с одинаковых мастеров? Позже в этом блоге я объясню разницу между теоретическим и фактическим разрешением.


Динамический диапазон и разрядность:

Динамический диапазон — это разница в громкости между самым тихим и самым громким отрывком. Динамический диапазон измеряется в децибелах (дБ).

Просто для справки, вот несколько примеров динамического диапазона, которые могут иметь отношение к большинству из нас:

  • Звук комара, летящего на расстоянии 3 метров, составляет 0 дБ.
  • Гул лампы накаливания на расстоянии 1 метра составляет 10 дБ.
  • Фоновый шум в тихой студии звукозаписи составляет 20 дБ.
  • Уровень фонового шума в обычном тихом помещении составляет около 30 дБ.
  • Ранняя аналоговая мастер-лента имела динамический диапазон всего 60 дБ.
  • Записи
  • LP с микроканавками имеют динамический диапазон 65 дБ.
  • Dolby увеличил динамический диапазон аналоговой мастер-ленты до 90 дБ.
  • Звук отбойного молотка на расстоянии 1 метра составляет 110 дБ.
  • Звук полного оркестра на расстоянии 1 метра составляет 120 дБ.
  • Более 130 дБ вызывает необратимую потерю слуха.
  • Звук реактивного самолета при взлете составляет 140 дБ.

В цифровой записи 1 бит = 6 дБ:

  • 16-битные компакт-диски Red Book имеют динамический диапазон 96 дБ.
  • 20-битная цифровая мастер-лента имеет динамический диапазон 120 дБ.
  • 24-битные форматы HD имеют динамический диапазон 144 дБ.

Но подождите… разве фоновый шум в тихой комнате не 30 дБ?

Таким образом, вы не сможете услышать разницу между динамическим диапазоном 16-битной записи и 20-битной записи, если только вы не увеличите громкость до уровня выше 30 дБ фонового шума, который может привести к повреждению слуха.

Так с какой стати им вообще создавать цифровой формат записи, который даже нельзя слушать?!?!?!?!?

Простота: битовая глубина и частота дискретизации, намного превышающие диапазон человеческого слуха, используются во время процессов записи, редактирования, микширования и мастеринга для снижения цифрового шума в слышимом спектре, когда записи понижаются до значительно более низкого разрешения, продаваемого в коммерческих записях.


Уровень шума:

Динамический диапазон — это максимально громкий звук, а минимальный уровень шума — самый тихий.

Мы уже знаем, что в тихой комнате уровень фонового шума составляет около 30 дБ, и нам нужно подняться выше. Даже если система играет выше комнатного шума в 30 дБ, источник питания в ЦАП будет маскировать LSB, если размах напряжения шума в источнике питания не меньше напряжения LSB.

Для того, чтобы ЦАП действительно разрешал определенную битовую глубину, размах напряжения пульсаций в источнике питания должен быть ниже, чем напряжение LSB.И для того, чтобы ЦАП мог разрешать определенную частоту дискретизации, скорость источника питания должна быть выше, чем частота дискретизации.

Основываясь на выходном напряжении 2,5 В однотактного ЦАП (около среднего), ниже приведены напряжения, при которых шум источника питания должен быть ниже, чтобы можно было услышать LSB:

  • 16-битное минимальное напряжение шума LSB = 76 мкВ
  • 20-битное минимальное напряжение шума LSB = 4,75 мкВ
  • 24-битное минимальное напряжение шума LSB = 0,3 мкВ
Для справки, обычный регулятор мощности LM317, качество, используемое в большинстве коммерческих электронных устройств, имеет шум около 150 мкВ от пика до пика, а лучшие сверхмалошумящие регуляторы мощности, используемые в лучших из лучших аудиофильских электронных устройств, имеют шум около 150 мкВ. Размах шума 5 мкВ.Таким образом, даже выходное напряжение 5 В сбалансированного ЦАП не могло разрешить ничего близкого к напряжению LSB 24-битной записи.

Извините, что разорвал чей-то пузырь и противоречу маркетинговой шумихе, мифу и легенде в аудиофильской индустрии, но то, что ЦАП способен декодировать 24-бита, не означает, что он действительно способен обрабатывать эту битовую глубину на своем аналоговом выходе. сцена.

По словам экспертов, которые производят лучшие микросхемы ЦАП, резисторы и регуляторы мощности, теоретически невозможно создать электронику, способную различать разрешение, намного превышающее 20-битное (динамический диапазон 120 дБ).Любая компания, заявляющая о 24-битном разрешении своего ЦАП, просто полная чушь. О, они могут декодировать 24-битное, потому что 24-битное существует на цифровой стороне, но аналоговый выходной каскад в лучших в мире ЦАП не способен разрешать намного больше, чем 20-битный динамический диапазон.

И даже не говорите мне о ЦАПах с ламповыми выходными каскадами: самый низкий уровень шума лампового выходного каскада составляет около 90 дБ, а это означает, что, что бы ни утверждал производитель, ни один ламповый ЦАП не может разрешить динамический диапазон даже при 16-битной записи. не говоря уже о 24-битной записи.


Теоретическое и фактическое разрешение:

Согласно теореме доктора Найквиста, выборка на частоте, в два раза превышающей максимальную слышимую частоту, обеспечивает идеальное воспроизведение звуковой волны. Любое более высокое разрешение будет отображать только больше точек на одних и тех же кривых.

Таким образом, чтобы правильно сэмплировать ноту 20 кГц, максимальную частоту, которую может слышать человеческое ухо, вам нужно сэмплировать на частоте более 40 кГц. Частота дискретизации CD Red Book 44,1 кГц была разработана для точной записи звука частотой 20 кГц.

Извините, что разорвал ваш пузырь, но, несмотря на то, во что могут верить многие аудиофилы, менее одного человека из тысячи может слышать что-либо выше 20 кГц в детстве, и почти нет никого старше 40 лет, кто может слышать намного выше 15 кГц. .

Так зачем же нужны более высокие частоты дискретизации, чем 44,1 кГц?

Одной из причин является шум квантования. Поскольку шум квантования присутствует около частоты дискретизации записи PCM, a 44.Запись 1 кГц имеет шум квантования на одну октаву выше предела человеческого слуха в 20 кГц. Этот шум квантования необходимо отфильтровать, поэтому все ЦАП имеют на выходе фильтр нижних частот. Поскольку шум квантования всего на одну октаву выше слышимости, используемые фильтры имеют очень крутой наклон, чтобы не отфильтровывать желаемые высокие частоты. Эти цифровые фильтры нижних частот с крутым наклоном широко известны как фильтры «кирпичной стены».

Хотя вы много слышали о фильтрах «кирпичной стены», которые вызывали слышимые искажения в верхних частотах первых проигрывателей компакт-дисков Red Book, факт в том, что это была лишь небольшая часть причины, по которой ранние компакт-диски и проигрыватели Red Book имели неестественное звучание верхних частот. .Большая часть жестких, резких, неестественно звучащих высоких частот в ранних цифровых технологиях была больше связана с недостатками источников питания и недостатками в процессе записи, а не с фильтрами «кирпичной стены».

Чтобы снизить шум квантования в слышимом спектре, для студий звукозаписи были разработаны профессиональные форматы, такие как 24-битный 352,8 кГц DXD. Причины, по которым были разработаны 24-битные микросхемы ЦАП, заключались в том, чтобы инженеры звукозаписи могли контролировать свою запись, редактирование, микширование и мастеринг в режиме реального времени без необходимости понижать частоту дискретизации.Конечно, компании, которые производили микросхемы ЦАП, прекратили производство микросхем ЦАП с более низким разрешением. А компании, производившие бытовую электронику, использовали эти 24-битные микросхемы ЦАП и начали делать креативные маркетинговые заявления о своей продукции.

Несмотря на то, что многие записи рекламируются как 24-битные, на самом деле используется лишь небольшая часть из 24-битного динамического диапазона. Эти так называемые 24-битные записи сжимаются до динамического диапазона, который может воспроизвести большинство электроники.Я говорю не о высококлассной аудиофильской электронике, а скорее об обычной автомобильной стереосистеме, телефоне или MP3-плеере. Коммерческие записи с динамическим диапазоном более 40 дБ имеют пики, которые отсекают большую часть электроники при очень низкой громкости. Дополнительные сведения о том, как динамический диапазон влияет на электронику, см. в следующем разделе «Требования к воспроизводящему оборудованию».

Так что же они делают с коммерчески доступными так называемыми 24-битными записями? Они просто заполняют старшие значащие биты (MSB) единицами, а младшие значащие биты (LSB) — нулями и центрируют фактический динамический диапазон.Даже самые лучшие аудиофильские записи имеют динамический диапазон менее 70 дБ. Они могли бы выпустить запись идентичного исполнения в 16-битном формате, но поскольку наивных потребителей обманули, заставив поверить в бредовые маркетинговые сообщения о 24-битном формате, звукозаписывающие компании помещают в среднем 5-7 бит динамического диапазона в 24-битный. битовый формат. Как глупо.

DSD ничем не отличается. Хотя вы не можете напрямую связать DSD с точки зрения битовой глубины и частоты дискретизации, грубая оценка состоит в том, что DSD64 (также известный как SACD или односкоростной DSD) довольно близок по разрешению к 24-битному 88.Запись PCM 2 кГц. Но вместо того, чтобы иметь шум квантования, сосредоточенный вокруг частоты дискретизации, как PCM, DSD64 имеет значительное количество цифрового шума чуть выше 25 кГц, как показано на графике ниже.

Чтобы обойти эту проблему, в ЦАП Delta-Sigma есть алгоритмы формирования шума и множество повышающих дискретизацию до более высоких частот, чтобы переместить шум квантования на достаточно высокую частоту, чтобы его можно было отфильтровать с минимальными искажениями в слышимом диапазоне.Это одна из причин, почему программное обеспечение компьютерного аудиоплеера, повышающее дискретизацию DSD64 до DSD с двойной или четырехкратной скоростью, обеспечивает такое улучшение производительности ЦАП Delta-Sigma. Это также является одной из причин, по которой повышение частоты дискретизации до высоких частот улучшает производительность файлов PCM, декодируемых большинством ЦАП Delta-Sigma.

Еще одна причина, по которой повышающая дискретизация улучшает производительность ЦАП Delta-Sigma, заключается в том, что они используют алгоритмы статистической коррекции ошибок, поэтому чем больше точек данных, тем точнее коррекция ошибок.Это то, что обманывает многих аудиофилов, заставляя их поверить в то, что более высокие частоты дискретизации выше полосы пропускания 2X, о которой заявил доктор Найквист, дадут более высокое разрешение. Это не относится к релейным ЦАП R-2R. Повышения частоты дискретизации до 88,2 кГц достаточно, чтобы удалить любые цифровые артефакты из слышимого спектра при использовании ЦАП R-2R.

Для получения более подробной информации по этой теме обратитесь к моему блогу «DSD vs. PCM: Myth vs. Truth».

Еще одним соображением о более высоких частотах дискретизации и большей битовой глубине являются системные ресурсы.Оба требуют больше места для хранения, больше оперативной памяти, более быстрые процессоры и более мощные источники питания. Хотя оптимальная частота дискретизации и битовая глубина, необходимые для точного воспроизведения музыки, являются предметом жарких споров, нет никаких сомнений в том, что чрезмерное разрешение излишне расходует системные ресурсы и излишне увеличивает размер и стоимость компонентов. Также обратите внимание, что более быстрые процессоры и источники питания с более высоким током, необходимые для обработки более высоких разрешений или для повышения частоты дискретизации, по своей природе являются более шумными.


Требования к воспроизводящему оборудованию:

Существует очень мало систем, даже среди лучших из лучших, которые могут точно воспроизводить полный динамический диапазон 120 дБ 20-битной записи. Вот почему немногие коммерческие записи имеют динамический диапазон выше 6 бит, не говоря уже о динамическом диапазоне 144 дБ 24-битной записи. Имейте в виду, что максимальный динамический диапазон LP-записей с микроканавками составляет всего 65 дБ, а максимальный динамический диапазон аналоговых мастер-лент Pro-Audio Dolby — 90 дБ.

В записи LP и стандартах аналоговых лент была мудрость. Зависимость между мощностью усилителя и децибелами (дБ) громкости является логарифмической, а не линейной. Производители знали, что на каждые 3 дБ повышения громкости потребители должны будут удвоить мощность своего усилителя и удвоить мощность динамиков. Таким образом, сохранение динамического диапазона потребительской записи ниже 60 дБ — это то, что позволило домашнему развлекательному оборудованию быть доступным, скромного размера и относительно высокого качества.

Чтобы на большинстве систем можно было воспроизводить живую музыку с уровнем громкости 120 дБ, студии звукозаписи ограничивают динамический диапазон с помощью процесса, называемого «динамической компрессией». Процесс динамической компрессии делает более тихие фрагменты относительно громкими, а более громкие - относительно более тихими. Это позволяет легче отличить детали низкого уровня от более громких пассажей. Когда музыка правильно динамически сжата, это позволяет вам слушать ее с разумной громкостью и при этом слышать все тонкие гармонические сигналы, которые раскрывают тон, тембр и акустику помещения в записи.

Подумайте об этом: динамический диапазон в 60 дБ на фоне фонового шума в 30 дБ равен 90 дБ. Насколько громче 90 дБ вы хотите слушать музыку дома? Что еще более важно, на каждые дополнительные 3 дБ увеличения динамического диапазона вам потребуется удвоить мощность вашего усилителя и удвоить мощность ваших динамиков.

При прочих равных, чтобы перейти от 90 дБ на выходе к 99 дБ, вам понадобится усилитель с 8-кратной мощностью и динамики с 8-кратной мощностью.Чтобы точно воспроизвести запись на уровне 120 дБ, вам понадобится усилитель в 1024 раза мощнее, а динамики в 1024 раза мощнее, чем для воспроизведения той же записи на уровне 90 дБ. я не знаю как вам, а такая система не влезет ни в мою комнату, ни в мой бюджет.


Сводка:

Ну, все это настоящее открытие для ушей, не так ли?

Когда люди утверждают, что слышат существенные различия между 16-битными и 24-битными записями, они слышат не разницу в битовой глубине, а чаще всего разницу в качестве цифрового ремастеринга.И большинство записей спроектированы так, чтобы лучше всего звучать на автомобильной стереосистеме или портативном устройстве, а не на высококачественной аудиофильской системе. Хорошо известно, что артисты и продюсеры часто слушают треки на MP3-плеере или автомобильной стереосистеме, прежде чем утвердить окончательный микс.

Качество записи играет гораздо более важную роль, чем формат или разрешение, в котором она распространяется. Но для увеличения прибыли многие руководители современных студий звукозаписи настаивают на том, чтобы ошибки были отредактированы на этапе постобработки, что значительно снижает качество исходного мастер-материала. ленты.Так что в каком бы формате эти записи ни были выпущены, музыка всегда будет звучать посредственно, так как вы никогда не сможете получить более высокое исполнение, чем то, что есть на оригинальных мастерах.

Напротив, некоторые из моих любимых цифровых записей были обработаны в цифровом виде с аналоговых записей 1950-х годов. Многие из этих записей были сделаны группой музыкантов, играющих в комнате, с одним дублем на трек и без постобработки. Хотя эти записи имеют гораздо более высокий фоновый шум, ограниченный мастер-лентой с динамическим диапазоном 60 дБ старой школы до Dolby, они сохраняют органический характер и гармонические сигналы в помещении, которые невозможно воспроизвести каким-либо другим способом.


Послушайте сами:

Вас интересуют возможности цифро-аналогового преобразования?

Mystique EVO DAC от Mojo Audio обеспечивает максимально чистое цифровое преобразование.

  • Релейный ЦАП R-2R без передискретизации.
  • Нет алгоритмов формирования шума, повышения или передискретизации.
  • Схема регулировки напряжения перехода через нуль
  • MSB для оптимизации линейности.
  • Аппаратное демультиплексирование левого и правого каналов с идеальным выравниванием по битам.
  • Прямая связь без выходных конденсаторов или трансформаторов для искажения фазы и времени или узкой полосы пропускания.
  • Блоки питания
  • LC с дроссельным входом, которые, в отличие от емкостных источников питания, сохраняют как ток, так и напряжение.

Mystique находится в отдельном классе. Взрывная микродинамика в сочетании с гармонически согласованными микродеталями раскрывают истинное время, мелодию, тон и тембр оригинального музыкального исполнения.

С 45-дневным прослушиванием без риска Mojo Audio вы можете услышать Mystique DAC для себя, в своей собственной системе, без риска и без платы за пополнение запасов.Испытайте всю гармоническую согласованность и эмоциональное содержание, которое способна доставить цифровая музыка.

Если вам нравится то, что вы прочитали в этом блоге, и вы заинтересованы в получении дополнительных бесплатных советов и рекомендаций, ознакомьтесь с остальными моими блогами на нашем веб-сайте. Кроме того, подпишитесь на нашу электронную рассылку, чтобы получать более полезную информацию, а также купоны на скидку, специальные предложения и первые сведения о новых продуктах.

Наслаждаться!

Бенджамин Цвикель
Владелец, Mojo Audio


Каталожные номера:

http://www.lavryengineering.com/lavry-white-papers/

http://www.highendnews.info/technology/oversampling_and_bitstream_metho.htm

http://www.grimmaudio.com/site/assets/files/1088/dsd_myth.pdf

http://bitperfectsound.blogspot.com/2014/12/dst-compression.html

http://www.soundonsound.com/sos/sep07/articles/digitalmyths.htm

http://www.digitalpreservation.gov/formats/fdd/fdd000230.shtml

https://en.wikipedia.org/wiki/Direct_Stream_Digital

Super Audio Compact Disc (SACD)

Blog

http://benchmarkmedia.com/blogs/news/15121729-audio-myth-24-bit-audio-has-more-resolution-than-16-bit-audio


Примечание: многие изображения, используемые в этом блоге, были адаптированы из рисунков, взятых из этих справочных источников.

.
24 бита: 24 бита в байтах

Добавить комментарий

Ваш адрес email не будет опубликован.

Пролистать наверх