20 000 профессионалов proAV > 1500 компаний > 570 городов > 6 стран ближнего зарубежья > 1 сообщество

Присоединяйтесь!

Подписка на дайджест
Рубрикатор статей

Аудио. Цифровое и аналоговое аудио

Несмотря на то, что большую часть внешней информации мы усваиваем с помощью зрения, звуковые образы для нас ничуть не менее важны, а часто даже и более. Попробуйте посмотреть кино с выключенным звуком – через 2-3 минуты вы потеряете нить сюжета и интерес к происходящему, каким бы большим ни был экран и качественным изображение! Поэтому в немом кино за кадром играл тапер. Если же убрать изображение и оставить звук, кино вполне можно «слушать» как увлекательную радиопостановку.

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы. При этом наш слух с большой точностью может локализовать невидимый источник звука по направлению, расстоянию, скорости перемещения.

Звук научились преобразовать в электрические колебания задолго до изображения. Этому предшествовала механическая запись звуковых колебаний, история которой началась еще в 19 веке.

Ускоренный прогресс, включая возможность передачи звука на расстояние, стал возможен благодаря электричеству, с появлением усилительной техники, акустоэлектрических и электроакустических и преобразователей – микрофонов, звукоснимателей, динамических головок и прочих излучателей. Сегодня звуковые сигналы передаются не только по проводам и через эфир, но и по оптоволоконным линиям связи, в основном в цифровом виде.

Акустические колебания преобразуются в электрический сигнал обычно с помощью микрофонов. Любой микрофон имеет в своем составе подвижный элемент, колебания которого порождают ток или напряжение определенной формы. Наиболее распространенный тип микрофона – динамический, представляющий собой «динамик наоборот». Колебания воздуха приводят в движение мембрану, жестко связанную со звуковой катушкой, находящейся в магнитном поле. Конденсаторный микрофон, по сути, и есть конденсатор, одна из обкладок которого колеблется в такт со звуком, а вместе с ней изменяется емкость между обкладками. В ленточных микрофонах используется тот же принцип, только одна из пластин свободно подвешена. Схож с конденсаторным электретный микрофон, пластины которого в процессе колебаний сами вырабатывают электрический заряд, пропорциональный амплитуде колебаний. Многие модели микрофонов имеют встроенный усилитель (уровень сигнала непосредственно с акусто-электрического преобразователя очень мал). В отличие от микрофона, звукосниматель электромузыкального инструмента регистрирует колебания не воздуха, а твердого тела: струны или деки инструмента. Головка звукоснимателя считывает канавку грампластинки с помощью иглы, механически соединенной с подвижными катушками, находящимися в магнитном поле, либо магнитами, если катушки неподвижны. Либо колебания иглы передаются на пьезоэлемент, который при механических воздействиях вырабатывает электрический заряд. В магнитной записи звуковой сигнал записывается на магнитную ленту, а затем считывается специальной головкой. Наконец, в кинематографе традиционно была принята оптическая запись: с краю пленки наносилась непрозрачная звуковая дорожка, ширина которой менялась в такт со сигналом, и при протягивании пленки через проекционный аппарат электрический сигнал снимался с помощью фотосенсора.

В синтезаторах звук рожается непосредственно в виде электрических колебаний, здесь отсутствует первичное преобразование акустических волн в электрический сигнал.

Современные источники звука осень разнообразны, и все большее распространение получают цифровые носители: компакт-диски, DVD, хотя сохраняются еще и виниловые пластинки. Мы продолжаем слушать радио, как эфирное, так и кабельное (радио-точки). Звук сопровождает телепередачи и кинофильмы, не говоря уже о таком привычном явлении, как телефония. Все больший удельный вес в мире аудио получает компьютер, позволяющий с удобством архивировать, комбинировать и обрабатывать звуковые программы в виде файлов. В век цифровых технологий оцифрованная речь и музыка передается по цифровым каналам, включая сеть Интернет, без серьезных потерь на транспортировку. Это обеспечивается цифровым кодированием, и потери возникают исключительно из-за сжатия, которое чаще всего при этом используется. Однако на цифровых носителях его либо нет вовсе (CD, SACD), либо применяются алгоритмы сжатия звука без потерь (DVD Audio, DVD Video). В остальных случаях степень сжатия определяется требуемым уровнем качества фонограммы (файлы MP3, цифровая телефония, цифровое телевидение, некоторые типы носителей).

cifrovoe-i-analogovoe-audio-1.jpg
Рис. 1. Преобразование акустических звуковых колебаний в электрический сигнал

Обратное преобразование из электрических колебаний в акустические осуществляются с помощью громкоговорителей, встроенных в радиоприемники и телевизоры, а также отдельных акустических систем, головных телефонов.

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц. Ниже (инфразвук) и выше (ультразвук) человеческое ухо не слышит, да и в пределах звукового диапазона чувствительность слуха весьма неравномерна, ее максимум приходится на частоту 4 кГц. Чтобы слышать звуки всех частот одинаково громко, нужно воспроизводить их с разным уровнем. Такой прием, называемый тонкомпенсацией, часто реализуется в бытовой аппаратуре, хотя результат его нельзя признать однозначно положительным.

cifrovoe-i-analogovoe-audio-2.jpg
Рис. 2. Кривые равной громкости
(Нажмите на изображение для увеличения)

Физические свойства звука обычно представляются не в линейных, а в относительных логарифмических величинах – децибелах (дБ), поскольку это гораздо нагляднее в цифрах и компактнее на графиках (в противном случае пришлось бы оперировать с величинами, имеющими множество нулей до запятой и после, и вторые с легкостью потерялись бы на фоне первых). Отношение двух уровней A и B в дБ (скажем, напряжения или тока) определяется как:

Сu [дБ] = 20 lg A/B. Если же речь идет о мощностях, то Сp [дБ] = 10 lg A/B.

Кроме частотного диапазона, определяющего чувствительность человеческого слуха к высоте звука, существует также понятие диапазона громкостей, который показывает чувствительность уха к уровню громкости и охватывает интервал от самого тихого звука, различимого слухом (порог чувствительности), до самого громкого, за которым лежит болевой порог. Порог чувствительности принят как звуковое давление в 2 х 10-5 Па (Паскаль), а болевой порог – давление, в 10 миллионов раз большее. Иными словами, диапазон слышимости, или отношение давления самого громкого звука, к самому тихому, составляет 140 дБ, что заметно превосходит возможности любой аудио аппаратуры ввиду ее собственных шумов. Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона (отношение самого громкого звука, воспроизводимого аппаратурой, к уровню шума) 120 дБ, компакт-диск обеспечивает 90 дБ, виниловая пластинка – порядка 60 дБ.

cifrovoe-i-analogovoe-audio-3.jpg
Рис. 3. Диапазон чувствительности слуха

Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона

Шумы всегда присутствуют в звуковом тракте. Это как собственные шумы усилительных элементов, так и внешние наводки. Искажения сигнала делятся на линейные (амплитудные, фазовые) и нелинейные, или гармонические. В случае линейных искажений спектр сигнала не обогащается новыми компонентами (гармониками), изменяются лишь уровень или фаза уже существующих. Амплитудные искажения, нарушающие изначальные соотношения уровней на разных частотах, приводят к слышимым искажениям тембра. Долгое время считалось, что фазовые искажения некритичны для слуха, однако на сегодня доказано обратное: и тембр, и локализация звука в значительной мере зависимы от фазовых соотношений частотных компонентов сигнала.

Любой усилительный тракт нелинеен

Любой усилительный тракт нелинеен, поэтому всегда возникают гармонические искажения: новые частотные компоненты, отстоящие по частоте в 3, 5, 7 и т.д. от порождающего их тона (нечетные гармоники) или в 2, 4, 6 и т.д. раз (четные). Порог заметности гармонических искажений сильно варьирует: от нескольких десятых и даже сотых долей процента до 3-7%, в зависимости от состава гармоник. Четные гармоники менее заметны, поскольку находятся в консонансе с основным тоном (разница по частоте в два раза соответствует октаве).

Помимо гармонических, имеют место интермодуляционные искажения, представляющие собой разностные продукты частот спектра сигнала и их гармоник. Например, на выходе усилителя, на вход которого подано две частоты 8 и 9 Гц (при достаточно нелинейной его характеристике) появится третья (1 кГц), а также целый ряд других: 2 кГц (как разность вторых гармоник основных частот) и т.д. Интермодуляционные искажения особенно неприятны на слух, поскольку порождают множество новых звуков, включая диссонансные по отношению к основным.

То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя

Шумы и искажения в значительной степени маскируются сигналом, однако они и сами маскируют сигналы малого уровня, которые исчезают или теряют отчетливость. Поэтому чем выше отношение сигнал/шум, тем лучше. Фактическая чувствительность к шумам и искажениям зависит от индивидуальных особенностей слуха и его натренированности. Уровень шумов и искажений, не влияющий на передачу речи, может быть абсолютно неприемлемым для музыки. То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя.

ПЕРЕДАЧА АНАЛОГОВОГО АУДИО

Традиционно аудио сигналы передавались по проводам, а также эфиру (радио).

Различают небалансную линию передачи (классическая проводная) и балансную. Небалансная имеет в своем составе два провода: сигнальный (прямой) и обратный (земля). Такая линия весьма чувствительна к внешним помехам, поэтому для передачи сигнала на большие расстояния не подходит. Часто реализуется с помощью экранированного провода, экран при этом соединяется с землей.

cifrovoe-i-analogovoe-audio-4.jpg
Рис. 4. Небалансная экранированная линия

Балансная линия предполагает три провода: два сигнальных, по которым течет один и тот же сигнал, но в противофазе, и землю. На приемной стороне синфазные помехи (наведенные на оба сигнальных провода) взаимно вычитаются и полностью исчезают, а уровень полезного сигнала удваивается.

cifrovoe-i-analogovoe-audio-5.jpg
Рис. 5. Балансная экранированная линия

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная.

На рисунках точки подключения экрана показаны условно, поскольку их приходится каждый раз подбирать «по месту» для достижения наилучших результатов. Чаще всего экран подключается только на стороне приемника сигнала.

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная

Аудиосигналы нормируются по уровню действующего напряжения (0,707 от амплитудного значения):

  • микрофонный 1-10 мВ (для микрофонов без встроенного усилителя),
  • линейный 0,25-1 В, обычно 0,7 В.

На выходе усилителя мощности, с которого сигнал поступает на громкоговорители, его уровень гораздо выше и может достигать (в зависимости от громкости) 20-50 В при токах до 10‑20 А. Иногда – до сотен вольт, для трансляционных линий и озвучивания открытых пространств.

Используемые кабели и разъемы:

  • для балансных линий и микрофонов – экранированная пара (часто витая), 3-контактные разъемы XLR или клеммы, винтовые или зажимные;

cifrovoe-i-analogovoe-audio-6.jpg
Рис. 6. Разъемы для балансных линий: клеммы и XLR

  • для небалансных линий – экранированный кабель, разъемы RCA («тюльпан»), реже DIN (а также ГОСТ), а также различные штекеры;

cifrovoe-i-analogovoe-audio-7.jpg
Рис. 7. Разъемы для небалансных линий: RCA, 3,5-мм и 6,25-мм штекеры

  • для мощных сигналов для громкоговорителей – неэкранированные (за редким исключением) акустические кабели большого сечения, клеммы или зажимы, разъемы типа «банан» или «игла»

cifrovoe-i-analogovoe-audio-8.jpg
Рис. 8. Разъемы акустических кабелей

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах. Имеют значение материалы проводника и диэлектрика, сечение, геометрия кабеля. В самых дорогих моделях межблочных и акустических кабелей применяется сверхчистая медь и даже цельное серебро, а также тефлоновая изоляция, отличающаяся минимальным уровнем диэлектрической абсорбции, увеличивающей потери сигнала, причем неравномерно по полосе частот. Рынок кабельной продукции очень разнообразен, часто разные модели одинакового качества отличаются друг от друга лишь ценой, причем во много раз.

Любые кабели характеризуются потерями аналогового сигнала, которые растут с ростом частоты и расстояния передачи. Потери определяются омическим сопротивлением проводника и контактов в разъемах, а также распределенными реактивными составляющими: индуктивностью и емкостью. По сути, кабель представляет собой фильтр низких частот (режет высокие).

Помимо передачи на разные расстояния, сигналы часто приходится разветвлять и коммутировать. Коммутаторы (селекторы входов) являются неотъемлемой частью многих компонентов аудиотракта, как профессионального, так и пользовательского. Существуют и специализированные усилители-распределители, разветвляющие сигнал и обеспечивающие согласование с линией передачи и другими компонентами по уровню и импедансам (а также часто компенсирующих спад на высоких частотах) и коммутаторы, обычные (несколько входов и один выход) и матричные (множество входов и выходов).

ОБРАБОТКА АНАЛОГОВОГО АУДИО

Любая обработка аналогового аудиосигнала сопровождается определенными потерями его качества (возникают частотные, фазовые, нелинейные искажения), однако она необходима. Основные виды обработки следующие:

  • усиление сигнала до уровня, нужного для передачи, записи или воспроизведения громкоговорителем: подав сигнал с микрофона на динамик, мы ничего не услышим: требуется предварительно усилить его по уровню и мощности, обеспечив при этом возможность регулировки громкости.

cifrovoe-i-analogovoe-audio-9.jpg
Рис. 9

  • фильтрация по частотам: от полезного звукового диапазона (20 Гц – 20 кГц) отсекают инфразвук, который на определенных частотах вреден для здоровья, и ультразвук. Во многих случаях диапазон намеренно сужают (речевой телефонный канал имеет полосу от 300 Гц – 3400 Гц, существенно ограничена полоса частот метровых радиостанций). Для акустических систем, имеющих как правило 2-3 полосы, также необходимо разделение, которое осуществляется обычно в фильтрах кроссоверов уже на уровне усиленного (мощного) сигнала.

cifrovoe-i-analogovoe-audio-10.jpg
Рис. 10. Схема кроссовера для трехполосной акустической системы

  • коррекция по частотам (эквалайзинг): регулировка тембра, компенсация неравномерной отдачи из-за акустических свойств помещения, компенсация потерь в линиях передачи, студийная обработка с целью достижения нужной «окраски» звука, подавление паразитной акустической обратной связи («свиста») и т.д.

cifrovoe-i-analogovoe-audio-11.jpg
Рис. 11. Пример прибора-эквалайзера

  • подавление шумов: существуют специальные схемы динамического шумопонижения, которые анализируют сигнал и сужают полосу пропорционально уровню и частоте ВЧ-составляющих («денойзеры», «дехиссеры»). При этом шум, находящийся выше полосы сигнала, отрезается, а оставшийся более или менее маскируется самим сигналом. Подобные схемы всегда приводят к весьма заметной на слух деградации сигнала, но в отдельных случаях их применение уместно (например, при работе с записанной речью или в переговорных радиостанциях). Для аналоговой звукозаписывающей техники также используются шумоподавители на основе компрессоров/экспандеров («компандерные», например, системы Dolby B, dbx), работа которых на слух менее заметна.
  • воздействие на динамический диапазон: для того чтобы воспроизведение музыкальных программ на обычных бытовых системах, включая автомобильные магнитолы, было достаточно сочным и выразительным, динамический диапазон сжимают, делая звучание тихих звуков более громким. В противном случае, не считая отдельных всплесков фортиссимо (на классической музыке), придется слушать тишину из динамиков, особенно с учетом шумной окружающей обстановки. Для этой цели служат приборы, называемые компрессорами. В некоторых случаях, наоборот, требуется расширить динамический диапазон, тогда применяются экспандеры. А чтобы исключить превышение максимального уровня, которое приведет к клиппированию (ограничение сигнала сверху, сопровождаемое очень высокими нелинейными искажениями, воспринимаемыми как хрип), в студиях используются лимитеры. Они как правило обеспечивают «мягкое» ограничение, а не просто срезают верхушки сигнала;

cifrovoe-i-analogovoe-audio-12.jpg
Рис. 12. Пример студийного процессора динамической обработки звука

  • спецэффекты для студий, ЭМИ и пр.: в распоряжении звукорежиссеров и музыкантов имеется большое количество спец-техники для придания звучанию нужной окраски или получения определенного эффекта. Это различные дистортеры (звук электрогитары становится хриплым, зернистым), приставки вау-вау (модуляция по амплитуде, вызывающая характерный «квакающий» эффект), энхенсеры и эксайтеры (приборы, влияющие на окраску звука, в частности, могущие придавать звучанию «ламповый» оттенок); фленжеры, хорусы и т.д.

cifrovoe-i-analogovoe-audio-13.jpg
Рис. 13. Примеры процессоров и приставок для электрогитар

  • смешивание звуков, эхо/реверберация: запись на студиях обычно ведется в многоканальном виде, затем с помощью микшеров фонограмма сводится в нужное количество каналов (чаще всего 2 или 6). При этом звукорежиссер может «выдвинуть вперед» тот или иной солирующий инструмент, записанный на отдельной дорожке, изменить соотношение громкостей разных дорожек. Иногда на сигнал накладываются многократные копии меньшего уровня с определенным сдвигом по времени, тем самым имитируется естественная реверберация (эхо). В настоящее время подобные и прочие эффекты достигаются в основном с помощью сигнальных процессоров, обрабатывающих цифровой сигнал.

cifrovoe-i-analogovoe-audio-14.jpg
Рис. 14. Современный микшерный пульт

ЗАПИСЬ АНАЛОГОВОГО АУДИО

Считается, что механическая запись звука была впервые реализована Эдисоном в 1877 году, когда он изобрел фонограф – валик, покрытый слоем мягкой станиоли, на который иглой, передающей колебания воздуха, наносился след (впоследствии вместо станиоли использовался воск, а сам метод стали называть глубинной записью, поскольку дорожка модулировалась по глубине). Однако в том же году француз Шарль Кро подал заявку в Академию наук по поводу своего изобретения – звук записывался на плоском стеклянном диске, покрытым сажей, с помощью соединенной с мембраной иглы, получалась поперечная дорожка, затем диск предполагалось просвечивать и снимать с него фотокопии для тиражирования (сам способ еще предстояло разработать). В конце концов поперечная запись, которая оказалась намного совершеннее глубинной, дала начало грамзаписи. В мире появились три компании, серийно выпускавших пластинки (CBS в Америке, JVC в Японии, Odeon в Германии – эта компания подарила миру двустороннюю пластинку) и аппараты для их воспроизведения. От Дойче Граммофон (Германия) произошло название «граммофон», от Пате (Франция) – патефон. Затем начали производить портативные патефоны с раструбом на шарнире, с электрическим двигателем вместо ручного привода, позже – с электромагнитными адаптерами. Пластинки становились все совершеннее, вмещали больше материала по времени звучания, расширялся диапазон частот, первоначально ограниченный 4 кГц. На смену хрупкому шеллаку пришел винилит, а недолговечные стальные иглы уступили место сапфировым, затем и алмазным. Началась эпоха стерео: в одной канавке нарезались две дорожки под углом в 45°. К началу 80-х годов прошлого века, когда наметилась глобальный переход к цифровому формату звука, виниловая пластинка подошла в апогее своего развития.

cifrovoe-i-analogovoe-audio-15.jpg
Рис. 15. Граммофон, патефон, электропроигрыватель

Магнитная запись более совершенна и издавна применялась в студиях. Первый аппарат для магнитной записи – телеграфон – создал Вальдемар Паульсен (Дания) в 1878 году, причем запись велась на стальную проволоку (струну от фортепьяно). В 20-х годах 20 века появились магнитофоны, использовавшие магнитную ленту. Массовое производство магнитофонов началось в 40-х. Сначала появились магнитные ленты на целлюлозной, а затем на лавсановой основе. Запись аудиосигналов производится на продольные дорожки с помощью пишущей (или универсальной) головки с магнитным зазором. Лента протягивается вплотную к зазору головки, и на ней образуется дорожка остаточного намагничивания. Нелинейная часть характеристики «размывается» с помощью высокочастотного тока подмагничивания (обычно порядка 100 кГц), на который накладывается полезный сигнал. Студийные аналоговые магнитофоны наряду с цифровыми до сих пор применяются для первичной записи фонограмм. Бытовые бывают двух- и трехголовочными (отдельно записывающая, воспроизводящая и стирающая головки либо стирающая и универсальная). Иногда присутствуют две воспроизводящие головки, если предусмотрен реверс.

Даже при очень бережном отношении магнитная лента со временем начинает осыпаться

Магнитная лента обладает шумами, которые уменьшаются (частично выводятся за пределы слышимого диапазона) с ростом скорости протяжки. Поэтому студийные магнитофоны имеют скорость 38, в то время как бытовые катушечные – 19 и 9,5 см/с. Для бытовых кассетных магнитофонов была принята скорость 4,76 см/с. Шумы ленты эффективно подавляются с помощью компандерной системы Dolby B: при записи уровень высокочастотной части для слабых сигналов поднимается на 10 дБ, а при воспроизведении на столько же опускается.

Профессиональная аналоговая магнитная запись на высокой скорости обеспечивает очень высокое качество. Именно на магнитных мастер-лентах долгое время архивировались музыкальные записи, и с них фонограмма переносилась на виниловые пластинки с некоторой потерей качества. Однако даже при очень бережном отношении магнитная лента со временем начинает осыпаться, ей свойственно постепенное размагничивание, деформация, копир-эффект (соседние слои в рулоне взаимно намагничиваются), она подвержена влиянию внешних магнитных полей. Затруднен также быстрый поиск нужного фрагмента (хотя это неудобство относится скорее к бытовой сфере). Поэтому с появлением цифровых форматов компания Sony, владелец огромного архива записей CBS/Columbia, озаботившись проблемой сохранности бесценных оригиналов записей второй половины 20 века, разработала метод записи в формате дискретной широтно-импульсной модуляции (поток DSD – Direct Stream Digital, который в дальнейшем дал начало пользовательскому формату Super Audio CD). Если аналоговая магнитная запись обеспечивает сохранность фонограммы в несколько десятилетий при постепенно увеличивающихся потерях, то цифровые архивы вечны и выдерживают неограниченное количество копирований без какой-либо деградации. По этой, как и по многим другим причинам (сервисные преимущества, универсальность, огромные возможности обработки) все большее распространение нынче получают цифровые форматы аудио.

ПОЛУЧЕНИЕ ЦИФРОВОГО АУДИОСИГНАЛА

По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала

Цифровой сигнал получают из аналогового или синтезируют непосредственно в цифре (в электромузыкальных инструментах). Аналого-цифровое преобразование предполагает две основные операции: дискретизацию и квантование. Дискретизация – замена непрерывного сигнала на ряд отсчетов его мгновенных значений, взятых через равные промежутки времени. По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала. Затем отсчеты квантуются по уровню: каждому из них присваивается дискретное значение, ближайшее к реальному. Точность квантования определяется разрядностью двоичного представления. Чем выше разрядность, тем больше уровней квантования (2N, где N – число разрядов) и ниже шумы квантования – погрешности из-за округления до ближайшего дискретного уровня.

cifrovoe-i-analogovoe-audio-16.jpg
Рис. 16. Оцифровка аналогового сигнала и получение цифровых отсчетов

Формат CD предполагает частоту дискретизации 44,1 кГц и разрядность 16 бит. То есть получается 44 тысячи отсчетов в секунду, каждый из которых может принимать один из 216 = 65536 уровней (для каждого из стереоканалов).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD)

Помимо формата 44,1 кГц / 16 бит в цифровой записи применяются и другие. Студийная запись обычно производится с разрядностью 20-24 бит. Затем данные переводятся в стандартный CD-формат путем пересчета. Лишние биты затем отбрасываются либо (лучше) округляются, иногда подмешивается псевдослучайный шум для уменьшения шумов квантования (dither).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD). В DVD Audio принят алгоритм сжатия данных без потерь MLP, разработанный компанией Meridian. А SACD, в отличие от других форматов, использует не импульсно-кодовую модуляцию (ИКМ, или PCM), а однобитовое кодирование DSD-потока (дискретная широтно-импульсная модуляция). Диски SACD бывают однослойными и двухслойными (гибридными), с обычным CD-слоем.

Наиболее популярным аудио носителем на сегодня остается компакт-диск, несмотря на определенные ограничения по качеству звучания, отмечаемые аудиофилами. Причина их – в низкой частоте дискретизации: для точного восстановления сигналов, близких к верхней границе звукового диапазона, необходим фильтр, не реализуемый физически (его импульсная реакция захватывает область отрицательного времени). Это в определенной степени компенсируется с помощью цифровой фильтрации с повышением частоты дискретизации и разрядности. Для обеспечения бесперебойного воспроизведения в реальном времени данные на диске записываются с избыточным кодированием (код Рида-Соломона).

Цифровые носители, чатоты дискретизации и разрядности кодирования

Носитель Авторство Размеры Время звучания,
мин.
Кол. каналов Fs, кГц Разрядн., бит
CD-DA Sony,
Philips
120, 90 мм до 90 2 44,1 16
S-DAT кассета, лента 3,81 мм 2 32, 44,1, 48 16
R-DAT кассета, лента 3,81 мм 2, 4 44,1 12, 16
DASH лента 6,3, 12,7 мм 2…48 44,056,
44,1, 48
12, 16
DAT Alesis кассета
S-VHS
60 8 44,1, 48 16, 20
DСС Philips кассета 2, 4 32, 44,1,
48
16, 18
MiniDisk Sony 64 мм 74 2, 4 44,1 16
DVD
Audio
120 мм 5.1 192 24
SACD Sony,
Philips
120 мм 2, 5 2800 1

Для передачи цифрового звука нужна широкополосная линия связи, особенно для несжатого многоканального потока высокого разрешения.

ПЕРЕДАЧА ЦИФРОВОГО АУДИО

Линиями связи для передачи цифрового аудио могут служить кабели, оптические линии и радиоэфир.

Для передачи ИКМ-сигналов по проводным линиям разработаны интерфейсы AES/EBU (балансный, коаксиальный), S/PDIF (небалансный коаксиальный), обеспечивающие передачу нескольких сигналов (тактовую частоту, частоту следования цифровых слов, данные каналов) по одному проводу. Внутри аппаратов эти сигналы передаются по отдельности, на выходе транспортного механизма кодируются, а на входе цифро-аналогового преобразователя (в двухблочных системах) вновь разделяются в цифровом приемнике.

Как правило, для передачи цифрового аудио используется высококачественный коаксиальный кабель. Существуют также преобразователи S/PDIF для оптоволоконных линий: AT&T ST и Toslink (последний является стандартным для бытовой аппаратуры). А также – для использования витых пар в составе кабельных сетей Ethernet. Средой распространения сжатого аудио в виде архивированных файлов является и сеть Интернет.

cifrovoe-i-analogovoe-audio-17.jpg
Рис. 17. Оптический кабель с разъемом Toslink

Как любой цифровой сигнал, оцифрованное аудио распределяют и коммутируют с помощью специальных устройств – усилителей-распределителей, обычных и матричных коммутаторов.

Имеется фактор, отрицательно влияющий на цифровые сигналы и часто сводящий на нет практически все преимущества цифрового аудио перед аналоговым, в числе которых возможность многократного копирования, передачи и архивирования программ без потерь качества — речь идет о джиттере. Джиттер представляет собой дрожание фазы, или неопределенность момента перехода из 0 в 1 и наоборот. Происходит это из-за постепенной деформации прямоугольных импульсов с практически идеальными фронтами, которые становятся все более пологими из-за реактивных элементов кабелей, что и приводит к неопределенности момента перепада, хотя крутизна фронтов в каждом последующем цифровом устройстве полностью восстанавливается. С джиттером все современные цифровые устройства успешно борются с помощью блоков перетактирования (reclocking). Подробнее см. брошюру «Коммутация и управление сигналами».

cifrovoe-i-analogovoe-audio-18.jpg
Рис.18. Распределение и коммутация

Для передачи и записи на различные цифровые носители применяются сжатые форматы аудио: Dolby Digital (AC-3) и DTS. Это позволяет разместить на диске DVD Video емкостью 4,7 Гб полнометражный фильм с многоканальным звуковым сопровождением, а также разного рода дополнительные материалы. Формат Dolby Digital предлагает 5 независимых каналов: 2 фронтальных, 2 тыловых и 1 сабвуферный для спец-эффектов. Сжатие производится с помощью адаптивного алгоритма MPEG Audio, основанного на психоакустических особенностях восприятия звука и обеспечивающего минимальную заметность сжатия. Все это позволяет воссоздать полноценную трехмерную звуковую панораму. Однако для качественного воспроизведения музыки Dolby Digital подходит гораздо меньше, чем CD, обладая меньшим разрешением. Скорость потока в режиме Dolby Digital (отсчеты по каждому каналу передаются друг за другом) составляет 384-640 кбит/с, в то время как в обычном двухканальном формате CD – 1411,2 кбит/с. Формат Dolby Digital 5.1 неоднократно совершенствовался, в основном в направлении наращивания количества каналов. Сейчас доступен вариант DD 7.1, предполагающий 2 фронтальных, 2 боковых и 2 тыловых канала, не считая канала спецэффектов (известна также модификация DD 6.1 с одним тыловым каналом).

Формат DTS имеет меньшую степень сжатия и большую скорость потока данных – 1536 кбит/с. Поэтому он используется не только для кодирования многоканальных саундтреков на DVD Video, но для многоканальных аудиодисков. Формат DTS, помимо традиционного DTS 5.1, известен в модификациях DTS ES Discrete 6.1, а также нескольких матричных вариантах, в которых, как и в Dolby Pro Logic II, задействован принцип матрицирования дополнительных каналов, которые синтезируются на основе дополнительной информации, содержащейся в основных.

В компьютерной сфере и мультимедиа (на уровне пользователя) требуется компактность данных, поэтому здесь находят широкое применение сжатые форматы звука. Например, MP-3, Windows Media Audio, OGG Vorbis. Благодаря сжатию становится возможным быстро скачивать музыкальные файлы из сети Интернет, организовывать потоковый аудио сервис (WMA, Real Audio, Winamp).

ОБРАБОТКА ЦИФРОВОГО АУДИО

Обработка производится с помощью мощных DSP (сигнальных) процессоров, например Shark производства Analog Devices. Благодаря высокому быстродействию многие операции удается реализовать в реальном времени: например, изменение разрядности и тактовой частоты с интерполяцией, регулировка тембрального баланса, эквализация, подавление шумов, компрессия, экспандирование или ограничение динамического диапазона, спец-эффекты (эхо, разные типы звучания, например «стадион», «концертный зал» и пр.), микширование нескольких дорожек. Обычно сигнальные процессоры работают при высокой разрядности сигнала (например, 32 бита с плавающей децимальной точкой), что уменьшает набег ошибки в процессе сложных математических вычислений, которые производятся на основе быстрого преобразования Фурье, вычисления набора соответствующих коэффициентов и последующего перемножения.

Сигнальные процессоры по мере их распространения дешевеют, на сегодня их можно обнаружить любом ресивере или Surround-процессоре, где они выполняют самые разнообразные функции, включая декодирование форматов объемного звука, эквализацию и управление басом, калибровка каналов по амплитуде и фазе и т.д.

Сигнальные процессоры по мере их распространения дешевеют, на сегодня их можно обнаружить любом ресивере или Surround-процессоре

Но, как обычно, программные технологии обработки сигнала развиваются еще стремительнее, чем аппаратные. Все, что может сделать DSP-процессор, доступно с помощью специальных компьютерных приложений, причем в данном случае пользователь получает более широкий простор деятельности и гибкость самой программы, которая периодически обновляется и дополняется (хотя и программное обеспечение специализированных устройств в наше время чаще всего можно обновлять, скажем, через порт USB с компьютера или даже прямо из сети Интернет, с сайта производителя оборудования. Но такое обновление, конечно, возможно только в пределах одного поколения «железа», по мере устаревания которого приходится заменять модуль или весь аппарат). Компьютерных программ для глубокой обработки цифрового звука достаточно как для пользовательских, так и профессиональных целей (например, Adobe Audition). Основная часть студийной обработки производится на компьютере. Это очень удобно и эффективно, а, главное, позволяет не привязываться к реальному времени, делая доступными операции любой степени сложности без особых требований по быстродействию. Например, можно вручную вычистить фонограмму (скажем, снятую с реликтового винилового носителя) от щелчков или подвергнуть ее «интеллектуальной» обработке по избавлению от шумов, спектральный состав которых заранее определяется в паузах и на тихих фрагментах.

Сжатие цифрового аудио основано на психоакустических особенностях слуха и использует эффект маскировки более тихих звуков более громкими

Наконец, сжатие с целью уменьшения скорости потока данных или перенос на другую тактовую частоту с возможным изменением разрядности тоже производится как аппаратно, так и программно, на компьютере.

Существует несколько стандартных компьютерных форматов аудио, как без сжатия, так и с ним.

Наиболее распространенный несжатый формат – Microsoft Riff/Wave (расширение «.wav»). Данные кодируются 8 или 16 битами. Во втором (приемлемом для качественного аудио) случае и при частоте дискретизации 44,1 кГц одна минуты музыки занимает 5,3 МБ дискового пространства. Помимо самих данных, файл .wav содержит заголовок, описывающий общие параметры файла, и один или более фрагментов с дополнительной информацией о режимах и порядке воспроизведения, пометками, названиями и координатами различных участков сигнала.

В отличие от Riff/Wave, файлы RAW представляют собой данные, как они есть – без вспомогательной информации. Которая присутствует в стандартных для платформы Macintosh файлах Apple AIFF, схожих с WAV.

Сжатие цифрового аудио основано на психоакустических особенностях слуха и использует эффект маскировки более тихих звуков более громкими, при этом тихие просто отбрасываются, а «порог актуальности» маскируемых звуков определяется их удаленностью по частоте от маскирующих, а также другими параметрами.

Из форматов, предполагающих сжатие с потерями, самым популярным является MP3 (MPEG 1/2/2.5 Layer 3). Позволяет применять множество различных способов сжатия, стандартным является лишь способ кодирования уже сжатых данных. Возможен вариант с постоянным битрейтом, определяемым исходя из требуемых размеров файлов или уровня качества, или с переменным, когда битрейт меняется на разных фрагментах музыки, поддерживая уровень качества постоянным. В целом MP3 характеризуется весьма удовлетворительным звучанием на средних и высоких битрейтах, но на низких уступает другим форматам. Исключение составляет новая версия MP3 Pro, ориентированная именно на низкий битрейт и в связи с этим весьма затребованная в сетях Интернет.

WMA, или Windows Media Audio, успешно конкурируют с MP3 на низких битрейтах (например, музыка при 64 кбит/с в WMA субъективно звучит не хуже, чем в MP3 с битрейтом 128 кбит/с. Кроме этого, данный формат обеспечивает защитную кодировку от несанкционированного копирования.

Ogg Vorbis в целом схож с WMA и MP3, но отличается математическим аппаратом обработки и ориентирован на частоту дискретизации 48 кГц. К тому же может поддерживать не 2, а до 255 каналов звука. Битрейт до 512 кбит/с, при сжатии, на 20-5-% более эффективном, чем в MP3, музыка субъективно звучит лучше. Серьезный конкурент MP3 и WMA, хотя и в неравной борьбе с фирмами-гигантами.

AAC (Advanced Audio Coding) разработан на основе MP3 (и той же компанией – Институтом Фраунгофера), но отличается расширенными возможностями: поддерживает частоту дискретизации 96 кГц, до 48 каналов. Более высокое качество звука «оплачивается» относительно более медленной процедурой кодировки и повышенными требованиями к «железу» по быстродействию при воспроизведении. Одна из последних версий AAC под названием Liquid Audio, допускающая включение в поток данных не только «водяных знаков», как AAC, но и другой информации (об исполнителях, правообладании и пр.), в какой-то момент явилась серьезным претендентом на преемственность MP3.

Во многом похож на AAC японский формат VQF (SoundVQ), который скорее всего в скором времени исчезнет из поля зрения, хотя и поддерживается компанией Yamaha.

Цифровой звук можно записывать на различные носители. В основном оптические диски, хотя по логике вещей рано ли поздно на арене останется одна лишь флэш-память , для которой не требуется никаких приводов с моторчиками.

Магнитная цифровая запись на сегодня в основном остается в профессиональной сфере и все увереннее покидает бытовую

Тиражируют компакт-диски, как и прочие похожие носители (DVD, SACD), путем штамповки поликарбонатных заготовок с алюминиевых матриц, на которые наносятся питы – углубления. Кроме этого, при наличии обычного компьютера с пишущим CD (DVD) приводом музыкальные файлы различных форматов можно записывать на матрицы CD-R, CD-RW и т.д. Файлы также хранят на жестком диске компьютера или специального аудиосервера, в котором может быть создана обширная фонотека, причем степень сжатия файлов (от нуля) выбирается пользователем.

Магнитная цифровая запись на сегодня в основном остается в профессиональной сфере и все увереннее покидает бытовую. Оптический диск боле привлекателен для потребителя, чем кассета, даже притом, что она имеет небольшие размеры. Кроме этого, их массовой востребованности не способствовали сложные отношения с обладателями прав на музыкальный контент (как, впрочем, и в случае с DVD Audio и SACD). DAT-магнитофоны записывают цифровой звук без сжатия с высоким 3качеством. Существует несколько типов цифровых магнитофонов: со стационарными головками (S-DAT) и с вращающимися (R-DAT), записывающих сигнал на кассету; бобинный DASH, DAT, использующий кассеты S-VHS и поперечно-наклонную запись. Формат DCC (запись с сжатием в PASC) в настоящее время признан неперспективным. Магнитооптические диски MiniDisc используют запись с алгоритмом сжатия ATRAC.

ВОСПРОИЗВЕДЕНИЕ ЗВУКА

В конце любого аудиотракта присутствуют аналоговые электроакустические преобразователи – громкоговорители или наушники. Цифровые излучатели пока что находятся на стадии ранних идей. Усилители мощности также в основном аналоговые, хотя постепенно пробивают себе дорогу и цифровые (точнее, импульсные, работающие по принципу широтно-импульсной модуляции). Этот класс усилителей – D – обеспечивает небывало высокий по сравнению с аналоговыми КПД (порядка 90%), малые размеры и вес, отсутствие тепловыделения. Чтобы за усилителями класса D закрепилось прочное положение лидеров, необходимо, тем не менее, решить многие важные проблемы, и в первую очередь проблему фильтрации высокочастотных компонентов модулированного сигнала, уровень которых на выходе очень высок. Кроме этого, практически отсутствуют усилители класса D с цифровым входом: аналоговый сигнал подается на встроенный АЦП. Это, пожалуй, и есть основной фактор, тормозящий развитие данного направления: ведь основная ценность самой идеи не в высоком КПД, а в возможности организовать полностью цифровой аудиотракт без лишних преобразований и аналоговых линий передач. Тем более цифровой выход на проигрывателях DVD не редкость. В последнее время в данной области стали появляться новые разработки. Компания Tripath выпустила специальный процессор, управляющий параметрами импульсного усиления на основании анализа входного сигнала, который (в цифровой форме) на некоторое время задерживается в буфере. В частности, в зависимости от текущего спектра сигнала подбирается оптимальная с точки зрения последующей фильтрации тактовая частота. Такие усилители (их называют «интеллектуальными») дали начало новой категории – усилители класса T. Подробнее см. брошюру «Усиление сигналов».

На смену традиционным стерео- и моно- усилителям все чаще приходят многоканальные, чаще всего строенные в AV-ресиверы, где имеется также все необходимое для глубокой обработки многоканальных сигналов, декодирования и преобразования из одного формата в другой. Многоканальный звук становится все популярнее, причем не только в качестве сопровождения к кино, но и сам по себе.

Как охлаждать будем? Жидкость или воздух: «за» и «против» Как охлаждать будем? Жидкость или воздух: «за» и «против»
Системы охлаждения для видеостен на основе проекционных кубов.
Отображать 4К контент или быть 4К устройством? Есть разница! Отображать 4К контент или быть 4К устройством? Есть разница!
В данной статье будут рассмотрены особенности разрешения в формате 4К, на которые следует обратить внимание.
Передача аудио- и видеосигналов по IP: что это дает proAV? Передача аудио- и видеосигналов по IP: что это дает proAV?
Часто мы слышим фразу "передача аудио- и видеосигнала по IP-сетям". Но каково ее истинное значение для коммерческих AV-с...
Визуальные технологии: типы сигналов и методы их сжатия Визуальные технологии: типы сигналов и методы их сжатия
В этой публикации речь пойдет о разных типах видеосигналов, а также о цифровых сигналах и методиках сжатия.
Многофункциональные помещения: как спроектировать грамотно? Многофункциональные помещения: как спроектировать грамотно?
Могут ли многофункциональные помещения в сегодняшних условиях корпоративной среды обеспечить свое многоцелевое назначение?
Как заставить зал «зазвучать»: азы акустической подготовки Как заставить зал «зазвучать»: азы акустической подготовки
Акустическая подготовка помещения – процесс, требующий от специалиста хорошего знания техники и чуткого музыкального слуха.
Все статьи
Видео
Вебинар "Все об аудио оснащении переговорных комнат"
Вебинар " Возможности аудио-видео коммутации LightWare"
Все видео
BOSCH: Каталог конференц-систем 2016/ноябрь
BOSCH: Каталог конференц-систем 2016/ноябрь
Каталог конференц-систем и оборудования для синхронного перевода, формат А4, 50 полос.
ECLER: каталог оборудования 2016
ECLER: каталог оборудования 2016
Полная продуктовая линейка аудиооборудования Ecler, 196 полос, А4, английский язык.
Все файлы
Акустика в залах совещаний: идеальный звук – совсем не сложно
Стюарт Стивенс
“Проектный менеджер компании Shure Distribution UK, Стюарт Стивенс - о различных методах улучшения акустики в залах для совещаний.”
Стюарт Стивенс
Проектный менеджер Shure Distribution UK
Распределенные звуковые системы. Не так просто, как кажется
Аджигитов Максим
“Задача этой статьи - развенчать миф о том, что проектирование системы фонового звука не стоит серьезных временных и умственных затрат.”
Аджигитов Максим
Ведущий инженер по акустике ГК DIGIS
Звуко-инженеры. Почему трудно работать вместе?
Ратмановас Александрас
“В чем состоят сложности, связанные со звуком, если как физическое явление он был объяснен еще 68 лет назад? Разбираемся вместе.”
Ратмановас Александрас
Инженер по звуку
Все мнения
http://www.avclub.pro/news/proizvoditel/novyy-shirokougolnyy-obektiv-dlya-vivitek-du9000/