Главная › Настройки › Какие есть способы сжатия звуковых файлов. Сжатие с потерями. Надо ли использовать нормализацию

Какие есть способы сжатия звуковых файлов. Сжатие с потерями. Надо ли использовать нормализацию

Цель работы : Изучить принцип действия гальванометра, определить его технические характеристики, изучить принцип его работы в режиме измерителя силы тока – амперметра и измерителя напряжения – вольтметра.

Приборы и принадлежности : лабораторная установка с гальванометром, вольтамперметрами (2 шт.), магазинами сопротивлений Р-33 (2 шт.), провода соединительные.

Краткие теоретические сведения

Гальванометрами называют электроизмерительные приборы, предназначенные для измерения малых величин тока, напряжения или количества электричества. В лабораторной практике применяются гальванометры постоянного и переменного тока различных систем с разнообразными электрическими и механическими параметрами. Наиболее распространены гальванометры постоянного тока магнитоэлектрической измерительной системы (стрелочные, со световым указателем, зеркальные), обладающие рядом преимуществ, главное из которых – высокая чувствительность. В приборах этой системы перемещение подвижной части прибора и связанного с ней указателя происходит в результате взаимодействия магнитного поля постоянного магнита и магнитного поля постоянного магнита и проводника с током. Наиболее распространены магнитоэлектрические гальванометры с подвижной частью в виде рамки, состоящей из витков тонкой медной или алюминиевой проволоки и установленной в кольцевом зазоре постоянного магнита. Измерительная система такого типа схематически изображена на рис. 12.1. В воздушном зазоре между полюсами постоянного магнита 1 и неподвижного цилиндрического сердечника 2 создается радиальное магнитное поле. Подвижная рамка 3, укрепленная на растяжках 4 , может поворачиваться вокруг сердечника 2 в поле магнита. К рамке 3 прикреплена указательная стрелка 5, которая сбалансирована противовесами 7. Электрический ток к обмотке рамки подводится по растяжкам 4. При протекании по обмотке рамки постоянного электрического тока на стороны, находящиеся в радиальном магнитном поле, действуют силы, направленные под прямым углом к вектору индукции в зазоре и образующие вращательный момент М = BSnI . Здесь В  величина индукции в зазоре, S  площадь рамки, n  число витков, I  сила тока в обмотке.

Рис. 12.1

Под действием этого момента рамка и связанный с нею указатель поворачивается на угол , который определяется равенством момента сил, действующих на рамку со стороны магнитного поля и противодействующего момента упругих сил М пр, возникающих в растяжках при их закручивании. В положении равновесия

M = M пр, BSnI = k , (12.1)

где k – коэффициент упругости растяжек. Успокоение колебаний подвижной части происходит благодаря токам, индуцируемым в каркасе рамки и в ее обмотке, если последняя замкнута на какое-либо внешнее сопротивление. В положении равновесия угол отклонения стрелки прибора равен

, (12.2)

Таким образом, угловое отклонение указателя прибора пропорционально току, протекающему в его рамке. Коэффициент пропорциональности S I называется чувствительностью гальванометра по току

, (12.3)

а обратная величина S I называется постоянной по току C I .

или
. (12.4)

Так как угол  часто определяется числом делений шкалы прибора N , то С I , можно назвать ценой деления и измерять в А/дел. При токе I в рамке измерительного механизма на зажимах создается напряжение

где R Г  внутреннее сопротивление гальванометра. Следовательно, по углу поворота подвижной части можно определить напряжение на зажимах гальванометра, т. е. он может быть использован для измерения напряжений. Постоянная по напряжению С U , равна постоянной по току, умноженной на сопротивление рамки гальванометра:

или
(12.6)

C U измеряется в В/дел.

Гальванометры с малым внутренним сопротивлением, предназначенные для измерения тока, называются амперметрами. Амперметры должны обладать малым внутренним сопротивлением, чтобы при их включении общее сопротивление цепи почти не изменялось и не изменялся ток в цепи.

Максимальное значение тока, который можно пропускать по обмотке рамки, как правило, невелико. Для расширения диапазона измерений прибора используют шунты – резисторы, включаемые параллельно. При шунтировании только часть подлежащего измерению тока ответвляется в прибор и непосредственно измеряется.

Благодаря высокой чувствительности гальванометра ток его очень мал, и для ответвления малого тока требуется шунт малого по сравнению с R Г сопротивления. Таким образом, гальванометр с шунтом (амперметр) в целом будет обладать малым сопротивлением. Пусть необходимо измерить ток I 0 , в n раз больший, чем максимально допустимый ток измерительного прибора. Для расчета сопротивления шунта R Ш применим законы Кирхгофа к контуру, изображенному на рис. 12.2:

,
. (12.7)

Используя условие I 0 = nI , находим

. (12.8)

Таким образом, зная внутреннее сопротивление гальванометра R Г, можно рассчитать необходимое сопротивление шунта. Длина шунта, изготовляемого из провода, рассчитывается по формуле

, (12.9)

где S П и   площадь поперечного сечения и удельное сопротивление провода, соответственно.

Рис.12.2 Рис.12.3

Гальванометры, предназначенные для измерения разности потенциалов, называются вольтметрами. Сопротивление вольтметра должно быть много больше сопротивления участка цепи, на котором измеряется падение напряжения, чтобы включение вольтметра не вызывало его изменения. Если внутреннее сопротивление гальванометра недостаточно, то последовательно с прибором включается добавочный резистор R Д (рис. 12.3). Включение добавочного резистора R Д производится в тех случаях, когда необходимо расширить пределы измерения прибора. Величина R Д рассчитывается из условия, что ток в цепи прибора не должен превышать максимально допустимого значения I max . Применяя закон Ома для участка цепи, находим

, (12.10)

. (12.11)

Необходимо найти величину добавочного резистора, если мы хотим в n раз увеличить пределы измерения прибора, т.е.

, (12.12)

Где U – максимальное напряжение, измеряемое прибором без дополнительного резистора. Тогда из (12.11) и (12.12) следует, что

Таким образом,

, (12.13)

т.е. для расширения предела измерения по напряжению в n раз сопротивление добавочного резистора должно быть в (n 1) раз больше сопротивления гальванометра.

Итак, для расчета сопротивления шунтов R Ш и сопротивления добавочных резисторов R Д нужно знать внутреннее сопротивление гальванометра. Обычными способами измерить его трудно в силу того, что через гальванометр можно пропускать только очень малый ток. Поэтому приходится прибегать к иному способу. Внутреннее сопротивление гальванометра, его чувствительность по току и по напряжению могут быть, в частности, определены с помощью схемы, представленной на рис. 12.4.

Рис.12.4

Здесь G – исследуемый гальванометр. Напряжение с потенциометра R подается на делитель напряжения, образованный резисторами R 2 и R 3 .

Ток на участке АД , согласно закону Ома, равен

, (12.14)

где U – напряжение, снимаемое с потенциометра R и измеряемое вольтметром, а

R АД = R АВ + R 3 . (12.15)

Подставляя выражение (12.15) в формулу (12.14), получим

. (12.16)

Падение напряжения на участке АВ равно

По первому закону Кирхгофа

. (12.18)

Решая совместно уравнения (12.16), (12.17) и (12.18) относительно I (ток в цепи гальванометра), получим

, (12.19)

где N – число делений, на которое отклоняется стрелка гальванометра при токе I .

При R 1 = 0 с помощью переменных резисторов R 2 и R 3 можно установить стрелку гальванометра на крайнее правое оцифрованное деление. Пусть этому положению соответствует число делений шкалы N 1 и ток через гальванометр I 1:

. (12.20)

Легко найти

Из формулы (12.19)

UR 2 = C I N (R AB +R 3)(R 1 + R 2 + R Г). (12.21)

а из выражения (12.20)

UR 2 = C I N 1 (R 1 АВ + R 3)(R 2 + R Г). (12.22)

Приравнивая правые части (12.21) и (12.22) друг другу и подставляя R AB и R 1 АВ , получим

(12.23)

Цена деления по току определяется из уравнения (12.20):

(12.24)

Цена деления по напряжению

(12.25)

Отклонение магнитной стрелки под действием тока, протекающего в проводнике было впервые описано Гансом Эрстедом в 1820 году. Это явление рассматривалось, как один из способов измерения электрического тока. Самое раннее упоминание о гальванометре сделал Иоганн Швейгер в университете Галле 16 сентября 1820 года. Термин гальванометр впервые появился в 1836 году по фамилии ученого Луиджи Гальвани.

Первоначально в инструментах использовалась сила магнитного поля Земли и они назывались тангенциальными гальванометрами. Перед работой их необходимо было ориентировать в пространстве. Позже был разработан астатический гальванометр, в котором использовались противоположно направленные магниты для того, чтобы исключить влияние магнитного поля Земли. Наиболее чувствительный гальванометр - гальванометр Томсона или зеркальный гальванометр был изобретен Уильямом Томсоном (Лордом Кельвином) и запатентован им в 1858 году. Вместо магнитной стрелки он использовал легкое маленькое зеркало с магнитной пылью, подвешенное на нити. Под действием даже небольших токов зеркало отклоняло луч света, играющего роль стрелки.

Ранние гальванометры с подвижным магнитом имели существенный недостаток: любые магниты или железные предметы воздействовали на гальванометр и отклонение стрелки не было прямо пропорционально протекающему току. В 1882 году Жак-Арсен д"Арсонваль и Марсель Депре разработали гальванометр с неподвижным магнитом и движущейся проволочной катушкой, подвешенной на тонких проводах. В железной трубке внутри катушки сосредотачивалось магнитное поле. К катушке прикреплялось легкое зеркало, которое отклоняло луч света под действием тока в катушке. Получившийся гальванометр был очень чувствителен и позволял обнаружить ток силой 10 микроампер.

Эдвард Уэстон усовершенствовал эту конструкцию. Он заменил тонкие провода на спиральные пружины, как в балансом колесе наручных часов. Он разработал метод стабилизации магнитного поля постоянного магнита, так что точность инструмента не уменьшалась с течением времени. Уэстон заменил зеркало на стрелку и использовал плоское зеркало под стрелкой для исключения параллакса при наблюдениях.

В 1888 году Уэстон запатентовал свое устройство, который стал стандартным прибором в электрооборудовании. Такая конструкция и сегодня используется в гальванометрах с подвижной катушкой Долгое время стрелочные гальванометры оставались наиболее массовой разновидностью электроизмерительных приборов.

Принцип действия

Чаще всего гальванометр используют в качестве аналогового измерительного прибора. Он используется для измерения постоянного тока, протекающего в цепи. Гальванометры конструкции д"Арсонваля/Уэстона используемые на сегодняшний день сделаны с небольшой поворачивающейся катушкой, находящейся в поле постоянного магнита. К катушке прикреплена стрелка. Маленькая пружина возвращает катушку со стрелкой в нулевое положение.

Когда постоянный ток проходит сквозь катушку, в ней возникает магнитное поле. Оно взаимодействует с полем постоянного магнита, и катушка, вместе со стрелкой, поворачивается, указывая на протекающий через катушку электрический ток.

Основная чувствительность гальванометра может быть, например, 100 мкА (при падении напряжения, скажем, 50 мв, при полном токе). Используя шунты можно измерять большие токи.

Так как стрелка прибора находится на небольшом расстоянии от шкалы, может возникнуть параллакс. Чтобы его избежать, под стрелкой располагают зеркало. Совмещая стрелку со своим отражением в зеркале, можно избежать параллакса.

Разновидности и устройство

Магнитоэлектрический

Представляет собой проводящую рамку (обычно намотана тонким проводом), закреплённую на оси в магнитном поле постоянного магнита. При отсутствии тока в рамке она удерживается пружиной в некотором нулевом положении. Если же по рамке протекает ток, то рамка отклоняется на угол, пропорциональный силе тока, зависящий от жёсткости пружины и индукции магнитного поля. Стрелка, закреплённая на рамке, показывает значение тока в тех единицах, в которых отградуирована шкала гальванометра.

От прочих конструкций магнитоэлектрическая система отличается наибольшей линейностью градуировки шкалы прибора (в единицах силы тока или напряжения) и наибольшей чувствительностью (минимальным значением тока полного отклонения стрелки).

Электромагнитный

Исторически самая первая конструкция гальванометра. Содержит неподвижную катушку с током и подвижный магнит (в приборах постоянного тока) или сердечник из магнитомягкого материала (для приборов, измеряющих и постоянный, и переменный ток), втягиваемый в катушку или поворачивающийся относительно неё.

Данная конструкция отличается большей простотой, отсутствием необходимости делать катушку возможно меньшего размера и веса (что требуется для магнитоэлектрической системы), отсутствием проблемы подведения тока к подвижной катушке. Однако такие приборы отличаются существенной нелинейностью шкалы (из-за неравномерностей магнитного поля сердечника и краевых эффектов катушки) и соответствующей сложностью градуировки. Тем не менее, применение данной конструкции приборов в качестве амперметров переменного тока относительно большой величины оправдано большей простотой конструкции и отсутствием дополнительных выпрямительных элементов и шунтов. Вольтметры же переменного и постоянного тока электромагнитной системы наиболее удобны для контроля узкого диапазона значений напряжения, так как начальный участок шкалы прибора сильно сжат, а контролируемый участок может быть растянут.

Тангенциальный

Тангенциальный гальванометр созданный компанией Баннела около 1890.

Тангенциальный гальванометр - один из первых гальванометров, использовавшихся для измерения электрического тока. Он работает с помощью компаса, который используется для сравнения магнитного поля создаваемого неизвестным током с магнитным полем Земли. Свое название он получил от тангенциального закона магнетизма, в котором говорится, что тангенс угла наклона магнитной стрелки пропорционален соотношению сил двух перпендикулярных магнитных полей. Впервые это было описано Клодом Пулье в 1837 году.

Тангенциальный гальванометр состоит из катушки, сделанной из изолированной медной проволоки, намотанной на немагнитную рамку, расположенную вертикально. Рамка может поворачиваться вокруг вертикальной оси, проходящей через ее центр. Компас расположен горизонтально, в центре круговой шкалы. Круговая шкала разделена на четыре квадранта, каждый из которых проградуирован от 0° до 90°. К магнитной стрелке компаса прикреплен длинный алюминиевый указатель. Чтобы избежать ошибок из-за параллакса под стрелкой устанавливают плоское зеркало.

В процессе работы гальванометр устанавливают так чтобы стрелка компаса совпала с плоскостью катушки. Затем к катушке подводят измеряемый ток, который создает магнитное поле на оси катушки, перпендикулярное магнитному полю Земли. Стрелка реагирует на векторную сумму двух полей и отклоняется на угол равный тангенсу отношения этих полей.

Теория

Гальванометр ориентирован так, что плоскость катушки параллельна магнитному меридиану, т.е горизонтальной составляющей магнитного поля Земли. Когда ток проходит через катушку в ней создается магнитное поле, перпендикулярное первому, силой:

где I - ток в амперах, n - число витков катушки и r - радиус катушки. Эти два перпендикулярных поля векторно складываются и стрелка компаса отклоняется на угол:

Из тангенциального закона, , т.е.

или , где K - понижающий коэффициент тангенциального гальванометра.

Одна из проблем тангенциального гальванометра - сложности при измерении очень больших и очень малых токов.

Измерение геомагнитного поля Земли

Тангенциальный гальванометр также можно использовать для измерения горизонтальной составляющей магнитного поля . Для этого низкое напряжение питания, подключают последовательно с реостатом , гальванометром и амперметром. Гальванометр располагают так, чтобы магнитная стрелка была параллельна катушке, при отсутствии в ней тока. Затем на катушку подается напряжение, которое регулируют реостатом до такой величины, чтобы стрелка отклонилась на угол 45 градусов и величина магнитного поля на оси катушки становится равной горизонтальной составляющей геомагнитного поля. Это поле можно рассчитать через ток, измеренный амперметром, число витков катушки и ее радиус.

Электродинамический

В качестве и подвижного, и неподвижного элемента используются катушки с током.

Вибрационный

Вибрационные гальванометры являются разновидностью зеркальных гальванометров. Собственная частота колебаний движущихся частей настроена на строго определенную частоту, обычно 50 или 60 Гц. Возможны более высокие частоты до 1 кГц. Поскольку частота зависит от массы подвижных элементов, высокочастотные гальванометры имеют очень малые размеры. Настройка вибрационного гальванометра осуществляется изменением силы натяжения пружины. Вибрационные гальванометры переменного тока предназначены для определения малых значений силы тока или его напряжения. Подвижная часть подобных приборов имеет достаточно низкий момент инерции . Их наиболее распространенное применение в качестве нуль-индикаторов в мостовых схемах переменного тока и компараторах.Резкий резонанс колебаний в вибрационном гальванометре, делает его очень чувствительным к изменениям частоты измеряемого тока и может быть использован для точной настройки приборов

Тепловой

Содержат проводник с током, удлиняющийся при нагреве, и рычажную систему, преобразующую это удлинение в движение стрелки.

Апериодический

Апериодическим называют гальванометр, стрелка которого после каждого отклонения становится тотчас в положение равновесия, без предварительных колебаний, как это бывает в простом гальванометре .

Прочие элементы и особенности конструкции

Балансирующие элементы. При отсутствии таковых гальванометр рассчитан на работу или только в горизонтальном положении шкалы, или только в вертикальном.
Арретир - элементы конструкции прибора, обеспечивающие фиксацию механизма в транспортном, нерабочем положении.
Успокоитель - воздушный (в виде лепестка, перемещающегося внутри специального профиля) или электромагнитный (короткозамкнутый виток). Служит для сведения к минимуму времени измерения. Может отсутствовать в баллистическом гальванометре.
Пружины, как правило, являются проводниками, по которым ток подаётся к рамке магнитоэлектрического или к подвижной рамке электродинамического прибора. В некоторых конструкциях осью и одновременно крутильным пружинами являются проводники, на которых растягивается рамка.
Крепление одной из пружин изготавливается поворотным и служит для установки стрелки в нулевое положение шкалы при отсутствии тока.
Как и в иных стрелочных измерительных приборах, шкала, помимо градуировки, может для повышения точности считывания показаний прибора иметь зеркало, в котором отражается часть стрелки прибора. Это зеркало облегчает правильное позиционирование глаза наблюдателя, при котором луч зрения перпендикулярен плоскости шкалы.

Современный зеркальный гальванометр от фирмы Scanlab

Зеркальный гальванометр

Большой точности измерений, а также наибольшей скорости реакции стрелки можно достигнуть, используя зеркальный гальванометр, в котором в качестве указателя используется небольшое зеркальце. Отражённый от него луч света играет роль стрелки. Зеркальный гальванометр был изобретен в 1826 году Иоганном Христианом Поггендорфом. Зеркальные гальванометры широко использовались в науке, до того как были изобретены более надежные и стабильные электронные усилители. Наибольшее распространение они получили в качестве записывающих устройств в сейсмометрах и подводных коммуникационных кабелях. В настоящее время высокоскоростные зеркальные гальванометры используют в лазерных шоу, для того чтобы перемещать лазерные лучи и создавать красочные фигуры в дыму вокруг аудитории. Некоторые виды таких гальванометров применяют для лазерной маркировки разнообразных вещей: от ручных инструментов до полупроводниковых кристаллов.

Применение

Измерительные приборы

Гальванометр является базовым блоком для построения других измерительных приборов. На основе гальванометра можно построить амперметр и вольтметр постоянного тока с произвольным пределом измерения:

Для получения амперметра необходимо подключить шунтирующий резистор параллельно гальванометру.
Для получения вольтметра необходимо подключить гасящий резистор (добавочное сопротивление) последовательно с гальванометром.

Если к гальванометру не подключено никаких дополнительных резисторов, то его можно считать как амперметром, так и вольтметром (в зависимости от того, как гальванометр включен в цепь и как интерпретируются показания).

Экспонометр, термометр

В сочетании с датчиком света (фотодиодом) или температуры (термоэлементом), гальванометр может быть использован в качестве, соответственно, экспонометра в фотографии, измерителя разности температур и т. п.

Баллистический гальванометр

Для измерения заряда , протекающего через гальванометр в виде короткого одиночного импульса, используется баллистический гальванометр , в котором наблюдают не отклонение рамки, а её максимальный отброс после прохождения импульса.

Нуль-индикатор

Гальванометр используется также в качестве указателя (нуль-индикатора) отсутствия тока (напряжения) в электрических цепях. Для этого он обычно исполняется с нулевым положением стрелки посередине шкалы.

Механическая запись электрических сигналов

Гальванометры используется для позиционирования писчиков в осциллографах , например в аналоговых электрокардиографах. Они могут иметь частотный отклик в 100 Гц и отклонение писчиков в несколько сантиметров. В некоторых случаях (у энцефалографа) гальванометры настолько сильны, что двигают писчики, находящиеся в непосредственном контакте с бумагой. Их пишущий механизм может быть основан на жидких чернилах или на подогреве писчиков, двигающихся по термобумаге. В других случаях гальванометры не обязаны быть столь сильными: контакт с бумагой происходит периодически, поэтому требуется меньше усилий на перемещение писчиков.

Оптическая развёртка

Системы зеркальных гальванометров используются для позиционирования в лазерных оптических системах. Обычно это механизмы высокой мощности с частотным откликом свыше 1 кГц.

Современное состояние

В современных условиях аналого-цифровые преобразователи и приборы с цифровой обработкой сигналов и числовой индикацией величин заменяют гальванометры в качестве измерительных приборов, особенно в составе универсальных (Авометров) и в механически сложных условиях работы.

Получение, хранение и обработка данных в компьютерных системах по гибкости значительно превышает все способы фиксации электрических сигналов самописцами на бумаге.

Сегодня количество потребляемой нами информации в сети выросло в тысячи раз в сравнении с началом 2000-х. И неудивительно, ведь раньше, помимо намного менее распространенного интернет-покрытия, привычные нам сайты и сервисы выглядели совсем по другому.

Мы ежедневно читаем статьи и новости о том, что та или иная компания разработала новый стандарт соединения, превосходящий нынешние аналоги по скорости передачи данных. За уже практически два десятилетия провайдеры и производители многих гаджетов сделали огромный шаг в направлении к скоростному доступу в Интернет. Но не одними лишь скоростями наш мгновенный доступ к сайтам един.

Огромную роль в экономии нашего времени сыграло развитие алгоритмов сжатия изображений, аудио и видеофайлов. Гуляя по просторам сети, зачастую мы даже не задумываемся над тем, как и что устроено, сколько сил было приложено к разработке той или иной технологии. В новой серии статей мы рассмотрим методы сжатия таких популярных форматов, как MP3 и JPEG, а также базово рассмотрим процесс кодирования видео.

Работа алгоритма

Первым в новой серии статей станет самый популярный формат сжатия аудио–файлов *.mp3. Появился он в 1993 году, благодаря рабочей группе института Фраунгофера, а стандартизирован объединением MPEG. По данным Википедии, объединение было образовано международной организацией ISO для разработки норм в сжатии аудио и видеофайлов. Ими были установлены также следующие стандарты:

MPEG–1 : Предназначался для сжатия видео и аудио–файлов, позже стал устоявшимся стандартом для VCD (Video CD).
MPEG–2 : Уже ориентировался на передачу сигнала широковещательного телевидения семейств ATSC, ISDB и DVB и в прочих спутниковых ТВ-вещаниях. Таких как например Dish Network.
MPEG–3 : Стандарт разработанный для вещания HDTV, но был не принят по причине того, что MPEG–2, с небольшими доработками вполне хватало для таких целей. И нет, это не тот самый mp3, о котором вы сейчас могли подумать. На самом деле, mp3 является ответвлением стандарта MPEG–1, 3 уровня.
MPEG–4 : Является во многом усовершенствованным MPEG–1, с поддержкой декодирования 3D–контента и сжатия с низким битрейтом. В него также была интегрирована система программной защиты авторских прав - DRM. Из новых введенных в стандарт видео-форматов, можно отметить ASP и H.264.

Все таки давайте вернемся обратно к mp3. Основной задачей формата было и является уменьшение размера файлов за счет удаления определенных участков звукового спектра, которые не ощущаются на непрофессиональной аудиотехнике, в соответствии с психоакустической моделью звуковосприятия человека.

На этом этапе при помощи алгоритма преобразования Фурье, звуковая волна раскладывается на спектры разной частоты. Все те малоразличимые нашим слухом частоты просто удаляются. В основном это весь спектр звука выше 16 000 Гц. По такому принципу, кстати, работают и сервисы определения музыки, типа SoundHound и Shazam. Встроенный в их работу алгоритм разделяет слышимую звуковую волну на несколько, выделяет ритмику, основные ноты и сравнивает их со своей базой данных.

Но тем не менее, общая картина звучания, например, mp3-файла в битрейте 320 кбит/с мало чем отличается от несжатого файла, при этом в размере может составлять 1/10 от оригинального.

Уже на этом этапе размер файла можно значительно уменьшить, но самый больший процент сжатия происходит на следующих этапах маскировки. Работа первого из них заключается в удалении кратных звуковых частот на громких моментах в песне, то есть если звучит громкий барабан, то все остальные сигналы исходящие от включенных в аранжировку инструментов, можно просто–напросто убрать, и никто этого не заметит.

А в некоторых случаях, в соответствии с той же психоакустической моделью, можно удалять доли перед, и после звучания громких звуков, так как в этот период у всех людей наступает кратковременная (буквально на несколько сотых секунды) глухота.

Потом идет распределение звуков по каналам. Это происходит не без потерь в детализации, с помощью специальных формул, которые вы можете посмотреть на картинке (упрощено). Разница в звучании каждого из каналов сводится почти к нулю с целью сэкономить еще одну сотню-другую байт.

В конце каждый из сжатых фреймов аудиозаписи закодированные одинаковыми символами (например нулями), сокращаются до минимальных размеров при помощи метода кода Хаффмана. В процессе его работы дополнительная информация не теряется, просто к каждому из значений фреймов присваивается какой-то код, в зависимости от того, сколько раз то или иное число в нем встречается. Далее все оставшиеся куски нашей аудиозаписи склеиваются и на выходе образуют привычный нам аудио–файл.

Спасибо, что дочитали до конца теперь мы разобрались с тем, как устроен один из самых распространенных аудиоформатов. B следующей статье мы рассмотрим процесс сжатия видео.

Лекции 15 – 16. Сжатие звуковой информации План лекции 1. Общие сведения. 2. Структура кодера с компрессией цифровых аудиоданных. 3. Психоакустические модели (ПАМ). 4. Базовые системы кодирования.

1. Методы сжатия звука основаны на устранении его избыточности. Различают статистическую и психоакустическую избыточность натуральных звуковых сигналов. Сокращение статистической избыточности базируется на учете свойств самих звуковых сигналов, а психоакустической – на учете свойств слухового восприятия. 2

Статистическая избыточность обусловлена наличием корреляционной связи между соседними отсчетами временной функции звукового сигнала (ЗС) при его дискретизации. Для ее уменьшения применяют достаточно обработки. При информации нет, их сложные алгоритмы использовании однако исходный потери сигнал оказывается представленным в более компактной 3

форме, что требует меньшего количества бит при его кодировании. Однако даже при использовании достаточно сложных процедур обработки устранение статистической избыточности звуковых сигналов позволяет увеличить требуемую пропускную способность канала связи лишь на 15… 25% по сравнению с ее исходной величиной, что нельзя считать революционным достижением. 4

После устранения статистической избыточности скорость цифрового потока при передаче высококачественных ЗС и возможности человека по их обработке отличаются, по крайней мере, на несколько порядков. 5

Это свидетельствует также о существенной психоакустической избыточности первичных цифровых ЗС и, следовательно, о возможности ее уменьшения. Наиболее перспективными с этой точки зрения оказались методы, учитывающие такие свойства слуха, как маскировка. Если известно, какие части звукового сигнала ухо воспринимает, а какие нет вследствие маскировки, то можно 6

выделить и затем передать по каналу связи лишь те части сигнала, которые ухо способно воспринять, а неслышимые – можно просто отбросить. Кроме того, сигналы можно квантовать с возможно меньшим разрешением по уровню так, чтобы искажения квантования, изменяясь по величине с изменением уровня самого сигнала, еще оставались 7

бы неслышимыми - маскировались бы исходным сигналом. Однако после устранения психоакустической избыточности точное восстановление формы временной функции ЗС при декодировании оказывается уже невозможным. 8

Две важные для практики особенности: Если компрессия цифровых аудиосигналов уже использовалась в канале связи, то ее повторное применение ведет к появлению существенных искажений, т. е. важно знать «историю» цифрового сигнала и какие методы кодирования уже использовались. 9

Традиционные методы оценки качества (например, на тональных сигналах) для кодеков с компрессией аудиоданных не пригодны, тестирование проводится на цифровых поскольку реальных звуковых сигналах. 10

Работы по анализу качества и оценке эффективности цифровых алгоритмов аудиоданных с компрессии целью их последующей стандартизации начались в 1988 году, когда была образована международная экспертная группа MPEG (Moving Pictures Experts Group). 11

Итогом работы этой группы на первом этапе явилось принятие в ноябре 1992 года международного, стандарта MPEG-1 ISO/IEC 11172 -3 (цифра 3 после номера стандарта относится к кодированию звуковых сигналов). 12

К настоящему времени достаточное распространение получили еще нескольких стандартов MPEG, таких, как MPEG-2 ISO/IEC 13818 -3, 13818 -7 и MPEG-4 ISO/IEC 14496 -3. В отличие от этого в США, в качестве альтернативны стандартам MPEG, был разработан стандарт Dolby AC-3. 13

Несколько позже четко сформировались две разные платформы цифровых технологий для радиовещания и телевидения – это DAB (Digital Audio Broadcasting), DRM (Digital Radio Mondiale), DVB (с наземной DVB-T, кабельной DVB-C, спутниковой DVB-S разновидностями) и ATSC (Dolby AC-3). 14

Первая из них (DAB, DRM) продвигается Европой, ATSC – США. Отличаются эти платформы, алгоритмом прежде всего, компрессии выбранным цифровых аудиоданных, видом цифровой модуляции и процедурой помехоустойчивого кодирования ЗС. 15

2. Несмотря на значительное разнообразие алгоритмов компрессии цифровых аудиоданных, структура кодера, реализующего такой алгоритм обработки сигналов, может быть представлена в виде обобщенной схемы: 16

В блоке временной и частотной сегментации исходный звуковой сигнал разделяется на субполосные составляющие и сегментируется по времени. Длина кодируемой выборки зависит от временных характеристик звукового сигнала. 18

При отсутствии резких выбросов по амплитуде используется так называемая длинная выборка. изменений кодируемой уменьшается, В случае же резких амплитуды выборки что дает сигнала длина существенно более высокое разрешение по времени. 19

Модель NMR использует следующие свойства слуха: Абсолютный порог слышимости. Критические полоски слуха (частотные группы, на которые человек разделяет звуковой сигнал при его восприятии), у которых даже есть своя единица измерения для высоты тона – барк. 23

Относительный маскировка в порог слышимости частотной области. и При одновременно воздействии на слух двух сигналов один на фоне другого может быть не слышен – это маскировка, а относительный порог слышимости – это порог слышимости одного сигнала в присутствии другого с учетом маскировки по частоте 24

Маскировка во временной области – характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости, когда маскирующий и маскируемый сигналы звучат не одновременно. 25

При этом различают послемаскировку (изменение порога слышимости после сигнала высокого уровня) и предмаскировку (изменение порога слышимости перед приходом сигнала высокого уровня). Такой вид маскировки, когда звуки не перекрываются во времени, называется временной маскировкой. 26

Послемаскировка проявляется на интервале времени 100… 200 мс после окончания маскирующего сигнала, а предмаскировка – около 10 мс, что определяется особенностями конкретного человека. По этой причине временная маскировка при цифровом кодировании практически не используется. 27

Основные процедуры которые вычислений, выполняются на базе психоакустического анализа, реализованного на основе NMR – модели по принципу аддитивного (взаимонезависимого) действия на орган слуха спектральных компонент, если они воздействуют одновременно. На вход блока психоакустического анализа кодера (слайд 17) подается первичный ИКМ сигнал 28

со скоростью 48*16 = 768 Кбит/с. Выполняются следующие процедуры: Процедура 1. Расчет энергетического спектра выборки входного ЗС и его нормирование. Пример: пусть длина выборки БПФ N=512 (Layer 1) или 1024 отсчета (Layer 2). Обозначим n - номер отсчета сигнала в выборке; k – индекс коэффициента БПФ. 29

На выходе блока БПФ имеем линейчатый спектр X(k) в д. Б, с разрешением по частоте ΔF = fд/N. При fд = 48 к. Гц и N = 1024 получим ΔF = 46, 875 Гц. БПФ выполняется с оконной функцией Hanna для подавления эффекта Гиббса. 30

Вычисленный спектр нормируется, максимальной спектральной компоненте присваивается уровень 92 д. Б. Процедура 2. Вычисление энергии сигнала выборки в субполосах кодирования. Процедура 3. Вычисление локальных максимумов энергетического спектра сигнала выборки. Алгоритм здесь простой: спектральная компонента X(k) будет локальным максимумом, 32

Если она больше предшествующей X(k-1), но не менее следующей X(k+1). Процедура 4. Формирование списка тональных компонент. В этом случае исследуется область частот максимума и около каждого соответствующая локального спектральная составляющая включается в список тональных компонент {X(k)} , если в этой области она 33

превышает любую компоненту (кроме двух соседних, чтобы учесть при расчете уровня их энергии) не менее чем на 7 д. Б. Процедура 5. Формирование списка нетональных (шумоподобных) осуществляется после компонент формирования списка тональных компонент. Для этого из исходного спектра сигнала выборки исключаются тональные и 34

соседние компоненты, учтенные ранее. Данная процедура необходима, чтобы учесть соответствующие коэффициенты маскировки. Процедура 6. Прореживание спектра тональных и нетональных компонент осуществляется с целью маскировки вне критической полоски слуха, которая одинакова и для тональных и для нетональных компонент. 35

После прореживания формируется новая сетка спектральных компонент: в первых трех субполосах (0… 2250 Гц) компоненты, учитываются в все следующих спектральные трех субполосах (2250… 4500 Гц) – каждая вторая, в последующих трех субполосах (4500… 6750 Гц) – каждая четвертая и в оставшихся 20 субполосах – лишь каждая восьмая спектральная компонента. 36

Таким образом, если верхняя частота ЗС 22500 Гц, то после такого прореживания получается спектр из 126 спектральных компонент (исходный спектр имел 512 составляющих). Процедура 7. Расчет коэффициентов маскировки. Процедура 8. Расчет порогов маскировки. 37

Процедура 9. Вычисление кривой глобального порога маскировки. Здесь формируется глобальный порог маскировки для каждой субполосы и определяется допустимое значение уровня шумов для каждого квантования, в частности, строится гистограмма распределения бит при кодировании субполосных отсчетов. 38

4. 1. Звуковая часть стандарта MPEG-1 (ISO/IEC 11172 -3) включает в себя три алгоритма различных уровней сложности: Layer (уровень) I, Layer II и Layer III. Общая структура процесса кодирования одинакова для всех уровней, но они различаются по целевому использованию и внутренним механизмам. Для каждого уровня определен свой цифровой поток, то есть общая 39

ширина потока и свой алгоритм декодирования. Уровни имеют коэффициенте различия сжатия и в обеспечиваемом качестве звучания получаемых потоков. MPEG-1 предназначен для кодирования сигналов, оцифрованных с частотой дискретизации 32, 44. 1 и 48 к. Гц. 40

Стандарт MPEG-1 нормирует для всех трех уровней следующие номиналы скоростей цифрового потока: 32, 48, 56, 64, 96, 112, 192, 256, 384 и 448 кбит/с, число уровней квантования входного сигнала – от 16 до 24. 41

Стандартным входным сигналом для кодера MPEG-1 принят цифровой сигнал AES/EBU (двухканальный цифровой звуковой сигнал с разрядностью квантования 20. . . 24 бита на отсчет). Предусматриваются следующие режимы работы звукового кодера: одиночный канал (моно), двойной канал (стерео или два моноканала) и 42

joint stereo (сигнал с частичным разделением правого и левого каналов). Важнейшим свойством MPEG-1 является полная обратная совместимость всех трех уровней. Это означает, что каждый декодер может декодировать сигналы не только своего, но и нижележащих уровней. 43

В основу алгоритма Уровня I положен формат DCC (Digital Compact Cassette), разработанный компанией Philips для записи на компакт-кассеты. Кодирование первого уровня применяется там, где не очень важна степень компрессии и решающими факторами являются сложность и стоимость кодера и декодера. 44

Кодер Уровня I обеспечивает высококачественный цифрового потока звук 384 при скорости кбит/с на стереопрограмму. Уровень II требует более сложного кодера и несколько более сложного декодера, но обеспечивает лучшее сжатие – 45

«прозрачность» канала достигается уже при скорости 256 кбит/с. Он допускает до 8 кодирований/декодирований без заметного ухудшения качества звука. В основу алгоритма Уровня II положен популярный в Европе формат MUSICAM. 46

Самый сложный Уровень III включает все основные инструменты сжатия: полосное кодирование, дополнительное ДКП, энтропийное кодирование, усовершенствованную ПАМ. За счет усложнения кодера и декодера он обеспечивает высокую степень компрессии – считается, что «прозрачный» канал формируется уже на скорости 47

128 кбит/с, хотя высококачественная передача возможна и на более низких скоростях. В стандарте рекомендованы две психоакустические модели: более простая Модель 1 и более сложная, но и более высококачественная Модель 2. Они отличаются алгоритмом обработки отсчетов. Обе модели могут использоваться для всех трех уровней, 48

но Модель 2 имеет специальную модификацию для Уровня III. MPEG-1 оказался первым международным стандартом цифрового сжатия звуковых сигналов и это обусловило его широкое применение во многих областях: 49

вещании, звукозаписи, мультимедийных связи приложениях. и Наиболее широко используется Уровень II, он вошел составной частью в европейские стандарты спутникового, кабельного и наземного цифрового ТВ вещания, в стандарты звукового вещания, записи на DVD, 50

Рекомендации МСЭ BS. 1115 и J. 52. Уровень III (его еще называют МР-3) нашел широкое применение в цифровых сетях с интегральным обслуживанием (ISDN) и в сети Интернет. Подавляющее большинство музыкальных файлов в сети записаны именно в этом стандарте. 51

4. 2. MPEG-2 это расширение MPEG-1 в сторону многоканального звука. MPEG-2 учитывает различия режима передачи многоканального звука, в том числе пятиканальный формат, семиканальный звук 52

с двумя дополнительными громкоговорителями, применяемыми в кинотеатрах с очень широким экраном, расширения этих форматов с низкочастотным каналом. 53

4. 3. При всем множестве новаторских подходов MPEG-4 звуковые разделы стандарта – возможно, наиболее интересная и революционная его часть. Объектный подход к изображениям – новое для телевидения, но в ряде систем анимации он применялся и ранее. 54

По поводу звуковых качество стандарта (т. н. объектного звука), то системы, сопоставимой с MPEG-4 по комплексности подхода, спектру примененных технологий и диапазону применений, просто нет. 55

Принципиальным отличием MPEG-7 является то, что он разрабатывался совсем не для установления каких-либо правил сжатия аудио- и видеоданных или типизацию и характеристику данных какого-то конкретно рода. 56

4. 4. Стандарт MPEG-7 предусмотрен как описательный, предназначенный регламентации характеристик мультимедиа любого типа, для данных вплоть до аналоговых, и записанных в разных форматах (например, с разным пространственным и временным разрешением кадра). 57

Некоторые методы сжатия звуковых данных (доп. к Лекции 2)

Кодирование данных без потерь (lossless coding) - это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Например, после сведения звука в студии звукозаписи, данные необходимо сохранить в архиве в оригинальном качестве для возможного последующего использования. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры – это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио.

Кодирование данных с потерями (lossy coding). Цель такого кодирования - любыми способами добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это достигается путем использования различных алгоритмов «упрощающих» оригинальный сигнал (выкидывая из него «ненужные» слабослышимые детали), что приводит к тому, что декодированный сигнал фактически перестает быть идентичным оригиналу, а лишь похоже звучит.

Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие.

В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз).

Некоторые форматы звуковых файлов :

Формат AU . Этот простой и распространенный формат на системах Sun и NeXT (в последнем случае, правда, файл будет иметь расширение SND). Файл состоит из короткого служебного заголовка (минимум 28 байт), за которым непосредственно следуют звуковые данные. Широко используется в Unix-подобных системах и служит базовым для Java-машины.

Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows. Является специальным типом другого, более общего формата RIFF (Resource Interchange File Format); другой разновидностью RIFF служат видеофайлы AVI. Файл RIFF составлен из блоков, некоторые из которых могут, в свою очередь, содержать другие вложенные блоки; перед каждым блоком данных помещается четырехсимвольный идентификатор и длина. Звуковые файлы WAV, как правило, более просты и имеют только один блок формата и один блок данных. В первом содержится общая информация об оцифрованном звуке (число каналов, частота дискретизации, характер зависимости громкости и т.д.), а во втором - сами числовые данные. Каждый отсчет занимает целое количество байт (например, 2 байта в случае 12-битовых чисел, старшие разряды содержат нули). При стереозаписи числа группируются парами для левого и правого канала соответственно, причем каждая пара образует законченный блок - для нашего примера его длина составит 4 байта. Такая, казалось бы, излишняя структурированность позволяет программному обеспечению оптимизировать процесс передачи данных при воспроизведении, но, как в подобных случаях всегда бывает, выигрыш во времени приводит к существенному увеличению размера файла.

Формат MP3 (MPEG Layer3) . Это один из форматов хранения аудиосигнала, позднее утвержденный как часть стандартов сжатого видео. Природа получения данного формата во многом аналогична уже рассмотренному нами ранее сжатию графических данных по технологии JPEG. Поскольку произвольные звуковые данные обратимыми методами сжимаются недостаточно хорошо, приходится переходить к методам необратимым: иными словами, базируясь на знаниях о свойствах человеческого слуха, звуковая информация “подправляется” так, чтобы возникшие искажения на слух были незаметны, но полученные данные лучше сжимались традиционными способами. Это называется адаптивным кодированием и позволяет экономить на наименее значимых с точки зрения восприятия человека деталях звучания. Приемы, применяемые в MP3, непросты для понимания и опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации. Успехи технологии MP3 привели к тому, что ее применяют сейчас и во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т.е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные, освещение). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию. Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования. Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить авторский музыкальный замысел.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как “модули программ воспроизведения”, они хранят в себе не только “электронные ноты”, но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.