Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Системы сжатия цифровых аудиоданных.

Содержание:

Введение

Чтобы раскрыть данную тему Системы сжатия цифровых аудиоданных. Надо разобрать и узнать, что такое сжатие, цифровые, аудиоданные.

Пробежимся по терминологии:

Сжатие (англ. data compression), упаковка данных, компрессия, сжимающее кодирование.

Цифровые - имеющий дискретные (вкл./выкл.) значения, противопоставляется аналоговому, имеющему оттенки значения.

Аудиоданные - результат преобразования аналогового сигнала звукового диапазона в цифровой аудио формат.

Простейший метод преобразования, импульсная модуляция (ИКМ), состоит в представлении последовательности мгновенных значений уровня сигнала, измеряемого аналого-цифровым преобразователем (АЦП) через равные промежутки времени.

Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а, соответственно, методы сокращения психоакустической избыточности - сжатием с потерями.

1. Сжатие без потерь

Сокращение статистической избыточности основано на учете свойств самих звуковых сигналов. Она определяется наличием корреляционной связи между соседними отсчетами цифрового звукового сигнала, устранение которой позволяет сокращать объем передаваемых данных на 15...25% по сравнению с их исходной величиной. Для передачи сигнала необходимо получить более компактное его представление, что возможно осуществить с помощью ортогонального преобразования. Важными условиями применения такого метода преобразования являются:

возможность восстанавливать исходный сигнал без искажений

способность обеспечивать наибольшую концентрацию энергии в небольшом числе коэффициентов преобразования

быстрый вычислительный алгоритмом

Этим требованиям отвечает модифицированное дискретно-косинусное преобразование (МДКП).

Уменьшить скорость цифрового потока позволяют методы кодирования, учитывающие статистику звуковых сигналов, например, вероятности появления уровней разной величины. Одним из таких методов является код Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются кодовыми словами большей длины. Именно в силу этих двух причин в наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты звукового сигнала, а коэффициенты МДКП.

Подобные методы применяются при архивации файлов.

2. Сжатие с потерями

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:

частотное (одновременное) маскирование

временное (неодновременное) маскирование

Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного.

Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости (порог слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления после маскировки (изменение порога слышимости после сигнала высокого уровня) и пред маскировки (изменение порога слышимости перед приходом сигнала максимального уровня). Более слабый сигнал становится неслышимым за 5 − 20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения.

Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров, который разделяет сигнал на частотные поддиапазоны. На выходе каждого фильтра оказывается та часть входного сигнала, которая попадает в полосу пропускания данного фильтра. Далее, в каждой полосе с помощью психоакустической модели, анализируется спектральный состав сигнала и оценивается, какую часть сигнала следует передавать без сокращений, а какая лежит ниже порога маскирования и может быть перекантовано на меньшее число бит. Для сокращения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. Эта операция аналогична компаундированию в аналоговом вещании. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами.

Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве.

Многие другие приёмы могут послужить способом сократить объём данных звуковой информации. Даже простое сужение полосы частот сигнала вместе с уменьшением динамического диапазона может уже называться сжатием аудиоданных. Например, в стандарте сжатия звука в сотовой связи используется и то и другое. Стремясь удалить избыточность из звука, кодек при плохом качестве сигнала становится избирателен к определённым словам, упорно проглатывая их.

Блок динамического распределения бит в соответствии с требованиями психоакустической модели для каждого поддиапазона кодирования выделяет такое минимально возможное их количество, при котором уровень искажений, вызванных квантованием, не превышал порога их слышимости, рассчитанного психоакустической моделью.

Для сигналов малой амплитуды характеристика сжатия имеет более крутой фронт, чем для сигналов большой амплитуды. Следовательно, изменение данного сигнала при малых амплитудах затронет большее число равномерно размещенных уровней квантования, чем тоже изменение при больших амплитудах. Характеристика сжатия эффективно меняет распределение амплитуд входного сигнала, так что на выходе системы сжатия уже не существует превосходства сигналов малых амплитуд (т. е. распределение из нормального стремиться к равномерному).

Так же следует отметить следующую особенность человеческого слуха. Резкие скачки человек не успевает отследить, а к сигналу малой амплитуды прислушивается. За счет переменного уровня шага квантования добиваются маскировки шумов квантования мощным сигналом (постоянства соотношения с/ш). Везде, где качество звука не должно в точности соответствовать оригиналу и где в будущем наверняка не потребуется серьезная обработка хранимых данных, использование формата сжатия с потерями вполне допустимо. Не всякому захочется каждый час вставлять в CD привод новый музыкальный диск, если объем винчестера составляет десятки гигабайт. Куда как проще записать музыку, например, в mp3 на винчестер или CD-ROM и слушать

Список литературы:

1.Бернард Скляр Цифровая связь. Теоретические основы и практическое применение [Текст] // М.: Издательский дом — «Вильямс», 2003. -1104с., ил.

2.Хаясака К. Г. Электроакустика [Текст] // М.: «Мир», 1982. -246с.

3.Алдошина И. А. Основы псих акустики [Электронный ресурс] // подборка с сайта www.625.net (доступ свободный) — Яз. рус.

4.Бенин М. С., Подунов А. С. Звук техника [Текст] // М.: Издательство ДОСААФ СССР, 1976.-159с.

5.Римский-Корсаков А. В. Электро-акустика [Текст] // М.: Издательство «Связь», 1973.-272с.

6.Сапожков М. А. Электро-акустика [Текст] // М.: Издательство «Связь», 1978.-272с.

7.Соболевский А. Г. Почему появились искажения? [Текст] // М.: «Радио и связь», 1985. -104с.

8.Дьяконов В. П. MATLAB 6.5 SP1/7 + Simulink 5/6. Основы применения. Серия «Библиотека профессионала» [Текст] // М.: СОЛОН-Пресс, 2005. -800 с.

9.Мартынов Н. Н. Введение в MATLAB 6 [Текст] // M.: КУДИЦ- ОБРАЗ, 2002. -352 с.

10.Солонина А. И., Улахович Д. А., Арбузов С. М., Словьёва Е. Б. Основы цифровой обработки сигналов [Текст] // СПб.: БХВ-Петербург, 2005. -768 с