Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

"Методы кодирования данных"

Содержание:

Введение

Одна и та же информация может быть представлена разными кодами, иначе говоря, в разных формах.

Люди выработали множество форм представления информации. К ним относятся: разговорные языки (русский, английский, немецкий — всего более 2000 языков), язык мимики и жестов, язык рисунков и чертежей, научные языки (например, язык математики), языки искусства (музыка, живопись, скульптура), специальные языки (азбука Брайля, азбука Морзе, флажковая азбука).

Способ кодирования (форма представления) информации зависит от цели, ради которой осуществляется кодирование. Такими целями могут быть сокращение записи, засекречивание (шифровка) информации, удобство обработки и т. п.

Чаще всего применяют следующие способы кодирования информации:

  1. графический — с помощью рисунков или значков;
  2. числовой — с помощью чисел:
  3. символьный с помощью символов того же алфавита, что и исходный текст.

Переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки, также называют кодированием.

Действия по восстановлению первоначальной формы представления информации принято называть декодированием. Для декодирования надо знать код.

Цель – рассмотреть методы кодирования информации.

Задачи:

- рассмотреть кодирование информации

- рассмотреть методы кодирования информации.

В основу работы легли исследования таких авторов, как Жиляков Е.Г. Белов С.П., Черноморец А.А. и др.

Глава 1. Понятие кодирование информации

1.1.Физические ресурсы информационных процессов

Проблема снижения ресурсоемкости различных видов производств уже давно стоит перед всем миром. Для многих государств, регионов, отраслей промышленности и отдельных предприятий экономия ресурсов становится приоритетной задачей. [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Решение этой задачи в соответствии с Федеральным законом № 261-ФЗ об энергосбережении является обязанностью не только промышленности, но и муниципальных учреждений, государственных органов. Не является исключением и отрасль информационных технологий, где задача снижения ресурсоемкости стала приоритетной.

Многие исследователи, изучая ин- формацию, отмечали, что любые ее преобразования основаны на физических законах. Например, А.А. Ляпунов указывал на ограничения пространства, времени и энергии при выполнении информационных технологий, поскольку невозможны концентрация слишком большой массы знаков в ограниченном объеме пространства, получение новых знаков и их передача в новый носитель за слишком маленькое время и регистрация новых знаков слишком маленькой энергией. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Н.Н. Моисеев считал, что за исключением потребности изучения целенаправленных действий в живой природе и обществе можно обойтись без термина «информация» и протекающие процессы описывать с помощью законов физики и химии [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Р. Ландауэр ставит знак равенства между информационными и физическими процессами, поскольку «информация физична».

Определение понятия информации, которое следует из работ Н. Винера [4], явно связывает информацию с ее физическими свойствами: «Информация – это обозначение содержания, полученное нами из внешнего мира в процессе приспосабливания к нему нас и наших чувств». Несмотря на такое понимание, физические свойства информации все же находились на втором плане исследований информатиков всю вторую половину XX века. Этому есть объяснение. Согласно закону Г. Мура, объемные характеристики информационных систем росли экспоненциально [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Все возрастающие вычислительные возможности полупроводниковых технологий давали возможность рассматривать поведение кибернетических систем исключительно как нематериальное, а информацию как нематериальную субстанцию, которая, тем не менее, переводит системы из одного состояния в другое и самым существенным образом влияет на принятие решений. Методология кибернетики основывается на трех базовых составляющих: системном подходе, прикладной математике и цифровых информационных технологиях. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Такие прикладные математические теории, как теория информации, теория принятия решений, теория массового обслуживания, теория управ- ления, моделирование систем, математическая и формальная логики, теории алгоритмов и автоматов, теории формальных языков и грамматик, социальная информатика, исследование операций и другие и сегодня составляют основу «информационного» образования.

Общее у этих теорий – это «переборный» или «цифровой» метод:

1. сначала интеллектуал должен сформулировать цель исследования;

2. затем для достижения этой цели необходимо или выбрать некоторые состояния системы, или перебрать состояния, или упорядочить состояния, или исключить некоторые состояния, или синтезировать новые состояния, и т.п. Весь смысл исследования прячется в цели, а вся «физика» – в умении сократить перебор, который для сложных систем является достаточно большим. Цифровая информационная технология при таком подходе призвана методами прикладной математики реализовать алгоритмы перебора состояний системы, описанных цифровыми массивами данных. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Кибернетика учитывает смысловую составляющую информации только через цель, которая формулируется вне системы, а материальную оставляющую рассматривает как изменение состояний объектов, не связанное с их физической природой. [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

В последние годы стало очевидным существование некоторого предела возможностей полупроводниковых технологий, и это обстоятельство заставляет вернуться к физическим основаниям информационных преобразований. Главным системным ограничением для суперхранителей, суперпереносчиков и суперобработчиков данных нашего времени является энергопотребление.

Уже сегодня крупные центры обработки данных, системы коммутации и маршрутизации, суперкомпьютеры в процессе своей работы потребляют десятки мегаватт электроэнергии. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Один маршрутизатор операторского класса, например, каждый год потребляет столько энергии, сколько выделяется при сжигании десятков тонн угля. Особенностью современных информационных технологий [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.], использующих принцип фон Неймана, является необходимость многократного сохранения, распространения и обработки данных. Это означает, что объемы энергии, потребляемые каждым информационным битом за время его жизненного цикла, увеличиваются многократно. У многих информационных технологий можно проследить взаимную зависимость уровня энергопотребления с другими физическими ресурсами, описывающими пространственные и временные параметры систем [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Возможности преобразования информационных битов при их сохранении, распространении и обработке зависит сегодня не только и не столько от существования того или иного программного обеспечения, перебирающего состояния систем. Первостепенное значение приобретает наличие физических ресурсов, поскольку именно использование физических ресурсов обеспечивает перемещение данных как материальных объектов во времени, в пространстве и изменение формы представления данных [10, 11]. Рассмотрим с общих позиций те физические ресурсы, которые необходимы для выполнения функций базовыми информационными технологиями сохранения, распространения и обработки данных [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Очевидно, что физические ресурсы самым существенным образом влияют на технологические возможности реализации базовых информационных процессов [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Любая информационная технология требует пространства. Пространственные ресурсы измеряются в единицах длины и расстояния, описывают способы размещения информационных объектов и должны эффективно использоваться при реализации информационных процессов. К числу основных пространственных ресурсов информационных технологий можно отнести следующие:

 для технологий сохранения – размер запоминающих устройств для записи и плотность записи данных;

 для технологий распространения – территория, в пределах которой организуется информационное взаимодействие пользователей (зона охвата) и распределение (плотность) пользователей на этой территории;

 для технологий обработки – размер техпроцесса и количество транзисторов, размещаемых в одном чипе. [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Кроме того, любая технология характеризуется объемом технологических помещений и допустимой плотностью размещения в них оборудования. Плотность записи данных – это количество бит, которое размещается на единице площади (или объема) запоминающего устройства (ЗУ). Очевидно, что плотность обратно пропорционально зависит от размера физического элемента, сохраняющего бит. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Размер техпроцесса определяет плотность транзисторов на одном кристалле. В соответствии с законом Г. Мура производительность кремниевых интегральных микросхем и количество транзисторов на одном кремниевом кристалле удваивается каждые 18 месяцев, а их стоимость при этом уменьшается на 50%. Рост количества транзисторов в одном чипе означает уменьшение и размеров единичного транзистора, и ширины контактных дорожек. Уровень техпроцесса 2011–2012 г.г. – это 22 нм, что соответствует размещению около 1,5 млрд транзисторов на 160 мм2 . Уменьшение размера техпроцесса позволяет не только увеличивать плотность хранения данных на полупроводниках, но и создавать более сложные и эффективные архитектуры процессоров, в частности, имеющие несколько вычислительных ядер и уровней кэш-памяти. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Кроме того уменьшение техпроцесса позволяет сократить энергопотребление за счет перехода на новые типы транзисторов, уменьшения напряжение питания, отключения в режиме бездействия отдельных ядер, кэш-памяти или участков интегрированного графического ядра и др. Плотность размещения оборудования оценивается при помощи целой группы параметров. Это и количество вычислительных операций (вычислительная плотность), и объем потребляемой энергии (энергетическая плотность), и скорость информационных каналов (сетевая плотность) на единицу площади оборудования и др. Рекорд вычислительной плотности 2013 г. – это 1 Пфлоп/с на одну стойку площадью 1 м2 .

Стойка состоит из 1024 вычислительных узлов, имеет совокупную емкость локального файлового хранилища узлов 0,5 ПБ и обеспечивает отвод более 0,4 МВт тепловой мощности за счет использования прямого жидкостного охлаждения [[Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Новой технологией, позволяющей сократить издержки на создание ИТ-инфраструктуры, являются модульные центры обработки данных. Производственное помещение строится из сэндвич-панелей, снабжается необходимым количеством серверов и прочего инфраструктурного оборудования и может располагаться в любом месте пространства при наличии доступа к сетевым и энергетическим мощностям [Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.].

Для каждого из базовых информационных процессов время обслуживания имеет свое название, отражающее специфику процесса. Для сохранения – это время гарантированного сохранения, для распространения – время доставки данных, для обработки – производительность обработчика[Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Время гарантированного сохранения – это период времени, который начинается в момент записи данных на ЗУ и продолжается до тех пор, пока данные могут быть найдены на ЗУ, считаны и интерпретированы пользователем. Это время зависит от времени «жизни» минимальных единиц хранения, т.е. времени, в течение которого они сохраняют установленное состояние. Примерами современных долговечных хранителей данных являются диски типа M-Disc, которые записывают данные на слое минерального материала, подобного камню, и гарантируют сохранность файлов на протяжении 1000 лет. Еще более выносливым является стеклянный диск. Он не имеет минерального слоя, устойчив к при- родным катастрофам, пожарам и излучениям, выдерживает условия открытого космоса, температуры, близкие к абсолютному нулю, и излучение Солнца.

Одна из компаний дает гарантию в 100 лет на накопители, созданные на базе флэш-памяти с антикоррозийной защитой. Электроны в плавающем затворе транзисторов сохраняются тем дольше, чем ниже температура хранения [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Согласно новому открытию можно синтезировать частицу ДНК и записать в нее экзабайты данных. Затем в лиофилизированной форме ДНК можно сохранять теоретически тысячи лет. Время доставки данных – это период времени, который начинается в момент поступления сигнала в канал связи и заканчивается по достижению данными заданной точки пространства (адресата).

Время доставки по сети связи включает время передачи данных от источника информации в канал связи, время перемещения сигнала по каналу между сетевыми центрами и время управления движением сигнала в сетевых центрах, таких как маршрутизаторы, серверы или телефонные станции. И в электрических, и в оптических сетях собственно время перемещения сигнала по каналу связи равно скорости света. Задержки передачи сигналов связаны с необходимостью обрабатывать адресную и другую управляющую информацию, сопровождающую данные при использовании коммутируемых сетей [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Пропускная способность канала – это наибольшая скорость передачи данных, измеряемая в бит/с, т.е. количество данных, которые сеть может передать за единицу времени между двумя оконечными устройствами. Она достигается при использовании оптимальных для данного канала настроек источника информации, когда на каждом такте работы канала каждый символ переносит максимально возможное количество бит данных. Производительность (показатель, обратный времени обработки данных) – это количество операций обработки в секунду. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Основной задачей процесса обработки данных является получение нового массива данных из исходного при помощи некоторых алгоритмов. Для решения этой задачи в архитектуре фон Неймана задействованы вычислительные элементы и память, объединенные коммутационной сетью (интерконнектом).

Вычислительные элементы – это процессоры, каждый из которых содержит несколько вычислительных ядер, память – это иерархически организованная система хранения программ и данных, включающая регистры, кэши, основную и внешнюю памяти [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

В сложной архитектуре компьютеров скорость счета зависит не столько от свойств элементной базы, сколько от способов объединения процессоров, памяти и интерконнекта. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Появление суперкомпьютеров производительностью до 1 Эфлоп/с (1018 флоп/с) ожидается до 2020 г. Обсуждается возможность приближения суперкомпьютеров к зетта-масштабу (1021 флоп/с) до 2030 г. Время доступа – это интервал времени между моментами поступления заявки на предоставление информационной услуги до момента начала ее реализации. Оно зависит от способа использования ресурсов информационных технологий, таких как объем запоминающих устройств, каналов и процессоров или энергии [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106.]

Если за некоторым пользователем заранее закреплен достаточный физический и технологический ресурс, то время доступа будет малой величиной, которой можно пренебречь. Однако, как правило, информационные системы организуют доступ многих пользователей к ограниченному количеству ресурсов. При этом возникают коллизии, и пользователи вынуждены ожидать освобождения нужных им ресурсов, если они уже используются другими пользователями.

Если количество ресурсов системы рассчитано таким образом, что время доступа не превышает согласованной с пользователем величины, то систему называют системой реального времени [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

По различным оценкам, к 2020 г. потребность оборудования информационных систем в электроэнергии увеличится более чем в два раза и достигнет 400 ГВт. Основными потребителями являются оконечные устройства, центры обработки данных и оборудование сетей. Бит как единица оценки количества данных уже недостаточен для сравнения возможностей и эффективности информационных систем. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Имеют значение и физический размер бита, и время его гарантированного сохранения, и энергия, необходимая для сохранения, передачи и обработки бита. Эффективность информационных систем связана сегодня с фактическим потреблением ими физических ресурсов (в первую очередь электроэнергии) и оценивается, например:

 объемом энергии, потребляемой в расчете на единицу информационных услуг;

 стоимостью транзакций в киловатт-часах или объеме выбросов углерода;

 объемами выбросов углерода в пересчете на один сервер или на группу пользователей;

 соотношением энергопотребления информационного оборудования и инженерных систем, поддерживающим его работу;

 энергопотреблением на 1 м2 площади технических помещений и т.д.

Р. Ландауэр в 1961 г. показал [7], что расход энергии в процессе вычислений связан с уничтожением битов данных, и сформулировал следующий принцип: «Независимо от физики и технологии вычисли- тельного процесса при потере 1 бита данных в процессе вычисления как минимум выделяется энергия, равная Bk Тln2 , Дж», где kВ – постоянная Больцмана, определяющая связь между температурой и энергией (порядка 1,3807·10–23 Дж/К); Т – температура, при которой ведутся вычисления (300 К = 26,85°С). Остальные операции (копирование, установка, перенос и др.) требуют сколь угодно мало энергии при достаточно малой скорости протекания. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Для описания ресурсного обеспечения базовых информационных технологий может быть использован параллелепипед, грани которого отображают нижние и верхние границы пространства, времени и энергии, необходимые информационным технологиям на некотором этапе их развития.

К соответствующим значениям следует стремиться при выборе информационной техники [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106.].

В качестве примера рассмотрим технологии сохранения больших данных, которым также требуются все большие объемы физических ресурсов.

1.2. Основные методы кодирования

Большинство традиционных методов кодирования относится к одному из двух основных типов: замена и перестановка. В шифрах замены один символ заменяется другим, но порядок следования символов в сообщении не изменяется. В шифрах перестановки в соответствии с некоторым правилом перемешиваются символы сообщения. Эти типы кодов могут быть любого уровня сложности и даже могут быть применены совместно.

Цифровые компьютеры привнесли третий основной тип шифрования, называемый битовой обработкой, в котором по некоторому алгоритму изменяется машинное представление данных. Все три метода могут использовать ключ.

Ключ - это строка символов, необходимая для дешифрования сообщения. Необходимо различать понятие ключ и метод. Знание ключа не дает возможности дешифровать сообщение, необходимо также знать алгоритм шифрования. С другой стороны знание метода шифрования без ключа также не дает такой возможности; необходимо знать и метод и ключ. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Пусть, например, зашифровывается сообщение на русском языке и при этом замене подлежит каждая буква сообщения. Формально в этом случае шифр замены можно описать следующим образом. Для каждой буквы  исходного алфавита строится некоторое множество символов M так, что множества M и M  попарно не пересекаются при    , то есть любые два различные множества не содержат одинаковых элементов.

Множество M называется множеством обозначений для буквы  . является ключом шифра замены. Зная ее, можно осуществить как зашифрование, так и расшифрование. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

При зашифровании каждая буква  открытого сообщения, начиная с первой, заменяется любым символом из множества M . Если в сообщении содержится несколько букв  , то каждая из них заменяется на любой символ из M . За счет этого с помощью одного ключа можно получить различные варианты зашифрованного сообщения для одного и того же открытого сообщения.

Выводы

На сегодняшний день существует два метода сжатия без потерь – это статистические и словарные методы. Статистические методы играют на том, что если некоторый символ в последовательности встречается относительно часто, то ему ставится в соответствие короткий код, а если символ встречается реже – то ему присваивается более длинный код. В результате такого неравномерного кодирования, средняя длина последовательности становится короче. В другом, словарном методе, находятся похожие цепочки символов, которым присваиваются соответствующие более короткие коды. Эти методы независимы друг от друга и потому могут использоваться совместно для достижения более лучшего сжатия.

Глава 2. Методы кодирования информации

2.1. Методы кодирования информации

Для человека представляется естественным осуществлять информационный обмен, используя устную речь и визуальное отображение предметов, явлений или процессов.

Индустрия создания информационного, образовательного и развлекательного контента применяет устную речь для звукового сопровождения информационных справок, фильмов и музыкальных композиций.

Это приводит к росту потоков информации, содержащей речь. В связи с этим возникает проблема обеспечения автоматического контроля за использованием речи, и в частности предотвращения несанкционированных действий с ней. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Иными словами, речь стоит рассматривать с двух позиций: не только как объект, в котором осуществляют скрытное кодирование, обеспечивающее хранение и передачу контрольной информации о контенте, но и как объект, который сам представляет собой контрольную информацию. Контрольная информация может представлять собой сведения о лицах, предметах, фактах, событиях, явлениях и процессах, представленные в цифровой форме. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Исходя из этого для обеспечения автоматического контроля речевых данных необходимо решение ряда задач: подтверждение идентичности полученной информации; идентификация личности; распознавание; определение целостности речи; защита речи от несанкционированного до- ступа; хранение, при котором невозможно обнаружить контрольную информацию, если не знать о ее существовании.

Со многих точек зрения для речевых данных это целесообразно осуществлять в скрытном режиме, когда информация о процессах скрытного кодирования и соответствующих действиях доступна только определенному кругу лиц. Мера скрытности характеризует способность информации не быть обнаруженной в процессе информационного обмена.

Для решения задач, приведенных выше, можно воспользоваться принципом стеганографии, а в случаях аудиоданных – цифровой стегано- графией, когда контент и информация контроля представляются в цифровой форме. В основе не очень широкого круга существующих алгоритмов стеганографии используются различные приемы кодирования контрольной информации, среди которых можно выделить: использование наименьшего значащего разряда, кодирование на основе расширения спектра и некоторые другие. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Отметим, что развитие методов цифровой стеганогорафии направлено на повышение скрытности контрольной информации, выражаемое на- пример через степень искажения, с сохранением стойкости кодирования внедряемой информации к внешним разрушающим воздействиями. Авторами для решения указанной проблемы предлагается метод адаптивного скрытного кодирования контрольной информации, обеспечивающий при заданной вероятности ошибки высокую скрытность.

Суть метода заключается в использовании энергетических свойств речевых данных, математической основой которого является применение в качестве ортогонального базиса собственных векторов субполосной матрицы [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ] вместо псевдослучайной последовательности (ПСП), широко применяемой в настоящее время при скрытном кодирования контрольной информации.

Использование собственных векторов, энергия которых сконцентрирована в заданной частотной полосе, позволяет повысить избирательность в частотной области при реализации задач анализа/синтеза. Для обеспечения избирательности целесообразно использовать собственные вектора, собственные числа которых близки к единице Свойство соответствия собственных чисел собственным векторам как критерия, применяемого при отборе векторов, обладающих заданной концентрацией энергии, вытекает из следствия равенства Парсеваля.

Следствие определяет пропорциональность доли энергии собственного вектора значению собственного числа ему соответствующего. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Спектр собственного вектора субполосной матрицы в области трансформант Фурье К еще одному важному свойству собственных векторов субполосной матрицы, найденных для одной субполосы, можно отнести условие орто- нормальности: это свойство позволяет решить еще одну важную проблему анализа речевых сигналов, а именно: оценить вклад энергии вектора в отрезок данных. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Такую операцию естественно называть частотной фильтрацией, а значение скалярного произведения собственного вектора на отрезок данных – субполосной проекцией.

Основным недостатком метода расширения спектра является вероятность ошибки, возникающей при декодировании бит контрольной информации.

Появление такой высокой вероятности ошибки вызвано корреляцией отрезка речевых данных с ПСП. Одним из способов уменьшения вероятности ошибки является использование модуляции гармонического сигнала ПСП для формирования сигнально-кодовой конструкции (СКК). Модуляция частично концентрирует энергию относительно центральной частоты . Но ис- пользование модуляции не позволяет полностью сконцентрировать всю энергию ПСП в заданной полосе частот, что все равно приводит к изменению отрезка речевых данных во всей частотной области. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Метод субполосных проекций обладает на порядок меньшей вероятностью ошибки декодирования контрольной информации. Этот показатель достигается за счет скрытного кодирования контрольной информации в узкой полосе, а следовательно, и воздействие шума с равномерным распределением в частотной области меньше. Стоит отметить, что энергия шума с равномерным распределением, воздействующая на СКК в методе субполосных проекций, обратно пропорциональна ширине субполосы. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Иными словами: чем уже субполоса, тем меньшая энергия шума оказывает влияние на СКК. Также важно для повышения помехоустойчивости отбирать для скрытного кодирования СКК, обладающие большей энергией. Исследования показали, что применение субполосных проекций для скрытного кодирования контрольной информации позволяет обеспечить высокую скрытность при небольшой вероятности ошибки, возникающей в результате воздействия шума. Также отличительным свойством метода является безошибочное декодирование контрольной информации, в случае если речевые данные не подвергались изменению.

2.2. Методы специального кодирования

При воспроизведении данных, записанных на носитель записи, сигналы данных как в ВЗУ на оптических дисках, так и в ВЗУ на магнитных дисках претерпевают искажения, обусловленные ограниченной разрешающей способностью системы головка – диск. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Критерием этой разрешающей способности является длительность одиночного импульса воспроизведения, которая обычно превышает длительность синхротакта, в результате чего происходит межсимвольная интерференция (МСИ) и суммарный (результирующий) сигнал данных имеет амплитудные и временные искажения. Причины использования кодов с ограничением длины поля записи

Искажения сигнала воспроизведения за счет МСИ состоят в непостоянстве амплитуды сигнала и сдвиге во времени пиков сигнала от их номинальной позиции, соответствующей позиции «единичного» элемента сигнала записи. При воспроизведении данных, записанных на носитель, решается задача идентификации каждого элемента («единичного» и «нулевого»), что реализуют путем потактной конъюнкции сигнала данных сигналом специальной синхросерии воспроизведения, формируемой под управлением сигналов данных воспроизведения. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Эта синхросерия создается синхрогенератором, управляемым «единичными» импульсами сигнала воспроизведения.

Такое управление обеспечивает регулирование частоты синхросерии, отслеживающее текущие изменения скорости движения носителя при воспроизведении.

Это необходимо для минимизации сдвига во времени сигналов синхросерии относительно сигналов данных. Такой сдвиг означает как бы уменьшение эффективного временного допуска на разрешенное расположение во времени каждого элементарного сигнала данных по сравнению с номинальным значением этого допуска, равным синхротактуТс .

Результатом такого уменьшения временного допуска является уменьшение достоверности воспроизведения данных, то есть повышение вероятности сбоя или ошибки в данных. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Для повышения точности отслеживания частоты синхросерии за скоростью носителя данных подстройка синхрогенератора посредством «единичных» импульсов должна выполняться достаточно часто, чтобы минимизировать накопленный «уход» частоты относительно текущей средней частоты данных воспроизведения.

Обычный двоичный код имеет равную вероятность появления символов «1» или «0» в текущем такте и допускает бесконечно большие «ну- левые» последовательности символов, в пределах которых нет подстройки частоты генератора. Такой код не обладает свойствами самосинхронизации.

В связи с этим для представления данных на подвижном носителе в ВЗУ создают специальные канальные коды, которые гарантируют появление символа «1» через определенное количество символов «0» и поэтому обладают свойствами самосинхронизации. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Существует две причины, по которым необходимо это техническое оснащение: во-первых, синхронизируемая (синхронизирующая) схема использует поток импульсов, благодаря переходам чередующихся магнитных полярностей на диске, чтобы поддержать правильное время связывания-удержания (track-andhold), ADC и детектора.

В то же время, если импульсы долгое время отсутствуют, т.е. длинная последовательность нулей (запись без возврата к нулю с инвер- сией – NRZIrecording), канал двусторонней связи не получит достаточно информации, чтобы обеспечить надлежащую синхронизацию (выравнивание). [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Вследствие этого, временной промежуток между двумя единицами должен быть ограничен.

Во-вторых, когда два бита записываются слишком близко друг к другу, взаимные помехи между двумя противоположными импульсами будут снижать соотношение “сигнал- шум” (SNR) при считывании только что записанной информации (эхосчитывании).

Следовательно, следует использовать постоянное кодирование, чтобы гарантировать расстояние (интервал) между двумя переходами расстояние (интервал), достаточно большой, чтобы избежать межсимвольных помех (ISI); поскольку это расстояние (интервал), которое обычно определяется от средней величины, техническое оснащение в состоянии затем увеличить плотность записи. [Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106. ]

Выравнивание по частичному отклику при- меняется сейчас для борьбы с проблемой межсимвольных помех (ISI), но кодирование с ограничением длины поля записи (RLL)широко используется по вышеприведённым причинам. Особенности канальных самосинхронизирующихся кодов Кодирование с ограничением длины поля записи (RLL) обычно классифицируют по (d, k): показатель dотражает минимальное количество нулей между двумя единицами [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

Показатель k ограничивает максимальное количество нулей между двумя единицами. С другой точки зрения, d контролирует высокочастотные составляющие в связанных сигналах токов записи, чтобы сократить межсимвольные помехи (ISI), напротив, оказывает доминирующее влияние на низкочастотные составляющие, чтобы обеспечить информацию о частоте для канала тактовой синхронизации. [Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.]

При этом параметр к принимает соответственно значения из ряда чисел 1, 2, 3, 4, ..., так что всегда справедливо неравенство: d

Вывод

При воспроизведении данных, записанных на носитель записи, сигналы данных как в ВЗУ на оптических дисках, так и в ВЗУ на магнитных дисках претерпевают искажения, обусловленные ограниченной разрешающей способностью системы головка – диск.

Применение субполосных проекций для скрытного кодирования контрольной информации позволяет обеспечить высокую скрытность при небольшой вероятности ошибки, возникающей в результате воздействия шума. Также отличительным свойством метода является безошибочное декодирование контрольной информации, в случае если речевые данные не подвергались изменению.

Заключение

В современном информационном мире одной из самых актуальных задач является сжатие изображений и видео.

Один пример. Спутник, делающий снимки поверхности Земли в разных частотных диапазонах, передает информацию на Землю, которая затем помещается в хранилище изображений, где используются геоинформационными системами для самых разных целей.

При этом, объем этой графической информации настолько велик, что при ее сжатии борются буквально за каждый байт, т.к. его хранение стоит денег.

По некоторым оценкам дополнительное сжатие хотя бы на 5% дает выигрыш в миллионы долларов.

Примерно та же ситуация сохраняется и при передаче изображений по каналам связи.

Существующей пропускной способности не хватает, чтобы в полной мере удовлетворить потребности пользователей. Все выше сказанное и определяет актуальность задачи сжатия изображений.

На сегодняшний день существует два метода сжатия без потерь – это статистические и словарные методы.

Статистические методы играют на том, что если некоторый символ в последовательности встречается относительно часто, то ему ставится в соответствие короткий код, а если символ встречается реже – то ему присваивается более длинный код.

В результате такого неравномерного кодирования, средняя длина последовательности становится короче.

В другом, словарном методе, находятся похожие цепочки символов, которым присваиваются соответствующие более короткие коды.

Эти методы независимы друг от друга и потому могут использоваться совместно для достижения более лучшего сжатия.

Литература

1. Алексеев А.П., Аленин А.А. Скрытая передача данных в звуковых файлах формата WAV // ИКТ. Т.8, №3, 2010. – С.101-106.

2. Жиляков Е.Г. Вариационные метода анализа и построения функций по эмпирическим данным. Белгород: Изд-во БелГУ, 2007.

3. Жиляков Е. Г., Девицина C.Н., Лихолоб П.Г. Определение возможного объема внедряемой информации при скрытой передаче меток в речевых данных // Научные ведомости БелГУ. «Инфокоммуникационные технологии» Том 13, № 3, 2015, с. 325-333

4. Жиляков Е.Г., Пашинцев В.П., Белов С.П., Лихолоб П.Г. Серия «Информатика». Вып. 23/1, №13 (132), 2012. – С. 222-227.

5. Жиляков Е.Г. Белов С.П., Черноморец А.А. Вариационные методы анализа сигналов на основе частотных представлений // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2010. – С. 10-26.

6. Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей // Вопросы радиоэлектроники. Серия ЭВТ. Вып. 1, 2003. – 240 с.