Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Методы кодирования данных (Кодирование числовой информации)

Содержание:

Введение

В начале своей работы я бы хотел дать определение таким понятием как информация и кодирование.

Информация — это различные сведения, воспринимаемые живыми организмами, электронными устройствами и другими системами, об окружающем мире, процессах, предметах и явлениях.

Кодирование — процесс представления информации (сообщения) в виде кода. Код — система условных знаков для передачи, обработки и хранения информации. Первым, кто использовал кодирование двух символьной информации, был Готфрид Вильгельм Лейбниц. Он считал: «Вычисление с помощью двоек … является для науки основным и порождает новые открытия. При сведении чисел к простым началам, каковыми являются 0 и 1, везде появляется чудесный порядок». К сожалению, на данную систему в то время просто не обратили внимание.

Впервые, с необходимостью кодирования человечество столкнулось более 150 лет назад, вскоре после изобретения телеграфа. Каналы были дороги и ненадежны, что сделало актуальной задачу минимизации стоимости и повышения надежности передачи телеграмм. Используемая тогда схема была неудобна, а также пропускала двойные ошибки. С развитием каналов связи потребовался более эффективный механизм контроля.

Первым теоретическое решение проблемы передачи данных по зашумленным каналам (частично избавляющим человечество от предыдущих проблем) предложил Клод Шеннон, основоположник статистической теории информации. Существует множество версий кодов, построенных «по мотивам» Хэмминга, они различаются количеством проверочных битов, а также алгоритмами кодирования. Особое значение подобные коды приобрели в связи с развитием дальней космической связи с межпланетными станциями.

После того как я описал необходимые понятия, а также коротко рассказал о возникновении понятия кодирования, хотел бы выделить объект моей курсовой работы, цель, а также основные задачи.

Объект: процесс кодирования информации.

Цель: ознакомление с методами кодирования данных, выявление достоинств и недостатков этих методов.

Задачи:

  1. Проанализировать литературу по теории информации и кодированию данных.
  2. Выявить формы представления кодирования информации.
  3. Познакомиться с различными методами кодирования информации
  4. Выявить достоинства и недостатки методов кодирования данных
  5. Проанализировать кодирования информации на практическом примере

В своей курсовой работе я постараюсь использовать современные источники, в которых наиболее полно описана информация по кодированию данных. Хоть я и начал свою работe с истории, я постараюсь преподнести наиболее полную и актуальную на сегодняшний день информацию. Большинство источников информации, которые будут упомянуты, являются основными при изучении дисциплины «Технологии программирования» в различных вузах. Некоторые источники, покажут, что-то новое, а именно альтернативный взгляд авторов на решение проблем, возникающих при кодировании.

1. Кодирование информации

«Информация и кодирование - два основных понятия современной информационной техники. Информация в техническом смысле этого слова и методы защиты информации от ошибок, возникающие в результате передачи сообщений, являются сегодня основой при подготовки специалистов, работающих в области информационных технологий.» [5. Вернер М. Основы кодирования. Учебник для ВУЗов / М. Вернер —М.: Техносфера 2004 – C.3.].

Кодирование информации — одна из базовых тем курса теоретических основ информатики, отражающая фундаментальную необходимость представления информации в какой-либо форме, т.е. кодировании информации. При этом понятие «кодирование» воспринимается не в узком смысле — кодирование как способ сделать сообщение непонятным для всех, кто не владеет ключом кода, а в широком — как представление информации в виде сообщения на каком-либо языке. Большинство кодов основано на системах счисления. Система счисления – это система приемов и правил, позволяющих устанавливать взаимно-однозначное соответствие между любым числом и его представлением в виде совокупности конечного числа символов. [15. Савченко В. Ф. Кодирование информации: учебное пособие / Савченко В. Ф. - ВолгГТУ, Волгоград, 2008. – C.4.].

Вся информация, обрабатываемая, хранящаяся, и передаваемая по сетям компьютер представлена в виде двоичных чисел. [7. Грошев А. С. Информатика: Учебник для вузов / А.С. Грошев. – Архангельск, Арханг. гос. техн. ун-т, 2010. – C.15.].

До середины двадцатого средства и методы кодирования играли побочную роль, но с появлением компьютеров ситуация радикально изменилась. Кодирование находит довольно широкое применение в информационных технологиях и зачастую является основным вопросом при решении самых разных задач:

– представление данных произвольной природы (чисел, текста, графики) в памяти компьютера;

– оптимальная передача данных по каналам связи;

– защита информации (сообщений) от несанкционированного доступа;

– обеспечение помехоустойчивости при передаче данных по каналам связи;

– сжатие информации.

В первой главе я хотел бы рассмотреть основные методы кодирования различных видов информации.

На сегодняшний день существуют различные способы кодирования информации. Выбор способа зависит от вида информации, которую необходимо кодировать: текст, число, графическое изображение, звук или видео. [17. Шавенько Н.К. Основы теории информации и кодирования. Учебное пособие. / Н.К. Шавенько – М, Изд-во МИИГАиК, 2012 – C. 25]

1.1 Кодирование числовой информации

Числовая информация хранится и обрабатывается в компьютерах в двоичной системе счисления – числа представляются в виде последовательностей 0 и 1.

Существуют два вида чисел и два способа их представления: форма с плавающей точкой и форма с фиксированной точкой. Форма с плавающей точкой – для вещественных (действительных) чисел, форма с фиксированной точкой применяется для целых чисел.

ЭВМ оперирует с числами, содержащими конечное число двоичных цифр (разрядов). Количество разрядов ограничено длиной разрядной сетки машины. Под разрядной сеткой понимается совокупность двоичных разрядов, предназначенных для хранения и обработки машинных слов (двоичных кодов). Количество двоичных разрядов и положение запятой в разрядной сетке машины определяют такие важные характеристики ЭВМ, как точность и диапазон представляемых чисел. Кроме бита и байта, для указания длины формата чисел используется машинное слово, полуслово и двойное слово. Двойное слово и полуслово по-разному определяются для разных систем ЭВМ. Кроме того, может использоваться понятие тетрада – 4 двоичных разряда, которыми может кодироваться, например, одна двоичная цифра. Двоичные разряды в форматах формируются слева направо (начиная с нулевого разряда). [7. Грошев А. С. Информатика: Учебник для вузов / А.С. Грошев. – Архангельск, Арханг. гос. техн. ун-т, 2010. – C.22.]

Целые числа хранятся и обрабатываются в компьютере в двоичном формате. При вводе число записывается в привычной для нас десятичной системе счисления, а компьютер переводит его в двоичный код. В математике, как известно, целыми числами называют множество из натуральных чисел, противоположных им по знаку чисел и числа нуль. В вычислительной технике и программировании в связи с разным внутренним представлением различают целые числа без знака – unsigned integer и целые числа со знаком – signed integer. От представления зависит внутренний формат и диапазон значений чисел. Для хранения целого числа в оперативной памяти выделяется фиксированное число байтов: один, два, четыре или восемь. [18. Яшин В. Информатика: аппаратные средства персонального компьютера / В. Яшин – М.: ИНФРА-М, 2010 – 96 с.]

Целые числа без знака представляются в двоичной системе счисления, при этом диапазон значений изменяется от 0 до 2 n – 1, где n – количество двоичных разрядов. Так, если под число отводится 1 байт (8 бит), то оно может изменяться в диапазоне от 0 до 255, а если 2 байта (16 бит), то от 0 до 65535. Представление числа 58 при однобайтном размещении показано на рис. 5: 5810 = 1110102 и старшие 6-й и 7-й разряды обнуляются. Рис. 5. Представление числа 58 в формате без знака Целые числа со знаком представляются в компьютере иначе. Один, старший, двоичный разряд обозначает знак числа: 0 – неотрицательное число, 1 – отрицательное. Для кодирования отрицательных значений существует 0 0 1 1 1 0 1 0 Двоичная запись числа 1 0 Разряды: 7 6 5 4 3 2 старшие младшие 38 прямой, обратный и дополнительный код. Положительные значения изображаются одинаково в прямом, обратном и дополнительном кодах – двоичными кодами с цифрой 0 в знаковом разряд. [3. Берман Н. Д., Стригунов В.В., Шадрина Н.И Основы информатики: учеб. пособие / Н. Д. Берман, В. В. Стригунов, Н. И. Шадрина; [науч. ред. Э. М. Вихтенко]. – Хабаровск: Изд-во Тихоокеан. гос. ун-та, 2014. – С. 37.]

Для представления вещественных чисел используется логарифмическое представление, экспоненциальная форма или форма с плавающей точкой. Представление чисел с плавающей точкой — это представление числа с помощью двух чисел: мантиссы – числового значения числа и порядка – показателя степени, в которую надо возвести основание с.с., в которой представлено число. Форма представления чисел с плавающей точкой в общем виде: Х = ± М * q± p, где М – мантисса числа, q – основание с.с., р – порядок [15. Савченко В. Ф. Кодирование информации: учебное пособие / Савченко В. Ф. - ВолгГТУ, Волгоград, 2008. – C.15.].

Кодирование числовой информации является базисным, именно поэтому я начал свою курсовую работу с его изучения.

1.2 Кодирование текстовой информации

С начала семидесятых годов ЭВМ стали использоваться для обработки текстовой информации. Эта функция стала основной для современных ПК. При вводе в память компьютера текстовой информации происходит ее двоичное кодирование, пользователь нажимает на клавишу с символом, и в этот момент в память поступает последовательность из электрических импульсов (двоичный код символа).

Двоичный код символа хранится в оперативной памяти компьютера. В процессе вывода символа на экран компьютера производится декодирование, т.е. преобразование кода символа в его изображение. Традиционно, для того чтобы закодировать один символ, используется количество информации, равное 1 байту, т. е. I = 1 байту = 8 битам. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить, сколько различных символов можно закодировать (считая, что символы – это возможные события): К = 2I = 28 = 256, т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов. Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255. Первые 128 кодов (от 0 до 127) должны быть стандартными и обязательными для всех стран и всех компьютеров, а во второй половине (с кода 128 до кода 255) каждая страна может делать все, что ей угодно, и создавать в этой половине свой национальный стандарт. Первую половину таблицы кодов называют таблицей ASCII (American Standard Code for Information Interchange), ее ввел американский институт стандартизации ANSI. В этой таблице размещаются прописные и строчные буквы английского алфавита, символы чисел от 0 до 9, все знаки препинания, символы арифметических операций и некоторые другие специальные коды. За вторую половину кодовой таблицы (коды от 128 до 255) стандарт ASCII не отвечает. Разнличные страны могут создавать здесь свои таблицы. Зачастую бывает так, что даже в одной стране в этой половине действуют несколько разных стандартов, предназначенных для разных компьютерных систем. Тексты, кодированные при помощи одной таблицы, не будут правильно отображаться в другой кодировке. Одному двоичному коду ставятся в соответствие разные символы. [10. Епифанцева М. Я., Т.А. Мызникова Кодирование информации в персональном компьютере: Учебно-методическое пособие: В 2-х ч. / М.Я. Епифанцева., Т.А. Мызникова – Омск: Изд-во СибАДИ, 2006. – Ч. 2. – C.22.] Для решения данной проблемы в 1991 компанией Unicode Consortium году был предложена новая кодировка – Unicode.

Unicode резервируют 1114112 (220+216) символов кода, в настоящее время используются более 96000 символов. Первые 256 кодов символов соответствуют таковым ISO 8859-1, наиболее популярной 8-разрядной таблицы символов «западного мира»; первые 128 символов также идентичны таблице ASCII.

Unicode мало подходит для непосредственной̆ передачи по сети – байты в тексте вполне могут приходиться на область управляющих символов, поэтому обычно применяются две другие основанные на Unicode кодировки переменной длины, обозначаемые как UTF (Unicode Transformation Format): 7битная UTF-7 и 8-битная UTF-8. В каком-то смысле они уже не являются языковыми кодировками, а являются программно-распознаваемым кодом относительно исходного Unicode, но зарегистрированы они именно как кодировки, наравне с ISO 8859-5 или KOI8-R.

В UTF-8 все символы разделены на несколько групп по значению первых битов. Символы с кодами менее 12810 кодируются одним байтом, первый̆ битом которого равен нулю, а последующие 7 бит в точности соответствуют 128 символам 7-й таблицы ASCII (см. таблицу 1.2), следующие 1920 символов – двумя байтами (Greek, Cyrillic, Coptic, Armenian, Hebrew и Arabic символы). Последующие символы кодируются тремя и четырьмя байтами. [7. Грошев А. С. Информатика: Учебник для вузов / А.С. Грошев. – Архангельск, Арханг. гос. техн. ун-т, 2010. – C.19.].

Стандарт кодирования символов Unicode стал доминирующим в интернациональных программных многоязычных средах. Microsoft Windows используют Unicode UTF-16, как внутреннее представление текста. Операционные системы типа Mac OS X, Linux, BSD и приняли UTF-8, как основное представления многоязычного текста.

1.3 Кодирование графической информации

В наше время довольно часто используются технологии обработки графической информации с помощью компьютера. Наиболее интенсивно технология обработки графической информации с помощью ПК стала развиваться в восьмидесятых годах.

Вся графическая информация представлена в двух формах: аналоговой или цифровой (дискретной). Хорошим примером аналогового представления может быть нарисованная художником картина, а изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета, – это дискретное представление. Преобразование графической информации из аналоговой формы в дискретную происходит путем пространственной дискретизации (разбиения) графического изображения. При этом производится кодирование – присвоение каждому элементу конкретного значения в форме кода. В процессе дискретизации изображение разбивается на отдельные маленькие фрагменты (пиксели), каждому пикселю присваивается значение его цвета, т.е. код цвета (зеленый, синий, красный и т.д.).

Качество кодирования изображения зависит от двух параметров. Во-первых, качество кодирования изображения тем выше, чем меньше размер точки и соответственно большее количество точек составляет изображение. Во-вторых, чем большее количество цветов, т.е. большее количество возможных состояний точки изображения, используется, тем более качественно кодируется изображение (каждая точка несет большее количество информации). Используемый набор цветов образует палитру цветов.

Одним байтом можно закодировать 256 различных цветов. Такой метод кодирования цвета называется индексным. В принципе, этого недостаточно для полноцветных изображений живой природы. Человеческий глаз может различать десятки миллионов цветовых оттенков.

65536 различных цветов можно закодировать 2 байтами. Это уже похоже на то, что мы видим на фотографиях и на картинках в журналах, но все равно хуже, чем в живой природе. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color. [10. Епифанцева М. Я., Т.А. Мызникова Кодирование информации в персональном компьютере: Учебно-методическое пособие: В 2-х ч. / М.Я. Епифанцева., Т.А. Мызникова – Омск: Изд-во СибАДИ, 2006. – Ч. 2. – C. 24.].

Если для кодирования цвета одной точки использовать 3 байта (24 бита), то количество возможных цветов увеличится еще в 256 раз и достигнет 16,5 миллиона. Этот режим позволяет хранить, обрабатывать и передавать изображения, не уступающие по качеству наблюдаемым в живой природе. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color). Используемое количество битов для кодирования цвета точки называют глубиной цвета. Как известно, цветовые рецепторы человека, подразделяются на три группы, причем каждая может воспринимать всего один цвет – красный, зеленый, или синий. Поэтому цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого и синего. Такая цветовая модель называется RGB моделью, по первым буквам английских названий цветов (Red, Green, Blue).

Если мы кодируем цвет точки с помощью трех байтов, то первый байт выделяется красной составляющей, второй – зеленой, а третий – синей. Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности. Чем больше значение байта цветовой составляющей, тем ярче этот цвет.

Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек (пикселей). [10. Епифанцева М. Я., Т.А. Мызникова Кодирование информации в персональном компьютере: Учебно-методическое пособие: В 2-х ч. / М.Я. Епифанцева., Т.А. Мызникова – Омск: Изд-во СибАДИ, 2006. – Ч. 2. – C.23-24.].

Векторное изображение представляется в виде комбинации простых геометрических фигур, так называемых примитивов – точек, отрезков, окружностей, прямоугольников и т. п. Каждый элемент векторного изображения можно описывать с помощью математических формул (уравнения линий, дуг, окружностей и т.д.).

Векторные изображения создаются специальными программами, например, встроенным в Microsoft Word редактором рисунков, системой AutoCAD и другими. Программы векторной графики используются для рисунков, которые легко представить в виде комбинации простейших фигур, например, технические чертежи, схемы, логотипы, шрифты и т.п. У векторной графики много достоинств. Она экономна в плане дискового пространства, необходимого для хранения изображений: это связано с тем, что сохраняется не само изображение, а только некоторые основные данные, используя которые, программа всякий раз воссоздает изображение заново. [8. Гуркова М.А., Назаренко С.Н., Резникова Э.Р., Смирнов В.Ю., Смирнова О.В. Информатика: Конспект лекций по курсу «Информатика» / М.А. Гуркова, С.Н. Назаренко, Э.Р. Резникова, В.Ю. Смирнов, О.В. Смирнова – М: МИИТ, 2008. – C.54]

Основным преимуществом векторной графики является возможность легкой модификации объектов без потери качества. Масштабирование, поворот, искривление могут быть сведены к двум, трем простейшим преобразованиям над векторами. Главным же недостатком является ограничение в живописных средствах: в программах векторной графики практически невозможно создавать фотореалистические изображения.

1.4 Кодирование звуковой информации

Звук – колебание частиц воздуха, непрерывный сигнал с меняющейся амплитудой. При кодировании звука этот сигнал надо представить в виде последовательности нулей и единиц. Если преобразовать звук в электрический сигнал (используя микрофона), мы сможем увидеть плавно изменяющееся с течением времени напряжение. Будем измерять напряжение через одинаковые промежутки времени и записывать полученные значения в память компьютера. Этот процесс называется дискретизацией, а устройство, выполняющее его – АЦП (аналого-цифровым преобразователем). [16. Топильский В.Б. Cхемотехника аналого-цифровых преобразователей. Учебное издание Москва: ТЕХНОСФЕРА, 2014 – c.32]. Для того чтобы воспроизвести закодированный таким методом звук, нужно выполнить обратное преобразование, для этого используется цифро-аналоговый преобразователь – ЦАП, а затем сгладить получившийся ступенчатый сигнал. Чем выше частота дискретизации и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук. Но при этом размер звукового файла увеличивается. [12. Ковалгин Ю.A., Вологдин Э.И. Цифровое кодирование звуковых сигналов / Ю.A. Ковалгин, Э.И. Вологдин — Изд-во Kорона-принт, 2004. – с.76]

Человек уже давно использует довольно компактный способ представления музыки – нотную запись. В ней специальными символами указывается на каком инструменте сыграть, какой высоты звук, и как его сыграть. Нотную запись можно считать алгоритмом для музыканта, записанным на особом формальном языке. В 1983 г. ведущие производители музыкальных синтезаторов и компьютеров разработали стандарт, определивший такую систему кодов. Он получил название MIDI. Существуют и другие, чисто компьютерные, форматы записи музыки. Среди них следует отметить формат MP3, позволяющий с хорошим качеством и высокой степенью сжатия кодировать звуковую информацию. [8. Гуркова М.А., Назаренко С.Н., Резникова Э.Р., Смирнов В.Ю., Смирнова О.В. Информатика: Конспект лекций по курсу «Информатика» / М.А. Гуркова, С.Н. Назаренко, Э.Р. Резникова, В.Ю. Смирнов, О.В. Смирнова – М: МИИТ, 2008. – C.56]

Существуют и чисто компьютерные форматы записи музыки. Среди них следует отметить наиболее популярный формат - MP3, позволяющий с хорошим качеством и высокой степенью сжатия кодировать звуковую информацию. MP3, он же MPEG-1 Layer 3 — стандарт сжатия аудиоинформации с потерями. Главной целью при создании стандарта было обеспечение максимально «идентичного» исходному звука, а также сведение к минимуму объема хранимых данных. Для этого была создана оригинальная схема кодирования — на первом этапе оцифрованный звук разбивается на частотные составляющие, которые проходят через ряд фильтров.

В формате MP3 в отличии от ранее существовавших стандартов появилась фильтрация. Разработчики стандарта создали так называемую психоакустическую модель (ПА-модель) — модель, в которой учитываются особенности человеческого слуха, и на основании этого из аудиосигнала отфильтровываются те частоты, отсутствие которых слух почти не замечает. На 2 этапе полученный поток кодируется по алгоритму Хаффмена со статической таблицей. Результат является потоком MP3. [1. Артюшенко А.В., Шелухин О.И, Афонин М. Ю. Цифровое сжатие видеоинформации и звука/ А.В. Артюшенко – М.: “Дашков и Ко”, 2003 – с. 183]

Ширина потока — битрейт определяет, сколько бит необходимо для кодирования 1 секунды музыки. Стандарт MP3 регламентирует потоки от 8kbit/s до 320kbit/s. Чем больше битрейт, тем больше деталей звука удается сохранить, тем он звучит реалистичнее. [6. Вологдин Э.И. Компрессирование Аудио Сигналов в формате MP3: Конспект лекций / Э.И. Вологдин – Санкт Петербург 2012 — С. 3]

В выборе битрейта при кодировании приходится чем-либо жертвовать — либо качеством в пользу малого размера, либо размером в пользу качества. Самый простой режим сжатия MP3 — это режим с постоянным битрейтом (CBR, Constant BitRate). Наиболее популярным сейчас является битрейт - 192 kbps. Именно используя его, мы можем получить достойный звук, но при этом готовый файл не будет занимать большой объём жесткого диска.

1.5 Кодирование видеоинформации

Видеоинформация – это очень сложный вид для хранения, обработки и воспроизведения. Впервые движущиеся изображения были сохранены на кинопленке в виде большого количества отдельных кадров изображения, снятых через короткие промежутки времени (24 кадра в секунду). Позднее на ту же самую пленку стала записываться и звуковая дорожка. В результате появилось телевидение с аналоговой записью движущегося изображения на магнитные ленты (системы телевидения SECAM и PAL используют 25 кадров в секунду, система NTSC - 29,97 кадров в секунду). С появлением компьютеров широкое распространение получили цифровые методы записи и кодирования видеоинформации, которые постоянно совершенствуются. В наше время время каждый может записать видео с использованием мобильных телефонов, цифровых видеокамер и выполнить монтаж видеофильма на ПК, производительности которых вполне достаточно для перекодирования видео высокого разрешения, однако продолжительность кодирования может составлять несколько часов.

Компьютерные цифровые методы кодирования видео могут использовать частоту телевизионных стандартов SECAM/PAL или NTSC, т. к. видеозаписи многих цифровых форматов могут воспроизводиться специальными компьютерными программами, а также путем подключения телевизора к компьютеру по средствам порта HDMI). [7. Грошев А. С. Информатика: Учебник для вузов / А.С. Грошев. – Архангельск, Арханг. гос. техн. ун-т, 2010. – C.29.].

Алгоритмы сжатия видеоинформации активно эксплуатируют ранзые типы избыточности, естественным образом им присущие. При использовании информационной избыточности можно достичь более чем двукратного сжатия данных. При использовании избыточности в смысле восприятия зрительной системой человека можно достичь гораздо больших величин коэффициента сжатия. Известно, что пространственно- высокочастотные детали зрительных образов менее важны для качества восприятия изображения, чем крупные пространственно-низкочастотные, из этого следует, что высокочастотные составляющие можно устранить из изображения, внося информационные потери, но незначительно ухудшая качество восприятия. В составляющих цветности такие искажения заметны значительно меньше, чем в яркостной составляющей. Воспроизводимое видео представляется в виде последовательно сменяющих друг друга изображений с заданной частотой. Для видеоинформации алгоритмы сжатия используют идею межкадровой избыточности. Сжатию подвергается разница между соседними кадрами, а не видеокадр в целом. Благодаря такому подходу удается достичь гораздо более высоких коэффициентов сжатия, т.к. разница между видеокадрами в общем случае очень мала из-за незначительного временного интервала. [9. Дворкович А.В., Дворкович В. П. Цифровые видеоинформационные системы (теория и практика)/ А.В. Дворкевич -М: ТЕХНОСФЕРА, 2012 -1009 - 380с. В дополнение к сокращению межкадровой избыточности используются различные механизмы предсказаний изменений в видеопоследовательности. Это приводит к уменьшению необходимости сжимать и сокращать всю извлекаемую информацию. Наиболее известные на сегодняшний день алгоритмы сжатия видео H.264, H.265, H.265 + и группа MPEG-2, MPEG-4. Все они используют гибридную модель, основанную на дискретном косинусном преобразовании для устранения пространственной внутрикадровой избыточности и дифференциальной импульсно-кодовой модуляции для удаления межкадровой избыточности. В 2013 г. появился новый стандарт сжатия видеоизображений H.265. Он позволил вдвое сократить необходимую для передачи видеоинформации пропускную способность каналов. [13. Козин И.Д., Федулина И.Н. Методы сжатия видеоинформации: Учебное пособие (для магистрантов специальности «Радиотехника, электроника и телекоммуникации»)/И.Д. Козин, И.Н. Федулина – Алматы: АУЭС, 2015. – C.76]

Рассмотрев основные методы кодирования различных видов информации в ПК, мы можем прийти к выводу, что главная цель кодирования - преобразование информации в вид, более удобной для хранения, передачи или обработки. Также не менее важным результатом кодирования информации является сжатие (многократное уменьшение размера информации).

Для кодирования различных типов информации используются различные методы, но несмотря на это у них есть нечто общее: вся закодированная информация представляется в виде 0 и 1.

Проанализировав различные системы кодирования, мы можем увидеть, что у них есть недостатки, которые устраняются в процессе совершенствования. Это происходит за счёт появления новых методов кодирования информации.

2. Применения кодирования в коммерческой деятельности

За последние десятилетия в связи с внедрением ЭВМ выросла значимость кодирования информации. Кодирование облегчает обработку технико-экономической информации с помощью ЭВМ

Код должен иметь определенную структуру построения. Структура кода состоит из следующих элементов:

- длина кода – характеризуется числом знаков в коде.

- алфавит кода – это система знаков, принятых для образования кода; наиболее часто используется буквенный, цифровой, буквенно-цифровой и штриховой алфавиты кода;

- основание кода – это число знаков в алфавите кода;

- разряд кода – это позиция знака в коде;

При кодировании продукции предпочитают код десятиразрядный цифровой. Применяемый в ОПК код удобен для машинной обработки информации.

На данный момент известно несколько технологий автоматической идентификации: штриховое кодирование, радиочастотные системы, оптическое распознавание знаков, машинное зрение, речевой ввод данных.

Наибольшее распространение получило штриховое кодирование. Штриховой код (Приложение 1) – это символ, состоящий из четкого рисунка штрихов и промежутков между ними, соответствующий машинному коду букв и чисел в двоичной системе. Такой код легче считывать, чем буквы и цифры. [11. Ишдавлетова Э.Т. Методическое пособие по дисциплине Автоматизация технологических процессов почтовой связи/ Э.Т. Ишдавлетова – Ташкент, 2006 – с.3]

Процесс управления товародвижением как составная часть коммерческой деятельности требует информационного обеспечения. Для любого предприятия наличие данных о характере продукции, ее происхождении, оперативность получения информации о товаропотоках и правилах их учета жизненно необходимы. Эта проблема всегда стояла перед фирмами и предприятиями. В этих условиях встал вопрос о разработке новой системы идентификации - штрихового кодирования.

2.1 Линейное штриховое кодирование

Линейными называются штрих-коды, которые читаются в одном направлении. В подобном коде символ представлен последовательностью знаков, выстроенных в одну линию. Обычный одномерный штрих-код содержит от 20 до 30 символов на дюйм. Линейные символики позволяют кодировать небольшой объём информации.

Наиболее популярными являются следующие линейные символики: EAN, UPC (UPC-A, UPC-E), Код 39, Код «2 из 5» (Interleaved 2-of-5), Codabar, 27. Линейные символики позволяют кодировать небольшой объем информации (до 20-30 символов ) с помощью несложных штрих-кодов, читаемых недорогими сканерами.

Линейные штрих-коды – самая распространенная из технологий автоматической идентификации. В настоящее время штриховые коды EAN/UPC лежат в основе всемирной многоотраслевой коммуникационной системы, создание которой обеспечивается двумя крупнейшими специализированными международными организациями – EAN International и AIM Global.

Штриховой код символики UPC/EAN предназначен для кодирования

цифровой информации и является одним из основных машиночитаемых носителей данных в рамках международной системы EAN•UCC. [20. Межгосударственный стандарт. Автоматическая идентификация. Кодирование штриховое. Спецификация символики EAN/UPC (ЕАН/ЮПиСи) http://docs.cntd.ru/document/1200028884 (Дата обращения: 04.03.2020)]

Символики штрихового кода Code 128 и Код 39, наряду с символиками EAN/UPC и Interleaved 2 of 5 в наше время являются самыми распространенными в мире среди линейных символик, в которых символ представлен последовательностью знаков символа штрихового кода, выстроенных в одну линию. Но в отличие от EAN/UPC и Interleaved 2-of-5 эти символики позволяют кодировать не только цифровую информацию, но и данные, содержащие латинские буквы и специальные графические знаки.

«Код 128» является непрерывным, обладает свойствами самоконтролируемости и двунаправоленности декодирования. Каждый знак состоит из трех штрихов и трех пробелов, распределенных в 11 модулях, соответствующих ширине наиболее узкого элемента. Ширина любого элемента принимает значение от одного до четырех модулей. Для каждого знака сумма ширин штрихов в модулях должна быть четной, а для пробелов - нечетной. Знак «Стоп» имеет ширину 13 модулей. Весь набор знаков кода 128 распределен в трех наборах знаков (А, В, С): в первом кодируются цифры, прописные латинские буквы, специальные графические символы и управляющие символы, во втором вместо управляющих символов включены строчные латинские буквы, а в третьем представлены только пары чисел от 00 до 99. В каждом наборе содержится от трех до семи специальных знаков для управления считывающим устройством. Набор «Кода 128» имеет три знака «Старт» и один знак «Стоп». Контрольный знак является неотъемлемой частью символа штрихового кода. [2. Белов Г. В., Ерохин Б.Т., Варфоломеев В.П. Информационные технологии предпринимательства: Учебник для вузов/ Г. В. Белов, Б. Т. Ерохин, В. П. Варфоломеев – М.: ИКЦ «Академкнига», 2005 -C.126].

2.2 Двумерное штриховое кодирование

Длительное время линейные штриховые коды продвигали в качестве машиночитаемых регистрационных знаков. Каждый знак при этом содержал уникальный серийный номер, закодированный с использованием чёрных и белых штрихов, который являлся ключом к базе данных, содержащей подробную информацию. Со временем человечеству стало требоваться кодирование большего количество информации. Потребители хотели, чтобы штриховые коды являлись своего рода портативной базой данных, а не просто ключом к ней.

Тенденция к созданию портативных баз данных появилась в 1984 г., когда AIAG (Automotive Industry Action Group) опубликовала стандарт приложения в отношении идентификационных меток для автозапчастей при транспортировке, которые состояли из четырех стековых штрих-кодов Code 39. Эти штриховые коды содержали номер запчасти, количество, имя поставщика и серийный номер.

Первый двумерный штрих-код был представлен в 1988 г. Intermec Corporation, когда они объявили о введении Code 49. Этого были разработаны или модернизированы шесть других кодов, отвечавших потребности вместить портативную базу данных в максимально малое пространство. [14. Петрище, Ф.А. Теоретические основы товароведения и экспертизы непродовольственных товаров: учеб. для вузов по спец. "Товаровед. и экспертиза товаров" / Ф.А. Петрище. - М.: Дашков и К, 2009. – с 98]

В настоящее время для описания этого нового класса используются несколько терминов. Двумерный код является общим для всего данного класса.

Линейный штриховой код является вертикально избыточным, то есть информация в нём повторяется в вертикальном измерении. Верхняя часть штрихов может быть убрана без потери информации. Однако вертикальная избыточность позволяет считывать символы с полиграфическими дефектами, например, пятнами или пробелами. Чем выше штрихи, тем больше вероятность, что хотя бы одну полосу штрихового кода можно считать.

Двумерный код хранит информацию по всей длине и высоте символа. Если задуматься, то можно заметить, что все созданные людьми алфавиты представляют собой двумерный код. Оба измерения содержат информацию, по крайней мере, часть вертикальной избыточности становится ненужной. В таком случае необходимо использовать другие методы для предотвращения неправильного считывания, а также для обеспечения приемлемого коэффициента успешного считывания. Вначале двумерные символики разрабатывались для применения только в случаях, когда идентификационный символ необходимо было разместить на небольшом пространстве. Впервые эти символы были применены в медицинской промышленности на упаковках, содержащих лекарственные средства в дозах на один прием. Эти упаковки отличались маленькими размерами, и там совсем не было места для размещения штрихового кода. Представители электронной промышленности также с самого начала проявили интерес к высокоплотным двумерным символикам, так как в электронных схемах чрезвычайно мало свободного места.

Сравнительно недавно возможность кодировать портативные базы данных сделала двумерные символики популярными даже в тех областях, где наличие свободного пространства для размещения кода не главное. Один из примеров - хранение информации об адресе, имени и демографических данных при почтовой рассылке.

Среди двумерных кодов я бы хотел рассмотреть набирающий популярность в современном мире код - QR-код (Приложение 2). Его название пошло от английского словосочетания quick response - быстрый отклик). QR-код был разработан японской компанией "Denso-Wave" в 1994 году.

Главным достоинством QR-кода является легкое распознавание сканирующим оборудованием, что дает возможность использования в торговле, производстве, логистике. QR-коды больше всего распространены в Японии, стране, где штрих-коды пользовались такой большой популярностью, что объём информации, зашифрованной в коде, вскоре перестал устраивать индустрию. Японцы начали экспериментировать с новыми способами кодирования небольших объёмов информации в графической картинке. Уже в начале двух тысячного года QR-коды получили широкое распространение в Японии, их можно было встретить на большом количестве плакатов, упаковок и товаров.

Максимальное количество символов, помещаемых в один QR-код:

цифры – 7089,

двоичный код - 2953 байт,

цифры и буквы – 4296,

иероглифы - 1817. [19. Иванова Н.А., Бекезина К.М. Развитие и возможности технологий QR-кодирования в современном мире // Современные научные исследования и инновации. 2015. № 11 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2015/11/59467 (дата обращения: 04.03.2020).]

Закодировать информацию в QR-код можно несколькими способами, а выбор конкретного способа зависит от того, какие символы используются. Если используются только цифры от 0 до 9, то можно применить цифровое кодирование, если кроме цифр необходимо зашифровать буквы латинского алфавита, пробел и символы ±*/$%*.:, используется алфавитно-цифровое кодирование. Ещё существует кодирование кандзи, которое применяется для шифрования китайских и японских иероглифов, и побайтовое кодирование. Перед каждым способом кодирования создаётся пустая последовательность бит, которая затем заполняется.

На QR-коде есть обязательные поля, они не несут закодированной информации, а содержат информацию для декодирования. Это: Поисковые узоры, полосы синхронизации, выравнивающие узоры, код маски и уровня коррекции, код версии, а также обязательный отступ вокруг кода.

Помимо этого, QR-код содержит дополнительные данные, которые необходимы для корректного распознавания информации программами-сканерами мобильных телефонов:

  1. Номер версии. QR-код содержит всю информацию об используемой версии кода – в настоящее время их количество уже достигло сорока.
  2. Синхронизация. Между тремя позиционными метками проходит пунктирная линия, которая задает модель матрицы. 
  3. Позиционирование. Данная метка, расположенная в трех углах рисунка, позволяет сканирующему устройству распознавать положение QR-кода и быстрее запускать процесс сканирования. На
  4. Направление. Данная метка помогает сканирующему устройству определять, какие искажение перспективы имеет QR-код.
  5. Формат. С помощью этой информации сканирующее устройство определяет используемый формат данных. Например то, что именно скрывается в коде: календарная запись, контактные данные или ссылка на ресурс в Интернете. 

В настоящее время QR-код довольно широко распространен в странах Азии. Постепенно он развивается в Северной Америке и Европе. Наибольшее признание QR-код получил среди пользователей мобильной связи - установив программу, распознающую QR-код, абонент может моментально заносить в свой телефон текстовую информацию, добавлять контакты в адресную книгу, переходить по web-ссылкам, отправлять SMS-сообщения и т.д. [4. Бугаев Л. Мобильный маркетинг: как зарядить свой бизнес в мобильном мире / Леонид Бугаев. — М.: Альпина Паблишер, 2012 – 153с.]

В Японии практически на всех товарах, продающихся в магазинах нанесены подобные коды, их размещают в рекламных буклетах и справочниках.

Японские операторы сотовой связи совместно выпускают под своим брендом мобильные телефоны со встроенной поддержкой распознавания QR-кода.

В нашей стране QR-код с каждым днем обретает всё большую популярность. Наиболее ярким примером является мобильное приложение “Градусник”, которым пользуются сотрудники компании Газпром нефть. Данное приложение было разработано с целью противодействия распространению COVID-19 и мониторинга здоровья сотрудников. Приложение интегрировано с корпоративной медицинской системой и помогает оказывать поддержку сотрудникам при заболеваниях, а также исключает риски прохода в офисы и на производство работников без теста на коронавирус. Основной функцией в «Градуснике» является предоставление сотруднику персонального QR-кода, который необходимо предъявлять при входе на объектах компании. После сканирования кода программа получает информацию из базы данных о результатах тестов сотрудника на коронавирус и проверяет отсутствие других корпоративных ограничений, после чего разрешает доступ в офис или на производственную площадку. Данное решение сильно упрощает процедуру допуска работников к рабочим площадкам, но при этом является полностью безопасной в плане возможного взлома.

Заключение

Кодирование — это процесс, в результате которого происходит формирование определенного представления информации.

Компьютер обрабатывает только ту информацию, которая представлена в числовой форме. Любая другая информация (видео, изображение, звуки, и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. К примеру, для того чтобы перевести в числовую форму музыкальный звук, нужно через короткие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме

Также на ПК можно обрабатывать текстовую информацию. Каждая буква при вводе в компьютер кодируется определенным числом, а при выводе на внешние устройства по этим числам строятся изображения букв.

Проанализировав различные источники информации и ознакомившись с методами кодирования данных, мы можем сделать определенные выводы. Несмотря на то, что на данный момент существует множество способов кодирования информации, мы можем выделить основную проблему, возникающую при кодировании, которая является спутником любого из них. Данной проблемой является постоянно увеличивающийся информационный поток, в следствие чего человечеству приходится с каждым годом придумывать все более эффективные способы кодирования.

Технологии не стоят на месте, в результате чего мы наблюдаем информационный прогресс, например, если раньше мы могли смотреть видео только в низком качестве, то сейчас приобретает наибольшую популярность именно форматы высокого качества, для кодирования которого требуется совершенно иные методы.

Ещё одним недостатком является изменение качества в результате кодирования (например качество видеоинформации), зачастую происходит ухудшение характеристик

Во второй части своей работы я рассмотрел практическое применение кодирования информации в коммерческой деятельности, а именно штриховое кодирование. Этот вид кодирование получил огромное распространение в современном обществе. Все торговые сети его используют, но самым интересным и перспективным на данной момент для меня показался именно QR-code. Это абсолютно простой метод кодирования, который позволяет не только сократить время обработки, но и вмещает в себя огромное количество информации, занимая при этом минимальное количество места. Сам QR-code представляет собой небольшую картинку. Он не только включает в себя различную информацию, но и является гиперссылкой, благодаря которой мы можем узнать всё о конкретном объекте.

Список использованных источников

  1. Артюшенко А.В., Шелухин О.И, Афонин М. Ю. Цифровое сжатие видеоинформации и звука/ А.В. Артюшенко – М.: “Дашков и Ко”, 2003 – 426 с.
  2. Белов Г. В., Ерохин Б.Т., Варфоломеев В.П. Информационные технологии предпринимательства: Учебник для вузов/ Г. В. Белов, Б. Т. Ерохин, В. П. Варфоломеев – М.: ИКЦ «Академкнига», 2005. – 432 с.
  3. Берман Н. Д., Стригунов В.В., Шадрина Н.И Основы информатики: учеб. пособие / Н. Д. Берман, В. В. Стригунов, Н. И. Шадрина; [науч. ред. Э. М. Вихтенко]. – Хабаровск: Изд-во Тихоокеан. гос. ун-та, 2014. – 76 с.
  4. Бугаев Л. Мобильный маркетинг: как зарядить свой бизнес в мобильном мире / Леонид Бугаев. — М.: Альпина Паблишер, 2012 – 214 с.
  5. Вернер М. Основы кодирования. Уебник для ВУЗов / М. Вернер —М.: Техносфера 2004 – 288 с.
  6. Вологдин Э.И. Компрессирование Аудио Сигналов в формате MP3: Конспект лекций / Э.И. Вологдин – Санкт Петербург 2012 — 15 с.
  7. Грошев А. С. Информатика: Учебник для вузов / А. С. Грошев– Архангельск, Арханг. гос. техн. ун-т, 2010 – 470 c.
  8. Гуркова М.А., Назаренко С.Н., Резникова Э.Р., Смирнов В.Ю., Смирнова О.В. Информатика: Конспект лекций по курсу «Информатика» / М.А. Гуркова, С.Н. Назаренко, Э.Р. Резникова, В.Ю. Смирнов, О.В. Смирнова. – М: МИИТ, 2008 – 116 с.
  9. Дворкович А.В. Дворкович В. П. Цифровые видеоинформационные системы (теория и практика)/ А.В. Дворкевич -М: ТЕХНОСФЕРА, 2012 -1009 1009 с.
  10. Епифанцева М. Я., Мызникова Т.А. Кодирование информации в персональном компьютере: Учебно-методическое пособие: В 2-х ч. / М. Я. Епифанцева, Т.А. Мызникова – Омск: Издательство СибАДИ, 2006. – Ч. 2. – 33 с.
  11. Ишдавлетова Э.Т. Методическое пособие по дисциплине Автоматизация технологических процессов почтовой связи / Э.Т. Ишдавлетова – Ташкент, 2006 – 69 с.
  12. Ковалгин Ю.A., Вологдин Э.И. Цифровое кодирование звуковых сигналов / Ю.A. Ковалгин, Э.И. Вологдин — Изд-во Kорона-принт, 2004. – 240с.
  13. Козин И.Д., Федулина И.Н. Методы сжатия видеоинформации: Учебное пособие (для магистрантов специальности «Радиотехника, электроника и телекоммуникации»)/И.Д. Козин, И.Н. Федулина – Алматы: АУЭС, 2015. – 80 с.
  14. Петрище, Ф.А. Теоретические основы товароведения и экспертизы непродовольственных товаров: учеб. для вузов по спец. "Товаровед. и экспертиза товаров" / Ф.А. Петрище. - М.: Дашков и К, 2009. - 509 с.
  15. Савченко В. Ф. Кодирование информации: учебное пособие / В. Ф. Савченко - ВолгГТУ, Волгоград, 2008. – 64 с
  16. Топильский В.Б. Cхемотехника аналого-цифровых преобразователей. Учебное издание / В.Б. Топильский – М.: ТЕХНОСФЕРА, 2014 – 288 c.
  17. Шавенько Н.К. Основы теории информации и кодирования. Учебное пособие. / Н.К. Шавенько – М, Изд-во МИИГАиК, 2012 – 125 с.
  18. Яшин В. Информатика: аппаратные средства персонального компьютера / В. Яшин – М.: ИНФРА-М, 2010 – 254 с.
  19. Иванова Н.А., Бекезина К.М. Развитие и возможности технологий QR-кодирования в современном мире / Современные научные исследования и инновации. 2015. № 11 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2015/11/59467 (дата обращения: 04.03.2020).
  20. Межгосударственный стандарт. Автоматическая идентификация. Кодирование штриховое. Спецификация символики EAN/UPC (ЕАН/ЮПиСи) [Электронный ресурс] http://docs.cntd.ru/document/1200028884 (Дата обращения: 04.03.2020)

Приложения

Приложение 1

Штрих-код

Рисунок взят с ресурса https://markerovka.ru/pechat_shtrih.html

Приложение 2

QR-код “Музей кузнечного мастерства” в Тюмени

Рисунок взят с ресурса http://firms.city/russia/muzey-kuznechnogo-masterstva