Преподаватель который помогает студентам и школьникам в учёбе.

Методы кодирования данных

Содержание:

Введение

Любой информационный объект можно сохранить разными способами. Самым простым является графический либо изобразительный вид. Именно так первобытные люди пытались передавать из поколения в поколение информацию о природных явлениях, объектах. До нашего времени сохранить некоторые наскальные рисунки, сделанные первобытными людьми. Потом их сменили картины, схемы, фотографии, чертежи.

Для более качественного обмена данными одновременно осуществляется кодирование и обработка информации на стороне передатчика (подготовка данных и преобразование их в форму, удобную для трансляции, обработки и хранения), пересылка и декодирование на стороне приемника (преобразование кодированных данных в исходную форму). Это взаимосвязанные задачи: источник и приемник должны обладать сходными алгоритмами обработки сведений, иначе процесс кодирования-декодирования будет невозможен. Кодирование и обработка графической и мультимедийной информации обычно реализуются на основе вычислительной техники.

Под кодированием информации в компьютере понимается процесс ее преобразования в форму, позволяющую организовать более удобную передачу, хранение или автоматическую переработку этих данных. С этой целью используются различные таблицы. Кодирования информации - проблема, имеющая достаточно давнюю историю, гораздо более давнюю, нежели история развития вычислительной техники, которая обычно шла параллельно с историей развития проблемы сжатие и шифровки информации.

Цель курсовой работы провести анализ методов кодирования данных.

Для достижения поставленной цели были сформулированы следующие задачи:

- изучить способы представления информации в ЭВМ, общие понятия кодирования и методы кодирования;

- исследовать основные примеры кодирования;

- рассмотреть способы кодирования и декодирования информации числовой, текстовой и графической.

Объектом исследования курсовой работы является способы предоставления информации в ЭВМ

Предметом исследования является методы кодирования данных

В процессе исследовательской работы были применены совокупность методов сравнительно-правового анализа, классификаций и обобщений, а также описания - один из важных методов изучения рассматриваемого вопроса.

Структурная работа состоит из введения, трех глав, заключения, содержащего основанные на результатах проведенного исследования выводы, библиографического списка.

Глава 1 Передача информации в ЭВМ

Окружающий мир заполнен информацией. Ежесекундно через органы чувств человек получает сотни сигналов и сообщений. Столь значимую составляющую жизни невозможно оставить без внимания, появилась даже специальная область знаний, специализирующаяся на информационных процессах и явлениях, – информатика. Ее основное оружие – умные электронно-вычислительные машины, способные быстро и точно анализировать данные и манипулировать ими. Способы представления информации в ЭВМ отличаются от тех, к которым мы привыкли, и обеспечивают максимальную эффективность вычислительного процесса.

Информация – понятие глобальное, дать ее всеохватное определение затруднительно. До сих пор не существует единого общенаучного термина, каждая область знаний оперирует собственным представлением об информации. Для простоты можно определить ее как данные о состоянии окружающего мира во всех его проявлениях^[1].

Информация имеет смысл лишь тогда, когда ее кто-нибудь воспринимает или использует. В отличие от энергии или массы, которые, как известно, не пропадают, а лишь трансформируются, информация вполне может исчезнуть.

Основная задача информатики – научиться собирать, хранить и передавать данные. Реализация этого – дело непростое. Информация бывает разная, и каждый ее вид требует к себе особого подхода.

1.1 Виды информации

На сегодняшний день люди научились работать с огромным разнообразием данных, отличающихся природой происхождения и структурой.

Самые востребованные виды информации:

1.Графическая информация – это самый первый вид данных, которым человечество научилось манипулировать. Она доступна для восприятия и не требует особенных преобразований. Наскальные рисунки – древнейшее хранилище информации об окружающем мире. На смену им пришли живопись, фотография и технические чертежи.

2.Числовая информация позволяет описать количественные характеристики объектов. Важность данных этого типа взлетела до небес при развитии торговли и денежного обмена. Чтобы успешно хранить и передавать числовую информацию, пришлось придумать специальные системы символов. Каждая культура считала деньги по-своему, так образовались разные системы счисления.

3.Текстовая информация – это закодированная особыми символами человеческая речь. С изобретением письменности стало возможным передавать любые концепции на сколь угодно большое расстояние, а также передавать знания следующим поколениям. Для удобства манипуляций с текстовой информацией человечеству пришлось изобрести бумагу и книгопечатание.

4.Звуковая информация долго не поддавалась человеку. Лишь в конце XIX века появились первые звукозаписывающие устройства, позволяющие воспринимать и сохранять данные.

5.Видеоинформация – живая графика – покорилась человеку с изобретением кинематографического аппарата.

Все эти данные могут быть записаны, обработаны электронно-вычислительными машинами и переданы от человека к человеку. Они могут храниться без потерь на протяжении долгого времени. Существуют и другие разновидности информации, с которыми человечество еще не научилось работать, например, тактильная или вкусовая.

Деление данных на виды имеет для информатики большое значение. Формы представления информации в ЭВМ базируются на ее особенностях, а каждый вид данных имеет специфическую структуру. Так, символьная и графическая информация обрабатываются машиной по-разному.

Главные остановочные пункты в жизненном цикле информации следующие:

•восприятие и сбор;

•хранение;

•передача;

•воспроизведение или отображение.

Во время длительного хранения или передачи данные могут искажаться или теряться. Значительные ошибки нарушают или полностью изменяют суть информации, следовательно, их нужно любой ценой избежать.

Для облегчения манипуляций с данными была придумана кодировка. Суть процесса кодирования в том, что информация по строго определенным правилам переводится в другую форму, над ней осуществляется некая операция, а затем происходит обратное преобразование.

Одна из первых удачных попыток кодирования – световые сигналы. Мигание источников света – удобный способ передачи информации на большие расстояния. С развитием техники люди придумали еще множество способов шифровать данные: электрические сигналы, радиоволны^[2].

Кодирование обеспечивает большую сохранность и защищенность данных, позволяет увеличить скорость передачи информации и облегчить ее обработку.

Таким образом, информационный цикл приобретает следующий вид:

•сбор;

•кодирование;

•хранение;

•передача;

•декодирование;

•воспроизведение.

В процессе жизненного цикла данные могут неоднократно подвергаться кодированию и декодированию с использованием разных кодовых систем. Это необходимо для приведения информации в более удобное состояние для осуществления конкретной операции.

1.2 Материальная основа информации

Производить какие-либо реальные манипуляции можно только над материальными объектами, имеющими определенные характеристики, которые можно зафиксировать и измерить. Представление информации в ЭВМ базируется на электрических сигналах.

Работающие с данными узлы машины представлены огромным количеством крошечных элементов, которые в любой момент времени пребывают в одном из двух состояний: включенном или выключенном. Конкретная технология реализации может отличаться для разных ЭВМ и даже для разных блоков одной машины. Выключенное состояние обозначается нулем – отсутствие сигнала, включенное – единицей^[3].

Количество информации, получаемое от одного структурного элемента, – один бит. Слово «бит» образовано от выражения binary digit (двоичная цифра). 1 бит – минимальная единица информации. Вся информация в компьютерах представлена последовательностью битов – нулей и единиц. Поразительно, какое огромное многообразие данных может быть зашифровано таким простым способом!

Представление информации в ЭВМ в виде отдельных точечных значений называется дискретным. По сравнению с аналоговым, оно проще реализуется и позволяет легче оперировать большими объемами данных.

Двоичный код

Последовательность битов, представляющая некоторые данные, называется двоичным кодом. С его помощью может быть закодирована любая информация: числовая, символьная, графическая.

Правила, по которым данные преобразуются в машинный код, специфичны для каждого типа. Отдельные значения в них могут совпадать, поэтому декодирование всегда производится в зависимости от контекста.

Двоичное представление информации в ЭВМ имеет ряд преимуществ:

•удобство реализации: двухпозиционные элементы гораздо проще и надежнее трех- и более позиционных;

•помехоустойчивость: сигнал, в котором присутствуют только два возможных состояния гораздо проще для восприятия;

•простота вычислений: двоичная арифметика максимально проста.

Математическая основа представления информации в ЭВМ – система счисления с основанием 2. Она намного проще привычной нам десятичной системы, оперирует всего двумя цифрами – нулем и единицей – и определяет правила всех математических операций, производимых над двоичным кодом.

Существует три способа представления числовой информации в ЭВМ:

•число с фиксированной точкой;

•число с плавающей точкой;

•двоично-десятичное представление.

У чисел с фиксированной точкой, как следует из названия, место точки (запятой), отделяющей дробную часть строго определено и зафиксировано.

1.Если точка находится после последней значащей цифры – число является целым.

2.Расположение точки перед первой значащей цифрой соответствует правильной дроби (меньше единицы по модулю).

Для определения знака выделен самый первый разряд. У положительных чисел в нем расположен 0, у отрицательных – 1.

Главное преимущество такой формы представления – отсутствие погрешностей округления при вычислениях. Главный недостаток – ограниченный диапазон значений, зависящий от разрядной сетки конкретной ЭВМ.

Числа с плавающей точкой представлены сочетанием значений мантиссы и порядка. Такая форма записи называется полулогарифмической.

Точность вычислений для такого представления зависит от длины мантиссы: при округлении могут отсекаться лишние разряды.

И числа с фиксированной точкой, и мантисса, и порядок чисел с плавающей точкой представлены в двоичной системе.

Двоично-десятичное представление чисел обеспечивается специальными процессорами в составе ЭВМ. Число обрабатывается как десятичное, но каждая его цифра представляется двоичной тетрадой. Это позволяет сократить время обработки больших массивов десятичных чисел.

Текстовая информация

Для представления текстовой информации в ЭВМ используются специальные таблицы, в которых каждому символу ставится в соответствие уникальный двоичный код.

В наиболее популярной кодировке ASCII (Американский стандарт кода для международного обмена) на один символ выделено 8 бит – 1 байт. Для кодовой единицы такого размера существует 256 уникальных комбинаций, следовательно, можно закодировать 256 разных текстовых символов. Помимо букв разных алфавитов, в таблице учитываются математические операторы, знаки препинания и прочие специальные элементы.

Конечно, 256 комбинаций – слишком мало для нашего мультикультурного мира. Некоторые языки сами по себе содержат больше букв. В таблицах Unicode увеличили размер базовой единицы кода, выделив под нее 2 байта (16 бит). Это позволило увеличить предел кодирования до 65536 элементов^[4].

Растровая графика

Представление графической информации в ЭВМ называют матричным. Оно основано на разбиении изображения на ряды точек (пикселей). Для каждого пикселя информация о положении, цвете и яркости сохраняется отдельно.

В черно-белых изображениях для точки достаточно указать "степень серости" – одну из 256 градаций серого цвета. Для этого выделяется 1 байт (8 бит).

Цветные иллюстрации требуют больше данных. Чтобы закодировать информацию о цвете точки, его представляют в виде композиции трех базовых цветов: красного, зеленого и синего. Это модель Red-Green-Blue – RGB. Кодирование одной точки цветного изображения требует 24 разрядов – по одному байту (8 бит) для каждой составляющей.

Векторная графика

Изображение может быть описано и по-другому. Для этого оно разбивается на элементарные фигуры – отрезки, дуги, круги. Каждая часть может быть описана с помощью математических формул. Так, круг представляется совокупностью координаты центра и радиуса окружности. Такой способ описания графики называется векторным.

1.3 Общие понятия кодирования и декодирования

Процесс передачи информации между человеком и компьютером, несколькими компьютерами либо несколькими людьми, происходит с помощью различных форм.

Люди общаются между собой на понятном для них языке, используя при этом буквенный алфавит. Для восприятия компьютером информации, передаваемой человеком, нужно язык человека преобразовать в язык, понятный компьютеру. Другими словами, произвести её кодирование.

Таким образом, кодирование – это процесс, при котором происходит трансформация информации одной системы знаков в другую.

Декодирование, наоборот, трансформирует закодированную первоначальную информацию в исходную форму, понятную человеку. Это обратный кодированию процесс. Он известен уже давно.

Как пример постоянного декодирования можно привести азбуку Морзе. Она передаёт сообщения кодами. Чтобы их можно было прочесть, нужно выполнить преобразования кода в язык, понятный человеку, то есть в слова.

Кодирование информации производится не только на компьютере, но и на всей электронной технике. К ней относятся и смартфоны, и планшеты, и ноутбуки, и прочие устройства. Для преобразования в них информации используется двоичный код, состоящий из двух символов – «0» и «1».

Сегодня известно множество кодов, и у каждого их них есть свой алфавит. Вся вводимая в компьютер информация кодируется. Чтобы человек ни делал (писал, рисовал, создавал файлы, играл), всё превращается в компьютере в определённый набор из нолей и единиц.

Для того, чтобы закодированная информация могла появиться на экране компьютера в понятном человеку виде, в системе проводится декодирование. Числовая последовательность преобразуется в понятные для восприятия человека буквы, цифры и знаки. Оба процесса, кодирование и декодирование, происходят мгновенно, за доли секунды.

Сегодня для кодирования информации в памяти компьютеров используют двоичный код. Это самый простой способ кодирования. Специальные программы преобразуют информацию в числовую последовательность и хранят её в памяти компьютера. При необходимости вывести её на экран, трансформируют в форму, понятную нам^[5].

Чтобы представить слова, цифры и символы в числовой последовательности, используются специальные таблицы перевода. В них каждой букве латиницы, цифре и символу соответствует определённый числовой ряд из «0» и «1». В таблице можно увидеть, что двоичный код содержит 8 разрядов.

Но для преобразования информации из одной системы языков в другую существует алфавит, состоящий из 256 символов. Он считается достаточным. Значит, у каждого символа свой десятичный код от 0 до 256, что соответствует двоичному коду от 00000000 до 11111111. Таким образом, любую информацию можно представить в виде символов.

Любой человек может, пользуясь таблицей, закодировать какую-либо фразу и посмотреть, как она будет выглядеть в компьютере. Программы, которые проводят кодирование и декодирование информации, называются кодировщиками.

Таблица кодирования символов ASCII относится к международным стандартам для ПК. Она восьмиразрядная. Это значит, что один символ занимает объём памяти равный 1 байту.

В кодировочной таблице символы, имеющие порядковые номера от 0 до 31, относят к управляющим. С их помощью происходит управление процессами, которые преобразуют текстовую информацию для вывода её на экран. Номера от 32 до 127 считаются стандартными, или английскими. Пробел — это просто пустота, но он также закодирован. В таблице его номер 32.

Номера от 128 до 255 принято считать альтернативными или русскими. Это вторая половина таблицы. Во второй её половине 128 кодов, а начинается она с 10000000 и заканчивается 11111111. Эта часть таблицы кодирования имеет название – кодовая страница. В ней размещают алфавиты, которые отличаются от латиницы, поэтому у неё множество вариантов.

В таблице кодов цифры размещены от меньшего к большему, а буквы – в алфавитном порядке.

Самая используемая кодировка, которую применяют в большинстве случаев кодировщики, Microsoft Windows. Её сокращённое название СР 1251. Кодирование символов происходит по международным стандартам. Иначе невозможно было бы пользоваться электроникой, купленной в другой стране.

В международной системе кодирования символов есть 16-ти разрядная система кодировки – Unicode. Один символ в этой системе занимает объём памяти в 2 байта. Это больше в 2 раза, чем в системе кодировки ASCII. Такой факт, безусловно, является недостатком.

Но зато символов эта система содержит гораздо больше – 65536. В Unicode включены все известные и неизвестные алфавиты во всём мире. Она содержит огромное количество всевозможных символов, относящихся к математике, химии, физике, музыке и т.д.

Если при переносе информации, написанной русским языком, с одного компьютера на другой на экране мы видим что-то несуразное, это говорит о том, что использовались различные кодировки символов.

1.4 Методы кодирования данных

Кодирование — это процесс преобразования данных или заданной последовательности символов, символов, алфавитов и т. Д. В определенный формат для защищенной передачи данных. Декодирование — это обратный процесс кодирования, который заключается в извлечении информации из преобразованного формата.

Кодирование — это процесс использования различных комбинаций уровней напряжения или тока для представления единиц и нулей цифровых сигналов в линии передачи.

Распространенными типами кодирования линий являются униполярный, полярный, биполярный и манчестерский.

Метод кодирования данных подразделяется на следующие типы в зависимости от типа преобразования данных.

Аналоговые данные для аналоговых сигналов. К этой категории относятся методы модуляции, такие как амплитудная модуляция, частотная модуляция и фазовая модуляция аналоговых сигналов.

Аналоговые данные для цифровых сигналов. Этот процесс можно назвать оцифровкой, которая осуществляется с помощью импульсной кодовой модуляции (PCM). Следовательно, это не что иное, как цифровая модуляция. Как мы уже обсуждали, выборка и квантование являются важными факторами в этом. Дельта-модуляция дает лучшую производительность, чем PCM.

Цифровые данные в аналоговые сигналы . Методы модуляции, такие как амплитудная манипуляция (ASK), частотная манипуляция (FSK), фазовая манипуляция (PSK) и т. Д., Подпадают под эту категорию. Они будут обсуждаться в последующих главах.

Цифровые данные в цифровые сигналы — это в этом разделе. Есть несколько способов отобразить цифровые данные на цифровые сигналы. Некоторые из них:

- аналоговые данные для аналоговых сигналов. К этой категории относятся методы модуляции, такие как амплитудная модуляция, частотная модуляция и фазовая модуляция аналоговых сигналов.

- аналоговые данные для цифровых сигналов. Этот процесс можно назвать оцифровкой, которая осуществляется с помощью импульсной кодовой модуляции (PCM). Следовательно, это не что иное, как цифровая модуляция. Как мы уже обсуждали, выборка и квантование являются важными факторами в этом. Дельта-модуляция дает лучшую производительность, чем PCM.

- цифровые данные в аналоговые сигналы . Методы модуляции, такие как амплитудная манипуляция (ASK), частотная манипуляция (FSK), фазовая манипуляция (PSK) и т. Д., Подпадают под эту категорию. Они будут обсуждаться в последующих главах.

- цифровые данные в цифровые сигналы — это в этом разделе. Есть несколько способов отобразить цифровые данные на цифровые сигналы.

Невозврат в ноль (NRZ)

Коды NRZ имеют 1 для высокого уровня напряжения и 0 для низкого уровня напряжения. Основное поведение кодов NRZ состоит в том, что уровень напряжения остается постоянным в течение битового интервала. Конец или начало бита не будут указываться, и он будет поддерживать одно и то же состояние напряжения, если значение предыдущего бита и значение текущего бита совпадают.

Если рассмотрен вышеприведенный пример, поскольку имеется длинная последовательность постоянного уровня напряжения, и тактовая синхронизация может быть потеряна из-за отсутствия битового интервала, приемнику становится трудно различать 0 и 1.

Есть два варианта в NRZ, а именно — NRZ — L (NRZ — УРОВЕНЬ)

Полярность сигнала изменяется, только когда входной сигнал изменяется с 1 на 0 или с 0 на 1. Он такой же, как NRZ, однако первый бит входного сигнала должен иметь изменение полярности.

NRZ — I (NRZ — INVERTED)

Если 1 появляется во входящем сигнале, то происходит переход в начале битового интервала. Для 0 во входящем сигнале нет перехода в начале битового интервала.

Коды NRZ имеют недостаток , заключающийся в том, что синхронизация часов передатчика с часами приемника полностью нарушается, когда есть строка 1 с и 0 с . Следовательно, должна быть предусмотрена отдельная линия часов.

Уровень сигнала проверяется дважды для каждого бита, как в начале, так и в середине. Следовательно, тактовая частота вдвое превышает скорость передачи данных, и, таким образом, частота модуляции также удваивается. Часы взяты из самого сигнала. Ширина полосы, необходимая для этого кодирования, больше.

Существует два типа двухфазного кодирования.

- Бифазный Манчестер

- Дифференциальный Манчестер

Бифазный Манчестер

В этом типе кодирования переход выполняется в середине битового интервала. Переход для результирующего импульса происходит от высокого к низкому в середине интервала для входного бита 1. В то время как переход от низкого к высокому для входного бита 0 .

Дифференциальный Манчестер

В этом типе кодирования всегда происходит переход в середине битового интервала. Если в начале битового интервала происходит переход, то входной бит равен 0 . Если в начале битового интервала перехода не происходит, то входной бит равен 1 .

На следующем рисунке показаны формы сигналов кодирования NRZ-L, NRZ-I, двухфазного Манчестера и дифференциального Манчестера для различных цифровых входов.

Рис.1 - Формы сигналов кодирования NRZ-L, NRZ-I, двухфазного Манчестера и дифференциального Манчестера

Блочное кодирование

Среди типов блочного кодирования известны следующие: кодирование 4B / 5B и кодирование 8B / 6T. Количество битов обрабатывается по-разному, в обоих этих процессах.

4B / 5B Кодировка

В манчестерском кодировании для отправки данных требуются часы с двойной скоростью, а не кодирование NRZ. Здесь, как следует из названия, 4 бита кода отображаются с 5 битами с минимальным количеством 1 бит в группе.

Проблема синхронизации часов в кодировании NRZ-I устраняется путем назначения эквивалентного слова из 5 битов вместо каждого блока из 4 последовательных битов. Эти 5-битные слова предопределены в словаре.

Основная идея выбора 5-битного кода состоит в том, что он должен иметь один ведущий 0 и не более двух конечных 0 . Следовательно, эти слова выбираются так, что в каждом блоке битов происходят две транзакции.

8B / 6T Кодировка

Мы использовали два уровня напряжения для передачи одного бита по одному сигналу. Но если мы используем более 3 уровней напряжения, мы можем отправлять больше битов на сигнал.

Например, если 6 уровней напряжения используются для представления 8 битов в одном сигнале, то такое кодирование называется кодированием 8B / 6T. Следовательно, в этом методе мы имеем целых 729 (3 ^ 6) комбинаций для сигнала и 256 (2 ^ 8) комбинаций для битов.

Эти методы в основном используются для преобразования цифровых данных в цифровые сигналы путем их сжатия или кодирования для надежной передачи данных.

Глава 2 Основные примеры кодирования данных

Серийная цифровая связь стала довольно популярной. Существует много разновидностей: среди стандартных интерфейсов на уровне плат у нас есть UART, SPI и I2C. «Цифровая» связь также может быть достигнута с помощью аналоговых сигналов. Одним из примеров является линия радиочастотной передачи данных, которая использует изменения аналоговой амплитуды, частоты или фазы для беспроводной передачи двоичных данных. Также есть высокоскоростные дифференциальные интерфейсы, такие как последовательные линии связи на основе LVDS или USB.

2.1 Кодирование по Манчестеру

При передаче данных внедряются различные методы кодирования для обеспечения безопасности данных и быстрой передачи. Манчестерское кодирование является одним из таких цифровых способов кодирования. Оно сильно отличается от других методов, поскольку по умолчанию каждая длина бит данных фиксируется. Состояние бит определяется в соответствии с направлением перехода. Различные системы представляют бит-статус по-разному, но большинство систем представляют 1 бит против перехода от низкого к высокому и 0 бит для перехода с высоким и низким^[6].

Манчестерское кодирование — это метод модуляции данных, который может использоваться во многих ситуациях, но особенно полезен при двоичной передаче информации на основе аналоговых, радиочастотных, оптических, высокоскоростных цифровых или дальних цифровых сигналов.

Синхронизация сигналов является основным преимуществом манчестерского кодирования. Она обеспечивает более высокую надежность с той же скоростью передачи данных по сравнению с другими методами. Но манчестерское кодирование также имеет некоторые недостатки. Например, оно потребляет больше полосы пропускания, чем исходный сигнал.

Все виды кодирования по Манчестеру имеют следующие характеристики:

•Каждый бит передается в фиксированное время.

•"1" отмечается, когда происходит переход от высокого к низкому; "0" выражается, когда выполняется переход от низкого до высокого.

•Переход, который используется для примечания 1 или 0, точно встречается в середине периода.

Кодирование в общем понимании — это процесс преобразования данных в формат, необходимый для удовлетворения потребностей в обработке информации, в том числе:

•Компиляция и исполнение программы.

•Передача данных, хранение и сжатие (декомпрессия).

•Обработка данных приложений, таких как преобразование файлов.

Все виды кодов могут иметь два значения:

•В компьютерной технологии кодирование представляет собой процесс применения определенного кода, такого как буквы, символы и цифры, к данным для преобразования в эквивалентный шифр.

•В электронике кодирование относится к аналого-цифровому преобразованию.

Манчестерский код (впервые опубликован в 1949 году) представляет собой синхронную технологию кодирования часов, используемую физическим уровнем для кодирования тактового сигнала и данных синхронного потока бит. В этом методе фактические двоичные данные, которые должны передаваться по кабелю, не отправляются как последовательность логических единиц и нолей (известные технически как Non Return to Zero или NRZ). Вместо этого биты преобразуются в несколько иной формат, который имеет ряд преимуществ перед использованием прямого двоичного кодирования.

Манчестерский код содержит частые переходы уровня, которые позволяют приемнику извлекать синхронизирующий сигнал с помощью цифровой фазовой блокированной петли (DPLL) и правильно декодировать значение и синхронизацию каждого бита. Чтобы обеспечить надежную работу с использованием DPLL, передаваемый бит-поток должен содержать высокую плотность бит-переходов. Все виды кодов гарантируют это, позволяя принимающему DPLL правильно извлекать тактовый сигнал.

Двухфазный манчестерский код может потреблять примерно вдвое большую ширину полосы исходного сигнала (20 МГц). Это штраф за введение частых переходов. Для локальной сети 10 Мбит/с спектр сигналов лежит между 5 и 20 МГц. Манчестерское кодирование используется в качестве физического уровня локальной сети Ethernet, где дополнительная пропускная способность не является существенной проблемой для передачи коаксиального кабеля. Ограниченная пропускная способность кабеля CAT5e потребовала более эффективного метода кодирования для передачи 100 Мбит/с с использованием кода MLT 4b/5b. Это использует три уровня сигнала (вместо двух уровней, используемых в манчестерском кодировании), и следовательно, сигнал 100 Мбит/с занимает только полосу пропускания 31 МГц. Gigabit Ethernet использует пять уровней и кодирование 8b/10b, чтобы обеспечить еще более эффективное использование ограниченной пропускной способности кабеля, передавая 1 Гбит/с в полосе пропускания 100 МГц.

При передаче данных манчестерский код представляет собой форму цифрового кодирования, в котором биты данных представлены переходами из одного логического состояния в другое. Это отличается от более распространенного метода, в котором бит представлен либо высоким состоянием, например, +5 вольт, либо низким состоянием, например 0 вольт.

Когда используется код Манчестера II, длина каждого бита данных устанавливается по умолчанию. Это делает сигнал самосинхронизирующимся. Состояние бит определяется в соответствии с направлением перехода. В некоторых системах переход от низкого к высокому представляет логику 1, а переход от высокой к низкой представляет логику 0. В других системах переход от низкого к высокому представляет логику ноля и единицы (как переход от высокой к низкой)^[7].

Главным преимуществом манчестерского кодирования является тот факт, что сигнал синхронизируется. Это минимизирует частоту ошибок и оптимизирует надежность. Основным недостатком является тот факт, что сигнал, закодированный в Манчестере, требует передачи большего количества бит, чем в исходном сигнале.

Несмотря на непреодолимые преимущества стандартной цифровой связи по сравнению с аналоговой сигнализацией, существуют некоторые общие ограничения технологии.

Одно из них — проблема синхронизации: приемник должен знать, когда именно передается информация для отбора входящих данных. Обратите внимание, что эта синхронизация не нужна для аналоговой аудиопередачи. Демодулированный аудиосигнал может быть доставлен в динамик без явной интерпретации данных на стороне приемника.

Другим недостатком является необходимость подключения постоянного тока. Цифровые данные могут включать длинные непрерывные последовательности из них или нули, и, таким образом, стандартный цифровой сигнал, используемый для передачи этих данных, будет оставаться на одном и том же напряжении в течение относительно длительного периода времени.

Манчестерское кодирование предлагает средство для устранения этих двух ограничений. Это простая цифровая схема модуляции, которая выполняет две функции:

•гарантирует, что сигнал никогда не будет оставаться на логическом низком или высоком уровне логики в течение длительного периода времени;

•преобразует сигнал данных в сигнал данных плюс синхронизация.

Во многих случаях вполне приемлемо использовать отдельный тактовый сигнал для достижения синхронизации между передатчиком и приемником. Но иногда такой подход нежелателен, например, когда вам нужно минимизировать количество межсоединений между частями системы или когда миниатюризация требует микроконтроллера с наименьшим количеством контактов, который может каким-то образом обеспечить требуемую функциональность.

В других ситуациях отдельный тактовый сигнал просто не является вариантом. Например, было бы крайне неэффективно включать два отдельных радиочастотных передатчика и приемника (то есть один для данных и один для часов) в сложной беспроводной линии передачи данных.

В случае с интерфейсом UART вместо внешних часов, передаваемых передатчиком и приемником, можно использовать внутренние синхронизирующие сигналы. Но эта стратегия приносит существенные ограничения:

•Не устойчива к частотным изменениям, которые становятся более проблематичными, когда передатчик и приемник находятся в разных условиях.

•Не обладает гибкостью, поскольку требует, чтобы устройства Tx и Rx были явно предварительно сконфигурированы для одной и той же скорости передачи данных^[8].

•Обычно приемнику требуется внутренняя тактовая частота, которая значительно выше, чем скорость передачи данных, и это может привести к жестким ограничениям на максимальную скорость передачи данных.

Сложные системы, особенно с высоким напряжением, не всегда способны обеспечить синфазное напряжение передаваемого сигнала совместимо с допустимым диапазоном общего режима приемника. Еще одна проблема - токи повреждения. Постоянное соединение не защищает от опасных долгосрочных токов, возникающих в результате короткого замыкания.

Таким образом, соединение переменного тока является простым способом уменьшить неудобства и риски, связанные с режимами синфазного напряжения и режимами отказа.

Технология линейного кодирования используется в стандартных сетях Ethernet, специфицированная — в стандарте IEEE 802.3. Линейное кодирование — это процесс, посредством которого цифровая информация в двоичном битовом потоке преобразуется в электрические сигналы для передачи.

Двухуровневый код использует переход напряжения в двух состояниях для представления одного бита информации. Бинарный 0 представлен переходом от более высокого к более низкому напряжению в течение времени, установленного для передачи одного бита (то есть одного «битового времени»). Бинарная 1 представлена переходом от низшего к высшему. Для сетей Ethernet высокое напряжение обычно составляет +0,85 вольта, а уровень низкого напряжения обычно составляет -0,85 вольта, что делает каждый переход напряжения равным 1,7 вольта.

Манчестерское кодирование имеет то преимущество, что позволяет передавать данные без необходимости в дополнительном тактирующем сигнале. Это возможно, потому что переходы напряжения происходят в середине каждого интервала передачи бит, который устанавливает шаблон синхронизации. Таким образом, изменение среднего интервала позволяет приемным станциям поддерживать надлежащую синхронизацию друг с другом, чтобы обеспечить целостность передачи. Из-за дополнительного перехода на бит, который используется для целей синхронизации, кодировка Манчестера эффективна только на 50 %. Например, для получения скорости передачи данных 10 Мбит/с требуется полоса пропускания 20 МГц.

Другая версия, называемая дифференциальным манчестерским кодированием, представляет собой двоичный код нуля путем перехода напряжения в начале битового интервала и двоичный код единицы без перехода в начале битового интервала. В обоих случаях переход происходит в середине интервала для целей синхронизации. Дифференциальная манчестерская кодировка используется для сетей Token Ring IEEE 802.5.

2.2 Кодировка ASCII. Таблица кодировки ASCII

Под кодированием информации в компьютере понимается процесс ее преобразования в форму, позволяющую организовать более удобную передачу, хранение или автоматическую переработку этих данных. С этой целью используются различные таблицы. Кодировка ASCII — это первая система, разработанная в Соединенных Штатах для работы с англоязычным текстом, которая получила впоследствии распространение во всем мире.

Символы на мониторе компьютера или того или иного мобильного цифрового гаджета формируются на основе наборов векторных форм всевозможных знаков и кода, позволяющего найти среди них тот символ, который необходимо вставить в нужное место. Он представляет собой последовательностей бит. Таким образом, каждому символу должен однозначно соответствовать набор нулей и единиц, которые стоят в определенном, уникальном порядке.

Исторически сложилось так, что первые ЭВМ были англоязычными. Для кодирования символьной информации в них было достаточно использовать всего лишь 7 бит памяти, тогда как для этой цели выделялся 1 байт, состоящий из 8 битов. Количество знаков, понимаемых компьютером в таком случае, было равно 128. В число таких символов входили английский алфавит с его знаками препинания, числа и некоторые специальные символы. Англоязычная семибитная кодировка с соответствующей таблицей (кодовой страницей), разработанная в 1963 году, была названа American Standard Code for Information Interchange. Обычно для ее обозначения использовалась и используется и по сей день аббревиатура «Кодировка ASCII».

Со временем компьютеры стали широко использоваться и в неанглоговорящих странах. В связи с этим появилась нужда в кодировках, позволяющих использовать национальные языки. Было решено не изобретать велосипед, и взять за основу ASCII. Таблица кодировки в новой редакции значительно расширилась. Использование 8-го бита позволило переводить на компьютерный язык уже 256 символов.

Кодировка ASCII имеет таблицу, которая делится на 2 части. Общепринятым международным стандартом принято считать лишь ее первую половину. В нее входят:

•Символы с порядковыми номерами от 0 до 31, кодируемые последовательностями от 00000000 до 00011111. Они отведены для управляющих символов, которые руководят процессом вывода текста на экран или принтер, подачей звукового сигнала и т. п.

•Символы с NN в таблице от 32 до 127, кодируемые последовательностями от 00100000 до 01111111 составляют стандартную часть таблицы. В их число входят пробел (N 32), буквы латинского алфавита (строчные и прописные), десятизначные цифры от 0 до 9, знаки препинания, скобки разного начертания и другие символы.

•Символы с порядковыми номерами от 128 до 255, кодируемые последовательностями от 10000000 до 11111111. В их число включены буквы национальных алфавитов, отличные от латинского. Именно эта альтернативная часть таблицы кодировка ASCII используется для преобразования в компьютерную форму русских символов.

К особенностям кодировки ASCII относится отличие букв «A» - «Z» нижнего и верхнего регистров только одним битом. Это обстоятельство значительно упрощает преобразование регистра, а также его проверку на принадлежность к заданному диапазону значений. Кроме того, все буквы в системае кодировки ASCII представляются собственными порядковыми номерами в алфавите, которые записаны 5 цифрами в двоичной системе счисления, перед которыми для букв нижнего регистра стоит 0112, а верхнего — 0102.

К числу особенностей кодировки ASCII можно причислить и представление 10 цифр - «0»-«9». Во второй системе счисления они начинаются с 00112, а заканчиваются 2-ми значениями чисел. Так, 01012 эквивалентно десятичному числу пять, поэтому символ «5» записывается как 0011 01012. Опираясь на сказанное, можно легко преобразовать двоично-десятичные числа в строку в кодировке ASCII посредством добавления слева битовой последовательности 00112 к каждому полубайту.

Как известно, для отображения текстов на языках группы юго-восточной Азии требуются тысячи знаков. Такое их количество никак не описывается в одном байте информации, поэтому даже расширенные версии ASCII уже не могли удовлетворять возросшие потребности пользователей из разных стран.

Так, возникла необходимость создания универсальной кодировки текста, разработкой которой при сотрудничестве со многими лидерами мировой IT-индустрии занялся консорциум "Юникод". Его специалистами была создана система UTF 32. В ней для кодирования 1 символа выделялось 32 бита, составляющих 4 байта информации. Главным недостатком было резкое увеличение объема необходимой памяти в целых 4 раза, что влекло за собой множество проблем.

Кодировка "Юникод" — стандарт кодирования символов. Он был предложен некоммерческой организацией Unicode Inc. в 1991 году. Стандарт разработан с целью объединения как можно большего числа разнотипных символов в одном документе. Страница, которая создана на его основе, может содержать в себе буквы и иероглифы из разных языков (от русского до корейского) и математические знаки. При этом все символы в данной кодировке отображаются без проблем. -

Когда-то, задолго до появления единой системы "Юникод", кодировка выбиралась исходя из предпочтений автора документа. По этой причине нередко, чтобы прочитать один документ, нужно было использовать разные таблицы. Иногда это приходилось делать по несколько раз, что существенно усложняло жизнь обычному пользователю. Как уже было сказано, решение этой проблемы в 1991 году было предложено некоммерческой организацией Unicode Inc., предложившей новый тип кодирования символов. Он был призван объединить морально устаревшие и разнообразные стандарты. "Юникод" - кодировка, которая озволила добиться немыслимого на тот момент: создать инструмент, поддерживающий огромное количество символов. Результат превзошел многие ожидания – появились документы, одновременно содержащие как английский, так и русский текст, латынь и математические выражения.

Но созданию единой кодировки предшествовала необходимость разрешения ряда проблем, которые возникли из-за огромного разнообразия стандартов, уже существовавших на тот момент. Самые распространённые из них:

- эльфийские письмена, или «кракозябры»;

- ограниченность набора символов;

- проблема преобразования кодировок;

- дублирование шрифтов.

В то же время для большинства стран с официальными языками, относящимися к индоевропейской группе, количество знаков, равное 232, является более чем избыточным.

В результате дальнейшей работы специалистов из консорциума "Юникод" появилась кодировка UTF-16. Она стала тем вариантом преобразования символьной информации, которая устроила всех как по объему требуемой памяти, так и по числу кодируемых символов. Именно поэтому UTF-16 была принята по умолчанию и в ней для одного знака требуется зарезервировать 2 байта.

Даже эта достаточно продвинутая и удачная версия "Юникода" имела некоторые недостатки, и после перехода от расширенной версии ASCII к UTF-16 увеличивала вес документа в два раза.

В связи с этим было решено использовать кодировку переменной длины UTF-8. В таком случае каждый символ исходного текста кодируется последовательностью длиной от 1 до 6 байт.

Все знаки латинского алфавита в UTF-8 переменной длины кодируются в 1 байт, как в системе кодировки ASCII.

Особенностью ЮТФ-8 является то, что в случае текста на латинице без использования других символов, даже программы, не понимающие "Юникод", все равно позволят его прочитать. Иными словами, базовая часть кодировки текста ASCII просто переходит в состав новой UTF переменной длины. Кириллические знаки в ЮТФ-8 занимают 2 байта, а, например, грузинские — 3 байта. Созданием UTF-16 и 8 была решена основная проблема создания единого кодового пространства в шрифтах. С тех пор производителям шрифтов остается только заполнять таблицу векторными формами символов текста исходя из своих потребностей.

В различных операционных системах предпочтение отдается различным кодировкам. Чтобы иметь возможность читать и редактировать тексты, набранные в другой кодировке, применяются программы перекодировки русского текста. Некоторые текстовые редакторы содержат встроенные перекодировщики и позволяют читать текст вне зависимости от кодировки.

Теперь вы знаете, сколько символов в кодировке ASCII и, как и почему она была разработана. Конечно, сегодня наибольшее распространение в мире получил стандарт "Юникод". Однако нельзя забывать, что он создан на базе ASCII, поэтому следует по достоинству оценивать вклад его разработчиков в сферу IT.

Глава 3 Способы кодирования и декодирования информации числовой, текстовой и графической

Эксплуатация электронно-вычислительной техники для обработки данных стала важным этапом в процессе совершенствования систем управления и планирования. Но такой метод сбора и обработки информации несколько отличается от привычного, поэтому требует преобразования в систему символов, понятных компьютеру.

Кодирование данных – это обязательный этап в процессе сбора и обработки информации.

Как правило, под кодом подразумевают сочетание знаков, которое соответ-ствует передаваемым данным или некоторым их качественным характеристикам. А кодирование – это процесс составления зашифрованной комбинации в виде списка сокращений или специальных символов, которые полностью передают изначальный смысл послания. Кодирование еще иногда называют шифрованием, но стоит знать, что последняя процедура предполагает защиту данных от взлома и прочтения третьими лицами .

Цель кодирования заключается в представлении сведений в удобном и лаконичном формате для упрощения их передачи и обработки на вычислительных устройствах. Компьютеры оперируют лишь информацией определенной формы, поэтому так важно не забывать об этом во избежание проблем. Принципиальная схема обработки данных включает в себя поиск, сортировку и упорядочивание, а кодирование в ней встречается на этапе ввода сведений в виде кода^[9].

Вопрос о том, что такое кодирование и декодирование, может возникнуть у пользователя ПК по различным причинам, но в любом случае важно донести корректную информацию, которая позволит юзеру успешно продвигаться в потоке информационных технологий дальше. Как вы понимаете, после процесса обработки данных получается выходной код. Если такой фрагмент расшифровать, то образуется исходная информация. То есть декодирование – это процесс, обратный шифрованию.

Если во время кодирования данные приобретают вид символьных сигналов, которые полностью соответствуют передаваемому объекту, то при декодировании из кода изымается передаваемая информация или некоторые ее характеристики.

Получателей закодированных сообщений может быть несколько, но очень важно, чтобы сведения попали в руки именно к ним и не были раскрыты раньше третьими лицами. Поэтому стоит изучить процессы кодирования и декодирова-ния информации. Именно они помогают обмениваться конфиденциальными све-дениями между группой собеседников.

3.1 Кодирование и декодирование текстовой информации

При нажатии на клавиатурную клавишу компьютер получает сигнал в виде двоичного числа, расшифровку которого можно найти в кодовой таблице – внутреннем представлении знаков в ПК. Стандартом во всем мире считают таблицу ASCII.

Однако мало знать, что такое кодирование и декодирование, необходимо еще понимать, как располагаются данные в компьютере. К примеру, для хранения одного символа двоичного кода электронно-вычислительная машина выделяет 1 байт, то есть 8 бит. Эта ячейка может принимать только два значения: 0 и 1. Получается, что один байт позволяет зашифровать 256 разных символов, ведь именно такое количество комбинаций можно составить. Эти сочетания и являются ключевой частью таблицы ASCII. К примеру, буква S кодируется как 01010011. Когда вы нажимаете ее на клавиатуре, происходит кодирование и декодирование данных, и мы получаем ожидаемый результат на экране.

Половина таблицы стандартов ASCII содержит коды цифр, управляющих символов и латинских букв. Другая ее часть заполняется национальными знака-ми, псевдографическими знаками и символами, которые не имеют отношения к математике. Совершенно ясно, что в различных странах эта часть таблицы будет отличаться. Цифры при вводе также преобразовываются в двоичную систему вычисления согласно стандартной сводке.

Легче будет понять, что такое кодирование информации, на примере. Рас-смотрим коды английского символа «С» и русской буквы «С». Заметим, что взяты символы заглавные, и их коды отличаются от строчных. Английский символ будет выглядеть как 01000010, а русский - 11010001. То, что для человека на экране монитора выглядит одинаково, компьютер воспринимает совершенно по-разному. Необходимо также обратить внимание на то, что коды первых 128 символов остаются неизменны, а начиная от 129 и далее одному двоичному коду могут соответствовать различные буквы в зависимости от используемой кодовой таблицы. К примеру, десятичный код 194 может соответствовать в КОИ8 букве «б», в СР1251 - «В», в ISO - «Т», а в кодировках СР866 и Мас вообще этому коду не соответствует ни один символ. Поэтому, когда при открытии текста мы вместо русских слов видим буквенную-символьную абракадабру, это означает, что такое кодирование информации нам не подходит и нужно выбрать другой конвертор символов .

3.2 Примеры кодирования и декодирования чисел

Кодирование чисел

В двоичной системе счисления, которую активно используют компьютеры, встречаются лишь две цифры – 0 и 1.

Действия с образовывающимися числами двоичной системы изучает двоичная арифметика. Большинство законов основных математических действий для таких цифр остаются актуальными.

Предлагаем рассмотреть 2 способа кодировки числа 45. Если эта цифра встречается в пределах текстового фрагмента, то каждая ее составляющая будет закодирована, согласно таблице стандартов ASCII, 8 битами. Четверка превратится в 01000011, а пятерка – в 01010011.

Если число 45 используется для вычислений, то будет задействована специ-альная методика преобразования в восьмиразрядный двоичный код 001011012, для хранения которого нужен будет всего лишь 1 байт.

В двоичной системе исчисления берутся всего два варианта значения — 0 и 1. Все основные операции с двоичными числами использует наука под названием двоичная арифметика. Эти действия имеют свои особенности. Возьмем, к примеру, число 45, набранное на клавиатуре. Каждая цифра имеет свой восьмиразрядный код в кодовой таблице ASCII, поэтому число занимает два байта (16 бит): 5 - 01010011, 4 - 01000011 . Для того чтобы использовать это число в вычислениях, оно переводится по специальным алгоритмам в двоичную систему исчисления в виде восьмиразрядного двоичного числа: 45 - 00101101.

Кодирование на двух нижних каналах характеризует метод представлеия ин-формации сигналами, которые распространяются по среде транспортировки. Кодирование можно рассматривать как двухступенчатое. И ясно, что на принимающей стороне реализуется симметричное декодирование.

Логическое кодирование данных изменяет поток бит созданного кадра МАС-уровня в последовательность символов, которые подлежат физическому кодированию для транспортировки по каналу связи. Для логического кодирования используют разные схемы:

- 4B/5B — каждые 4 бита входного потока кодируются 5-битным символом (табл 1.1). Получается двукратная избыточность, так как 24 = 16 входных комби-наций показываются символами из 25 = 32. Расходы по количеству битовых ин-тервалов составляют: (5-4)/4 = 1/4 (25%). Такая избыточность разрешает опреде-лить ряд служебных символов, которые служат для синхронизации. Применяется в 100BaseFX/TX, FDDI

- 8B/10B — аналогичная схема (8 бит кодируются 10-битным символом) но уже избыточность равна 4 раза (256 входных в 1024 выходных).

- 5B/6B — 5 бит входного потока кодируются 6-битными символами. При-меняется в 100VG-AnyLAN

- 8B/6T — 8 бит входного потока кодируются шестью троичными (T = ternary) цифрами (-,0,+). К примеру: 00h: +-00+-; 01h: 0+-+=0; Код имеет избыточ-ность 36/28 = 729/256 = 2,85. Скорость транспортировки символов в линию является ниже битовой скорости и их поступления на кодирования. Применяется в 100BaseT4.

- Вставка бит — такая схема работает на исключение недопустимых после-довательностей бит. Ее работу объясним на реализации в протоколе HDLC. Тут входной поток смотрится как непрерывная последовательность бит, для которой цепочка из более чем пяти смежных 1 анализируется как служебный сигнал (пример: 01111110 является флагом-разделителем кадра). Если в транслируемом потоке встречается непрерывная последовательность из 1, то после каждой пятой в выходной поток передатчик вставляет 0. Приемник анализирует входящую цепочку, и если после цепочки 011111 он видит 0, то он его отбрасывает и последовательность 011111 присоединяет к остальному выходному потоку данных. Если принят бит 1, то последовательность 011111 смотрится как служебный символ. Такая техника решает две задачи — исключать длинные монотонные последовательности, которые неудобные для самосинхронизации физического кодирования и разрешает опознание границ кадра и особых состояний в непрерывном битовом потоке .

Избыточность логического кодирования разрешает облегчить задачи физического кодирования — исключить неудобные битовые последовательности, улучшить спектральные характеристики физического сигнала и др. Физическое/сигнальное кодирование пишет правила представления дискретных символов, результат логического кодирования в результат физические сигналы линии. Физические сигналы могут иметь непрерывную (аналоговую) форму — бесконечное число значений, из которого выбирают допустимое распознаваемое множество. На уровне физических сигналов вместо битовой скорости (бит/с) используют понятие скорость изменения сигнала в линии которая измеряется в бодах (baud). Под таким определением определяют число изменений различных состояний линии за единицу времени. На физическом уровне проходит синхронизация приемника и передатчика. Внешнюю синхронизацию не используют из-за дороговизны реализации еще одного канала. Много схем физического кодирования являются самосинхронизирующимися — они разрешают выделить синхросигнал из принимаемой последовательности состояний канала.

Скремблирование на физическом уровне разрешает подавить очень сильные спектральные характеристики сигнала, размазывая их по некоторой полосе спектра. Очень сильные помеха искажают соседние каналы передачи. При разговоре о физическом кодирировании, возможное использование следующие термины:

- транзитное кодирование — информативным есть переход из одного состояния в другое

- потенциальное кодирование — информативным есть уровень сигнала в конкретные моменты времени

- полярное — сигнал одной полярности реализуется для представления одного значения, сигнал другой полярности для — другого. При оптоволоконное транспортировке вместо полярности используют амплитуды импульса

- униполярное — сигнал одной полярности реализуется для представления одного значения, нулевой сигнал — для другого

- биполярное — используется отрицательное, положительное и нулевое зна-чения для представления трех состояний

- двухфазное — в каждом битовом интервале присутствует переход из одного состояния в другое, что используется для выделения синхросигнала.

3.3 Популярные схемы кодирования, которые применяются в локаль-ных сетях

AMI/ABP

AMI — Alternate Mark Inversion или же ABP — Alternate bipolare, биполярная схема, которая использует значения +V, 0V и -V. Все нулевые биты имеют значения 0V, единичные — чередующимися значениями +V, -V. Применяется в DSx (DS1 — DS4), ISDN. Такая схема не есть полностью самосинхронизирующейся — длинная цепочка нулей приведет к потере синхронизации.

MAMI

MAMI — Modified Alternate Mark Inversion, или же ASI — модифицирован-ная схема AMI, импульсами чередующейся полярности кодируется 0, а 1 — нулевым потенциалом. Применяется в ISDN (S/T — интерфейсы).

B8ZS

B8ZS — Bipolar with 8 Zero Substitution, схема аналогичная AMI, но для син-хронизации исключает цепочки 8 и более нулей ( за счет вставки бит).

HDB3

HDB3 — High Density Bipolar 3, схема аналогичная AMI, но не допускает пе-редачи цепочки более трех нулей. Вместо последовательности из четырех нулей вставляется один из четырех биполярных кодов.

Манчестерское кодирование

Manchester encoding — двухфазное полярное/униполярное самосинхронизи-рующееся кодирование. Текущий бит узнается по направлению смены состояния в середине битового интервала: от -V к +V: 1. От +V к -V: 0. Переход в начале интервала может и не быть. Применяется в Ethernet. (В начальных версиях — униполярное).

Дифференциальное манчестерское кодирование

Differential manchester encoding — двухфазное полярное/униполярное само-синхронизирующиеся код. Текущий бит узнается по наличию перехода в начале битового интервала (рис. 4.1), например 0 — есть переход (Вертикальный фраг-мент), 1 — нет перехода (горизонтальный фрагмент). Можно и наоборот опреде-лять 0 и 1.В середине битового интервала переход есть всегда. Он нужен для синхронизации. В Token Ring применяется измененная версия такой схемы, где кроме бит 0 и 1 определенны также два бита j и k (Рис. 4.2). Здесь нет переходов в середине интервала. Бит К имеет переход в начале интервала, а j — нет.

MLT-3

Трехуровневое кодирование со скремблированием который не самосинхро-низуется. Используются уровни (+V, 0, -V) постоянные в линии каждого битового интервала. При передаче 0 значения не меняются, при передаче 1 — меняются на соседние по цепочке +V, 0, -V, 0, +V и тд. (рис. 5). Такая схема является усложнонным вариантом NRZI. Применяется в FDDI и 100BaseTX.

NRZ и NRZI

NRZ — Non-return to zero (без возврата к нулю), биполярная нетранзиктивная схема (состояния меняются на границе), которая имеет 2 варианта. Первый вариант это недифференциальное NRZ (используется в RS-232) состояние напрямую отражает значение бита (рис. 6.а). В другом варианте — дифференциальном, NRZ состояние меняется в начале битового интервала для 1 и не меняется для 0. (рис.6.Б). Привязки 1 и 0 к определенному состоянию нету .

NRZI — Non-return to zero Inverted, измененная схема NRZ (рис. 6.в). Тут со-стояния изменяются на противоположные в начале битового интервала 0, и не меняются при передаче 1. Возможна и обратная схема представления. Использу-ются в FDDI, 100BaseFX.

RZ — Return to zero (с возвратом к нулю), биполярная транзитивная само-синхронизирующаяся схема. Состояние в определенный момент битового интервала всегда возвращается к нулю. Имеет дифференциаль-ный/недифференциальный варианты. В дифференциальном привязки 1 и 0 к со-стоянию нету. (рис. 7.а).

FM 0

FM 0 — Frequency Modulation 0 (частотная модуляция), самосинхронизиру-ющийся полярный код. Меняется на противоположное на границе каждого битового интервала. При передаче 1 в течение битового интервала состояние неизменное. При передаче 0, в середине битового интервала состояние меняется на противоположное. (рис. 8). Используется в LocalTalk.

PAM 5

PAM 5 — Pulse Amplitude Modulation, пятиуровневое биполярное кодирова-ние, где пара бит в зависимости от предыстории оказывается одним из 5 уровней потенциала. Нужен неширокая полоса частот (вдвое ниже битовой скорости). Используется в 1000BaseT.

2B1Q

Здесь пара бит оказывается одним четверичным символом (Quater-nary symbol), где каждому соответствует один из 4 уровней сигнала.

4B3T — блок из 4 бит (16 состояний) кодируется тремя троичными символами (27 символов). Из множества возможных методов изменений рассмотрим MMS43, который используется в интерфейсе BRI сетей ISDN (таблица). Тут применяются специальные методы для исключения постоянной составляющей напряжения в линии, в следствии чего кодирования ряда комбинаций зависит от предыстории — состояния, где находится кодер. Пример: последовательность бит 1100 1101 будет представлена как: + + + — 0 -.

Схемы, которые не являются самосинхронизирующими, вместе с логическим кодированием и определением фиксированной длительности битовых интервалов разрешают достигать синхронизации. Старт-бит и стоп-бит служат для синхронизации, а контрольный бит вводит избыточность для повышения достоверности приема.

Заключение

В ходе курсовой работы была рассмотрена задача кодирования, которая включает в себя:

- изучение способов представления информации в ЭВМ;

- рассмотрение способов кодирования и декодирования информации числовой, текстовой и графической;

- подробное исследование кодирования текстовой информации в компьютере.

Задача кодирования является одним из главных понятий информатики, так как кодирование предшествует передаче и хранению информации, и, соответственно, является основой их успешного осуществления.

При передаче сообщений по каналам связи могут возникать помехи, способные привести к искажению принимаемых знаков. Эта проблема решается с помощью помехоустойчивого кодирования. Помехоустойчивое кодирование передаваемой информации позволяет в приемной части системы обнаруживать и исправлять ошибки. Коды, применяемые при помехоустойчивом кодировании, называются корректирующими кодами. Впервые, исследование эффективного кодирования произвел Клод Шеннон. Для теории связи важнейшее значение имеют две теоремы, доказанные Шенноном.

В работе были рассмотрены эти теоремы, и можно прийти к выводу, что первая – затрагивает ситуацию с кодированием при передаче сообщения по линии связи, в которой отсутствуют помехи, искажающие информацию, т.е. эта теорема является эталоном, какими должны быть помехоустойчивые коды, вторая теорема относится к реальным линиям связи с помехами.

В ходе курсовой работы были составлены примеры кодирования, на основе первой теоремы Шеннона. Это кодирования является достаточно эффективным, так как получаемый код практически не имеет избыточности, но, к сожалению, в реальных линиях связи множество помех, и такой результат недостижим. Поэтому код Шеннона не является таким же эффективным как, например, код Хафмена. Но, несмотря на это нужно отметить, что Клод Шеннон был одним из основателей теории кодирования и его работы внесли огромный вклад в развитие информатики.

Библиография

Нормативно-правовые документы

1. Конституция Российской Федерации от 12 декабря 1993 г. (с изм. и доп., вступ. в силу с 21.07.2014)

Научная литература

Босова Л.Л Информатика и ИКТ 6 класс [Текст]: Учебник/ Босова Л.Л .- М.: Изд-во "БИНОМ. Лаборатория знаний", 2016. - 208 с.;
Босова Л.Л Информатика и ИКТ 7 класс [Текст]: Учебник/ Босова Л.Л..- М.: Изд-во "БИНОМ. Лаборатория знаний", 2018. - 229 с.; .
Куликовский Л.Ф., Мотов В.В. Теоретические основы информационных процессов: Учеб. пособие для вузов по спец. "Автоматика и механизация процессов обработки и выдачи информации". – М.:Высшая школа, 2017. – 248с.
В.М. Лачинов, А.О.Поляков Информодинамика или Путь к Миру открытых систем http://www.inftech.webservis.ru/it/information/index.html
Энциклопедия "Кругосвет" www.krugosvet.ru
Инженер Мареев Новая теория информации www.eme.ru
Лидовский В.В. Теория информации. Учебное пособие. - М.: Компания Спутник+, 2014г.
Вернер М. Основы кодирования Учебник для вузов. – М.: Техносфера,2018. – 288с.
Котоусов А.С. Теоретические основы радиосистем. Радиосвязь, радиолокация, радионавигация. – М.: Радио и связь, 2014. – 224с.
Гаранин М.В., Журавлев В.И., Кунегин С.В. Системы и сети передачи информации: Учеб. пособие для вузов. – М.: Радио и связь, 2017. – 336с.
Липкин И.А. Статистическая радиотехника. Теория информации и кодирования. – М.: "Вузовская книга", 2012. – 216с.
Быховский М.А. Круги памяти (Очерки истории развития радиосвязи и вещания в XX столетии). Серия изданий "История электросвязи и радиотехники". – М.: МЦНТИ, ООО "Мобильные коммуникации", 2014. – 224с.
Рузайкин Г. Теория информации и информационные технологии //Открытые системы, 2018, № 07-08
12. Просиз Дж. Цифровая связь. Пер. с англ. /Под ред. Д.Д.Кловского. – М.: Радио и связь, 2019. – 800с.
Шульгин В.И. Основы теории передачи информации. Учебное пособие. Ч.1-2. – Харьков: ХАИ, 2013.
Котоусов А.С. Теоретические основы радиосистем. Радиосвязь, радиолокация, радионавигация. – М.: Радио и связь, 2012
Скляр Б. Цифровая связь. Теоретические основы и практическое применение, 2-е издание. : Пер. с англ. – М.: Издательский дом "Вильямс", 2018. – 1104с.
Семакин И.Г. Информатика и ИКТ для 8-9 классов [Текст]: Учеб. по базовому курсу / Семакин И.Г., Залогова Л.А, Русаков С.В., Шестакова Л.В.. М.: Изд-во "БИНОМ. Лаборатория знаний", 2019. - 320 с.; .
Угринович Н.Д «Информатика и ИКТ» Базовый курс. 9 класс [Текст]: Учебник/ Угринович Н.Д.- М.: Изд-во "БИНОМ. Лаборатория знаний", 2017. 295 с.;
Могилев А.В. Информатика [Текст]: Учеб. для студентов пед. вузов/ Могилев А.В., Пак Н.И., Хённер Е.К. М.: Академия, 2014. - 848 с.
Подласый И. П. Педагогика. Новый курс [Текст]: Учеб. для студентов пед. вузов/ Подласый И. П. - М.: Гуманит. изд. центр ВЛАДОС, 2018.
Бочкин, А.И. Методика преподавания информатики [Текст] / Бочкин А.И.. - Минск : Высшая школа, 2014. - 431 с.

Рузайкин Г. Теория информации и информационные технологии //Открытые системы, 2018, № 07-08 ↑
Босова Л.Л Информатика и ИКТ 7 класс [Текст]: Учебник/ Босова Л.Л..- М.: Изд-во "БИНОМ. Лаборатория знаний", 2018. - 229 с.; . ↑
Котоусов А.С. Теоретические основы радиосистем. Радиосвязь, радио-локация, радионавигация. – М.: Радио и связь, 2014. – 224с. ↑
Лидовский В.В. Теория информации. Учебное пособие. - М.: Компания Спутник+, 2014г. ↑
Рузайкин Г. Теория информации и информационные технологии //Открытые системы, 2018, № 07-08 ↑
Котоусов А.С. Теоретические основы радиосистем. Радиосвязь, радиолокация, радионавигация. – М.: Радио и связь, 2012 ↑
Подласый И. П. Педагогика. Новый курс [Текст]: Учеб. для студентов пед. вузов/ Подласый И. П. - М.: Гуманит. изд. центр ВЛАДОС, 2018. ↑
Угринович Н.Д «Информатика и ИКТ» Базовый курс. 9 класс [Текст]: Учебник/ Угринович Н.Д.- М.: Изд-во "БИНОМ. Лаборатория знаний", 2017. 295 с.; ↑
Лидовский В.В. Теория информации. Учебное пособие. - М.: Компания Спутник+, 2014г. ↑