Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Стандарты представления текстовой информации в ИС (Гипертекстовые и мультимедийные информационные технологии)

Содержание:

Введение

Основные понятия представления текстовой информации в ИС.

Рассмотрение данного вопроса правильней было бы начать с определения «Информационной системы».

Информационная система (ИС) — это система, предназначенная для ведения информационной модели, чаще всего — какой-либо области человеческой деятельности.

Эта система должна обеспечивать средства для протекания информационных процессов:

  • Хранение;
  • Передача;
  • Преобразование информации.

Различают 3 класса информационных систем по степени их автоматизации:

Ручные информационные системы - характеризуются отсутствием современных технических средств переработки информации и выполнением всех операций

человеком. Например, о деятельности менеджера в фирме, где отсутствуют компьютеры, можно говорить, что он работает с ручной ИС.

Автоматизированные информационные системы (АИС) - наиболее популярный класс ИС. Предполагают участие в процессе обработки информации и человека, и

технических средств, причем главная роль отводится компьютеру.

Автоматические информационные системы — выполняют все операции по переработке информации без участия человека, различные роботы. Примером автоматических информационных систем являются многие поисковые системы сети

Интернет, например Google, Rambler, Yandex, где сбор информации о сайтах осуществляется автоматически поисковым роботом (crawler) и человеческий фактор не влияет на ранжирование результатов поиска.

Обычно под термином ИС понимают именно Автоматизированные информационные системы (АИС).

Основная часть

Обработка текстовой информации.

Существует множество методов обработки информации, но в большинстве случаев они сводятся к обработке текстовых и числовых данных.

Текстовая информация может возникать из различных источников и иметь различную степень сложности по форме представления. В зависимости от формы представления для обработки текстовых сообщений используют разнообразные информационные технологии. Чаще всего в качестве инструментального средства обработки текстовой электронной информации применяют текстовые редакторы или процессоры. Они представляют программный продукт, обеспечивающий пользователя специальными средствами, предназначенными для создания, обработки и хранения текстовой информации. Текстовые редакторы и процессоры используются для составления, редактирования и обработки различных видов информации. Отличие текстовых редакторов от процессоров заключается в том, что редакторы, как правило, предназначены для работы только с текстами, а процессоры позволяют использовать и другие виды информации.

Редакторы, предназначенные для подготовки текстов условно можно разделить на обычные (подготовка писем и других простых документов) и сложные (оформление документов с разными шрифтами, включающие графики, рисунки и др.). Редакторы, используемые для автоматизированной работы с текстом, можно разделить на несколько типов: простейшие, интегрированные, гипертекстовые редакторы, распознаватели текстов, редакторы научных текстов, издательские системы.

В простейших редакторах-форматерах (например, “Блокнот”) для внутреннего представления текста дополнительные коды не используются, тексты же обычно формируются на основе знаков кодовой таблицы ASCII.

Текстовые процессоры представляют систему подготовки текстов (Word Processor). Наибольшей популярностью среди них пользуется программа MS Word. Технология обработки текстовой информации с помощью таких программ обычно включает следующие этапы:

1) создание файла для хранения текстовой информации;

2) ввод и (или) копирование текстовой информации в компьютер;

3) сохранение текста, представленного в электронной форме;

4) открытие файла, хранящего текстовую информацию;

5) редактирование электронной текстовой информации;

6) форматирование текста, хранящегося в электронной форме;

7) создание текстовых файлов на основе встроенных в текстовый редактор стилей оформления;

8) автоматическое формирование оглавления к тексту и алфавитного справочника;

9) автоматическая проверка орфографии и грамматики;

10) встраивание в текст различных элементов и объектов;

11) объединение документов;

12) печать текста.

К основным операциям редактирования относят: добавление; удаление; перемещение; копирование фрагмента текста, а также поиска и контекстной замены. Если создаваемый текст представляет многостраничный документ, то можно применять форматирование страниц или разделов. При этом в тексте появятся такие структурные элементы, как: закладки, сноски, перекрестные ссылки и колонтитулы.

Большинство текстовых процессоров поддерживает концепцию составного документа – контейнера, включающего различные объекты. Она позволяет вставлять в текст документа рисунки, таблицы, графические изображения, подготовленные в других программных средах. Используемая при этом технология связи и внедрения объектов называется OLE (Object Linking and Embedding – связь и внедрение объектов).

Для автоматизации выполнения часто повторяемых действий в текстовых процессорах используют макрокоманды. Самый простой макрос – записанная последовательность нажатия клавиш, перемещений и щелчков мышью. Она может воспроизводиться, как магнитофонная запись. Её можно обработать и изменить, добавив стандартные макрокоманды.

Перенос текстов из одного текстового редактора в другой осуществляется программой-конвертером. Она создаёт выходной файл в соответствующем формате. Обычно программы текстовой обработки имеют встроенные модули конвертирования популярных файловых форматов.

Разновидностью текстовых процессоров являются настольные издательские системы. В них можно готовить материалы по правилам полиграфии. Программы настольных издательских систем (например, Publishing, PageMaker) являются инструментом верстальщика, дизайнера, технического редактора. С их помощью можно легко менять форматы и нумерацию страниц, размер отступов, комбинировать различными шрифтами и т.п. В большей степени они предназначены для издания полиграфической продукции.

Международные стандарты кодов символов и их представление в современных ИС, языках программирования и программных платформах.

Кодировки ASCII, ANSI, КОI8 и некоторые другие.

Поскольку текст изначально дискретен — он состоит из отдельных символов, — для компьютерного представления текстовой информации используется другой способ: все символы кодируются числами, и текст представляется в виде набора чисел — кодов символов, его составляющих. При выводе текста на экран монитора или принтера необходимо восстановить изображения всех символов, составляющих данный текст. Для этого используются так называемые кодовые таблицы символов, в которых каждому коду символа ставится в соответствие изображение символа.

Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

Существует много различных кодировок. В большинстве из них символы кодируются восьмибитовыми (или однобайтными) числа­ми. В одном байте можно записать 256 различных целых чисел. Это­го достаточно для кодирования всех букв русского и латинского ал­фавитов, арабских цифр, знаков препинания и некоторых других необходимых символов.

Для наглядности кодируемые символы располагаются в табли­це. Таблица разбита на 16 строк и 16 столбцов. Каждая строка и ка­ждый столбец имеют четырехразрядные двоичные номера от 0000 до 1111 (или шестнадцатеричные от 0 до F). Код символа составляется из номеров столбца и строки, на пересечении которых он находится. Этим двоичным числам соответствуют десятичные числа от 0 до 255.

До появления операционной системы Windows основной явля­лась кодовая таблица символов ASCII (American Standard Code for Information Interchange - американский стандартный код обмена информацией).

Разработана она была в 1960-х годах в США и применялась для любых видов передачи информации, в том числе и некомпьютерных (телеграф, факсимильная связь и т. д.).

Первая половина таблицы ASCII (коды от 0 до 127) содержит знаки препинания, цифры, символы латинского алфавита, матема­тические знаки и является общепринятой. Коды от 128 до 255 назы­ваются расширенными и используются для национальных алфави­тов и символов псевдографики.

В таблице ASCII отсутствуют символы кириллицы. Для пред­ставления кириллицы в DOS была разработана кодовая страница СР-866, построенная на основе ASCII. Символы с кодами от 0 до 127 в этой таблице такие же, как в кодировке ASCII, а символы кирил­лицы расположены на тех позициях, где в таблице ASCII находятся относительно редко используемые символы национальных алфави­тов и греческие буквы. Ниже приведен фрагмент этой таблицы []. Символам кириллицы здесь соответствуют десятичные коды от 128 до 175 и от 224 до 239.

С появлением графической среды Windows ASCII морально ус­тарела, в частности, ненужными стали псевдографические символы. Фирмой Мiсrosоft была разработана новая кодовая таблица ANSI. Для представления кириллицы в Windows на основе кодировки ANSI построена кодовая страница СР-12565. Символам кириллицы здесь соответствуют шестнадцатеричные коды от С0 до FF, или в десятичной системе счисления от 192 до 255.

В середине семидесятых годов специалистами одного из советских НИИ был разра­ботан новый стандарт, предназначенный для представления символов русского языка в электронной форме. Сейчас эта кодировка известна под наименованием КОI8 (код обмена информации восьмибитовый). Став базовой кодировкой для только что появившихся тогда в нашей стране русифицированных UNIХ - совместимых опера­ционных систем, KOI8 была принята Госстандартом СССР в качестве базовой спецификации для обмена электронными документами на русском языке, в силу чего данной кодировке было присвоено соответствие стандарту ГОСТ 19768-74.

После ликвидации Советского Союза этот стандарт претерпел некоторые изменения, разделившись на две отдельные спецификации: KOI8-R применяется в настоящее время для представления символов русского языка, KOI8-U – украинского.

Кодировка КОI8 также используется в качестве принятого в Российском Интернете «формата по умолчанию» при пересылке сообщений электронной почты.

Стандарт MicroSoft/IBM code page 866 (альтернативная кодировка DOS) служит базовой кодировкой в операционных системах MS-DOS и OS/2, и потому в настоя­щее время медленно, но верно утрачивает свои позиции, ибо даже сам разработ­чик и производитель DOS компания Мiсrоsоft отказалась от дальнейшей поддер­жки этой линии операционных платформ. Тем не менее, кодировка жива и по сей день, прежде всего благодаря той части пользователей, которые не намерены пока расставаться с браузерами, работающими в среде MS – DOS.

Компания MicroSoft, создавая программное обеспечение для работы в Интерне­те, как водится, пошла своим путем, предложив стандарт Мiсrоsоft code page 1251 (Windows-1251), получивший чрезвычайно широкое распространение благодаря необыкновенной популярности операционной системы Мiсrоsоft Windows и http - сервера IIS (Internet 1nformation Server), входящего в комплект поставки Windows NT/2000. Именно поэтому и Windows – 1251, и KOI8 - R входят в тот минимально допустимый набор кодировок, которые должна обязательно поддерживать любая мало-мальски уважающая себя веб - страница.

Кодировка ISO – 8859-5 была разработана Международной организацией по стандартизации (International Standards Organization, ISO) с единственной целью: унифицировать представление символов национальных алфавитов в электронной форме. Именно поэтому ISO предложила целый набор кодировок серии 8859, каждая из которых описывала свой набор знаков: существует соответствующая кодировка ISO для арабского языка (ISO-8859-6), иврита (ISO-8859-8), латиницы (ISO-8859-1) и других языков мира. В силу различных причин русский вариант кодировки ISO не получил широкого распространения, однако все же изредка встречается в Интер­нете и потому поддерживается рядом русскоязычных серверов.

Кодировка Macintosh СР (МАС) ориентирована на персональные компьютеры Apple Macintosh, оснащенные операционной системой MacOS. Из-за высокой сто­имости Аррlе - совместимые компьютеры не стали в России популярными, однако они весьма широко используются на Западе и иногда эксплуатируются на круп­ных отечественных предприятиях.

В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode, который, по замыслу его разработчиков, позволил бы использовать в текстах любые символы любых языков мира. Этот стандарт используется в качестве основной кодировки в операционной системе Microsoft Windows ХР.

Стандарт кодирования символов Unicode.

Unicode (Юникод или Уникод, англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Юникод имеет несколько форм представления: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) и UTF-32 (UTF-32BE, UTF-32LE). Была разработана также форма представления UTF-7 для передачи по семибитным каналам, но из-за несовместимости с ASCII она не получила распространения и не включена в стандарт. В Microsoft Windows NT и основанных на ней системах Windows 2000 и Windows XP в основном используется форма UTF-16LE. В UNIX-подобных операционных системах GNU/Linux, BSD и Mac OS X принята форма UTF-8 для файлов и UTF-32 или UTF-8 для обработки символов в оперативной памяти.

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. «Unicode Consortium»), объединяющей крупнейшие IT-корпорации. Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита и кириллицы, при этом становятся ненужными кодовые страницы.

Коды в стандарте Unicode разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены коды от U+0400 до U+052F.

Большинство современных операционных систем в той или иной степени обеспечивают поддержку Юникода.

В операционных системах семейства Windows NT для внутреннего представления имён файлов и других системных строк используется двухбайтовая кодировка UTF-16LE. Системные вызовы, принимающие строковые параметры, существуют в однобайтном и двухбайтном вариантах.

UNIX-образные операционные системы, в том числе, Linux, BSD, Mac OS X, используют для представления Юникода кодировку UTF-8. Большинство программ могут работать с UTF-8 как с традиционными однобайтными кодировками, не обращая внимания на то, что символ представляется как несколько последовательных байт. Для работы с отдельными символами строки обычно перекодируются в UCS-4, так что каждому символу соответствует машинное слово.

Одной из первых успешных коммерческих реализаций Юникода стала среда программирования Java. В ней принципиально отказались от восьмибитного представления символов в пользу шестнадцатибитного. Сейчас большинство языков программирования поддерживают строки Unicode, хотя их представление может различаться в зависимости от реализации.

Стандарт Юникод поддерживает языки как с направлением написания слева - направо (англ. Left – to - right, LTR) так и с написанием справа - налево (англ. Right – to - eft, RTL), как иврит и арабский язык. Кроме того, Юникод поддерживает комбинированные тексты, содержащие одновременно RTL и LTR фразы. Данная возможность называется двунаправленность (англ. bidirectional, Bidir). Простые реализации Юникода могут не иметь поддержки двунаправленности.

Универсальная система кодирования (Юникод) представляет собой набор графических символов и способ их кодирования для компьютерной обработки текстовых данных.
Графические символы — это символы, имеющие видимое изображение. Графическим символам противопоставляются управляющие символы и символы форматирования.
Графические символы включают в себя следующие группы:

  • буквы, содержащиеся хотя бы в одном из обслуживаемых алфавитов;
  • цифры;
  • знаки пунктуации;
  • специальные знаки (математические, технические, идеограммы и пр.);
  • разделители.

Юникод — это система для линейного представления текста. Символы, имеющие дополнительные надстрочные или подстрочные элементы, представляются в виде последовательности кодов, составленной по определённым правилам (декомпозированный вариант) или единого символа (композированный вариант).

Представление символа «Й» (U+0419) в виде базового символа «И» (U+0418) и комбинируемого символа «» (U+0306).

Графические символы в Юникод подразделяются на протяжённые и непротяжённые (бесширинные). Непротяженные символы при отображении не занимают места в строке. К ним относятся ударения, диакритические знаки и т. п. При кодировании в Юникоде, как протяжённые, так и непротяжённые символы имеют собственные коды. Протяжённые символы иначе называются базовыми, а непротяжённые — комбинируемыми, потому что они не могут встречаться самостоятельно. Например, символ «á» будет представлен как последовательность базового символа «a» (U+0061) и комбинируемого символа «´» (U+0301) или как отдельный символ «á» (U+00C1).

Юникод включает практически все современные письменности, в том числе: арабскую, армянскую, бенгальскую, бирманскую, греческую, грузинскую, деванагари, иврит, кириллицу, коптскую, кхмерскую, латинскую, тамильскую, хангыль, хань (Китай, Япония, Корея), чероки, эфиопскую, японскую (катакана, хирагана, кандзи) и другие.
С академической целью добавлены многие исторические письменности, в том числе: древнегреческая, египетские иероглифы, клинопись, письменность майя, этрусский алфавит.
В Юникоде представлен широкий набор математических и музыкальных символов, а также пиктограмм.

В Юникоде зарезервировано 1 114 112 (= 220 + 216) позиций символов, из которых сейчас используется около 90000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859-1 (Latin-1).
Хоть формы записи UTF-8 и UTF-32 позволяют кодировать до 231 (2 147 483 648) кодовых позиций, принято решение использовать лишь 220+216 (1 114 112) для совместимости с UTF-16. Впрочем, даже и этого более чем достаточно — на сегодняшний день используется чуть больше 96 000 кодовых позиций.

Кодовое пространство разделено на 17 «плоскостей» по 65536 (= 216) символов. Нулевая плоскость называется базовой, в ней расположены символы наиболее употребительных письменностей. Первая плоскость используется, в основном, для исторических письменностей. Плоскости 16 и 17 выделены для частного употребления.

Для обозначения символов Unicode используется запись вида «U+xxxx» или «U+yyyyyyyy», где xxxx и yyyyyyyy — шестнадцатеричная запись номера символа. Например, символ «я» (U+044F) имеет код 044F16 = 110310.

Базовая многоязыковая плоскость.

Базовая плоскость UNICODE:

Чёрный

— расширенный латинский алфавит;

Голубой

— лингвистические символы международного фонетического алфавита IPA;

Синий

— другие европейские алфавиты;

Оранжевый

— письменности Ближнего Востока;

Светло-оранжевый

— письменности Африки;

Зелёный

— письменности Южной Азии;

Фиолетовый

— письменности Юго-восточной Азии;

Красный

— письменности Восточной Азии;

Розовый

— унифицированные китайско-японско-корейские символы;

Жёлтый

— письменности аборигенов Северной Америки;

Пурпурный

— символы;

Тёмно-серый

— диакритики;

Светло-серый

— суррогатные пары UTF-16 и области для частного использования;

Сине-зелёный

— другие знаки;

Белый

— не используется.

Плоскость 0 (Основная многоязыковая плоскость, англ. Basic Multilanguage Plane, BMP) содержит символы практически для всех современных письменностей и большое число специальных символов. Большая часть таблицы занята китайско – японско - корейскими иероглифами.

Плоскость 1 (дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена, в первую очередь, для исторических письменностей, но также включает музыкальные и математические символы.

Некоторые регионы Unicode выделены для частного использования и экспериментов.
Частная область включает:

  • Регион в Базовой плоскости U+E000…U+F8FF
  • Расширенные плоскости 15 (U+F0000…U+FFFFF) и 16 (U+100000…U+10FFFF).

По мере изменения и пополнения таблицы символов системы Юникода и выхода новых версий этой системы — а эта работа ведётся постоянно, поскольку изначально система Юникод была представлена в ISO в недоработанном виде — выходят и новые документы ISO. Система Юникод существует в общей сложности в следующих версиях:

  • 1.1 (соответствует стандарту ISO/IEC 10646—1:1993),
  • 2.0, 2.1 (тот же стандарт ISO/IEC 10646—1:1993 плюс дополнения: «Amendments» с 1-го по 7-е и «Technical Corrigenda» 1 и 2),
  • 3.0 (стандарт ISO/IEC 10646—1:2000).
  • 3.2 (стандарт 2002 года)
  • 4.0 (стандарт 2003)
  • 4.01 (стандарт 2004)
  • 4.1 (стандарт 2005)
  • 5.0 (стандарт 2006)

Для примера можно рассмотреть символы, представленные в основной плоскости в версии Unicode 4.1.

В Unicode 4.1 в основной плоскости представлены следующие символы:

  • Базовый латинский алфавит (0000—007F)
  • Дополнительные символы Latin-1 (0080—00FF)
  • Расширенный латинский алфавит-A (0100—017F)
  • Расширенный латинский алфавит-B (0180—024F)
  • Международный фонетический алфавит (IPA) Extensions (0250—02AF)
  • Пробельные символы (02B0—02FF)
  • диакритические символы (0300—036F)
  • Греческий и коптский алфавиты (0370—03FF)
  • Кириллица (0400—04FF)
  • Дополнительные символы кириллицы (0500—052F)
  • Армянский алфавит (0530—058F)
  • Еврейский алфавит (0590—05FF)
  • Арабский алфавит (0600—06FF)
  • Сирийский алфавит (0700—074F)
  • Дополнительные символы арабского алфавита (0750—077F)
  • Thaana (0780—07BF)
  • Индийские письменности:
    • Деванагари (0900—097F)
    • Бенгали (0980—09FF)
    • Gurmukhi (0A00—0A7F)
    • Gujarati (0A80—0AFF)
    • Oriya (0B00—0B7F)
    • Tamil (0B80—0BFF)
    • Telugu (0C00—0C7F)
    • Kannada (0C80—0CFF)
    • Malayalam (0D00—0D7F)
    • Sinhala (0D80—0DFF)
  • Тайский алфавит (0E00—0E7F)
  • Лаосская письменность (0E80—0EFF)
  • Тибетская письменность (0F00—0FFF)
  • Бирманский алфавит (1000—109F)
  • Грузинский алфавит (10A0—10FF)
  • Отдельные буквы (Jamo) хангыль (1100—11FF)
  • Амхарский язык (1200—137F)
  • Ethiopic Supplement (1380—139F)
  • Язык чероки (13A0—13FF)
  • Unified Canadian Aboriginal Syllabics (1400—167F)
  • Ogham (1680—169F)
  • Рунный алфавит (16A0—16FF)
  • Филиппинские письменности:
    • Tagalog (1700—171F)
    • Hanunoo (1720—173F)
    • Buhid (1740—175F)
    • Tagbanwa (1760—177F)
  • Кхмерский алфавит (1780—17FF)
  • Монгольский алфавит (1800—18AF)
  • Limbu (1900—194F)
  • Tai Le (1950—197F)
  • New Tai Lue (1980—19DF)
  • Khmer Symbols (19E0—19FF)
  • Buginese (1A00—1A1F)
  • Фонетические расширения (1D00—1D7F)
  • Дополнительные фонетичестие расширения (1D80—1DBF)
  • Дополнительные диакритические знаки (1DC0—1DFF)
  • Latin Extended Additional (1E00—1EFF)
  • Расширенный греческий алфавит (1F00—1FFF)
  • Символы:
    • Пунктуация (2000—206F)
    • Надстрочные и подстрочные знаки (2070—209F)
    • Символы валют (20A0—20CF)
    • Combining Diacritical Marks for Symbols (20D0—20FF)
    • Letterlike Symbols (2100—214F)
    • Number Forms (2150—218F)
    • Стрелки (2190—21FF)
    • Математические операторы (2200—22FF)
    • Прочие технические символы (2300—23FF)
    • Control Pictures (2400—243F)
    • Optical Character Recognition (2440—245F)
    • Enclosed Alphanumerics (2460—24FF)
    • Символы для рисования рамок (2500—257F)
    • Block Elements (2580—259F)
    • Геометрические фигуры (25A0—25FF)
    • Прочие символы (2600—26FF)
    • Dingbats (2700—27BF)
    • Miscellaneous Mathematical Symbols-A (27C0—27EF)
    • Supplemental Arrows-A (27F0—27FF)
    • Азбука Брайля (2800—28FF)
    • Supplemental Arrows-B (2900—297F)
    • Miscellaneous Mathematical Symbols-B (2980—29FF)
    • Supplemental Mathematical Operators (2A00—2AFF)
    • Miscellaneous Symbols and Arrows (2B00—2BFF)
  • Глаголица (2C00—2C5F)
  • Коптский алфавит (2C80—2CFF)
  • Georgian Supplement (2D00—2D2F)
  • Tifinagh (2D30—2D7F)
  • Ethiopic Extended (2D80—2DDF)
  • Supplemental Punctuation (2E00—2E7F)
  • CJK Radicals Supplement (2E80—2EFF)
  • Kangxi Radicals (2F00—2FDF)
  • Ideographic Description Characters (2FF0—2FFF)
  • CJK Symbols and Punctuation (3000—303F)
  • Хирагана (3040—309F)
  • Катакана (30A0—30FF)
  • Чжуинь (Бопомофо) (3100—312F)
  • Хангыль Compatibility Jamo (3130—318F)
  • Kanbun (3190—319F)
  • Расширение Бопомофо (31A0—31BF)
  • CJK Strokes (31C0—31EF)
  • Katakana Phonetic Extensions (31F0—31FF)
  • Enclosed CJK Letters and Months (3200—32FF)
  • CJK Compatibility (3300—33FF)
  • CJK Unified Ideographs Extension A (3400—4DBF)
  • Yijing Hexagram Symbols (4DC0—4DFF)
  • CJK Unified Ideographs (4E00—9FFF)
  • Yi Syllables (A000—A48F)
  • Yi Radicals (A490—A4CF)
  • Modifier Tone Letters (A700—A71F)
  • Syloti Nagri (A800—A82F)
  • Слоги хангыль (AC00—D7AF)
  • Верхняя часть суррогатных пар (D800—DB7F)
  • Верхняя часть суррогатных пар для частного использования (DB80—DBFF)
  • Нижняя часть суррогатных пар (DC00—DFFF)
  • Область для частного использования (E000—F8FF)
  • CJK Compatibility Ideographs (F900—FAFF)
  • Alphabetic Presentation Forms (FB00—FB4F)
  • Arabic Presentation Forms-A (FB50—FDFF)
  • Variation Selectors (FE00—FE0F)
  • Vertical Forms (FE10—FE1F)
  • Combining Half Marks (FE20—FE2F)
  • CJK Compatibility Forms (FE30—FE4F)
  • Small Form Variants (FE50—FE6F)
  • Arabic Presentation Forms-B (FE70—FEFF)
  • Halfwidth and Fullwidth Forms (FF00—FFEF)
  • Специальные символы (FFF0—FFFF)

Некоторые письменности будут добавлены в следующей версии Unicode. Эти письменности и предложенные диапазоны перечислены далее:

  • N'Ko ( Mandekan) (07C0—07FF)
  • Balinese (1B00—1B7F)
  • Lepcha ( Rong) (1C00—1C4F)
  • Latin Extended-C (2C60—2C7F)
  • Santali (Ol Cemet' / Ol Chiki) (2DE0—2DFF)
  • Vai (A500—A61F)
  • Latin Extended-D (A720—A7FF)
  • Phags-pa (A840—A87F)
  • Saurashtra (AB00—AB5F)

Но, как ни грустно это признавать, любая изобретённая человеком система, Unicode не свободен от недостатков.

Недостатки стандарта кодирования символов Unicode.

  • Многие системы письма всё ещё не представлены в Юникоде. Например, письменность церковнославянского языка содержит много дополнительных графических элементов (такие как титлы и надстрочные буквы). Они не могут быть должным образом представлены в системе Юникод, хотя отдельные элементы для этого имеются. Изображение «длинных» надстрочных символов, простирающихся над несколькими буквами, пока в принципе не предусмотрено.
  • Тексты на китайском, корейском и японском языке имеют традиционное написание сверху вниз, начиная с правого верхнего угла. Данная возможность не отражена в Юникоде (впрочем, она и не должна быть отражена, поскольку это относится к форматированию текста, а не к кодированию символов).
  • В стандартах Юникода не было зафиксировано, когда вводится отдельная кодовая позиция для готового (Precomposed) символа, а когда его необходимо набирать из базового и диакритического. Например, русские буквы Ё (U+0401) и Й (U+0419) существуют в виде отдельных символов, хотя могут быть представлены и набором базового символа плюс диакритика (Decomposed): Е+¨ (U+0415 U+0308), И+ (U+0418 U+0306). В то же время, множество символов из языков с алфавитами на основе кириллицы не имеют precomposed форм.
  • Юникод предусматривает возможность разных начертаний одного и того же символа в зависимости от языка. Так, китайские иероглифы могут иметь разные начертания в китайском, японском (кандзи) и корейском (ханджа), но при этом в Юникоде обозначаться одним и тем же символом (так называемая CJK-унификация), хотя упрощённые и полные иероглифы всё же имеют разные коды. Часто возникают накладки, когда, например, японский текст выглядит «по-китайски». Аналогично, русский и сербский языки используют разное начертание курсивных букв n и m (в сербском они выглядят как и и ш). Поэтому нужно следить, чтобы текст всегда был правильно помечен как относящийся к тому или другому языку.
  • Файлы с текстом в Юникоде занимают больше места в памяти, так как один символ кодируется не одним байтом, как в различных национальных кодировках, а последовательностью байтов (исключение составляет UTF-8 для языков алфавит которых укладывается в ASCII). Однако с увеличением мощности компьютерных систем и удешевлением памяти и дискового пространства эта проблема становится всё менее существенной.
  • Хотя поддержка Юникода реализована в наиболее распространённых операционных системах, не всё прикладное программное обеспечение поддерживает корректную работу с ним. В частности, не всегда обрабатываются метки BOM и плохо поддерживаются диакритические символы. Проблема является временной и есть следствие сравнительной новизны стандартов Юникода (в сравнении с однобайтовыми национальными кодировками).

ISO/IEC 10646.

Консорциум Юникода работает в тесной связи с рабочей группой ISO/IEC/JTC1/SC2/WG2, которая занимается разработкой международного стандарта 10646 (ISO/IEC 10646). Между стандартом Юникода и ISO/IEC 10646 установлена синхронизация, хотя каждый стандарт использует свою терминологию и систему документации.

Сотрудничество Консорциума Юникода с Международной организацией по стандартизации (англ. International Organization for Standardization, ISO) началось в 1991 году. В 1993 году ISO выпустила стандарт DIS 10646.1. Для синхронизации с ним, Консорциум утвердил стандарт Юникода версии 1.1, в который были внесены дополнительные символы из DIS 10646.1. В результате, значения закодированных символов в Unicode 1.1 и DIS 10646.1 полностью совпали.

В дальнейшем сотрудничество двух организаций продолжилось. В 2000 году стандарт Unicode 3.0 был синхронизирован с ISO/IEC 10646-1:2000. Предстоящая третья версия ISO/IEC 10646 будет синхронизирована с Unicode 4.0. Возможно, эти спецификации даже будут опубликованы как единый стандарт.

Аналогично форматам UTF-16 и UTF-32 в стандарте Юникода, стандарт ISO/IEC 10646 также имеет две основные формы кодирования символов: UCS-2 (2 байта на символ, аналогично UTF-16) и UCS-4 (4 байта на символ, аналогично UTF-32). UCS значит универсальный многооктетный (многобайтовый) кодированный набор символов (англ. Universal Multiple-Octet Coded Character Set). Как уже упоминалось, UCS-2 можно считать подмножеством UTF-16 (UTF-16 без суррогатных пар), а UCS-4 является синонимом для UTF-32.

Шрифты и особенности работы с ними в ИС.

Шрифт — это общий термин, которым называют набор печатаемых или отображаемых текстовых символов определенного стиля (например, жирный или курсив) и определенного размера (например, 10 пунктов), имеющих конкретное начертание (например, Times New Roman).

До 1984 года термин «шрифт» был понятен только графическим дизайнерам, издателям и тем, кто имел дело с большими печатными прессами, но не с периферией настольных компьютеров. Те, кто использовал компьютеры тогда, привыкли видеть на компьютерном экране достаточно грубые, моноширинные буквы и цифры и получать на печати документы, которые в лучшем случае выглядели как отпечатанные на пишущей машинке. Но в том же году произошли два события, которые раз и навсегда изменили мир шрифтов. Во-первых, компания Apple Computer представила компьютер Macintosh, во-вторых, Hewlett-Packard выпустила первый принтер LaserJet. Macintosh предложил компьютерному миру концепцию множественных шрифтов, которые действительно выглядели как шрифты в книгах и журналах. LaserJet содержал два новых пропорциональных рисунка шрифтов, и с того момента пользователи начали набирать свои заметки и отчеты с помощью Times Roman, Helvetica и других шрифтов. Каждый шрифт имеет индивидуальный облик, который делает его в большей или меньшей степени подходящим для данной публикации. Уверенный, элегантный, богемный, оригинальный, романтический, дружеский - шрифт может иметь самый разный облик.

Общие характеристики шрифтов.

Существует сложившаяся терминология, позволяющая охарактеризовать каждый конкретный шрифт по всем его параметрам:

Гарнитура шрифта (Type family) - совокупность шрифтов, объединенных общими стилевыми признаками, отличными от других шрифтов, т.е. совокупность начертаний, объединенных общим характером графического построения знаков и решением их элементов. Некоторые гарнитуры располагают большим количеством начертаний, чем другие. Благодаря этому можно построить весь документ на одной гарнитуре, используя, где это необходимо различные варианты начертаний. Примером может служить шрифт Helios, который насчитывает около 33 начертаний.

Вот краткий список наиболее используемых гарнитур:

Academy — экономична. Имеет маленькую высоту строчного знака, и потому хорошо читается в крупных кеглях (от двенадцати пунктов и выше). Набирать ею мелко (10 и менее пунктов) основной текст не следует.

Antiqua — это наименование семейства шрифтов. В компьютерном варианте этот шрифт очень близок к классической Литературной гарнитуре. Гарнитура хорошо читается и подходит для любых целей, но несколько бледновата. Ценным свойством является ее экономичность.

Baltica — существует во многих версиях. Хороша для любых целей. Очень легко читается, но не очень экономична.

Bodoni — это тоже целое семейство шрифтов. Очень контрастный шрифт красивого рисунка. Такие шрифты традиционно используют для набора высокохудожественных изданий со "свободным" текстом.

Kudriashov — «Кудряшевская». Красивая, легко читающаяся гарнитура. Очень хорошо воспринимается в плотных, густых текстах. Собственно говоря, была создана именно для этой цели.

Tahoma — гротеск. Очень хорошо смотрится в полосе и на экране.

Officina Sans — гротеск со своеобразными "срезанными" уголками штрихов и "полузасечками". Отлично смотрится в полосе и на экране. Один из "несовковых" шрифтов.

Некоторый набор терминов, которые необходимо знать при работе со шрифтами.

Начертание (Type face) - комплект строчных и прописных знаков, цифр, знаков препинания, спецзнаков и символов. Начертания шрифтов любой гарнитуры отличаются цветовой насыщенностью, пропорциями, контрастностью и наклоном знаков. Наиболее распространенные начертания - Normal (обычный), Bold (полужирный), Italic (курсив или наклонный), Bold Italic (полужирный курсив или наклонный), Condensed (узкий) и Extended (широкий). Хотелось бы развеять широко распространенное заблуждение о том, что курсив и наклонный - это одно и то же. Это разные начертания. Наклонный шрифт образуется простым искажением (наклоном) символов исходного (Normal) шрифта. Буквы же в курсивном начертании имеют лишь сходство с прямыми по стилю, но рисунок их совсем другой. Наклонное начертание может быть создано программой, курсивное должно изначально содержаться в файле шрифта.

Насыщенность шрифта определяется изменением толщины основных и соединительных штрихов одноименных знаков в различных начертаниях. Непрерывный ряд начертаний составляют: светлое (light), нормальное (regular, book), полужирное (demi), жирное (bold), темное (heavy), черное (black) и сверхжирное (extra bold).

Пропорции шрифта - показатель изменения ширины одноименных знаков в начертаниях одной гарнитуры от сверхузких до сверхшироких. Шрифт может быть узким (condensed), нормальным (normal) и широким (extended). Обычно в комплекте идут шрифты с нормальным начертанием, но большинство программ позволяют менять соотношение высота-ширина шрифта и получать нужный эффект.

Контрастность - один из основных признаков шрифта, выраженный отношением толщины соединительных штрихов к толщине основных штрихов знаков. Эта характеристика изменяется от неконтрастных до сверхконтрастных шрифтов.

Кегель - это величина площадки, на которой размещается знак (буква). Кегль, или размер (size) шрифта определяется его высотой, измеренной в типографских пунктах (point или pt): 12 пунктов = 1 пике, 6 пик одному дюйму. В основу измерений шрифтов положена система Дидо, распространенная в Европе и принятая в России, и так называемая система Пика (англо-американская). В любом случае, основной единицей измерения является пункт, равный в системе Дидо 0,376 мм, а в системе Пика - 0,352 мм. Разница составляет около 7 %. Например, кегль 10 пунктов равен 3,76 мм (3,52 мм в системе Пика). (Поэтому при указании кегля обязательно нужно уточнить, какой пункт имеет в виду заказчик, а какой заложен в верстке.)
Ещё во времена металлического набора у наборщиков сложилось профессиональное наименование кеглей различного размера: кегль 6 пунктов - нонпарель, кегль 8 пунктов - петит, кегль 9 пунктов - боргес и т.д. Основные кегли: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 18, 20, 24, 28, 32, 36, 42, 48 п.

Базовая линия - воображаемая линия, проходящая по нижнему краю основного элемента символа, называется базовой линией. Литера как бы лежит на этой линии.

Наклон знака определяется углом, который он образует с вертикальной осью.

Комплектность (полиграфический алфавит) - совокупность всех знаков, необходимых для набора текста: строчных, прописных, цифр, знаков препинания, спецзнаков и символов.

Интерлиньяж - это расстояние между базовыми линиями соседних строк. Оно измеряется в пунктах и складывается из кегля шрифта и расстояния между строками. Например, кегль 10 пунктов при расстоянии между строками в 2 пункта называют кеглем 10 пунктов при интерлиньяже 12 пунктов. Стандартная величина интерлиньяжа определяется как 110-120% кегля, но так бывает не всегда.

Кернинг и трекинг, будучи атрибутами символов, характеризуют не сами символы, а расстояние между ними, т.е. межсимвольные пробелы. Они необходимы для улучшения зрительного восприятия текста. Кернингом называется изменение ширины пробела для конкретных пар литер. Обычно кернинг делается в сторону уменьшения пробела таким образом, что выступающие части одной литеры пары заходят в пространство второй литеры. Результат - размещение символов становится зрительно более равномерным. Фирменные шрифты снабжены таблицами кернинга, то есть списком пар, для которых нужно сокращать пробел при наборе текста. Это, например, ГО, ГА, АУ, Ст и другие. Если в шрифте есть большая таблица пар кернинга, он будет хорошо и равномерно смотреться в разном кегле. Программы верстки снабжены возможностью автоматического кернинга, они имеют собственные таблицы пар. В таких программах можно организовать автоматическую корректировку пробелов в парах кернинга в тексте любой длины. После обработки текста автоматическим кернингом в заголовках и другом крупном тексте дополнительно проводят ручной кернинг, то есть символы сближают вручную. Чем крупнее текст, тем большее значение для его внешнего вида имеет кернинг. Для проведения ручного кернинга курсор должен быть установлен между сближаемыми символами. При изменении значения кернинга первая литера остается на месте, вторая перемещается. Трекинг, в отличие от кернинга, задается не для пары, а для нескольких символов и в данной программе характеризует величину межсимвольного пробела в группе символов. Пробелы меняются одинаково для всех выделенных символов. Если задавать трекинг для выделенной пары, то он будет аналогичен кернингу. Кернинг и трекинг измеряются в специальных относительных единицах - тысячных долях круглой шпации (ems/1000), поскольку при смещении в паре важны не точные значения, а их отношение к величине символов в конкретной гарнитуре. В данном случае применение такой относительной единицы автоматически делает эти смещения пропорциональными кеглю шрифта. В полиграфии используются дополнительные единицы измерения - круглая шпация, полукруглая шпация, тонкая шпация, характеризующие горизонтальные размеры шрифта. Они соответствуют ширине заглавных букв М, N и строчной буквы t. Таким образом, круглая шпация примерно равна размеру шрифта, полукруглая шпация составляет 0,5 размера шрифта, а тонкая шпация - 0,25 размера шрифта. Поскольку все шрифты разные, то и ширина литеры М у них может различаться. Таким образом, значение круглой шпации колеблется в зависимости от кегля и гарнитуры. Шпации применяются при измерениях абзацных отступов, кернинга и других перемещениях символов.

Удобочитаемость шрифта определяется скоростью (быстротой восприятия) и удобством чтения как отдельных знаков, так и текста в целом, а также правильностью понимания прочитанного без лишнего напряжения и повышенной утомляемости.
Удобочитаемость отдельных гарнитур шрифтов в значительной степени определяется квалификацией и навыками читателей. Различают четыре модели чтения: побуквенное, послоговое, пословное, понятиями. При побуквенном и послоговом чтении наилучшей удобочитаемостью обладают гротесковые шрифты, значительно меньшей — шрифты Литературной гарнитуры и еще меньшей - Обыкновенной гарнитуры. Геометрические параметры шрифта: при пословном чтении преимущества шрифтов снижаются с уменьшением кегля шрифта, так как в шрифтах мелких кеглей буквы сходных очертаний (с, е; н, к; з, в; н, и) труднее различать. Шрифты Литературной гарнитуры сохраняют хорошую удобочитаемость во всех кеглях.

Выравнивание текста не имеет смысла для отдельных символов, это атрибут абзаца. Для текста любого типа выравнивание может быть задано для каждого абзаца отдельно. Оно определяется как: выровненный по левому краю (Left justify), по центру (Center justify), по правому краю (Right justify) и по ширине (Fully justify). В тексте, выровненном по ширине, строки выравниваются по правому и левому краю колонки.

Спуск - понятие, которое вызывает особый интерес у начинающих. Дело в том, что когда-то спусковые полосы содержали в себе заставки. В силу различных причин сейчас заставки почти не употребляются. Но пробел перед началом новой части большого текста остался и является важной частью его внутренней иерархии.

Использование шрифта.

В зависимости от целевого назначения шрифты можно разделить на: текстовые, выделительные, титульные (заголовочные), для акцидентного набора, афишно-плакатные.
К текстовым относятся шрифты светлого прямого начертания кг. 5-14. Для набора основного текста книг и журналов обычно используют гарнитуры — Literaturnaya (Литературную), Банниковскую, Usual New (Обыкновенную новую), Bodoni (Бодони), School (Школьную), Journal (Журнальную) и др.; для газетного набора - New Journal (Новую газетную), School, Usual (Обыкновенную).

    • Шрифты кг. 6, 7 используют для набора основного текста компактных изданий — карманных справочников и словарей, для объявлений в газетах, а также как дополнительные шрифты к основному кеглю.
    • Шрифт кг. 8 применяют для набора основного текста некоторых массовых журналов, справочников, указателей, словарей, для дополнительного и справочно-вспомогательных текстов, а также таблиц в книгах, научных и художественных журналах и газетах.
    • Шрифты кг. 8, 9 используют для набора текста газет; шрифт кг. 10 и частично 9 — для набора основного текста различных книжных изданий и части журналов.
    • Шрифты кг. 12, 14 — для набора основного текста учебников (первых лет обучения) и книг для детей.

К выделительным относятся шрифты курсивные, наклонные, полужирные, жирные, широкие и других начертаний, перечисленные в текстовой группе шрифтов до кг. 14. Их используют для выделений при текстовом наборе (например, драматических произведений), а также в газетах и журналах.
К титульным (заголовочным) относятся крупнокегельные шрифты (кг. 16—48) всех начертаний. Их применяют для набора заголовков в газетах, книгах и журналах, а также для набора текста на титульных листах и обложках, объявлений, грамот, программ и других акцидентных работ. Для тех же целей используют рубленые и неконтрастные группы шрифтов.

Индексация шрифтов. Стандартным шрифтам присвоены определенные буквенные и цифровые индексы.
Первая часть индекса — название гарнитуры шрифта, обозначенное начальными прописными буквами. Например, Обыкновенная гарнитура — О, Академическая — А, Обыкновенная новая — ОН. Чтобы различить гарнитуры, названия которых начинаются с одинаковых букв, к прописной начальной букве добавляют строчную (например, Банниковская — Бн).

Вторая часть индекса — условное обозначение начертания шрифта.

    • Для прямых начертаний обозначения не используют, а курсивные и наклонные шрифты обозначают косой чертой, поставленной за начальными буквами индекса шрифта, например Л/, Бн/, ОН/.
    • В зависимости от ширины строчного знака начертания шрифтов обозначают четными цифрами: сверхузкое — 2; узкое — 4; широкое — 6; сверхширокое — 8. Шрифты с нормальной шириной строчного знака цифру не имеют. Четные цифры ставят за знаком, обозначающим постановку строчного знака.
    • В зависимости от насыщенности строчного знака, начертания шрифтов обозначают нечетными цифрами: светлое — 1, полужирное — 3, жирное — 5. Эти цифры ставят после цифры, обозначающей ширину строчного знака.

Так, шрифт Обыкновенной гарнитуры прямого узкого светлого начертания будет иметь обозначение 041, Академической гарнитуры прямого нормального жирного начертания - А5, Обыкновенной новой гарнитуры курсивного нормального полужирного начертания — ОН/3.
Следующая часть индекса — цифровое обозначение кегля шрифта. Эту цифру ставят после обозначения начертания шрифта и отделяют от него дефисом. В каталогах, прейскурантах и образцах шрифтов вместо дефиса ставят строчную букву, обозначающую способ набора. Так, индекс шрифта Академической гарнитуры курсивного полужирного начертания для ручного набора кг. 10 — А/3р10.


Классификация шрифтов.

Несмотря на огромное количество шрифтов, созданных для компьютерных издательских систем, все их можно разделить на четыре группы: шрифты с засечками (антиква - serif), шрифты без засечек (гротески - sans serif), декоративные (decorative) и рукописные (script).

Засечки или серифы - горизонтальные элементы окончания основных (иногда соединительных) штрихов имеют самую разнообразную форму: прямоугольную, изогнутую, клювообразную, одностороннюю и т.п. Они облегчают чтение, как бы соединяя буквы между собой. Принято считать, что полноценными шрифтами с засечками являются гарнитуры антиквенных групп. Яркий пример серифного шрифта — гарнитуры типа Times, Bodoni, Garamond.

Гротески или рубленные (нем. Grotesk, анг. и фр. Grotesque, амер. Gothic) - это шрифты без засечек, слабоконтрастные или без контраста. Эти шрифты начали распространяться в начале 20-ого столетия – в конце эпохи модерна, их появление положило конец господству антиквенных шрифтов.

Шрифты с засечками (serif).
Шрифты с засечками также называют антиквенными, то есть античными, древними. Дело в том, что впервые подобные элементы у букв применили ещё древние римляне в шрифтах монументальных надписей (прописные) и в книжном гуманистическом минускуле эпохи Ренессанс (строчные).
Первая наборная антиква появилась во второй половине XV века в Италии и Германии. В дальнейшем форма латинской антиквы развивалась: антиква старого стиля (конец XV – начало XVIII в.в.) сменилась переходной антиквой (начало XVIII – конец XVIII в.в.), а затем антиквой нового стиля (конец XVIII – начало XIX в.в.), кроме того, в начале XIX в. появились брусковые шрифты. На основе всех этих исторических форм современные дизайнеры шрифта создают новые версии антиквенных шрифтов.

Шрифты без засечек (sans-serif).
В шрифтах без засечек отсутствуют завершающие элементы на концах штрихов. Название sans-serif происходит от французского sans - без.
Первые шрифты без засечек появились еще в начале XIX века в Англии, но считались экзотикой, хотя подобная форма знаков применялась еще в надписях античной Греции. Новым шрифтам дали название «гротеск» и из-за их необычных свойств использовали редко, в основном в акцидентном наборе. Такое положение вещей оставалось до тех пор, пока немецкая группа "Баухауз" не стала использовать и разрабатывать такие шрифты. Девизом нашествия гротесковых шрифтов стала прагматичность, рациональность, стремление избежать «лишнего». Наиболее известным образцом гротескового шрифта того времени является Futura, шрифт, созданный в Германии в 1928, в нём отразились основные идеи идеологии "Баухауз".
Первые гротески проигрывали серифным шрифтам в удобочитаемости. Futura не смогла занять ведущих позиций, и предпочтение было отдано Helvetica, типичному "офисному" шрифту. Примером дальнейшего развития гротесков является Frutinger (он же Freeset, созданный в 1976); на первый взгляд он напоминает Helvetica, в нем прослеживается тенденция к некоторым "анти-геометрическим" особенностям, типа неравной ширины элементы (особенно в шрифте жирного начертания), непрямоугольность конечных линий, их закругленность (например, в основании вертикальной линии в букве "b"). Все эти тонкости нужны были, чтобы сгладить слишком резкие линии гротеска, повысить четкость знаков, их узнаваемость, в результате получился гораздо более удобочитаемый шрифт — особенно по сравнению с Helvetica или Futura.
Тенденции, которые проявились в шрифте Frutinger, были позднее развиты в семействе шрифтов, чрезвычайно популярных теперь как в вебе, так и в полиграфии. Первый шрифт этого семейства, названного Meta, был разработан в 1984 дизайнерами Эриком Шпикерманом и Лукасом де Гротом. В Meta элементы слегка различаются по ширине (в маленьких кеглях, более тонкие элементы должны не сойти на нет, но, напротив, быть неотличимым от более толстых) и, как компенсация отсутствия засечек, согнутые окончания вертикальных линий в буквах "b" или "n". И прописные и строчные буквы гораздо уже, чем у других гротесков (буквы зрительно вписываются в прямоугольники, а не в квадраты). Задача состояла в том, чтобы, сохранив экономичность шрифта, повысить его удобочитаемость, и чтобы он выглядел при наборе мелким кеглем хорошо и на экране и на дешевой бумаге. Мета был провозглашен "шрифтом девяностых".
В соответствии с формой овалов, наличием или отсутствием контраста, степенью открытости знаков и степенью разноширинности гротески делятся на старые, новые, геометрические и гуманистические. Иногда к гуманистическим гротескам относят также так называемую ленточную антикву – умеренно контрастный шрифт без засечек, конструкция которого повторяет один из видов антиквы.

Рукописные шрифты.
Рукописные, каллиграфические и свободно написанные кистью, а также шрифты, имеющие сходство с рукописными, но не относящиеся к готическим и древнерусским, которые выделены в отдельные группы. Рукописные шрифты делятся в зависимости от пишущего инструмента на шрифты, имитирующие письмо ширококонечным пером, остроконечным пером, кистью и другими инструментами (карандаш, фломастер, шариковая ручка и т.д.). Кроме того, рукописные шрифты могут быть связные (где каждая буква соединяется с соседними) и несвязные (где каждая буква стоит отдельно). Возможны также промежуточные (полусвязные) формы, где соединяется только часть букв или буквы соединяются только с одной стороны. Рукописные шрифты применяются для акциденции и для набора учебной литературы (прописи).

Декоративные шрифты.
Эту категорию составляют многочисленные шрифты, которые не укладываются в обычные группы, а также специально предназначенные для акцидентного набора и имитирующие определенный исторический стиль или декоративную обработку формы, например: Модерн, Ар Деко, Оп-арт, контурные, выворотные, трехмерные, фактурные, орнаментальные, трафаретные, машинописные, экранные, с рваным контуром и т.д. Чаще всего их используют, чтобы подчеркнуть новизну, яркость, индивидуальность. Но, лучше никогда не использовать их в качестве основного текста, мало того что они неудобочитаемы, так еще и эффект пропадает. Заголовки, выделения - вот место где эти шрифты к месту.

Готические шрифты, сейчас применяются в основном как акцидентные. К этой группе относятся шрифты, по рисунку имитирующие средневековые рукописные почерки ширококонечным пером, распространенные в XIII-XVI веках главным образом в северной Европе. Их буквы характеризуются, как правило, узкими пропорциями, сильным контрастом, изломами штрихов, большой насыщенностью и высокой декоративностью. Существует несколько основных форм готических почерков: текстура, ротунда, бастарда, швабахер, фрактура, канцлей. Первые наборные шрифты XV века повторяли форму наиболее распространенных готических почерков и в дальнейшем применялись параллельно с наборной антиквой, практически выйдя из широкого употребления только в ХХ веке.

Старославянские шрифты, сейчас применяются в основном как акцидентные. К этой группе относятся шрифты, по рисунку имитирующие средневековые кириллические почерки ширококонечным пером, распространенные в X-XVIII веках главным образом в восточной и южной Европе. Существует четыре основных вида кириллических почерков: устав, полуустав, скоропись, вязь, а также их переходные формы. Первые наборные кириллические шрифты XV-XVI века повторяли форму рукописного полуустава. После реформы Петра I начала XVIII века полууставные шрифты сохранились только для церковного употребления. Позднее на основе исторических форм появились стилизации старославянских шрифтов.

Неалфавитные и символьные шрифты. К этой группе относятся комплекты специальных знаков (математические, лингвистические, фонетические, химические, астрономические, электротехнические, архитектурные, картографические, нотные, шахматные, клавиатурные и т.д.), линейки, бордюры, орнаменты, виньетки и другие наборные украшения. Также сюда относятся комплекты политипажей на различные темы и пиктограммы (дорожные, спортивные, туристические и т.д.).

Альтернативные шрифты.
В данную группу входят шрифты, которые созданы в собственном ни на что не похожем стиле. В основном это новые виды шрифтовых форм, созданные производителями совсем недавно, и не несущие в основе другие шрифты. Их применение пока рассматривается в основном в качестве броских заголовков (примерно там же где и декоративные шрифты).

Различные исследования показали, что шрифты с засечками читаются легче, так как засечки помогают взгляду передвигаться от буквы к букве, и буквы при этом не сливаются друг с другом. С другой стороны, что буквы без засечек легче читать в шрифтах очень большого или очень малого размера. Но установить единообразные правила очень сложно (а если точнее практически невозможно), так как кроме начертания огромное значение имеет кегль шрифта, длина строк, интерлиньяж, свободное пространство и даже бумага (при представлении продукции в бумажном виде). А если обратить внимание на то, что в последнее время течение моды поставило под вопрос саму удобочитаемость (для привлечения внимания используются причудливые шрифты и различные эффекты их размещения).

Шрифт Times New Roman.

Английский дизайнер и теоретик типографики Уолтер Трэйси (Walter Tracy) назвал шрифт Times New Roman самым замечательным типографическим феноменом двадцатого века. В самом деле, немногие из современных текстовых шрифтов могут сравниться с Times по количеству вариантов, широте применения и общему влиянию на типографику. Этот шрифт, без сомнения, является самым используемым в мире, и ему стоит уделить внимание.

История Times New Roman.

В 1929 году английский типограф и историк шрифта Стэнли Морисон (Stanley Morison) был приглашен как консультант по типографике в старейшую лондонскую газету «Таймс» («The Times») для улучшения ее облика. Его рекомендации сводились к тому, что надо усовершенствовать верстку, но главное - заменить шрифт основного набора.
К этому времени газета уже более 100 лет набиралась английским вариантом антиквы нового стиля, очень контрастным с тонкими засечками. Пробный набор различными шрифтами показал, что существующие гарнитуры либо недостаточно компактны, либо неудовлетворительны по форме, либо плохо читаются в кегле 9 пунктов.

Типичный газетный шрифт, которым набиралась газета «Таймс» до разработки шрифта Times New Roman.

Тогда Морисон предложил создать новую гарнитуру на основе хорошего исторического рисунка, подобно тому, как фирма Monotype разработала свои шрифты Plantin, Baskerville и Perpetua. В ответ руководство газеты, убежденное доводами Морисона, предложило ему самому возглавить проект в сотрудничестве со штатным художником газеты Виктором Лардентом (Victor Lardent).

Приняв это предложение, Морисон решил не использовать выпущенный 4-мя годами ранее американской фирмой Mergenthaler Linotype шрифт Ionic, созданный специально для газетного набора, несмотря на его популярность и удобочитаемость. Для него подобный шрифт ассоциировался с бульварными газетами "для народа". Набор консервативной газеты «Таймс», которую читали министры и государственные деятели Англии, должен был выглядеть иначе.

Под руководством Морисона была разработана новая гарнитура, предположительно на основе шрифта Monotype Plantin (серия 110). По одним сведениям, Морисон передал Ларденту серию собственных карандашных эскизов алфавита нового шрифта, по другим, дал устное указание использовать в качестве модели Plantin, заострив засечки, по третьим, в основе работы Лардента лежала фотокопия страницы из некоей книги фламандского печатника XVI века Кристофа Плантена (Christoph Plantin), возможно, набранная шрифтом Робера Гранжона (Robert Granjon). Опираясь на этот источник, Лардент нарисовал шрифт-прототип, впоследствии сильно переработанный под руководством Морисона. В начале апреля 1931 года фирма Monotype начала работу над оснасткой комплекта знаков нового шрифта в 9 кегле, а в конце этого же месяца в работу поступили два других кегля (7 и 5 1/2 пунктов).

В июне 1931 года рисунки и отливки прямого начертания были переданы на фирму Linotype, которая должна была изготовить комплект матриц для набора текста на линотипе. (Таким образом, Linotype получил права на новый шрифт параллельно с Monotype). К концу этого же года новый шрифт в текстовых кеглях уже был передан в наборный цех газеты «Таймс». Очевидно, это было прямое начертание вместе с курсивом. Однако работа над заголовочными комплектами продолжалась до августа 1932 года. Первый номер газеты, набранный новым шрифтом, был напечатан 3 октября 1932 года.

Получившийся в результате текстовый шрифт был достаточно близок по рисунку и ёмкости к шрифту Plantin, но рост его строчных был увеличен, засечки стали гораздо острее, а контраст между основными и соединительными штрихами в буквах сильнее. Новый рисунок отвечал ожиданиям Морисона, который хотел создать привлекательный текстовой шрифт с высокой удобочитаемостью и одновременно повышенной емкостью для печати на хорошей бумаге. Именно такой респектабельный шрифт мог удовлетворить требования руководства газеты «Таймс» и соответствовать методам ее производства, а также представлениям ее читателей. Гарнитура была названа Times New Roman (серия 327), что означает «Таймс Новый Прямой» - новый по отношению к прежнему шрифту газеты «Таймс».

Однако в 1994 году на конференции Международной типографической ассоциации (ATypI) в Сан-Франциско американский исследователь Майк Паркер (Mike Parker) сделал сенсационное сообщение, что рисунок шрифта Times New Roman принадлежит вовсе не Морисону. В том же году вышел журнал "Printing History" (vol.31/32) с его подробно аргументированной статьей. Паркер обнаружил, что прямое светлое начертание гарнитуры Times New Roman поразительно похоже на найденный в архивах американской фирмы Lanston Monotype комплект шрифтовых шаблонов серии 54, изготовленный, по всей вероятности, не позднее 1916 года. Их рисунок приписывается Старлингу Берджессу (W.Starling Burgess), американскому строителю гоночных яхт, поэту, авиа- и автоконструктору.

Это сообщение вызвало бурю эмоций в среде историков типографики: как же так, неужели наиболее уважаемый английский типограф XX века Стенли Морисон, творец самого известного современного шрифта английской школы, воспользовался для его создания рисунками какого-то никому не известного американца? Тем не менее, оказалось, что в архивах той же фирмы нашлись несколько шаблонов курсивных знаков из серии 55, относящихся к тому же заказу и тоже похожих на курсив Times. Фирма Lanston Monotype выпустила в 1962 году свой собственный шрифт Times металлического набора серии 362, сопровождаемый жирным шрифтом Times Bold серии 57. На шаблонах серии 362 ясно виден выбитый более ранний номер 54. Из архивных источников известно, что шрифт серий 54, 55 и 57 (предположительно по собственным рисункам) был заказан Старлингом Берджессом для его проектного бюро W.Starling Burgess & Co., проданного в 1916 году. Этот заказ был аннулирован в конце 1918 года и шрифт не был завершен.

Шрифт серии 54, изготовленный фирмой Lanston Monotype для Старлинга Берджесса.

Сейчас американское происхождение рисунка Times New Roman признается и другими исследователями, во всяком случае, это предположение невозможно игнорировать: слишком велико сходство. Английскую фирму Monotype и американскую фирму Lanston Monotype связывали деловые отношения. Поэтому нельзя исключить, что рисунки знаков серии 54 могли попасть в Англию и затем послужить основой для Times New Roman Морисона и Лардента.
Кроме того, Морисона никак нельзя назвать дизайнером, графиком, художником шрифта. Он был исследователь, историк, критик, типограф (по советской терминологии художественный и технический редактор). Неизвестно, рисовал ли он когда-нибудь шрифт руками. Сам он нигде не утверждал, что нарисовал Times New Roman собственноручно. Более того, Морисон позже писал про этот шрифт: «Его достоинство в том, чтобы выглядеть так, как будто он не был спроектирован кем-то персонально...». Его художник Виктор Лардент работал в отделе рекламы газеты «Таймс» и писал заголовки к рекламным объявлениям. Он тоже не был дизайнером наборного шрифта.

Эскиз прямого светлого начертания шрифта Times New Roman работы Виктора Лардента, 1931 г.

Это отчетливо видно по первоначальному эскизу алфавита нового шрифта, бесспорно нарисованному Лардентом. Это красивая шрифтовая композиция, но никак не проект газетного шрифта для набора текста в кегле 9 пунктов. Более того, этот эскиз имеет мало общего с окончательным Times New Roman как по рисунку отдельных букв (в особенности C, G, R, S, s), так и по цвету, пропорциям и степени остроты засечек. Разумеется, процесс создания шрифта в тот момент только начинался, было много уточнений рисунка и переделок, в которых немаловажную роль сыграли штатные дизайнеры шрифта фирмы Monotype, но тем не менее.

Хотя Морисон и ратовал за "невидимый" шрифт, который совершенно не отвлекает читателя, его единственное шрифтовое творение, Times New Roman, никак не назовешь лишенным индивидуальности. Более того, он явно результат индивидуального творческого акта, со всем своим резко характерным и алогичным рисунком. В таком контексте тонкий критик-традиционалист Морисон, оплот элегантности и хорошего вкуса, не очень подходит в качестве создателя шрифта Times. Требуется кто-то более неистовый, например, сын крупнейшего американского конструктора гоночных яхт XIX века, обладатель крупнейшей авиационной премии Коллье (Collier Trophy) 1915 года за конструкцию бесхвостого гидросамолета "летающее крыло", строитель гоночных яхт, три из которых (Enterprise, Rainbow, Ranger) выиграли Кубок Америки, и удивительного автомобиля Dymaxion-Старлинг Берджесс, который сам был не чужд миру издательств и типографий. (Берджесс напечатал в 1903 году книгу своих стихов в типографии Кембриджского университета, был знаком со многими американскими типографами; в архивах фирмы Lanston Monotype сохранился комплект шаблонов еще одного шрифта, сделанных по его рисункам).

Нисколько не пытаясь умалить роль Стэнли Морисона и Виктора Лардента в создании шрифта Times New Roman, ведь в том виде, каком мы его знаем сейчас, Times New Roman создали именно они (и неизвестные нам по именам штатные дизайнеры фирмы Monotype). Просто возможно, что предыстория этого шрифта известна не полностью. Справедливость требует заметить, что среди его возможных прототипов называли, кроме шрифта Plantin, также шрифты голландского пуансониста XVI века Хендрика ван дер Кеере (Hendrik van der Keere), шрифт Neue Kirchenschrift 1862 года немецкой фирмы Bauer и шрифты американского типографа конца XIX-начала ХХ века Теодора Лоу де Винна (Theodor Low de Vinne).

Гарнитура шрифта Times New Roman.

Некоторые относят Times New Roman к голландской антикве старого стиля. Другим гораздо ближе позиция современного канадского исследователя Роберта Брингхерста (Robert Bringhurst), который в своей книге «The Elements of Typographic Style» называет Times New Roman шрифтом, который имеет гуманистический (то есть ренессансный) наклон осей овалов, но маньеристические пропорции, барочную насыщенность цветом и острые неоклассицистические окончания. В целом Times по пропорциям, контрасту и наклону осей овалов скорее уж можно классифицировать как переходную антикву, хотя сверхострые засечки и суженные строчные явно напоминают некоторые шрифты начала ХХ века. В сущности, Times из-за своей эклектичной формы очень напоминает некоторые шрифты второй великой эпохи шрифтотворчества, эпохи Модерна, наподобие нашей гарнитуры Литературной, бывшей Латинской.

Визуальный характер прямого (Roman) светлого начертания (серия 327) определяется значительным контрастом, очень крупным очком строчных знаков, короткими выносными элементами, острыми засечками, скругленными в местах присоединения к основным штрихам, и наклонными осями овалов. Строчные буквы заметно светлее прописных и выглядят более узкими. В крупном нижнем полуовале строчного а внутрибуквенный просвет расширен, но в других строчных, например, таких, как b, d, h, m, n, p, q, u он вытянут по вертикали. Это связано с тем, что все строчные буквы имеют слегка вытянутые пропорции. Пропорции прописных, наоборот, достаточно широки и алфавит в целом стремится к одноширинности. Прописные буквы с круглыми элементами, такие, как C и S, довольно открыты. G, несмотря на свою значительную ширину, производит впечатление закрытого знака из-за высокого правого вертикального штриха без нижней шпоры, но с двусторонней засечкой вверху. Прописная J не имеет свисания ниже линии шрифта, в отличие от шрифта Plantin, что характерно уже для шрифтов эпохи классицизма. Буквы с круглыми элементами C, G, S, s на концах штрихов имеют двусторонние остроконечные чуть наклонные засечки. Выраженная обратная засечка в таких знаках характерна для шрифтов не ранее начала XVIII века.

Monotype Times New Roman, серия 327.

Жирное (Bold) начертание (серия 334) в гарнитуре практически соответствует по ширине прямому светлому, имеет повышенную насыщенность и контрастность, что, очевидно, связано с его первоначальным применением в газете. Как пишет Уолтер Трэйси в своей книге «Letters of Credit», это начертание загадочно, поскольку его строчные знаки по форме ближе к шрифтам эпохи классицизма из-за горизонтальных односторонних засечек в верхней левой части таких букв, как b, d, h, i, j, k, l, m, n, p, r, тогда как в светлом начертании аналогичные буквы имеют наклонные треугольные засечки антиквы старого стиля. Кроме того, строчные знаки жирного начертания пришлось сделать чрезвычайно узкими для соответствия их ширин строчным светлого начертания, в свою очередь, достаточно узких. В результате внутрибуквенный просвет большинства строчных напоминает узкую вертикальную щель, засечки очень короткие, и набор напоминает частокол. Поскольку пропорции прописных ближе к пропорциям прописных основного начертания, от жирного начертания возникает ощущение узких строчных при нормальных прописных. Обычно унификация ширин знаков разных начертаний объясняется необходимостью их совместного применения как основного и выделительного при наборе на линотипе. Но в газете «Таймс» в качестве шрифтового выделения применялся курсив, а жирным начертанием набирались только заголовки, поэтому не было необходимости делать ширины его знаков такими же, как в светлом. Можно было спроектировать жирное начертание более близким по рисунку и пропорциям к основному, как и было сделано позже при разработке полужирного (Semi-Bold). То, что этого не случилось, можно рассматривать как косвенное доказательство того факта, что рисунок жирного начертания тоже был в какой-то мере заимствован.

Monotype Times New Roman, серия 334.

Первоначально в гарнитуре был разработан только один светлый курсив (Italic). Его прописные буквы несколько более узкие, чем у прямого начертания, но по рисунку близки к нему. Для курсивных строчных характерны жесткая форма k с двусторонней горизонтальной засечкой на конце правого верхнего штриха и жесткие треугольные v, w, y. Буква z вначале имела внизу росчерк с каплей на конце, однако затем фирма Monotype заменила его на строгий горизонтальный штрих. (В шрифте Times Roman фирмы Linotype эта буква сохранила первоначальную форму). Ширины знаков курсива соответствуют основному начертанию.

Monotype Times New Roman, серия 327.

Жирный курсив (Bold Italic) был выпущен только в 1956 году. По форме он очень близок к светлому курсиву и не совсем соответствует в деталях рисунка прямому жирному начертанию.

Форматы шрифтов.

Одним из наиболее существенных преимуществ графического интерфейса Windows является возможность использования разнообразных шрифтов для изображения символов на внешних устройствах (мониторах, принтерах). Давайте подробней разберём форматы шрифтов, используемые для этих целей.

Масштабируемые шрифты.

Из-за недостатков растровых шрифтов ещё в 70-х и 80-х годах для компьютерной полиграфии стали создаваться способы определения шрифтов, базирующихся не на растрах, а на описаниях контуров символов. Преобразование контуров символов в растры должно было осуществляться или компьютером, или автоматически самим внешним устройством. Такие шрифты называются масштабируемыми, так как они могут быть введены с любым размером символов. При использовании масштабируемых шрифтов обеспечивается полное соответствие изображений символов на экране и на печати, поскольку они формируются из одних и тех же контуров, содержащихся в шрифтовом файле (это соответствие называется принципом WYSIWYG - What You See Is What You Get).

Широкое распространение контурные шрифты получили после 1985 г., когда фирма Adobe выпустила шрифты в формате Adobe Type 1 (другое, более распространенное название — PostScript Type 1) вместе с языком описания страниц PostScript. Шрифты формата PostScript Type 1 считаются профессиональными полиграфическими шрифтами, и именно на работу с ними в большинстве своем рассчитано полиграфическое оборудование.
Другой распространенный формат контурных шрифтов — это TrueType, совместная разработка фирм Apple и Microsoft для применения в операционных системах Mac System 7.x и Windows 3.x. Основным стимулом для создания формата TrueType послужило, по всей видимости, стремление к независимости от фирмы Adobe, владевшей всеми правами на формат Type 1. Поддержка формата TrueType была включена в системы MS Windows 3.1 и Mac System 7.0, что привело к его широкому распространению.

Сейчас PostScript Type1 и TrueType — это два наиболее распространенных формата компьютерных шрифтов. Работа со шрифтами TrueType несколько проще, так как они поддерживаются операционными системами MS Windows и Mac OS, в то время как для установки и использования шрифтов PostScript нужна специальная программа Adobe Type Manager. Но если документ требуется подготовить для печати в типографии, предпочтение отдается шрифтам PostScript, с которыми работает большинство фотонаборных автоматов.

TrueType.

Шрифтовой формат TrueType был разработан в середине 80-х компанией Apple, для операционной системы компьютеров Макинтош. Сейчас используется в операционных системах Apple и Microsoft. TrueType - шрифты созданы на языке описания страниц TrueImage, для построения шрифтовых знаков в TrueType применяются квадратичные сплайны. Они рисуются на экране быстрее, чем кривые Безье, применяемые для построения знаков в PostScript - шрифтах, однако при печати дают менее точные кривые, чем кривые Безье.

Шрифты TrueType могут содержать до 65000 символов, расположенных в порядке, определенном стандартом Unicode. В действительности, не все шрифты содержат расширенные наборы символов, большинство европейских изготовителей ограничиваются стандартной комплектацией западноевропейской кодировки (т.н. Latin 1). Исключение составляют компании Microsoft, которая большую часть европейских шрифтов выпускает в кодировке WGL4 и компания ParaType, выпускающая так называемые Multilingual (многоязычные) шрифты, которые кроме Западноевропейской, включают в себя Центрально-европейскую, Кириллическую, Балтийскую и Турецкую кодировки.

Шрифты TrueType состоят из одного файла, используемого и для вывода на экран и для печати. В системе Windows он имеет расширение .ttf, а в Mac OS это шрифтовой набор (suitcase) с ресурсом SFNT. В Mac OS X встроен шрифтовой процессор нового поколения, который кроме шрифтов с ресурсом SFNT, поддерживает и файлы .ttf, созданные для Windows. Так что файл с расширением .ttf можно использовать на обеих операционных платформах.

TrueType спроектирован таким образом, чтобы одинаково четко выводиться на экран и печать при любом кегле. При печати шрифтов TrueType на принтере QuickDraw (струйный принтер), лазерных PCL-принтерах или TrueImage-совместимых информация, используемая компьютером, передается непосредственно на принтер. При печати TrueType-шрифтов на принтере PostScript, драйвер принтера обычно преобразует их в PostScript-совместимые шрифты (например, Type 1).
Такое преобразование может привести к некоторой потере информации шрифта или небольшому его изменению, включая хинтовку и толщину штрихов.

Хинты - это команды, встроенные в контурные шрифты и позволяющие печатать их с максимальным соответствием спроектированной форме символа. Хинтовка позволяет воспроизводить (печатать, например) контурные шрифты сохраняя форму символов при низком разрешении. Так хинтовка улучшает вид мелкого текста, напечатанного на лазерном принтере с разрешением 300 dpi.

OpenType.

OpenType® — новый формат шрифта с перекрестной платформой, разработанный совместно Adobe и Microsoft. Спецификации OpenType были выпущены в 1997 году, формат вобрал в себя все последние достижения в области шрифтовых технологий. Adobe переконвертировали полностью Adobe Type Library в этот формат и теперь предлагают сотни шрифтов OpenType. Два основных преимущества формата OpenType — совместимость его c обеими платформами — (один и тот же файл шрифта работает под Macintosh и Windows) и его способность поддерживать значительно расширенный набор символов, что обогащает лингвистическое обеспечение и облегчает управление файлом.

Формат OpenType - модификация TrueType формата SFNT, где сохранены Adobe ® Postscript ® данные шрифта и добавлены новые типографские свойства. OpenType шрифты, содержащие данные Postscript, как, например, в Adobe Type Library, могут включать типы шрифтов Type 1 и Multiple Master - имеют расширение .otf, в то время как основанные на языке TrueImage (т.е. содержащие TrueType шрифты для Макинтош и Windows) шрифты формата OpenType имеют расширение .ttf и распространяются Microsoft. Для использования .otf-шрифтов операционная система требует Adobe Type Manager (ATM) или наличия встроенной поддержки PostScript-шрифтов. Шрифты OpenType могут включать расширенный набор символов и обеспечивать более широкое лингвистическое обеспечение и более точное управление. Шрифты OpenType от Adobe с богатым набором средств отмечены приставкой "Pro", которая является частью имени шрифта и появляется в прикладных меню шрифта. OpenType шрифты могут быть установлены рядом с форматами PostScript Type 1 и TrueType.

OpenType может иметь "цифровую подпись" производителя. Эта подпись позволяет операционной системе определить происхождение шрифта и выяснить, был ли он модифицирован.
Так же как TrueType, шрифты OpenType имеет так называемый "параметр уровня встраивания" ("embedding flag"). Этот механизм определяет, какие ограничения накладываются на встраивание шрифта в документ для его распространения с этим документом.
Шрифты OpenType используют более эффективные методы сжатия данных: Compact Font Format (CFF) фирмы Adobe для данных PostScript и MicroType Express фирмы Agfa для данных TrueType. Благодаря сжатию файлы со шрифтами занимают меньше места на диске и быстрее пересылаются по сети.

Любой OpenType шрифт использует единственный файл шрифта для всей его иерархической структуры, показателей и растровых данных, упрощая управление файлами. Кроме того, тот же самый файл шрифта работает и под Macintosh и под Windows. В результате, OpenType позволяет вам перемещать файлы шрифта между платформами гораздо мобильнее.
Точечный рисунок, векторная структура и метрические данные объединены в один файл шрифта OpenType с перекрестной платформой, что упрощает манипуляции со шрифтом. Базирующиеся на Unicode, международном многобайтовом символьном кодировании, охватывающем фактически все в мире языки, шрифты OpenType могут служить для многоязычной печати посредством включения добавочных наборов символов нужного алфавита в один шрифт. Все Adobe OpenType шрифты включают стандартный диапазон символов латиницы, используемых на Западе, и несколько интернациональных символов, включая Adobe OpenType "Pro" шрифты, где есть полный диапазон символов с диакритическими знаками для поддержки центрально- и восточно-европейских языков, например, турецкого и польского. Многие из этих шрифтов также содержат расширенные наборы кириллических и греческих символов в одном файле шрифта. OpenType позволяет программам проектирования шрифтов обеспечивать файл более совершенной языковой поддержкой, чем любой предыдущий формат шрифтов. Одно из главных преимуществ новой технологии — поддержка расширенных типографских возможностей (т.н. OpenType features). Помимо собственно знаков шрифт OpenType может содержать правила использования этих знаков — позиционирование и подстановку одних знаков вместо других при определенных обстоятельствах.

В прошлом типичный западный шрифт Postscript был ограничен 256 глифами, вынуждая вас устанавливать и управлять двумя или более связанными стилями шрифта. OpenType значительно упрощает управление шрифта и публикацию, гарантируя, что все требуемые глифы для документа будут содержаться в одном файле шрифта с перекрестной платформой. Шрифты OpenType могут содержать больше чем 65,000 глифов, поэтому в одном файле шрифта может содержаться много нестандартных глифов, например, полные наборы символов из многих нелатинских алфавитов, лигатуры, а так же широкий спектр надстрочных, подстрочных, математических символов, буквиц, особые формы букв, капитель, контекстные и стилистические замены.

Лигатуры - символы, заменяющие собой сочетания типа ff, fi, fl, ffi, ti. Перемычки или какие-либо элементы в подобных сочетаниях во многих шрифтах находятся очень близко друг от друга. Лигатура позволяет их слить, что улучшает внешний вид текста, добавляет шика заголовкам. Для письменностей ряда восточных языков (арабский, фарси), где знаки соединяются и могут иметь различные формы, в зависимости от того, в какой части слова находятся, подмена лигатурами получает первостепенную важность.

Исторически сложилось так, что некоторые из шрифтов самого высокого качества включают разные начертания для различных размеров печати. Некоторые шрифты из Adobe OpenType включают четыре оптических разновидности размера: подстрочный (6-8 пункта), регулярный (9-13 пункта), подзаголовочный (14-24 пункта) и крупнокегельный (25-72 пункта). Называемые "Opticals", эти изменения (разновидности) были оптимизированы для использования в определенных размерах шрифта.

Являясь самым важным в обсуждении OpenType показательно различия между символами и глифами.

Символы — объекты, назначенные по стандарту Unicode, которые представляют самые маленькие семантические модули языка.

Глифы — это графический образ знака.

Один знак может соответствовать нескольким глифам: нижний регистр "a", капительная буква "a" и специальный символ "a" — это три отдельных глифа. Один глиф может также представлять многие символы, как в случае "ffi" связи, который соответствует последовательности трех символов: f, f и i.
Для любого символа имеется заданный по умолчанию глиф и позиционированные данные. Приложение размещения показывает как один или несколько символов могут изменять позиционирование или менять глиф.

К сожалению, не смотря на благие намерения унифицировать PostScript и TrueType в одном формате, OpenType с данными PostScript (OT/PS) и OpenType с данными TrueType (OT/TT) работают по-разному в различных системах и приложениях.
Кроме того, новые возможности формата могут поддерживаться не в полном объеме.
Существуют 3 уровня поддержки:

  • Базовая поддержка — шрифты OpenType работают как обычные шрифты в кодировке Western.
  • Многоязычная поддержка — шрифты OpenType могут использоваться в соответствии с кодировкой Unicode.
    Замечание: Будьте внимательны, даже если в операционную систему встроена поддержка кодировки Unicode, это еще не означает, что все приложения автоматически пользуются средствами этой поддержки, и, наоборот, в ОС с базовой поддержкой, некоторые приложения могут работать со шрифтами напрямую, и иметь доступ к знакам за пределами однобайтного диапазона.
  • Полная поддержка — Unicode + поддержка расширенной типографики: шрифты OpenType могут использоваться в соответствии со всеми своими возможностями замены и позиционирования глифов.

Adobe Type 1.

Adobe создала множество шрифтовых форматов, основанных на языке описания страниц PostScript. Самый распространенный из них - Type 1. Это общепринятый стандарт для цифровых шрифтов (ISO 9541). Шрифт формата Type 1 — специальная форма программы PostScript и особый формат файла, который ориентирован на описание шрифта. В языке PostScript существуют и другие стандарты описания шрифтов — Type 0, Type 2, Type 3, ..., однако сейчас они почти не используются или используются для специальных целей. В последние годы язык PostScript был расширен, чтобы обеспечить поддержку шрифтовых возможностей стандартов TrueType и OpenType. Новые устройства с языком Adobe PostScript сейчас поддерживают все 3 шрифтовых стандарта.

Шрифты PostScript могут содержать до 220 печатаемых символов, т.е. не поддерживают стандарт Unicode. Знаки в шрифтах Type 1 описываются с помощью кривых Безье, что позволяет более точно, чем TrueType передавать их форму на печати. Основанный на языке PostScript формат Type 1 более, чем TrueType совместим с программами Adobe, он не требует конвертации при печати на PostScript-устройствах и, как следствие, порождает меньше ошибок.
Профессиональные шрифты PostScript Type 1 содержат специальные подсказки (хинты), которые помогают сохранить симметрию и другие эстетические параметры в процессе растеризации (рендеринга). Благодаря толково написанному растеризатору, относительно простой набор хинтов позволяет получать шрифты с приемлемым качеством. Однако разработчики шрифтов не имеют возможности полностью контролировать процесс растеризации, что не всегда позволяет достичь желаемого качества представления символов.
Наиболее известная и распространенная сегодня реализация языка PostScript — формат документов PDF, поддерживаемый продуктами серии Acrobat. Почти что все, что может быть сделано в PostScript может быть реализовано в PDF.

Type 1 состоит из двух компонентов: растрового (экранного) и контурного (принтерного) файла шрифта. Растровый шрифт имеет, как правило, ряд вариантов размеров, созданных при генерации шрифта. На Макинтош все вариации экранного шрифта сгруппированы в шрифтовой набор (suitcase), на Windows - записываются в файл с расширением .pfm. Имеющиеся векторные гарнитуры шрифта не группируются, на Windows-версии принтерные Type 1-шрифты имеют расширение .pfb.
Шрифт PostScript для Windows может состоять из 2-х, 3-х или 4-х файлов. Набор из 3 файлов состоит из файла с расширением .pfb (Print Font Binary), который содержит информацию о контурах; файла с расширением .atm (Adobe Font Metrics), содержащего информацию о ширинах символов и кернинге; .inf файла, содержащего дополнительную информацию, которая требуется для инсталляции. В процессе инсталляции Windows генерирует .pfm файл (Print Font Metrics), в основе которого лежит информация из .atm и .inf файлов. Далее используется только .pfb и .pfm файлы. Некоторые производители генерируют .pfm файлы самостоятельно и поставляют своим клиентам только два этих файла. Этого достаточно для нормального использования. Некоторые так же добавляют .atm файлы, а некоторые поставляют все 4 файла.

Шрифты Type 1 могут быть резидентными и находиться в ПЗУ принтера, что повышает скорость печати. Для работы с операционной системой Type 1 требует утилиту Adobe Type Manager (ATM), которая, кроме прочего, позволяет генерировать на лету из контурного шрифта отсутствующие версии экранного. Технология ATM интегрирована в Microsoft Windows 2000 и XP, а так же в Macintosh OS X.

Adobe Multiple Master.

Формат Multiple Master представляет собой PostScript-шрифт, который позволяет динамически изменять такие параметры как насыщенность, ширину, начертание и оптический размер. Данные характеристики описываются в терминах линейных осей проектирования. Таким образом, Multiple Master-файл способен включать, соответственно, оси насыщенности, ширины, стиля и оптического размера. Каждая ось проектирования имеет линейный диапазон, в котором может плавно изменятся данный параметр. Например, для шрифта Myriad ось насыщенности предусматривает диапазон от 1 до 830, а ось ширины - от 1 до 700.
Multiple Master-шрифты содержат базовое начертание (Multiple Master Base Font) и несколько заранее сконфигурированных комбинаций параметров осей (Multiple Master Instance). Для создания готовых комбинаций применяется специальная утилита Adobe Font Creator. Названия всех Multiple Master-шрифтов содержат сочетание "MM", имя гарнитуры так же заканчивается на MM с числовыми значениями параметров осей. С Multiple Master-шрифтами могут работать такие программы как Adobe Photoshop, Adobe InDesign, Adobe Illustrator. Illustrator, кроме возможности использования готовых комбинаций позволяет, так же, создавать свои вариации посредством палитры MM Design.

Для вывода на печать Multiple Master-шрифт требует не менее 3 Mb памяти принтера. Несмотря на то, что Multiple Master основан на PostScript, могут быть проблемы с интерпретацией параметров его осей, поэтому в ряде случаев имеет смысл, перед выводом на печать (или созданием EPS/PS-файла), конвертировать тексты в кривые.

Данный формат, благодаря способности к динамическому изменению параметров, как ни один другой обладает беспрецедентными возможностями для дизайнера.

Adobe Type 3.

Спецификация шрифта Type 3 была создана Adobe, однако, сделав ее доступной для независимых производителей, сама Adobe шрифтов Type 3 никогда не распространяла. Формат проще в разработке, чем Type 1, поддерживает символы, описанные с помощью сложных составных знаков, серых штрихов и серой заливки. Type 3 не сохраняет параметры хинтовки, и, как следствие, выводится с меньшей точностью и детализацией. Type 3 требует больше памяти компьютера и принтера для работы с ним.
Шрифты Type 3 называют также шрифтами, определяемыми пользователем. Обычно они применяются для описания сложных графических фигур (таких как логотипы).

Adobe Type 4.

Формат Adobe PostScript Type 4 представляет собой шрифт Type 1 преобразованный и сжатый утилитой Adobe Font Downloader для загрузки на PostScript-принтер.

Adobe Type 42.

Type 42 - шрифты TrueType, содержащие PostScript-код. Формат генерируется во время печати драйвером PostScript-принтера. Type 42 позволяет интерпретатору принтера PostScript передавать информацию о шрифте интерпретатору TrueType не преобразуя шрифт TrueType в PostScript.

Растровые шрифты.

На большинстве устройств изображения формируются из точек (исключением является разве лишь некоторые плоттеры), поэтому наиболее простым решением является задание символов с помощью их растров - поточечных изображений. На основе этих растров либо компьютер, либо внешнее устройство (скажем, лазерный принтер) формирует выводимое изображение (например, печатаемую страницу). Задание шрифтов с помощью растров требует минимального "интеллекта" от внешнего устройства и позволяет достичь высокого качества изображения даже на устройствах с низким разрешением, если дизайнер при разработке шрифта вручную подберет наилучшее расположение точек для получения красивого рисунка символов. Однако растры символов надо создавать и хранить в компьютере отдельно для каждого размера и начертания символов, для каждого разрешения внешнего устройства, так очень удобно.
Обычно файлы растровых шрифтов, как правило, имеют расширение .fon. В комплект Windows входят три набора растровых шрифтов различных размеров: MS Sans Serif (шрифт без засечек), MS Serif (шрифт с засечками), и Courier (шрифт под пишущую машинку).

Понятие «Гипертекста».

Термин «гипертекст» был введён Теодором Нельсоном в 1965 году для обозначения «текста ветвящегося или выполняющего действия по запросу». Обычно гипертекст представляются набором текстов, содержащих узлы перехода от одного текста к какому-либо другому, позволяющие избирать читаемые сведения или последовательность чтения.

Общеизвестным и притом ярко выраженным примером гипертекста служат веб-страницы — документы HTML (язык разметки гипертекста), размещённые в Сети Интернет. В более широком понимании термина, гипертекстом является любая повесть, словарь или энциклопедия, где встречаются отсылки к другим частям данного текста.

В компьютерной терминологии, гипертекст — текст, сформированный с помощью языка разметки, потенциально содержащий в себе ссылки.

Язык разметки (текста) в компьютерной терминологии — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Принадлежит классу компьютерных языков. Текстовый документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках

— например, указание на заголовки, выделения, списки и т. д. В более сложных случаях язык разметки позволяет вставлять в документ интерактивные элементы и содержание других документов.

Ссылка — это запись, связывающая между собой части документа, библиографические записи, классификационные деления или предметные рубрики.

Используют также термины внутренняя ссылка (ссылающаяся на другую часть того же

документа) и внешняя ссылка (ссылающаяся на другой документ).

Гипертекстовая система - это информационная система, способная хранить информацию в виде электронного текста, позволяющая устанавливать электронные связи между любыми "информационными единицами", хранящимися в ее памяти и вызывать их на экран монитора "простым нажатием кнопки".

Концепция гипертекста достаточно проста. Есть база данных, в базе данных находятся объекты. Объекты это, чаще всего, небольшие текстовые разделы, посвященные тому или иному вопросу. Специальные механизмы и правила позволяют компьютеру поддерживать ссылки из одних текстовых фрагментов в другие. Человек или программный агент может устанавливать новые связи между текстовыми фрагментами. Система текстовых фрагментов или файлов с такой организацией получила название "гипертекст".

Гипертекст - это сеть текстов.

На данном рисунке «гипертекст» представлен как сеть.

Реализации гипертекста.

Ваннавер Буш.

Впервые устройство, которое бы поддерживало гипертекстовые возможности чтения и письма описал Ваннавер Буш, назвав эту систему Memex.

Прообраз гипертекстового устройства – система Memex, которую Ваннавер Буш описал в статье "Как бы могли мыслить", по своей сути, представляла систему для обмена "мемами" - теми элементарными единицами культурной эволюции, о которых писал Ричард Докинз. Гипертекст изначально мыслился создателям как система общественной деятельности. Группа взаимосвязанных сообщений образовывала сеть, и эта гипертекстовая сеть документов поддерживала социальную сеть отношений между сообществом авторов коллективного гипертекста. Гипертекстом называют любой текст, отдельные фрагменты, записи или страницы которого обнаруживаются какие-либо ссылки на другие записи. Используя терминологию Докинза можно сказать, что гипертекст это - комплекс связанных между собой мемов. С технической точки зрения гипертекстовая система это - информационная система, способная хранить информацию в виде электронного текста, позволяющая устанавливать электронные связи между любыми "информационными единицами", хранящимися в ее памяти. Специальные механизмы и правила позволяют компьютеру поддерживать ссылки из одних текстовых фрагментов в другие. Человек или программный агент может устанавливать новые связи между текстовыми фрагментами.

Дуглас Энгельбарт.

Вторая после Буша по значимости личность в истории гипертекста это - Дуглас Энгельбарт, работавший над проектом расширения мыслительных возможностей человека. Важно отметить, что Энгельбарт и его группа сосредоточили свои усилия на обеспечении и расширении познавательных возможностей группы людей. Многие из возможностей, заложенных в NLS, нашли свое широкое применение относительно недавно. К этим возможностям относятся встроенные в систему возможности установления гипертекстовых связей; возможность хранения групповых переговоров, встроенная в системы электронной почты; возможности личных настроек, перестроек и расширений системы пользователями; возможности усиления не только индивидуальных, но и групповых возможностей. Файлы в NLS содержались как иерархии сегментов. Каждый сегментов назывался "утверждением". Каждое "утверждение" снабжалось идентификатором своего уровня в иерархической структуре файла. Можно было установить любое число ссылочных связей -"утверждений" друг с другом, связей как внутрифайловых, так и межфайловых. В результате структура приобретала неиерархические и нелинейные свойства. В системе обеспечивалось несколько способов перемещения внутри файла по "утверждениям". Исследования, проводившиеся в рамках создания системы NLS, расширяли возможности сохранения записей в коллективной памяти и, самое главное, заметно упрощали механизмы обмена записями или мимами внутри сетевого сообщества. Энгельбарт рассматривает отношения людей и программ как гетерогенное сообщество, в котором происходит эволюция всех вовлеченных в систему агентов. Внутри сложных современных информационных комплексов происходит совместная эволюция, в которую вовлечены люди и средства.

Энгельбарт отмечал, что «как только мы начинаем использовать новые средства, они изменяют привычные условия нашего существования». Подход, нацеленный на саморазвитие, заставляет нас постоянно перестраивать наш мир. Нам приходится осваивать новые роли, вырабатывать новые привычки и осваивать новые методы деятельности. Эти изменения в нас происходят только потому, что появляются новые технические средства, которые мы сами же и придумали. После того как новые средства деятельности вносятся в сообщество, между средствами и людьми, которые их используют, происходит совместный процесс эволюционных изменений. Люди видоизменяют и друг друга и программные средства для своего роста и развития.

Нельсон Теодор.

Теодор Нельсон, последователь Энгельбарта, работал над созданием всеобщей системы электронных публикаций и всеобщего архива. Нельсон предложил сам термин "гипертекст" и многое сделал для того, чтобы идеи гипертекста получили широкое распространение. Он неоднократно подчеркивал, что гипертекст в его понимании не является иерархической структурой. С его точки зрения, знак равенства, который ставят между понятиями «иерархия» и «структура», представляет собой популярный миф. Живые формы информационных структур не могут быть верно представлены иерархией. Такие структуры как параллелизм, перекрестные связи, взаимное проникновение и одновременное присутствие одного элемента в нескольких местах не могут быть переданы иерархией. Гипертекст видится Нельсону как мультиагентное сообщество, внутри которого существуют сложные неиерархические отношения между агентами.

Тим Бернерс Ли.

Бернерс Ли - отец Всемирной паутины. все предыдущие предложения основывались на единой централизованной базе данных - это позволило бы избежать ошибок при переходе от документа к документу. Бернерс Ли решил, что для истинной глобальности Сети нужно рассредоточить базу данных по всему миру, сознательно рискуя при этом получить разрывы связей, а ее основой должна стать Сеть сетей - Интернет.

В начале 90-х годов Тим Бернерс Ли разработал протокол HTTP - (HyperText transfer protocol), который позволил связать между собой документы, размещенные на одном или на нескольких компьютерах, подключенных к сети Интернет. Эта гипертекстовая сеть документов известна как Всемирная Паутина. Всемирная паутина, как и большинство компьютерных средств, расширяет не только возможности индивидуума, но и возможности группы, сообщества и общества, обеспечивая группе возможное поле для совместной интеллектуальной деятельности. Сам Бернерс Ли описывал Всемирную паутину как абстрактное пространство информации. Паутина делает сеть полезной, поскольку люди на самом деле интересуются информацией и не хотят ничего знать про провода и компьютеры. Паутина существует, потому что программы работают и поддерживают постоянный обмен информацией между компьютерами.

Вначале работ по созданию Всемирной Паутины Бернерс Ли представлял ее как общее информационное пространство, в котором люди общаются и делятся информацией. Это представлялось возможным, поскольку если наши взаимоотношения происходят в Сети, то мы можем использовать компьютеры для того, чтобы анализировать эти отношения, находить смысл в наших действиях и находить лучшие способы для совместных действий Всемирная Паутина представляет собой электронную инфраструктуру семиосферы, в которой все участники мыслительного пространства могут обмениваться сообщениями. Существенно, то эта электронная инфраструктура хранит все записи и коммуникации, происходящие между членами сетевого сообщества.

Наглядная схема гипертекста.

Список используемой литературы

1. В. Холмогоров. – «Основы веб - мастерства. Учебный курс.» 3-е издание.

Изд. «Питер». – С.-Петербург., 2003 год. (стр. 27,28). [7]

2. И.В. Миссинг, Ю.Д. Романова, В.И. Шестаков. – «Информатика и информационные технологии». – Изд. «Эксмо» - Москва, 2005. (стр.28, 29).[7]

3. http://fontproblem.narod.ru/index.html?http://fontproblem.narod.ru/unicode.htm#Un_4Un_4 (с этого сайта была взята некоторая информация про кодировку символов «Unicode»).[10][19][20]

4. О. Ефимова, В. Морозов, Н. Угринович. – «Курс компьютерной технологии с основами информатики». – Изд. «АСТ», - Москва, 2003. (стр. 203, 204). [3]

5. Т. Пратт, М. Зелковиц. – «Языки программирования. Разработка и реализация. 4-е издание». – Изд. «Питер», - С. – Петербург, 2002 год.

(стр. 545). [52]

6. Г.С. Гохберг, А.В. Зафиевский, А.А. Короткин. – «Информационные технологии», - Изд. «ACADEMA», - Москва, 2004. (стр. 124). [52]

7. http://ru.wikipedia.org – главная страница Википедии.

http://ru.wikipedia.org/wiki/%D0%93%D0%B8%D0%BF%D0%B5%D1%80%D1%82%D0%B5%D0%BA%D1%81%D1%82 [52]

http://letopisi.ru/index.php/%d0%93%d0%b8%d0%bf%d0%b5%d1%80%d1%82%d0%b5%d0%ba%d1%81%d1%82 – ссылки на использованный из Википедии материал на тему «Гипертекст». [53]

8. http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0#.D0.98.D1.81.D1.82.D0.BE.D1.87.D0.BD.D0.B8.D0.BA.D0.B8_.D0.B8.D0.BD.D1.84.D0.BE.D1.80.D0.BC.D0.B0.D1.86.D0.B8.D0.B8 – материал из Википедии. [3]

9. http://urist.fatal.ru/Book/Glava5/Glava5.htm [3]

10. http://inftis.narod.ru/it/5-6/n6.htm [3]

11. http://fontproblem.narod.ru/index.html?http://fontproblem.narod.ru/crosref/shrift_format.htm [41]

12. http://fontproblem.narod.ru/index.html?http://fontproblem.narod.ru/srift.htm#Zas [22]

13. http://fontproblem.narod.ru/index.html?http://fontproblem.narod.ru/crosref/aticles/Times.htm#Times_1Times_1 [34]

14. http://ifont.ru/n1-28.html [29]