Преподаватель который помогает студентам и школьникам в учёбе.

Обзор языков гипертекстовой разметки.

Содержание:

Введение

Глобальная сеть - совокупность компьютеров, расположенных на больших расстояниях друг от друга, а также система каналов передачи связи: средств коммуникации (переключения), обеспечивающих соединение пользовательских коммуникационных систем и обмен данными между ними.[1]

Глобальные сети (WideAreaNetworks, WAN) создаются крупными телекоммуникационными компаниями для оказания платных услуг абонентам.

Интернет — мировая глобальная компьютерная сеть. Она составлена из разнообразных компьютерных сетей, объединенных стандартными соглашениями о способах обмена информацией и единой системой адресации. Интернет использует протоколы семейства TCP/IP. Они хороши тем, что обеспечивают относительно дешевую возможность надежно и быстро передавать информацию даже по не слишком надежным линиям связи, а также строить программное обеспечение, пригодное для работы на любой аппаратуре. Система адресации (URL-адреса) обеспечивает уникальными координатами каждый компьютер (точнее, практически каждый ресурс компьютера) и каждого пользователя Интернета, создавая возможность взять именно то, что нужно, и передать именно туда, куда нужно.

В 1994 году началась революция – World Wide Web. Всемирная паутина World Wide Web (WWW) соткана из Web-страниц, которые содержат в себе разную информацию в зависимости от тематики Web сайта. В основу Web был положен гипертекст (hypertext) – метод связывания блоков, или «страниц», данных, придуманный еще в шестидесятых годах. Однако только в девяностых годах Бернерс-Ли и его сотрудники перенесли концепцию гипертекста в Internet, создав HTTP – Hypertext Transfer Protocol (протокол передачи гипертекста). С появлением HTTP родился и World Wide Web.

Сегодня в Internet существуют миллионы Web – сайтов. Можно получать доступ к информации по различным темам, открыть в Web свой бизнес. Более того, в Web можно найти и сведения о нем самом и о тех технологиях, на которых он основан.

Таким образом, данная курсовая работа носит актуальный характер. Целью работы является обзор языков гипертекстовой разметки. Для достижения данной цели требуется решить следующие задачи:

провести анализ понятия «гипертекст»;
проанализировать историю развития гипертекста;
провести анализ моделей гипертекста;
изучить виды языков гипертекстовой разметки документов – синтаксис, структуру документов, основные элементы.
провести анализ будущего Web-программирования.

Глава 1. Гипертекст

1.1 Понятие гипертекста

Гипертекст - текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Во время чтения такого текста (в соответствующей программе, его обрабатывающей и выполняющей соответствующие ссылки или действия) вы видите подсвеченные (выделенные) в тексте слова. [3] Если наехать на них курсором и нажать клавишу или на кнопку (глаз) мышки, то высветится то, на что ссылалось это слово, например, другой параграф той же главы этого же текста. [1] В WWW по ключевым словам можно попасть в совершенно другой текст из другого документа, войти в какую-нибудь программу, произвести какое-либо действие и т.д. В Internet в контексте WWW можно получать доступ к чему угодно, к telnet, e-mail, ftp, Gopher, WAIS, Archie, USENET News и т.п. В WWW можно ссылаться на данные на других машинах в любом месте сети, тогда при активации этой ссылки эти данные автоматически передадутся на исходную машину и вы увидите на экране текст, данные, картинку, а если провести в жизнь идею мультимедиа, то и звук услышите, музыку, речь. [2] Это слегка напоминает Gopher, но фактически это принципиально другое и новое. В Gopher имеется жесткая структура меню, по который вы двигаетесь, как вам угодно. Эта структура не зависит от того, что вы делаете, какой документ пользуете и т.д. В WWW вы двигаетесь по документу, который может иметь какую угодно гипертекстовую структуру. Можно свободно организовать структуры меню в гипертексте. Имея редактор гипертекстов, можно создать любую структуру рабочей среды, включая документацию, файлы, данные, картины, программное обеспечение и т.д., и это не будет новое программное обеспечение, а просто гипертекст.

Гипертекстовая технология – это представление текста в виде многомерной иерархической структуры типа сети.[1]

Гипертекст формируется в результате представлений текста как ассоциативно связанных блоков информации. Ассоциативная связь – это соединение, сближение представлений, смежных, противоположных, аналогичных. Гипертекст значительно отличается от обычного текста. Обычные (линейные) тексты имеют последовательную структуру и предусматривают их чтение слева направо и сверху вниз. [2]

Простейший пример гипертекста - это любой словарь или энциклопедия, где каждая статья имеет отсылки к другим статьям этого же словаря. В результате читать такой текст можно по-разному: от одной статьи к другой, по мере надобности, игнорируя гипертекстовые отсылки; читать статьи подряд, справляясь с отсылками; наконец, пуститься в гипертекстовое плавание, то есть от одной отсылки переходить к другой. [2]

Концепция гипертекста достаточно проста. Есть база данных, в базе данных находятся объекты. Объекты это, чаще всего, небольшие текстовые разделы, посвященные тому или иному вопросу. Специальные механизмы и правила позволяют компьютеру поддерживать ссылки из одних текстовых фрагментов в другие. Человек или программный агент может устанавливать новые связи между текстовыми фрагментами. Система текстовых фрагментов или файлов с такой организацией получила название "гипертекст". [3]

Гипертекст изначально создавался как среда поддерживающая взаимодействие нескольких людей. Культовая работа Ваннавера Буша "As we may Think", в которой он описал устройство Memex, была связаны с проблемами взаимодействия коллективов ученых после Второй Мировой Войны, когда стало ясно, что существующие системы плохо поддерживают коллективную мыслительную деятельность. Система Memex, по своей сути, представляла систему для обмена "мемами" - элементарными единицами культурной эволюции. Гипертекст изначально мыслился создателям как система общественной деятельности. Группа взаимосвязанных сообщений образовывала сеть, и эта гипертекстовая сеть документов поддерживала социальную сеть отношений между сообществом авторов коллективного гипертекста.[3]

Использование гипертекста позволяет фиксировать отдельные идеи, мысли, факты, а затем связывать их друг с другом, двигаясь в любых направлениях, определяемых ассоциативными связями.

С развитием компьютерных средств мультимедиа гипертекст начал превращаться в более наглядную информационную форму, получившую название гипермедиа — эта информационная форма содержит не только текст, но и графику, видеоинформацию и звуки.

Обработка гипертекста открыла новые возможности освоения информации, качественно отличающиеся от традиционных способов.

Вместо поиска информации по соответствующему поисковому ключу гипертекстовая технология предполагает перемещение от одних объектов информации к другим с учетом их смысловой, семантической связанности.

Обработке информации по правилам формального вывода в гипертекстовой технологии соответствует запоминание пути перемещения по гипертекстовой сети.[2]

Гипертексты обладают определенной семантической (смысловой) сетевой структурой. При многократном просмотре, если гипертекст используется как учебник, эта структура будет сильно влиять на структуру знаний пользователя по изучаемому вопросу. Поэтому при построении гипертекстовых систем следует уделять внимание не только тому, как разбить исходный текст на части, но и тому, насколько пользователю будет понятно, легко и удобно работать с этими частями текста.

Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.[2]

Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Заголовок содержит тему или наименование описываемого объекта.

Информационная статья содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим, близким по смыслу статьям.

Текст, включаемый в информационную статью, может сопровождаться пояснениями, примерами, документами, объектами реального мира.[2]

Тезаурус гипертекста – это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка и предназначенный для поиска слов по их смысловому содержанию.[2]

Тезаурус гипертекста можно представить в виде сети: в узлах находятся текстовые описания объекта (информационные статьи), ребра сети указывают на существование связи между объектами и на тип родства.[2]

Алфавитный словарь включает в себя перечень наименований всех информационных статей в алфавитном порядке. [2]

Список главных тем содержит заголовки всех справочных статей, для которых нет ссылок типа род – вид, часть – целое. [2]

К основным элементам гипертекстовой технологии относятся: [3]

- информационный фрагмент;

- тема;

- узлы;

- ссылки.

Информационный фрагмент гипертекста может представлять собой линейную последовательность строк текста, рисунок, видеофрагмент, аудиофрагмент.[5]

Тема содержит краткое название информационного фрагмента. Информационный фрагмент может состоять целиком из множества тем либо включать в себя одну или несколько тем наряду с прочей информацией.

Узлом в гипертексте называется информационный фрагмент, из которого возможен переход к другим информационным фрагментам гипертекста.[5]

Ссылка представляет собой слово, фразу или набор фраз, с помощью которых осуществляется переход от одного узла к другому. Ссылки могут быть референтными или организационными.

Референтные ссылки — это наиболее типичный вид ссылок в гипертекстах. Они, как правило, имеют два конца, обычно это направленные связи, хотя большинство гипертекстовых информационных систем поддерживает и обратное движение по ссылке. Исходный конец референтной ссылки называется «источник». Логически это отдельная точка или область в тексте. Другой конец называется «назначением» — это определенная точка или область в гипертексте. С источником ссылки связывается некоторая пометка, указывающая наличие ссылки, — она показывает имя ссылки, обычно изображается в виде последовательности символов и высвечивается как отдельная единица текста. Например, при щелчке по термину появится информационный фрагмент, разъясняющий значение этого термина.[5]

Организационные ссылки устанавливают явные связи между двумя точками гипертекста и отличаются от референтных тем, что поддерживают иерархическую структуру в гипертексте. Организационные ссылки связывают узел-родитель с узлами-сыновьями и, таким образом, формируют древовидный подграф в рамках общего гипертекстового сетевого подграфа. Такие ссылки часто соответствуют отношению «быть частным случаем», и по этой причине операции над этими ссылками (при построении гипертекста) отличаются от операций над референтными ссылками.[6]

Область применения гипертекстовой технология очень широка. Это издательская деятельность, библиотечная работа, обучающие системы, разработка документации, законов, справочных руководств, баз данных, баз знаний и т.д. [6]

Наиболее известным примером гипертекста являются веб-страницы — документы HTML (язык разметки гипертекста) как они размещаются в Сети.

Современные программы разработки Web-серверов, такие как MS FrontPage или Web Pen для Windows, дают возможность даже новичку без всякого штудирования учебников легко создавать готовые странички. При этом cпециалист по созданию Web-сайтов, называемый Web-мастером, берет готовые файлы (тексты, таблицы, графику, базы данных, звук, анимацию, видеофильмы, программы) и с помощью кнопок и команд меню оформляет страницы сайта. Подобные программы, выполняя команды инструментальных и операционного меню, формируют гипертекст WWW-сервера.

Исходные текстовые, табличные и графические и другие объекты включаются в Web-site посредством тегов (tag = ярлык, этикетка). Тег - это последовательность символов, задающая

1). положение объекта на странице сайта,

2). внешний вид объекта или

3). связь данной страницы с другими страницами этого сайта, а также с любым другим сервером.

Тег называют также управляющим маркером, флагом. Программы типа Web Pen сами расставляют теги, поэтому пользователь таких программ может не знать языка разметки гипертекста (HTML = HyperText Markup Language).

1.2 История возникновения гипертекстовой разметки

История гипертекста богата и переменчива, поскольку гипертекст не столько какая-то новая идея, сколько находящаяся в эволюции концепция возможного применения компьютера. В разработку идеи гипертекста внесли свой вклад много людей, и каждый из них, видимо, представлял себе нечто отличное от других.

Компьютерному гипертексту предшествует ручной, один из вариантов которого – традиционное использование карточек. Такие карточки можно нумеровать и снабжать взаимными ссылками. Их часто распределяют по рубрикам, т. е. им придается иерархическая организация (в некотором ящике или пакете). Удобство таких карточек состоит в том, что, имея небольшой размер, они разбивают записи на малые куски. Пользователь может легко реорганизовать картотеку с учетом новой информации. Но, конечно, с увеличением объема такой картотеки, работать с ней становится все труднее.[13]

Другой вариант ручного гипертекста – это справочная книга, например словарь и энциклопедия. Статьи или определения, даваемые в таких книгах, содержат явные ссылки друг на друга, последовав за этими ссылками, читатель получает более богатую информацию. Каждой такой книге можно поставить в соответствие сеть с текстовыми узлами и связями-ссылками.[13]

Многие века существуют документы, где внутренние перекрестные ссылки и отсылки к другим документам образуют значительную долю содержания. Таковы, например, Талмуд с его обильным использованием аннотаций и встроенным в текст комментарием, а также сочинения Аристотеля, в которых ссылки на другие источники играют огромную роль.[13]

Еще один важный пример – печатные издания Библии. В них текст каждой из ее книг-частей делится на главы, а те, в свою очередь, на стихи. Главы пронумерованы внутри каждой книги, стихи – внутри каждой главы. Стих может состоять из части грамматического предложения, одного целого предложения или нескольких фраз . В подлинном библейском тексте этого деления нет. Оно было сделано учеными-богословами для облегчения ссылок и цитат. К примеру, деление Нового Завета на стихи, ныне общепринятое, восходит к XVI веку. Согласно этому делению, Новый Завет (27 книг-частей) состоит из 260 глав и, суммарно по всем главам, из 7942 стихов. Гипертекст возникает здесь потому, что в современных изданиях Библии текст идет в сопровождении так называемых "параллельных мест", обычно в виде ссылок на полях. Каждая такая ссылка ставит в соответствие стиху, который идет рядом, "параллельные" стихи из этой же или других книг-частей Библии (даются координаты этих стихов). В комментариях объясняется, что "параллельные места" указывают на тождественные события и "созвучные выражения". Библейский текст, по существу, превращен в гипертекстовую сеть на узлах-стихах. Сеть имеет огромные размеры: если взять лишь ее новозаветную часть с ее внутренними "параллелями", то получилось бы почти 8 тыс. гипертекстовых узлов (из них, правда, многие не имели бы связей).[7]

Все эти примеры относят появление гипертекста к далеким временам. Сейчас, однако, немало специалистов, которые считают, что об истинном гипертексте можно говорить лишь в том случае, когда перемещение по связям поддерживается компьютером.

В 1945 году в своей статье “Как мы можем думать” (“As We May Think”) Ванневар Буш высказал идею машины для просмотра и пополнения записями документов, записанных на пленке. [7]

Эта машина, получившая название “Memex”, никогда не была построена, но она содержала идею, которую позже назвали гипертекстом. [7]

Информация, считал Буш, должна храниться в виде пленочных микрофильмов. Поэтому Memex имела устройство для чтения микрофильмов и устройство для записи микрофильмов с помощью процесса сухой фотографии. То есть Memex принципиально не была цифровым компьютером. [8]

Буш представлял машину в виде письменного стола с экранами для отображения информации и клавиатурой для управления. Внутри стола размещалось хранилище микрофильмов и механизм доступа к ним (рисунок 1)[8]

Рисунок 1 – Схема Memex

Однако главная особенность и новизна Memex состояла не в способах хранения информации, а в способе доступа к ней. Буш предложил механизм перекрестных ссылок, аналогичный тому, который используется в современном гипертексте. Ссылки Буш предлагал записывать во вспомогательных полях в теле документа, а в качестве средства навигации использовать нечто похожее на современный мультимедийный шлем.[8]

Фактически система Xanadu явилась прообразом web-пространства, но сам Тед Нельсон отзывается отрицательно о Web и HTML, считая, что работа Бернерса-Ли является сильно упрощенным вариантом его работы. [8]

Первую работающую гипертекстовую систему (она называлась NLS, от oN Line System) продемонстрировал в 1968 году Дуг Энгельбарт (Doug Engelbart, 1925 г.р.). [8]

В 1989 году Тим Бернерс-Ли (Tim Berners-Lee, 1955 г.р.), работая над внутренней сетью организации CERN (Европейский совет по ядерным исследованиям в Женеве), предложил глобальный гипертекстовый проект, ныне известный как Всемирная паутина. [7]

В начале 1990-х Тим Бернерс-Ли и его коллеги создали язык HTML, на котором записываются современные гипертексты, то есть такие документы (распределенные по Сети), которые благодаря гиперссылкам можно просматривать по контексту. После создания языка HTML Web-технологии начали приобретать более четкий характер и бурное разностороннее развитие, поддерживаемое многочисленными компаниями в будущем, такими как: Google, Microsoft, Mozilla Foundation и пр.

1.3 Модели гипертекста

В самом общем виде модель гипертекста характеризуется механизмом связей, узлами-объектами и пользовательским интерфейсом – способом взаимодействия человека с узлами и связями.

Узлы. Узел – важнейшее понятие гипертекстовых систем, так как в них именно в форме узлов хранится и представляется пользователю информация. Характеристики узла, существенные для гипертекстового пользователя (читателя или автора), – это тип информации, которая может быть сохранена (текст, таблица, графика, звук и др.), и вместимость, объем каждого узла.[13]

Некоторые гипертекстовые системы поддерживают только текст (например, NLS и ZOG), другие – таблицы и графику (HyperTIES, HyperCard, Guide); есть механизмы интерпретации различных видов информации (например, видео) в рамках гипертекстовой сети (Intermedia, NoteCards).

Важно отметить, что просто реализация возможности показывать узлы мультимедиа здесь недостаточна. Каждый новый тип информации должен быть полностью интегрирован с гипертекстовой сетью системы, для чего необходимо разработать методы создания связей между, например, кадрами видео и текстом. В Intermedia и NoteCards это достигается сравнительно легко: они разрабатывались в расширяемых средах (объектно-ориентированный язык Cи и Lisp соответственно), отсюда – легкая встраиваемость в систему модулей, создающих гипертекстовую функциональность для новых видов информации.

Что касается объемов узлов, то, например, такие системы, как ZOG и HyperCard, поддерживают только узлы жестко фиксированной величины (объемом с экран), в то время как другие обладают более гибкими возможностями.

Узел на экране обычно дается в своем отдельном окне. Одновременно может быть открыто лишь несколько окон-узлов. Выполняются стандартные операции оконных систем. Отметим, что сами оконные системы, а также манипулятор мышь, были изобретены Дагласом Энгельбартом, для нужд его пионерской системы.[13]

Объем узла, разбиение информации на узлы – серьезная проблема для автора гипертекста, который должен думать о восприятии смыслового содержания узла читателем. Предпочитительны узлы, обладающие внутренним смысловым единством (внутренней когерентностью).[13]

Связи. Способ реализации связей имеет ключевое значение, поскольку именно связи обеспечивают "нелинейное ветвление" – сердцевину гипертекстовой функциональности.[13]

При описании связей в гипертексте часто используется понятие anchor (буквально, якорь) – это слово или фраза, которые подсвечиваются на экране и воспринимаются как точки начала или конца связи.

Возможны два варианта статуса гипертекстовых связей. В первом связи являются самостоятельными объектами, которыми пользователь может манипулировать напрямую; во втором связи спрятаны в системе (возможно, как часть текста) и проявляются, только когда пользователь каким-либо образом задействует их.[13]

Intermedia – пример системы со связями первого статуса. У нее связи хранятся отдельно от документов, на которые ссылаются. Эти связи также могут быть типизированы с помощью данных вида атрибут – значение, что позволяет осуществлять их поиск по запросу пользователя.

Связи этого статуса делают возможным включение в систему графического браузера – средства, с помощью которого сеть (граф из узлов и связей) отображается на экране. Без хранения межузловых связей невозможно говорить о графовой структуре сети. Поэтому лишь такие системы, как NoteCards, Intermedia и реализации HAM (Hypertext Absnract Machine), могут обеспечивать функциональность, необходимую для обработки сети как графа.

Связи второго статуса ("спрятанные") – есть просто спецификации адреса для перехода и существуют только в момент их активизации. Например, связи в HyperCard – это кнопки, содержащие инструкцию "иди к карточке № 42106" (или что-то подобное). Однако кнопки могут и не содержать таких инструкций, они будут целиком вставлены в программный код системы. Так как нет ясного соотношения между узлом и набором его связей в гипертекстовой сети, HyperCard не имеет средств для воздействия на сеть как целое. Хотя система и обеспечивает графическое представление последних посещенных карточек, не поддерживается информация об альтернативных маршрутах, по которым можно следовать.[13]

В системах NLS, HyperTIES, ZOG адрес узла для перехода по связи хранится как часть текста или имя отдельно стоящей кнопки. Такие связи по своей природе однонаправленные, они позволяют осуществлять сквозной проход по документу, но при этом возможно оказаться в тупике (в узле, из которого не выходят связи).[13]

Еще одной важной характеристикой связи является то, как она подключена к узлам – соединяет ли она узлы как целые или фрагментами. Еще по поводу Memex отмечалось, что, когда узлы соединяются как целые, у читателя могут возникать трудности с пониманием причины существования конкретной связи от данного узла, особенно если у него эта связь не единственная. В свою очередь, в узле, куда произошел переход, читатель часто вынужден искать информацию, которая делает переход осмысленным.

Наиболее гибко эти проблемы были решены в Intermedia. В этой системе связи могут начинаться из любого фрагмента одного узла и заканчиваться в любом фрагменте другого. В Notecards и HyperCard, как и Memex, связь относится целиком к узлу-карточке. У NLS, ZOG, HyperTIES и Guide началом связи всегда служат некоторые слова и фразы.[13]

Интерфейс пользователя. Эволюция гипертекстовых систем тесно переплетена с исследованиями, разработками, изобретениями в области человеко-машинного интерфейса. Иконки, кнопки, оконные интерфейсы, манипуляторы типа мышь и многое другое изобрели люди из гипертекстового сообщества. И выдающимся изобретателем в этой области является пионер гипертекста Даглас Энгельбарт. Он жив до сих пор и очень почитаем в компьютерном мире. Несколько лет тому назад была учреждена премия Энгельбарта, вручаемая на ежегодной международной конференции серии Hypertext за лучшую представленную работу.[13]

А влияние гипертекстовых разработок на развитие новых идей в области человеко-машинного интерфейса видно по тому факту, что программы регулярных всемирных конференций по взаимодействию компьютера с человеком обязательно включают раздел, посвященный гипертексту.

Однако вернемся к различным вариантам реализации интерфейса пользователя в обозреваемых гипертекстовых системах. Эти варианты с их особенностями отражают поиски и пути, которыми шли исследователи.

Все системы позволяли легко перемещаться по документу в его естественной последовательности – либо путем скроллирования линейного документа (Intermedia, Guide), либо двигаясь по дереву иерархической структуры узлов, используя операции "следующий потомок" или "возврат к родителю" (ZOG, HyperCard).

Значительно больший интерес представляют вопросы: как пользователь может распознать связь (каково ее визуальное представление) – и как эту связь можно активизировать? В разных системах эти вопросы решаются по-разному. В Memex информация о связях просто хранилась на специально отведенном пустом пространстве узла как сигнал читателю: что-то из данного текста связано с дополнительной информацией. Все остальные системы позволяли размечать информацию узла так, чтобы его части могли стать метками связей: у одних (ZOG, HyperTIES и Guide) это была подсветка соответствующего ключевого слова или фразы, у других (HyperCard, Intermedia, Notecards) – значки связей или кнопки, которые, как значки сноски (примечания), предупреждали читателя о существовании дополнительной информации, соотнесенной с данной.

Возможность выбора той или иной связи достигалась, например, в Memex и ZOG соотнесением каждой данной связи с ключом клавиатуры (так, как это делается для меню). В Intermedia, Notecards, HyperCard и Guide вместо этого надо было указать на связь и "кликнуть" мышью. У HyperTIES немного другая модель (клавиатурная): одна связь-точка остается подсвеченной и эта подсветка перемещается от одной связи к другой под управлением курсорных стрелок. Когда нужная связь выбрана, пользователь активизирует ее с помощью некоторого другого ключа.

В NLS подобная операция также состоит из двух частей – выбрать и активизировать. Такой подход позволяет управлять как выбором, так и последующим действием (так называемый подход "selections and actions").[14]

Когда связь распознана и выбрана, система осуществляет немедленный гипертекстовый прыжок по связи к новой информации. Такой мгновенный прыжок больше подходит компьютеру, чем человеку. Читатель, например при просмотре журнала, встретив ссылку (или цитату) на другую книгу или статью, не бросает чтение, а доводит его до конца и лишь потом по библиотечной ссылке смотрит работу, на которую ссылались. В случае с компьютером такие переходы по связям ведут к поиску в глубину с растущей стопкой (стеком) отложенных статей, к которым надо будет вернуться. Такие отложенные статьи могут расти, как снежный ком, увеличивая нагрузку на память и отвлекая внимание читателя. При этом многие системы могли высвечивать только один узел на экране в данный момент.

При нескольких переходах по связям у пользователя терялся контекст исходной информации. Он забывал, с чего начал свои переходы и где находится, особенно когда приходилось исследовать неизвестную сеть. Это существенный недостаток гипертекста – быстрая дезориентация пользователя.

Второй побочный эффект и недостаток гипертекста, называемый когнитивной перегрузкой, связан с необходимостью совершать множество действий (выбирать связи, кнопки, совершать переходы, возвращаться назад) для получения полезной информации. В гипертекстовых системах были разработаны средства борьбы с этими недостатками. Например, Notecards и Intermedia позволяли многим узлам находиться на экране одновременно, в Intermedia разрабатывались графические браузеры, отображающие в отдельном окне структуру сети связей (локальные и глобальные карты). При этом существовала опасность утопить пользователя во множестве открытых окон с разнообразной информацией.[14]

Таким образом, введение в обычный текстовый формат гипертекстовых (перекрестных) связей увеличивает функциональность системы по сравнением со случаем статично-линейного текста. Однако некоторые особенности гипертекстовых систем делают написание гипертекста тяжелым трудом , а сам гипертекст – трудным для восприятия.

Преимуществам нелинейности, перекрестных переходов и мультимедийной информации – всему тому, что есть "больше, чем текст", угрожают недостатки, описанные выше. В некоторых обстоятельствах гипертекст, вероятно, является менее подходящим, чем линейный текст.

Пути и навигация. Борьба с недостатками гипертекста насчитывает не один десяток лет, и хотя полностью их устранить нельзя, многое сделано в этом направлении.[13]

Прежде всего, в гипертексте изначально существует метафора прокладывания пользователем пути (тропы, трейла) в паутине гипертекстовых связей. Путь – это последовательность из узлов и связей, которые посещает пользователь. Это понятие выработал еще Ванневар Буш, имея в виду аналогию с процессами в мозгу человека: "Человеческий ум работает ассоциативно. Ухватив, поняв что-то, он сразу цепляется за следующее, что предлагается, подсказывается ассоциацией мыслей в соответствии с некоторой сложной паутиной трейлов, которые поддерживаются ячейками мозга".

Обычно гипертекстовые системы кроме возможности переходов по связям предоставляют и различные методы, помогающие прокладывать пути, т. е. осуществлять навигацию в гипертексте. Эти методы, не ограничивая свободу пользователя, направлены на преодоление дезориентации и дополнительной когнитивной нагрузки, от которых страдает читатель гипертекста и которые вместе получили название "проблема навигации" (Navigation Problem).

У большинства гипертекстовых систем навигационную помощь предоставляют следующие средства.

Локальная карта. Это всех связей и , непосредственно связанных с узлом. Она может графической (, в виде блок-схемы) или (просто список). карты обеспечивают контекст и выбрать связь.

Глобальная карта. Это представление полной из узлов и . Ввиду трудностей с огромного числа , такие карты пригодны для гипертекстов объемом сотни узлов. всех с ними разработчики (Янкелович, Мейровиц, ван ). Локальные и глобальные в реальных гипертекстовых назывались " браузерами".[13]

(бэктрекинг). Посещенные и связи текущего сохраняются и возможность вернуться в узлы.[13]

(проложенные маршруты). Это пути, можно проходить по . Подобное полезно при гипертекстовых учебников или . Для больших значение туров .[13]

Поиск (в гипертекстовых узлов). все достижения в информационного поиска: запросы, морфологический , языки запросов и др.

Фильтры. Это ограничения области пределами задаваемого подмножества узлов и . Такие называются видами () и могут быть для последующего повторного .[13]

. Список подсвеченных , связей или узлов, по алфавиту, теме, , предмету и т. д. разрабатываются автором и тот недостаток, что никак не точку зрения на то, как он хочет гипертекст.[13]

. Читатель может (пометить) свою позицию, вернуться к ней позже.

Для больших и сложных сетей растет использовать , интеллектуальную помощь в .

В заключение – об одном подходе, принадлежащем исследователям и на преодоление проблемы в гипертексте.

В этом пользователь и система в сети навигацию, подразумевается, что тропа должна подобна когерентному (тексту, которого вместе смысловое единство). Это , что кроме локальной между узлов в тропе-трейле поддерживаться и некая связность, подчиненность некоторой , заданной начальным тропы.[5]

Такая навигация, конечно, не всегда. , человек, осуществляющий в гипертексте, может перемещаться по связям в попасть на факты, получить на какой-то частный , когда найденные рассматриваются по , вне контекста.[6]

Однако и альтернативные виды активности при взаимодействии с , где такая нужна. Это – браузинг по тематике, или изучение предмета по материалу, в сети, или же чернового варианта из узлов сети.[6]

навигация реализована в СМИСК – разработке. В этой локальные переходы по в строящейся тропе-трейле под так называемым , следящем за глобальной () связностью. Этот базируется на иерархии строящегося .

Иерархия реализована в интерактивного дерева, развертывается в тропу-дискурс.

разработки опираются на труды известных психолого-лингвистов, как ван , Кинч и Левельт. были в докладе на гипертекстовой международной конференции "" EWHCI'93.

Глава 2. Обзор языков разметки

Самый на сегодняшний день гипертекстовой разметки , был создан для организации информации, в сети Интернет, и ется одной из составляющих WWW. С использованием гипертекстовой документа способ разнообразных информационных в сети более упорядочен, а получили удобный поиска и просмотра информации.

HTML (HyperText Language) - язык гипертекстовой , который в настоящее используется в Wide Web. Изначально как язык для обмена и технической документацией. языка занимается W3C (WWW ). [15]

HTML является версией стандартного о языка - SGML (Standart Markup Language), был утвержден ISO в качестве а еще в 80-х . Этот язык для создания других разметки, он определяет набор , их атрибуты и внутреннюю документа. Контроль за использования дескрипторов при помощи набора правил, DTD-описаниями, которые программой клиента при документа. Для класса документов свой набор , описывающих грамматику языка . С помощью SGML описывать структурированные , организовывать информацию, в документах, эту информацию в некотором формате. Но в виду своей сложности, использовался, в , для описания синтаксиса языков (наиболее из которых является ), и немногие работали с SGML- напрямую.[15]

SGML — метаязык, на котором определять язык разметки для . SGML — наследник в 1969 году в IBM GML (Generalized Markup ).[16]

SGML был разработан для использования машинно-читаемых документов в больших и аэрокосмических проектах. Он использовался в и издательской сфере, но его затруднила его широкое для повседневного использования.

части SGML: [16]

SGML-декларация — , какие символы и могут появляться в ;
Document Type Definition — определяет синтаксис разметки. DTD может дополнительные определения, , как символьные ссылки-мнемоники;
семантики, к разметке — также ограничения синтаксиса, не могут быть внутри DTD;
SGML-документа — по крайней , должен быть элемент.

Язык предоставляет вариантов синтаксической для использования различными . Изменяя SGML-декларацию, даже от использования угловых , хотя этот считается стандартным, так concrete syntax.

Пример SGML: [16]

< type="example">

typically like <>this</italics>

</>

SGML стандартизован ISO: « 8879:1986 Information and office Generalized Markup (SGML)».

Языки HTML и XML от SGML. HTML — это SGML, а — это подмножество SGML, для упрощения процесса разбора документа. приложениями являются SGML Docbook (документирование) и «Z » (типография и документирование).

2.1.1 разметка

Система разметки коды разметки, предоставляющие названия для частей документа. , такие, как <> или \end{list} просто часть документа и т про нее: "следующий элемент - " или "это - начатого последним " и т.д. Напротив, система разметки определяет, обработка производиться в конкретной документа: "здесь процедуру PARA с 1, b и x", или "сдвинуть границу на 2см влево, -- на 2см вправо, пропустить и встать на новую границу", и т.д. В инструкции, необходимые для документа с определенными (например, для его форматирования) отделяются от разметки, встречающейся документа. Обычно они вне документа в отдельных или программах.

При , а не процедурной, разметке и тот же документ можно различными программами, из которых применять различные обработки к тем частям , которые она считает . Например, анализа содержимого совершенно игнорировать в аннотируемом тексте, как программа может извлекать и их вместе для печати в каждой главы. С и теми же файла могут разные правила . Например, одна может имена людей и имена для создания или базы данных, а , оперирующая тем же , может печатать собственные шрифтом начертания.

2.1.2 Типы

SGML понятие типа и, как следствие, определения документа (document definition, DTD). Тип формально определяется его частями и их структурой. , определение отчета констатировать, что он из заголовка, возможно, , за которым следуют и один или несколько . Все, что не имеет , в соответствии с этим определением, отчетом не , так же, как не является им последовательность , за которой аннотация, вне зависимости от , насколько такие похожи на отчет для .

Раз документы известные типы, использовать специальную , называющуюся анализатором (), для проверки , утверждающего свою определенному типу. проверяет, что все элементы, типом , на самом деле и расположены в правильном . Что более важно, документы и того же типа обрабатываться одинаковым . Можно конструировать , использующие структуры документа, , таким образом, действовать в более манере.

2.1.3 данных

Основная создания SGML в том, чтобы обеспечить закодированных из одной аппаратной и среды в другую без информации. Два описанных свойства эту задачу на абстрактном ; третье свойство -- на строк байтов (), из которых документ. SGML универсальный механизм подстановки (string ), то есть, машинно-независимый способ , что некоторая последовательность в документе должна при его обработке другой последовательностью. очевидное применение механизма -- обеспечение номенклатуры; , и более важное, -- печально известной различных компьютерных понимать символов друг , или способ в любой предоставить все графические , необходимые для приложения, путем описательных обозначений символов. Строки, этим подстановки, называются (entities). В SGML объект (entity) специальный : оно означает именованную размеченного документа, ко всяческим соображениями . Объектом быть строка или целый файл . Для включения его в документ конструкция, как ссылка на объект ( reference).

2.1.4. SGML-

Этот раздел простой и механизм разметки или структурных единиц , предоставляемый SGML. Он описывает, способы SGML для выражения правил, возможные осмысленные этих в любых текстах.

В стандарте SGML для единиц, рассматриваемых как компоненты, термин элемент (). Различным типам даются различные , но SGML не никаких способов значение конкретного элементов, кроме его к другим элементов. То есть, все, что сказать про элемент, (например) <blort>, -- это то, что его могут (а могут и не встречаться) элементов типа <>, и что он может раскладываться (а и не раскладываться) на типа <blortette>. подчеркнуть, что стандарт совершенно не заботит текстовых : она зависит от приложения (В момент идет по созданию (с использованием SGML) стандартного"языка и спецификации стилей (document style and specification , DSSSL)".) Дело SGML-совместимых наборов (таких, как описанный в Руководство) -- осмысленные имена элементов и документировать их использование в разметке . Это -- одна из данного документа. От выбора названий , кодирующих их функцию, технический для названия типа : обобщенный идентификатор ( identifier), или GI. [16]

В тексте ( документа, document ) каждый элемент быть явно или отмечен образом. Стандарт несколько разных это сделать, наиболее используемый из них -- метку (tag) в начале (открывающая метка, ) и еще одну -- в конце (закрывающая , end-tag). Пара и закрывающей меток для выделения элементов в , так же, как разные или кавычки используются в пунктуации. Например, цитирования может отмечен в так: [16]

реплика Розалинды <quote>Ничего глупее я никогда не

...

Как показывает данный , открывающая метка вид <название>, где угловая скобка начало открывающей , "название" -- идентификатор элемента, и закрывающая скобка означает метки. Закрывающая имеет вид, за исключением того, что за угловой скобкой символ косой , так что соответствующая метка будет </>. (На самом деле , используемые в качестве (угловые , косая черта, знак) могут , но удобно использовать , приведенные в описании.) [16]

содержимого элемента:

Элемент может пустым (), то есть, не содержать вообще ничего; может содержать текст. , однако, элементы типа будут содержаться (embed) элементов типа. [16]

использования правил, , какие элементы быть в другие, является важным свойством . Не переходя к дальнейшему этих , можно попытаться , как размеченный вышеприведенным текст может обработан с целями. Простая программа может только значимые текста для списка заголовков, или , использованных в тексте ; простая программа может пустые строчки строфами, возможно, с красной строки строчку строфы, или вставляя строфы. Разные каждого стихотворения набираться способами. Более аналитическая программа соотносить использование пунктуации со и метрическими разделами. , желающие видеть изменений разделов или строк, редактором этого , могут это сделать меняя положения . И, конечно, выше текст быть перенесен с компьютера на другой и любой (или человеком), смысл внесенных в меток, безо преобразований и , необходимых обычно для файлов текстовых . [16]

Определение документов : DTD

Правила наподобие -- первый шаг в создании спецификации структуры документа или типа документа, сокращаемого как DTD. При создании DTD документа может произвольно или сколь угодно структуру. Нужно компромисс между следования правилам и сложностью реальных текстов. Это справедливо, когда правила к уже существующим текстам: может иметь туманное представление об предназначении или старых текстов, и непротиворечивых правил, их структуры, может очень . С другой стороны, специфицируется новый , например, для ввода в текстовую данных, то чем точнее правила, тем лучше они быть выдержаны. в случае уже существующего текста иметь смысл ограничивающий набор , относящихся к видению текста или , касающейся текста, -- бы как средство проверки этого или гипотезы. Важно , что каждое определение документа является текста. Не единственного DTD, охватывающего все о тексте, хотя быть удобно одни DTD для конкретных типов . [16]

В настоящее SGML шире применяется там, где требованием является структуры документов. , при производстве технической весьма , чтобы разделы и были соответствующим вложены, чтобы ссылки корректны, и так далее. В ситуациях к документам как с сырому материалу, к применяется определенный набор . Однако, как говорилось , использование простых может сильно упростить аккуратной разметки и менее ограниченных . Делая правила явными, уменьшает свою по разметке и проверке текста, в то же выявляя интерпретацию и значимые особенности текста. [16]

минимизации

часть описания правила минимизации для . Эти правила определяют, ли присутствовать и закрывающая метки для появления данного . Они имеют вид пары , разделенных , первый из которых к открывающей, а второй -- к метке. В обоих должны или минус или буква O; означает, что метка присутствовать, а буква -- что она может опущена. Так, в нашем каждый элемент, <line>, должен открывающую . Только элементы <> и <anthology> обязаны иметь и закрывающую . [16]

содержимого

Третья каждого описания, в круглые скобки, моделью элемента, потому что она , что могут содержать элемента. Содержимое либо в других элементов, при помощи специальных слов. Есть таких слов, из которых часто используемое -- #. Это сокращение от parsed data( символьные данные), и оно , что описываемый элемент включать любые символьные . Если представить SGML описание в структуры наподобие дерева, с предком наверху (в случае, это будет <>), то почти всегда, следовать по дерева вниз (, от <anthology> к <poem>, <>, <line> или <title>), мы к #PCDATA. В примере так определены <> и <line>. Так как в их модели указано только # и не названо включаемых элементов, то они не содержать другие . [16]

Обозначения

Вышеприведенное для <stanza> устанавливает, что состоит из одной или строк. Оно использует включения ( indicator) -- плюс -- для указания , сколько раз может элемент, в модели содержимого. В SGML есть три включения, обычно знаком , вопросительным знаком и . (Так же, как и ограничители, эти имеют формальные и могут переопределены соответствующим описанием.) Знак означает, что соответствующий может один или более раз; знак означает, что быть не более элемента; означает, что элемент или отсутствовать, или появляться и более раз. Так, если бы содержимого для <> была (LINE*), бы допустимы строфы без , так же, как и с более чем одной . Если бы она (LINE?), то пустые были бы тоже , но ни одна строфа не бы иметь чем одну строку. <poem> в примере , что <poem> не может больше заголовка (но может не ни одного) и что оно должно как минимум одну <> (и может несколько). [16]

Модель содержимого (?, STANZA+) содержит одного . Поэтому нужно указать порядок, в эти элементы (<title> и <>) могут . Это упорядочение определяется (group connector запятой -- использованным ее компонентами. три возможных связки, представляемых запятой, чертой и знаком "&". ( же, как ограничители и включения, связки в стандарте формальные и могут быть соответствующим описанием.) [16]

означает, что оба компонента, она соединяет, должны в порядке, в модели содержимого. "&" указывает, что компоненты, он соединяет, должны оба, но в произвольном . Вертикальная черта , что может встречаться один из компонентов, она соединяет. бы в нашем примере заменить на знак то заголовок мог бы появляться или строфами , или в его конце (но не между ). Если ее заменить на черту, то стихотворение бы состоять или из , или только из строф -- но не из и другого.

Группы

До сих пор в нашем примере каждой содержимого были или элементом, или #PCDATA. можно, однако, модели , в которых компонентами списки элементов, связками. Такие , известные как модели (model ), могут также обозначениями включения и, в очередь, объединенными связками. продемонстрировать эти возможности, наш пример так, чтобы нестрофовые стихов. Для демонстрации стихотворения на строфовые (), двустишия (couplets), и (blank) или ?? (). Белый стих просто из строк ( пока возможность абзацев) определяется как <line1>, за идет <line2>.

<!ELEMENT couplet 2) >

Элементы <1> и <line2> (которые , например, чтобы возможными изучение рифмования) в точности ту же модель , что и существующий элемент <>. Они, следовательно, могут одно и то же . В этой ситуации указать группу (name group) в первого единого описания , а не записывать последовательность , отличающихся только именами. названий -- это список GI, связками и заключенный в скобки: [16]

<! (line | line1 | line2) O O (#PCDATA) >

элемента <poem> можно изменить так, включить все три варианта:

<! poem - O (title?, (stanza+ | couplet+ | line+) ) >

То , стихотворение состоит из заголовка, за которым одна или несколько , либо или несколько двустиший, одна или несколько . Отметьте разницу этим и следующим:

<!ELEMENT - O (title?, ( | couplet | line)+ ) >

вариант, обозначение включения у , а не у каждого элемента группы, позволит стихотворению из смеси строф, или белого стиха.

образом можно довольно модели, отражая сложность различных текстов. В следующем мы рассмотрим стих, в котором рефрен (refrain). Он состоять из повторений или быть текстом, не разделенным на строки. Рефрен появляться только в стихотворения или как дополнение после строфы. Это можно моделью содержимого следующей:

<! refrain - - (#PCDATA | +)>

<!ELEMENT poem - O (title?,

( (line+)

| (?, (stanza, ?)+ ) )) >

То есть, состоит из необязательного , за которым следует или строк, или группа, открывающаяся , за которым идет или несколько других , каждый которой состоит из с необязательным рефреном. образцу отвечает рефрен - - строфа - рефрен, так же, как и - рефрен - строфа - . А последовательность рефрен - - строфа - ему не удовлетворяет, так же, как и строфа - - рефрен - строфа. прочих условий, этой , -- требования, чтобы в было хотя бы строфа, если оно не просто из , и чтобы при наличии и и строфы они появлялись именно в порядке.

2.2 HTML

— стандартный язык разметки во Всемирной паутине. Большинство веб-страниц содержат разметки на языке (или XHTML). Язык интерпретируется браузерами; в результате интерпретации текст отображается на монитора компьютера или устройства.

Язык HTML приложением SGML (стандартного языка разметки) и международному ISO 8879.[15]

HTML был разработан британским Тимом Бернерсом-Ли приблизительно в 1986—1991 годах в стенах ЦЕРНа в Женеве в Швейцарии. создавался как для обмена научной и документацией, пригодный для людьми, не являющимися в области вёрстки. успешно справлялся с сложности SGML определения небольшого структурных и семантических — дескрипторов. Дескрипторы часто называют «тегами». С HTML можно создать простой, но красиво документ. Помимо структуры документа, в внесена гипертекста. Мультимедийные возможности были позже.[15]

язык HTML был и создан как структурирования и форматирования без их привязки к средствам (отображения). В идеале, с разметкой должен был без стилистических и искажений воспроизводиться на с различной технической (цветной современного компьютера, экран органайзера, по размерам экран телефона или и программы голосового текстов). Однако применение HTML далеко от его задачи. Например, тег <> предназначен для создания в таблиц, но часто и для оформления элементов на странице. С времени основная платформонезависимости языка была в жертву современным в мультимедийном и графическом

2.2.1 HTML-документа

HTML — это теговый язык разметки , то есть документ на языке представляет собой элементов, причем и конец элемента обозначается пометками, называемыми тегами. , в котором набрано имя , в HTML не имеет. Элементы быть пустыми, то не содержащими никакого и других (например, тег перевода <br>). В этом обычно не указывается тег. Кроме , элементы могут атрибуты, определяющие их свойства (например, шрифта для <font>). Атрибуты в открывающем теге. Вот части разметки :

<p>Текст двумя тегами - и закрывающим.</p>

<a ">Здесь элемент атрибут .</a>

А вот пример элемента: <br>

HTML-документ, отвечающий HTML версии, обязан со строки декларации HTML <!DOCTYPE>, обычно примерно так:

<!DOCTYPE PUBLIC "-//W3C//DTD 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

Если эта не указана, то добиться отображения документа в браузере труднее.

Далее начало и документа тегами <> и </html> соответственно. этих тегов находиться заголовка (<head></head>) и (<body></body>) документа.

2.2.2 элементы

Теги и их нечувствительны к . То есть <A HREF="http://example.com"> и <a "> означают одно и то же.

В версиях HTML у каждого огромное число параметров — обычно не 15. Приведем основные.

[15]

<a ="filename" target="_">название ссылки</a>

href задает адреса , на который указывает .
filename — имя файла или Internet, на который сослаться.
ссылки — название ссылки, которое отображаться в браузере, то показываться тем, кто на страницу.
target — значение окна или , в котором будет документ, на указывает ссылка. значения атрибута:
- _ — открытие документа в окне;
- _ — открытие документа в окне;
- _self — документа в текущем ;
- _parent — документа в родительском .

Значение по умолчанию: _.

Тот же элемент используется для так называемых «» (anchor), которые потом использоваться в , направленных на какой-то элемент . Например:

<!DOCTYPE >

<html>

<head>

< charset="utf-8">

<>Якорь документа</title>

</>

<body>

<p><a name=""></a></p>

<p>текст</p>

<p><a href="#">Наверх</a></p>

</>

</html>

Аналогичным якорь можно на закладку, находящуюся на веб-странице или на сайте: там, куда ссылка, должен <a name="xxx"></a>, а там, откуда ссылка, к href добавляется решётки и название .

Текстовые блоки

<H1> … </1>, <H2> … </H2>, … ,<6> … </H6> — заголовки 1, 2, … 6 . Используются для выделения текста ( 1 — самый крупный, 6 — мелкий).
<P> — новый . Можно в конце поставить </>, но это не обязательно.
<BR> — строка. Этот тег не (то есть не существует </BR>)
<> — горизонтальная линия
<> … </BLOCKQUOTE> — цитата. текст сдвигается .
<PRE> … </> — режим preview ( text). В этом текст заключается в и никак не (то есть теги, </PRE>, игнорируются, и строки ставятся там, и там, где они есть в документе).
<DIV> … </> — блок (обычно для применения стилей CSS)
<> … </SPAN> — (обычно используется для стилей CSS)

Форматирование [15]

<EM> … </> — логическое (обычно отображается шрифтом)
<STRONG> … </> — усиленное логическое (обычно жирным шрифтом)
<I> … </> — выделение текста
<B> … </B> — выделение жирным
<U> … </U> — подчёркивание
<S> … </S> (или <STRIKE> … </> )— ~~зачёркивание~~ текста
<> … </BIG> — шрифта
<SMALL> … </> — уменьшение шрифта
<> … </BLINK> — мигающий . Внимание! тег не работает в браузере Explorer версий 5 и без применения JavaScript
<> … </MARQUEE> — по экрану текст.
<> … </SUB> — подстрочный . Например, H<SUB>2</SUB>O текст H₂O.
<> … </SUP> — надстрочный . Например, E=mc<> создаст текст ².
<FONT > … </FONT> — задание шрифта. У этого есть следующие :
- COLOR= — задание цвета. может быть в шестнадцатеричной форме как # (первые 2 цифры задают компоненту, следующие 2 — , последние 2 — синюю) или .
- FACE= задание гарнитуры шрифта
- =размер задание шрифта. Размер от 1 до 7: по умолчанию 3. много способов стандартный размер.
- =+изменение или SIZE=- — изменение шрифта от стандартного. , +2 означает размер на 2 стандартного.

Списки

<UL>

<LI> первый </LI>

<LI> второй элемент </LI>

<LI> элемент </LI>

</UL>

создаёт

первый элемент
элемент
элемент

Если <UL> (Unordered — ненумерованный список) <OL> ( List — нумерованный ), список получится :

первый элемент
элемент
элемент

У этих есть параметры:

= "тип"

где тип — форма: в <> — символов

— квадрат
circle —
disk — круг: по

а в <OL> — цифр или

A или а (латинскими ) — буквенный список: заглавыми или строчными
I или i — римские цифры: заглавными или буквами

Объекты

EMBED — вставка объектов: не-HTML и media-файлов
— вставка Java-апплетов
SCRIPT — скриптов.

Изображения

IMG — вставка изображения. тег не закрывается.
- SRC — имя или URL
- ALT — имя (отобразится, если в запретить отображать )
- TITLE — краткое изображения ( при наведении курсора на )
- WIDTH, HEIGHT — (если не совпадают с размерами , то изображение «растянется» или «»)
- ALIGN — задает обтекания текстом (, middle, , left, right)
- , HSPACE — задают вертикального и горизонтального вокруг

Пример:

можно сделать :

2.3 XML

XML — рекомендованный Консорциумом Всемирной паутины язык разметки, представляющий собой общих синтаксических . XML предназначен для хранения данных (взамен файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML), иногда называемых словарями. XML является упрощённым подмножеством языка SGML.[17]

Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Интернет. Словари, основанные на XML (например, RDF, RSS, MathML, XHTML, SVG), сами по себе формально описаны, что позволяет программно изменять и проверять документы на основе этих словарей, не зная их семантики, то есть не зная смыслового значения элементов. Важной особенностью XML также является применение так называемых пространств имён (namespace). [17]

2.3.1 Достоинства XML

XML(человеко-ориентированный) — это формат, одновременно понятный и человеку и компьютеру;
XML поддерживает Юникод;
в формате XML могут быть описаны основные структуры данных — такие как записи, списки и деревья;
XML — это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей;
XML имеет строго определённый синтаксис и требования к парсингу, что позволяет ему оставаться простым, эффективным и непротиворечивым.
XML также широко используется для хранения и обработки документов как он-лайн, так и офф-лайн:
XML — формат, основанный на международных стандартах;
иерархическая структура XML подходит для описания практически любых типов документов;
XML представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
XML не зависит от платформы;
XML является подмножеством SGML (который используется с 1986 года). Уже накоплен большой опыт работы с языком и созданы специализированные приложения.
XML не накладывает требований на расположение символов на строке

2.3.2 Недостатки XML

Синтаксис XML избыточен.
- Размер XML документа существенно больше бинарного представления тех же данных. В грубых оценках величину этого фактора принимают за 1 порядок (в 10 раз).
- Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON) и особенно в форматах данных оптимизированных для конкретного случая использования.
- Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
- Для большого количества задач не нужна вся мощь синтаксиса XML и можно использовать значительно более простые и производительные решения
XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий «целых чисел», «строк», «дат», «булевых значений» и т.д.
Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами
- Выражение не иерархических данных (например, графов) требует дополнительных усилий
- Кристофер Дейт отмечал, что «…XML является попыткой заново изобрести иерархические базы данных…» (в 1980-е года иерархические базы данных были вытеснены реляционными базами данных).
Пространства имён XML сложно использовать и их сложно реализовывать в XML парсерах
Существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком (YAML, JSON, SweetXML). Также в последнее время очень большое распространение получил формат fb2.

2.3.3 Принцип построения XML-документа

В общем случае XML-документы должны удовлетворять следующим требованиям: [17]

В заголовке документа помещается объявление XML, в котором указывается язык разметки документа, номер его версии и дополнительная информация
Каждый открывающий тэг, определяющий некоторую область данных в документе обязательно должен иметь своего закрывающего "напарника", т.е., в отличие от HTML, нельзя опускать закрывающие тэги
В XML учитывается регистр символов
Все значения атрибутов, используемых в определении тэгов, должны быть заключены в кавычки
Вложенность тэгов в XML строго контролируется, поэтому необходимо следить за порядком следования открывающих и закрывающих тэгов
Вся информация, располагающаяся между начальным и конечными тэгами, рассматривается в XML как данные и поэтому учитываются все символы форматирования ( т.е. пробелы, переводы строк, табуляции не игнорируются, как в HTML)

Конструкции языка [17]

Содержимое XML-документа представляет собой набор элементов, секций CDATA, директив анализатора, комментариев, спецсимволов, текстовых данных. Общая схема представлена на рисунке 2.

Пример XML-документа:

<flower>tulip</flower>

<flower>cactus</flower>

</conservatory>

Рисунок 2- Общая схема структуры XML-документа

Элементы [17]

Элемент - это структурная единица XML- документа. Заключая слово rose в в тэги <flower> </flower> , мы определяем непустой элемент, называемый <flower>, содержимым которого является rose. В общем случае в качестве содержимого элементов могут выступать как просто какой-то текст, так и другие, вложенные, элементы документа, секции CDATA, инструкции по обработке, комментарии, - т.е. практически любые части XML- документа.

Любой непустой элемент должен состоять из начального, конечного тэгов и данных, между ними заключенных. Например, следующие фрагменты будут являться элементами:

<city>Novosibirsk</city>

Набором всех элементов, содержащихся в документе, задается его структура, и определяются все иерархическое соотношения. Плоская модель данных превращается с использованием элементов в сложную иерархическую систему с множеством возможных связей между элементами.

Производя в последствии поиск в этом документе, программа клиента будет опираться на информацию, заложенную в его структуру - используя элементы документа. То есть, если, например, требуется найти нужный университет в нужном городе, используя приведенный фрагмент документа, то необходимо будет просмотреть содержимое конкретного элемента <university>, находящегося внутри конкретного элемента <city>. Поиск при этом, естественно, будет гораздо более эффективен, чем нахождение нужной последовательности по всему документу.

В XML документе, как правило, определяется хотя бы один элемент, называемый корневым и с него программы-анализаторы начинают просмотр документа. В приведенном примере этим элементом является <country>

В некоторых случаях тэги могут изменять и уточнять семантику тех или иных фрагментов документа, по разному определяя одну и ту же информацию и тем самым предоставляя приложению-анализатору этого документа сведения о контексте использования описываемых данных. Например, прочитав фрагмент <city>Holliwood</city> мы можем догадаться, что речь в этой части документа идет о городе, а вот во фрагменте <restaurant>Holliwood</restaurant> - о забегаловке.

В случае, если элемент не имеет содержимого, то есть нет данных, которые он должен определять, то он называется пустым. Примером пустых элементов в HTML могут служить такие тэги HTML, как <br> <hr>, <img>. Необходимо только помнить, что начальный и конечные тэги пустого элемента как бы объединяется в один, и надо обязательно ставить косую черту перед закрывающей угловой скобкой (например, <empty/>;)

Имена тегов и атрибутов можно писать и по-русски. Опыт HTML показал, сколь важна тщательная и своевременная интернационализация всех аспектов языка, претендующего на какую-то роль в Интернете. Поэтому создатели XML позаботились, в частности, о том, чтобы в именах тегов и атрибутов можно было пользоваться не только латинскими буквами, но и кириллицей, иероглифами и вообще всеми символами из репертуара Unicode, которые считаются "буквами" хотя бы в одном языке или системе письменности.

Секция CDATA используется для того, чтобы обозначить части документа, которые не должны восприниматься как разметка. Секция CDATA начинается со строки '<![CDATA[' и заканчивается строкой ']]>'. Внутри самой секции не должна присутствовать строка ']]>'.

Секция CDATA:

Cтруктура XML-документа и разбор его XML-процессором позволяют произвести только простую проверку того, что документ является правильно оформленным. Для создания на этой основе специализированных языков необходимы дополнительные средства описания этих языков. XML поддерживает два механизма подобных описаний: определения типа документа (document type definition, DTD) и XML-схемы (XML schema).

Глава 3. Будущее гипертекстовой разметки

В настоящий момент актуальным стеком технологий для верстки сайтов являются языки HTML5 и CSS3.

3.1 Язык гипертекстовой разметки HTML5

HTML5 – это пятая версия языка HTML.

HTML5 вводит несколько новых элементов и атрибутов, которые отражают типичное использование разметки на современных веб-сайтах. Некоторые из них — семантические замены для использования универсальных блочных (<div>) и строчных (<span>) элементов, например, <nav> (блок навигации по сайту), <footer> (обычно относится к нижней части страницы или последней строке HTML кода) или <audio> и <video> вместо <object>. Некоторые устаревшие элементы, которые можно было использовать в HTML 4.01, были исключены, включая чисто оформительские элементы, такие как <font> и <center>, чьи эффекты выполняются с помощью каскадных таблиц стилей. Также в поведении веб снова заострено внимание на важности скриптов DOM (например, Javascript).[18]

Синтаксис HTML5 больше не базируется на SGML, несмотря на подобие его разметки. Однако он был разработан обратно совместимым с обычным парсингом более старых версий HTML. В HTML5 применяется новая вводная строка, которая выглядит как объявление типа документа в SGML, <!DOCTYPE html>, запускающая соответствующий стандартам режим рендеринга. С 5 января 2009 года HTML5 также включает в себя Web Forms 2.0, ранее бывшие отдельной спецификацией WHATWG.

В дополнение к определению разметки HTML5 устанавливает API, который может быть использован с JavaScript. Возможности DOM расширены и фактически используемые свойства задокументированы. Также добавлены новые API, например:[18]

элемент холст для непосредственного метода рисования в 2D. См. спецификацию Canvas 2D API Specification 1.0;
контроль над проигрыванием медиафайлов, который может использоваться, например, для синхронизации субтитров с видео^[34];
хранение данных в браузере;
редактирование документа: загрузка на страницу через выбор (тег <input type="file">) или перетаскиванием (Drag-and-drop)
Drag-and-drop: предоставляет набор событий для каждого элемента DOM, таких как появление и нахождение в его зоне, благодаря которым разработчик может информировать пользователя о необходимых действиях и идентификаторе перетаскиваемого файла, содержащего адрес, имя, тип, размер и дату изменения;
управление историей браузера;
тип MIME и регистрация обработчика протокола;
микроданные.

Не все выше перечисленные технологии включены в спецификацию W3C HTML5, хотя они есть в спецификации WHATWG HTML. Немного связанных технологий, которые не являются частью ни одной из спецификаций, следуют далее. W3C публикует спецификации для них отдельно:[18]

геолокация;
база данных SQL для Web, внутренняя база данных (больше не поддерживаемая);
Индексированная база данных (IndexedDB) API, индексирование по типу ключ-значение (прежде — WebSimpleDB);
Файл API, дескриптор обновления файлов и управления ими;
Работа с системой. Этот API предназначен для того, чтобы обеспечить хранение информации со стороны клиента без управления базами данных;
Запись в файл, использование API для записи в файл информации из приложения^.

HTML5 – на данный момент это уже стандарт в веб-разработке. В дополнение к нему применяются каскадные таблицы стилей третьего поколения – CSS3, о которых пойдет речь в следующем подразделе.

3.2 Каскадные таблицы стилей

Каскадные таблицы стилей являются удобным дополнением, позволяющим производить разметку сайта быстро, качественно и красиво.

CSS используется создателями веб-страниц для задания цветов, шрифтов, расположения отдельных блоков и других аспектов представления внешнего вида этих веб-страниц. Основной целью разработки CSS являлось разделение описания логической структуры веб-страницы (которое производится с помощью HTML или других языков разметки) от описания внешнего вида этой веб-страницы (которое теперь производится с помощью формального языка CSS). Такое разделение может увеличить доступность документа, предоставить большую гибкость и возможность управления его представлением, а также уменьшить сложность и повторяемость в структурном содержимом. Кроме того, CSS позволяет представлять один и тот же документ в различных стилях или методах вывода, таких как экранное представление, печатное представление, чтение голосом (специальным голосовым браузером или программой чтения с экрана), или при выводе устройствами, использующими шрифт Брайля.

Современное поколение каскадных таблиц стилей – CSS3, обладает огромным множеством возможностей для создания анимированного сайта без использования Javascript.

3.3 Выводы о будущем языков гипертекстовой разметки документов.

Использование стека HTML5+CSS3 для верстки сайтов приобрело большую популярность. Данная комбинация технологий идеально подходит для разметки современных сайтов. Однако консорциум W3C на данном этапе не останавливается. Языки HTML5+CSS3 будут пока и дальше поддерживаться, развиваться, но, скорее всего, только в ближайшие 5-10 лет. Это связано с решением W3C создать новые, «идеальные» языки для разработки сайтов. Следующим поколением станут: HTML6 и CSS4. HTML6 предполагает создание одностраничных веб-приложений без использования технологий Javascript. Соответственно синтаксис данного языка будет значительно отличаться от предыдущего поколения – HTML5. Язык CSS4 будет создан с учетом синтаксиса нового HTML6. Но пока оба языки – HTML6 и CSS4 ещё в активной разработке и будут доступны для массового применения нескоро. Хотя, у W3C уже имеются готовые заготовки, которые веб-разработчики могут опробовать уже сейчас, но не все браузеры будут их поддерживать.[19]

Заключение

В ходе курсовой работы был проведен всесторонний анализ языков гипертекстовой разметки документов. Были решены следующие задачи:

1) проведен анализ понятия «гипертекст»;

2) проанализирована история развития гипертекста;

3) проведен анализ моделей гипертекста;

4) изучены виды языков гипертекстовой разметки документов – синтаксис, структуру документов, основные элементы.

5) провести анализ будущего Web-программирования.

Таким образом, цель данной курсовой работы «обзор языков гипертекстовой разметки» была достигнута

Список литературы

Бройдо В.Л. Вычислительные системы, сети и телекоммуникации СПб, Питер 2012- 464 с.
Информатика /под редакцией С.В.Симоновича. СПб, Питер 2011- 400 с.
Кирмайер М. Информационные технологии. СПб.: Питер, 2013 – 443 с.
Мэтьюз Дж. Web – сервер. СПб.: Символ, 2008 – 356 с.
Олифер В. Г., Олифер Н.А. Компьютерные сети. СПб.: Питер, 2007 – 864 с
Олифер В. Г., Олифер Н.А. Сетевые операционные системы. СПб.: Питер, 2009 – 539 с.

7) Сайт «HyperText», What is HyperText. CERN. Проверено 20 октября 2015. URL: http://info.cern.ch/hypertext/WWW/WhatIs.html

8) Тед Нельсон. Curriculum Vitae: Theodor Holm Nelson, PhD (англ.). Сайт Теда Нельсона. Проверено 20 октября 2015. URL: http://hyperland.com/TNvita

9) Юлия Шатилова. Какой была бы альтернативная Сеть? Грезы о цифровой вселенной знаний (рус.)(недоступная ссылка — история) (13 августа 2012 года, 16:02). Проверено 20 октября 2015. Архивировано из первоисточника 25 августа 2012.

10) Тед Нельсон. What's On My Mind (англ.). Сайт проекта Xanadu (Тед Нельсон — автор проекта). Проверено 20 октября 2015. URL: http://www.xanadu.com.au/ted/zigzag/xybrap.html

11) Ted Nelson. Literary Machines. — Edition 87.1. — 2007.

12) "Complex information processing: a file structure for the complex, the changing and the indeterminate" in Association for Computing Machinery: Proceedings of the 20th National Conference. Ed. Lewis Winner: 84‑100, Cleveland (Canada): ACM. DOI:10.1145/800197.806036

13) Дуванов А.А., История гипертекста // Информатика – 1 сентября. - 2014. - №4. - С.23-24.

14) Костов Д.А., История гипертекста // Эврика – 2013. - №7. – С. 56-60

15) Квинт И.. HTML, XTML и CSS. СПб.: Питер, 2011 – 382 с.

16) Брайн М. SGML and HTML Explained. Addison Wesley, 1997 – с. 584

17) Холзнер С. XML Энциклопедия. Спб.: Питер, 2010 – с. 1092

18) Сухов К. HTML5. Путеводитель по технологии.

19) Сайт консорциума W3C. URL: https://lists.w3.org/Archives/Public/public-whatwg-archive/2015Mar/0071.html