Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Языки гипертекстовой разметки

Содержание:

Введение

Глобальная сеть - совокупность компьютеров, расположенных на больших расстояниях друг от друга; система каналов передачи связи: средств коммуникации, обеспечивающих соединение пользовательских коммуникационных систем и обмен данными между ними.[1] Глобальные сети (WideAreaNetworks, WAN) создаются крупными телекоммуникационными компаниями для оказания платных услуг абонентам.

Интернет - мировая глобальная компьютерная сеть. Она составлена из разнообразных компьютерных сетей, объединенных стандартными соглашениями о способах обмена информацией и единой системой адресации. Интернет использует протоколы семейства TCP/IP. Они обеспечивают: относительно дешевую возможность надежно и быстро передавать информацию даже по не слишком надежным линиям связи; строить программное обеспечение, пригодное для работы на любой аппаратуре. Система адресации (URL-адреса) обеспечивает уникальными координатами каждый ресурс компьютера и каждого пользователя Интернета, создавая возможность взять и передать именно то, что нужно.

В 1994 году началась революция – World Wide Web. Всемирная паутина World Wide Web (WWW) соткана из Web-страниц, которые содержат в себе информацию в зависимости от тематики Web сайта. В основу Web был положен гипертекст (hypertext) – метод связывания блоков, или «страниц», данных, придуманный еще в 60х г. Однако только в 90г. Бернерс-Ли и его сотрудники перенесли концепцию гипертекста в Internet, создав HTTP – Hypertext Transfer Protocol (протокол передачи гипертекста). С появлением HTTP родился и World Wide Web.

Сегодня в Internet существуют миллионы Web – сайтов. Можно получать доступ к информации по различным темам, открыть в Web свой бизнес. Более того, в Web можно найти и сведения о нем самом и о тех технологиях, на которых он основан.

Таким образом, данная курсовая работа носит актуальный характер. Целью работы является обзор языков гипертекстовой разметки. Для достижения данной цели требуется решить следующие задачи:

  1. провести анализ понятия «гипертекст»;
  2. проанализировать историю развития гипертекста;
  3. провести анализ моделей гипертекста;
  4. изучить виды языков гипертекстовой разметки документов – синтаксис, структуру документов, основные элементы.
  5. провести анализ будущего Web-программирования.

Глава 1. Гипертекст

1.1 Понятие гипертекста

Гипертекст - текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, документы, картинки и т.д. Во время чтения такого текста вы видите выделенные в тексте слова. Если наехать на них курсором и нажать клавишу или на кнопку мышки, то высветится то, на что ссылалось это слово, например, другой параграф той же главы этого же текста. Имея редактор гипертекстов, можно создать любую структуру рабочей среды, включая документацию, файлы, данные, картины, программное обеспечение и т.д., и это не будет новое программное обеспечение, а просто гипертекст.

Гипертекстовая технология – представление текста в виде многомерной иерархической структуры типа сети. Гипертекст формируется в результате представлений текста как ассоциативно связанных блоков информации. Ассоциативная связь – это соединение, сближение представлений, смежных, противоположных, аналогичных. Гипертекст значительно отличается от обычного текста. Обычные (линейные) тексты имеют последовательную структуру и предусматривают их чтение слева направо и сверху вниз.

Простейший  пример гипертекста - это любой словарь, где каждая статья имеет отсылки к другим статьям этого же словаря. В результате читать такой текст можно как угодно. Концепция гипертекста  проста. Есть база данных, в которой находятся  объекты. Объекты  - это небольшие  текстовые  разделы, посвященные  какому-либо вопросу. Специальные  механизмы  и  правила  позволяют  компьютеру поддерживать ссылки из одних текстовых фрагментов в другие. Человек или программный агент может устанавливать новые связи между текстовыми фрагментами. Система текстовых фрагментов или файлов называется "гипертекст". Использование гипертекста позволяет фиксировать отдельные идеи, мысли, факты, а затем связывать их друг с другом, двигаясь в любых направлениях, определяемых ассоциативными связями.

С развитием компьютерных средств мультимедиа гипертекст начал превращаться в более наглядную информационную форму, получившую название гипермедиа — эта информационная форма содержит текст, графику, видеоинформацию и звуки. Вместо  поиска информации по соответствующему поисковому ключу гипертекстовая технология предполагает перемещение от одних объектов информации к другим с учетом их смысловой, семантической связанности. Структурно  гипертекст состоит из информационного  материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.[2] Информационный  материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Заголовок содержит тему или наименование описываемого объекта.

Информационная статья содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим статьям.

Тезаурус  гипертекста – это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка и предназначенный для поиска слов по их смысловому содержанию. Тезаурус  гипертекста можно представить  в виде сети, в узлах которых находятся информационные статьи, ребра сети указывают на существование связи между объектами и на тип родства.

К основным элементам гипертекстовой технологии относятся:

- информационный фрагмент (может представлять собой линейную последовательность строк текста, рисунок, видеофрагмент, аудиофрагмент);

- тема ( содержит краткое название информационного  фрагмента. Информационный фрагмент может  состоять целиком из множества тем  либо включать в себя одну или несколько тем наряду с прочей информацией);

- узлы (называется информационный фрагмент, из которого возможен переход  к другим информационным фрагментам гипертекста);

- ссылки (представляет собой слово, фразу или набор фраз, с помощью которых осуществляется переход от одного узла к другому. Ссылки могут быть референтными или организационными).

Референтные ссылки — это наиболее типичный вид ссылок в гипертекстах. Они имеют два конца - направленные связи, хотя большинство гипертекстовых информационных систем поддерживает и обратное движение по ссылке. Исходный конец референтной ссылки называется «источник» -отдельная точка или область в тексте. Другой конец называется «назначением» — определенная точка или область в гипертексте.Организационные ссылки устанавливают явные связи между двумя точками гипертекста и отличаются от референтных тем, что поддерживают иерархическую  структуру в гипертексте.

Область применения гипертекстовой технология очень широка. Это издательская деятельность, библиотечная работа, обучающие системы, разработка документации, законов, справочных руководств, баз данных, баз знаний и т.д. Примером гипертекста являются веб-страницы — документы HTML как они размещаются в Сети. Современные программы разработки Web-серверов, такие как MS FrontPage или Web Pen для Windows, дают возможность даже новичку без всякого штудирования учебников легко создавать готовые странички. При этом cпециалист по созданию Web-сайтов, называемый Web-мастером, берет готовые файлы и с помощью кнопок и команд меню оформляет страницы сайта. Подобные программы, выполняя команды инструментальных и операционного меню, формируют гипертекст WWW-сервера. Исходные текстовые, табличные и графические и другие объекты включаются в Web-site посредством тегов (tag = ярлык, этикетка). Тег - это последовательность символов, задающая: 1). положение объекта на странице сайта; 2). внешний вид объекта; 3). связь данной страницы с другими страницами этого сайта, а также с любым другим сервером. Тег называют также управляющим маркером, флагом. Программы типа Web Pen сами расставляют теги, поэтому пользователь таких программ может не знать языка разметки гипертекста (HTML = HyperText Markup Language).

1.2 История возникновения гипертекстовой разметки

История гипертекста богата и переменчива, поскольку гипертекст - это находящаяся в эволюции концепция возможного применения компьютера. В разработку идеи гипертекста внесли свой вклад много людей. Перед компьютерным гипертекстом был ручной, который использовал карточки. Эти карточки можно нумеровать и снабжать взаимными ссылками. Их часто распределяют по рубрикам. Удобство таких карточек состоит в том, что, имея небольшой размер, они разбивают записи на малые куски. Но с увеличением объема такой картотеки, работать с ней становится труднее.

Другой вариант ручного гипертекста – это справочная книга, например словарь. Статьи или определения, даваемые в таких книгах, содержат явные ссылки друг на друга.

Еще пример – печатные издания Библии. Текст делится на главы, а те, на стихи. Главы пронумерованы, стихи внутри каждой главы. В подлинной Библии этого нет. Сделано это учеными-богословами для облегчения ссылок и цитат. Гипертекст возникает здесь потому, что в современных изданиях Библии текст идет в сопровождении "параллельных мест" в виде ссылок. В 45 г. в статье “Как мы можем думать” Ванневар Буш высказал идею машины для просмотра и пополнения записями документов, записанных на пленке. Эта машина “Memex”, не была построена, но содержала идею, которую назвали гипертекстом.Информация, считал Буш, должна храниться в виде пленочных микрофильмов. Буш представлял машину в виде письменного стола с экранами и клавиатурой для управления. Внутри стола размещалось хранилище микрофильмов и механизм доступа к ним (рисунок 1)

Рисунок 1 – Схема Memex

Главная особенность и новизна Memex состояла в способе доступа к ней. Буш предложил механизм перекрестных ссылок, аналогичный используется в современном гипертексте. Ссылки Буш предлагал записывать во вспомогательных полях в теле документа, а в качестве средства навигации использовать нечто похожее на современный мультимедийный шлем.

В 89г. Тим Бернерс-Ли (Tim Berners-Lee, 1955 г.р.), работая над внутренней сетью организации CERN (Европейский совет по ядерным исследованиям в Женеве), предложил глобальный гипертекстовый проект, известный как Всемирная паутина.[7] В начале 90-х Тим Бернерс-Ли и его коллеги создали язык HTML, на котором записываются современные гипертексты. После создания языка HTML Web-технологии начали приобретать более четкий характер и бурное разностороннее развитие, поддерживаемое такими как Google, Microsoft, Mozilla Foundation и пр. в будущем. Историческая последовательность изложена в приложении А.

1.3 Модели гипертекста

В самом общем виде модель гипертекста характеризуется механизмом связей, узлами-объектами и пользовательским интерфейсом – способом взаимодействия человека с узлами и связями.

Узлы. Узел – важнейшее понятие гипертекстовых систем, так как в них в форме узлов хранится и представляется пользователю информация. Характеристики узла – это тип информации, которая может быть сохранена и вместимость, объем каждого узла. Некоторые гипертекстовые системы поддерживают только текст (например, NLS и ZOG), другие – таблицы и графику(HyperTIES, HyperCard, Guide); есть механизмы интерпретации различных информации в гипертекстовой сети (Intermedia, NoteCards). Важно, что реализация возможности показать узлы мультимедиа недостаточно. Каждый новый тип информации должен быть полностью интегрирован с гипертекстовой сетью системы, для чего необходимо разработать методы создания связей между, например, видео и текстом. Что касается объемов узлов, то, такие системы, как ZOG и HyperCard, поддерживают только узлы жестко фиксированной величины, в то время как другие обладают более гибкими возможностями.

Связи. Способ реализации связей имеет обеспечивание "нелинейное ветвление" – сердцевину гипертекстовой функциональности.[13] При описании связей используется понятие anchor (якорь) – это слово или фраза, которые подсвечиваются на экране и воспринимаются как точки начала или конца связи. Возможны два варианта статуса гипертекстовых связей: 1) связи являются самостоятельными объектами, которыми пользователь может манипулировать напрямую; 2) связи спрятаны в системе и проявляются когда пользователь каким-то задействует их.[13] Intermedia – пример системы со связями первого статуса, где хранятся отдельно от документов, на которые ссылаются. Связи второго статуса ("спрятанные") – есть просто спецификации адреса для перехода и существуют только в момент их активизации. Например, связи в HyperCard – это кнопки, содержащие инструкцию "иди к карточке № 42106" (пример). Однако кнопки могут не содержать этого, значит целиком вставлены в программный код системы.

Интерфейс пользователя. Эволюция гипертекстовых систем переплетена с исследованиями, разработками, изобретениями в области человеко-машинного интерфейса. [13] Влияние гипертекстовых разработок на развитие новых идей видно по тому факту, что программы регулярных всемирных конференций по взаимодействию компьютера с человеком обязательно включают раздел, посвященный гипертексту.

Варианты реализации интерфейса. Все системы позволяли перемещаться по документу в естественной последовательности: либо путем скроллирования линейного документа (Intermedia, Guide), либо двигаясь по дереву иерархической структуры узлов, используя операции "следующий потомок" или "возврат к родителю" (ZOG, HyperCard).

Значительно больший интерес представляют вопросы: как пользователь может распознать связь – и как эту связь можно активизировать? В разных системах вопросы решаются по-разному. В Memex информация о связях хранилась на специально пустом пространстве узла как сигнал читателю. Все остальные системы позволяли размечать информацию узла так, чтобы его части могли стать метками связей: у одних (ZOG, HyperTIES и Guide) это была подсветка ключевого слова или фразы, у других (HyperCard, Intermedia, Notecards) – значки связей или кнопки, которые, как значки сноски, предупреждали читателя о существовании дополнительной информации.[14] Когда связь распознана и выбрана, система осуществляет немедленный гипертекстовый прыжок по связи к новой информации. Такой мгновенный прыжок подходит компьютеру. Читатель, например при просмотре журнала, встретив ссылку на другую статью, не бросает чтение, а доводит его до конца и потом по библиотечной ссылке смотрит работу, на которую ссылались. В случае с компьютером такие переходы по связям ведут к поиску в глубину с растущей стопкой (стеком) отложенных статей, к которым надо будет вернуться.

Второй побочный эффект гипертекста (когнитивная перегрузка) связан с необходимостью делать много действий для получения информации. Была борьба с этими недостатками. Например, Notecards и Intermedia позволяли узлам находиться на экране одновременно, в Intermedia разрабатывались браузеры, отображающие в отдельном окне структуру сети связей.

Пути и навигация. Путь – последовательность узлов и связей, которые посещает пользователь. Это понятие выработал Ванневар Буш, имея в виду аналогию с процессами в мозге человека: "Человеческий ум работает ассоциативно. Ухватив что-то, он цепляется за следующее, что предлагается, подсказывается ассоциацией мыслей в соответствии с некоторой сложной паутиной трейлов, которые поддерживаются ячейками мозга".

Гипертекстовые системы дают методы, помогающие прокладывать навигацию в гипертексте. Они преодолевают дезориентацию и когнитивную нагрузку, от которых страдает читатель. У большинства гипертекстовых систем навигационную помощь предоставляют следующие средства.

Локальная карта. Это картинка всех связей и узлов, связанных с текущим узлом. Она может быть графической или текстовой. Локальные карты обеспечивают читателю контекст и помогают выбрать связь.

Глобальная карта. Это графическое представление полной сети из узлов и связей. Но такие карты мало пригодны для реальных гипертекстов объемом свыше сотни узлов.

История (бэктрекинг). Посещенные узлы и связи текущего трейла сохраняются и есть возможность вернуться в предыдущие узлы.

Туры (проложенные маршруты). Это хранящиеся пути, которые можно проходить по желанию. Подобное полезно при создании гипертекстовых учебников или демонстраций.

Поиск (в совокупности гипертекстовых узлов). Используются все достижения в области информационного поиска: булевские запросы, морфологический поиск, языки запросов и др.

Индекс. Список подсвеченных слов, связей или узлов, по алфавиту, теме, автору, предмету и др. Индексы создаются автором и не учитывают точку зрения читателя на то, как он хочет использовать гипертекст.

Закладки. Читатель может сохранить свою текущую позицию, чтобы вернуться к ней позже.

Когерентная навигация сделана в системе СМИСК – российской разработке, где локальные переходы по связям в строящейся тропе-трейле происходят под так называемым макроконтролем, следящем за глобальной связностью. Этот контроль базируется на иерархии (реализована в форме интерактивного дерева, которое развертывается в тропу-дискурс) подтем строящегося дискурса. Теоретически разработки СМИСК опираются на труды таких известных психолого-лингвистов, как ван Дийк, Кинч и Левельт. Результаты были представлены в докладе на гипертекстовой секции международной конференции "Восток-Запад" EWHCI'93.

Глава 2. Виды языков гипертекстовой разметки

Сегодня самый популярный язык гипертекстовой разметки HTML -создан специально для организации информации в сети Интернет, является одной из ключевых составляющих технологии WWW. С ее использованием информационные ресурсы реализованы в форме интерактивного дерева, которое развертывается в тропу-дискурс, более упорядочен. HTML (HyperText Markup Language) - язык гипертекстовой разметки, который используется в World Wide Web. Он создавался как язык для обмена научной и технической документацией. Стандартизацией языка HTML занимается W3C (WWW Consortium). [15]

HTML -это упрощенная версия общего языка разметки SGML (Standart Generalised Markup Language), который был утвержден ISO в качестве стандарта в 80-х годах. Предназначен для создания других языков разметки, он определяет допустимый набор тэгов, их атрибуты и внутреннюю структуру документа. Контроль за правильностью использования дескрипторов осуществляется с помощью набора правил, называемых DTD-описаниями. Для каждого класса документов определяется свой набор правил, описывающих грамматику соответствующего языка разметки. [15]

2.1 SGML и его структуры

SGML — метаязык, на нем можно определять язык разметки для документов. SGML — наследник разработанного в69г.в IBM языка GML (Generalized Markup Language).[16] SGML был разработан для совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах. Он использовался в печатной и издательской сфере, но его сложность затруднила распространение. Основные части документа SGML: 1) SGML-декларация — определяет, какие символы и ограничители могут появляться в приложении; 2) Document Type Definition — определяет синтаксис конструкций разметки. DTD включает дополнительные определения, такие, как символьные ссылки-мнемоники; 3) Спецификация семантики — даёт ограничения синтаксиса и не могут быть выражены внутри DTD. Изменяя SGML-декларацию, можно даже отказаться от использования угловых скобок, хотя этот синтаксис считается стандартным, так называемым concrete reference syntax. Пример синтаксиса SGML: [16]

<quote type="example">

typically something like <italics>this</italics>

SGML стандартизован ISO: «ISO 8879:1986 Information processing—Text and office systems—Standard Generalized Markup Language (SGML)».

Языки HTML и XML произошли от SGML. HTML — это приложение SGML, а XML — это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML являются SGML Docbook (документирование) и «Z Format» (типография и документирование). Структура SGML описывает простой механизм разметки или идентификации структурных единиц текста, предоставляемый SGML.

Определение структуры документов SGML: DTD

Правила - первый шаг в создании формальной спецификации структуры SGML документа или определения типа документа, обычно сокращаемого как DTD. При создании DTD дизайнер документа может задавать произвольно жесткую или гибкую структуру. Нужно найти компромисс между удобством следования простым правилам и сложностью поддержки реальных текстов: дизайнер может иметь очень туманное представление об изначальном предназначении или смысле старых текстов, и задание непротиворечивых правил, касающихся их структуры, может быть очень сложным. Не существует единственного DTD, охватывающего все сведения о тексте. В настоящее время SGML шире всего применяется там, где основным требованием является единообразие структуры документов. Однако использование простых правил может сильно упростить задачу аккуратной разметки элементов и ограниченных текстов.

Правила минимизации

Вторая часть описания задает правила минимизации для элемента -определяют, обязаны ли присутствовать открывающая и закрывающая метки для каждого появления данного элемента. Они имеют вид пары символов, разделенных пробелом, первый из которых относится к открывающей, а второй -к закрывающей метке. В обоих случаях должны присутствовать или минус ( метка должна присутствовать) или буква O (она может быть опущена). В нашем примере каждый элемент, кроме <line>, должен иметь открывающую метку. Только элементы <poem> и <anthology> обязаны иметь закрывающую метку.

Обозначения включения

Вышеприведенное описание для <stanza> устанавливает, что строфа состоит из одной или более строк. Оно использует обозначение включения (occurence indicator) т.е. сколько раз может встречаться элемент, поименованный в модели содержимого. В синтаксисе SGML есть три обозначения включения: плюс (может встречаться один или более раз) вопросительный знак (может быть не более одного элемента) и звездочка (элемент может или отсутствовать, или появляться один и более раз).

Связки

Модель содержимого (TITLE?, STANZA+) содержит больше одного компонента и нужно указать порядок их появления. Это упорядочение определяется связкой (group connector) -запятой -использованным между ее компонентами. Существуют три связки, обычно представляемых запятой (оба компонента должны встречаться в порядке, указанном в модели содержимого), вертикальной чертой (может встречаться только один из компонентов, которые она соединяети), знаком "&" (компоненты, которые она соеденяет должны встречаться оба в произвольном порядке).

Группы модели

Группы модели (model groups), могут модифицироваться обозначениями включения и быть объединенными связками.

2.1.1 Описательная разметка

Эта система использует коды, дающие названия для классификации частей документа. Коды <para> или \end{list} идентифицируют часть документа и утверждают: "следующий элемент - параграф" или "это - конец начатого последним списка" и т.д. Система процедурной разметки определяет, какая обработка должна производиться в конкретной точке документа: "здесь вызвать процедуру PARA с параметрами 1, b и x", или "сдвинуть левую границу на 2см влево, правую -- на 2см вправо, пропустить строку и встать на новую левую границу", и т.д. В SGML инструкции для обработки документа с определенными целями отделяются от описательной разметки, встречающейся внутри документа и они собираются вне документа в отдельных программах. В процедурной разметке один документ можно обрабатывать разными программами, которые может применять различные правила обработки к частям документам, которые она считает важными. С одними и теми же частями файла могут ассоциироваться разные правила обработки. Например, одна программа может выделять имена людей и географические имена, а другая, оперирующая тем же текстом, может печатать имена собственные шрифтом отличающегося начертания.

2.1.2 Типы документов и независимость данных

SGML вводит понятие типа документа (document type definition, DTD). Тип документа определяется его составными частями и их структурой. Можно использовать специальную программу, называющуюся анализатором (parser), для проверки документа. Он проверяет все элементы, требуемые типом документа. Разные документы одного и того же типа могут обрабатываться одинаковым образом. Цель создания SGML в обеспечении транспортабельности закодированных документов из одной аппаратной и программной среды в другую без потери информации. SGML предоставляет универсальный механизм строковой подстановки (string substitution), то есть, простой машинно-независимый способ обозначить, что некоторая последовательность символов в документе должна заменяться при его обработке некоторой другой последовательностью. Одно очевидное применение этого механизма -обеспечение согласованности номенклатуры; другое - противодействие печально известной неспособности различных компьютерных систем понимать наборы символов друг друга. Строки, определенные этим механизмом подстановки, называются объектами (entities) - оно означает именованную часть размеченного документа, безотносительно ко всяческим соображениями структуры. Для включения его в документ используется конструкция, известная как ссылка на объект (entity reference).

2.2 HTML, структура HTML-документа и основные элементы

HTML — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц содержат разметку на языке HTML (или XHTML). Он интерпретируется браузерами. Форматированный текст отображается на экране монитора компьютера или мобильного устройства.

Язык HTML является приложением SGML и соответствует международному стандарту ISO 8879. Язык HTML разработан британским учёным Тимом Бернерсом-Ли приблизительно в 86—91 г. в стенах ЦЕРНа в Женеве в Швейцарии. HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми. HTML успешно справлялся с проблемой сложности SGML путём небольшого набора структурных и семантических элементов — дескрипторов. Мультимедийные возможности были добавлены позже.Текст с разметкой HTML должен был без искажений воспроизводиться на оборудовании с различной оснащённостью. Современное применение HTML далеко от его изначальной задачи. Например, тег <table> предназначен для создания таблиц, но часто используется и для оформления размещения элементов на странице.

Теги и их параметры нечувствительны к регистру. То есть <A HREF="http://example.com"> и <a href="http://example.com"> означают одно и то же. В последних версиях HTML практически у каждого тега много необязательных параметров — обычно не меньше 15. Осмотрим несколько:

Гиперссылки

<a href="filename" target="_self">название ссылки</a>

1)Атрибут href задает значение адреса документа, на который указывает ссылка;

2)filename — имя файла или адрес Internet, на который необходимо сослаться;

3)название ссылки — название гипертекстовой ссылки, которое будет отображаться в браузере, то есть показываться тем, кто зашел на страницу.

4)target — задает значение окна или фрейма, в котором будет открыт документ, на который указывает ссылка. Возможные значения атрибута:

    1. _top — открытие документа в текущем окне;
    2. _blank — открытие документа в новом окне;
    3. _self — открытие документа в текущем фрейме;
    4. _parent — открытие документа в родительском фрейме.

Текстовые блоки

  • <H1> … </H1>, <H2> … </H2>, … ,<H6> … </H6> — заголовки 1, 2, … 6 уровня. Используются для выделения частей текста (заголовок 1 — самый крупный, 6 — самый мелкий).
  • <P> — новый абзац. Можно в конце абзаца поставить </P>, но это не обязательно.
  • <BR> — новая строка. Этот тег не закрывается (то есть не существует тега </BR>)
  • <PRE> … </PRE>  — режим preview (preformatted text). В этом режиме текст заключается в рамку и никак не форматируется (то есть теги, кроме </PRE>, игнорируются, и переводы строки ставятся там, и только там, где они есть в оригинальном документе).
  • <SPAN> … </SPAN>  — строка (обычно используется для применения стилей CSS)

Изображения

  • IMG — вставка изображения. Этот тег не закрывается.
    1. SRC — имя или URL
    2. ALT — альтернативное имя (отобразится, если в браузере запретить отображать картинки)
    3. WIDTH, HEIGHT — размеры (если не совпадают с истинными размерами картинки, то изображение «растянется» или «сожмется»)
    4. ALIGN — задает параметры обтекания текстом (top, middle, bottom, left, right)
    5. VSPACE, HSPACE — задают размеры вертикального и горизонтального пространства вокруг изображения

2.3 XML достоинство и недостатки

XML — рекомендованный Консорциумом Всемирной паутины язык разметки, представляющий собой свод общих синтаксических правил. XML предназначен для хранения структурированных данных для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. XML является упрощённым подмножеством языка SGML. Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации. XML также является применение так называемых пространств имён (namespace).

Достоинствами XML являются: а) XML(человеко-ориентированный) — это формат, одновременно понятный и человеку и компьютеру; б)XML поддерживает Юникод; в) в формате XML могут быть описаны основные структуры данных — такие как записи, списки и деревья; г)XML — это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей; д) XML имеет строго определённый синтаксис и требования к парсингу, что позволяет ему оставаться простым, эффективным и непротиворечивым; е) XML также широко используется для хранения и обработки документов как он-лайн, так и офф-лайн: ж) XML — формат, основанный на международных стандартах; з)иерархическая структура XML подходит для описания практически любых типов документов; и)XML представляет собой простой текст, свободный от лицензирования и каких-либо ограничений; к) XML не накладывает требований на расположение символов на строке.

Недостатками: а)Синтаксис XML избыточен; б)Размер XML документа существенно больше бинарного представления тех же данных. В грубых оценках величину этого фактора принимают за 1 порядок (в 10 раз); в)Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON) и особенно в форматах данных оптимизированных для конкретного случая использования; г)Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных; д)Для большого количества задач не нужна вся мощь синтаксиса XML и можно использовать значительно более простые и производительные решения; е)XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий «целых чисел», «строк», «дат», «булевых значений» и т.д ж)Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами; з)Выражение не иерархических данных (например, графов) требует дополнительных усилий; и) Кристофер Дейт отмечал, что «…XML является попыткой заново изобрести иерархические базы данных…» (в 1980-е года иерархические базы данных были вытеснены реляционными базами данных); к)Пространства имён XML сложно использовать и их сложно реализовывать в XML парсера; л)Существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком (YAML, JSON, SweetXML). Также в последнее время очень большое распространение получил формат fb2.

2.3.1 Принцип построения XML-документа

В общем случае XML-документы должны удовлетворять следующим требованиям:1)В заголовке документа помещается объявление XML, в котором указывается язык разметки документа, номер его версии и дополнительная информация; 2)Каждый открывающий тэг, определяющий некоторую область данных в документе обязательно должен иметь своего закрывающего "напарника", т.е., в отличие от HTML, нельзя опускать закрывающие тэги; 3)В XML учитывается регистр символов; 4) Все значения атрибутов, используемых в определении тэгов, должны быть заключены в кавычки; 5)Вся информация, располагающаяся между начальным и конечными тэгами, рассматривается в XML как данные и поэтому учитываются все символы форматирования .

2.3.2.Конструкции языка

Содержимое XML-документа представляет собой набор элементов, секций CDATA, директив анализатора, комментариев, спецсимволов, текстовых данных. Общая схема представлена на рисунке 2.

Рисунок 2- Общая схема структуры XML-документа

Элементы

Элемент - это структурная единица XML- документа. Заключая слово rose в тэги <flower> </flower> , мы определяем непустой элемент, называемый <flower>, содержимым которого является rose. Набором всех элементов, содержащихся в документе, задается его структура, и определяются все иерархическое соотношения. Плоская модель данных превращается с использованием элементов в сложную иерархическую систему с множеством возможных связей между элементами. Если элемент не имеет содержимого, которые он должен определять, то он называется пустым. Примером пустых элементов могут быть <br> <hr>, <img>.

Имена тегов и атрибутов можно писать по-русски. Создатели XML позаботились о том, чтобы в именах тегов и атрибутов можно было пользоваться и кириллицей, иероглифами и вообще всеми символами из репертуара Unicode. Cтруктура XML-документа и разбор его XML-процессором позволяют произвести только простую проверку правильности оформления. Для создания на этой основе специализированных языков необходимы дополнительные средства описания этих языков. XML поддерживает два механизма подобных описаний: определения типа документа (document type definition, DTD) и XML-схемы (XML schema).

Глава 3. Будущее гипертекстовой разметки

3.1 Язык гипертекстовой разметки HTML5

HTML5 – это пятая версия языка HTML. HTML5 вводит несколько новых элементов и атрибутов, которые отражают типичное использование разметки на современных веб-сайтах. Некоторые из них — семантические замены для использования универсальных блочных (<div>) и строчных (<span>) элементов, например, <nav> , <footer> или <audio> и <video> вместо <object>. Синтаксис HTML5 больше не базируется на SGML. Однако он был разработан обратно совместимым с обычным парсингом более старых версий HTML. В HTML5 применяется новая вводная строка, которая выглядит как объявление типа документа в SGML, <!DOCTYPE html>. С 5 января 2009 года HTML5 также включает в себя Web Forms 2.0, ранее бывшие отдельной спецификацией WHATWG. Возможности DOM расширены и фактически используемые свойства задокументированы. Также добавлены новые API, например:

  • элемент холст для непосредственного метода рисования в 2D. См. спецификацию Canvas 2D API Specification 1.0;
  • Drag-and-drop: предоставляет набор событий для каждого элемента DOM, таких как появление и нахождение в его зоне, благодаря которым разработчик может информировать пользователя о необходимых действиях и идентификаторе перетаскиваемого файла, содержащего адрес, имя, тип, размер и дату изменения;
  • управление историей браузера;
  • микроданные.

Не все выше перечисленные технологии включены в спецификацию W3C HTML5, хотя они есть в спецификации WHATWG HTML. Немного связанных технологий, которые не являются частью ни одной из спецификаций, следуют далее. W3C публикует спецификации для них отдельно:[18]

  • геолокация;
  • база данных SQL для Web, внутренняя база данных (больше не поддерживаемая);
  • Индексированная база данных (IndexedDB) API, индексирование по типу ключ-значение (прежде — WebSimpleDB);
  • Запись в файл, использование API для записи в файл информации из приложения.

HTML5 – на данный момент это уже стандарт в веб-разработке. В дополнение к нему применяются каскадные таблицы стилей третьего поколения – CSS3, о которых пойдет речь в следующем подразделе.

3.2 Каскадные таблицы стилей

Эти таблицы стилей являются удобным дополнением, позволяющим производить разметку сайта быстро, качественно и красиво. CSS используется создателями веб-страниц для задания цветов, шрифтов, расположения отдельных блоков и других аспектов представления внешнего вида этих веб-страниц. Основной целью разработки CSS являлось разделение описания логической структуры веб-страницы от описания внешнего вида этой веб-страницы. Современное поколение каскадных таблиц стилей – CSS3, обладает огромным множеством возможностей для создания анимированного сайта без использования Javascript.

3.3 Выводы о будущем языков гипертекстовой разметки документов.

Использование стека HTML5+CSS3 для верстки сайтов приобрело большую популярность. Данная комбинация технологий идеально подходит для разметки современных сайтов. Однако консорциум W3C на данном этапе не останавливается. Языки HTML5+CSS3 будут пока и дальше поддерживаться, развиваться, но, скорее всего, только в ближайшие 5-10 лет. Это связано с решением W3C создать новые, «идеальные» языки для разработки сайтов. Следующим поколением станут: HTML6 и CSS4. HTML6 предполагает создание одностраничных веб-приложений без использования технологий Javascript. Соответственно синтаксис данного языка будет значительно отличаться от предыдущего поколения – HTML5. Язык CSS4 будет создан с учетом синтаксиса нового HTML6. Но пока оба языки – HTML6 и CSS4 ещё в активной разработке и будут доступны для массового применения нескоро. Хотя, у W3C уже имеются готовые заготовки, которые веб-разработчики могут опробовать уже сейчас, но не все браузеры будут их поддерживать.

Заключение

В ходе курсовой работы был проведен всесторонний анализ языков гипертекстовой разметки документов. Были решены следующие задачи:

1) проведен анализ понятия «гипертекст»;

2) проанализирована история развития гипертекста;

3) проведен анализ моделей гипертекста;

4) изучены виды языков гипертекстовой разметки документов – синтаксис, структуру документов, основные элементы.

5) провести анализ будущего Web-программирования.

Таким образом, цель данной курсовой работы «обзор языков гипертекстовой разметки» была достигнута

Библиография

  1. Бройдо В.Л. Вычислительные системы, сети и телекоммуникации СПб, Питер 2012- 464 с.
  2. Информатика /под редакцией С.В.Симоновича. СПб, Питер 2011- 400 с.
  3. Кирмайер М. Информационные технологии. СПб.: Питер, 2013 – 443 с.
  4. Мэтьюз Дж. Web – сервер. СПб.: Символ, 2008 – 356 с.
  5. Олифер В. Г., Олифер Н.А. Компьютерные сети. СПб.: Питер, 2007 – 864 с
  6. Олифер В. Г., Олифер Н.А. Сетевые операционные системы. СПб.: Питер, 2009 – 539 с.

7) Сайт «HyperText», What is HyperText. CERN. Проверено 20 октября 2015. URL: http://info.cern.ch/hypertext/WWW/WhatIs.html

8) Тед Нельсон. Curriculum Vitae: Theodor Holm Nelson, PhD (англ.). Сайт Теда Нельсона. Проверено 20 октября 2015. URL: http://hyperland.com/TNvita

9) Юлия Шатилова. Какой была бы альтернативная Сеть? Грезы о цифровой вселенной знаний (рус.)(недоступная ссылка — история) (13 августа 2012 года, 16:02). Проверено 20 октября 2015. Архивировано из первоисточника 25 августа 2012.

10) Тед Нельсон. What's On My Mind (англ.). Сайт проекта Xanadu (Тед Нельсон — автор проекта). Проверено 20 октября 2015. URL: http://www.xanadu.com.au/ted/zigzag/xybrap.html

11) Ted Nelson. Literary Machines. — Edition 87.1. — 2007.

12) "Complex information processing: a file structure for the complex, the changing and the indeterminate" in Association for Computing Machinery: Proceedings of the 20th National Conference. Ed. Lewis Winner: 84-100, Cleveland (Canada): ACM. DOI:10.1145/800197.806036

13) Дуванов А.А., История гипертекста // Информатика – 1 сентября. - 2014. - №4. - С.23-24.

14) Костов Д.А., История гипертекста // Эврика – 2013. - №7. – С. 56-60

15) Квинт И.. HTML, XTML и CSS. СПб.: Питер, 2011 – 382 с.

16) Брайн М. SGML and HTML Explained. Addison Wesley, 1997 – с. 584

17) Холзнер С. XML Энциклопедия. Спб.: Питер, 2010 – с. 1092

18) Сухов К. HTML5. Путеводитель по технологии.

19) Сайт консорциума W3C. URL: https://lists.w3.org/Archives/Public/public-whatwg-archive/2015Mar/0071.html

Приложение А

Таблица 1 - Историческая последовательность

Год

Событие

1945 г.

выход статьи Ванневара Буша "As We May Think".

1963 г.

Энгельбарт публикует "A Conceptual Framework for the Augmentation of Man's Intellect".

1965 г.

Нельсон вводит термин "гипертекст".

1967 г.

в Брауновском Университете Анди ван Дам и Нельсон разрабатывают Hypertext Editing System (HES), за которой последовал выпуск FRESS в 1968 г.

1968 г.

Энгельбарт демонстрирует NLS на FJCC (Fall Joint Computer Conference), часть проекта Augment, начатого в 1962 г.

1972 г.

начинается разработка ZOG в Университете Карнеги-Мэллона группой, возглавляемой Робертсоном.

1979 г.

Нельсон приступает к проекту Xanadu.

1981 г.

начинается разработка KMS в Knowledge Systems.

1981 г.

Нельсон публикует "Literary Machines", где подробно описан проект Xanadu.

1982 г.

система ZOG установлена на американском атомном авианосце Carl Vinson.

1982 г.

начинается разработка Питером Брауном системы Unix Guide в Университете Кента.

1983 г.

начинается разработка HyperTIES в Университете Мэриленда.

1983 г.

Рэндол Тригг защищает первую диссертацию по гипертексту в Университете Мэриленда.

1984 г.

начинается разработка Notecards в Xerox PARK.

1985 г.

начало разработки Intermedia в Брауновском Университете.

1986 г.

в Университете Северной Каролины приступают к разработке WE (Writing Environment).

1986 г.

Office Workstation Inc. (OWL) выпускает Guide для Макинтоша.

1987 г.

Apple Computers выпускает HyperCard (Бил Аткинсон) – первую гипермедиа авторскую систему, бесплатно устанавливаемую на каждом продаваемом "Макинтоше".

1987 г.

Джефф Конклин публикует свой выдающийся обзор "Hypertext: An Introduction and Survey".

1987 г.

ACM организует первую конференцию по гипертексту Hypertext'87 (Chapel Hill, North Carolina).

1987 г.

выпуск системы Guide для MS Windows.

1989 г.

Шнейдерман и Керсли разрабатывают Hypertext Hands-On! – первую электронную гипертекстовую книгу.

1989 г.

Autodesk, производитель систем CAD, начинает поддержку Xanadu.

1989 г.

Тим Бернерс-Ли выдвигает проект World Wide Web.

1989 г.

коммерческая реализация IRIS Intermedia 3.0.

1989 г.

опубликован "Afternoon, A Story" М. Джойса – первое произведение гипертекстовой беллетристики.

1989 г.

вторая конференция ACM Hypertext'89 (Pittsburgh, Pennsylvania).

1990 г.

первая Европейская конференция по гипертексту ECHT'90.

1990 г.

декабрь основание Научно-технического центра гиперинформационных технологий (ГНТЦ "Гинтех") Министерства связи РФ.

1991 г.

WWW в ЦЕРНе становится первым глобальным гипертекстом.

1991 г.

разработана первая версия пакета ГиперМетод (для DOS) в Ленинградском электротехническом институте.

1991–1999 гг.

проводятся международные гипертекстовые конференции.

1991–1996 гг.

серия конференций Восток-Запад "Взаимодействие человека с компьютером" (EWHCI).

1992 г.

Autodesk отказывается от работ по проекту Xanadu.

1992 г.

создается группа новостей alt.hypertext.

1993 г.

Международная конференция по гипермедиа и гипертекстовым стандартам в Амстердаме.

1993 г.

NCSA (The National Center for Supercomputing Applications) выпускает Mosaic 1.0 (Marc Andreeson, Eric Bina).

1993 г.

первая конференция, посвященная World Wide Web в Женеве.

1994 г.

информационный поток в WWW (Web-трафик) впервые превышает другие трафики Интернет.

Таблица составлена по данным с научного портала «Эврика», URL: http://evrika.tsi.lv/index.php?name=site&page=51