Рекомендуемая структура документа

Рекомендуемая структура документа

В дополнение к обязательной структуре настоятельно рекомендуется вставлять различные структурные детали. Существуют специальные рекомендации на различных сайтах, и Вы должны внимательно изучить соответствующие документы.

Здесь же мы просто подчеркнем, что каждый HTML документ должен содержать основную информацию о его происхождении. Частные рекомендации могут уточнить в деталях форму представления этой информации.

Если Вы стремитесь к тому, чтобы люди отыскали Ваш документ по соответствующим связям, важность предоставления информации о его происхождении становится очевидной. Когда пользователь найдет Ваш документ с помощью, например, поискового ресурса AltaVista, он, вероятнее всего, захочет узнать, к какому виду относится документ. Поэтому каждый файл HTML должен предоставлять самую основную информацию (или связи к информации) о его происхождении и природе. Например, в собрании книгоподобных документов, разделенных на малые файлы, каждый файл должен содержать, по крайней мере, связь к “первой странице” “книги” (Home page).

(далее…)

Обязательная структура документа

Обязательная структура документа

Начнем с самого простого HTML документа, содержащего только простой текст Hello world. В HTML файле содержимому обязательно должен предшествовать раздел HEAD, который минимально может состоять из двух конструкций. Тогда код HTML можно представить так:

Пример hello.html:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN"> 

<TITLE>Hello</TITLE> 

Hello world
 (далее...)

Заметки о разном

Заметки о разном

Этот подраздел рассматривает технические проблемы, связанные с некоторыми тегами HTML. Рекомендуем пропустить его в первом чтении, чтобы вернуться потом при необходимости. Описания тегов содержат ссылки на дополнительную литературу.

Escape последовательности (символьные объекты)

Escape последовательности или, точнее, символьные объекты, представляют собой метод представления специальных символов. Например, escape последовательность &lt; обозначает символ “меньше чем” (<).

Некоторые символы, такие как <, используются в HTML в специальном значении, поэтому должен существовать способ их выражения, как символьных данных внутри самого документа или в URL. Принято использовать следующие нотации (соответствия):

символ обычное имя (имена) символа HTML запись символа (escape последовательность)
< символ “меньше чем”, левая угловая скобка &lt;
> символ “больше чем”, правая угловая скобка &gt;
& амперсанд &amp;
двойные кавычки &quot;

Двойные кавычки (“) могут использоваться и в пределах обычного текста.

Заметим, что точка с запятой является частью escape последовательности, но в принципе она может быть опущена. Однако одни броузеры обработают такой код HTML, а другие могут и не понять.

В escape последовательности важен вариант написания символов, то есть различаются заглавные и строчные буквы. Например, амперсанд (&) не может быть представлен как &AMP (escape последовательность – неопределена). Escape последовательность &auml; и &Auml; – a умляут (a диерезис, написание a с двумя точками над ней) – обозначает два разных символа и дает д и Д. Escape последовательность написанная прописными буквами идентифицируется как &AUML;.

(далее…)

Разрешенная вложенность элементов

Разрешенная вложенность элементов

Этот раздел описывает, каким образом в HTML 3.2. элементы могут быть вложены. Здесь не приводятся правила упорядочения или обеспечения повторной вложенности элементов. Здесь просто даются ответы на вопросы в форме: может ли элемент X появится в пределах элемента Y?

Та же самая информация представлена в описании отдельных тегов в частях Допустимый контекст и Содержимое. Здесь это представлено в сжатой форме и носит иллюстративный характер.

Заметки на память:
(Пояснения к списку)

  • Текст со словами на верхнем регистре описывает элементы HTML.
  • Слово, написанном на нижнем регистре – термин, описывающий сочетание HTML элементов.
  • Элементы могут содержать внутри себя список других элементов, которые находятся в пределах этого элемента. Если нет такого списка, никакая вложенность элементов не разрешена. Исключение составляют элементы block и text. Для них допустимо такое содержание, как это описано в настоящем разделе.
  • #PCDATA означает “символьные данные, используемые при грамматическом разборе” (содержит только escape последовательности, например, &auml;, теги HTML – не разрешены).
  • body.content (body-содержание) означает: элементы, которые перечислены под элементом BODY.

(далее…)

Классификация элементов

Классификация элементов

Способы, которыми теги HTML могут сочетаться, определяются терминами элементов и их классификацией. Гораздо удобнее определить, например, что элемент H1 может содержать только текстовые элементы, чем давать длинный список подходящих элементов, особенно, если учесть, что один и тот же список должен появляться во многих контекстах, и этот список может изменяться при добавлении новых текстовых элементов к будущим версиям HTML.

Элементы HTML можно классифицировать на три основные категории:

  • заголовочные элементы, т.е. элементы, используемые в элементе HEAD (“шапка”, заголовок) и содержащие информацию о документе в целом: TITLE, ISINDEX, BASE, META, LINK, SCRIPT, STYLE
  • блоковые элементы, включающие элементы, которые специфицируют структуру документа, например, разделение на части и параграфы (абзацы): H1, H2, H3, H4, H5, H6, ADDRESS, и элементы P, UL, OL, DL, PRE, DIV, CENTER, BLOCKQUOTE, FORM, ISINDEX, HR, TABLE
  • текстовые элементы. Текстовыми элементами могут быть:
    • простой текст, возможно содержащий escape последовательности (например, &amp;)
    • выражения разметки: EM, STRONG, DFN, CODE, SAMP, KBD, VAR, CITE
    • разметка шрифта: TT, I, B, U, STRIKE, BIG, SMALL, SUB, SUP
    • специальные элементы: A, IMG, APPLET, FONT, BASEFONT, BR, SCRIPT, MAP
    • элементы формы: INPUT, SELECT, TEXTAREA

(далее…)