HTML

редактировать

Язык гипертекстовой разметки
HTML. (язык гипертекстовой разметки)
логотип HTML5 и wordmark.svg Официальный логотип последней версии, HTML5
Расширение имени файла
  • .html
  • .htm
Тип интернет-носителя text / html
Код типа TEXT
РазработаноWHATWG
Первый выпуск1993 г ​​.; 27 лет назад (1993)
Последний выпуск Living Standard. (2020)
Тип форматаФормат файла документа
Контейнер для HTML-элементов
Содержится ввеб-браузере
Расширен сSGML
Расширен доXHTML
Открытый формат ?Да
Веб-сайтhtml.spec.whatwg.org

Язык гипертекстовой разметки (HTML ) - это стандартный язык разметки для документов, предназначенных для отображения в веб -браузере. Этому могут помочь такие технологии, как каскадные таблицы стилей (CSS) и языки сценариев, такие как JavaScript.

Веб-браузеры получают HTML-документы из веб-сервер или из локального хранилища и преобразовать документы в мультимедийные веб-страницы. HTML имеет структуру веб-страницы семантически и изначально включает подсказки для внешнего вида документа.

Элементы HTML - это строительные блоки HTML-страниц. С помощью конструкций HTML, изображения и другие объекты, такие как интерактивные формы, могут быть встроены в отображаемую страницу. HTML предоставляет средства для создания структурированных документов путем обозначения структурной семантики для текста, таких как заголовки, абзацы, ссылки, цитаты и другие элементы. HTML-элементы выделяются тегами, записанными с использованием угловых скобок. Такие теги, как и , непосредственно вводят контент на страницу. Другие теги, такие как

, окружают и обеспечивают информацию о тексте документа и другие теги в качестве подэлементов. Браузеры не отображают HTML-теги, но используют их для интерпретации содержимого страницы.

HTML может встраивать программы, написанные на языке сценариев, таком как JavaScript, который влияет на поведение и содержимое веб-страниц. Включение CSS определяет внешний вид и компоновку контента. Консорциум World Wide Web (W3C), бывший разработчик HTML и поддерживающий стандарты CSS, с 1997 года использование CSS вместо явного презентационного HTML.

Содержание

  • 1 История
    • 1.1 Разработка
    • 1.2 Временная шкала версий HTML
      • 1.2.1 HTML 2
      • 1.2.2 HTML 3
      • 1.2.3 HTML 4
      • 1.2.4 HTML 5
    • 1.3 Черновик HTML временная шкала версии
      • 1.3.1 Версии XHTML
    • 1.4 Переход публикации HTML в WHATWG
  • 2 Разметка
    • 2.1 Элементы
      • 2.1.1 Примеры элементов
  • 3 Заголовок уровня 2
    • 3.1 Заголовок уровня 3
      • 3.1.1 Заголовок уровня 4
      • 3.1.2 Атрибуты
    • 3.2 Ссылки на символы и сущности
    • 3.3 Типы данных
    • 3.4 Объявление типа документа
  • 4 Семантический HTML
  • 5 Доставка
    • 5.1 HTTP
    • 5.2 Электронная почта HTML
    • 5.3 Соглашения об именах
    • 5.4 Приложение HTML
  • 6 вариантов HTML4
    • 6.1 Сравнение HTML на основе SGML и XML
    • 6.2 Переходные и строгие
    • 6.3 Сравнение рамок и переходов
    • 6.4 Обзор версий спецификаций
  • 7 Вт HATWG HTML против HTML5
  • 8 Редакторы WYSIWYG
  • 9 См. Также
  • 10 Ссылки
  • 11 Внешние ссылки

История

Разработка

Фотография Тима Бернерса- Ли в апреле 2009 г. Тим Бернерс-Ли в апреле 2009 г.

В 1980 году физик Тим Бернерс-Ли, подрядчик в CERN, используя и созданный прототип INQUIRE, систему, которую исследователи CERN могли использовать и поделиться документами. В 1989 году Бернерс-Ли выполняет служебную записку, в которой предлагал систему на основе Интернета гипертекст. Бернерс-Ли определил HTML и программное обеспечение для сервера в конце 1990 года. В том же году Бернерс-Ли и системный инженер ЦЕРН Роберт Кайо работали над совместным запросом компании на финансирование, но формально проект не был принят ЦЕРН. В своих личных заметках от 1990 года он перечислил «некоторые из многих областей, в которых используется гипертекст» и поставил энциклопедию на первое место.

Первым общедоступным описанием HTML был документ под названием «HTML-теги», впервые упомянутый в Интернете Тимом Бернерсом-Ли в конце 1991 года. Он включает 18 элементов, составляющих начальные, относительно простой дизайн HTML. За исключением тега гиперссылки, на них сильно повлиял SGMLguid, внутренний формат документации на основе Standard Generalized Markup Language (SGML) в CERN. Одиннадцать из этих элементов все еще существуют в HTML 4.

HTML - это язык разметки, который веб-браузеры используют для интерпретации и составления текст, изображений., и другие материалы на визуальных или звуковых веб-страницах. Характеристики по умолчанию для каждого элемента разметки HTML в браузере, и эти характеристики могут использоваться с помощью дополнительного конструктора веб-страницы CSS. Многие из текстовых элементов можно найти в техническом переводе ISO 1988 года TR 9537 «Методы использования SGML», который, в свою очередь, широко использует ранних языков форматирования текста, таких как команда команда RUNOFF, разработанная в начале 1960- х годов. для операционной системы CTSS (Совместимая система разделения времени): эти команды форматирования были получены из команд, используемых наборщиками для ручного форматирования документов. Однако концепция обобщенной разметки SGML основывается на элементах (вложенных аннотированных диапазонах с атрибутами), а не просто на эффектах печати, с также разделением структуры и разметки; HTML постепенно продвигается в этом направлении с помощью CSS.

Бернерс-Ли считал HTML приложение SGML. Он был официально определен как таковой Инженерной группой Интернета (IETF) с публикацией в середине 1993 года первого предложения по спецификации HTML, Интернет-проекта «Язык гипертекстовой разметки (HTML)», автор Бернерс- Ли и Дэном Коннолли, который включает определение типа документа SGML для определения грамматики. Срок действия черновика истек через шесть месяцев, но он отличался от настраиваемого тега NCSA Mosaic для встраивания встроенных изображений, отражающего философию IETF, согласно которым стандарты основываются на успешных прототипах. Точно так Интернет-проект Дэйва Рэггетта, «HTML + (формат гипертекстовой разметки)», с конца 1993 года предлагал стандартизировать уже реализованные функции, такие как таблицы и формы для заполнения.

После истечения черновиков HTML и HTML + в начале 1994 года IETF создала рабочую группу HTML, которая в 1995 году завершила принятие «HTML 2.0», первой спецификации HTML, которая должна рассматривать как стандарт, на котором должны основываться будущие реализации.

Дальнейшее развитие под эгидой IETF было остановлено конкурирующими интересами. С 1996 года спецификации HTML поддерживаются при участии поставщиков коммерческого обеспечения Консорциумом Всемирной паутины (W3C). Однако в 2000 году HTML также стал стандартом (ISO / IEC 15445: 2000). HTML 4.01 был опубликован в конце 1999 года, а в 2001 году были опубликованы другие исправления. В 2004 году разработка HTML5 началась в Рабочей группе по технологиям веб-гипертекстовых приложений (WHATWG), которая стала совместным продуктом с W3C в 2008 году., и завершено и стандартизировано 28 октября 2014 г.

Временная шкала версии HTML

HTML 2

24 ноября 1995 г.
HTML 2.0 был опубликован как RFC 1866. Дополнительные RFC добавленные возможности:

HTML 3

14 января 1997 г.
HTML 3.2 была опубликована как Рекомендация W3C. Это первая версия, разработанная и стандартизированная исключительно W3C, поскольку IETF закрыла свою рабочую группу HTML 12 сентября 1996 года. 33>
Первоначально кодовое название «Wilbur», HTML 3.2 полностью исключило математические формулы, согласовало перекрытие между различными проприетарными расширениями и приняло большинство тегов визуальной разметки Элементы Netscape. Элемент blink в Netscape и Microsoft marquee были опущены из-за взаимной договоренности между двумя я компании. Разметка математических формул, аналогичная разметка в HTML, не была стандартной. Реализовано 14 месяцев спустя в MathML.

HTML 4

18 декабря 1997 г.
HTML 4.0 был опубликован как Рекомендация W3C. Он предлагает три варианта:
  • Строгий, в устаревших элементах запрещены
  • Переходный, в котором разрешены устаревшие элементы
  • Набор фреймов, в котором в основном только кадр связаны связанные элементы.
Первоначально кодовое название «Cougar», HTML 4.0 приняло многие типы элементов и атрибутов, специфичные для использования таблиц постепенно изменилось от функций визуальной разметки Netscape, пометив их как устаревший в пользу таблиц стилей. HTML 4 - это приложение SGML, соответствующий стандарту ISO 8879 - SGML.
24 апреля 1998 г.
HTML 4.0 был переиздан с небольшими изменениями без увеличения номера версии.
24 декабря 1999 г.
HTML 4.01 был опубликован как Рекомендация W3C. Он предлагает те же три варианта, что и HTML 4.0, и его последние исправления были опубликованы 12 мая 2001 г.
май 2000 г.
ISO / IEC 15445: 2000 («ISO HTML» на основе HTML 4.01 Strict) был опубликован как международный стандарт ISO / IEC. В ISO этот стандарт относится к сфере ISO / IEC JTC1 / SC34 (Объединенный технический комитет ISO / IEC 1, Подкомитет 34 - языки описания и обработки документов).
После HTML. 4.01 в течение многих лет не существовало версии HTML, поскольку разработка параллельного языка XHTML на основе XML занимала рабочую группу W3C по HTML в начале и середине 2000-х.

HTML 5

28 октября 2014 г.
HTML5 был опубликован как Рекомендация W3C.
1 ноября 2016 г.
HTML 5.1 был опубликован как Рекомендация W3C.
14 декабря 2017 г.
HTML 5.2 был опубликован как рекомендация W3C.

Временная шкала черновой версии HTML

октябрь 1991
HTML-теги, неофициальный документ ЦЕРН, в котором 18 HTML-тегов, впервые были упомянуты публично.
июнь 1992 г.
Первый неофициальный черновик HTML DTD с семью последующими исправлениями (15 июля, 6 августа, 18 августа, 17 ноября, 19 ноября, 20 ноября, 22 ноября)
ноябрь 1992 г.
HTML DT D 1.1 (первый номер версии, основанными на ревизиях RCS, которые начинаются с 1.1, а не 1.0), неофициальный черновик
июнь 1993 г.
язык гипертекстовой разметки был опубликован IETF Рабочая группа IIIR в виде проекта Интернета (приблизительное предложение стандарта). Через месяц он был заменен второй версией.
ноябрь 1993 г.
HTML + был опубликован IETF как проект в Интернете и являлся конкурирующим предложением к проекту языка гипертекстовой разметки. Срок его действия истек в июле 1994 года.
ноябрь 1994 года
Первый черновик (версия 00) HTML 2.0, опубликованный самой IETF (названный «HTML 2.0» из версии 02), который, наконец, привел к публикации из RFC 1866 в ноябре 1995 г.
апрель 1995 г. (как автор - март 1995 г.)
HTML 3.0 был предложен в стандарте для IETF, но срок действия предложения истек пять месяцев спустя (28 сентября 1995 г.) без дальнейших действий. Он включает в себя множество возможностей, которые были предложены HTML +, такие как поддержка таблиц, обтекание цифрами текста и сложных математических формул.
W3C начал работать с собственным Google Arena в испытательного стенда для HTML 3 и каскадных таблиц стилей, но HTML 3.0 не удалось по нескольким причинам. Проект был сочтен очень большим - 150 страниц, а также темпы разработки браузеров, а также количество сторонних опередили ресурсы IETF. Производители браузеров, включая Microsoft и Netscape в то время, решили реализовать различные подмножества черновых функций HTML 3, а также представить свои собственные расширения для него. (см. Браузерные войны ). Расширение для управления стилистическими ограничениями документов, защита таких вещей, как цвет текста, текстура фона, размер шрифта и начертание шрифта определенно выходят за рамки языка, когда их единственной целью было указать, как будет организован документ ". Дэйв Рэггетт, который был членом W3C в течение многих лет, пишет, например:« В определенной степени Microsoft построила свой бизнес в Интернете, расширив возможности HTML ».
Официальный логотип HTML5 Логотип HTML5
Январь 2008 г.
HTML5 был опубликован W3C как рабочий проект.
Хотя его синтаксис очень похож на синтаксис SGML, HTML5 имеет отказался от любая попытка применить SGML явно определил свою собственную сериализацию "html" в дополнение к альтернативной сериализации XHTML5 на основе XML.
2011 HTML5 - Last Call
14 февраля В 2011 году W3C расширил устав своей рабочей группы HTML, ук азав четкие вехи для HTML5. В мае 2011 года рабочая группа продвинула HTML5 до «Last Call», приглашаем сообщество внутри и вне W3C для подтверждения технической обоснованности спецификации. W3C разработал комплексный набор тестов для достижения широкой функциональной совместимости для полной спецификации к 2014 году, который является критерием датой для рекомендаций. В январе 2011 года WHATWG переименовала свой уровень жизни с «HTML5» в «HTML». Тем не менее, W3C продолжает свой проект по выпуску HTML5.
2012 HTML5 - кандидат в рекомендации
В июле 2012 года WHATWG и W3C приняли решение о степени разделения. W3C продолжит работу над спецификацией HTML5, сосредоточив внимание на едином окончательном стандарте, который WHATWG рассматривает как «снимок». Организация WHATWG продолжит свою работу с HTML5 в качестве «стандарта жизни». Концепция жизни заключается в том, что он никогда не бывает полным и постоянно обновляется и улучшается. Новые функции могут быть добавлены, но функциональность не будет удалена.
В декабре 2012 года W3C назначил HTML5 кандидатом в рекомендации. Критерием перехода к Рекомендации W3C - это «две 100% полные и полностью совместимые реализации».
2014 HTML5 - Предлагаемая рекомендация и рекомендация
В сентябре 2014 года W3C переместил HTML5 в предлагаемую рекомендацию.
28 октября 2014 года HTML5 выпущен в качестве стабильной рекомендации W3C, что означает, что процесс спецификации завершен.

версия XHTML

XHTML - это отдельный язык, который как переформулировка HTML 4.01 с использованием XML 1.0. Он больше не разработан как отдельный стандарт.

  • XHTML 1.0 был опубликован как Рекомендация W3C 26 января 2000 г., а затем был пересмотрен и переиздан 1 августа 2002 г. Он предлагает те же три варианта, что и HTML 4.0 и 4.01, переформулированный в XML, с небольшими ограничениями. 333>
  • XHTML 1.1 был опубликован как рекомендация W3C 31 мая 2001 г. Он основан на XHTML 1.0 Строгие, но включает незначительные изменения, может быть настроен и переформулирован с использованием модулей в рекомендациях W3C «Модуляризация XHTML», который был опубликован 10 апреля 2001 года.
  • XHTML 2.0 был рабочим проектом, работа над ним была прекращена в 2009 году в пользу работы над HTML5 и XHTML5. XHTML 2.0 был несовместим с XHTML 1.x, поэтому его можно было бы более точно охарактеризовать как новый язык, вдохновленный XHTML, чем обновление XHTML 1.x.
  • Синтаксис XHTML, известный как «XHTML5.1» ", определяется вместе с HTML5 в черновике HTML5.

Переход публикации HTML на WHATWG

28 мая 2019 года W3C объявил, что WHATWG будет единственным издателем Стандарты HTML и DOM. W3C и WHATWG опубликовали конкурирующие стандарты с 2012 года. Хотя стандарт W3C был идентичен WHATWG в 2007 году, с тех пор стандарты постепенно разошлись из различных проектных решений. WHATWG "Living Standard" "некоторое время было де-факто веб-стандартом.

Разметка

HTML-разметка из нескольких ключевых компонентов, включая те, что называются тегами (и их атрибутами), символами типа данных на основе HTML-теги чаще всего идут парами, например

HTML - HTML

, хотя некоторые из них заменяют собой пустые элементы и поэтому не являются парными, например . - это начальный тег, а второй - конечный тег (их также называют открывающими тегами и закры) вающими тегами).

Другим важным компонентом является объявление типа документа HTML , которое запускает стандартный режим рендеринга.

Ниже представлен пример классического «Hello, World!» программа :

Это заголовок

Привет, мир!

Текст между и представлен веб-страницей, а текст между и - видимое содержимое страницы. Текст разметки Это заголовокуказать заголовок страницы, а тег указать разделение страницы, используемое для упрощения стилизации.

Объявление типа документа предназначено для HTML5. Если объявление не включено, различные браузеры будут возвращаться в "режим совместимости " для визуализации.

Элементы

HTML-документы подразумевают структуру вложенных HTML-элементов. Они обозначены в документе тегами HTML, заключенными в угловые скобки, например:

.

В простом случае размер элемента указывается парой тегов: «начальный тег»

и «конец. тег "

. Текстовое содержимое элемента, если оно есть, помещается между этими тегами.

Теги могут также включать дополнительную разметку тегов между началом и концом, включая сочетание тегов и текста. Это указывает на дополнительные (вложенные) элементы как дочерние элементы родительского элемента.

Начальный тег может также включать атрибуты внутри тега. Они указывают на другую информацию, такую ​​как идентификаторы для разделов в документе, идентификаторы, используемые для привязки информации о стиле к презентации документа, и для некоторых тегов, таких как , используемых для встраивания изображений, ссылка на ресурс изображения в форматируйте так:

Некоторые элементы, такие как разрыв строки или
, не допускают никакого встроенного содержимого, ни текста, ни других тегов. Для них требуется только один пустой тег (похожий на начальный тег) и не используется конечный тег.

Многие теги, в частности закрывающий конечный тег для очень час то используемого элемента абзаца

, являются необязательными. Браузер HTML или другой агент может сделать вывод о закрытии конца элемента из контекста и структурных правил, определенных стандартом HTML. Эти правила сложны и не очень хорошо понимаются большинством разработчиков HTML.

Таким образом, общая форма HTML-элемента: ''content''. Некоторые элементы HTML определяются как пустые элементы и принимают форму . Пустые элементы могут не содержать содержимого, например тег или встроенный тег . Имя элемента HTML - это имя, используемое в тегах. Обратите внимание, что имени конечного тега предшествует косая черта, /, и что в пустых элементах конечный тег не требуется и не разрешен. Если атрибуты не указаны, в каждом случае используются значения по умолчанию.

Примеры элементов

Заголовок HTML-документа: .... Заголовок включается в заголовок, например:

Заголовок

Заголовки: заголовки HTML тегами от

HTML - HTML

Уровень заголовка 2

Уровень заголовка 3

Уровень заголовка 4

Уровень заголовка 5
Заголовок уровень 6

Эффекты следующие:

Заголовок уровня 2

Заголовок уровня 3

Заголовок уровня 4

Обратите внимание, что CSS может радикально изменить рендеринг.

Абзацы:

Параграф 1

Параграф 2

Разрывы строк: . Разница между и

заключается в том, что разбивает строку без изменений семантической структуры, тогда как

разделяет страницу на абзацы. Элемент является пустым в том смысле, что, хотя он может иметь атрибуты, он не может иметь содержимое и может не иметь закрывающего тега.

Этот представляет собой абзац с разрывами строки

Это ссылка в HTML. Для создания ссылок используется тег . Атрибут hrefсодержит URL-адрес ссылки.

Ссылка на Википедию! 

Входные данные:

Есть много способов, пользователь может вводить данные, например:

1 2 3 

Комментарии:

Комментарии могут помочь понять понимании разметки и не эксперт на веб-странице.

В HTML используется несколько типов элементов разметки:

Структурная разметка указывает цель текста
Например,

Golf

устанавливает «Гольф» как товарная позиция второго уровня. Структурная разметка не обозначает какой-либо конкретный рендеринг, но большинство веб-браузеров стили по умолчанию для форматирования элементов. Контент может быть стилизован с помощью каскадных таблиц стилей (CSS).
Презентационная разметка указывает внешний вид текста, независимо от его назначения
, Полужирный текстуказывает, что устройства визуального вывода должны отображать жирным шрифтом текста, но мало указывает, какие устройства, которые не могут этого сделать (например, слуховые устройства, которые читают текст вслух), должны делать. В случае обоих полужирного текстаи курсивного текста, есть другие элементы, которые могут иметь эквивалентную визуальную визуализацию, но являются более семантическими по своей природе, например, усиленный тексти выделенный текстсоответственно. Легче увидеть, как звуковой пользовательский агент должен интерпретировать последние два элемента. Однако не эквивалентны своим презентационным аналогам: для программы чтения с экрана было бы нежелательно выделять, например, название книги, но на такое название будет выделено курсивом. Большинство элементов презентационной разметки стали устаревшими в соответствии со спецификацией HTML 4.0 используют использование CSS для стилизации.
Гипертовая разметка превращает части документа в ссылки на другие документы
Элемент привязки в документе гиперссылку, а его атрибут hrefустанавливает целевой URL URL ссылки. Например, разметка HTML Wikipedia указит слово «Wikipedia » как гиперссылку. Чтобы отобразить изображение как гиперссылку, элемент imgвставляется как содержимое в элемент a. Подобно br, img- это пустой элемент с атрибутами, но без содержимого или закрывающего тега. описательный текст .

Атрибуты

Основные атрибутов элемента - это пары имя-значение, разделенные =и записанные в начальном теге элемента после названия элемента. Может быть заключено в одинарные или двойные кавычки, хотя значения, состоящие из символов, можно оставить без кавычек в HTML (но не в XHTML). Оставлять значения атрибутов без кавычек считается небезопасным. В отличие от атрибутов пары имя-значение, есть некоторые атрибуты, которые влияют на элемент просто своим присутствием в начальном теге элемента, например, атрибут ismapдля элемента img.

Есть несколько общих атрибутов, которые присутствуют во многих элементах:

  • Атрибут idобеспечивает уникальный идентификатор элемента для всего документа. Это используется для идентификации элемента, чтобы таблицы стилей могли его презентационные свойства. Добавленный к URL-адресу страницы, он предоставляет глобальный уникальный идентификатор элемента, обычно это подраздел страницы. Например, идентификатор «Атрибуты» в https://en.wikipedia.org/w/HTML#Attributes.
  • Атрибут классиспользует способ классификации похожих элементов. Это может быть для семантических или презентационных целей. Например, документ HTML может семантически использовать обозначение , чтобы указать, что все элементы с этим уровнем подчинены основному тексту документа. В том месте, где они представлены в исходном HTML, представлены такие элементы, как сноски на странице, вместо того, чтобы появиться в том месте. Атрибуты класса используются семантически в микроформатах. Могут быть указаны несколько значений класса; например, помещает элемент как в нотацию , так и в классы важно.
  • Автор может использовать атрибут styleдля назначения презентационные свойства конкретного элемента. Считается лучшей практикой использовать атрибуты элемента idили classдля выбора элемента из таблицы стилей, хотя иногда это может быть слишком громоздким для простого, особого или специального стиля.
  • Атрибут titleиспользуется для присоединения подтекстового объяснения к элементу. В большинстве случаев браузеров этот атрибут отображается как всплывающая подсказка .
  • Атрибут langопределяет естественный язык содержимого элемента, который может отличаться от языковой остальной части документа. Например, в документе на английском языке:

    Ну что ж, c'est la vie, как говорят во Франции.

Элемент сокращения, abbr, может быть, показать некоторые из этих атрибутов:

HTML

В этом примере отображается как HTML ; в большинстве браузеров при наведении курсора на аббревиатуру должен использовать текст заголовка «Язык гипертекстовой разметки».

Большинство элементов связанных с языком атрибут директдля указаний направления текста, например, с «rtl» для текста справа налево, например, арабский, персидский или иврит.

Ссылки на символы и объекты

Начиная с версии 4.0, HTML определяет набор из 252 ссылок на объекты и набор из 1,114,050 числовых ссылок на символы, обе из которых позволяют записывать символы посредством разметки, а не простой. Литеральный символ и его копия в разметке считаются эквивалентными и одинаково.

Возможность «экранировать» символы таким образом позволяет использовать символы <и (когда они записываются как <и соответственно), которые следует интерпретировать как символьные данные, а не как разметку. Например, литерал <обычно указывает начало тега, а обычно указывает начало ссылок на символьный объект или числовой символьной ссылки; запись его как или или позволяет вход в содержимое элемента или в значение атрибута. Символ двойных кавычек ("), если он не используется для обозначения значения атрибута, также должен быть экранирован как "или "или ", когда он появляется в самом значении атрибута. Аналогично, символ одинарной кавычки ('), если он не используется для обозначения значения атрибута, также должен быть экранирован как 'или '(или как 'в документах HTML5 или XHTML), когда он появляется в самом значении атрибута. Если авторы документа упускают из необходимости экранирования таких символов, некоторые браузеры могут быть очень снисходительными и пытаются использовать контекст, чтобы угадать их намерения. Результатом по-прежнему является недопустимая разметка, что делает документ менее доступным для других браузеров и других пользовательских агентов, которые могут попытаться проанализировать документ, например, для поиска и индексции.

Экранирование также позволяет отображать символы, которые нелегко набрать или недоступны в кодировке символов документа, в содержимом элемента и атрибута. Например, с острым ударением e(é), можно записать в любом документе HTML как ссылку на объект éили как числовые ссылки éили и, используя символы, которые доступны на всех клавиатурах и поддерживаются во всех кодировках символов. Кодировки символов Unicode, такие как UTF-8, совместимы со всеми современными браузерами и обеспечивают прямой доступ почти ко всем символам мировых систем письма.

Примеры escape-последовательностей HTML
ИменованныйДесятичныйШестнадцатеричныйРезультатОписаниеПримечания
Амперсанд
<<<<Меньше
>>>>Больше
""""Двойные кавычки
''''Одинарные кавычки
Неразрывные пробелы
©©©©Copyright
®®®®Зарегистрированный товарный знак
Dagger
Двойной кинжал Имена чувствительны к регистру
Двойной кинжал Имена могут иметь синонимы
Товарный знак

Типы данных

HTML определяет несколько типов данных для содержимого элемента, таких как сценарии данных и данные таблицы стилей, а также множество типов для значений атрибутов, включая индексы, имена, URI, число s, единицы длины, языки, дескрипторы мультимедиа, цвета, кодировки символов, даты и время и т. д. Все эти типы данных являются специализацией символьных данных.

Объявление типа документа

HTML-документы должны начинаться с Декларации типа документа (неофициально, «doctype»). В браузерах doctype помогает определить режим визуализации - в частности, следует ли использовать quirks mode.

Первоначальной целью doctype было обеспечение синтаксического анализа и проверки HTML-документов инструментами SGML на основе Определение типа документа (DTD). DTD, к которому относится DOCTYPE, содержит машиночитаемую грамматику, определяющую разрешенное и запрещенное содержимое для документа, соответствующее такому DTD. С другой стороны, браузеры не реализуют HTML как приложение SGML и, как следствие, не читают DTD.

HTML5 не определяет DTD; поэтому в HTML5 объявление doctype проще и короче:

Пример документа doctype HTML 4

Это объявление добавлено на DTD для «строгой» версии HTML 4.01. Валидаторы на основе SGML читают DTD, чтобы правильно проанализировать документ и выполнить проверку. В современных браузерах действительный тип документа активирует стандартный режим в отличие от quirks mode.

Кроме того, HTML 4.01 предоставляет переходные DTD и Frameset,, как объяснено ниже. Переходный тип является наиболее инклюзивным и включает текущие теги, а также старые или устаревшие теги, при этом Strict DTD исключает устаревшие теги. В наборе фреймов есть все теги, необходимые для создания фреймов на странице вместе с тегами, включенными в переходный тип.

Семантический HTML

Семантический HTML - это способ написания HTML, который подчеркивает значение закодированной информации над его презентацией (посмотрите). HTML включал семантическую разметку с самого начала, но также включал презентационную разметку, такую ​​как теги , и

. Также существуют семантически нейтральные теги span и div. С конца 1990-х, когда каскадные таблицы стилей начали работать в большинстве браузеров, веб-авторов поощряли избегать использования презентационной разметки HTML с целью разделения представления и содержимого.

В ходе обсуждения Семантической паутины в 2001 году Тим Бернерс-Ли и другие привели примеры того, как интеллектуальные программные "агенты" однажды могут автоматически сканировать Интернет и находить, фильтровать и сопоставлять ранее не связанные, опубликованные факты в интересах пользователей-людей. Такие агенты не являются обычным явлением даже сейчас, но некоторые идеи Web 2.0, mashups и веб-сайтов сравнения цен могут быть близки. Основное различие между этими гибридами веб-приложений и семантическими агентами Бернерса-Ли заключается в том, что текущая агрегация и гибридизация информации обычно разрабатываются веб-разработчиками, которые уже знают веб-расположения и семантика API конкретных данных, которые они хотят смешать, сравнить и объединить.

Важным типом веб-агента, который выполняет сканирование и чтение веб-страниц автоматически, без предварительного знания того, что он может найти, является веб-сканер или паук поисковых систем. Эти программные агенты зависят от семантической ясности веб-страниц, которые они находят, поскольку они используют различные методы и алгоритмы для чтения и индексации миллионов веб-страниц в день и предоставляют веб-пользователям средства поиска без которого полезность всемирной паутины была бы значительно уменьшена.

Чтобы пауки поисковых систем могли оценивать значимость фрагментов текста, которые они находят в документах HTML, а также для тех, кто создает гибридные приложения и другие гибриды, а также для более автоматизированных агентов по мере их разработки, семантические структуры, существующие в HTML, необходимо широко и единообразно применять, чтобы выявить значение опубликованного текста.

Теги презентационной разметки не рекомендуются в текущем HTML и XHTML рекомендации. Большинство презентационных функций из предыдущей версии HTML больше не разрешены, поскольку они приводят к снижению доступности, более высокой стоимости обслуживания сайта и большему размеру документов.

Хороший семантический HTML также улучшает доступность веб-документов (см. Также Рекомендации по обеспечению доступности веб-контента ). Например, программа чтения с экрана или аудиобраузер может правильно определить документ, она не будет тратить время пользователя с ослабленным зрением на повторяющейся или нерелевантной информации, если она была правильно размечена.

Доставка

HTML-документы могут быть доставлены тем же способом, что и любой другой компьютерный файл. Однако чаще всего они доставляются либо по HTTP с веб-сервера, либо по почте.

HTTP

World Wide Web состоит в основном из HTML-документов, передаваемых с веб-серверов в веб-браузерах с использованием протокола передачи гипертекста (HTTP). Однако HTTP используется для обслуживания изображений, звука и другого контента в дополнение к HTML. Чтобы веб-браузеру знать, как обрабатывать каждый полученный документ, вместе с документом передается другая информация. Эти метаданные обычно содержат тип MIME (например, text / htmlили application / xhtml + xml) и кодировку символов (см. Кодировка символов в HTML ).

В современных браузерах тип MIME, отправляемый с документом HTML, может влиять на то, как документ изначально интерпретируется. Ожидается, что документ, отправленный с типом XHTML MIME, будет иметь правильно сформированный XML; синтаксические ошибки могут привести к тому, что браузер не сможет его отобразить. Тот же документ, отправленный с типом HTML MIME, может быть успешно отображен, поскольку некоторые браузеры более снисходительны к HTML.

В рекомендациях W3C указано, что XHTML 1.0, соответствующим руководящим принципам, изложен в Приложении C к рекомендациям, может быть помечены любым типом MIME. В XHTML 1.1 также указано, что документы XHTML 1.1 должны быть помечены любым типом MIME.

HTML-электронная почта

Большинство графических почтовых клиентов позволяют использовать подмножество HTML (часто не определенное) для обеспечения форматирования и семантической разметки недоступны для обычного текста. Это может быть типографская информация, как цветные заголовки, выделенный и цитируемый текст, встроенные изображения и диаграммы. Многие такие клиенты включают в себя как редактор GUI для составления сообщений электронной почты в формате HTML, так и механизм визуализации для их отображения. Некоторые критикуют HTML в электронной почте из-за проблем с совместимостью, потому что он может помочь скрыть фишинговые атаки, из-за проблем доступности для слепых или слабовидящих людей, потому что он может запутать спам фильтрует и потому, что размер сообщения больше, чем у обычного текста.

Соглашения об именах

Наиболее распространенным расширением имени файла для файлов, HTML, является .html. Распространенное сокращение для этого - .htm, возникло из-за некоторых операционных систем и файловых систем таких как DOS и ограничения налагаемых структур FAT, ограниченные расширения файлов до трех букв.

HTML-приложение

HTML-приложение (HTA; расширение файла ".hta") - это приложение Microsoft Windows, которое использует HTML и динамический HTML в браузер, чтобы графический интерфейс приложения. Обычный файл HTML ограничен модели безопасности безопасности веб-сайтов, взаимодействуя только с веб-серверами и управляя только объектами веб-страниц и файлы cookie сайта. HTA работает как полностью доверенное приложение и поэтому имеет больше привилегий, таких как создание / редактирование / удаление файлов и записей реестра Windows. Они запускаются из системы файловой системы. Они работают через Интернет через HTTP.

Варианты HTML4

С момента своего создания HTML и связанные с ним протоколы относительно быстро получили признание. Однако в первые годы существования языка четких стандартов не существовало. Хотя его создатели изначально задумывали HTML как семантический язык, дополнительные детали, практическое использование выдвинуло язык в языке презентационных элементов и атрибутов, обусловленных различными поставщиками браузеров. Последние стандарты, относящиеся к HTML, отражают усилия по преодолению иногда хаотичного развития документов. Чтобы вернуть HTML его роль семантического языка, W3C разработал языки стилей, такие как CSS и XSL, чтобы взять на себя бремя представления. Вместе с тем, спецификация HTML постепенно ограничивала презентационные элементы.

Существуют две оси, различающие различные варианты HTML, как указано в настоящее время: HTML на основе SGML и HTML на основе XML (называемый XHTML) на одной оси и строгий или переходный (свободный) или набор фреймов - на другой. ось.

HTML на основе SGML и HTML на основе XML

Одно различие последних спецификаций HTML в различиях между спецификациями на основе SGML и спецификациями на основе XML. Спецификация на основе XML обычно называется XHTML, чтобы четко отличать ее от более традиционного определения. Однако имя корневого элемента продолжает оставаться «html» даже в HTML-коде, заданном XHTML. W3C предполагал, что XHTML 1.0 будет идентичным HTML 4.01, за исключением тех случаев, когда ограничение XML по сравнению с более сложным SGML требует обходных путей. Временная связь XHTML и HTML. В таких обстоятельствах некоторые авторы объединяют два имени как (X) HTML или X (HTML).

Как и HTML 4.01, XHTML 1.0 имеет три подспецификации: строгую, переходную и набор фреймов.

Помимо различных открывающих объявлений для документа, между документами HTML 4.01 и XHTML 1.0 - в каждом из соответствующих DTD - в основном синтаксические. Базовый синтаксис HTML допускает множество ярлыков, содержащихся в XHTML, например элементы с необязательными открывающими или закрывающими тегами и даже пустые элементы, которые не должны иметь закрывающего тега. Напротив, XHTML требует, чтобы все элементы имели открывающий и закрывающий теги. XHTML, однако, также представляет новый ярлык: тег XHTML можно открывать и закрывать внутри одного и того же тега, добавляя косую черту перед концом тега, например: .. Введение этого сокращения используется в SGML для HTML 4.01, может сбить с толку более раннее программное обеспечение, незнакомое с этим новым соглашением. Чтобы это, нужно добавить пробел перед закрытием тега как такового:
.

, чтобы понять различия между HTML и XHTML, проверить преобразование действующего и правильно сформированного документа XHTML 1.0, который соответствует Приложению C (см. Ниже) в действующий документ HTML 4.01. Для выполнения этого перевода требуются следующие шаги:

  1. Язык элемента должен быть указан с помощью атрибута lang, а не атрибута XHTML xml: lang. XHTML использует Встроенный язык функциональности XML, определяющий.
  2. Удалите пространство имен XML (xmlns = URI). HTML не имеет средств для пространств имен.
  3. Измените объявление типа документа с XHTML 1.0 - HTML 4.01. (см. раздел DTD для дальнейшего объяснения).
  4. Если удалить присутствует, XML объявления. (Обычно это: ).
  5. убедитесь, что тип MIME документа равенство установлено значение text / html. И для HTML, и для XHTML это происходит из заголовка HTTP Content-Type, отправленного сервером.
  6. Измените пустой элемент XML синтаксис пустого элемента стиля HTML от (
    до ).

Это основные изменения, необходимые для перевода документа из XHTML 1.0 в HTML 4.01. Для перевода из HTML в XHTML также потребуется Добавление любых пропущенных открывающих или закрывающих тегов. При кодировании в HTML или XHTML лучше всегда вставлять необязательные теги в документ HTML, а не помнить, какие теги можно опустить.

Правильно сформированный документ XHTML соответствует всем синтаксическим требованиям XML. документ соответствует стандартам содержания для XHTML, который представляет собой документ.

W3C рекомендует несколько соглашений для простого миграции между HTML и XHTML (см. Рекомендации по совместимости HTML ). ледующие шаги можно применить только к документам XHTML 1.0:

  • Включите атрибуты xml: langи langв любые элементы, назначающие язык.
  • Используйте пустой -element синтаксис только для элементов, указанных как пустые в HTML.
  • Включите дополнительный пробел в теги пустых элементов: например,
    вместо .
  • Включите явные закрывающие теги для элементов, которые разрешают содержимое, но остаются пустыми (например, , а не ).
  • Опустите объявление XML.

Тщательно следуя рекомендациям W3C по совместимости, пользовательский агент должен иметь возможность интерпретировать документ одинаково как HTML или XHTML. Для документов, которые являются XHTML 1.0 и были сделаны совместимыми таким образом, W3C разрешает их обслуживание либо как HTML (с text / htmlтипом MIME ), либо как XHTML (с application / xhtml + xmlили application / xmlтип MIME). в формате XHTML браузеры должны использовать синтаксический анализатор XML, который строго соответствует спецификациям XML для синтаксического анализа. g содержания документа.

Переходный и строгий

HTML 4 определил три разные версии: строгую, переходную ( когда-то называемую свободным) и набор фреймов. Версия Strict предназначена для новых документов и считается передовой практикой, в то время как версии были разработаны Transitional и Frameset, чтобы упростить перенос, которые соответствуют старой спецификации HTML или не соответствуют какой-либо версии HTML 4. Версии Transitional и Frameset позволяют использовать презентационную разметку, которая отсутствует в версии Strict. Вместо этого рекомендуется использовать каскадные таблицы стилей для улучшения представления HTML-документов. XHTML 1 определяет синтаксис XML только для языка, определенный HTML 4, те же различия применимы и к XHTML 1.

Переходная версия допускает следующие части словаря, которые не включены в строгую версию:

  • Более свободная модель содержимого
    • Встроенные элементы и простой текст разрешены непосредственно в: теле, цитата, форма, noscriptи noframes
  • элементы, связанные с презентацией
    • подчеркивание (u) (Устарело. Может спутать посетителя с гиперссылкой.)
    • перечеркнутый (s)
    • центр(Устарело. Использование вместо этого CSS.)
    • font(Устарело. Используйте CSS вместо этого.)
    • basefont(Устарело. Используйте вместо него CSS.)
  • Атрибуты, связанные с презентацией
    • background(Устарело. Вместо этого используйте CSS.) И bgcolor(Устарело. Используйте вместо этого CSS.) Атрибуты для body(обязательный элемент согласно W3C.) Атрибут
    • align(устарел. используйте вместо этого CSS.) атрибут в div, форма, абзац (p) и заголовок (h1... h6) элементы
    • align(устарело. использовать CSS я nstead.), noshade(устарело. використов вместо этого CSS.), size(устарело. используйте вместо этого CSS.) и width(устарело. используйте вместо этого CSS.) атрибуты в hrэлементенте
    • align(устарело. Используйте вместо этого CSS.), border, vspaceи hspaceатрибуты в imgи объектах(внимание: элемент объектподдерживает только в Internet Explorer (из основных браузеров)) элементы
    • align(устарело. Вместо этого використовуйте CSS.) Атрибут в легенде Элементыи caption
    • align(устарело. Используйте вместо этого CSS.) И bgcolor(устарело. Используйте вместо этого CSS.) В tableelement
    • nowrap(Устарело), bgcolor(Устарело. Используйте вместо этого CSS.), width, heightна tdи thэлементы
    • bgcolor(устарело. Используйте вместо этого CSS.) Атрибут на trelement
    • clear(устаревший) атрибут на brэлемент
    • компактныйатрибут в dl, dirи менюэлементы
    • тип(не рекомендуется. Используйте его вместо этого CSS.), compact(устарело. используйте використов вместо CSS.) и start(устарело. Используйте вместо этого CSS.) Атрибуты в olи ulelements
    • typeи valueатрибуты на lielement
    • widthатрибут в preelement
  • Дополнительные элементы в переходной спецификации
    • меню(устарело. Использовать вместо этого CSS.) Список (без замены, хотя неупорядоченный список рекомендуется)
    • dir(устарел. Используйте вместо этого CSS.) Список (без замены, хотя рекомендуется неупорядоченный список)
    • isindex(Уста рело.) (элемент требует поддержки на стороне сервера и обычно добавляется в документы на стороне сервера, formи inputмогут элементы в качестве замены)
    • апплет(Устарело. Вместо этого используйте элемент .)
  • Атрибут языка(Устаревший) в элементе скрипта (избыточно с атрибутом тип).
  • Объекты, связанные с фреймом
    • iframe
    • noframes
    • target(устарело в карта, ссылкаи образуют элементы.) Атрибут на a, клиентская карта изображения (карта), ссылка, formи базовые элементы

Версия Frameset включает в себя все, что есть в переходной версии, а также элемент frameset(используется вместо body) и элемент frame.

Набор фреймов по сравнению с переходным

В дополнение к указанным выше переходным отличиям в спецификациях набора фреймов (будь то XHTML 1.0 или HTML 4.01) указана другая модель содержимого, с набором фреймоввместо тело, которое содержит либо элементы frame, либо опционально noframesс body.

Сводка согласно спецификации

Как Этот список демонстрирует, что свободные версии поддерживаются для поддержки устаревших версий. Однако, вопреки распространенным заблуждениям, переход на XHTML не подразумевает удаления этой устаревшей поддержки. Скорее X в XML означает расширяемость, а W3C - модулируемую спецификацию и открывает ее для независимых расширений. Основным достижением перехода от XHTML 1.0 к XHTML 1.1 является модульность всей спецификации. Строгая версия HTML развернута в XHTML 1.1 посредством набора модульных расширений спецификации XHTML 1.1. Аналогичным образом, кто-то, кто ищет свободные (переходные) спецификации или спецификацию набора фреймов, найдет другую расширенную поддержку XHTML 1.1 (большая часть которой устаревших модулях или модулях фреймов). Модульность также позволяет разрабатывать отдельные функции по собственному расписанию. Так, например, XHTML 1.1 позволяет быстрее перейти на новые стандарты XML, такие как MathML (язык представления и семантической математики на основе XML) и XForms - новая высокотехнологичная веб-форма. технология для замены HTML-форм.

Таким образом, спецификация HTML 4 в основном свела все различные реализации HTML к единой четко написанной спецификации, основанной на SGML. XHTML 1.0 перенес эту спецификацию, как есть, в новую спецификацию XML. Далее, XHTML 1.1 использует расширяемую природу XML и модулируемую всю спецификацию. XHTML 2.0 был задуман как первый шаг к добавлению новых функций в спецификации на основе подхода, основанного на стандарте.

WHATWG HTML против HTML5

HTML Living Standard, это WHATWG, является официальной версией, в то время как W3C HTML5 больше не отделен от WHATWG.

Редакторы WYSIWYG

Есть несколько редакторов WYSIWYG (What You See Is What You Get), в которых пользователь выкладывает все так, как должно быть в HTML-документ, использующий графический пользовательский интерфейс (GUI), часто похожий на текстовые процессоры. Редактор визуализирует документ, а не показывает код, поэтому автора не требуются обширные знания HTML.

Модель редактирования WYSIWYG подверглась критике, прежде всего из-за низкого качества сгенерированного кода; есть голоса, выступающие за изменение модели WYSIWYM («Что вы видите, то и имеете в виду»).

WYSIWYG редактора остается спорным вопросом из-за их предполагаемые недостатки, такие как:

  • Полагаясь в основном на макете в противоположности означая, часто используя разметку, которая не передает подразумеваемый смысл, а просто копирует макет <333.>
  • Часто создается подробный и избыточный код, не использующий каскадный характер HTML и CSS.
  • Часто создается неграмматическая разметка, называемая супом тегов или семантически неправильной разметкой (например, как курсивом).
  • Большая часть информации в HTML-документах отсутствует в макете, модель подверглась критике за ее характер, «то, что вы видите, это все, что вы получаете».

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-22 09:50:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте