Форматированный текст, стилизованный текст, или форматированный текст, в отличие от обычного текста, содержит информацию о стилях, выходящую за рамки минимума семантических элементов: цвета, стили (полужирный, курсив), размеры и специальные функции в HTML (такие как гиперссылки ).
Отформатированный текст нельзя правильно идентифицировать с двоичными файлами или отличать от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, это может быть только текст, например файлы HTML, RTF или обогащенный текст, и это может быть ASCII -только. И наоборот, файл с простым текстом может быть не-ASCII (в такой кодировке, как Unicode UTF-8 ). Текст с форматированием только текста достигается с помощью разметки, которая также является текстовой, тогда как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.
Форматированный текст зародился в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях. В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве замены. Выделение, например, может быть достигнуто в ASCII несколькими способами:
Подчеркивание также использовалось для названий книг : Посмотрите это на _The_C_Programming_Language_.
Форматирование может быть отмечено тегами, отличными от основного текста специальными символами, такими как угловые скобки в HTML. Например, этот текст:
помечена в HTML таким образом:
Собака классифицируется как Canis lupus familisв таксономии.
Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсива. В LaTeX текст будет размечен следующим образом:
В таксономии собака классифицируется как \ textit {Canis lupus knownis}.
Большинство языков разметки можно редактировать с помощью любого, не требуя специального программного обеспечения. Многие языки разметки также можно редактировать с помощью специализированного программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода в виде WYSIWYG.
С момента изобретения MacWrite, первые WYSIWYG текстовый процессор, в котором машинист кодирует форматирование визуально, а не вставляя текстовую разметку, текстовые процессоры, как правило, сохраняют в двоичные файлы. Открытие таких файлов с помощью открывает текст, украшенный различными двоичными символами, либо вокруг отформатированных областей (например, в [[Wortely, в начале или в конце файла (например, в Microsoft Word ).
).Форматированные текстовые документы в двоичных файлах, однако, имеют недостатки, связанные с областью форматирования и секретностью. В то время как степень форматирования точно отмечена на языках разметки, форматирование WYSIWYG основано на памяти, т. Е. например, нажатие полужирной кнопки до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов с форматированными текстовыми документами, как правило, являются собственностью и недокументированы, что затрудняет совместимость кодирования третьими сторонами, а также ненужные обновления из-за изменений версии.
WordStar был популярным текстовым процессором, в котором не использовались двоичные файлы со скрытыми символами.
OpenOffice.org Writer сохраняет файлы в формате XML формат. Однако в результате файл является двоичным, поскольку он сжат (эквивалент tarball ).
PDF - это другой форматированный текстовый формат файла, который обычно является двоичным (с использованием сжатия текста и хранения графики и шрифтов в двоичном формате). Как правило, это формат конечного пользователя, написанный из приложения, такого как Microsoft Word или OpenOffice.org Writer, и не может редактироваться пользователем после того, как он был готов.