ALTO (XML)

редактировать

ALTO(Анализируемый макет и текстовый объект) - это открытая схема XML, разработанная финансируемым ЕС проектом под названием METAe.

Стандарт изначально был разработан для описания текста OCR и информации макета страниц для оцифрованных материалов. Цель состояла в том, чтобы описать макет и текст в форме, позволяющей восстановить первоначальный внешний вид на основе оцифрованной информации - аналогично подходу к операции сохранения изображения без потерь.

ALTO часто используется в сочетании с стандартом кодирования и передачи метаданных (METS) для описания всего оцифрованного объекта и создания ссылок в файлах ALTO, например описание последовательности чтения.

Стандарт размещен в Библиотеке Конгресса с 2010 года и поддерживается редакционной коллегией, инициализированной в то же время.

С момента выхода окончательной версии стандарта ALTO в июне 2004 г. (версия 1.0) ALTO поддерживалась CCS CCS Content Conversion Specialists GmbH, Гамбург до версии 1.4.

Содержание
  • 1 Версии
  • 2 Структура
  • 3 Ссылки
  • 4 См. Также
  • 5 Внешние ссылки
Версии

Последняя версия схемы и обзор всех версии со ссылками на схему можно найти по адресу https://github.com/altoxml

Structure

Файл ALTO состоит из трех основных разделов, являющихся дочерними по отношению к корневому элементу . :

  • раздел содержит метаданные о самом файле ALTO и обрабатывающую информацию о том, как файл был создан.
  • раздел содержит стили текста и абзацев с их индивидуальными описаниями:
    • содержит описания шрифтов
    • содержит описания абзацев, например Информация о выравнивании Раздел
  • содержит информацию о содержимом. Он подразделяется на элементы .
Ссылки
См. Также
Последняя правка сделана 2021-06-07 21:28:04
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте