ALTO(Анализируемый макет и текстовый объект) - это открытая схема XML, разработанная финансируемым ЕС проектом под названием METAe.
Стандарт изначально был разработан для описания текста OCR и информации макета страниц для оцифрованных материалов. Цель состояла в том, чтобы описать макет и текст в форме, позволяющей восстановить первоначальный внешний вид на основе оцифрованной информации - аналогично подходу к операции сохранения изображения без потерь.
ALTO часто используется в сочетании с стандартом кодирования и передачи метаданных (METS) для описания всего оцифрованного объекта и создания ссылок в файлах ALTO, например описание последовательности чтения.
Стандарт размещен в Библиотеке Конгресса с 2010 года и поддерживается редакционной коллегией, инициализированной в то же время.
С момента выхода окончательной версии стандарта ALTO в июне 2004 г. (версия 1.0) ALTO поддерживалась CCS CCS Content Conversion Specialists GmbH, Гамбург до версии 1.4.
Последняя версия схемы и обзор всех версии со ссылками на схему можно найти по адресу https://github.com/altoxml
Файл ALTO состоит из трех основных разделов, являющихся дочерними по отношению к корневому элементу