OCR-A

редактировать
OCR-A
OCR-A font.svg
Категория Sans-serif
Дизайнер (ы) Основатели американского типа
По заказуАмериканского национального института стандартов
Дата выпуска1968
ВариантыРасширенный OCR-A
Образец гарнитуры OCR A.svg
Образец

OCR-A - это шрифт, созданный в 1968 году, на заре компьютерного оптического распознавания символов, когда возникла потребность в шрифте, который мог бы распознаваться не только компьютерами того времени., но также и людьми. OCR-A использует простые толстые штрихи для формирования узнаваемых символов. Шрифт моноширинный (фиксированная ширина), при этом принтер должен размещать глифы на расстоянии 0,254 см (0,10 дюйма) друг от друга, а устройство чтения должно принимать любое расстояние от 0,2286 см (0,09 дюйма) до 0,4572 см ( 0,18 дюйма).

Содержание
  • 1 Стандартизация
  • 2 Реализации
  • 3 Использование
  • 4 Кодовые точки
    • 4.1 Стандартное представление до Unicode
    • 4.2 Выделенные символы OCR-A в Unicode
    • 4.3 Пробел, цифры и буквы без ударения
    • 4.4 Обычные символы
    • 4.5 Оставшиеся символы
    • 4.6 Дополнительные символы
    • 4.7 Исключения
      • 4.7.1 PrecisionID
      • 4.7.2 Barcodesoft
      • 4.7.3 Morovia
      • 4.7.4 IDAutomation
  • 5 Приложения
  • 6 Продавцы стандартов шрифтов
  • 7 См. Также
  • 8 Примечания
  • 9 Внешние ссылки
Стандартизация

OCR- Шрифт был стандартизирован Американским национальным институтом стандартов (ANSI) как ANSI X3.17-1981. С тех пор X3.4 стал INCITS, а стандарт OCR-A теперь называется ISO 1073-1: 1976 . Существует также немецкий стандарт для OCR-A под названием DIN 66008.

Реализации

В 1968 году American Type Founders выпустили OCR-A, один из первых оптических символов. распознавание шрифтов в соответствии с критериями, установленными Бюро стандартов США. Дизайн прост, так что его можно легко прочитать на машине, но его труднее читать человеческим глазом.

Когда металлический шрифт уступил место компьютерному набору, Тор Лиллквист использовал Метафонт для описания шрифта OCR-A. Это определение впоследствии было улучшено Ричардом Б. Уэльсом. Их работа доступна на CTAN.

Чтобы сделать бесплатную версию шрифта более доступной для пользователей Microsoft Windows, Джон Заутер преобразовал определения Metafont в TrueType, используя potrace и FontForge в 2004 году. В 2007 году Гюркан Сенгюн создал пакет Debian на основе этой реализации. В 2008 году Люк Деврой исправил вертикальное позиционирование в реализации Джона Саутера и исправил имя строчной буквы z.

Независимо от этого Мэтью Скала использовал mftrace для преобразования определений Metafont в формат TrueType в 2006. В 2011 году он выпустил новую версию, созданную путем переписывания определений Metafont для работы с METATYPE1, генерации контуров напрямую без промежуточного шага трассировки. 27 сентября 2012 г. он обновил свою реализацию до версии 0.2.

Помимо этих бесплатных реализаций OCR-A, есть также реализации, проданные несколькими поставщиками.

Используйте

Хотя технология оптического распознавания символов продвинулась до такой степени, что такие простые шрифты больше не нужны, шрифт OCR-A по-прежнему используется. Его использование остается широко распространенным в кодировании проверок во всем мире. Некоторые компании lockbox по-прежнему настаивают на том, чтобы номер счета и сумма задолженности на бланке возврата счета были напечатаны в OCR-A. Кроме того, из-за своего необычного внешнего вида он иногда используется в рекламе и демонстрационной графике.

В частности, он используется для субтитров в телесериале Blacklist и для основных заголовков в The Pretender. Кроме того, OCR-A используется для фильма 13 часов: Тайные солдаты Бенгази.

Кодовые точки

Шрифт - это набор форм символов или глифов. Чтобы компьютер мог использовать шрифт, каждому глифу должна быть назначена кодовая точка в наборе символов . Когда OCR-A стандартизировался, обычной кодировкой символов был Американский стандартный код для обмена информацией или ASCII. Не все глифы OCR-A вписываются в ASCII, а для пяти символов были альтернативные глифы, которые могли указывать на необходимость второго шрифта. Однако для удобства и эффективности предполагалось, что все глифы будут доступны в едином шрифте с использованием кодирования ASCII, с дополнительными символами, размещенными в точках кодирования, которые в противном случае не использовались бы.

Современный потомок ASCII - это Unicode, также известный как ISO 10646. Unicode содержит ASCII и имеет специальные положения для символов OCR, поэтому некоторые реализации OCR-A обращаются к Unicode для руководства по назначению кодов символов.

Стандартное представление до Unicode

Стандарт ISO ISO 2033 : 1983 и соответствующий Японский промышленный стандарт JIS X 9010: 1984 (первоначально JIS C 6229-1984), определяют кодировки символов для OCR-A, OCR-B и E-13B. Для OCR-A они определяют модифицированный 7-битный набор ASCII (также известный под его номером ISO-IR ISO-IR-91), включая только прописные буквы, цифры, подмножество знаков препинания и символы, и некоторые дополнительные символы. Коды, которые переопределяются относительно ASCII, а не просто опущены, перечислены ниже:

СимволИзображениеМестоположениеВ ASCIIКомментарии
£Знак фунта 0x23#Соответствует BS 4730, варианту для Соединенного Королевства ISO 646.
{Левая фигурная скобка 0x28(Имя символа по-прежнему «ЛЕВЫЙ ПАРЕНТЕЗ», несмотря на наличие скобки. Обычный код ASCII левой фигурной скобки 0x7B опущен.
}Правая фигурная скобка 0x29)Имя символа по-прежнему "RIGHT PARENTHESIS", несмотря на отображение фигурной скобки. Обычный код ASCII правой скобки 0x7D опущен.
Крючок OCR 0x3C<
Председатель OCR 0x3E>
¥Знак иены 0x5C\Соответствует JIS X 0201. Включен в JIS X 9010, но опущен ISO 2033.
Вилка OCR 0x5D]

Кроме того, длинная вертикальная метка (длинный вертикальный знак ) кодируется как 0x7C, что соответствует вертикальной полосе ASCII (|).

Выделенные символы OCR-A в Unicode

Следующие символы были определены для целей управления и теперь находятся в диапазоне Unicode «Оптическое распознавание символов» 2440–245F :

Выделенные кодовые точки OCR-A на основе ASCII и Unicode
ИмяИзображениеТекстUnicode
Hook OCRКрючок OCR U + 2440
OCR ChairПредседатель OCR U +2441
Вилка OCRВилка OCR U + 2442
Перевернутая вилка OCRU + 2443
Ремень OCRU + 2444
Галстук-бабочка OCRU + 2445

Пробел, цифры и буквы без ударения

Цифры OCR-A Заглавные буквы OCR-A без ударения Строчные буквы без ударения OCR-A

Все реализации OCR-A используют U + 0020 для пробела, От U + 0030 до U + 0039 для десятичных цифр, от U + 0041 до U + 005A для безударных букв верхнего регистра и от U + 0061 до U + 007A для безударных букв lo. были буквы в регистре.

Обычные символы

Помимо цифр и букв без ударения, многие символы OCR-A имеют очевидные кодовые точки в ASCII. Большинство из них, включая все акцентированные буквы OCR-A, имеют очевидные кодовые точки в Unicode.

Дополнительные коды OCR-A на основе ASCII и Unicode
NameGlyphUnicode
Exclamation Markвосклицательный знак U + 0021
Quotation Markкавычка U + 0022
Знак числацифровой знак U + 0023
Знак доллараЗнак доллара U + 0024
Знак процентаЗнак процента U + 0025
Амперсандамперсанд U + 0026
АпострофАпостроф U + 0027
Левая скобкаЛевая круглая скобка U + 0028
Правая скобкаПравая скобка U + 0029
ЗвездочкаЗвездочка U + 002A
Плюсзнак плюса U + 002B
ЗапятаяЗапятая U + 002C
Дефис-минусДефис-минус U + 002D
Полная остановка (точка)Точка (точка) U + 002E
Знак косой чертыСолидус (косая черта) U + 002F
ДвоеточиеДвоеточие U + 003A
Точка с запятойТочка с запятой U + 003B
Знак меньшеЗнак «Меньше» U + 003C
Знак равенстваЗнак равенства U + 003D
Знак большезнак больше U + 003E
Знак вопросаЗнак вопроса U + 003F
Коммерческий адресРекламный в U + 0040
Левая квадратная скобкалевая квадратная скобка U + 005B
Обратный знак солидуса (обратная косая черта)Обратный солидус U + 005C
Правая квадратная скобкаПравая квадратная скобка U + 005D
Circumflex AccentCircumflex Accent U + 005E
Левая фигурная скобкаЛевая фигурная скобка U + 007B
Правая фигурная скобкаПравая фигурная скобка U + 007D
Знак фунта (стерлингов)Знак фунта U + 00A 3
Знак йеныЗнак иены U + 00A5
Латинская заглавная буква A с дирезисомЗаглавная латинская буква A с Dieresis U + 00C4
Латинская заглавная буква A с кольцом сверхулатиница Заглавная буква A с кольцом над ним U + 00C5
Латинская заглавная буква AEзаглавная латинская буква AE U + 00C6
Заглавная латинская буква N с тильдойЛатинская заглавная буква N с тильдой U + 00D1
Заглавная латинская буква O с символом Дьереза ​​Латинская заглавная буква O с Дерезисом U + 00D6
Заглавная латинская буква O со штрихомЗаглавная латинская буква O со штрихом U + 00D8
Латинская заглавная буква U с символом DieresisЛатинская заглавная буква al Буква U с символом Dieresis U + 00DC

Остальные символы

Линотип закодировал оставшиеся символы OCR-A следующим образом:

Дополнительные символы OCR-A
ИмяГлифUnicodeИмя Unicode
Длинная вертикальная меткадлинный вертикальный знак U + 007CВертикальная линия

Дополнительные символы

Шрифты, восходящие к работам Тора Лиллквиста и Ричарда Б. Уэльса, определяют четыре символа не в OCR-A, чтобы заполнить набор символов ASCII. Эти фигуры используют тот же стиль, что и фигуры символов OCR-A. Это:

Дополнительные символы ASCII
ИмяГлифUnicode
Low LineНижняя линия U + 005F
Grave AccentСерьезный удар U + 0060
Вертикальная линияВертикальная линия U + 007C
ТильдаТильда U + 007E

Линотип также определяет дополнительные символы.

Исключения

Некоторые реализации не используют приведенный выше код присвоение очков некоторым персонажам.

PrecisionID

Реализация PrecisionID OCR-A имеет следующие нестандартные кодовые точки:

  • Обработка OCR в U + 007E
  • Председатель OCR в U + 00C1
  • OCR Fork в U + 00C2
  • Euro Sign в U + 0080

Barcodesoft

Реализация OCR-A Barcodesoft имеет следующие нестандартные кодовые точки:

  • Крючок OCR на U + 0060
  • Стул OCR на U + 007E
  • Вилка OCR на U + 005F
  • Длинная вертикальная метка на U + 007C (согласуется с Linotype)
  • Удаление символа в U + 0008

Morovia

Реализация OCR-A в Morovia имеет следующие нестандартные кодовые точки:

  • Перехватчик OCR в U + 007E (соглашается с PrecisionID)
  • Председатель OCR в U + 00F0
  • Вилка OCR в U + 005F (согласована с Barcodesoft)
  • Длинная вертикальная отметка в U + 007C (согласована с Linotype)

IDAutomation

Реализация OCR-A в IDAutomation имеет следующие нестандартные кодовые точки:

  • Перехватчик OCR в U + 007E (соответствует PrecisionID)
  • Председатель OCR в U + 00C1 (согласуется с Pr ecisionID)
  • Форк OCR в U + 00C2 (соответствует PrecisionID)
  • Ремень OCR в U + 00C3
Приложения
Продавцы стандартов шрифтов
См. также
Примечания
Внешние ссылки
Wikimedia Commons имеет носители, относящиеся к OCR-A.
Последняя правка сделана 2021-06-01 06:14:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте