OCR-A

редактировать

OCR-A

Категория	Sans-serif
Дизайнер (ы)	Основатели американского типа
По заказу	Американского национального института стандартов
Дата выпуска	1968
Варианты	Расширенный OCR-A

Образец

OCR-A - это шрифт, созданный в 1968 году, на заре компьютерного оптического распознавания символов, когда возникла потребность в шрифте, который мог бы распознаваться не только компьютерами того времени., но также и людьми. OCR-A использует простые толстые штрихи для формирования узнаваемых символов. Шрифт моноширинный (фиксированная ширина), при этом принтер должен размещать глифы на расстоянии 0,254 см (0,10 дюйма) друг от друга, а устройство чтения должно принимать любое расстояние от 0,2286 см (0,09 дюйма) до 0,4572 см ( 0,18 дюйма).

Содержание

1 Стандартизация
2 Реализации
3 Использование
4 Кодовые точки
- 4.1 Стандартное представление до Unicode
- 4.2 Выделенные символы OCR-A в Unicode
- 4.3 Пробел, цифры и буквы без ударения
- 4.4 Обычные символы
- 4.5 Оставшиеся символы
- 4.6 Дополнительные символы
- 4.7 Исключения
  - 4.7.1 PrecisionID
  - 4.7.2 Barcodesoft
  - 4.7.3 Morovia
  - 4.7.4 IDAutomation
5 Приложения
6 Продавцы стандартов шрифтов
7 См. Также
8 Примечания
9 Внешние ссылки

Стандартизация

OCR- Шрифт был стандартизирован Американским национальным институтом стандартов (ANSI) как ANSI X3.17-1981. С тех пор X3.4 стал INCITS, а стандарт OCR-A теперь называется ISO 1073-1: 1976 . Существует также немецкий стандарт для OCR-A под названием DIN 66008.

Реализации

В 1968 году American Type Founders выпустили OCR-A, один из первых оптических символов. распознавание шрифтов в соответствии с критериями, установленными Бюро стандартов США. Дизайн прост, так что его можно легко прочитать на машине, но его труднее читать человеческим глазом.

Когда металлический шрифт уступил место компьютерному набору, Тор Лиллквист использовал Метафонт для описания шрифта OCR-A. Это определение впоследствии было улучшено Ричардом Б. Уэльсом. Их работа доступна на CTAN.

Чтобы сделать бесплатную версию шрифта более доступной для пользователей Microsoft Windows, Джон Заутер преобразовал определения Metafont в TrueType, используя potrace и FontForge в 2004 году. В 2007 году Гюркан Сенгюн создал пакет Debian на основе этой реализации. В 2008 году Люк Деврой исправил вертикальное позиционирование в реализации Джона Саутера и исправил имя строчной буквы z.

Независимо от этого Мэтью Скала использовал mftrace для преобразования определений Metafont в формат TrueType в 2006. В 2011 году он выпустил новую версию, созданную путем переписывания определений Metafont для работы с METATYPE1, генерации контуров напрямую без промежуточного шага трассировки. 27 сентября 2012 г. он обновил свою реализацию до версии 0.2.

Помимо этих бесплатных реализаций OCR-A, есть также реализации, проданные несколькими поставщиками.

Используйте

Хотя технология оптического распознавания символов продвинулась до такой степени, что такие простые шрифты больше не нужны, шрифт OCR-A по-прежнему используется. Его использование остается широко распространенным в кодировании проверок во всем мире. Некоторые компании lockbox по-прежнему настаивают на том, чтобы номер счета и сумма задолженности на бланке возврата счета были напечатаны в OCR-A. Кроме того, из-за своего необычного внешнего вида он иногда используется в рекламе и демонстрационной графике.

В частности, он используется для субтитров в телесериале Blacklist и для основных заголовков в The Pretender. Кроме того, OCR-A используется для фильма 13 часов: Тайные солдаты Бенгази.

Кодовые точки

Шрифт - это набор форм символов или глифов. Чтобы компьютер мог использовать шрифт, каждому глифу должна быть назначена кодовая точка в наборе символов . Когда OCR-A стандартизировался, обычной кодировкой символов был Американский стандартный код для обмена информацией или ASCII. Не все глифы OCR-A вписываются в ASCII, а для пяти символов были альтернативные глифы, которые могли указывать на необходимость второго шрифта. Однако для удобства и эффективности предполагалось, что все глифы будут доступны в едином шрифте с использованием кодирования ASCII, с дополнительными символами, размещенными в точках кодирования, которые в противном случае не использовались бы.

Современный потомок ASCII - это Unicode, также известный как ISO 10646. Unicode содержит ASCII и имеет специальные положения для символов OCR, поэтому некоторые реализации OCR-A обращаются к Unicode для руководства по назначению кодов символов.

Стандартное представление до Unicode

Стандарт ISO ISO 2033 : 1983 и соответствующий Японский промышленный стандарт JIS X 9010: 1984 (первоначально JIS C 6229-1984), определяют кодировки символов для OCR-A, OCR-B и E-13B. Для OCR-A они определяют модифицированный 7-битный набор ASCII (также известный под его номером ISO-IR ISO-IR-91), включая только прописные буквы, цифры, подмножество знаков препинания и символы, и некоторые дополнительные символы. Коды, которые переопределяются относительно ASCII, а не просто опущены, перечислены ниже:

Символ	Местоположение	В ASCII	Комментарии
£	0x23	#	Соответствует BS 4730, варианту для Соединенного Королевства ISO 646.
{	0x28	(	Имя символа по-прежнему «ЛЕВЫЙ ПАРЕНТЕЗ», несмотря на наличие скобки. Обычный код ASCII левой фигурной скобки 0x7B опущен.
}	0x29	)	Имя символа по-прежнему "RIGHT PARENTHESIS", несмотря на отображение фигурной скобки. Обычный код ASCII правой скобки 0x7D опущен.
⑀	0x3C	<
⑁	0x3E	>
¥	0x5C	\	Соответствует JIS X 0201. Включен в JIS X 9010, но опущен ISO 2033.
⑂	0x5D	]

Кроме того, длинная вертикальная метка ( ) кодируется как 0x7C, что соответствует вертикальной полосе ASCII (|).

Выделенные символы OCR-A в Unicode

Следующие символы были определены для целей управления и теперь находятся в диапазоне Unicode «Оптическое распознавание символов» 2440–245F :

Выделенные кодовые точки OCR-A на основе ASCII и Unicode
Имя	Изображение	Текст	Unicode
Hook OCR		⑀	U + 2440
OCR Chair		⑁	U +2441
Вилка OCR		⑂	U + 2442
Перевернутая вилка OCR	⑃	⑃	U + 2443
Ремень OCR	⑄	⑄	U + 2444
Галстук-бабочка OCR	⑅	⑅	U + 2445

Пробел, цифры и буквы без ударения

Цифры OCR-A

Заглавные буквы OCR-A без ударения

Строчные буквы без ударения OCR-A

Все реализации OCR-A используют U + 0020 для пробела, От U + 0030 до U + 0039 для десятичных цифр, от U + 0041 до U + 005A для безударных букв верхнего регистра и от U + 0061 до U + 007A для безударных букв lo. были буквы в регистре.

Обычные символы

Помимо цифр и букв без ударения, многие символы OCR-A имеют очевидные кодовые точки в ASCII. Большинство из них, включая все акцентированные буквы OCR-A, имеют очевидные кодовые точки в Unicode.

Дополнительные коды OCR-A на основе ASCII и Unicode
Name	Glyph	Unicode
Exclamation Mark		U + 0021
Quotation Mark		U + 0022
Знак числа		U + 0023
Знак доллара		U + 0024
Знак процента		U + 0025
Амперсанд		U + 0026
Апостроф		U + 0027
Левая скобка		U + 0028
Правая скобка		U + 0029
Звездочка		U + 002A
Плюс		U + 002B
Запятая		U + 002C
Дефис-минус		U + 002D
Полная остановка (точка)		U + 002E
Знак косой черты		U + 002F
Двоеточие		U + 003A
Точка с запятой		U + 003B
Знак меньше		U + 003C
Знак равенства		U + 003D
Знак больше		U + 003E
Знак вопроса		U + 003F
Коммерческий адрес		U + 0040
Левая квадратная скобка		U + 005B
Обратный знак солидуса (обратная косая черта)		U + 005C
Правая квадратная скобка		U + 005D
Circumflex Accent		U + 005E
Левая фигурная скобка		U + 007B
Правая фигурная скобка		U + 007D
Знак фунта (стерлингов)		U + 00A 3
Знак йены		U + 00A5
Латинская заглавная буква A с дирезисом		U + 00C4
Латинская заглавная буква A с кольцом сверху		U + 00C5
Латинская заглавная буква AE		U + 00C6
Заглавная латинская буква N с тильдой		U + 00D1
Заглавная латинская буква O с символом Дьереза		U + 00D6
Заглавная латинская буква O со штрихом		U + 00D8
Латинская заглавная буква U с символом Dieresis		U + 00DC

Остальные символы

Линотип закодировал оставшиеся символы OCR-A следующим образом:

Дополнительные символы OCR-A
Имя	Глиф	Unicode	Имя Unicode
Длинная вертикальная метка		U + 007C	Вертикальная линия

Дополнительные символы

Шрифты, восходящие к работам Тора Лиллквиста и Ричарда Б. Уэльса, определяют четыре символа не в OCR-A, чтобы заполнить набор символов ASCII. Эти фигуры используют тот же стиль, что и фигуры символов OCR-A. Это: