Оптическое распознавание символов (блок Unicode)

редактировать
Блок символов Unicode
Оптическое распознавание символов
ДиапазонU + 2440..U + 245F. (32 кодовых точки)
ПлоскостьBMP
СкриптыОбщие
Наборы символовЭлементы управления OCR
Назначено11 кодовых точек
Не используется21 зарезервированных кодовых точек
История версий Unicode
1.0.011 (+11)
Примечание :

Оптический Распознавание символов - это блок Unicode, содержащий сигнальные символы для стандартов OCR.

Содержание
  • 1 Блок
  • 2 Подзаголовка
    • 2.1 OCR-A
    • 2.2 MICR
    • 2.3 OCR
  • 3 История
  • 4 Ссылки
Блок
Оптический символ Распознавание. Официальная таблица кодов Консорциума Unicode (PDF)
0123456789ABCDEF
U + 244x
U + 245x
Примечания
1.^Начиная с версии Unicode 13.0
2.^Серые области обозначают неназначенные кодовые точки
Подзаголовки

Блок оптического распознавания символов имеет три неофициальных подзаголовка (группы) в своей коллекции символов: OCR-A, MICR и OCR.

OCR-A

Подзаголовок OCR-A содержит шесть символов, взятых из шрифта OCR-A, описанного в стандарте ISO 1073-1: 1976: U + 2440 ⑀ OCR HOOK, U + 2441 ⑁ КРЕСЛО OCR, U + 2442 ⑂ ВИЛКА OCR, U + 2443 ⑃ ПЕРЕВЕРНУТАЯ ВИЛКА OCR, U + 2444 ⑄ РЕМНЯ OCR и U + 2445 ⑅ OCR BOW TIE. Галстук-бабочка OCR имеет информационный псевдоним "уникальная звездочка".

MICR

Подзаголовок MICR содержит четыре символа пунктуации для идентификаторов банковских чеков, взятых из распознавания символов магнитными чернилами шрифта E-13B (зашифрованный в стандарте ISO 1004: 1995): U + 2446 ⑆ ИДЕНТИФИКАЦИЯ БАНКА ОТДЕЛЕНИЯ OCR, U + 2447 ⑇ СУММА ПРОВЕРКИ OCR, U + 2448 ⑈ OCR DASH и U + 2449 ⑉ НОМЕР УЧЕТНОЙ ЗАПИСИ КЛИЕНТА OCR.

Последние два символа названы неверно (их имена были случайно переключены, когда они были названы в ISO / IEC 10646: 1993 ). Хотя их официальные названия остаются неизменными из-за политики стабильности Unicode, они оба исправили нормативные псевдонимы : U + 2448 ⑈ - это MICR ON US SYMBOL, а U + 2449 ⑉ - MICR DASH SYMBOL (стандарт отмечает, что «имена символов Unicode содержат несколько неправильных терминов»).

Эти символы ранее кодировались кодировкой ISO-IR-98, определенной в ISO 2033 : 1983, в котором они назывались просто от SYMBOL ONE до SYMBOL FOUR. Все четыре символа имеют информативные псевдонимы в диаграммах Unicode: «транзит», «сумма», «на нас» и «тире» соответственно.

OCR

Подзаголовок OCR состоит из одного символа: U + 244A ⑊ OCR DOUBLE BACKSLASH.

История

Следующие документы, относящиеся к Unicode, фиксируют цель и процесс определения конкретных символов в блоке оптического распознавания символов:

Версия Конечные точки кодаСчетчикL2 IDWG2 IDДокумент
1.0.0U + 2440..244A11(подлежит определению)
L2 / 10-416R Мур, Лиза (2010-11-09), «Consensus 125-C39», UTC # 125 / L2 # 222 Minutes, Создайте два формальных псевдонима: U + 2448 MICR ON US SYMBOL и U + 2449 MICR DASH SYMBOL для Unicode 6.1.
N4103 «T.3. Оптическое распознавание символов», неподтвержденный протокол совещания 58 WG 2, 03.01.2012
Ссылки
Последняя правка сделана 2021-06-01 13:33:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте