Оптическое распознавание меток

редактировать

Оптическое распознавание меток (также называется считывание оптических меток и OMR ) - это процесс сбора данных, помеченных человеком, из форм документов, таких как опросы и тесты. Они используются для чтения анкет, экзаменационных работ с несколькими вариантами ответов в виде линий или заштрихованных областей.

Содержание
  • 1 Фон OMR
    • 1.1 Оптический лист ответов
    • 1.2 Чтение
    • 1.3 Ошибки
  • 2 Программное обеспечение OMR
    • 2.1 Коммерческое программное обеспечение OMR
    • 2.2 Библиотеки разработки OMR
    • 2.3 Программное обеспечение OMR с открытым исходным кодом
  • 3 История
  • 4 Использование
    • 4.1 Приложения
    • 4.2 Типы полей
    • 4.3 Возможности / требования
    • 4.4 Недостатки
  • 5 См. Также
  • 6 Ссылки
Фон OMR
Тестовая форма OMR с регистрационными метками и выпадающими цветами, предназначенная для сканирования специальным устройством OMR

Многие традиционные устройства OMR работают со специальным устройством сканера, которое светит луч света на бланк. Контрастная отражательная способность в заранее определенных положениях на странице затем используется для обнаружения этих отмеченных областей, поскольку они отражают меньше света, чем пустые области бумаги.

Некоторые устройства OMR используют формы, которые предварительно напечатаны на «трансоптической» бумаге и измеряют количество света, проходящего через бумагу; таким образом, отметка на обеих сторонах бумаги уменьшит количество света, проходящего через бумагу.

В отличие от специального устройства OMR, программное обеспечение OMR для настольных компьютеров позволяет пользователю создавать свои собственные формы в текстовом редакторе и распечатывать их на лазерном принтере. Затем программное обеспечение OMR работает с обычным настольным сканером изображений с устройством подачи документов для обработки форм после заполнения.

OMR обычно отличается от оптического распознавания символов (OCR) тем, что не требуется сложный механизм распознавания образов. То есть метки построены таким образом, что вероятность неправильного чтения меток мала. Это действительно требует, чтобы изображение имело высокую контрастность и легко узнаваемую или несущественную форму. Поле, связанное с OMR и OCR, - это распознавание штрих-кодов, таких как штрих-код UPC на упаковке продукта.

Одним из наиболее известных применений оптического распознавания знаков является использование карандаша №2 (HB в Европе) пузыря оптических листов ответов в множественном выборе вопрос экзамены. Учащиеся отмечают свои ответы или другую личную информацию темными кружками, отмеченными на заранее распечатанном листе. После этого лист автоматически классифицируется сканирующим устройством. В Соединенных Штатах и ​​большинстве европейских стран горизонтальная или вертикальная «галочка» в прямоугольной «ромбовидной форме» является наиболее часто используемым типом формы OMR; Наиболее распространенным приложением в Соединенном Королевстве является форма национальной лотереи Великобритании. Таблетки в форме ромбов являются более поздней технологией и имеют то преимущество, что их легче маркировать и легче стирать. Большие «пузырьковые» метки - это технология, унаследованная от очень ранних машин OMR, которые были настолько нечувствительны, что для надежности требовалась большая метка. В большинстве азиатских стран для заполнения оптического листа ответов используется специальный маркер. Учащиеся также отмечают ответы или другую информацию затемненными кружками, отмеченными на заранее распечатанном листе. Затем лист автоматически оценивается на сканирующем устройстве.

Многие современные приложения OMR требуют заполнения специализированных форм. Эти формы оптимизированы для компьютерного сканирования, с тщательной регистрацией при печати и тщательным дизайном, так что двусмысленность сведена к минимуму. Из-за чрезвычайно низкой частоты ошибок, низкой стоимости и простоты использования OMR является популярным методом подсчета голосов.

Метки OMR также добавляются к элементам физической почты, чтобы можно было использовать оборудование для вставки папок. Метки добавляются к каждой (обычно лицевой / нечетной) странице почтового документа и состоят из последовательности черных штрихов, которые сканирует устройство для вставки папок, чтобы определить, когда письмо следует сложить, а затем вставить в конверт.

Оптический лист ответов

Ответ на математический вопрос SAT, отмеченный на оптическом листе ответов

Оптический лист ответов или пузырьковый лист - это особый тип формы, используемый в вопросе с несколькими вариантами ответов экзаменах. Оптическое распознавание меток используется для обнаружения ответов. Самой известной компанией в США, занимающейся оптическими листами ответов, является Scantron Corporation, хотя для некоторых видов использования требуется собственная индивидуальная система.

Оптические листы ответов обычно имеют набор пустых овалов. или коробки, соответствующие каждому вопросу, часто на отдельных листах бумаги. Штрих-коды могут пометить лист для автоматической обработки, и каждая серия заполненных овалов будет возвращать определенное значение при считывании. Таким образом, ответы учащихся могут быть записаны в цифровом виде или идентифицированы.

Чтение

Первые оптические листы с ответами были прочитаны путем прохождения света через лист и измерения того, какая часть света была заблокирована, с помощью фотолабор на противоположной стороне. Поскольку некоторые фотолаборы в основном чувствительны к синему концу видимого спектра, нельзя использовать синие ручки, поскольку синие чернила отражают и пропускают синий свет. Из-за этого для заполнения пузырьков пришлось использовать карандаши номер два - графит - очень непрозрачное вещество, которое поглощает или отражает большую часть света, который

Современные оптические листы ответов читаются на основе отраженного света, измеряющего яркость и темноту. Их не нужно заполнять карандашом номер два, хотя они рекомендуются по сравнению с другими типами (это из-за более светлых отметок, сделанных карандашами с большим номером, и пятен от карандашей номер 1). Черные чернила будут считываться, хотя многие системы будут игнорировать метки того же цвета, в котором печатается бланк. Это также позволяет использовать оптические листы с ответами на двух сторонах, потому что метки, сделанные на противоположной стороне, не будут мешать показаниям отражательной способности в такой степени, как с показаниями непрозрачности.

Большинство систем допускают человеческую ошибку при неточном заполнении овалов - до тех пор, пока они не попадают в другие овалы и овал почти заполнен, сканер определит его как заполненный.

Ошибки

Оптические листы ответов могут быть напечатаны неправильно, так что все овалы будут считаться заполненными. Это происходит, если очертания овалов слишком толстые или неровные. Во время президентских выборов в США в 2008 г. это произошло с более чем 19 000 открепительных удостоверений в округе Джорджия округа Гвиннетт и было обнаружено примерно через 10 000 уже были возвращены. Небольшая разница не была очевидна для невооруженного глаза и не была обнаружена до тех пор, пока в конце октября не был проведен тестовый прогон. Это потребовало, чтобы все бюллетени были переведены на правильно напечатанные изолированными сотрудниками комиссии по выборам под пристальным наблюдением членов политических партий Демократической и Республиканской (но не других ) политических партий, а также депутатов округа Шериф . По закону передача не могла произойти до дня выборов (4 ноября).g

Программное обеспечение OMR
Обычная бумажная форма OMR, без регистрационных знаков и выпадающих цветов, разработан для сканирования с помощью сканера изображений и программного обеспечения OMR

Программное обеспечение OMR - это компьютерное программное приложение, которое делает возможным OMR на настольном компьютере с помощью сканера изображений для обработки опросов, тестов, ведомостей посещаемости, контрольных списков, и другие формы на обычной бумаге, напечатанные на лазерном принтере.

Программное обеспечение OMR используется для сбора данных из листов OMR. Во время сбора данных сканирующие устройства фокусируются на многих факторах, таких как толщина бумаги, размеры листа OMR и шаблон проектирования.

Коммерческое программное обеспечение OMR

Одним из первых пакетов программного обеспечения OMR, в котором использовались изображения с обычных сканеров изображений, был Remark Office OMR, созданный Gravic, Inc. (первоначально называвшийся Principia Products, Inc.). Remark Office OMR 1.0 был выпущен в 1991 году.

Потребность в программном обеспечении OMR возникла из-за того, что в ранних системах оптического распознавания меток использовались специальные сканеры и специальные предварительно напечатанные формы с выпадающими цветами и регистрационными метками. Такие формы обычно стоят от 0,10 до 0,19 доллара за страницу. Напротив, пользователи программного обеспечения OMR создают свои собственные формы с распознаванием знаков с помощью текстового процессора или встроенного редактора форм, распечатывают их локально на принтере и могут сэкономить тысячи долларов на большом количестве форм.

Идентификация оптические метки в форме, например для обработки бланков переписи, предлагались многими компаниями, занимающимися обработкой бланков (пакетный захват транзакций) с конца 1980-х годов. В основном это основано на битональном изображении и количестве пикселей с минимальным и максимальным количеством пикселей для устранения посторонних меток, таких как те, которые стираются грязным ластиком, которые при преобразовании в черно-белое изображение (битональное) могут выглядеть как допустимые метки.. Таким образом, этот метод может вызвать проблемы, когда пользователь передумает, и поэтому некоторые продукты начали использовать оттенки серого, чтобы лучше идентифицировать цель маркера - внутренне скантрон и сканеры NCS использовали оттенки серого.

Программное обеспечение OMR также используется для добавления меток OMR к почтовым документам, чтобы их можно было сканировать с помощью устройства для вставки папок. Примером программного обеспечения OMR является Mail Markup от британского разработчика Funasset Limited. Это программное обеспечение позволяет пользователю настраивать и выбирать последовательность OMR, а затем применять метки OMR к почтовым документам перед печатью.

OMR Development Libraries

КомпанияПродуктГод основания
ABBYYABBYY FineReader Engine1993
AccusoftFormFix1991
Aspose.NET OMR Reader Parser2001
GDPicture. NET OMR и SDK для распознавания шаблонов2003
LEAD TechnologiesLEADTOOLS1990
VintaSoftForms Processing.NET Plug-in2001

Программное обеспечение OMR с открытым исходным кодом

Некоторое программное обеспечение OMR, разработанное и распространяемое под бесплатными лицензиями или лицензиями с открытым исходным кодом:

Список программного обеспечения OMR
ИмяСоздательПримечанияПоследняя стабильная версияСтоимость (US $ )Лицензия на программное обеспечение Открытый исходный код
FormScannerАльберто Borsettaмультиплатформенное приложение Java, поддерживает пользовательские формы2017-06-07БесплатноGPLv3 Да
queXFАвстралийский консорциум социальных и политических исследований Incorporatedможет использоваться самостоятельно или совместно. соединение с опросами, экспортированными из LimeSurvey 2019-05-13БесплатноGPLv2 Да
Удай OMRАадитешвар Сет2007БесплатноGPLv2 Да
Общая система вопросников (SQS)2016БесплатноЛицензия Apache v2.0Да
Автоматический множественный выборAlexis Bienvenüeдля тестов класса, с форматированием LaTeX29.12.2018БесплатноGPLv2 Да
Moodle Quiz OMRонлайн-поддержка автономных викторин, проводимых на листах OMRБесплатноGPLv3 Да
SDAPS: Скрипты для сбора данных с бумажными- на основе опросовБенджамин Бергдля опросов, поддерживает документы в формате LaTeX и ODT2019-06-02БесплатноGPLv3 Да
OMR Mark EngineРеализация C # поддерживает массовое сканирование с помощью настраиваемых форм2015БесплатноЛицензия Apache v2.0Да
G'n'T EvalСтефан Бройниг2013БесплатноЛицензия ISC Да
Его tory

Оптическое распознавание метки (OMR) - это сканирование бумаги для обнаружения наличия или отсутствия метки в заданном месте. Оптическое распознавание знаков развилось из нескольких других технологий. В начале 19-го и 20-го веков были выданы патенты на машины, которые помогли бы слепым.

OMR теперь используется как устройство ввода для ввода данных. Двумя ранними формами OMR являются бумажная лента и перфокарты, которые используют фактические отверстия, пробитые в носителе, а не заполненные карандашом кружки на носителе. Бумажная лента использовалась еще в 1857 году как устройство ввода для телеграфа. Перфокарты были созданы в 1890 году и использовались в качестве устройств ввода для компьютеров. Использование перфокарт сильно сократилось в начале 1970-х с появлением персональных компьютеров. В современных OMR, где распознается присутствие карандаша, заполненного пузырьком, распознавание выполняется с помощью оптического сканера.

Первым сканером распознавания меток была машина оценки теста IBM 805 ; эти метки считываются путем измерения электропроводности графитового грифеля карандаша с помощью пар проволочных щеток, сканировавших страницу. В 1930-х Ричард Уоррен из IBM экспериментировал с системами оптического распознавания меток для тестовой оценки, как описано в патентах США 2150256 (подана в 1932 году, выдана в 1939 году) и 2,010653 (подана в 1933 году, выдана в 1935 году).. Первый успешный оптический сканер считывания меток был разработан Эвереттом Франклином Линдквистом, как описано в патенте США 3050248 (подана в 1955 г., выдана в 1962 г.). Линдквист разработал множество стандартизированных образовательных тестов и нуждался в машине для подсчета очков лучше, чем тогда стандартный IBM 805. Права на патенты Линдквиста принадлежали Исследовательскому центру измерений до 1968 года, когда Университет Айовы продал операция Westinghouse Corporation.

. В тот же период IBM также разработала успешную оптическую машину для проверки распознавания меток, как описано в патенте США 2944734 (подана в 1957 г., выдана в 1960 г.)). В 1962 году компания IBM представила это устройство как оптический считыватель меток IBM 1230. Это и множество связанных с ним компьютеров позволили IBM перенести широкий спектр приложений, разработанных для своих машин распознавания меток, на новую оптическую технологию. Эти приложения включали в себя различные формы управления запасами и отчетов о проблемах, большинство из которых имели размеры стандартной перфокарты.

, в то время как другие участники образовательного тестирования сосредоточились на продаже услуг сканирования, Scantron Корпорация, основанная в 1972 году, имела другую модель; он будет распространять недорогие сканеры в школах и получать прибыль от продажи тестовых форм. В результате многие люди стали думать обо всех формах, воспринимающих метки (независимо от того, воспринимаются они оптически или нет) как о скантронных формах. Scantron действует как дочерняя компания MF Worldwide (MFW) и предоставляет системы и услуги тестирования и оценки, а также услуги по сбору и анализу данных для образовательных учреждений, предприятий и правительства.

В 1983 году Westinghouse Learning Corporation была приобретена National Computer Systems (NCS). В 2000 году NCS была приобретена Pearson Education, где технология OMR составила ядро ​​группы управления данными Pearson. В феврале 2008 г. MF Worldwide приобрела группу управления данными у Pearson; группа теперь является частью бренда Scantron.

OMR использовался во многих ситуациях, как указано ниже. Использование OMR в системах инвентаризации было переходом между перфокартами и штрих-кодами и не так часто используется для этой цели. Однако OMR по-прежнему широко используется для опросов и тестирования.

Использование

Использование OMR не ограничивается школами или агентствами по сбору данных; многие предприятия и учреждения здравоохранения используют OMR для оптимизации процессов ввода данных и уменьшения ошибок ввода. Технологии OMR, OCR и ICR позволяют собирать данные из бумажных форм. OMR также может быть выполнен с использованием сканера OMR (дискретная считывающая головка) или сканера изображений.

Приложения

Форма ставок OMR, используемая в Japan Racing Association Ипподром Фукусима, Япония. Билет для ставок с использованием этой формы.

Есть много других приложений для OMR, например:

Типы полей

OMR имеет различные поля, чтобы указать желаемый формат. Эти поля включают:

  • Несколько, где есть несколько вариантов, но выбран только один. Например, форма может запрашивать один из вариантов ABCDE; 12345; полностью отказаться ree, не согласен, безразличен, согласен, полностью согласен; или аналогичный.
  • Сетка: пузыри или линии настроены в формате сетки, чтобы пользователь мог ввести номер телефона, имя, идентификационный номер и т. д.
  • Добавить, просуммировать отвечает на одно значение
  • логическое, отвечает да или нет на все, что применяется
  • двоичное, отвечает да или нет только на одно поле
  • пунктирных линий, разработано Smartshoot OMR, позволяют пропускать границы, как при традиционном падении цвета.

Возможности / требования

В прошлом и в настоящее время для некоторых систем OMR требуется специальная бумага, специальные чернила и специальный считыватель ввода (Bergeron, 1998). Это ограничивает типы вопросов, которые можно задать, и не допускает большого разнообразия при вводе формы. Прогресс в OMR теперь позволяет пользователям создавать и распечатывать свои собственные формы и использовать сканер (желательно с устройством подачи документов) для чтения информации. Пользователь может расположить вопросы в формате, который соответствует их потребностям, но при этом легко вводить данные. Системы OMR достигают стопроцентной точности и в среднем распознают отметки в 5 миллисекунд. Пользователи могут использовать квадраты, круги, эллипсы и шестиугольники для зоны отметки. Затем программное обеспечение можно настроить на распознавание заполненных пузырьков, крестиков или галочек.

OMR также можно использовать в личных целях. На рынке есть многофункциональные принтеры, которые будут печатать фотографии, выбранные пользователем, путем заполнения пузырьков для выбора размера и выбора бумаги на напечатанном индексном листе. После того, как лист заполнен, человек помещает лист на сканер для сканирования, и принтер печатает фотографии в соответствии с указанными отметками.

Недостатки

Также есть некоторые недостатки и ограничения OMR. Если пользователь хочет собрать большие объемы текста, OMR усложняет сбор данных. Также существует вероятность пропуска данных в процессе сканирования, и неправильные или ненумерованные страницы могут привести к их сканированию в неправильном порядке. Кроме того, если не будут приняты меры предосторожности, страницу можно будет повторно сканировать, что приведет к дублированию данных и искажению данных.

В результате широкого распространения и простоты использования OMR стандартизованные исследования могут состоять в основном из нескольких: вопросы выбора, меняющие характер проверяемого.

См. Также
Списки
Ссылки
Последняя правка сделана 2021-06-01 13:34:40
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте