Автор (ы) | Cognitive Technologies |
---|---|
Разработчик (и) | Cognitive Технологии |
Первоначальный выпуск | Источник 2 апреля 2008 г.; 12 лет назад (02.04.2008) |
Стабильный выпуск | 1.1 / 19 апреля 2011 г.; 9 лет назад (2011-04-19) |
Написано на | C и C ++ |
Операционная система | Кросс-платформенная |
Тип | Оптическое распознавание символов |
Лицензия | Бесплатное / лицензии BSD |
Веб-сайт | панель запуска.net / cuneiform-linux |
CuneiForm Cognitive OpenOCR - это свободно распространяемая система распознавания текста с открытым исходным кодом, разработанная Российская компания-разработчик программного обеспечения Cognitive Technologies.
CuneiForm OCR была разработана Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с самыми популярными моделями сканеров, МФУ и программного обеспечения в России и других странах. мира: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др.. В 2008 году Cognitive Technologies открыла исходные коды программы.
CuneiForm - это система, предназначенная для преобразования электронных копий бумажных документов и файлов изображений в редактируемую форму без изменения структуры и исходных шрифтов документа в автоматическом или полуавтоматическом режиме. Система включает в себя два компонента для разовой и пакетной обработки электронных документов.
Список языков, поддерживаемых системой:
Кроме того, система поддерживает смесь русского и английского языков. Распознавание других смешанных языков поддерживается только в ветке, разработанной Андреем Боровским в 2009 году. Обучить систему распознавать другие языки сложно, поскольку каждый язык связан с файлом данных, структура и метод разработки которого не раскрываются. разработчики.
1993 - Cognitive Technologies подписала OEM-контракт с Corel, в соответствии с условиями которого библиотека Cognitive распознавания была встроена в Corel Draw 3.0 (и более поздние версии) пакет, популярный в издательской сфере.
1994 - Контракт с Hewlett-Packard на оборудование всех сканеров, импортируемых в Россию с CuneiForm OCR. Это был первый контракт HP с российской компанией-разработчиком программного обеспечения.
1995 - Контракт с японской корпорацией Epson на поставку их сканеров с CuneiForm OCR. OEM-контракт был подписан с крупнейшим в мире производителем факсов, лазерных принтеров, сканеров и другой оргтехники - Brother Corporation. Согласно соглашению, новый роликовый сканер Brother IC-150 был оснащен программным обеспечением Cognitive для сканирования и распознавания по всему миру.
1996 г. - OEM-соглашение с одним из крупнейших мировых производителей мониторов, факсов, лазерных принтеров, МФУ и другого офисного оборудования - Samsung Information Systems America. Согласно соглашению, новое многофункциональное устройство Samsung OFFICE MASTER OML-8630A должно было быть оснащено системой оптического распознавания символов Cognitive Cuneiform LE во всем мире.
Адаптивное распознавание - метод, основанный на сочетании двух типов алгоритмов распознавания печатных символов: мультифонтного и омнифонного. Система генерирует внутренний шрифт для каждого входного документа на основе хорошо напечатанных символов с использованием динамической настройки (адаптации) к конкретным входным символам. Таким образом, метод сочетает в себе всесторонность и технологичность подхода омнифонта с высокой точностью распознавания шрифтов, что значительно повышает скорость распознавания.
1997 - Первое использование технологий на основе нейронных сетей в CuneiForm. Алгоритмы, использующие нейронные сети для распознавания символов, разрабатываются следующим образом: изображение символа, которое необходимо распознать (шаблон), уменьшается до определенного стандартного размера (нормализуется). Значения яркости нормализованного шаблона используются в качестве входных параметров для нейронной сети. Количество выходных параметров нейронной сети равно количеству распознанных символов. Результатом распознавания является символ, который соответствует максимальному значению выходного вектора нейронной сети.
1999
2001 - OEM-контракт с Canon на сканеры и оборудование многофункциональных устройств с программным обеспечением Cognitive Technologies CuneiForm OCR для Восточной Европы