CuneiForm (программное обеспечение)

редактировать
CuneiForm
Автор (ы) Cognitive Technologies
Разработчик (и) Cognitive Технологии
Первоначальный выпускИсточник 2 апреля 2008 г.; 12 лет назад (02.04.2008)
Стабильный выпуск 1.1 / 19 апреля 2011 г.; 9 лет назад (2011-04-19)
Написано наC и C ++
Операционная система Кросс-платформенная
Тип Оптическое распознавание символов
Лицензия Бесплатное / лицензии BSD
Веб-сайтпанель запуска.net / cuneiform-linux Измените это в Викиданных

CuneiForm Cognitive OpenOCR - это свободно распространяемая система распознавания текста с открытым исходным кодом, разработанная Российская компания-разработчик программного обеспечения Cognitive Technologies.

CuneiForm OCR была разработана Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с самыми популярными моделями сканеров, МФУ и программного обеспечения в России и других странах. мира: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др.. В 2008 году Cognitive Technologies открыла исходные коды программы.

Содержание

  • 1 Возможности
  • 2 История
  • 3 Перспективы развития
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки

Возможности

CuneiForm - это система, предназначенная для преобразования электронных копий бумажных документов и файлов изображений в редактируемую форму без изменения структуры и исходных шрифтов документа в автоматическом или полуавтоматическом режиме. Система включает в себя два компонента для разовой и пакетной обработки электронных документов.

Список языков, поддерживаемых системой:

Кроме того, система поддерживает смесь русского и английского языков. Распознавание других смешанных языков поддерживается только в ветке, разработанной Андреем Боровским в 2009 году. Обучить систему распознавать другие языки сложно, поскольку каждый язык связан с файлом данных, структура и метод разработки которого не раскрываются. разработчики.

История

1993 - Cognitive Technologies подписала OEM-контракт с Corel, в соответствии с условиями которого библиотека Cognitive распознавания была встроена в Corel Draw 3.0 (и более поздние версии) пакет, популярный в издательской сфере.

1994 - Контракт с Hewlett-Packard на оборудование всех сканеров, импортируемых в Россию с CuneiForm OCR. Это был первый контракт HP с российской компанией-разработчиком программного обеспечения.

1995 - Контракт с японской корпорацией Epson на поставку их сканеров с CuneiForm OCR. OEM-контракт был подписан с крупнейшим в мире производителем факсов, лазерных принтеров, сканеров и другой оргтехники - Brother Corporation. Согласно соглашению, новый роликовый сканер Brother IC-150 был оснащен программным обеспечением Cognitive для сканирования и распознавания по всему миру.

1996 г. - OEM-соглашение с одним из крупнейших мировых производителей мониторов, факсов, лазерных принтеров, МФУ и другого офисного оборудования - Samsung Information Systems America. Согласно соглашению, новое многофункциональное устройство Samsung OFFICE MASTER OML-8630A должно было быть оснащено системой оптического распознавания символов Cognitive Cuneiform LE во всем мире.

  • OEM-соглашение с ведущим мировым производителем офисного оборудования Xerox об оснащении многофункциональных устройств Xerox 3006 и Pro-610 системой распознавания CuneiForm.
  • Выпуск CuneiForm '96 OCR с первыми адаптивными алгоритмами распознавания в мир.

Адаптивное распознавание - метод, основанный на сочетании двух типов алгоритмов распознавания печатных символов: мультифонтного и омнифонного. Система генерирует внутренний шрифт для каждого входного документа на основе хорошо напечатанных символов с использованием динамической настройки (адаптации) к конкретным входным символам. Таким образом, метод сочетает в себе всесторонность и технологичность подхода омнифонта с высокой точностью распознавания шрифтов, что значительно повышает скорость распознавания.

1997 - Первое использование технологий на основе нейронных сетей в CuneiForm. Алгоритмы, использующие нейронные сети для распознавания символов, разрабатываются следующим образом: изображение символа, которое необходимо распознать (шаблон), уменьшается до определенного стандартного размера (нормализуется). Значения яркости нормализованного шаблона используются в качестве входных параметров для нейронной сети. Количество выходных параметров нейронной сети равно количеству распознанных символов. Результатом распознавания является символ, который соответствует максимальному значению выходного вектора нейронной сети.

  • Новое OEM-соглашение с Canon об оснащении многофункциональных устройств, импортируемых в Россию, системой CuneiForm;
  • Новый OEM-контракт с OKI Europe Limited на оснащение МФУ OKI FAX 4100 и OKI FAX 5200, импортируемых в Россию с система CuneiForm;
  • Первая OCR-система CuneiForm MMX Update для процессора Intel MMX;
  • Сканеры NeuHause поставляются с системой распознавания CuneiForm;
  • Первая в России система сетевого сканирования Версия CuneiForm 98 NEST.

1999

  • Новый OEM-контракт с компанией Olivetti на поставку импортируемых в Россию многофункциональных устройств с системой CuneiForm;
  • Дистрибьюторское соглашение с ведущим европейским дистрибьютором программного обеспечения. WSKA (Франция) о распространении OCR Cuneiform Direct в Европе;
  • Выпущена новая версия системы Cuneiform 2000, реализующая метод «когнитивного анализа TM»: экспертная система интегрирована в ядро ​​распознавания, который анализирует альтернативы оценивает результат каждого алгоритма обнаружения и выбирает лучший вариант.
  • Метод «Сегментация таблицы меридианов TM» разработан для повышения точности воссоздания исходной формы таблица в выходном документе;
  • Представлен механизм воссоздания формы исходного документа - «То, что вы сканируете, то и получаете TM» . Технология была направлена ​​на сохранение исходной формы отсканированного документа с точки зрения размещения его компонентов. Это особенно важно для документов со сложной топологией: многоколоночные тексты с заголовками, аннотациями, графическими иллюстрациями, таблицами и т. Д.

2001 - OEM-контракт с Canon на сканеры и оборудование многофункциональных устройств с программным обеспечением Cognitive Technologies CuneiForm OCR для Восточной Европы

Перспективы развития

  • 12 декабря 2007 г. Выпущена бесплатная -версия OCR CuneiForm и объявлено об открытии ее исходного кода.
  • 2 апреля 2008 г. исходные коды Cuneiform OCR публикуются под лицензией BSD, а осенью - исходные тексты интерфейса системы.
  • Последняя версия OpenSource версии для Windows не обновлялась с 14.02.2009. Эта версия больше не доступна для загрузки. Вместо этого версия от 11.11.2008 доступна на странице загрузки
  • . В 2009 году выпущены графические интерфейсы для открытой версии Cuneiform на основе библиотеки Qt 4 - Cuneiform-Qt. Начиная с версии 0.9.0 открытая версия для Linux может использоваться как библиотека.

См. Также

  • Puma.NET - это библиотека-оболочка для механизма распознавания Cognitive Technologies CuneiForm. Это упрощает включение функций распознавания текста в любое приложение.NET Framework 2.0 (или более поздней версии).

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-16 11:24:41
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте