OCR CuneiForm 12.0 - одна из немногих систем с открытым исходным кодом для распознавания текста

для раздела Новости Software
На рынке систем для оптического распознавания одним программным продуктом стало больше. Это первая из немногих некоммерческая разработка, которая в полной мере поддерживает работу с русским языком. OCR CUNEIFORM - это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. Обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним. Отличается от других программ этого класса высоким уровнем распознавания, особенно текстов низкого качества и наличием встроенных мастеров - помощников в работе; мощным встроенным текстовым редактором.

Основные возможности OCR CuneiForm выглядят следующим образом:

  • высокое качество распознавания
  • высокая скорость работы
  • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20)
  • работа в режиме автоматической фрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации
  • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки
  • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе
  • полное сохранение топологии страницы
  • поддержка пакетного режима сканирования и распознавания
  • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой
  • встроенный текстовый редактор для работы с распознанным текстом
  • совмещенный показ изображений и результатов распознавания

Интерфейсом и удобством работы программа пока похвастаться не может, однако разработчики работают в этом направлении. Кроме того, это проект с открытым исходным кодом, а значит оказать помощь в его разработке может любой желающий, имеющий достаточно опыта в данном направлении.

  • OCR CuneiForm 12.0 (33.4 MB, open source).
Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.4 из 5
голосов: 37

Возможно вас заинтересует

Сейчас обсуждают