Cognitive Scanpack побеждает ABBYY FineReader
Cognitive OpenOCR (Cuneiform) — это система оптического распознавания разработанная крупнейшим российским разработчиком программного обеспечения Cognitive Technologies, которая обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов, получаемых, например, со сканера или факса, в редактируемый текст для последующей работы с ним в текстовых редакторах. В настоящее время система переведена с статус free-ware, а её развитие осуществляется сообществом разработчиков Open Sources при поддержке компании Cognitive Technologies.
Открытие кода OCR Cuneiform — очередной этап программы «Распознавание должно быть на каждом компьютере», реализуемой Cognitive Technologies. Цель программы сделать технологию OCR доступной для широкого круга пользователей за счет открытости кода и нулевой стоимости ПО.
Для распространения программы выбрана лицензия BSD (Berkeley Software Distribution). Выбор лицензии BSD для открытия ядра OCR Cuneiform был обусловлен в первую очередь научно-исследовательской и образовательной направленностью проекта. В его рамках предполагается получить новые идеи и методы, которые смогут значительно усилить систему и повысить привлекательность OCR-технологий как сервиса. Для общества статус BSD означает возможность использования результатов работы в коммерческих проектах.
После открытия исходных кодов ядра распознавания Cuneiform сообществом уже была успешно решена сложнейшая задача — портирование системы под Linux. Теперь после открытия кодов интерфейса системы, перед участниками проекта стоит задача создания системы распознавания текстов с открытым исходным кодом, ориентированной на конечных пользователей, работающих в наиболее распространенных в мире ОС.
Загрузить систему Cognitive OpenOCR (CuneiForm)
Скачать исходный код программы Cognitive OpenOCR (CuneiForm)
Скачать исходный код интерфейса Cognitive OpenOCR (CuneiForm)
Скачать документацию на библиотеки ядра распознавания