
Cognitive Scanpack побеждает ABBYY FineReader
В задачах построения сложных информационных и аналитических систем мы часто сталкиваемся с проблемой обмена данными между различными подсистемами. Нередко самая простая задача импорта/экспорта данных из одной системы в другую приводит к необходимости серьезных разработок модулей на стыке подсистем. Задачу можно существенно облегчить, если заранее рассчитывать на то, что данные определенного класса будут перемещаться между подсистемами, и заложить в этих подсистемах возможность воспринимать извне и отдавать наружу данные в стандартном формате импорта/экспорта. В определенных случаях этот формат вообще может использоваться в качестве внутреннего формата данных в подсистеме.
Нами разработан специальный формат файлов, основанный на языке XML и предназначенный для хранения структурированных данных. Формат является средством обмена между различными информационными системами и/или подсистемами, как уже созданными, так и, по возможности, теми, что будут созданы в будущем.
Сам по себе стандарт XML является очень обобщенным форматом данных, он создан консорциумом, состоящим из многих компаний, и в него вошло очень много различных концепций и идей, подчас довольно далеких друг от друга.
Разработанный нами новый формат дополняет язык XML семантикой, которая существует в области разработки информационных систем, основанных на понятии "документ", таких как: потоковый ввод структурированных документов, электронные архивы, системы документооборота и делопроизводства, редакторы и дизайнеры бумажных и электронных форм, генераторы отчетов.