ContentCapture 14.8 интегрируется с российскими большими языковыми моделями YandexGPT и GigaChat. Совместное использование OCR-технологий и LLM внутри платформы обеспечивает высокоточное извлечение данных из неструктурированных документов, таких как технические инструкции и регламенты, а также из документов с вариативной структурой расположения данных: договоров, претензий, уставов, протоколов, доверенностей и резюме.
После предварительного обучения ContentCapture в связке с LLM достигает точности извлечения отдельных полей из неструктурированных документов до 98%. Новые функциональные возможности IDP-платформы востребованы для автоматизации работы вспомогательных подразделений, таких как бухгалтерия, HR, юридический блок, отдел продаж, служба поддержки клиентов и производственные подразделения.
Интеграция с облачной моделью позволяет заказчикам снизить стоимость обработки документов, особенно в условиях ограниченной инфраструктуры. В будущих релизах планируется реализация совместного использования ContentCapture с локальными языковыми моделями для работы в закрытом контуре.
IDP-платформа ContentCapture – один из флагманских продуктов Content AI. Она обеспечивает потоковую обработку документов любых форматов с их классификацией, извлечением, верификацией данных и их последующей отправкой в корпоративные информационные системы. ContentCapture широко востребована в проектах автоматизации работы с документами в крупных российских компаниях из банковского и нефтегазового сектора, промышленности, энергетики и других отраслей.
«Современные IDP-решения, включая ContentCapture, давно обеспечивают высокую точность обработки структурированных документов, таких как счета-фактуры, акты, УПД. Благодаря новым нейросетевым технологиям мы значительно продвинулись в извлечении данных из неструктурированных документов, – отметила генеральный директор Content AI Светлана Дергачева. – Мы протестировали работу ContentCapture с интегрированной LLM в нескольких проектах и увидели впечатляющие результаты».
«ContentCapture трансформируется в более производительную и интеллектуальную систему. Наша цель – создать платформу для комплексного решения задач обработки документов и автоматизации бизнес-процессов. Мы стремимся повысить интеграционные возможности продукта, чтобы он эффективно взаимодействовал с другими информационными системами предприятия, помогая нашим заказчикам достигать эффекта гиперавтоматизации», – добавил директор по продуктам Content AI Иван Волков.
IDP-платформа ContentCapture включена в реестр отечественного ПО и имеет подтвержденную маркировку продукта с искусственным интеллектом. Решение доступно для использования как в среде Windows, так и Linux.