GreenData вывела на рынок решение GreenData.Mind IDP — систему интеллектуальной обработки документов (IDP), которая на базе ИИ распознаёт, классифицирует и извлекает данные из широкого спектра типовых и нетиповых документов для автоматизации документооборота. Система ориентирована на компании, которым нужна не вся платформа GreenData.Mind, а именно прикладной инструмент для обработки документов.
Решение автоматически определяет тип документа, извлекает ключевые атрибуты и может декомпозировать многостраничные файлы на логические части. Результаты обработки передаются в корпоративные системы для последующей верификации, маршрутизации и хранения.
В основе продукта лежит поэтапный пайплайн: сначала классификация и определение структуры документа, затем распознавание и извлечение данных. Для этого используются модели, отвечающие за классификацию и структурирование, а также OCR нового поколения на базе визуальных языковых моделей (VLM).
Модели дообучаются на внутренних датасетах GreenData. Для нетиповых документов применяются большие языковые модели (LLM).
GreenData.Mind IDP поддерживает обработку PDF, изображений, электронных таблиц, текстовых документов, презентаций и архивов. Инструмент можно использовать как фронт для корпоративных ECM/ERP/CRM.
«Мы видим отдельный спрос именно на IDP-системы. Для заказчиков искусственный интеллект интересен, прежде всего, как прикладной инструмент, который решает конкретную задачу, например, сокращает ручной ввод данных или ускоряет проверку документов и снижает нагрузку на сотрудников. Более того, IDP решения позволяют компаниям оцифровать и архивные документы – это подготавливает площадку и упрощает внедрение других технологий, например, ИИ-ассистентов. Поэтому GreenData.Mind IDP мы представляем как самостоятельное решение с готовыми сценариями, понятной областью применения и возможностью дальнейшей адаптации под оперативные бизнес-задачи конкретной организации», — отмечает Александр Перевалов, руководитель группы разработки искусственного интеллекта GreenData.