В ходе ежегодного Конгресса NEFT 4.0 по цифровизации нефтегазовой отрасли России, специалисты технологического консорциума «РАМАКС» и российского разработчика систем управления данными Arenadata представили доклад «Искусственный интеллект в управлении данными» и продемонстрировали примеры интегрированных решений с нефтегазовой спецификой на базе корпоративной дата-платформы Memoza. Эти решения ИИ направлены на оптимизацию управления данными, автоматизацию рутинных процессов и повышение эффективности работы с большими объемами информации.
В своей презентации Иван Новоселов, генеральный директор компании DataCatalog, входящей в Arenadata, и советник по нефтегазовой индустрии вице-президента RAMAX Марат Зайдуллин рассказали о том, как данные становятся фундаментом для цифровой трансформации бизнеса нефтегазовых компаний и какую ключевую роль в этом процессе играет искусственный интеллект. В ходе презентации был представлен пример комплексного кейса использования ИИ в системе концептуального проектирования. ИИ-ассистент взаимодействует с базой знаний, генерирует вызовы функций редактора и смежных систем, а также использует специализированные агенты для выполнения задач. Это позволяет значительно ускорить процесс проектирования и повысить точность работы с данными.
Марат Зайдуллин подчеркнул, что эффективное управление данными является основой для повышения конкурентоспособности и устойчивости бизнеса в условиях стремительного развития технологий. Особо он отметил такие возможности, как:
- Использование генеративного ИИ и языковых моделей для автоматизации рутинных процессов, таких как анализ инженерной документации, подготовка отчетов и автопротоколирование.
- Внедрение интеллектуальных решений для контроля качества данных, построения сквозных процессов и интеграции разнородных систем.
- Применение ИИ-инструментов для виртуализации данных, каталогизации и управления данными.
В качестве примера, Марат рассказал о решении Memoza LLM — это корпоративная дата-платформа с интегрированным модулем взаимодействия с данными через большие языковые модели (LLM). Memoza позволяет автоматизировать обработку данных, создавать диаграммы по текстовым запросам и управлять метаданными.
В своей части доклада Иван Новоселов подчеркнул ключевую роль качественного управления данными для эффективной работы ИИ. Он отметил, что успешное применение искусственного интеллекта напрямую зависит от трёх фундаментальных характеристик данных:
- Полнота и релевантность — данные должны охватывать все возможные сценарии работы модели.
- Актуальность — устаревшая информация снижает точность прогнозов, особенно в динамичных условиях.
- Чистота — отсутствие дубликатов, ошибок разметки и артефактов, которые могут искажать результаты.
Особое внимание было уделено технической совместимости данных с инструментами обработки, что особенно важно при обучении нейросетей. Ведь именно эти факторы определяют способность ИИ-систем к точному прогнозированию и анализу.
Также Иван Новоселов поговорил со слушателям о следующих передовых разработках:
- Arenadata Catalog — инструмент для управления качеством данных, построения data lineage и ведения бизнес-глоссариев. Решение обеспечивает прозрачность происхождения данных и их надежность для принятия управленческих решений.
- Arenadata Agent (ADA) — ИИ-агент нового поколения, который помогает автоматизировать сложные сценарии управления данными, включая миграцию SQL-кода, анализ изображений и мониторинг кластеров СУБД.
- AI Data Steward — это интеллектуальный режим работы ADA, который выступает виртуальным помощником по управлению корпоративными данными в Arenadata Catalog. Используя концептуальную модель и существующие описания, система анализирует недостаточно документированные объекты и предлагает дата-стюарду обоснованные гипотезы об их назначении, взаимосвязях и других характеристиках. Например, для таблиц ADA может автоматически проверять полноту заполнения полей, соответствие именования (префиксов/суффиксов) принятой типологии (hub, bridge, satellite и др.), а также анализировать смысловую согласованность данных. Это позволяет существенно упростить процесс описания и классификации данных, повышая общее качество метаинформации в каталоге. Особенность подхода заключается в способности системы генерировать содержательные предположения о природе анализируемых объектов, что помогает дата-стюардам принимать более обоснованные решения при работе с корпоративными данными.
Представленные решения на основе искусственного интеллекта открывают новые возможности для предприятий нефтегазовой отрасли, позволяя оптимизировать управление данными, автоматизировать рутинные процессы и повышать качество аналитики.
RAMAX и Arenadata продолжают активно развивать решения для цифровой трансформации нефтегазового сектора, предоставляя компаниям инструменты, позволяющие оперативно и бесшовно внедрять решения эффективного управления данными для повышения операционной эффективности, быстрой адаптации к изменениям на рынке и принятия обоснованных управленческих решений.