Приказ Госстандарта о введении в действие новых госстандартов ГОСТ Р ИСО/МЭК 24668-2022 "Информационные технологии. Искусственный интеллект. Структура управления процессами аналитики больших данных" и ГОСТ Р 70466-2022 "Информационные технологии. Эталонная архитектура больших данных. Часть 1. Структура и процесс применения" датирован 21 ноября и 8 ноября соответственно, однако их полный текст размещен на официальном сайте ведомства только 19 декабря текущего года. Документы вступают в силу в 2023 г.: ГОСТ Р ИСО/МЭК 24668-2022 с 1 января, а ГОСТ Р 70466-2022 - с 1 марта.
Раннее, в 2021 г., принят стандарт ГОСТ Р ИСО/МЭК 20546-2019 "Информационные технологии. Большие данные. Обзор и словарь". После его принятия председатель совета директоров Института развития информационного общества Юрий Хохлов анонсировал разработку еще восьми стандартов, посвященных аналитическим технологиям. Два из этих восьми стандартов окончательно утверждены 19 декабря, остальные пока находятся на разных стадиях подготовки.
Как подчеркнул президент НП "РУССОФТ" Валентин Макаров, данные стандарты являются основополагающими хотя бы потому, что содержат базовые определения, и без этого не может быть никакого движения. "Появление стандартов в области технологий искусственного интеллекта - а аналитика больших данных составляет основу этих технологий - является критическим условием прикладного использования искусственного интеллекта и создания на его основе киберфизических систем для Нового технологического уклада. Каждый раз на этапе формирования нового технологического уклада должен преодолеваться барьер отсутствия государственного регулирования, которое бы позволило массово использовать новые технологии, - таким видит Валентин Макаров значение появления данных документов. - Формирование технического регулирования - прежде всего технических стандартов - и нормативного регулирования является ключом к преодолению этого барьера, к победе в глобальной конкуренции за лидерство к новому технологическому укладу. И побеждает не тот, кто первым разработал новую технологию, а тот, кто первым сумел сформировать техническое и нормативное регулирование и получить согласование ее массового внедрения. Теперь отрасль может ориентироваться на эти стандарты и правильно строить свои НИРы и ОКРы при подготовке к лицензированию и сертификации будущей продукции".
Ведущий эксперт в области больших данных ООО "Аурига" Владимир Суворов считает, что появление стандартов в целом значимо, если они несут полезную информацию, помогают методологически и не мешают результату: "Тема больших данных и аналитики данных очень актуальна. Особенно полезно знать, как нужно внедрять аналитику и data-driven-подход. Крупные компании, не только, начали использовать аналитику. Иметь ГОСТ особенно полезно для IT-driven-компаний и компаний с государственным участием. Также хорошо, если они не включают сильно специфические указания на устаревшие технологии".
"Ассоциация больших данных входит в состав Технического комитета по стандартизации №164 "Искусственный интеллект" (ТК164) и поддерживает появление стандартов в областях больших данных и ИИ. ГОСТ Р 70466-2022 и ГОСТ Р ИСО/МЭК 24668-2022 по сути являются адаптацией международного стандарта, которого участники Ассоциации больших данных в целом и так придерживаются. Кроме того, считаем важным начать разработку российских отраслевых стандартов размеченных данных, основываясь на имеющейся практике", - так прокомментировали появление документов в пресс-службе Ассоциации больших данных.
Однако, по оценке Владимира Суворова, качество стандартов серьезно отличается: "ГОСТ "Искусственный Интеллект. Структура управления процессами аналитики больших данных" имеет хорошее содержание. На базе него можно делать управление процессом, использовать как руководство для любых консультантов, при написании ТЗ, старте проектов и аналитике баз данных. В некоторых местах даже избыточный. А вот ГОСТ "Эталонная архитектура больших данных. Часть 1. Структура и процесс применения" в текущем издании не выглядит полезным. Усложнили описание, сильно обобщили слово "архитектура". Имеет мало практической информации для построения систем БД. Ввели непопулярные термины, неочевидно накладывающиеся на ландшафт". По мнению эксперта, ГОСТу нужно больше вводной информации по таким разделам, как идентификация, загрузка, хранение, обработка данных, модели их представления, витрины данных, модели аналитики, продакшн-режим работы с моделями.
Яков Шпунт