Проект нацстандарта подготовили Национальный центр цифровой экономики МГУ имени М.В. Ломоносова и Институт развития информационного общества. Стандарт "Информационные технологии. Большие данные. Обзор и словарь" устанавливает термины и определения основных понятий в области технологий работы с большими данными.
"Технологии работы с большими данными достигли высокого уровня зрелости и их применение приносит ощутимые эффекты в экономике и социальной сфере. Стандартизация процессов разработки и использования технологий хранения и анализа больших данных позволяет обмениваться лучшими практиками, использовать подходы и решения, которые подтвердили результативность как в России, так и во всем мире", - считает председатель совета директоров Института развития информационного общества, руководитель рабочей группы по большим данным Технического комитета 164 "Искусственный интеллект" Юрий Хохлов.
В рабочей группе по разработке big data стандартов участвует "Ассоциация больших данных". От ассоциации над первым нацстандартом работал в том числе ПАО "МегаФон". Разработку нацстандарта по большим данным поддерживает группа МТС: в ближайшее время компания направит разработчикам комментарии по проекту. Опрошенные операторы связи считают, что нацстандарт облегчит взаимодействие владельцев данных и потребителей продуктов, которые сделаны на основе big data.
Банк "ВТБ" также участвует в рабочей группе проекта нацстандарта по большим данным. Руководитель департамента анализа данных и моделирования ВТБ Максим Коновалихин рассказал, что сотрудники организации продолжают разрабатывать терминологию стандарта, базовые ценности и социальные ориентиры технологии.
"Стандарт по большим данным не принесет дополнительную выгоду для страны, для гос и коммерческих предприятий, но точно позволит избежать ненужных затрат, - уверен директор по развитию национальных проектов Softline Андрей Шолохов. - В области big data мы часто используем переводы с англоязычных источников. Определение единственно правильного соответствия между английскими и русскими терминами позволит избежать путаницы из-за разных вариантов переводов".
Текст первой редакции проекта требует доработки, считает заместитель директора центра компетенции больших данных компании "Техносерв" Олег Савранский. Многие положения, на его взгляд, нужно расписать подробно. "Отсутствует информация про использование алгоритмов машинного обучения при работе с большими данными. Нет терминов, связанных с моделями машинного обучения, и описания четких критериев отличия больших данных от массивов данных привычных реляционных big data", - сказал специалист. Он говорит, что в будущем назреет необходимость ввести стандарт обмена и хранения данных посредством единого реестра.
В этом году ТК 164 планирует подготовить первые редакции стандартов в области big data по структуре и прикладным процессам, безопасности и конфиденциальности,а также дорожную карту стандартов.
Анастасия Самсонова