Министерство цифрового развития, связи и массовых коммуникаций (Минцифры) предложило предоставить разработчикам в сфере искусственного интеллекта (ИИ) платный доступ к пакетам государственных данных. Это следует из проекта концепции, которую ведомство представило в рамках тематической экспертной сессии АНО «Цифровая экономика» (копия есть у РБК, подлинность документа подтвердили два источника РБК, знакомых с ходом его обсуждения).
Как пояснил представитель АНО «Цифровая экономика», в текущей версии концепции в дата-сеты входят любые данные: о медицинских обследованиях и поставленных по ним диагнозам, уровне цен в различных регионах, составе почвы для сельскохозяйственных работ и т.д.
Из проекта следует, что в зависимости от типа данных формированием, анонимизацией и обезличиванием их наборов будут заниматься или госоператор (для данных ограниченного доступа), или аккредитованные организации, или сами ведомства. Предполагается, что дата-сеты будут формироваться на платной основе, а их стоимость будет определяться исходя из сложности и объема. Большие массивы данных, имеющих ту или иную степень секретности, смогут получить организации, аккредитованные профильными ведомствами, например ФСБ, а доступ к дата-сетам, содержащим общедоступную информацию, будет безвозмездным. Аккредитованные организации смогут обогащать дата-сеты коммерческими данными.
«Возможность создать единую фабрику данных делает государство уникальным оператором, который имеет в своем распоряжении практически неограниченное количество дата-сетов и их комбинаций. Такие базы представляют интерес для бизнеса, который выстраивает маркетинговые коммуникации и планы развития, опираясь на аналитику дата-сетов», — передал через представителя своего аппарата вице-премьер Дмитрий Чернышенко. По его словам, наборы данных «станут основой машинного обучения для организаций и предприятий, представляющих ключевые отрасли экономики», а внедрение искусственного интеллекта повысит производительность предприятий и ускорит цифровую трансформацию.
Президент России Владимир Путин в декабре 2020 года поручил правительству внести проект закона о доступе разработчиков искусственного интеллекта к большим данным, в том числе государственным. Он отметил, что эта информация является «питательной средой для развития технологий искусственного интеллекта по целому ряду направлений».
Зампред комиссии по правовому обеспечению цифровой экономики Московского отделения Ассоциации юристов России Борис Едидин считает, что одним из ключевых препятствий для развития технологии ИИ сейчас является недостаток или плохое качество данных, так что инициатива доступа к госданным является крайне необходимой — это позволит расширить круг разработчиков ИТ-решений и «повысить саму культуры сбора, хранения и обработки данных». Однако, если стоимость данных будет очень большой, это не позволит вовлечь в развитие индустрии некрупные компании и стартапы. «С другой стороны, платность сформирует и определенные требования к качеству данных, предъявляемые покупателями (разработчиками). В перспективе это поможет решить проблему плохого качества данных», — считает он.
Представитель МТС сообщил, что компания заинтересована в доступе к государственным данным. «Например, для анализа эффективности рекламы нам были бы полезны данные о распределении пассажиропотока и транзакциях в городском транспорте. Но крайне важно качество этих дата-сетов, в частности качество разметки. Если у нас появится доступ к действительно качественно размеченным данным, мы будем готовы за это платить», — пояснил он.
Анна Серебряникова, президент Ассоциации больших данных, объединяющей Сбербанк, «МегаФон», «Яндекс», «Ростелеком», МТС и др. игроков, назвала идею организации доступа к государственным наборам данных для развития искусственного интеллекта правильной. Она отметила, что во всем мире важную роль играют организации, которые выступают посредниками и доверенной стороной при доступе различных участников к дата-сетам и берут на себя решение организационных и технических проблем. Такие посредники необходимы «в связи со значительной сложностью формирования запросов на необходимые для разработок данные, трудностями с решением вопросов контроля доступа, имеющимися ограничениями режима охраны различных дата-сетов», отметила Серебряникова.
Ранее Минцифры подготовило законопроект, согласно которому бизнес должен безвозмездно передавать властям обезличенные данные россиян для оказания цифровых услуг, однако участники рынка выступили против. Этот документ еще обсуждается, сообщил представитель правительства.
Владислав Скобелев
Анна Балашова