Умный бот на основе работы нейросети просканирует библиотеку видеосервиса Megogo. В результате нецензурные слова будут «запиканы», а на контенте появится значок «18+», чтобы предупредить пользователей о соответствующем содержании фильмов или сериалов.
Для создания робота разработчики используют две технологии. Во-первых, распознавание человеческой речи. Этот инструмент имеет открытый исходный код Vosk и позволяет вычленять из диалогов матерные слова. Поскольку инструмент находится на стадии доработки, зачастую возникают ошибки, связанные с идентификацией отдельных слогов или частей слов в качестве мата, например, «не психуй».
Во-вторых, визуальное распознавание на базе нейронной сети. Это наиболее сложная задача, когда машина должна научиться идентифицировать сцены насилия. Сложность связана с определением допустимой степени жестокости, ранжировать которую не всегда удается даже человеку.
Перейти в полностью автономный режим программа сможет ориентировочно через год. До этого момента потребуется обязательное участие человека.