Запрещенный контент в библиотеке видеосервиса Megogo будет искать нейросеть

Онлайн кинотеатр Megogo объявил о скором запуске нового бота для поиска в видеоматериалах нецензурной брани, а также сцен употребления табака и алкоголя. На первом этапе робот будет выявлять 4 группы матерных слов, сцены курения и распития алкогольных напитков. В планах разработчиков научить робота распознавать сцены насилия.

Умный бот на основе работы нейросети просканирует библиотеку видеосервиса Megogo. В результате нецензурные слова будут «запиканы», а на контенте появится значок «18+», чтобы предупредить пользователей о соответствующем содержании фильмов или сериалов.

Для создания робота разработчики используют две технологии. Во-первых, распознавание человеческой речи. Этот инструмент имеет открытый исходный код Vosk и позволяет вычленять из диалогов матерные слова. Поскольку инструмент находится на стадии доработки, зачастую возникают ошибки, связанные с идентификацией отдельных слогов или частей слов в качестве мата, например, «не психуй».

Во-вторых, визуальное распознавание на базе нейронной сети. Это наиболее сложная задача, когда машина должна научиться идентифицировать сцены насилия. Сложность связана с определением допустимой степени жестокости, ранжировать которую не всегда удается даже человеку.

Перейти в полностью автономный режим программа сможет ориентировочно через год. До этого момента потребуется обязательное участие человека.

Автор: Александр Абрамов.

Тематики: Web

Ключевые слова: онлайн-кинотеатры