ООО «Центр речевых технологий» (ЦРТ) существует уже около 20 лет, успев за это время вырасти из небольшой компании в значимого игрока мирового рынка. Два десятилетия назад компания состояла из нескольких человек, отделившихся от НПО «Дальняя связь», на сегодня же она насчитывает порядка 250 сотрудников. ЦРТ является лидером на российском рынке и ведущим разработчиком на международной арене. Доля продуктов компании в нашей стране составляет 30-50 %, а в некоторых сегментах рынка даже 70-80 %. Что касается экспорта, то продукты и технологии ЦРТ продаются более чем в 64 странах мира. На сегодняшний день ключевыми его рынками являются, помимо России и стран СНГ, страны Латинской Америки, страны Персидского залива и США.
ЦРТ специализируется в сфере компьютерной обработки речевых сигналов, в том числе создаёт технологии шумоочистки и повышения разборчивости речи, распознавания и синтеза речи, определения характеристик личности по голосу. Примечательно, что компания выполняет полный бизнес-цикл, от разработки до реализации того или иного продукта. Разработчик инвестирует в собственную научную школу и создает оригинальные продукты на базе своих разработок. Также центр занимается промышленным производством (через аутсорсинг) своего товара и его продажей. Зачастую инновационные решения ЦРТ формируют новые сегменты рынка.
Технологии ЦРТ применимы в различных сферах. Например, синтез речи – возможность механически воспроизводить человеческий голос – позволяет создавать системы голосового самообслуживания и в дальнейшем полностью автоматизировать те или иные диспетчерские службы. С помощью технологий шумоочистки можно получать информацию, записанную с большими помехами. Кстати, именно «Центру речевых технологий» доверили расшифровать записи с затонувшей подводной лодки «Курск» и переговоры с террористами во время захвата «Норд-Ост». Идентификация физиологических характеристик личности по голосу необходима для криминалистики и служб безопасности. Распознавание речи – перевод голоса в электронный текст – применяется для составления протоколов заседаний и многих других задач.
«И государственным, и частным компаниям нужны системы распознавания и синтеза речи. Это сервисы, которые мы будем представлять людям. К примеру, сервисы по озвучиванию сайтов, снижению нагрузки контакт-центров и секретарей», – отметила коммерческий директор ЦРТ Юлия Хитрова.
В рамках круглого стола специалисты ЦРТ рассказали журналистам о некоторых своих проектах, которые в данный момент находятся на стадии запуска. Один из социальных проектов, который ЦРТ реализует на некоммерческой основе, – это «Единый голосовой портал Санкт-Петербурга». Специалисты собираются автоматизировать систему информационного оповещения горожан в административных учреждениях, выиграв тендер Комитета экономического развития промышленной политики и торговли. Таким образом, на вопросы о льготах, пенсиях, новых законодательных актах будет отвечать синтезированный голос. По статистике, примерно 85 % вопросов, задающихся диспетчерам госучреждений, повторяются. Система позволит переложить необходимость отвечать на эти вопросы с человека на автоматическую систему, однако когда та не будет справляться с поставленной задачей – не поймет вопрос или не найдет ответ, позвонивший автоматически будет переведен на диспетчера или секретаря. Примечательно, что система, помимо прочего, сможет анализировать эмоциональное состояние говорящего, с целью перевода его на живого человека, если он начнет раздражаться. Через полгода проект будет запущен в Жилищном комитете, городском мониторинговом центре и в одном из медицинских учреждений города. В дальнейшем, если система себя оправдает, планируется создать единый информационный портал, в который будут включены «горячие телефоны» всех городских служб.
Еще один социальный проект – это разработка прибора «Речевик», который позволит людям с ограниченными возможностями читать, а если точнее, прослушивать нужные книги. Система переводит текст произведений в аудиоформат. Благодаря тому, что «Речевик» работает в режиме реального времени, а не записывает и не копирует произведения, соблюдаются авторские права. Размером прибор сравним со сканером, при желании с ним можно ходить в библиотеку. Что немаловажно, стоит он также не дороже сканера и приобрести его возможно уже сегодня.
Технологии синтеза и распознавания речи также были успешно применены в президентской библиотеке имени Б. Ельцина. В ней были реализованы инструменты поиска по ключевым словам, а также поиска по голосам дикторов аудиокниг. Кроме того, в библиотеке используется возможность идентифицировать личность по голосу. То есть для допуска к каким-либо особо важным источникам или архивам необходимо произнести ключевую фразу. По мнению специалистов ЦРТ, технология биометрической аутентификации по голосу – это один из самых надежных видов контроля доступа.
Также спикеры круглого стола рассказали журналистам о партнерстве компании ЦРТ с РЖД. Сейчас происходит внедрение автоматизированной системы контроля выполнения оперативных переговоров между машинистами поездов и диспетчерами. Тренажер поможет как при обучении сотрудников РЖД, так и для предотвращения чрезвычайных ситуаций. Уже сегодня проект запущен в Вологде. В дальнейшем специалисты ЦРТ рассчитывают на внедрение его по всей России.
Благодаря разработкам «Центра речевых технологий» в России появляются «умные дома» отечественного производства, вся техника в которых реагирует на речевые сигналы – то есть на команды. Сейчас в Петербурге около полутора десятков «умных» квартир. В Москве – примерно в два раза больше. ЦРТ сотрудничает с застройщиками и в основном внедряет подобные технологии до этапа ремонтно-отделочных работ.
Руководитель группы систем голосового самообслуживания ЦРТ Алексей Рыбаков рассказал о готовящемся проекте внедрения технологий разработчика в одном из крупнейших операторов сотовой связи, входящем в «большую тройку». Суть проекта в увеличении скорости обслуживания абонентов, звонящих в техническую поддержку.
«Сейчас мы разрабатываем концепцию внедрения технологии распознавания речи для того, чтобы клиенты обслуживались в автоматическом режиме максимально быстро. Это не тоновый набор, где абоненту приходится долго прослушивать километровые сообщения. Все будет абсолютно иначе. Например, вам нужна информация о роуминге в какой-то определенной стране, которая не представлена в контакт-центре. С помощью системы распознавания речи вы можете просто назвать нужную страну, и вам сразу расскажут стоимость и условия обслуживания. Или вы хотите получить информацию о каком-либо тарифе, которых сейчас у операторов множество. Не нужно ждать, пока система все их перечислит и доберется до нужного. Вы называете тариф – и вам тут же выдают по нему информацию», – пояснил Алексей Рыбаков. Как скоро произойдет запуск проекта ЦРТ у оператора, название которого пока не разглашается, пока не известно.