По имени «Нестор»

ООО «Центр Речевых Технологий», разработчик высокотехнологичных решений и продуктов в области речевых технологий, выпустило новую версию решения «Нестор», предназначенного для синхронного документирования устных выступлений, заседаний, собраний и конференций. Работы над проектом продолжались 1 год. На сегодняшний день компания уже реализовала ряд проектов по внедрению новой версии решения. Ключевыми заказчиками «Нестора» выступают госорганы.

ООО «Центр речевых технологий» (ЦРТ) специализируется в области разработки электронной техники и программного обеспечения для высококачественной записи, обработки и анализа звуковой информации. Штат компании, включая ученых, составляет около 200 сотрудников. С момента создания в 1990 году специалисты ЦРТ производят и поставляют продукцию для подразделений МВД, МЮ, МЧС, МО, служб экстренной помощи, центров обработки вызовов, производителей средств связи и других. Основными клиентами компании являются организации, в деятельности которых особое значение придается передаче, регистрации и обработке речевой информации. ЦРТ является соучредителем консорциума «Российские речевые технологии», членом Русского биометрического общества, членом Совета инновационной образовательной программы СПбГУ (национальный проект «Образование»), соредактором Международного речевого биометрического стандарта от Российской Федерации. Более одной трети объема выпускаемой продукции компании реализуется за пределами России в 62 странах мира.

Недавно компания выпустила новую версию системы распределенного компьютерного документирования «Нестор». Решение предназначено для синхронного документирования устных выступлений, заседаний, собраний и конференций, проводимых органами исполнительной, законодательной и судебной власти, общественными и коммерческими организациями. C помощью системы  можно создавать стенограммы выступлений в реальном времени, а первую стенограмму мероприятия получить фактически сразу после его завершения.

«Решение о разработке «Нестора» было вызвано, прежде всего, общими тенденциями развития IT-рынка. Когда-то давно стенографирование заседаний велось полностью вручную обширным штатом стенографистов, а результаты выводились через несколько часов после завершения мероприятия. Новая версия ПО «Нестор» позволяет получить полный текст стенограммы уже через 5-7 минут по завершении заседания. При этом в качестве стенографистов могут выступать как специально обученные сотрудники, так и не профессионалы в этой области, а просто сотрудники, владеющие навыком компьютерной машинописи. Это значительно повышает производительность труда не только секретарей и стенографистов, но и самих потребителей печатной информации», - рассказала руководитель группы рекламы и PR ООО «Центр речевых технологий» София Щерба.

В качестве нововведений в решении «Нестор» разработчики отмечают возможности новой версии для одновременной работы нескольких команд исполнителей по разным проектам, произвольного масштабирования системы с тем, чтобы пользователь мог выбрать оптимальную для себя конфигурацию, а также возможность поддержки различных типов устройств ввода сигнала (микрофонов). Кроме того, новая версия позволяет привлечь к работе большое количество операторов, тогда как старая поддерживала работу только 6 человек, а также организовывать мобильные стенды стенографирования для работы в условиях выездной сессии или в случае, когда организация не имеет постоянно закрепленного места слушаний.

Как отмечают разработчики, в решение внедрены 2 принципиально новых модуля. Это модуль импорта, который позволяет использовать медиаданные разного типа в качестве источника для формирования стенограмм, АРМ «Администратор» обеспечивает «прозрачное» управление всем процессом стенографирования. В процессе создания новой версии системы были переработаны все модули и архитектура системы. Модернизация системы велась в течение одного года. Штат проектной команды состоял из 20 специалистов ЦРТ.

«Система стенографирования «Нестор» имеет различные варианты конфигурации, которые зависят от числа пользователей и количества обслуживаемых каналов звуковой информации. Также она может быть адаптирована к техническим требованиям заказчика и тому оборудованию, которое есть у него в наличии, его требованиям к функциональности. Например, система может быть сопряжена с другими речевыми решениями ЦРТ - такими как система верификации пользователя по парольной фразе Voice Key-Service, модулями голосового управления. Ее развертывание требует постоянного подключения наших сотрудников на всех этапах внедрения, начиная с предпроектного обследования и до полного технического сопровождения установленной системы. Минимальное время проекта по развертыванию стандартной конфигурации системы занимает 15 дней. В случае с решением «Нестор» мы можем говорить о том, что наша компания продает не только аппаратно-программный комплекс выбранной заказчиком комплектации, но и саму услугу по организации стенографирования. Причем условия оказания такой услуги могут быть различными», - пояснила София Щерба.

Как отмечают в компании-разработчике, наиболее успешно система «Нестор» зарекомендовала себя на рынке B2G. Соответственно, в числе ее потенциальных заказчиков рассматриваются представители госсектора. Это организации исполнительной и законодательной власти, а также судебные органы. Кроме того, система представляет интерес для крупных корпораций с развитой системой документооборота.

В условиях конфиденциальности информации конкретные заказчики, с которыми уже проводились проекты по внедрению новой версии решения «Нестор», не разглашаются разработчиком. Известно только то, что она уже установлена и эксплуатируется в Администрации Президента РФ, Правительстве РФ и Совете Федерации Федерального Собрания РФ. Также систему «Нестор» используют более чем в 30 государственных органах власти России и СНГ. 

Как говорят в компании-разработчике, данное решение также может сдаваться в аренду. Так, в 2007 году компания ЦРТ впервые предоставила комплекс «Нестор» на условиях аренды организаторам Азиатско-Тихоокеанского парламентского форума. Специфика их работы состояла в том, что форум привлекает большое количество участников и ежегодно проводится в разных странах. Организаторам российского мероприятия было необходимо организовать процесс документирования в сжатые сроки, привлекая в качестве стенографистов не профессионалов, а волонтеров, имеющих базовые навыки работы с компьютером. ЦРТ взял на себя организационные работы по развертыванию мобильного комплекса, специалисты компании оказывали техническое сопровождение в ходе форума. В настоящее время у ЦРТ уже есть заказчики, рассматривающие стенографирование как дополнительную аутсорсинговую услугу.

В качестве подобных разработок на рынке специалисты ЦРТ отмечают «МПИ Фонограф 2005» от компании «Моспроминформ». По словам Софии Щерба, система заявлена на рынке, но опытов практической реализации нет. Также на рынке представлена система «Графит» (Украина), но она представляет собой разработку под Win 3.11 с ограниченным функционалом.
 
«Мы предполагаем, что новая версия «Нестор» займет устойчивое положение на рынке. Естественно, необходимо отметить, что рынок этот еще до конца не сформирован и требует больших вложений в развитие. Необходимо постоянно работать с потенциальными заказчиками, показывая им, насколько может быть упрощен процесс документирования. При этом речь пока не идет о его полной автоматизации. Наша цель – внедрение производительного инструмента, который будет оптимизировать, а не замещать работу стенографиста», - добавила г-жа Щерба.

Среди последних решений питерского разработчика отметим систему Voice Navigator, которая была представлена на VII Международном бизнес-форуме «Мир Call-центров. Call Center World. Russia/CIS - 2008». Данное решение представляет собой набор программных продуктов и технологий для интерактивных телефонных сервисов (Interactive Voice Response), основанных на распознавании и синтезе русской речи. Продукт способен задавать звонящему вопросы и понимать ответы, в зависимости от которых производится дальнейшая маршрутизация звонка в системе. На форуме проходила демонстрация возможностей решения в режиме реального времени (см. новость от 20 марта 2008 г.). В основе Voice Navigator лежит технология распознавания слитной русской речи «Руссограф», разработанная в ЦРТ. Напомним, что для разработки этой технологии в ЦРТ использовали набор речевых баз данных, в который входили записи более чем 3 тыс. дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Работы специалистов-разработчиков над проектом продолжались около 3 лет. Инвестиции, привлеченные собственными силами компании на разработку технологии, составили около $5 млн (см. новость от 30 января 2008 г.).

В настоящее время технологиями распознавания речи занимаются ряд компаний, подавляющее большинство которых зарубежные. Поэтому из их числа сравнительно небольшое количество исследовательских групп специализируется на системах, которые применимы к русскому языку. В числе наиболее крупных - петербургский институт информатики и автоматизации РАН, Клуб голосовых технологий от МГУ, Sakrament (Минск), Microsoft Speech SDK и Lernout&Hauspie. Компания Conversay (США) предоставляет возможность организации получения информации из Интернета посредством голосовых команд. Компания Elan Informatique (Франция) занимается разработкой приложений для слепых и слабовидящих людей.  На данный момент из программных пакетов, которые поддерживают русский язык, помимо разработки «Руссограф» отметим Microsoft Speech SDK, Lernout&Hauspie и разработку Digalo фирмы Elan Informatique.

Эксперты оценивают российский рынок речевых технологий где-то в $25 млн и, по прогнозам, к 2010 году он вырастет до $250 млн. Мировой же рынок речевых технологий, по данным Global Industry Analysts, на 2007 год составил $3,1 млрд.

Автор: Дарья Тренина.

Тематики: Интеграция, Маркетинг, Оборудование, ПО, Финансы

Ключевые слова: