Выбираем онлайн-сервис для озвучки текста

11.10.2021 |

Стоимость услуг профессиональной дикторской озвучки — от 1 рубля за слово. Плюс ко всему в большинстве случаев дикторы берутся за работу только при условии заказа определенного объема. А как быть, если вы не дотягиваете до этого объема и нужно озвучить несколько фраз либо небольшой текст? На помощь в таком случае приходят сервисы для озвучки текста, в которых используется технология TTS (Text-to-Speech). Такие решения пользуются все большей популярностью.

С их помощью:

Озвучивают видеоролики. Возможности современных сервисов позволяют получать качественный звук и «человечную» речь для озвучки развлекательных, образовательных и других типов видео.
Создают речи для программ и приложений. Зачастую для них требуются короткие реплики, за озвучку которых профессионалом придется выложить немало.
Генерируют меню для IVR (голосового меню) сервисов IP-телефонии.
Создают звуковые дорожки для креативов и рекламных материалов в различных сферах бизнеса.

Давайте рассмотрим несколько TTS-сервисов, с помощью которых можно организовать озвучку текстов для решения различных задач.

APIHOST: озвучка по очень приятной цене

Одна из ключевых особенностей сервиса для озвучки текста APIHOST — очень привлекательные цены. Стоимость 1000 символов на тарифе «Стандарт» здесь — всего от 60 копеек: т.е. за 100 рублей можно озвучить до 166 000 символов текста (стоимость для озвучки обычными голосами). Сервис поддерживает более 40 языков (включая разные версии некоторых языков). При озвучивании текстов в APIHOST вы сможете управлять широким набором различных параметров. Среди них:

Высокая скорость озвучки. Здесь используются распределенная система, которая разбивает большой текст на фрагменты и обрабатывает их параллельно. Озвучка 100 000 символов здесь занимает, в среднем, 5 минут, в то время как в некоторых аналогичных сервисах на это может уйти несколько часов.
Выбор голоса. Пользователям сервиса предлагается более 800 мужских и женских голосов, среди которых 64 русских. Среди них есть, как максимально «человечные», так и очевидно синтезированные программой. Также регулярно добавляются новые голоса.
Высота голоса. Может регулироваться в сторону увеличения (от +1.1 до +3.0) и уменьшения (от 0.9 до 0.7).
Громкость и темп речи. Возможные значения: нормальный, динамичный, мягкий и шепот.
Скорость речи.
Длина паузы между словами (до 0.5 сек). Также можно добавлять дополнительные паузы вручную, с помощью специального символа «-». Паузы, ударения и другая специализированная разметка здесь не учитывается при подсчете количества символов для озвучки.
Эмоциональная окраска. Доступна для определенного набора голосов.
Поддержка фонем и возможность расстановки ударений в словах вручную. Для этого в программе озвучки используется символ «+».

Есть возможность выбора формата аудиофайла, в котором будет сохраняться результат озвучки. Доступные на данный момент варианты: mp3 и wav.

Zvukogram: умеет озвучивать даже диалоги

В сервисе Zvukogram (сайт https://zvukogram.com/speech/) преобразование текста в голос осуществляется с помощью нейросетей. Решение работает с 15 языками. Важная ключевая особенность этого сервиса — возможность озвучки диалогов с использованием разных голосов. Также здесь реализованы и другие полезные инструменты. Среди них:

Обрезка полученного аудиофайла.
Возможность разбивки результатов озвучивания на несколько файлов.
Функционал для переозвучки фрагментов внутри большого текста.
Настройка произношения и простановки ударения через Международный фонетический алфавит (МФА).

Конечно же, здесь реализованы и характерные для большинства сервисов этого класса типовые возможности и опции. Сервис предлагает более 30 голосов: профессиональные, обычные, а также имитирующие разговор бота. Есть возможность управления звуком, причем усиливать можно фрагменты текста по-отдельности. Сервис также предлагает опцию для управления интонацией голоса. Она может быть нейтральной, дружеской или раздраженной.

Для расчетов в Zvukogram используются внутренние токены, которые покупаются пакетами (от 100 рублей). Приобретя минимальный пакет за 100 рублей, вы сможете озвучить обычными голосами 105000 символов или премиальными — 21000 симв.

VoxWorker: простой и удобный, все на одной странице

Сервис озвучки текста VoxWorker переводит текст в голос на русском, английском и украинском языках. Преимуществом сервиса является простота интерфейса, все инструменты собраны на одной странице, а также бесплатность сервиса.

Среди его особенностей:

Простая и понятная расстановка ударений. Ударный звук отмечается с помощью символа «+», размещающегося перед ним.
Возможность добавления пауз. Для этого в панели сервиса нужно нажать специальную кнопку.
8 градаций скорости произношения. Вы можете регулировать ее от значения «очень медленно» до тройной скорости.
Регулировка высоты голоса. Регулируется в диапазоне от -0.6 до +1.8.
Хранение голосовых файлов. По умолчанию файлы зарегистрированных пользователей хранятся 96 часов. Но есть возможность активировать опцию их постоянного хранения, чтобы делиться онлайн.

Результаты озвучки сохраняются в формате mp3. Озвучивание и запись в файл происходит практически мгновенно, нужно только нажать кнопку «скачать». Для озвучивания текста в VoxWorker используются 5 голосов на выбор. 3 из них женские, 2 — мужские. Есть функционал для работы с черновиками.