[ON] Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русского языка

Обсуждение новостей, соответствующих тематике форума

Модератор: Модераторы разделов

Ответить
Аватара пользователя
rssbot
Бот
Сообщения: 6002
ОС: gnu/linux

[ON] Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русского языка

Сообщение rssbot »

Опубликован выпуск открытой системы синтеза речи RHVoice 1.2.4, изначально развивавшейся для обеспечения качественной поддержки русского языка, но затем адаптированной и для других языков, включая английский, португальский, украинский, киргизский, татарский и грузинский. Код написан на С++ и распространяется под лицензией LGPL 2.1. Поддерживается работа в GNU/Linux, Windows и Android. Программа совместима с типовыми TTS-интерфейсами (text-to-speech) для преобразования текста в речь: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) и Android Text-To-Speech API, но также может использоваться в экранном ридере NVDA.




В программе применяются наработки проекта HTS (HMM/DNN-based Speech Synthesis System) и параметрический метод синтеза со статистическими моделями (Statistical Parametric Synthesis на базе HMM - Hidden Markov Model). Плюсом статистической модели являются низкие накладные расходы и нетребовательность к мощности CPU. Все операции выполняются локально на системе пользователя. Поддерживается три уровня качества речи (чем ниже качество - тем выше производительность и меньше время реакции).


Поддерживается настройка и смена голосов. Для русского языка доступно 9 вариантов голосов, для английского - 5. Голоса формируются на основе записей естественной речи. Из-за использования статистической модели качество произношения не достигает уровня синтезаторов, генерирующих речь на основе комбинации фрагментов естественной речи, но тем не менее результат вполне разборчив и напоминает трансляцию записи с громкоговорителя.



В настройках можно изменять скорость, высоту и громкость. Для изменения темпа может применяться библиотека Sonic. Возможно автоматическое определение и переключение языка на основе анализа входного текста (например, для слов и цитат на другом языке может использоваться родная для данного языка модель синтеза). Поддерживаются голосовые профили, определяющие сочетания голосов для разных языков.








Источник: https://www.opennet.ru/opennews/art.shtml?num=55093
(opennet.ru, основная лента)
Последний раз редактировалось rssbot 06.05.2021 11:46, всего редактировалось 1 раз.
Причина: Updated upstream
Спасибо сказали:
Ответить