Язык разметки синтеза речи

редактировать
Язык разметки на основе XML

Язык разметки синтеза речи ( SSML ) - это основанный на XML язык разметки для приложений синтеза речи. Это рекомендация рабочей группы W3C голосового браузера. SSML часто встраивается в сценарии VoiceXML для управления системами интерактивной телефонии. Однако его также можно использовать отдельно, например, для создания аудиокниг. Для настольных приложений популярны другие языки разметки, в том числе Apple встроенные голосовые команды и Microsoft SAPI разметка текста в речь (TTS)., также язык XML. Он также используется для создания звуков с помощью API преобразования текста в речь Azure Cognitive Services или при написании навыков сторонних разработчиков для Google Assistant или Amazon Alexa.

SSML основан на Java. Язык разметки речи (JSML), разработанный Sun Microsystems, хотя текущая рекомендация была разработана в основном поставщиками синтеза речи. Он охватывает практически все аспекты синтеза, хотя некоторые области остались неуказанными, поэтому каждый поставщик принимает свой вариант языка. Кроме того, при отсутствии разметки ожидается, что синтезатор будет самостоятельно интерпретировать текст. Таким образом, SSML не является строгим стандартом в смысле C или даже HTML.

Содержание
  • 1 Пример
  • 2 Возможности
  • 3 См. Также
  • 4 Внешние ссылки
Пример

Вот пример документа SSML:

Меню телефона: уровень 1

Для английского языка нажмите one.Para español, oprima el dos.

Features

SSML определяет достаточный объем разметки для prosody, что не очевидно в приведенном выше примере. Сюда входит разметка для

  • pitch
  • contour
  • диапазона тона
  • rate
  • duration
  • volume
См. Также
Внешние ссылки
Последняя правка сделана 2021-06-09 02:15:18
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте