Язык разметки синтеза речи

редактировать

Язык разметки на основе XML

Язык разметки синтеза речи ( SSML ) - это основанный на XML язык разметки для приложений синтеза речи. Это рекомендация рабочей группы W3C голосового браузера. SSML часто встраивается в сценарии VoiceXML для управления системами интерактивной телефонии. Однако его также можно использовать отдельно, например, для создания аудиокниг. Для настольных приложений популярны другие языки разметки, в том числе Apple встроенные голосовые команды и Microsoft SAPI разметка текста в речь (TTS)., также язык XML. Он также используется для создания звуков с помощью API преобразования текста в речь Azure Cognitive Services или при написании навыков сторонних разработчиков для Google Assistant или Amazon Alexa.

SSML основан на Java. Язык разметки речи (JSML), разработанный Sun Microsystems, хотя текущая рекомендация была разработана в основном поставщиками синтеза речи. Он охватывает практически все аспекты синтеза, хотя некоторые области остались неуказанными, поэтому каждый поставщик принимает свой вариант языка. Кроме того, при отсутствии разметки ожидается, что синтезатор будет самостоятельно интерпретировать текст. Таким образом, SSML не является строгим стандартом в смысле C или даже HTML.

Содержание

1 Пример
2 Возможности
3 См. Также
4 Внешние ссылки

Пример

Вот пример документа SSML:

Меню телефона: уровень 1Для английского языка нажмите one.Para español, oprima el dos.

Features

SSML определяет достаточный объем разметки для prosody, что не очевидно в приведенном выше примере. Сюда входит разметка для

pitch
contour
диапазона тона
rate
duration
volume

См. Также

Спецификация лексики произношения (PLS)
Спецификация грамматики распознавания речи (SRGS)
Семантическая интерпретация для распознавания речи (SISR)
SABLE язык разметки синтеза речи, предназначенный для объединения SSML, STML и JSML

Внешние ссылки