Спецификация грамматики распознавания речи

редактировать

Спецификация грамматики распознавания речи (SRGS) - это Стандарт W3C для определения грамматик распознавания речи. Грамматика распознавания речи - это набор шаблонов слов, который сообщает системе распознавания речи, чего ожидать от человека. Например, если вы вызываете приложение автосекретаря, оно предложит вам ввести имя человека (с ожиданием, что ваш звонок будет переведен на телефон этого человека). Затем он запустит распознаватель речи, присвоив ему грамматику распознавания речи. Эта грамматика содержит имена людей в каталоге автосекретаря и набор шаблонов предложений, которые являются типичными ответами вызывающих абонентов на подсказку.

SRGS определяет два альтернативных, но эквивалентных синтаксиса, один на основе XML, а другой - на расширенном формате BNF. На практике синтаксис XML используется чаще.

И ABNF, и XML-форма обладают выразительной силой контекстно-свободной грамматики. Грамматический процессор, который не поддерживает рекурсивные грамматики, обладает выразительной силой конечного автомата или языка регулярных выражений.

Если бы распознаватель речи возвратил только строку, содержащую фактические слова, произнесенные пользователем, голосовое приложение должно было бы проделать утомительную работу по извлечению семантического значения из этих слов. По этой причине грамматики SRGS могут быть украшены элементами тегов, которые при выполнении создают семантический результат. SRGS не определяет содержимое элементов тега: это делается в сопутствующем стандарте W3C, Семантическая интерпретация для распознавания речи (SISR). SISR основан на ECMAScript, а операторы ECMAScript внутри тегов SRGS создают объект семантического результата ECMAScript, который легко обрабатывается голосовым приложением.

И SRGS, и SISR являются Рекомендациями W3C, заключительным этапом разработки стандартов W3C. Стандарт W3C VoiceXML, определяющий способ задания голосовых диалогов, сильно зависит от SRGS и SISR.

Примеры

Вот пример расширенного BNF SRGS, который может использоваться в приложении автосекретаря:

#ABNF 1.0 ISO-8859-1; // Язык грамматики по умолчанию - английский (США) en-US; // Одноязычное присоединение к токенам // Обратите внимание, что «fr-CA» (канадский французский) применяется только // к слову «oui» из-за правил приоритета $ yes = yes | oui! fr-CA; // Прикрепление к расширению на одном языке $ people1 = (Michel Tremblay | André Roy)! Fr-CA; // Обработка языкового произношения одного и того же слова // Способный распознаватель речи будет прослушивать мексиканское испанское и // американское английское произношение. $ people2 = Jose! en-US | Jose! Es-MX; / ** * Возможен многоязычный ввод * @example могу я поговорить с Андре Роем * @example могу я поговорить с Хосе * / public $ request = могу я поговорить с ($ people1 | $ people2);

Вот тот же пример SRGS, используя форму XML:

даouiМишель ТремблейАндре РойХосеХосемогу я поговорить с Андре Роеммогу я поговорить с Хосемогу я поговорить с 
См. Также
Внешние ссылки
Последняя правка сделана 2021-06-09 02:15:18
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте