Спецификация лексикона произношения

редактировать

Рекомендация Всемирного веб-консорциума

Спецификация словаря произношения (PLS) - это W3C Рекомендация, которая предназначена для обеспечения возможности взаимодействия спецификации информации о произношении для механизмов распознавания речи и синтеза речи в приложениях для просмотра голоса. Язык предназначен для облегчения использования разработчиками, одновременно поддерживая точную спецификацию информации о произношении для международного использования.

Язык позволяет указывать одно или несколько вариантов произношения слова или фразы с использованием стандартного алфавита произношения или, при необходимости, с использованием алфавитов конкретного производителя. Произношения сгруппированы вместе в документ PLS, на который можно ссылаться из других языков разметки, таких как Спецификация грамматики распознавания речи SRGS и язык разметки синтеза речи SSML.

Содержание

1 Использование
2 Общие варианты использования
- 2.1 Несколько произношений для одной и той же орфографии
- 2.2 Несколько орфографий
- 2.3 Омофоны
- 2.4 Омофоны
- 2.5 Произношение по орфографии
3 Статус и будущее
4 См. Также
5 Ссылки
6 Внешние ссылки

Использование

Вот пример документа PLS:

judgmentjudgementˈdʒʌdʒ. məntfiancéfiancefiˈɒns.eɪˌfiː.ɑːnˈseɪ

, которые можно использовать для улучшения TTS, как показано в следующем SSML 1.0 документ:

По мнению моего жениха, Лас-Вегас - лучшее место для медового месяца. Я ответил, что предпочитаю Венецию и не думаю, что венецианское казино было приемлемым компромиссом.

, но также для улучшения ASR в следующей грамматике SRGS 1.0 :

Терминатор 2: Судный деньМой большой толстый противный женихСудный день Плутона

Распространенные варианты использования

Несколько вариантов произношения для одной и той же орфографии

Для Системы ASR обычно полагаются на несколько вариантов произношения одного и того же слова или фразы, чтобы справиться с вариациями произношения в пределах одного языка. В языке лексикона произношения несколько вариантов произношения представлены более чем одним элементом (или ) в одном элементе .

В следующем примере слово «Ньютон» имеет два возможных произношения.

Ньютонˈnjuːtənˈnuːtən

Множественные орфографии

В некоторых ситуациях существуют альтернативные текстовые представления одного и того же слова или фразы. Это может возникнуть по ряду причин. Подробности см. В разделе 4.5 PLS. Поскольку это представления, имеющие одно и то же значение (в отличие от омофонов), рекомендуется их представлять с помощью одного элемента , содержащего несколько графем.

Вот два простых примера множественной орфографии: альтернативное написание английского слова и множественное написание японского слова.

цветцветˈkʌlərнихонго日本語に ほ ほ ごɲihoŋɡo

Гомофоны

В большинстве языков есть омофоны, слова с одинаковым произношением, но с разными значениями (и, возможно, разными написаниями), например «семя» и «уступка». Рекомендуется представлять их как разные лексемы.

cedesiːdseedsiːd

Homographs

В большинстве языков есть слова с разными значениями, но с одинаковым написанием (а иногда и с разными произношениями), называется омографами. Например, в английском языке слова bass (рыба) и слово bass (в музыке) имеют одинаковое написание, но разные значения и произношение. Хотя рекомендуется, чтобы эти слова были представлены с использованием отдельных элементов , которые различаются разными значениями атрибута role (см. Раздел 4.4 PLS 1.0), если автор словаря произношения не хочет различать два слова, они могут просто быть представлены как альтернативные варианты произношения в том же элементе . В последнем случае процессор TTS не сможет различить, когда применять первую или вторую транскрипцию.

В этом примере показано произношение омографа «бас».

bassbæsbeɪs

Обратите внимание, что английский язык содержит множество примеров пар существительное-глагол, которые можно рассматривать либо как омографы, либо как альтернативные произношения, в зависимости от автора предпочтение. Двумя примерами являются существительное / глагол «отказаться» и существительное / глагол «адрес».

refuserɪˈfjuːzrefuseˈrɛfjuːs

Произношение по орфографии

Для некоторых слов и фраз произношение может быть быстро и удобно выражено в виде последовательности прочие орфографии. От разработчика не требуется лингвистических знаний, вместо этого он использует произношение, которое, как ожидается, уже будет доступно. Для выражения произношения с использованием других орфографий можно использовать элемент .

Эта функция может быть очень полезна при расширении акронимов.

W3CКонсорциум World Wide Web101сто одинТаиландсвязанная земляBBC 1быть морским

Статус и будущее

PLS 1.0 достиг статуса рекомендации W3C 14 октября 2008 года.

См. также

Ссылки

Спецификация PLS (рекомендация W3C)

Внешние ссылки