Спецификация словаря произношения (PLS) - это W3C Рекомендация, которая предназначена для обеспечения возможности взаимодействия спецификации информации о произношении для механизмов распознавания речи и синтеза речи в приложениях для просмотра голоса. Язык предназначен для облегчения использования разработчиками, одновременно поддерживая точную спецификацию информации о произношении для международного использования.
Язык позволяет указывать одно или несколько вариантов произношения слова или фразы с использованием стандартного алфавита произношения или, при необходимости, с использованием алфавитов конкретного производителя. Произношения сгруппированы вместе в документ PLS, на который можно ссылаться из других языков разметки, таких как Спецификация грамматики распознавания речи SRGS и язык разметки синтеза речи SSML.
Вот пример документа PLS:
judgment judgement ˈdʒʌdʒ. mənt fiancé fiance fiˈɒns.eɪ ˌfiː.ɑːnˈseɪ
, которые можно использовать для улучшения TTS, как показано в следующем SSML 1.0 документ:
По мнению моего жениха, Лас-Вегас - лучшее место для медового месяца. Я ответил, что предпочитаю Венецию и не думаю, что венецианское казино было приемлемым компромиссом.
, но также для улучшения ASR в следующей грамматике SRGS 1.0 :
- Терминатор 2: Судный день
- Мой большой толстый противный жених
- Судный день Плутона
Для Системы ASR обычно полагаются на несколько вариантов произношения одного и того же слова или фразы, чтобы справиться с вариациями произношения в пределах одного языка. В языке лексикона произношения несколько вариантов произношения представлены более чем одним элементом
В следующем примере слово «Ньютон» имеет два возможных произношения.
Ньютон ˈnjuːtən ˈnuːtən
В некоторых ситуациях существуют альтернативные текстовые представления одного и того же слова или фразы. Это может возникнуть по ряду причин. Подробности см. В разделе 4.5 PLS. Поскольку это представления, имеющие одно и то же значение (в отличие от омофонов), рекомендуется их представлять с помощью одного элемента
Вот два простых примера множественной орфографии: альтернативное написание английского слова и множественное написание японского слова.
цвет цвет ˈkʌlər нихонго 日本語 に ほ ほ ご ɲihoŋɡo
В большинстве языков есть омофоны, слова с одинаковым произношением, но с разными значениями (и, возможно, разными написаниями), например «семя» и «уступка». Рекомендуется представлять их как разные лексемы.
cede siːd seed siːd
В большинстве языков есть слова с разными значениями, но с одинаковым написанием (а иногда и с разными произношениями), называется омографами. Например, в английском языке слова bass (рыба) и слово bass (в музыке) имеют одинаковое написание, но разные значения и произношение. Хотя рекомендуется, чтобы эти слова были представлены с использованием отдельных элементов
В этом примере показано произношение омографа «бас».
bass bæs beɪs
Обратите внимание, что английский язык содержит множество примеров пар существительное-глагол, которые можно рассматривать либо как омографы, либо как альтернативные произношения, в зависимости от автора предпочтение. Двумя примерами являются существительное / глагол «отказаться» и существительное / глагол «адрес».
refuse rɪˈfjuːz refuse ˈrɛfjuːs
Для некоторых слов и фраз произношение может быть быстро и удобно выражено в виде последовательности прочие орфографии. От разработчика не требуется лингвистических знаний, вместо этого он использует произношение, которое, как ожидается, уже будет доступно. Для выражения произношения с использованием других орфографий можно использовать элемент
Эта функция может быть очень полезна при расширении акронимов.
W3C Консорциум World Wide Web 101 сто один Таиланд связанная земля BBC 1 быть морским