SAMPA

редактировать

Фонетический алфавит Методы оценки речи (SAMPA ) - это фонетический алфавит, читаемый компьютером с использованием 7-битных печатаемых символов ASCII на основе Международного фонетического алфавита (IPA).

Первоначально он был разработан в конце 1980-х годов для шести европейских языков в рамках программы исследований и разработок информационных технологий EEC ESPRIT. Максимальное количество символов было заимствовано из IPA; там, где это невозможно, используются другие имеющиеся знаки, например [@] для schwa (IPA [ə]), [2] для гласного звука в французском deux (IPA [ ø]) и [9] для гласного звука во французском neuf (IPA [œ]).

Сегодня официально SAMPA была разработана для всех звуков следующих языков:

Символы ["s {mp @] представляют собой произношение имени SAMPA на английском языке с начальным символом ["], обозначающим основное ударение. Как и IPA, SAMPA обычно заключен в квадратные скобки или косую черту, которые не являются частью собственно алфавита и просто означают, что это фонетический характер в отличие от обычного текста.

Возможности

SAMPA была разработана в конце 1980-х в рамках финансируемого Европейской Комиссией ESPRIT проекта 2589 «Методы оценки речи» (SAM) - отсюда «SAM Phonetic Alphabet» - для облегчения обмена данными по электронной почте и вычислительной обработки транскрипции в фонетике и речевых технологиях.

SAMPA - это частичное кодирование из IPA. Первая версия SAMPA была объединением наборов кодов фонем для датского, голландского, английского, французского, немецкого и итальянского языков; более поздние версии расширили SAMPA для охвата других европейских языков. Поскольку SAMPA основана на инвентаризации фонем, каждая таблица SAMPA действительна только на том языке, для которого она была создана. Чтобы сделать этот метод кодирования IPA универсально применимым, был создан X-SAMPA, который предоставляет одну единственную таблицу без языковых различий.

SAMPA был разработан как хак для обхода неспособности текстовых кодировок представлять символы IPA. Следовательно, поскольку поддержка Unicode для символов IPA становится все более распространенной, потребность в отдельной машиночитаемой системе для представления IPA в ASCII уменьшается. Однако ввод текста зависит от определенных кодировок клавиатуры или устройств ввода. По этой причине SAMPA и X-SAMPA по-прежнему широко используются в вычислительной фонетике и в речевых технологиях.

См. Также
Ссылки
  • Ranchhod, Elisabeth J. Mamede, Nuno (2002). Достижения в обработке естественного языка: Третья международная конференция, PorTAL 2002, Фаро, Португалия, 23–26 июня 2002 г. Материалы (Конспект лекций по информатике ). (1-е изд.). Springer. ISBN 3-540-43829-7.
  • L. Де Миллер, Анна и Реттиг, Джеймс (2000). Лингвистика: Справочник по справочной литературе (2-е изд.). Библиотеки без ограничений. ISBN 1-56308-619-0.
  • Ламбертс, Коэн и Голдстоун, Роб (2004). Справочник познания. Sage Publications Ltd. ISBN 0-7619-7277-3.
Внешние ссылки
Найдите SAMPA в Wiktionary, бесплатный словарь.
Последняя правка сделана 2021-06-06 02:40:54
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте