Метод ввода пиньинь

редактировать
метод ввода китайских иероглифов в компьютер Снимок экрана Smart Pinyin SCIM.

метод пиньинь (упрощенный китайский : 拼音 输入 法; традиционный китайский : 拼音 輸入 法; пиньинь : пиньинь сюро фǎ) относится к семейству методов ввода, основанных на методе латинизации пиньинь.

В самой простой форме метод пиньинь позволяет пользователю вводить китайские символы, вводя пиньинь китайского символа и затем представляя пользователю список возможных символов с этим произношение. Однако существует ряд немного разных таких систем, и современные методы пиньинь предоставляют ряд удобных функций.

Содержание
  • 1 Преимущества и недостатки
  • 2 Элементы и особенности
    • 2.1 Длина преобразования
    • 2.2 Обработка тонов
    • 2.3 Обработка расширенных латинских символов (ü и ê)
    • 2.4 Обработка of hm, hng, ng, n
    • 2.5 Статистика использования и пользовательские словари
    • 2.6 Аббревиатура
    • 2.7 Нечеткий пиньинь
    • 2.8 Предсказание слов
    • 2.9 Двойное пиньинь
    • 2.10 Исправление опечаток
    • 2.11 Смешение языков
  • 3 Реализации
    • 3.1 Кросс-платформенный
    • 3.2 Windows
    • 3.3 Linux / Unix
    • 3.4 macOS
    • 3.5 Web
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
Преимущества и недостатки

Очевидное преимущество методов ввода на основе пиньинь - простота обучения для говорящих на стандартном китайском. Те, кто знаком с пиньинь и умеет распознавать полученные символы, смогут вводить их практически без обучения по сравнению с другими методами ввода. Это не требует, чтобы пользователь мог построить символ с нуля, как это было бы в китайском языке. Поскольку все дети в материковом Китае обязаны изучать пиньинь в школе, пиньинь является одним из самых популярных методов ввода в этой стране.

Для людей, которые не говорят на стандартном китайском, Основное преимущество пиньинь становится недостатком, так как им нужно будет выучить стандартное китайское произношение символов, прежде чем они смогут использовать этот метод ввода. Кроме того, поскольку пиньинь и другие методы ввода, основанные на произношении, не полагаются на формирование символа для ввода (как и методы ввода на основе штрихов, такие как Cangjie ), они могут вызвать истощение языка и потерю навыков у взрослых, а также могут стать препятствием для изучения письменного китайского у детей.

Элементы и особенности

Методы ввода пиньинь различаются рядом возможных аспектов. Большинство методов ввода пиньинь предоставляют удобные функции для ускорения ввода. Некоторые из этих функций могут значительно ускорить набор текста.

Длина преобразования

Основная идея метода ввода состоит в том, чтобы иметь буфер, который удерживает пользовательский ввод до тех пор, пока он не будет преобразован в символы, которые в противном случае были бы недоступны с клавиатуры.

В самых основных системах за один раз преобразуется один символ. Это делает процесс ввода очень трудоемким. Мало того, что пользователь должен выбирать символы по одному, это также означает, что система ввода не имеет возможности приоритизировать выбор символов с использованием словосочетаний, грамматической структуры или контекста. Кроме того, поскольку метод ввода поддерживает только один символ за раз, он, скорее всего, потребует от пользователя ввести полное написание пиньинь, чтобы сузить выбор. Эта система все еще существует во встроенных приложениях, таких как сотовые телефоны.

Обычные реализации пиньинь на компьютере сегодня могут содержать до предложения в пиньинь, прежде чем потребуется преобразование. Метод пытается угадать подходящие символы, используя словосочетания из словаря, грамматической структуры и контекста.

Обработка тонов

Китайский - тональный язык. Тоны могут использоваться для дальнейшего различения символов одного и того же звука. Многие из ранних реализаций односимвольных методов пиньинь требовали ввода тонов, чтобы сузить выбор символов.

Для удобства выбор тона по умолчанию отключен в большинстве современных систем пиньинь на компьютере. Пользователь может иметь возможность включить его в зависимости от реализации пиньинь.

Обработка расширенных латинских символов (ü и ê)

За исключением интонации, в пиньинь есть две расширенные латинские гласные. Это ü (У-умляут) и ê (E-циркумфлекс). Учитывая, что раскладка клавиатуры США является наиболее распространенной раскладкой клавиатуры в Китае, любая реализация метода пиньинь должна иметь возможность облегчить ввод этих гласных на клавиатуре США.

Поскольку буква «v» не используется в китайском пиньинь, она повсеместно используется как псевдоним для ü. Например, если ввести «nv» в метод ввода, появится список кандидатов для пиньинь : nǚ.

Обработка ê не столь универсальна, поскольку символ - единственный широко используемый символ с таким произношением. Это междометие, примерно эквивалентное "Эх " на английском языке. Некоторые IME, такие как Google Pinyin, объединяют его в «e», в то время как другие создают для него дополнительную буквенную комбинацию, например «ea» или «eh», или «ei» в iOS. Другие просто уронили бы этот звук.

Обработка hm, hng, ng, n

Символ 嗯 (ng) может (или должен) быть записан с использованием IBUS linux и метода ввода Microsoft путем ввода «en».

Статистика использования и пользовательские словари

Большинство современных реализаций методов ввода корректируют позиции слов-кандидатов в списке кандидатов на основе предыдущей статистики использования. Кроме того, метод ввода также поддерживает пользовательские фразы через пользовательский словарь.

Аббревиатура

Аббревиатура - это функция, которая позволяет пользователю опускать все, кроме первой или первой пары букв в написании пиньинь. Эта функция может значительно ускорить ввод длинных словосочетаний. В рамках этой функции пользователь может ввести слово "концерт" (упрощенный китайский : 音乐会; традиционный китайский : 音樂會; пиньинь : yīnyuèhuì) введите «yyh» вместо «yinyuehui».

В системах, поддерживающих пользовательские фразы, пользователи могут даже определять свои собственные сокращения, которые могут не соответствовать стандартным правилам пиньинь.

Нечеткий пиньинь

Пиньинь был создан на основе произношения стандартного китайского, разновидности мандаринского китайского. Региональный акцент преобладает в китайском языке как среди носителей языка, так и среди носителей языка. Это означает, что у значительного числа носителей мандаринского языка возникнут проблемы с различением ряда похожих по звучанию слогов пиньинь, таких как c и ch, s и sh, z и zh, n и ng, h или hu и f, или n и л. Нечеткий пиньинь или нечеткий ввод (模糊 音) - это функция, которая позволяет пользователю вводить эти похожие по звучанию гласные или согласные, как если бы они были одним и тем же. У него также есть недостатки, так как пользователь должен выбирать правильные символы или слова из более длинного списка «омофонов».

Предсказание слов

Предсказание слова (упрощенный китайский : 联想; традиционный китайский : 聯想; пиньинь : liánxiǎng; горит. : 'ассоциация') - это функция метода ввода, который пытается угадать следующую серию символов, которую пытается ввести пользователь. Эта функция часто используется для обозначения двух разных механизмов, выполняющих схожие функции.

Один из этих механизмов похож на функцию автозаполнения для пользовательского ввода. Пока пользователь набирает соответствующий пиньинь, метод ввода будет принимать ввод и искать все возможные словосочетания, которые могут соответствовать вводу пользователя, даже если ввод является неполным. Например, когда пользователь вводит «шанг», метод ввода покажет «上海» (Шанхай) в качестве кандидата на слово в рамках этой функции.

Второй возможный механизм - это предсказание следующего ввода пользователя после того, как пользователь завершит ввод набора слов. Например, в приведенном выше примере после того, как пользователь выберет «上海» (Шанхай) из списка кандидатов слов, буфер пиньинь метода ввода будет пуст. В соответствии с этим механизмом метод ввода будет отображать список слов, которые часто следует за словом Шанхай, например «人» (люди), «市» (город), «的» (вспомогательное слово).

Двойной пиньинь

Схема двойного пиньинь по умолчанию в Microsoft Pinyin IME. Многие IME, в том числе ибус-пиньинь, поддерживают эту схему.

Группы гласных в пиньинь могут содержать до четырех букв. Двойной пиньинь (双拼) - это метод, при котором более длинные группы гласных назначаются согласным клавишам как сочетания клавиш, а zh, ch, sh назначаются клавишам гласных как сочетания клавиш. Таким образом, когда метод ввода ожидает гласную, пользователь может использовать ярлыки для ускорения набора текста.

В Microsoft Pinyin IME, например, если пользователь хочет ввести в компьютер «中华人民共和国 (zhōnghuárénmíngònghéguó)», «Китайская Народная Республика», он должен ввести «чжунхуарэньминьхэго» в полном пиньинь. В двойном пиньинь, однако, достаточно ввести "vshwrfmngshego" (v = zh, s = ong, h = h, w = ua, r = r, f = en, m = m, n = in, g = g, s = ong, h = h, e = e, g = g, o = uo).

Исправление опечаток

Подобно автоматическому исправлению опечаток для английского языка в текстовых процессорах, реализации метода пиньинь могут распознавать возможные опечатки и отображать соответствующие слова-кандидаты. Используя Google Pinyin в качестве примера, при обнаружении предполагаемой опечатки Google Pinyin будет показывать как слова-кандидаты, предполагающие, что это правильно, так и слова-кандидаты, предполагающие, что это опечатка.

Смешивание языков

Наиболее продвинутые реализации метода пиньинь позволяют смешивать английский язык во входном потоке, не требуя от пользователя изменения языкового режима. Однако он часто имеет некоторые ограничения, такие как требование, чтобы ввод был прописным.

Следующие примеры показывают разницу, если пользователь желает ввести «这个 SQL 漏洞 可以 瘫痪» (эта уязвимость SQL может парализовать всю систему.):

  • «zhe ge [переключиться на английский] SQL [переключиться на китайский] Loudong Keyi Tanhuan zhengge xitong. " (Не поддерживается)
  • «чжэ гэ SQL лубонг кейи танхуань чжэнге ситун». (Поддерживается)
Реализации

Ниже приведены наиболее популярные редакторы методов пиньинь, используемые в Материковом Китае. Их можно бесплатно скачать на их официальных сайтах.

Межплатформенный

  • Механизм метода ввода Rime, механизм метода ввода с открытым исходным кодом для pinyin и других, который поддерживает Windows, macOS и Linux (中州 韻).

Windows

Linux / Unix

  • Fcitx, общий метод ввода, поддерживающий пиньинь с fcitx-pinyin и fcitx-rime, среди многих других схем.
  • Smart Pinyin (scim-pinyin), реализация pinyin для платформы ввода SCIM на Linux, BSD и другие устройства.
  • Bi mspinyin, реализация pinyin для платформы ввода в Linux, BSD и других Unices.
  • OpenVanilla, кроссплатформенной платформе для китайского языка и др.
  • Ibus-Pinyin (ibus-pinyin), реализация pinyin для платформы ввода IBus на Linux, BSD и других Unices.
  • Ibus-sunpinyin, метод ввода пиньинь на основе статистической языковой модели для IBus.

macOS

  • Ввод пиньинь является частью стандартной установки macOS. В версии 10.5.8 и ранее использовался международный стандартный термин ITABC, но в Mac OS X 10.6 он был изменен на «Пиньинь - упрощенный».
  • Fit smart Pinyin является альтернативой стандартному вводу на китайском языке в OS X

Веб

См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-02 06:30:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте