Метод ввода Цанцзе | |||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Кодирование «倉 頡 輸入 法» (т. Е. Метод Цанцзе) традиционными китайскими иероглифами | |||||||||||||||||||||||
Традиционный китайский | 倉 頡 輸入 法 | ||||||||||||||||||||||
Упрощенный китайский | 仓 颉 输入 法 | ||||||||||||||||||||||
| |||||||||||||||||||||||
Метод ввода Цанцзе (Метод ввода Цанг-цзе, иногда называемый Чанцзе, Цан Цзе, Чанцзи или Чонгкит ) - это система ввода китайских символов в компьютер с помощью стандартной компьютерной клавиатуры. В именах файлов и в других местах имя Цанцзе иногда сокращается как cj.
Метод ввода был изобретен в 1976 году Чу Бонг-Фу и назван в честь Цанцзе (Цанг-чжи), мифологического изобретателя. китайской письменности, по предложению Чан Вэй-куо, бывшего министра обороны Тайваня. Чу Бонг-Фу выдал патент на Цанцзе в 1982 году, так как считал, что этот метод должен принадлежать китайскому культурному наследию. Таким образом, Cangjie стал программным обеспечением с открытым исходным кодом и присутствует на каждой компьютерной системе, поддерживающей традиционные китайские иероглифы, и он был расширен так, что Cangjie совместим с упрощенным китайским языком набор символов.
Китайская клавиатура в Шек Тонг Цуй Здание муниципальных служб, Гонконг с намеками Цанцзе, напечатанными в нижнем левом углу клавиш. (В правом нижнем и правом верхнем углах напечатаны символы Dayi и символы Zhuyin соответственно.)Cangjie - это первый китайский метод ввода, в котором используется QWERTY клавиатура. Чу увидел, что клавиатура QWERTY стала международным стандартом, и поэтому считал, что ввод на китайском языке должен быть основан на ней. В других, более ранних методах используются большие клавиатуры с 40–2400 клавишами, за исключением метода четырех углов, в котором используются только цифровые клавиши.
В отличие от метода ввода Пиньинь, Цанцзе основан на графическом аспекте символов: каждая графическая единица называется «радикалом » (не путать с радикалы канси ), представлен базовым символьным компонентом, всего 24, каждый из которых сопоставлен с определенной буквенной клавишей на стандартной QWERTY клавиатуре. Дополнительная функция «сложный персонаж» отображается на клавишу X. Клавиши разделены на четыре группы, чтобы облегчить обучение и запоминание. Присвоение кодов китайским иероглифам осуществляется путем разделения составляющих «радикалов» символов.
Основные компоненты символов в Цанцзе называются «радикалами» (字根) или «буквами» (字母). Есть 24 радикала, но 26 ключей; 24 радикала (основные формы 基本 字形) связаны примерно с 76 вспомогательными формами (輔助 字形), которые во многих случаях являются либо повернутыми, либо транспонированными версиями компонентов основных форм.. Например, буква A (日 ) может представлять либо себя, либо немного более широкий 曰, либо поворот на 90 °. (Более полный отчет о 76 с лишним транспозициях и поворотах, чем перечисленные ниже, см. В статье о записи Цанцзе в китайских Викиучебниках.)
24 клавиши размещены по четырем группы:
Группа | Ключ | Имя | Первичное значение |
---|---|---|---|
Философская группа | A | 日солнце | 日, 曰, повернутое на 90 ° 日 (как в 巴) |
B | 月 луна | четыре верхних штриха, 冂, 爫, 冖, верхний и верхний левый часть 炙, 然 и 祭, четыре верхних левых штриха 豹 и 貓 и четыре верхних штриха 骨 | |
C | 金 gold | , 丷, 八, и два предпоследних штриха и 匹 | |
D | 木 дерево | , первые два штриха 寸 и 才, первые два штриха и 皮 | |
E | 水 вода | 氵, последние пять ударов 暴 и 康, 又 | |
F | 火 запускают | форму 小, 灬, первые три удара в 當 и 光 | |
G | 土 наносят | непосредственно, или 士 для солдата | |
Ударная группа | H | 竹 бамбук | наклон и короткий наклон, канси радикал 竹, а именно верхние части в 笨 и 節 |
I | 戈 кинжал топор | точка, первые три штриха в и 庫 и форма 厶 | |
J | 十 ten | Форма креста и форма 宀 | |
K | 大 big | Форма X, включая 乂 и первые два штриха, а также 疒 | |
L | 中 center | вертикальный штрих, а также 衤 и первые четыре штриха 書 и 盡 | |
M | 一 один | горизонтальный штрих, как а также последний штрих 孑 и 刁, форма 厂 и форма 工 | |
N | 弓 лук | арбалет и крюк | |
Часть тела s группа | O | 人 человек | расчленение, радикал канси 人, первые два штриха и 乓, первые два штриха, 攻 и 氣, а также последние два штриха 兆 |
P | 心 сердца | Радикал Канси 忄, второй штрих в 心, последние четыре штриха в, 慕 и 忝, форма 匕, форма 七, предпоследние два штрихи в 代, и форма 勹 | |
Q | 手 рука | Радикал Канси 手 | |
R | 口 рот | Радикал Канси 口 | |
Группа форм персонажей | S | 尸 труп | 匚, первые два штриха, первый штрих и 刀, третий штрих и 豕, первые четыре штриха и 髟 |
T | 廿 двадцать | Два вертикальные штрихи, соединенные горизонтальным штрихом; радикал Канси 艸 при написании как 艹 (независимо от того, соединен ли горизонтальный штрих или сломан) | |
U | 山 гора | Трехсторонний корпус с отверстием наверху | |
V | 女 женщина | Крючок вправо, V-образная форма, последние три штриха в 艮, 衣 и 長 | |
W | 田 поле | Само, а также любое четырехстороннее ограждение с чем-то внутри, включая первое два штриха в и 毋 | |
Y | 卜 гадание | Форма and и повернутые формы, форма 辶, первые два штриха в 斗 | |
Клавиша столкновения / сложности * | X | столкновение 重 / 難/ сложный | (1) устранение неоднозначности коллизий при декомпозиции кода Цанцзе, (2) код для «трудноразлагаемой» части |
Клавиша специального символа * | Z | (см. примечание) | Вспомогательный код, используемый для ввода специальных символов (сам по себе не имеет значения). В большинстве случаев эта клавиша в сочетании с другими клавишами создает китайскую пунктуацию (например,。,。, 「」, 『』). Примечание. В некоторых вариантах вместо X используется Z в качестве ключа столкновения. В этих системах Z имеет имя «столкновение» (重), а X - имя «сложный» (難); но использование Z в качестве ключа столкновения не используется ни в оригинальном Cangjie, ни в текущих основных реализациях. В других вариантах Z может иметь имя "определяемое пользователем" (造) или другое имя. |
Подстановочный знак | Shift + 8 (*) | Подстановочный знак | Он может заменить любую клавишу со 2-го на 5-е место и вернуть список совпадающих комбинаций. Это очень полезно для неизвестных догадок, когда вы уверены в первом и последнем вводе. (например, ввод 竹 * 竹 будет включать в список следующие элементы: 身, 物, 秒, 第) |
Вспомогательные формы каждого радикала Цанцзе немного изменились в разных версиях метода Цанцзе. Таким образом, это одна из причин того, что разные версии метода Цанцзе не полностью совместимы.
Чу Бонг-Фу дал альтернативные названия некоторым буквам в соответствии с их характеристиками. Например, H (竹) также называют 斜, что означает наклон. Имена образуют рифму, чтобы помочь учащимся запомнить буквы, каждая группа находится в строке (звуки последних символов даны в скобках):
Машинист должен быть знаком с несколькими правилами декомпозиции (拆字 規則), которые определяют, как анализировать символ, чтобы получить код Цанцзе..
Правила подчиняются различным принципам:
Некоторые формы всегда декомпозируются одинаково, независимо от того, сказано ли в правилах, что они должны раскладываться таким образом или нет. Количество таких исключений невелико:
Форма | Фиксированная декомпозиция | ||
---|---|---|---|
Версия 2 | Версия 3 | Версия 5 | |
門 (дверь) | 日 弓 (AN) | ||
目 (глаз) | 月 山 (BU) | ||
鬼 (призрак) | 竹 戈 (HI) | 竹 戈 (HI) или HUI | — |
几 (маленькая таблица) | 竹 山 (HU) | 竹 弓 (HN) | |
贏 (победа) | — | 卜 口月 月 弓 (YRBBN) | 卜 弓 月 山 金 (YNBUC) |
虍 (тигр [радикал]) | 卜 心 (YP) | ||
亡 поверх 口 (吂) | 卜 口 (YR) | 卜 女 口 (YVR) | |
隹 (птица) | 人 土 (OG) | ||
气 (воздух [ радикальный]) | 人 山 (OU) | 人 弓 (ON) | 人 一 弓 (OMN) |
畿 минус 田 | 女 戈 (VI) | ||
鬥 (конкурировать) | 中 弓 (LN) | ||
阝 (курган или городской радикал) | 弓 中 (NL) |
Некоторые формы не могут разложиться. Они представлены знаком X, который является клавишей 難 на клавиатуре Цанцзе.
Форма | Фиксированное разложение (v5) |
---|---|
臼 | HX |
與 | HXYC |
興 | HXBC |
盥 | HXBT |
姊 | VLXH |
齊 | YX |
兼 | TXC |
鹿 | IXP |
身 | HXH |
卍 | NX |
黽 | RXU |
龜 | NXU |
廌 | IXF |
慶 | IXE |
淵 | ELXL |
肅 | LX |
Изначально метод ввода Цанцзе не предназначался для создания символа в каком-либо наборе символов. Вместо этого он был частью интегрированной системы, состоящей из правил ввода Цанцзе и платы контроллера Цанцзе. Эта плата контроллера содержит генератор символов прошивку, которая динамически генерирует китайские символы из кодов Цанцзе при выводе символов, используя графический режим высокого разрешения Apple II компьютер. В предисловии к руководству пользователя Цанцзе, Чу Бон-Фу написал в 1982 году:
[в переводе]. Что касается вывода: Вывод и ввод, в факт, [образуют] единое целое; нет причин, по которым [они должны быть] догматически разделены на два разных объекта.… Это фактически необходимо.…
В этой ранней системе, когда пользователь набирает, например, «yk», чтобы получить китайский иероглиф 文коды Цанцзе не преобразуются в кодировку символов, и сохраняется фактическая строка «yk». Код Цанцзе для каждого символа (строка из 1–5 строчных букв плюс пробел) был кодировкой этого конкретного символа.
Демонстрация способности генератора символов Минчжу генерировать символы в соответствии с кодами. Ни один из примеров не включен в Unicode. Первый символ - ⿰ 飠 它, что в Сюйчжоу обозначает разновидность супа. Другие символы никогда не записываются.Особенностью этой ранней системы является то, что, если кто-то посылает ей случайные строчные слова, генератор символов будет пытаться построить китайские символы в соответствии с правилами разложения Цанцзе, что иногда вызывает странные, неизвестные персонажи появятся. Эта непреднамеренная функция, «автоматическая генерация символов», описана в руководстве и отвечает за создание более 10 000 из 15 000 символов, которые может обработать система. Имя Цанцзе, напоминающее о создании новых персонажей, действительно подходило для этой ранней версии Цанцзе.
Наличие встроенного генератора символов также объясняет историческую необходимость существования клавиши «X», которая используется для устранения неоднозначности коллизий декомпозиции: поскольку символы «выбираются», когда коды «выводятся» ", каждый символ, который может отображаться, фактически должен иметь уникальное разложение Цанцзе. Для системы было бы нецелесообразно - да и практично - предоставлять выбор символов-кандидатов при отображении произвольного текстового файла, поскольку пользователь не будет знать, какой из кандидатов правильный.
Cangjie была разработана как простая в использовании система, помогающая продвигать использование китайских компьютеров. Однако многие пользователи считают, что Цанцзе трудно выучить и использовать, причем многие трудности вызваны плохим обучением.
При достаточной практике пользователи могут преодолеть вышеуказанные проблемы. Типичные слепые машинисты могут печатать на китайском со скоростью 25 символов в минуту (cpm) или выше, используя Цанцзе, несмотря на трудности с запоминанием списка вспомогательных форм или правил разложения. По имеющимся данным, опытные машинистки Цанцзе могут набирать со скоростью от 60 до 200 копий в минуту.
Декомпозиция символа зависит от заранее определенного набора «стандартных форм» (標準 字形). Однако, поскольку в разных странах существует множество вариаций Цанцзе, стандартная форма определенного персонажа в Цанцзе не всегда та, которую пользователь усвоил раньше. Изучение Цанцзе влечет за собой изучение не только самой Цанцзе, но и незнакомых стандартных форм некоторых персонажей. Редактор метода ввода Cangjie (IME) не обрабатывает ошибки при декомпозиции, кроме как информирует пользователя (обычно звуковым сигналом) об ошибке. Однако изначально Цанцзе предназначался для присвоения разных кодов разным вариантам персонажа. Например, в Cangjie, доступном в Windows, код для 產 - YHHQM, что соответствует не форме этого символа, а другому варианту, 産. Это проблема, связанная с реализацией Cangjie в Windows. В оригинальном Цанцзе 產 должно быть YKMHM (первая часть - 文), а 産 - YHHQM (первая часть - 产).
Знаки препинания не разлагаются геометрически, а имеют заранее заданные коды, которые начинаются с ZX, за которым следует строка из трех букв, связанных с порядком знаков в коде Big5. (Этот набор кодов был добавлен в Cangjie в традиционной китайской версии Windows 95. В Windows 3.1 в Cangjie не было набора кодов для знаков препинания.) Таким образом, ввод знаков препинания в Cangjie становится утомительным упражнением, требующим либо запоминания, либо выбора -и-клевать. Однако в современных системах это решается путем доступа к виртуальной клавиатуре на экране (в Windows это активируется нажатием Ctrl + Alt + запятая).
Типичные ошибки не считаются альтернативными кодами. Например, если не разложить 方 сверху вниз на YHS, а вместо этого ввести YSH в соответствии с порядком штрихов, Цанцзе не вернет символ 方 в качестве варианта выбора.
Поскольку для Цанцзе требуются все 26 клавиш клавиатуры QWERTY, его нельзя использовать для ввода китайских иероглифов на обычных телефонах, которые имеют только 12-клавишную клавиатуру. Альтернативные методы ввода, такие как Zhuyin, 5-тактный (или 9-тактный Motorola ) и метод ввода Q9, вместо этого используются.
Обычно говорят, что метод ввода Цанцзе прошел через пять поколений (обычно называемых «версиями» на английском языке), каждое из которых немного несовместимо с другими. В настоящее время версия 3 (第三 代 倉 頡) является наиболее распространенной и изначально поддерживается Microsoft Windows. Версия 5 (第五 代 倉 頡), поддерживаемая Free Cangjie IME и ранее единственная Cangjie, поддерживаемая SCIM, представляет собой метод значительного меньшинства и поддерживается iOS.
Ранняя система Cangjie Поддерживаемая картой Zero One на Apple II была Версия 2; Версия 1 так и не была выпущена.
Метод ввода Цанцзе, поддерживаемый в классической Mac OS, похож как на версию 3, так и на версию 5.
Версия 5, как и исходный метод ввода Цанцзе, была создана непосредственно Чу. Он надеялся, что выпуск Версии 5, изначально намеченной как Версия 6, положит конец «более чем десяти версиям метода ввода Цанцзе» (слегка несовместимые версии, созданные разными поставщиками).
Версия 6 еще не выпущена для широкой публики, но используется для создания базы данных, которая может точно хранить любой исторический китайский текст.
Большинство современных реализаций Cangjie (IME) предоставляют различные удобные функции:
Помимо ключа подстановки, многие из этих функций удобны для обычных пользователей, но не подходят для слепых печатников, поскольку они делают Cangjie IME непредсказуемым.
Были также разные попытки «упростить» Цанцзе тем или иным способом:
Многие исследователи обсуждали способы разложить китайские иероглифы на их основные компоненты и попытаться создать приложения на основе системы разложения. Идею можно назвать исследованием [ж ]. Коды Цанцзе предлагают основу для таких усилий. Academia Sinica на Тайване и Университет Цзяотун в Шанхае также имеют похожие проекты.
Одно прямое применение использования разложенных символов - это возможность вычисления сходства между разными китайскими иероглифами. Метод ввода Цанцзе - хорошая отправная точка для такого рода приложений. Ослабив ограничение в пять кодов для каждого китайского символа и приняв более подробные коды Цанцзе, визуально похожие символы можно найти путем вычислений. Интеграция этого с информацией о произношении позволяет изучать китайские иероглифы с помощью компьютера.
[Перевод]. Это не проблема; есть также вспомогательные формы для восполнения недостатков радикалов. Вспомогательные формы являются вариациями формы радикалов, [и поэтому] их легко запомнить.
[Перевод]. Добавлен словарь [к этой книге] основан на 4800 стандартных, обычно используемых иероглифах, провозглашенных Министерством образования. Если добавить к этому автоматически генерируемые символы, количество символов составляет около 15 000 (с использованием словаря Kangxi в качестве основы).
На Викискладе есть материалы, связанные с методом ввода Цанцзе. |