TRON (кодировка)

редактировать
TRON
Язык (и)Английский, китайский, японский, корейский
Созданопроектом TRON
КлассификацияDBCS
Преобразовывает / кодируетJIS X 0208, JIS X 0212, JIS X 0213, GB 2312, KS X 1001, Big5, GB 18030, другие
  • v
  • t

TRON Code - это мульти- байт кодировка символов, использованная в проекте TRON. Он похож на Unicode, но не использует процесс унификации Unicode Han : каждый символ из каждого набора символов CJK кодируется отдельно, включая архаичные и исторические эквиваленты современных символы. Это означает, что тексты на китайском, японском и корейском языках можно смешивать без какой-либо двусмысленности в отношении точной формы символов; однако это также означает, что многие символы с эквивалентной семантикой будут закодированы более одного раза, что усложняет некоторые операции.

В TRON есть место для 150 миллионов кодовых точек. Отдельные кодовые точки для китайского, корейского и японского вариантов более 70 000 символов хань в Unicode 4.1 (если это будет сочтено необходимым) потребуют более 200 000 кодовых точек в TRON. TRON включает не-ханьские символы из Unicode 2.0, но он не поддерживает последние версии Unicode, поскольку Unicode расширяется за пределы Basic Multilingual Plane и добавляет символы в существующие скрипты. Кодировка TRON была обновлена, чтобы включить другие недавние обновления кодовой страницы, такие как JIS X 0213.

Шрифты для кодировки TRON доступны, но у них есть ограничения для коммерческого использования.

Викискладе есть носители, относящиеся к Код TRON.
Содержание
  • 1 Структура
    • 1.1 Управляющие коды
    • 1.2 Символьные коды
    • 1.3 Коды спецификатора языка
    • 1.4 Специальные и escape-коды
    • 1.5 Плоскости
  • 2 См. Также
  • 3 Внешние ссылки
  • 4 Ссылки
Структура

Каждый символ в коде TRON состоит из двух байтов. Подобно ISO / IEC 2022, кодировка символов TRON обрабатывает символы из нескольких наборов символов в рамках одной кодировки символов с помощью управляющих последовательностей, называемых кодами спецификатора языка, для переключения между плоскостями из 48 400 кодовых точек. Наборы символов, включенные в код TRON, включают существующие наборы символов, такие как JIS X 0208 и GB 2312, а также другие источники символов, такие как Dai Kan-Wa Jiten и некоторые сценарии, не включенные в другие кодировки, такие как символы Донгба.

. Благодаря включению полных наборов символов в код TRON многие символы с эквивалентной семантикой кодируются несколько раз; например, все символы кандзи в GT Typeface получают свои собственные кодовые точки, несмотря на то, что многие из них перекрываются с другими наборами символов кандзи, которые уже включены, такими как JIS X 0208. Одним из таких примеров является символ 亜 (расположенный в Unicode в U + 4E9C), который появляется в области JIS X 0208 по адресу 1-3021, области GT Typeface по адресу 2-2464 и области Dai Kan-Wa Jiten по адресу 8-2373.

Управляющие коды

Байты в диапазоне от 0x00 до 0x20 и 0x7F зарезервированы для использования в управляющих кодах.

Коды символов

Символы в каждой плоскости разделены на четыре зоны. Каждая зона выделяется отдельно; например, в плоскости 1 символы JIS X 0208 находятся в зоне A, начиная с 0x2121, символы JIS X 0213 находятся как в зоне A, так и в зоне B, а символы GB 2312 находятся в зоне C, начиная с 0x2180.

ЗонаПервый байтВторой байт
Зона A0x21 - 0x7E0x21 - 0x7E
Зона B0x80 - 0xFD0x21 - 0x7E
Зона C0x21 - 0x7E0x80 - 0xFD
Зона D0x80 - 0xFD0x80 - 0xFD

Кодовые точки обозначены как X-YYYY, где X - это номер плоскости в десятичном формате, а YYYY - это кодовая точка в шестнадцатеричном формате. В качестве альтернативы можно использовать нотацию 0xNNYYYY, где NN - второй байт кода спецификатора языка. Текстовый формат "TNNYYYY;" может использоваться для обозначения кодовой точки TRON в тексте ASCII, аналогично ссылкам на числовые символы в HTML.

Коды спецификатора языка

Коды спецификатора языка имеют префикс 0xFE. Допустимые суффиксы: от 0x21 до 0x7E и от 0x80 до 0xFE, многие из которых нераспределены.

Специальные и управляющие коды

Специальные коды имеют префикс 0xFF.

Плоскости

Ниже приведены плоскости, выделенные для использования в коде TRON, вместе с соответствующими кодами спецификатора языка и описанием наборов символов, включенных в каждую плоскость.

ПлоскостьКод спецификатора языкаОписание
1FE 21JIS X 0208, JIS X 0212, JIS X 0213, GB 2312, KS X 1001 и шрифт Брайля
2FE 22символы гарнитуры GT
3FE 23символы гарнитуры GT продолжение
6FE 26Big5
8FE 28Дай Кан-Ва Дзитен персонажи
9FE 29Дай Кан-Ва Дзитен продолжил: хентайгана и разные символы
10FE 2Aписьменности меньшинств (символы донгба)
16FE 30Unicode 2.0 (кроме CJK Unified и хангыль)
17FE 31Unicode 2.0 (исключая CJK Unified и Hangul) продолжение
22FE 36GB 18030
23FE 37GB 18030 продолжение

Самолеты с 11 по 15 были изначально предназначался для хранения набора символов Модзикё, но из-за разногласий эти самолеты были исключены. Все остальные самолеты до 31 в настоящее время зарезервированы для использования в будущем.

См. Также
Внешние ссылки
Ссылки
Последняя правка сделана 2021-06-09 06:21:18
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте