Элементы управления C1 и дополнение Latin-1 | |
---|---|
Диапазон | U + 0080..U + 00FF. (128 кодовых точек) |
Плоскость | BMP |
Скрипты | Латинский (64 символа). Обычный (64 символа) |
Основные алфавиты | Французский. Немецкий. Исландский. Испанский |
Наборы символов | Пунктуация. Математика. Валюта |
Назначено | 128 кодовых точек. 33 Управление или Формат |
Не используется | 0 зарезервированных кодовых точек |
Стандарты источников | ISO / IEC 8859-1 |
История версий Unicode | |
1.0.0 | 128 (+128) |
Примечание : |
Приложение Latin-1 (также называемое C1 Controls и Latin-1 Supplement ) является вторым блоком Unicode в стандарте Unicode. Он кодирует верхний диапазон ISO 8859-1 : 80 (U + 0080) - FF (U + 00FF). Элементы управления C1 (0080–009F) не являются графическими. Этот блок находится в диапазоне от U + 0080 до U + 00FF, содержит 128 символов и включает элементы управления C1, Latin-1 знаки пунктуации и символы, 30 пар маюскула и минускула с акцентом латинскими буквами и 2 математических оператора.
Элементы управления C1 и дополнительный блок Latin-1 были включены в его нынешнюю форму с тем же набором символов, что и в версии 1.0 стандарта Unicode Standard. Его имя блока в Unicode 1.0 было просто Latin1 .
Блок C1 Controls и Latin-1 Supplement имеет четыре подзаголовка в своей коллекции символов: элементы управления C1, знаки препинания и символы Latin-1, буквы и математические операторы.
Подзаголовок управления C1 содержит 32 дополнительных кода управления, унаследованных от ISO / IEC 8859-1 и многих других стандартов 8-битных символов. Псевдонимы для управляющих кодов C0 и C1 взяты из.
Подзаголовок знаков пунктуации и символов Latin-1 содержит 32 символа общих международных знаков пунктуации, таких как в виде перевернутых восклицательных и вопросительных знаков и средней точки; и символы, такие как знаки валюты, диакритические знаки через интервалы, вульгарные дроби и надстрочные числа.
Подзаголовок «Буквы» содержит 30 пар больших и малых акцентированных или новых латинских символов для западноевропейских языков, и два дополнительных минускульных символа, которые обычно не используются в словах.
Подзаголовок математического оператора используется для знаков умножения и деления.
В таблице ниже показано количество каждой буквы, символа и управляющего кода в каждом подзаголовке в блоке C1 Controls and Latin-1 Supplement.
Тип подзаголовка | Количество символов | Диапазон символов |
---|---|---|
Управление C1 | 32 кода управления | U + 0080 до U + 009F |
Знаки пунктуации и символы Latin-1 | 32 знака пунктуации и символа | U + 00A0 - U + 00BF |
Буквы | 30 пар маюскула и минускула диакритические знаки латинские символы | от U + 00C0 до U + 00D6, от U + 00D8 до U + 00F6 и от U + 00F8 до U + 00FF |
Математические операторы | U + 00D7 × ЗНАК УМНОЖЕНИЯ и U + 00F7 ÷ ЗНАК РАЗДЕЛЕНИЯ. | U + 00D7 и U + 00F7 |
Элементы управления C1 и приложение Latin-1. Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 008x | XXX | XXX | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
U + 009x | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | XXX | SCI | CSI | ST | OSC | PM | APC |
U + 00Ax | NB. SP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | SHY. | ® | ¯ |
U + 00Bx | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
U + 00Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
U + 00Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
U + 00Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
U + 00Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Примечания
|
Дополнительный блок Latin-1 содержит два emoji : U + 00A9 и U + 00AE.
Блок имеет четыре стандартизованных варианта, определенных для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию в текстовую презентацию.
U+ | 00A9 | 00AE |
базовая кодовая точка | © | ® |
base + VS15 (текст) | ©︎ | ®︎ |
base + VS16 (emoji) | ©️ | ®️ |
Следующие документы, связанные с Unicode, описывают цель и процесс определения конкретных символов в блоке Latin-1 Supplement:
Версия | Окончательные кодовые точки | Счетчик | L2 ID | WG2 ID | Документ |
---|---|---|---|---|---|
1.0.0 | U + 0080..009F | 32 | X3L2 / 95-002 | PDAM № 3 согласно ISO / IEC 10646 -1 на коди нг элементов управления C1, 1994-11-01 | |
X3L2 / 95-028 | N1148 | Девять таблиц ответов на повторное / расширенное голосование, 1995-02-22 | |||
N1203 | Умамахесваран, ВС; Ксар, Майк (1995-05-03), "5.3", неподтвержденный протокол совещания 27 SC2 / WG2, Женева | ||||
X3L2 / 95-061 | DAM №3 по ISO / IEC 10646-1 (кодирование C1 Controls), 1995-06-01 | ||||
N1307 | Таблица ответов на бюллетень JTC1 на 10646 DAM 3, Кодирование C1 Controls, (SC2 N 2666), 1996-01-15 | ||||
N1309 | Патерсон, Брюс (1996-01-17), Отчет и размещение комментариев к DAM 1, UTF 16 и DAM 2, UTF-8, DAM 3, Кодирование элементов управления C1 и DAM 4, Удаление Приложения G: UTF1 | ||||
N1312 | Патерсон, Брюс (1996-01-17), проект окончательного текста 10646 AMD-3, кодирование элементов управления C1 | ||||
L2 / 99-048 | Умамахесваран, VS (1999-02-04), C1 контролирует в кодовых таблицах | ||||
L2 / 99-054R | Алипранд, Джоан (1999-06-21), «C1 Controls», Утвержденный протокол встречи UTC / L2 в Пало-Альто, 3 февраля - 5, 1999 | ||||
N3046 | Suignard, Michel (2006-02-22), Улучшение формального определения управляющих символов | ||||
N3103 (pdf, doc ) | Umamaheswaran, VS (2006- 08-25), "M48.33", неподтвержденный протокол собрания 48 WG 2, Moun Тайн Вью, Калифорния, США; 27 апреля 2006 г. | ||||
U + 00A0..00FF | 96 | (подлежит определению) | |||
X3L2 / 94-077 | N994 | Дэвис, Марк (1994-03- 03), ISO / IEC 10646-1 - Предлагаемый проект исправления 1 | |||
X3L2 / 94-098 | N1033 (pdf, doc ) | Umamaheswaran, VS; Ksar, Mike (1994-06 -01), «8.1.15», неподтвержденный протокол совещания 25 ISO / IEC JTC 1 / SC 2 / WG 2, отель Falez, Анталья, Турция, 18 апреля 1994 г. | |||
L2 / 11-016 | Мур, Лиза (2011-02-15), «Исправьте ошибки в присвоении свойств для букв верхнего и нижнего индекса (B.13.4) [U + 00AA, U + 00BA]», UTC # 126 / L2 # 223 Минуты | ||||
L2 / 11-116 | Мур, Лиза (2011-05-17), "Consensus 127-C14", UTC # 127 / L2 # 224 минуты, Измените общую категорию на U + 00AA FEMININE ОБЫЧНЫЙ ИНДИКАТОР и U + 00BA ОБЫЧНЫЙ ИНДИКАТОР МАСКУЛИНА «Lo» для Unicode 6.1. | ||||
L2 / 11-261R2 | Мур, Лиза (2011-08-16), «Consensus 128-C6», UTC # 128 / L2 # 225 Минут, Измените общую категорию с "So" на "Po"... [U + 00A7 и U + 00B6] | ||||
L2 / 15-050R | Дэвис, Марк; и др. ( 2015-01-29), Additio Селекторы окончательных вариантов для смайликов | ||||