C0 контролирует и Basic Latin | |
---|---|
Диапазон | U + 0000..U + 007F. ( 128 кодовых точек) |
Плоскость | BMP |
Скрипты | Латинский (52 символа). Обычный (76 символов) |
Основные алфавиты | Английский. Французский. Немецкий. Испанский. Вьетнамский |
Наборы символов | Арабские цифры. Знаки пунктуации |
Назначены | 128 кодовых точек. 33 Управление или Формат |
Не используется | 0 зарезервированных кодовых точек |
Стандарты источника | ISO / IEC 8859, ISO 646 |
История версий Unicode | |
1.0.0 | 128 (+128) |
Примечание : |
Элементы управления Basic Latin или C0 и Basic Latin Блок Unicode является первым блоком стандарта Unicode, и единственный блок, который закодирован одним байтом в UTF-8. Блок содержит все буквы и управляющие коды кодировки ASCII. Он варьируется от U + 0000 до U + 007F, содержит 128 символов и включает элементы управления C0, символы пунктуации ASCII и символы, ASCII цифры, как верхний регистр и нижний регистр английского алфавита, так и контрольный символ .
Базовый латинский блок был включен в его нынешнем виде из версии 1.0.0 стандарта Unicode, без добавления или изменения репертуара символов. Его имя блока в Unicode 1.0 было ASCII .
Элементы управления C0 и Basic Латинский блок содержит шесть подзаголовков.
Элементы управления C0, называемые управляющими кодами C0 ASCII в версии 1.0, унаследованы от ASCII и других 7-битных и 8-битные схемы кодирования. Имена псевдонимов для элементов управления C0 взяты из стандарта.
Этот подзаголовок относится к стандартным знакам пунктуации, простым математическим операторам и таким символам, как знак доллара, процент, амперсанд, подчеркивание и вертикальная черта.
Подзаголовок ASCII Digits содержит стандартные европейские цифровые символы 1–9 и 0.
Подзаголовок верхнего регистра латинского алфавита содержит стандартный 26-буквенный латинский алфавит без ударения в majuscule.
Подзаголовок нижнего регистра латинского алфавита содержит стандартный 26-буквенный латинский алфавит без ударения в минускуле.
Подзаголовок управляющего символа содержит символ «Удалить».
В таблице ниже показано количество букв, символов и управляющих кодов в каждом из подзаголовков в C0 Co. ntrols и блок Basic Latin.
Тип подзаголовка | Количество символов | Диапазон символов |
---|---|---|
Управление C0 | 32 управляющих кода | От U + 0000 до U + 001F |
Знаки препинания и символы ASCII | 33 знака препинания и символы | от U + 0020 до U + 002F, от U + 003A до U + 0040, от U + 005B до U + 0060 и от U + 007B до U + 007E |
цифры ASCII | 10 цифр | от U + 0030 до U + 0039 |
прописные латинские буквы | 26 латинских букв без ударения в маюскуле. | U + 0041 до U + 005A |
Строчный латинский алфавит | 26 латинских букв без ударения в минускуле. | U + 0061 до U + 007A |
Управляющий символ | 1 управляющий код, содержащий символ «Удалить». | U + 007F |
C0 Controls и Basic Latin. Официальная таблица кодов Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
U + 001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
U + 002x | SP | ! | " | # | $ | % | ' | ( | ) | * | + | , | - | . | / | |
U + 003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U + 004x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U + 005x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U + 006x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U + 007x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
Примечания
|
Некоторые символы определены для отображения как стандартизованный вариант, если следовать по вариантным показателям.
Для нуля с коротким диагональным штрихом определен вариант: U + 0030 DIGIT ZERO, U + FE00 VS1 (0︀).
Двенадцать символов (#, * и цифры) может сопровождаться U + FE0E VS15 или U + FE0F VS16 для создания вариантов эмодзи. Это keycap базовые символы, например # ️⃣ (U + 0023 NUMBER SIGN U + FE0F VS16 U + 20E3 COMBINING ENCLOSING KEYCAP). Версия VS15 - это «текстовое представление», а версия VS16 - «стиль эмодзи».
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
base | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
base+VS15+keycap | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
base+VS16+keycap | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
Следующие документы, связанные с Unicode, фиксируют цель и процесс определения конкретных символов в блоке Basic Latin:
Версия | Конечные точки кода | Счетчик | UTC ID | L2 ID | WG2 ID | Документ |
---|---|---|---|---|---|---|
1.0.0 | U+0000..007F | 128 | (подлежит определению) | |||
UTC / 1999-013 | Карлссон, Кент (1999-05-27), Тильдес и декомпозиции микроподвески | |||||
L2 / 99-176R | Мур, Лиза (1999-11-04), "Micro Sign Case Mappings", Протоколы совместной встречи UTC / L2 в Сиэтле, 8-10 июня 1999 г. | |||||
L2 / 04-145 | Старнер, Дэвид (2004-04-30), C с примерами символов штрихов из отчета BAE 1884 (Дорси) | |||||
L2 / 04-202 | Андерсон, Дебора (2004- 06-07), Срезанная обратная связь C | |||||
N3046 | Suignard, Michel (22.02.2006), Улучшение формального определения управляющих символов | |||||
N3103 (pdf, doc ) | Umamaheswaran, VS (25 августа 2006 г.), "M48.33", неподтвержденный протокол собрания 48 Рабочей группы 2, Маунтин-Вью, Калифорния, США; 27 апреля 2006 г. | |||||
L2 / 11-043 | Фрейтаг, Асмус; Карлссон, Кент (02.02.2011), Предложение по исправлению ошибок и несоответствий в присвоении определенных свойств для букв верхнего и нижнего индекса | |||||
L2 / 11-160 | PRI # 181 Изменение общей категории двенадцати символов, 2011-05 -02 | |||||
L2 / 11-261R2 | Мур, Лиза (2011-08-16), «Консенсус 128-C3», UTC # 128 / L2 # 225 минут, Примите рекомендации Кена Уистлера в L2 / 11-281 о псевдонимах имен для управляющих символов с добавлением сокращений BEL и NUL. | |||||
L2 / 11-438 | N4182 | Эдберг, Питер (2011-12-22), Emoji Variation Sequences (Revision из L2 / 11-429) | ||||
L2 / 15-107 | Мур, Лиза (2015-05-12), «Consensus 143-C5», UTC # 143 Минуты, Добавьте 12 последовательностей клавиш в emoji-data.txt как временные именованные последовательности в Unicode 8.0. | |||||
L2 / 15-268 | Битон, Барбара; Фрейтаг, Асмус; Янку, Лауреньиу; Сарджент, Мюррей (30.10.2015), Предложение по представлению варианта с нулевым косым чертом пустого множества | |||||
L2 / 15-301 | Пурнадер, Рузбех (01.11.2015), Предложение для 278 стандартизированных последовательностей вариантов для эмодзи | |||||
L2 / 15-254 | Мур, Лиза (2015-11-16), «B.12.1.2 Предложение по представлению варианта с нулевым косым чертом для пустого набора», UTC # 145 Минуты | |||||
L2 / 17-294 | N4914 | Лунде, Кен (2017-08-14), Предложение о добавлении стандартизированной последовательности вариантов для U + FF10 FULLWIDTH DIGIT ZERO | ||||