Базовая латиница (блок Unicode)

редактировать
Блок символов Unicode
C0 контролирует и Basic Latin
ДиапазонU + 0000..U + 007F. ( 128 кодовых точек)
ПлоскостьBMP
СкриптыЛатинский (52 символа). Обычный (76 символов)
Основные алфавитыАнглийский. Французский. Немецкий. Испанский. Вьетнамский
Наборы символовАрабские цифры. Знаки пунктуации
Назначены128 кодовых точек. 33 Управление или Формат
Не используется0 зарезервированных кодовых точек
Стандарты источникаISO / IEC 8859, ISO 646
История версий Unicode
1.0.0128 (+128)
Примечание :

Элементы управления Basic Latin или C0 и Basic Latin Блок Unicode является первым блоком стандарта Unicode, и единственный блок, который закодирован одним байтом в UTF-8. Блок содержит все буквы и управляющие коды кодировки ASCII. Он варьируется от U + 0000 до U + 007F, содержит 128 символов и включает элементы управления C0, символы пунктуации ASCII и символы, ASCII цифры, как верхний регистр и нижний регистр английского алфавита, так и контрольный символ .

Базовый латинский блок был включен в его нынешнем виде из версии 1.0.0 стандарта Unicode, без добавления или изменения репертуара символов. Его имя блока в Unicode 1.0 было ASCII .

Содержание

  • 1 Таблица символов
  • 2 Подзаголовки
    • 2.1 Элементы управления C0
    • 2.2 Пунктуация и символы ASCII
    • 2.3 Цифры ASCII
    • 2.4 Верхний регистр латинского алфавита
    • 2.5 Нижний регистр латинского алфавита
    • 2.6 Управляющий символ
  • 3 Количество символов, букв и управляющих кодов
  • 4 Блок
  • 5 Варианты
  • 6 История
  • 7 См. Также
  • 8 Ссылки

Таблица символов

КодРезультатОписаниеАкроним
C0 контролирует
U + 0000Нулевой символ NUL
U + 0001Начало заголовка SOH
U + 0002Начало текста STX
U + 0003Конец -текстовый символ ETX
U + 0004Символ конца передачи EOT
U + 0005Знак запроса ENQ
U + 0006Символ подтверждения ACK
U + 0007Символ звонка BEL
U + 0008Backspace BS
U + 0009Горизонтальная вкладка HT
U + 000AПеревод строки LF
U + 000BВертикальная табуляция VT
U + 000CПодача страницы FF
U + 000DВозврат каретки CR
U + 000EShift Out SO
U + 000FВходной сдвиг SI
U + 0010Выход из канала передачи данных DLE
U + 0011Управление устройством 1 DC1
U + 0012Контроль устройств 2 DC2
U + 0013Контроль устройств 3 DC3
U + 0014Контроль устройств 4 DC4
U + 0015Отрицательный -символ подтверждения NAK
U + 0016Synchronous Idle SYN
U + 0017Конец блока передачи ETB
U + 0018Отмена символа CAN
U + 0019Конец среды EM
U + 001AЗамещающий символ SUB
U + 001BEscape-символ ESC
U + 001CРазделитель файлов FS
U + 001DРазделитель групп GS
U + 001EРазделитель записей RS
U + 001FРазделитель единиц US
Пунктуация и символы ASCII
U + 0020Пробел SP
U + 0021!Восклицательный знак EXC
U +0022"Кавычка QUO
U + 0023#Число s ign
U + 0024$Знак доллара
U + 0025%Знак процента
U + 0026Амперсанд
U + 0027'Апостроф
U + 0028(Левая скобка
U + 0029)Правая скобка
U + 002A*Звездочка
U + 002BЗнак плюс
U + 002C,Запятая
U + 002D-Дефис-минус
U + 002E.Точка или период
U + 002F/Солидус или Косая черта
цифры ASCII
U + 00300Нулевая цифра
U + 00311Первая цифра
U + 00322Вторая цифра
U + 00333Третья цифра
U + 00344Четвертая цифра
U + 00355Пятерка
U + 00366Шесть цифр
U + 00377Седьмая цифра
U + 00388Восьмая цифра
U + 00399Девятая цифра
Пунктуация и символы ASCII
U + 003A:Двоеточие
U + 003B;Точка с запятой
U + 003C<Знак «меньше»
U + 003D=Знак равенства
U + 003E>Знак больше
U + 003F?Знак вопроса
U + 0040@Знак или Коммерческая в
Заглавная латинская буква
U + 0041AЛатинская заглавная буква A
U + 0042BЛатинская буква Ca заглавная буква B
U + 0043Cзаглавная латинская буква C
U + 0044Dзаглавная латинская буква D
U + 0045Eзаглавная латинская буква E
U + 0046FЗаглавная латинская буква F
U + 0047GЗаглавная латинская буква G
U + 0048HЗаглавная латинская буква H
U + 0049IЗаглавная латинская буква I
U + 004AJЗаглавная латинская буква J
U + 004BKЗаглавная латинская буква K
U + 004CLЗаглавная латинская буква L
U + 004DMЗаглавная латинская буква M
U + 004ENЗаглавная латинская буква N
U + 004FOЗаглавная латинская буква O
U + 0050PЗаглавная латинская буква P
U + 0051QЗаглавная латинская буква Q
U + 0052RЗаглавная латинская буква R
U + 0053SЗаглавная латинская буква S
U + 0054TЗаглавная латинская буква T
U + 0055UЗаглавная латинская буква U
U + 0056VЗаглавная латинская буква V
U + 0057WЗаглавная латинская буква W
U + 0058XЗаглавная латинская буква X
U + 0059YЗаглавная латинская буква буква Y
U + 005AZзаглавная латинская буква Z
пунктуация и символы ASCII
U + 005B[Левая квадратная скобка
U + 005C\Обратная косая черта
U + 005D]Правая квадратная скобка
U + 005E^Круговой акцент
U + 005F_Нижняя линия
U + 0060`Могильный акцент
Строчная латинская буква
U + 0061aЛатинская строчная буква A
U + 0062bЛатинская строчная буква B
U + 0063cЛатинская строчная буква C
U + 0064dЛатинская строчная буква D
U + 0065eЛатинская строчная буква E
U + 0066fЛатинская строчная буква F
U + 0067gЛатинская строчная буква G
U + 0068hЛатинская строчная буква H
U + 0069iЛатинская строчная буква I
U + 006AjЛатинская строчная буква J
U + 006BkЛатинская строчная буква K
U + 006ClЛатинская строчная буква L
U + 006DmЛатинская строчная буква M
U + 006EnЛатинская строчная буква N
U + 006FoЛатинская строчная буква O
U + 0070pЛатинская строчная буква P
U + 0071qЛатинская строчная буква Q
U + 0072rЛатинская строчная буква R
U + 0073sЛатинская строчная буква S
U + 0074tЛатинская строчная буква T
U + 0075uЛатинская строчная буква U
U + 0076vлати n Строчная буква V
U + 0077wСтрочная латинская буква W
U + 0078xСтрочная латинская буква X
U + 0079yСтрочная латинская буква Y
U + 007AzЛатинская строчная буква Z
Пунктуация и символы ASCII
U + 007B{Левая фигурная скобка
U + 007C|Вертикальная черта
U + 007D}Правая фигурная скобка
U + 007E~Тильда
Управляющий символ
U + 007FУдалить DEL
Буква U + 005C (\) может отображаться как йена (¥) или вон ( ₩) подписываются японскими / корейскими шрифтами, ошибочно принимая Unicode (особенно UTF-8 ) за устаревший набор символов, в котором обратная косая черта заменяется этими знаками.

Подзаголовки

Элементы управления C0 и Basic Латинский блок содержит шесть подзаголовков.

Элементы управления C0

Элементы управления C0, называемые управляющими кодами C0 ASCII в версии 1.0, унаследованы от ASCII и других 7-битных и 8-битные схемы кодирования. Имена псевдонимов для элементов управления C0 взяты из стандарта.

Пунктуация и символы ASCII

Этот подзаголовок относится к стандартным знакам пунктуации, простым математическим операторам и таким символам, как знак доллара, процент, амперсанд, подчеркивание и вертикальная черта.

Цифры ASCII

Подзаголовок ASCII Digits содержит стандартные европейские цифровые символы 1–9 и 0.

Прописные латинские буквы алфавит

Подзаголовок верхнего регистра латинского алфавита содержит стандартный 26-буквенный латинский алфавит без ударения в majuscule.

нижний регистр латинского алфавита

Подзаголовок нижнего регистра латинского алфавита содержит стандартный 26-буквенный латинский алфавит без ударения в минускуле.

Управляющий символ

Подзаголовок управляющего символа содержит символ «Удалить».

Количество символов, букв и управляющих кодов

В таблице ниже показано количество букв, символов и управляющих кодов в каждом из подзаголовков в C0 Co. ntrols и блок Basic Latin.

Тип подзаголовкаКоличество символовДиапазон символов
Управление C032 управляющих кодаОт U + 0000 до U + 001F
Знаки препинания и символы ASCII33 знака препинания и символыот U + 0020 до U + 002F, от U + 003A до U + 0040, от U + 005B до U + 0060 и от U + 007B до U + 007E
цифры ASCII10 цифрот U + 0030 до U + 0039
прописные латинские буквы26 латинских букв без ударения в маюскуле.U + 0041 до U + 005A
Строчный латинский алфавит26 латинских букв без ударения в минускуле.U + 0061 до U + 007A
Управляющий символ1 управляющий код, содержащий символ «Удалить».U + 007F

Блок

C0 Controls и Basic Latin. Официальная таблица кодов Unicode Consortium (PDF)
0123456789ABCDEF
U + 000xNULSOHSTXETXEOTENQACKBELBSHTLFVTFFCRSOSI
U + 001xDLEDC1DC2DC3DC4NAKSYNETBCANEMSUBESCFSGSRSUS
U + 002xSP!"#$%'()*+,-./
U + 003x0123456789:;<=>?
U + 004x@ABCDEFGHIJKLMNO
U + 005xPQRSTUVWXYZ[\]^_
U + 006x`abcdefghijklmno
U + 007xpqrstuvwxyz{|}~DEL
Примечания
1.^Начиная с версии Unicode 13.0

Варианты

Некоторые символы определены для отображения как стандартизованный вариант, если следовать по вариантным показателям.

Для нуля с коротким диагональным штрихом определен вариант: U + 0030 DIGIT ZERO, U + FE00 VS1 (0︀).

Двенадцать символов (#, * и цифры) может сопровождаться U + FE0E VS15 или U + FE0F VS16 для создания вариантов эмодзи. Это keycap базовые символы, например # ️⃣ (U + 0023 NUMBER SIGN U + FE0F VS16 U + 20E3 COMBINING ENCLOSING KEYCAP). Версия VS15 - это «текстовое представление», а версия VS16 - «стиль эмодзи».

Последовательности вариаций эмодзи
U+0023002A0030003100320033003400350036003700380039
base#*0123456789
base+VS15+keycap#︎⃣*︎⃣0︎⃣1︎⃣2︎⃣3︎⃣4︎⃣5︎⃣6︎⃣7︎⃣8︎⃣9︎⃣
base+VS16+keycap#️⃣*️⃣0️⃣1️⃣2️⃣3️⃣4️⃣5️⃣6️⃣7️⃣8️⃣9️⃣

История

Следующие документы, связанные с Unicode, фиксируют цель и процесс определения конкретных символов в блоке Basic Latin:

Версия Конечные точки кодаСчетчикUTC IDL2 IDWG2 IDДокумент
1.0.0U+0000..007F128(подлежит определению)
UTC / 1999-013 Карлссон, Кент (1999-05-27), Тильдес и декомпозиции микроподвески
L2 / 99-176R Мур, Лиза (1999-11-04), "Micro Sign Case Mappings", Протоколы совместной встречи UTC / L2 в Сиэтле, 8-10 июня 1999 г.
L2 / 04-145 Старнер, Дэвид (2004-04-30), C с примерами символов штрихов из отчета BAE 1884 (Дорси)
L2 / 04-202 Андерсон, Дебора (2004- 06-07), Срезанная обратная связь C
N3046 Suignard, Michel (22.02.2006), Улучшение формального определения управляющих символов
N3103 (pdf, doc )Umamaheswaran, VS (25 августа 2006 г.), "M48.33", неподтвержденный протокол собрания 48 Рабочей группы 2, Маунтин-Вью, Калифорния, США; 27 апреля 2006 г.
L2 / 11-043 Фрейтаг, Асмус; Карлссон, Кент (02.02.2011), Предложение по исправлению ошибок и несоответствий в присвоении определенных свойств для букв верхнего и нижнего индекса
L2 / 11-160 PRI # 181 Изменение общей категории двенадцати символов, 2011-05 -02
L2 / 11-261R2 Мур, Лиза (2011-08-16), «Консенсус 128-C3», UTC # 128 / L2 # 225 минут, Примите рекомендации Кена Уистлера в L2 / 11-281 о псевдонимах имен для управляющих символов с добавлением сокращений BEL и NUL.
L2 / 11-438 N4182 Эдберг, Питер (2011-12-22), Emoji Variation Sequences (Revision из L2 / 11-429)
L2 / 15-107 Мур, Лиза (2015-05-12), «Consensus 143-C5», UTC # 143 Минуты, Добавьте 12 последовательностей клавиш в emoji-data.txt как временные именованные последовательности в Unicode 8.0.
L2 / 15-268 Битон, Барбара; Фрейтаг, Асмус; Янку, Лауреньиу; Сарджент, Мюррей (30.10.2015), Предложение по представлению варианта с нулевым косым чертом пустого множества
L2 / 15-301 Пурнадер, Рузбех (01.11.2015), Предложение для 278 стандартизированных последовательностей вариантов для эмодзи
L2 / 15-254 Мур, Лиза (2015-11-16), «B.12.1.2 Предложение по представлению варианта с нулевым косым чертом для пустого набора», UTC # 145 Минуты
L2 / 17-294 N4914 Лунде, Кен (2017-08-14), Предложение о добавлении стандартизированной последовательности вариантов для U + FF10 FULLWIDTH DIGIT ZERO

См. Также

Ссылки

  1. ^«База данных символов Unicode». Стандарт Юникода. Проверено 9 июля 2016 г.
  2. ^«Перечисленные версии стандарта Unicode». Стандарт Юникода. Проверено 9 июля 2016 г.
  3. ^Стандарт Unicode версии 1.0, том 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  4. ^" 3.8: Блок-за-блок-схемы » (PDF). Стандарт Юникода. версия 1.0. Консорциум Unicode.
  5. ^Сортировка всего: когда обратная косая черта не является обратной?
  6. ^ «Таблицы кодов Unicode 6.2» (PDF). Стандарт Юникода. Проверено 1 апреля 2013 г.
  7. ^Битон, Барбара; Фрейтаг, Асмус; Янку, Лауреньиу; Сарджент, Мюррей (30 октября 2015 г.). «L2 / 15-268: Предложение по представлению варианта пустого набора с нулевой косой чертой» (PDF).
  8. ^ «Последовательности вариаций эмодзи UTS # 51». Консорциум Unicode.
  9. ^Эдберг, Питер (2011-12-22). «L2 / 11-438: последовательности вариаций эмодзи (пересмотр L2 / 11-429)» (PDF).
  10. ^Пурнадер, Рузбех (2015-11-01). «L2 / 15-301: предложение по 278 стандартизированным последовательностям вариантов для смайликов» (PDF).
  11. ^«UTR # 51: Unicode Emoji». Консорциум Unicode. 2020-02-11.
  12. ^«UCD: данные эмодзи для UTR №51». Консорциум Unicode. 2020-01-28.
Последняя правка сделана 2021-05-11 13:55:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте