Дополнение Latin-1 (блок Unicode)

редактировать
Блок символов Unicode
Элементы управления C1 и дополнение Latin-1
ДиапазонU + 0080..U + 00FF. (128 кодовых точек)
ПлоскостьBMP
СкриптыЛатинский (64 символа). Обычный (64 символа)
Основные алфавитыФранцузский. Немецкий. Исландский. Испанский
Наборы символовПунктуация. Математика. Валюта
Назначено128 кодовых точек. 33 Управление или Формат
Не используется0 зарезервированных кодовых точек
Стандарты источниковISO / IEC 8859-1
История версий Unicode
1.0.0128 (+128)
Примечание :

Приложение Latin-1 (также называемое C1 Controls и Latin-1 Supplement ) является вторым блоком Unicode в стандарте Unicode. Он кодирует верхний диапазон ISO 8859-1 : 80 (U + 0080) - FF (U + 00FF). Элементы управления C1 (0080–009F) не являются графическими. Этот блок находится в диапазоне от U + 0080 до U + 00FF, содержит 128 символов и включает элементы управления C1, Latin-1 знаки пунктуации и символы, 30 пар маюскула и минускула с акцентом латинскими буквами и 2 математических оператора.

Элементы управления C1 и дополнительный блок Latin-1 были включены в его нынешнюю форму с тем же набором символов, что и в версии 1.0 стандарта Unicode Standard. Его имя блока в Unicode 1.0 было просто Latin1 .

Содержание

  • 1 Таблица символов
  • 2 Подзаголовка
    • 2.1 Элементы управления C1
    • 2.2 Знаки пунктуации и символы Latin-1
    • 2.3 Буквы
    • 2.4 Математический оператор
  • 3 Количество символов, букв и управляющих кодов
  • 4 Компактная таблица
  • 5 Emoji
  • 6 История
  • 7 См. Также
  • 8 Ссылки

Таблица символов

КодРезультатОписаниеАкроним
C1 Элементы управления
U + 0080Символ заполненияPAD
U +0081Предустановка старшего октетаHOP
U + 0082Разрыв разрешен здесьBPH
U + 0083Здесь нет разрываNBH
U + 0084IndexIND
U + 0085Следующая строка NEL
U + 0086Начало выбранной областиSSA
U + 0087Конец выделенной областиESA
U + 0088Набор символов (по горизонтали) табуляцииHTS
U + 0089Табуляция символов (по горизонтали) с выравниваниемHTJ
U + 008AНабор строк (вертикальная) табуляцииLTS
U + 008BНеполная линия вперед (вниз)PLD
U + 008CЧастичная линия назад (вверх)PLU
U + 008Dобратный перевод строки (индекс)RI
U + 008Eодносменный двойнойSS2
U + 008FТри в одну сменуSS3
U + 0090Строка управления устройствомDCS
U + 0091Частное использование ОдинPU1
U + 0092Частное использование ДваPU2
U + 0093Установить состояние передачиSTS
U + 0094Символ отмены CCH
U + 0095Ожидающее сообщениеMW
U + 0096Начало защищенной областиSPA
U + 0097Конец защищенной областиEPA
U + 0098Начало строкиSOS
U + 0099Введение одного графического символаSGCI
U + 009Aодносимвольный вводный элементSCI
U + 009Bконтрольный вводный элемент CSI
U + 009Cтерминатор конца строкиST
U + 009DКоманда операционной системыOSC
U + 009EЛичное сообщениеPM
U + 009FКоманда прикладной программыAPC
Пунктуация и символы Latin-1
U + 00A0Неразрывный пробел NBSP
U + 00A1¡Перевернутый восклицательный знак
U + 00A2¢Знак цент
U + 00A3£Знак фунта
U + 00A4¤Знак валюты
U + 00A5¥Знак йены
U + 00A6¦Прерывистая полоса
U + 00A7§Знак раздела
U + 00A8¨Диэрезис
U + 00A9©Знак авторских прав
U + 00AAªЖенский порядковый номер
U + 00AB«Двойная угловая кавычка, указывающая влево
U + 00AC¬Не знак
U + 00ADМягкий дефис SHY
U + 00AE®Зарегистрированный знак
U + 00AF¯Macron
U + 00B0°Символ степени
U + 00B1±Знак плюс-минус
U + 00B2²Верхний индекс два
U + 00B3³Верхний индекс три
U + 00B4´Острый ударение
U + 00B5µМикроподпись
U + 00B6Пилкроу знак
U + 00B7·Средняя точка
U + 00B8¸Седилья
U + 00B9¹Верхний индекс
U + 00BAºМужской порядковый номер ind icator
U + 00BB»Двойные угловые кавычки, указывающие вправо
U + 00BC¼Вульгарная фракция одна четверть
U + 00BD½Вульгарная фракция половина
U + 00BE¾Вульгарная дробь три четверти
U + 00BF¿Перевернутый вопросительный знак
Буквы
U + 00C0ÀЛатинская заглавная буква A с тупым шрифтом
U + 00C1ÁЛатинская заглавная буква A с острым ударением
U + 00C2ÂЛатинская заглавная буква A с циркумфлексом
U + 00C3ÃЛатинская заглавная буква A с тильдой
U + 00C4ÄЛатинская заглавная буква A с тремой
U + 00C5Åзаглавная латинская буква A с кольцом сверху
U + 00C6Æзаглавная латинская буква AE
U + 00C7Çзаглавная латинская буква C с седилем
U + 00C8ÈЗаглавная латинская буква E с тупым ударением
U + 00C9ÉЗаглавная латинская буква E с острым ударением
U + 00CAÊЗаглавная латинская буква E с циркумфлексом
U + 00CBËЗаглавная латинская буква E с тупым ударением
U + 00CCÌЗаглавная латинская буква I с тупым ударением
U + 00CDÍЗаглавная латинская буква I с острым ударением
U + 00CEÎЛатинская заглавная буква al буква I с циркумфлексом
U + 00CFÏлатинская заглавная буква I с диэрезисом
U + 00D0Ðлатинская заглавная буква Eth
U + 00D1Ñлатинская заглавная буква N с тильдой
U + 00D2ÒЗаглавная латинская буква O с тупым ударением
U + 00D3ÓЗаглавная латинская буква O с острым ударением
U + 00D4ÔЗаглавная латинская буква O с циркумфлексом
U + 00D5ÕЗаглавная латинская буква O с тильдой
U + 00D6ÖЗаглавная латинская буква O с тильдой
Математический оператор
U + 00D7×Знак умножения
Буквы
U + 00D8ØЛатинская заглавная буква O со штрихом
U + 00D9ÙЛатинская заглавная буква U с тупым ударением
U + 00DAÚЛатинская заглавная буква U с острым ударением
U + 00DBÛЛатинская заглавная буква U с циркумфлексом
U + 00DCÜЗаглавная латинская буква U с тремой
U + 00DDÝЗаглавная латинская буква Y с острым ударением
U + 00DEÞЗаглавная латинская буква Thorn
U + 00DFßЛатинская строчная буква A с острым ударением S
U + 00E0àЛатинская строчная буква A с тупым ударением
U + 00E1áЛатинская строчная буква A с острым ударением
U + 00E2âЛатинская строчная буква A с циркумфлексом
U + 00E3ãЛатинская строчная буква A с тильдой
U + 00E4äЛатинская строчная буква A с диэрезисом
U + 00E5åЛатинская строчная буква A с кольцом сверху
U + 00E6æЛатинская строчная буква AE
U + 00E7çЛатинская строчная буква C с седилем
U + 00E8èЛатинская строчная буква E с тупым ударением
U + 00E9éСтрочная латинская буква E с острым ударением
U + 00EAêСтрочная латинская буква E с циркумфлексом
U + 00EBëСтрочная латинская буква E с диэрезисом
U + 00ECìСтрочная латинская буква I с тупиком
U + 00EDíСтрочная латинская буква I с острым ударением
U + 00EEîСтрочная латинская буква I с циркумфлексом
U + 00EFïСтрочная латинская буква I с тильдой
U + 00F0ðСтрочная латинская буква Eth
U + 00F1ñСтрочная латинская буква N с тильдой
U + 00F2òСтрочная латинская буква O с grave
U + 00F3óстрочная латинская буква O с острым ударением
U + 00F4ôстрочная латинская буква O с циркумфлексом
U + 00F5õстрочная латинская буква O с тильдой
U + 00F6öЛати n Строчная буква O с тремой
Математический оператор
U + 00F7÷Знак деления
Буквы
U + 00F8øСтрочная латинская буква O со штрихом
U + 00F9ùЛатинская строчная буква U с тупым ударением
U + 00FAúЛатинская строчная буква U с острым ударением
U + 00FBûЛатинская строчная буква U с циркумфлексом
U + 00FCüЛатинская строчная буква U с диэрезис
U + 00FDýлатинская строчная буква Y с острым ударением
U + 00FEþлатинская строчная буква шип
U + 00FFÿлатинская строчная буква Y с тремой

Подзаголовки

Блок C1 Controls и Latin-1 Supplement имеет четыре подзаголовка в своей коллекции символов: элементы управления C1, знаки препинания и символы Latin-1, буквы и математические операторы.

C1 controls

Подзаголовок управления C1 содержит 32 дополнительных кода управления, унаследованных от ISO / IEC 8859-1 и многих других стандартов 8-битных символов. Псевдонимы для управляющих кодов C0 и C1 взяты из.

Пунктуация и символы Latin-1

Подзаголовок знаков пунктуации и символов Latin-1 содержит 32 символа общих международных знаков пунктуации, таких как в виде перевернутых восклицательных и вопросительных знаков и средней точки; и символы, такие как знаки валюты, диакритические знаки через интервалы, вульгарные дроби и надстрочные числа.

Буквы

Подзаголовок «Буквы» содержит 30 пар больших и малых акцентированных или новых латинских символов для западноевропейских языков, и два дополнительных минускульных символа, которые обычно не используются в словах.

Математический оператор

Подзаголовок математического оператора используется для знаков умножения и деления.

Количество символов, букв и управляющие коды

В таблице ниже показано количество каждой буквы, символа и управляющего кода в каждом подзаголовке в блоке C1 Controls and Latin-1 Supplement.

Тип подзаголовкаКоличество символовДиапазон символов
Управление C132 кода управленияU + 0080 до U + 009F
Знаки пунктуации и символы Latin-132 знака пунктуации и символаU + 00A0 - U + 00BF
Буквы30 пар маюскула и минускула диакритические знаки латинские символыот U + 00C0 до U + 00D6, от U + 00D8 до U + 00F6 и от U + 00F8 до U + 00FF
Математические операторыU + 00D7 × ЗНАК УМНОЖЕНИЯ и U + 00F7 ÷ ЗНАК РАЗДЕЛЕНИЯ.U + 00D7 и U + 00F7

Компактная таблица

Элементы управления C1 и приложение Latin-1. Официальная таблица кодов Консорциума Unicode (PDF)
0123456789ABCDEF
U + 008xXXXXXXBPHNBHINDNELSSAESAHTSHTJVTSPLDPLURISS2SS3
U + 009xDCSPU1PU2STSCCHMWSPAEPASOSXXXSCICSISTOSCPMAPC
U + 00AxNB. SP¡¢£¤¥¦§¨©ª«¬SHY. ­®¯
U + 00Bx°±²³´µ·¸¹º»¼½¾¿
U + 00CxÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
U + 00DxÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞß
U + 00Exàáâãäåæçèéêëìíîï
U + 00Fxðñòóôõö÷øùúûüýþÿ
Примечания
1.^Начиная с Unicode версии 13.0

Emoji

Дополнительный блок Latin-1 содержит два emoji : U + 00A9 и U + 00AE.

Блок имеет четыре стандартизованных варианта, определенных для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию в текстовую презентацию.

Последовательности вариантов эмодзи
U+00A900AE
базовая кодовая точка©®
base + VS15 (текст)©︎®︎
base + VS16 (emoji)©️®️

История

Следующие документы, связанные с Unicode, описывают цель и процесс определения конкретных символов в блоке Latin-1 Supplement:

Версия Окончательные кодовые точкиСчетчикL2 IDWG2 IDДокумент
1.0.0U + 0080..009F32X3L2 / 95-002PDAM № 3 согласно ISO / IEC 10646 -1 на коди нг элементов управления C1, 1994-11-01
X3L2 / 95-028N1148Девять таблиц ответов на повторное / расширенное голосование, 1995-02-22
N1203 Умамахесваран, ВС; Ксар, Майк (1995-05-03), "5.3", неподтвержденный протокол совещания 27 SC2 / WG2, Женева
X3L2 / 95-061DAM №3 по ISO / IEC 10646-1 (кодирование C1 Controls), 1995-06-01
N1307Таблица ответов на бюллетень JTC1 на 10646 DAM 3, Кодирование C1 Controls, (SC2 N 2666), 1996-01-15
N1309Патерсон, Брюс (1996-01-17), Отчет и размещение комментариев к DAM 1, UTF 16 и DAM 2, UTF-8, DAM 3, Кодирование элементов управления C1 и DAM 4, Удаление Приложения G: UTF1
N1312Патерсон, Брюс (1996-01-17), проект окончательного текста 10646 AMD-3, кодирование элементов управления C1
L2 / 99-048 Умамахесваран, VS (1999-02-04), C1 контролирует в кодовых таблицах
L2 / 99-054R Алипранд, Джоан (1999-06-21), «C1 Controls», Утвержденный протокол встречи UTC / L2 в Пало-Альто, 3 февраля - 5, 1999
N3046 Suignard, Michel (2006-02-22), Улучшение формального определения управляющих символов
N3103 (pdf, doc )Umamaheswaran, VS (2006- 08-25), "M48.33", неподтвержденный протокол собрания 48 WG 2, Moun Тайн Вью, Калифорния, США; 27 апреля 2006 г.
U + 00A0..00FF96(подлежит определению)
X3L2 / 94-077N994 Дэвис, Марк (1994-03- 03), ISO / IEC 10646-1 - Предлагаемый проект исправления 1
X3L2 / 94-098N1033 (pdf, doc )Umamaheswaran, VS; Ksar, Mike (1994-06 -01), «8.1.15», неподтвержденный протокол совещания 25 ISO / IEC JTC 1 / SC 2 / WG 2, отель Falez, Анталья, Турция, 18 апреля 1994 г.
L2 / 11-016 Мур, Лиза (2011-02-15), «Исправьте ошибки в присвоении свойств для букв верхнего и нижнего индекса (B.13.4) [U + 00AA, U + 00BA]», UTC # 126 / L2 # 223 Минуты
L2 / 11-116 Мур, Лиза (2011-05-17), "Consensus 127-C14", UTC # 127 / L2 # 224 минуты, Измените общую категорию на U + 00AA FEMININE ОБЫЧНЫЙ ИНДИКАТОР и U + 00BA ОБЫЧНЫЙ ИНДИКАТОР МАСКУЛИНА «Lo» для Unicode 6.1.
L2 / 11-261R2 Мур, Лиза (2011-08-16), «Consensus 128-C6», UTC # 128 / L2 # 225 Минут, Измените общую категорию с "So" на "Po"... [U + 00A7 и U + 00B6]
L2 / 15-050R Дэвис, Марк; и др. ( 2015-01-29), Additio Селекторы окончательных вариантов для смайликов

См. также

Ссылки

Последняя правка сделана 2021-05-26 14:26:10
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте