Общая пунктуация

редактировать
Блок символов Unicode
Общая пунктуация
ДиапазонU + 2000..U + 206F. (112 кодовых точек)
ПлоскостьBMP
СкриптыОбычный (109 символов). Унаследовано (2 символа)
Символ устанавливаетЗнаки препинания. Пробелы. Элементы управления форматом
Назначено111 кодовых точек
Не используется1 зарезервированных кодовых точек. 6 устарело
История версий Unicode
1.0.067 (+67)
1.176 (+9)
3.083 (+7)
3,295 (+12)
4,097 (+2)
4,1106 (+9)
5.1107 (+1)
6.3111 (+4)
Примечание :

Общая пунктуация - это блок Unicode, содержащий знаки пунктуации, пробелы и форматирования для использования со всеми скриптами и системами письма. Включены пробелы определенной ширины, форматы соединения, направленные форматы, умные кавычки, архаичные и новые знаки препинания, такие как междуполосный, и невидимые математические операторы.

Дополнительные символы пунктуации находятся в блоке Supplemental Punctuation и помещены в десятки других блоков Unicode.

Содержание

  • 1 Блок
  • 2 Emoji
  • 3 История
  • 4 Ссылки

Блок

Знаки пунктуации. Официальная таблица кодов Консорциума Unicode (PDF)
0123456789ABCDEF
U + 200xNQ. SP MQ. SP EN. SP EM. SP 3 / M. SP 4 / M. SP 6 / M. SP F. SP P. SP TH. SP H. SP ZW. SP ZW. NJ ZW. J LRM RLM
U + 201x NB. ‑
U + 202x L. SEP P. SEP LRE RLE PDF LRO RLO NNB. SP
U + 203x
U + 204x
U + 205x MM. SP
U + 206xWJ ƒ () × , + LRI RLI FSI PDI
Примечания
1.^Начиная с версии Unicode 13.0
2.^Серая область указывает неназначенную кодовую точку
3.^Кодовые точки Unicode U + 206A - U + 206F устарели в версии Unicode 3.0

Некоторые символы в этом блоке обычно не отображаются с помощью непосредственно видимого глифа. Десять пробелов от U + 2002 до U + 200B (фиксированное en или ⁄ 2 em, em, ⁄ 3 em, ⁄ 4 em, ⁄ 6 em, цифра и пространство для знаков препинания, переменная тонкая или ⁄ 5 em и пространство волос, фиксированное пространство нулевой ширины) и U + 205F (математическая medium или ⁄ 9 em space) отличаются шириной по горизонтали, в то время как U + 2000 и U + 2001 (en и em quad) фактически являются псевдонимами U + 2002 и U + 2003, соответственно; еще два, U + 202F и U + 2060 (некорректное объединение слов) являются вариантами U + 2009 или U + 2004 и U + 200B, которые запрещают перенос строки. Три символа нулевой ширины от U + 200B до U + 200D (пробел, несоединение и соединение) различаются тем, как они влияют на связывание и формирование смежных букв. Одиннадцать невидимых символов U + 200E, U + 200F (знак слева направо и справа налево), от U + 202A до U + 202E (встраивание, всплывающее окно и переопределение) и от U + 2066 до U + 2069 (изолирует) контролировать направленность текста, если разметка более высокого уровня не отменяет их. В U + 2018 и U + 2019 есть явные разделители строк и абзацев.

Emoji

Блок General Punctuation содержит два emoji : U + 203C и U + 2049.

Блок имеет четыре стандартных варианта определен для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию представляют собой текстовое представление.

Последовательности вариантов эмодзи
U+203C2049
базовая кодовая точка
base + VS15 (текст)‼︎⁉︎
base + VS16 (emoji)‼️⁉️

History

Следующий код Unicode -связанные документы фиксируют цель и процесс определения конкретных символов в блоке общей пунктуации:

Версия Конечные кодовые точкиСчетчикUTC IDL2 IDWG2 IDДокумент
1.0.0U + 2000..202E, 2030..203E, 2040..204467(подлежит определению)
L2 / 11-438 N4182 Эдберг, Питер (2011-12-22), Последовательности вариаций эмодзи (редакция L2 / 11-429)
L2 / 17-086 Бердж, Джереми ; и другие. (2017-03-27), Добавить ZWJ, VS-16, колпачки клавиш и теги в Emoji_Component
L2 / 17-103 Мур, Лиза (2017-05-18), "E.1.7 Добавить ZWJ, VS -16, Колпачки клавиш и теги для Emoji_Component ", UTC # 151 Минут
1.1U + 203F, 2045..20463(подлежит определению)
U + 206A..206F6(подлежит определению)
UTC / 1992-xxx Фрейтаг, Асмус (1992-05-12), "К. Биди", неподтвержденный протокол заседания UTC № 52, 8 мая 1992 г. в Xerox
L2 / 01-275 Дэвис, Марк (2001-07-16), New Properties (ReservedForCf, Deprecated, Discouraged)
L2 / 01-301 Whistler, Ken (2001- 08-01), «Элементы управления альтернативным форматом, унаследованные от 10646», Анализ устаревания символов в стандарте Unicode
L2 / 01-326 Дэвис, Марк (2001-08-15), Новые свойства: Reserved_Cf_Code_Point и устаревшие
L2 / 01-295R Мур, Лиза (2001-11-06), "Движение 88-M13", минуты с встречи UTC / L2 # 88
3,0U + 202F, 2048..20493L2 / 97-288N1603 Умамахесваран, Вирджиния (1997-10-24), «8.18», неподтвержденный протокол собрания, РГ 2 Встреча № 33, Ираклион, Крит, Греция, 20 июня - 4 июля 1997 г.
L2 / 98-088 N1711 Рабочая встреча по монгольскому кодированию с участием представителей Китая и Монголии, 1998-02-15
L2 / 98-104 N1734 Уистлер, Кен (1998-03-20), Комментарии к предложению по монгольскому кодированию, WG2 N1711
L2 / 98-252 (pdf, txt )N1833RM (pdf, doc )Мур, Ричард (1998-05-04), Отзыв на комментарии Кена Уистлера по монгольской кодировке: N 1734
L2 / 98-251 (pdf, html, txt )N1808 (pdf, doc )Ответ на «Предложение WG2 N1734», поднятый на совещании в Сиэтле по поводу »предложения WG 2 N1711 ", 1998-07-09
L2 / 98-281R (pdf, html )Алипранд, Джоан (1998-07-31)," Монгольский (IV.A) ", Неподтвержденные минуты - UTC # 77 и NCITS подгруппа L2 # 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон - 29-31 июля 1998 г.
N1862 Редакция N1711 - монгольский, 1998-09-17
N1865 Позиция США - монгольский (N1711, N1734 и N1808), 1998-09-18
N1918 Paters on, Брюс (1998-10-28), Текст для комбинированного бюллетеня регистрации и рассмотрения PDAM - SC2 N 3208
L2 / 99-010 N1903 (pdf, html, doc )Умамахесваран, ВС (1998-12-30), «8.1.3», Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25
L2 / 99-075.1 N1973 Комментарии Ирландии к SC 2 N 3208, 1999-01-19
L2 / 99-075 N1972 (pdf, html, doc )Резюме голосования по SC 2 N 3208, бюллетень PDAM по WD для ISO / IEC 10646-1 / Amd.29: монгольский, 1999-02- 12
N2020 Патерсон, Брюс (1999-04-05), FPDAM 29 Текст - монгольский
L2 / 99-113 Текст для бюллетеня FPDAM ISO / IEC 10646, Amd.29 - монгольский, 1999-04-06
L2 / 99-232 N2003 Умамахесваран, ВС (1999-08-03), «6.1.3 PDAM29 - монгольский шрифт», Протокол заседания 36 Рабочей группы 2, Фукуока, Япония, 1999-03-09-15
L2 / 99-304 N2126 Патерсон, Брюс (1999-10-01), пересмотренный текст для бюллетеня FDAM ISO / IEC 10646-1 / FDAM 29, ПОПРАВКА 29: монгольский
L2 / 99-381 Окончательный текст для ISO / IEC 10646-1, FDAM 29 - монгольский, 1999-12-07
L2 / 00-010 N2103 Умамахесваран, ВС (2000-01-05), "6.4.4", Протокол 37-го заседания РГ 2, Копенгаген, Дания: 1999-09-13-16
L2 / 07-209 Уистлер, Кен (2007-07-05), UTR 14 и U + 202F УЗКО НЕТ -BREAK SPACE
L2 / 11-438 N4182 Эдберг, Питер (2011-12-22), Последовательности вариаций эмодзи (редакция L2 / 11-429)
L2 / 15-187 Мур, Лиза (2015-08-11), "B.14.5", UTC # 144 Минуты
L2 / 16-258 N4752R2 Эк, Грег (2016-09-19), монгольский Базовые формы, позиционные формы и варианты форм
L2 / 16-259 N4753 Эк, Грег; Рилеке, Орлог Оу (2016-09-20), WG2 # 65 Точки для обсуждения в Монголии
L2 / 16-266 N4763 Андерсон, Дебора; Уистлер, Кен; Макгоуэн, Рик; Пурнадер, Рузбех; Гласс, Андрей; Янку, Лауреньиу; Мур, Лиза (2016-09-26), «1. Монгольский», Комментарии к документам WG2 №65 на монгольском языке, малом кидани и др.
L2 / 16-297 N4769 Андерсон, Дебора (2016 г. -10-27), монгольский специальный отчет
U + 204A1L2 / 98-214N1747 Эверсон, Майкл (1998-05-25), символы сокращения для UCS
L2 / 98-281R (pdf, html )Алипранд, Джоан (1998-07-31), «Символы из ISO 5426-2 (IV.C.5-6)», Неподтвержденные минуты - UTC # 77 и NCITS подгруппа L2 # 174 СОВМЕСТНОЕ ЗАСЕДАНИЕ, Редмонд, Вашингтон - 29-31 июля 1998 г.
L2 / 98-292R (pdf, html, Рисунок 1 )"2.6", комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-19
L2 / 98-292N1840 " 2.6 ", Комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-25
L2 / 98-301N1847 Эверсон, Майкл (1998-09- 12), Ответы на комментарии NCITS / L2 и Unicode Consortium по многочисленным предложениям
L2 / 98-372N1884R2 (pdf, doc )Wh истлер, Кен; и другие. (1998-09-22), Дополнительные символы для UCS
L2 / 98-329 N1920 Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 30, ПОПРАВКА 30: Дополнительные латинские и другие символы, 1998-10-28
L2 / 99-010 N1903 (pdf, html, doc )Umamaheswaran, VS (1998-12-30), "8.1.5.1", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25
U + 204B..204D3L2 / 98 -215N1748 Эверсон, Майкл (1998-05-25), Дополнительные символы подписи для UCS
L2 / 98-281R (pdf, html )Aliprand, Джоан (1998-07-31), «Знаки подписи (IV.C.7)», неподтвержденные протоколы - UTC № 77 и NCITS подгруппа L2 № 174 СОВМЕСТНОЕ СОБРАНИЕ, Редмонд, Вашингтон, 29-31 июля 1998 г.
L2 / 98-292R (pdf, html, Рисунок 1 )«2.7», комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-19
L2 / 98-292N1840 "2.7", комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-25
L2 / 98-301N1847 Эверсон, Майкл (1998-09-12), комментарии NCITS / L2 и Консорциума Unicode по многочисленным предложениям
L 2 / 98-372N1884R2 (pdf, doc )Whistler, Ken; и другие. (1998-09-22), Дополнительные символы для UCS
L2 / 98-329 N1920 Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 30, ПОПРАВКА 30: Дополнительные латинские и другие символы, 1998-10-28
L2 / 99-010 N1903 (pdf, html, doc )Umamaheswaran, VS (1998-12-30), "8.1.5.1", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25
3,2U + 2047, 20512L2 / 99-238 Сводный документ, содержащий 6 японских предложений, 1999-07-15
N2092 Добавление сорока восьми символов, 1999-09-13
L2 / 99-365 Мур, Лиза (1999-11-23), Комментарии к предложениям JCS
L2 / 00-024 Шибано, Коджи (2000-01-31), пересмотренное предложение JCS
L2 / 99-260R Мур, Лиза (2000-02-07), «JCS Proposals», Протокол встречи UTC / L2 в Миссии Вьехо, 26-28 октября 1999 г.
L2 / 00-098, L2 / 00-098-page5 N2195 Обоснование использования символов без кандзи, предложенных комитетом JCS, 2000-03-15
L2 / 00-119 N2191R Уистлер, Кен; Фрейтаг, Асмус (2000-04-19), Кодирование дополнительных математических символов в Юникоде
L2 / 00-234 N2203 (rtf, txt )Umamaheswaran, VS (2000-07-21), «8.18, 8.20», Протокол заседания SC2 / WG2 в Пекине, 21.03.2000 - 24
L2 / 00-115R2 Мур, Лиза (2000-08 -08), "Движение 83-M11", Протокол собрания № 83 по всемирному координированному времени
L2 / 00-297 N2257 Сато, ТК (2000-09-04), символы JIS X 0213 часть-1
L2 / 00-342 N2278 Сато, ТК; Эверсон, Майкл; Уистлер, Кен; Фрейтаг, Асмус (2000-09-20), Специальный отчет по отзывам Японии N2257 и N2258
L2 / 01-050 N2253 Умамахесваран, VS (2001-01-21), "7.16 JIS X0213 Символы », Протокол заседания SC2 / WG2 в Афинах, сентябрь 2000 г.
U + 204E..2050, 2057, 205F, 2061..20627L2 / 00-005R2 Мур, Лиза (2000- 02-14), «Движение 82-M11», Протокол UTC № 82 в Сан-Хосе
L2 / 00-119 N2191R Уистлер, Кен; Фрейтаг, Асмус (2000-04-19), Кодирование дополнительных математических символов в Unicode
L2 / 00-234 N2203 (rtf, txt )Umamaheswaran, VS (2000-07- 21), «8.18», Протокол заседания SC2 / WG2 в Пекине, 21.03.2000 - 24
L2 / 00-115R2 Мур, Лиза (2000-08-08), "Motion 83 -M11 ", Протокол собрания № 83
U + 2052, 20632L2 / 01-142 N2336 Битон, Барбара; Фрейтаг, Асмус; Ион, Патрик (2001-04-02), Дополнительные математические символы
L2 / 01-156 N2356 Фрейтаг, Асмус (2001-04-03), Дополнительные математические символы (Проект 10)
L2 / 01 -344 N2353 (pdf, doc )Umamaheswaran, VS (2001-09-09), "7.7 Mathematical Symbols", Протокол заседания SC2 / WG2 № 40 - Маунтин-Вью, апрель 2001
U + 20601L2 / 99-260R Мур, Лиза (2000-02-07), «Юникод в языках разметки», Протокол встречи UTC / L2 в Миссии Вьехо, 26 октября - 28, 1999
L2 / 00-005R2 Мур, Лиза (2000-02-14), "Разрыв / соединение графемы нулевой ширины", Минуты UTC # 82 i n Сан-Хосе, Рекомендация для Арнольда Винклера: Поскольку предложение о разрыве / соединении графемы нулевой ширины было отозвано, повторно откройте задание 81-12 (чтобы Марк Дэвис подготовил предложение для WG2 по объединению слов нулевой ширины.)
L2 / 00-258 N2235 Дэвис, Марк (2000-08-09), Предложение о добавлении СОЕДИНИТЕЛЯ СЛОВ НУЛЕВОЙ ШИРИНЫ
L2 / 00-369 Уистлер, Кен ( 2000-10-06), "е. (НУЛЕВАЯ ШИРИНА) СОЕДИНИТЕЛЬ СЛОВ ", WG2 в Вулиагмени (Афины)
L2 / 01-050 N2253 Умамахесваран, ВС (2001-01-21)," 7.7 Предложение о добавлении НУЛЕВОЙ ШИРИНЫ СЛОВА ", Протокол заседания SC2 / WG2 в Афинах, сентябрь 2000 г.
4,0U + 2053..20542L2 / 02-141 N2419 Эверсон, Майкл; и др.. (2002-03-20), символы уральского фонетического алфавита для UCS
L2 / 02-192 Эверсон, Майкл (2002-05-02), Ответ Эверсона на UPA
N2442 Эверсон, Майкл; Колехмайнен, Эркки I.; Руппель, Клаас; Тростеруд, Тронд (2002-05-21), Обоснование для помещения уральского фонетического алфавита в BMP
L2 / 02-291 Уистлер, Кен (2002 -05-31), отчет WG2 из Дублина
L2 / 02-292 Уистлер, Кен (2002-06-03), Предварительный просмотр досье согласия WG2
L2 / 02-166R2 Мур, Лиза (2002-08-09), "Сценарии и новые персонажи - UPA", UTC # 91 Минуты
L2 / 02-253 Мур, Лиза (2002-10-21), "Консенсус 92-C2 ", UTC # 92 Минуты
4,1U + 20551L2 / 03-151R Констебль, Питер; Ll Ойд-Уильямс, Джеймс; Ллойд-Уильямс, Сью; Чоудхури, Шамсул Ислам; Али, Асаддар; Садик, Мохаммед; Чоудхури, Матиар Рахман (10 мая 2003 г.), Пересмотренное предложение по кодированию сценария Силоти Нагри в BMP
L2 / 03-136 Мур, Лиза (18 августа 2003 г.), «Сценарии и новые персонажи - Syloti Nagri Script », UTC # 95 Минут
U + 2056, 2058..20593L2 / 03-282R N2610R Эверсон, Майкл; Клеминсон, Ральф (2004-09-04), Окончательное предложение по кодированию глаголицы в UCS
L2 / 03-324 N2642 Пантелия, Мария (2003-10-06), Предложение по кодированию дополнительные греческие символы редактирования и пунктуации в UCS
U + 205A..205C3L2 / 03-157 Пантелия, Мария (2003-05-19), Дополнительные символы бета-кода не в Unicode (WIP)
L2 / 03-193R N2612-7 Пантелия, Мария (11.06.2003), Предложение о кодировании дополнительных знаков пунктуации в UCS
U + 205D1L2 / 02- 312R Пантелия, Мария (2002-11-07), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS
L2 / 03-324 N2642 Пантелия, Мария (2003-10- 06), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS
U + 205E1L2 / 03-354 N2655 Фрейтаг, Асмус (2003-10-10), Предложение - Символы, используемые в словарях
L2 / 03-356R2 Мур, Лиза (2003-10-22), "Consensus 97-C15", UTC # 97 Минуты
5.1U + 20641L2 / 07-011R N31 98R Фрейтаг, Асмус; Битон, Барбара; Ион, Патрик; Сарджент, Мюррей; Карлайл, Дэвид; Pournader, Roozbeh (2007-01-15), 29 дополнительных математических и символьных символов
L2 / 07-015 Мур, Лиза (2007-02-08), «Математические символы и символы (C.4)», UTC # 110 минут
L2 / 07-268 N3253 (pdf, doc )Umamaheswaran, VS (2007-07-26), "M50.16", неподтвержденные минуты WG 2 meeting 50, Франкфурт-на-Майне, Германия; 2007-04-24 / 27
6.3U + 2066..20694L2 / 12-186R Ланин, Аарон ; Дэвис, Марк; Pournader, Roozbeh (2012-07-24), Предложение для изолятов биди в Unicode
L2 / 12-290 N4310 Lanin, Aharon; Davis, Mark; Pournader, Roozbeh ( 2012-07-31), Предложение о четырех символах для Bidi
L2 / 12-239 Мур, Лиза (2012-08-14), "Consensus 132-C12", UTC # 132 Minutes
L2 / 13-040 Pournader, Roozbeh; Lanin, Aharon (2013-01-29), Fasttracking Arabic Letter Mark (ALM)
L2 / 13-125 N4447 Констебль, Питер (2013- 06-10), Отчет о взаимодействии Unicode для WG2

Ссылки

Последняя правка сделана 2021-05-21 14:38:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте