Общая пунктуация | |
---|---|
Диапазон | U + 2000..U + 206F. (112 кодовых точек) |
Плоскость | BMP |
Скрипты | Обычный (109 символов). Унаследовано (2 символа) |
Символ устанавливает | Знаки препинания. Пробелы. Элементы управления форматом |
Назначено | 111 кодовых точек |
Не используется | 1 зарезервированных кодовых точек. 6 устарело |
История версий Unicode | |
1.0.0 | 67 (+67) |
1.1 | 76 (+9) |
3.0 | 83 (+7) |
3,2 | 95 (+12) |
4,0 | 97 (+2) |
4,1 | 106 (+9) |
5.1 | 107 (+1) |
6.3 | 111 (+4) |
Примечание : |
Общая пунктуация - это блок Unicode, содержащий знаки пунктуации, пробелы и форматирования для использования со всеми скриптами и системами письма. Включены пробелы определенной ширины, форматы соединения, направленные форматы, умные кавычки, архаичные и новые знаки препинания, такие как междуполосный, и невидимые математические операторы.
Дополнительные символы пунктуации находятся в блоке Supplemental Punctuation и помещены в десятки других блоков Unicode.
Знаки пунктуации. Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 200x | NQ. SP | MQ. SP | EN. SP | EM. SP | 3 / M. SP | 4 / M. SP | 6 / M. SP | F. SP | P. SP | TH. SP | H. SP | ZW. SP | ZW. NJ | ZW. J | LRM | RLM |
U + 201x | ‐ | NB. ‑ | ‒ | – | — | ― | ‖ | ‗ | ‘ | ’ | ‚ | ‛ | “ | ” | „ | ‟ |
U + 202x | † | ‡ | • | ‣ | ․ | ‥ | … | ‧ | L. SEP | P. SEP | LRE | RLE | LRO | RLO | NNB. SP | |
U + 203x | ‰ | ‱ | ′ | ″ | ‴ | ‵ | ‶ | ‷ | ‸ | ‹ | › | ※ | ‼ | ‽ | ‾ | ‿ |
U + 204x | ⁀ | ⁁ | ⁂ | ⁃ | ⁄ | ⁅ | ⁆ | ⁇ | ⁈ | ⁉ | ⁊ | ⁋ | ⁌ | ⁍ | ⁎ | ⁏ |
U + 205x | ⁐ | ⁑ | ⁒ | ⁓ | ⁔ | ⁕ | ⁖ | ⁗ | ⁘ | ⁙ | ⁚ | ⁛ | ⁜ | ⁝ | ⁞ | MM. SP |
U + 206x | WJ | ƒ () | × | , | + | LRI | RLI | FSI | PDI | |||||||
Примечания
|
Некоторые символы в этом блоке обычно не отображаются с помощью непосредственно видимого глифа. Десять пробелов от U + 2002 до U + 200B (фиксированное en или ⁄ 2 em, em, ⁄ 3 em, ⁄ 4 em, ⁄ 6 em, цифра и пространство для знаков препинания, переменная тонкая или ⁄ 5 em и пространство волос, фиксированное пространство нулевой ширины) и U + 205F (математическая medium или ⁄ 9 em space) отличаются шириной по горизонтали, в то время как U + 2000 и U + 2001 (en и em quad) фактически являются псевдонимами U + 2002 и U + 2003, соответственно; еще два, U + 202F и U + 2060 (некорректное объединение слов) являются вариантами U + 2009 или U + 2004 и U + 200B, которые запрещают перенос строки. Три символа нулевой ширины от U + 200B до U + 200D (пробел, несоединение и соединение) различаются тем, как они влияют на связывание и формирование смежных букв. Одиннадцать невидимых символов U + 200E, U + 200F (знак слева направо и справа налево), от U + 202A до U + 202E (встраивание, всплывающее окно и переопределение) и от U + 2066 до U + 2069 (изолирует) контролировать направленность текста, если разметка более высокого уровня не отменяет их. В U + 2018 и U + 2019 есть явные разделители строк и абзацев.
Блок General Punctuation содержит два emoji : U + 203C и U + 2049.
Блок имеет четыре стандартных варианта определен для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию представляют собой текстовое представление.
U+ | 203C | 2049 |
базовая кодовая точка | ‼ | ⁉ |
base + VS15 (текст) | ‼︎ | ⁉︎ |
base + VS16 (emoji) | ‼️ | ⁉️ |
Следующий код Unicode -связанные документы фиксируют цель и процесс определения конкретных символов в блоке общей пунктуации:
Версия | Конечные кодовые точки | Счетчик | UTC ID | L2 ID | WG2 ID | Документ |
---|---|---|---|---|---|---|
1.0.0 | U + 2000..202E, 2030..203E, 2040..2044 | 67 | (подлежит определению) | |||
L2 / 11-438 | N4182 | Эдберг, Питер (2011-12-22), Последовательности вариаций эмодзи (редакция L2 / 11-429) | ||||
L2 / 17-086 | Бердж, Джереми ; и другие. (2017-03-27), Добавить ZWJ, VS-16, колпачки клавиш и теги в Emoji_Component | |||||
L2 / 17-103 | Мур, Лиза (2017-05-18), "E.1.7 Добавить ZWJ, VS -16, Колпачки клавиш и теги для Emoji_Component ", UTC # 151 Минут | |||||
1.1 | U + 203F, 2045..2046 | 3 | (подлежит определению) | |||
U + 206A..206F | 6 | (подлежит определению) | ||||
UTC / 1992-xxx | Фрейтаг, Асмус (1992-05-12), "К. Биди", неподтвержденный протокол заседания UTC № 52, 8 мая 1992 г. в Xerox | |||||
L2 / 01-275 | Дэвис, Марк (2001-07-16), New Properties (ReservedForCf, Deprecated, Discouraged) | |||||
L2 / 01-301 | Whistler, Ken (2001- 08-01), «Элементы управления альтернативным форматом, унаследованные от 10646», Анализ устаревания символов в стандарте Unicode | |||||
L2 / 01-326 | Дэвис, Марк (2001-08-15), Новые свойства: Reserved_Cf_Code_Point и устаревшие | |||||
L2 / 01-295R | Мур, Лиза (2001-11-06), "Движение 88-M13", минуты с встречи UTC / L2 # 88 | |||||
3,0 | U + 202F, 2048..2049 | 3 | L2 / 97-288 | N1603 | Умамахесваран, Вирджиния (1997-10-24), «8.18», неподтвержденный протокол собрания, РГ 2 Встреча № 33, Ираклион, Крит, Греция, 20 июня - 4 июля 1997 г. | |
L2 / 98-088 | N1711 | Рабочая встреча по монгольскому кодированию с участием представителей Китая и Монголии, 1998-02-15 | ||||
L2 / 98-104 | N1734 | Уистлер, Кен (1998-03-20), Комментарии к предложению по монгольскому кодированию, WG2 N1711 | ||||
L2 / 98-252 (pdf, txt ) | N1833RM (pdf, doc ) | Мур, Ричард (1998-05-04), Отзыв на комментарии Кена Уистлера по монгольской кодировке: N 1734 | ||||
L2 / 98-251 (pdf, html, txt ) | N1808 (pdf, doc ) | Ответ на «Предложение WG2 N1734», поднятый на совещании в Сиэтле по поводу »предложения WG 2 N1711 ", 1998-07-09 | ||||
L2 / 98-281R (pdf, html ) | Алипранд, Джоан (1998-07-31)," Монгольский (IV.A) ", Неподтвержденные минуты - UTC # 77 и NCITS подгруппа L2 # 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон - 29-31 июля 1998 г. | |||||
N1862 | Редакция N1711 - монгольский, 1998-09-17 | |||||
N1865 | Позиция США - монгольский (N1711, N1734 и N1808), 1998-09-18 | |||||
N1918 | Paters on, Брюс (1998-10-28), Текст для комбинированного бюллетеня регистрации и рассмотрения PDAM - SC2 N 3208 | |||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Умамахесваран, ВС (1998-12-30), «8.1.3», Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
L2 / 99-075.1 | N1973 | Комментарии Ирландии к SC 2 N 3208, 1999-01-19 | ||||
L2 / 99-075 | N1972 (pdf, html, doc ) | Резюме голосования по SC 2 N 3208, бюллетень PDAM по WD для ISO / IEC 10646-1 / Amd.29: монгольский, 1999-02- 12 | ||||
N2020 | Патерсон, Брюс (1999-04-05), FPDAM 29 Текст - монгольский | |||||
L2 / 99-113 | Текст для бюллетеня FPDAM ISO / IEC 10646, Amd.29 - монгольский, 1999-04-06 | |||||
L2 / 99-232 | N2003 | Умамахесваран, ВС (1999-08-03), «6.1.3 PDAM29 - монгольский шрифт», Протокол заседания 36 Рабочей группы 2, Фукуока, Япония, 1999-03-09-15 | ||||
L2 / 99-304 | N2126 | Патерсон, Брюс (1999-10-01), пересмотренный текст для бюллетеня FDAM ISO / IEC 10646-1 / FDAM 29, ПОПРАВКА 29: монгольский | ||||
L2 / 99-381 | Окончательный текст для ISO / IEC 10646-1, FDAM 29 - монгольский, 1999-12-07 | |||||
L2 / 00-010 | N2103 | Умамахесваран, ВС (2000-01-05), "6.4.4", Протокол 37-го заседания РГ 2, Копенгаген, Дания: 1999-09-13-16 | ||||
L2 / 07-209 | Уистлер, Кен (2007-07-05), UTR 14 и U + 202F УЗКО НЕТ -BREAK SPACE | |||||
L2 / 11-438 | N4182 | Эдберг, Питер (2011-12-22), Последовательности вариаций эмодзи (редакция L2 / 11-429) | ||||
L2 / 15-187 | Мур, Лиза (2015-08-11), "B.14.5", UTC # 144 Минуты | |||||
L2 / 16-258 | N4752R2 | Эк, Грег (2016-09-19), монгольский Базовые формы, позиционные формы и варианты форм | ||||
L2 / 16-259 | N4753 | Эк, Грег; Рилеке, Орлог Оу (2016-09-20), WG2 # 65 Точки для обсуждения в Монголии | ||||
L2 / 16-266 | N4763 | Андерсон, Дебора; Уистлер, Кен; Макгоуэн, Рик; Пурнадер, Рузбех; Гласс, Андрей; Янку, Лауреньиу; Мур, Лиза (2016-09-26), «1. Монгольский», Комментарии к документам WG2 №65 на монгольском языке, малом кидани и др. | ||||
L2 / 16-297 | N4769 | Андерсон, Дебора (2016 г. -10-27), монгольский специальный отчет | ||||
U + 204A | 1 | L2 / 98-214 | N1747 | Эверсон, Майкл (1998-05-25), символы сокращения для UCS | ||
L2 / 98-281R (pdf, html ) | Алипранд, Джоан (1998-07-31), «Символы из ISO 5426-2 (IV.C.5-6)», Неподтвержденные минуты - UTC # 77 и NCITS подгруппа L2 # 174 СОВМЕСТНОЕ ЗАСЕДАНИЕ, Редмонд, Вашингтон - 29-31 июля 1998 г. | |||||
L2 / 98-292R (pdf, html, Рисунок 1 ) | "2.6", комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-19 | |||||
L2 / 98-292 | N1840 | " 2.6 ", Комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-25 | ||||
L2 / 98-301 | N1847 | Эверсон, Майкл (1998-09- 12), Ответы на комментарии NCITS / L2 и Unicode Consortium по многочисленным предложениям | ||||
L2 / 98-372 | N1884R2 (pdf, doc ) | Wh истлер, Кен; и другие. (1998-09-22), Дополнительные символы для UCS | ||||
L2 / 98-329 | N1920 | Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 30, ПОПРАВКА 30: Дополнительные латинские и другие символы, 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Umamaheswaran, VS (1998-12-30), "8.1.5.1", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
U + 204B..204D | 3 | L2 / 98 -215 | N1748 | Эверсон, Майкл (1998-05-25), Дополнительные символы подписи для UCS | ||
L2 / 98-281R (pdf, html ) | Aliprand, Джоан (1998-07-31), «Знаки подписи (IV.C.7)», неподтвержденные протоколы - UTC № 77 и NCITS подгруппа L2 № 174 СОВМЕСТНОЕ СОБРАНИЕ, Редмонд, Вашингтон, 29-31 июля 1998 г. | |||||
L2 / 98-292R (pdf, html, Рисунок 1 ) | «2.7», комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-19 | |||||
L2 / 98-292 | N1840 | "2.7", комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4, 1998-08-25 | ||||
L2 / 98-301 | N1847 | Эверсон, Майкл (1998-09-12), комментарии NCITS / L2 и Консорциума Unicode по многочисленным предложениям | ||||
L 2 / 98-372 | N1884R2 (pdf, doc ) | Whistler, Ken; и другие. (1998-09-22), Дополнительные символы для UCS | ||||
L2 / 98-329 | N1920 | Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 30, ПОПРАВКА 30: Дополнительные латинские и другие символы, 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Umamaheswaran, VS (1998-12-30), "8.1.5.1", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
3,2 | U + 2047, 2051 | 2 | L2 / 99-238 | Сводный документ, содержащий 6 японских предложений, 1999-07-15 | ||
N2092 | Добавление сорока восьми символов, 1999-09-13 | |||||
L2 / 99-365 | Мур, Лиза (1999-11-23), Комментарии к предложениям JCS | |||||
L2 / 00-024 | Шибано, Коджи (2000-01-31), пересмотренное предложение JCS | |||||
L2 / 99-260R | Мур, Лиза (2000-02-07), «JCS Proposals», Протокол встречи UTC / L2 в Миссии Вьехо, 26-28 октября 1999 г. | |||||
L2 / 00-098, L2 / 00-098-page5 | N2195 | Обоснование использования символов без кандзи, предложенных комитетом JCS, 2000-03-15 | ||||
L2 / 00-119 | N2191R | Уистлер, Кен; Фрейтаг, Асмус (2000-04-19), Кодирование дополнительных математических символов в Юникоде | ||||
L2 / 00-234 | N2203 (rtf, txt ) | Umamaheswaran, VS (2000-07-21), «8.18, 8.20», Протокол заседания SC2 / WG2 в Пекине, 21.03.2000 - 24 | ||||
L2 / 00-115R2 | Мур, Лиза (2000-08 -08), "Движение 83-M11", Протокол собрания № 83 по всемирному координированному времени | |||||
L2 / 00-297 | N2257 | Сато, ТК (2000-09-04), символы JIS X 0213 часть-1 | ||||
L2 / 00-342 | N2278 | Сато, ТК; Эверсон, Майкл; Уистлер, Кен; Фрейтаг, Асмус (2000-09-20), Специальный отчет по отзывам Японии N2257 и N2258 | ||||
L2 / 01-050 | N2253 | Умамахесваран, VS (2001-01-21), "7.16 JIS X0213 Символы », Протокол заседания SC2 / WG2 в Афинах, сентябрь 2000 г. | ||||
U + 204E..2050, 2057, 205F, 2061..2062 | 7 | L2 / 00-005R2 | Мур, Лиза (2000- 02-14), «Движение 82-M11», Протокол UTC № 82 в Сан-Хосе | |||
L2 / 00-119 | N2191R | Уистлер, Кен; Фрейтаг, Асмус (2000-04-19), Кодирование дополнительных математических символов в Unicode | ||||
L2 / 00-234 | N2203 (rtf, txt ) | Umamaheswaran, VS (2000-07- 21), «8.18», Протокол заседания SC2 / WG2 в Пекине, 21.03.2000 - 24 | ||||
L2 / 00-115R2 | Мур, Лиза (2000-08-08), "Motion 83 -M11 ", Протокол собрания № 83 | |||||
U + 2052, 2063 | 2 | L2 / 01-142 | N2336 | Битон, Барбара; Фрейтаг, Асмус; Ион, Патрик (2001-04-02), Дополнительные математические символы | ||
L2 / 01-156 | N2356 | Фрейтаг, Асмус (2001-04-03), Дополнительные математические символы (Проект 10) | ||||
L2 / 01 -344 | N2353 (pdf, doc ) | Umamaheswaran, VS (2001-09-09), "7.7 Mathematical Symbols", Протокол заседания SC2 / WG2 № 40 - Маунтин-Вью, апрель 2001 | ||||
U + 2060 | 1 | L2 / 99-260R | Мур, Лиза (2000-02-07), «Юникод в языках разметки», Протокол встречи UTC / L2 в Миссии Вьехо, 26 октября - 28, 1999 | |||
L2 / 00-005R2 | Мур, Лиза (2000-02-14), "Разрыв / соединение графемы нулевой ширины", Минуты UTC # 82 i n Сан-Хосе, Рекомендация для Арнольда Винклера: Поскольку предложение о разрыве / соединении графемы нулевой ширины было отозвано, повторно откройте задание 81-12 (чтобы Марк Дэвис подготовил предложение для WG2 по объединению слов нулевой ширины.) | |||||
L2 / 00-258 | N2235 | Дэвис, Марк (2000-08-09), Предложение о добавлении СОЕДИНИТЕЛЯ СЛОВ НУЛЕВОЙ ШИРИНЫ | ||||
L2 / 00-369 | Уистлер, Кен ( 2000-10-06), "е. (НУЛЕВАЯ ШИРИНА) СОЕДИНИТЕЛЬ СЛОВ ", WG2 в Вулиагмени (Афины) | |||||
L2 / 01-050 | N2253 | Умамахесваран, ВС (2001-01-21)," 7.7 Предложение о добавлении НУЛЕВОЙ ШИРИНЫ СЛОВА ", Протокол заседания SC2 / WG2 в Афинах, сентябрь 2000 г. | ||||
4,0 | U + 2053..2054 | 2 | L2 / 02-141 | N2419 | Эверсон, Майкл; и др.. (2002-03-20), символы уральского фонетического алфавита для UCS | |
L2 / 02-192 | Эверсон, Майкл (2002-05-02), Ответ Эверсона на UPA | |||||
N2442 | Эверсон, Майкл; Колехмайнен, Эркки I.; Руппель, Клаас; Тростеруд, Тронд (2002-05-21), Обоснование для помещения уральского фонетического алфавита в BMP | |||||
L2 / 02-291 | Уистлер, Кен (2002 -05-31), отчет WG2 из Дублина | |||||
L2 / 02-292 | Уистлер, Кен (2002-06-03), Предварительный просмотр досье согласия WG2 | |||||
L2 / 02-166R2 | Мур, Лиза (2002-08-09), "Сценарии и новые персонажи - UPA", UTC # 91 Минуты | |||||
L2 / 02-253 | Мур, Лиза (2002-10-21), "Консенсус 92-C2 ", UTC # 92 Минуты | |||||
4,1 | U + 2055 | 1 | L2 / 03-151R | Констебль, Питер; Ll Ойд-Уильямс, Джеймс; Ллойд-Уильямс, Сью; Чоудхури, Шамсул Ислам; Али, Асаддар; Садик, Мохаммед; Чоудхури, Матиар Рахман (10 мая 2003 г.), Пересмотренное предложение по кодированию сценария Силоти Нагри в BMP | ||
L2 / 03-136 | Мур, Лиза (18 августа 2003 г.), «Сценарии и новые персонажи - Syloti Nagri Script », UTC # 95 Минут | |||||
U + 2056, 2058..2059 | 3 | L2 / 03-282R | N2610R | Эверсон, Майкл; Клеминсон, Ральф (2004-09-04), Окончательное предложение по кодированию глаголицы в UCS | ||
L2 / 03-324 | N2642 | Пантелия, Мария (2003-10-06), Предложение по кодированию дополнительные греческие символы редактирования и пунктуации в UCS | ||||
U + 205A..205C | 3 | L2 / 03-157 | Пантелия, Мария (2003-05-19), Дополнительные символы бета-кода не в Unicode (WIP) | |||
L2 / 03-193R | N2612-7 | Пантелия, Мария (11.06.2003), Предложение о кодировании дополнительных знаков пунктуации в UCS | ||||
U + 205D | 1 | L2 / 02- 312R | Пантелия, Мария (2002-11-07), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS | |||
L2 / 03-324 | N2642 | Пантелия, Мария (2003-10- 06), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS | ||||
U + 205E | 1 | L2 / 03-354 | N2655 | Фрейтаг, Асмус (2003-10-10), Предложение - Символы, используемые в словарях | ||
L2 / 03-356R2 | Мур, Лиза (2003-10-22), "Consensus 97-C15", UTC # 97 Минуты | |||||
5.1 | U + 2064 | 1 | L2 / 07-011R | N31 98R | Фрейтаг, Асмус; Битон, Барбара; Ион, Патрик; Сарджент, Мюррей; Карлайл, Дэвид; Pournader, Roozbeh (2007-01-15), 29 дополнительных математических и символьных символов | |
L2 / 07-015 | Мур, Лиза (2007-02-08), «Математические символы и символы (C.4)», UTC # 110 минут | |||||
L2 / 07-268 | N3253 (pdf, doc ) | Umamaheswaran, VS (2007-07-26), "M50.16", неподтвержденные минуты WG 2 meeting 50, Франкфурт-на-Майне, Германия; 2007-04-24 / 27 | ||||
6.3 | U + 2066..2069 | 4 | L2 / 12-186R | Ланин, Аарон ; Дэвис, Марк; Pournader, Roozbeh (2012-07-24), Предложение для изолятов биди в Unicode | ||
L2 / 12-290 | N4310 | Lanin, Aharon; Davis, Mark; Pournader, Roozbeh ( 2012-07-31), Предложение о четырех символах для Bidi | ||||
L2 / 12-239 | Мур, Лиза (2012-08-14), "Consensus 132-C12", UTC # 132 Minutes | |||||
L2 / 13-040 | Pournader, Roozbeh; Lanin, Aharon (2013-01-29), Fasttracking Arabic Letter Mark (ALM) | |||||
L2 / 13-125 | N4447 | Констебль, Питер (2013- 06-10), Отчет о взаимодействии Unicode для WG2 | ||||