Подстрочные и надстрочные индексы Unicode

редактировать
Символы Unicode Разница между надстрочными / подстрочными индексами и глифами числителя / знаменателя. Во многих популярных шрифтах символы «надстрочного» и «подстрочного» Unicode фактически являются глифами числителя и знаменателя.

Unicode имеет подстрочные и надстрочные версии ряда символов, включая полный набор арабскими цифрами. Эти символы позволяют представить любые полиномиальные, химические и некоторые другие уравнения в виде простого текста без использования какой-либо формы разметки, например HTML или TeX.

Консорциум Всемирной паутины и Консорциум Unicode дали рекомендации по выбору между использованием разметки и использованием символов надстрочного и подстрочного индекса:

При использовании в математическом контексте (MathML ) рекомендуется последовательно использовать разметку стиля для надстрочных и подстрочных индексов.... Однако, когда надстрочные и подскрипты должны отражать семантические различия, это проще для работы с этими значениями, закодированными в тексте, а не в разметке, например, в фонетической или фонематической транскрипции.

Содержание

  • 1 Использует
  • 2 Блок верхних и нижних индексов
  • 3 Другие символы верхнего и нижнего индекса
  • 4 Латинские и греческие таблицы
  • 5 Составные символы
  • 6 Примечания
  • 7 Ссылки

Использует

Предполагаемое использование, когда эти символы были Переход к Unicode должен был позволить писать химические и алгебраические формулы и фонетику без разметки, но при этом создавать истинные надстрочные и подстрочные индексы. Таким образом, предполагается, что «H₂O» (с использованием символа нижнего индекса) идентично «H 2 O» (с разметкой нижнего индекса).

На самом деле большинство шрифтов, содержащих эти символы, игнорируют определение Unicode и разрабатывают цифры для математических символов числитель и знаменатель, которые меньше обычных символов, но имеют выровнен с линией ограничения и базовой линией соответственно. При использовании с солидусом эти глифы полезны для создания произвольных диагональных дробей (аналогично глифу ½ ). Попытка сделать дроби с помощью существующих программных надстрочных / нижних индексов выглядят более запутанными (пример: / 2), поэтому дизайнеры шрифтов предоставили эту альтернативу. Это также делает верхние индексы полезными для порядковых указателей, более точно совпадающих с символами ª и º. Однако это делает их неправильными для обычных надстрочных и нижних индексов, и, как правило, формулы выглядят лучше при использовании разметки, чем эти символы.

Юникод предназначен для получения диагональных дробей с помощью другого механизма, но он очень плохо поддерживается. Дробная косая черта U + 2044 визуально похожа на солидус, но при использовании с обычными цифрами (а не надстрочными и нижними индексами) предназначена для указания системе макета, что дробь, такая как, должна отображаться с использованием автоматическая подстановка знаков для цифр. Некоторые браузеры поддерживают это, но не для всех шрифтов. Выбор шрифтов показан в таблице ниже.

СимволыШрифтРезультат
U + 00BD ½ VULGAR FRACTION ONE HALFПо умолчанию½
U + 00B9 ¹ SUPERSCRIPT ONE, U + 002F / SOLIDUS, U + 2082 ₂ ПОДПИСКА ДВА¹ / ₂
U + 00B9 ¹ SUPERSCRIPT ONE, U + 2044 ⁄ РАЗРЕШЕНИЕ ДРОБИ, U + 2082 ₂ ПОДПИСКА ДВА¹⁄₂
U + 0031 1 DIGIT ONE, U + 2044 ⁄ РАЗРЕШЕНИЕ ФРАКЦИИ, U + 0032 2 ЦИФРА ДВА1⁄2
Arial1⁄2
Cambria1 ⁄2
Consolas1⁄2
Times New Roman1⁄2

Блок надстрочных и подстрочных индексов

Наиболее распространенные цифры надстрочного индекса (1, 2 и 3) были в ISO-8859-1 и поэтому были перенесены в эти позиции в диапазоне Latin-1 Unicode. Остальные были помещены в специальный раздел Unicode по адресу U + 2070 до U + 209F. В двух таблицах ниже показаны эти символы. Каждому надстрочному или надстрочному символу предшествует нормальный x, чтобы показать подстрочный / надстрочный индекс. Таблица слева содержит действительные символы Юникода; один справа содержит эквиваленты, использующие разметку HTML для подстрочного или надстрочного индекса.

символы Unicode
0123456789ABCDEF
U + 00Bx
U + 207xx⁰xⁱx⁴x⁵x⁶x⁷x⁸x⁹x⁺x⁻x⁼x⁽x⁾xⁿ
U + 208xx₀x₁x₂x₃x₄x₅x₆x₇x₈x₉x₊x₋x₌x₍x₎
U + 209xxₐxₑxₒxₓxₔxₕxₖxₗxₘxₙxₚxₛxₜ
Моделируется с использованием тегов или
0123456789ABCDEF
U + 00Bxxxx
U + 207xxxxxxxxxxxxxxx
U + 208xx0x1x2x3x4x5x6x7x8x9x+x−x=x(x)
U + 209xxaxexoxxxhxkxlxmxnxpxsxt
Зарезервировано для использования в будущем. 220>Другие символы из Latin-1, не относящиеся к супер- или субскриптам.

Другие символы верхнего и нижнего индекса

Unicode версии 13.0 также включает символы нижнего и верхнего индекса, которые предназначены для семантического использования, в следующих блоках:

  • Блок Дополнение Latin-1 содержит указатели женского и мужского рода порядковые номера ª и º.
  • Latin Extended Блок -C содержит один дополнительный верхний индекс ⱽ и один дополнительный нижний индекс ⱼ.
  • Блок Latin Extended-D содержит три верхних индекса: ꝰ ꟸ ꟹ.
  • Блок Latin Extended-E содержит пять надстрочных знаков: ꭜ ꭝ ꭞ ꭟ ꭩ.
  • Блок Объединение диакритических знаков содержит средневековые диакритические знаки надстрочных букв. Эти буквы написаны непосредственно над другими буквами, встречающимися в средневековых германских рукописях, и поэтому эти глифы не содержат пробелов, например uͤ. Они показаны здесь над пунктирным кружком заполнителем ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
  • Блок Combining Diacritical Marks Extended содержит две комбинированные буквы для лингвистической транскрипции Scots. Они показаны здесь над пунктирным кружком заполнителем ◌: ◌ᪿ ◌ᫀ.
  • Блок Добавление диакритических знаков содержит дополнительные средневековые диакритические знаки надстрочных букв, которых достаточно для завершения основной строчный латинский алфавит, за исключением j, q и y, нескольких заглавных букв и лигатур (ae, ao, av) и дополнительных букв: ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ. Существует также объединяющий нижний индекс: ◌᷊..
  • В блоке Буквы модификатора интервала есть надстрочные буквы и символы, используемые для фонетической транскрипции: ʰ ʱ ʲ ʳ ʴ ʵ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
  • В блоке Phonetic Extensions есть несколько дополнительных и надскриптованных букв и символов: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴱ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, греческий ᵝ ᵞ ᵟ ᵠ ᵧ ᵩ, кириллица другое ᵎ ᵔ ᵕ ᵙ ᵜ. Они предназначены для обозначения вторичной артикуляции.
  • В блоке Phonetic Extensions Supplement есть еще несколько: Latin / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶻ ᶼ ᶽ ᶾ, греческий ᶿ.
  • Блок Cyrillic Extended-B содержит два надстрочных индекса Cyrillic : ꚜ ꚝ.
  • Блоки Cyrillic Extended-A и -B содержат несколько средневековых надстрочных букв диакритических знаков, достаточных для завершения основного строчного кириллического алфавита, используемого в церковнославянских текстах, также включает дополнительную лигатуру (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ⷾ ◌ⷿ ◌ꙴ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
  • грузинский Блок содержит одну надстрочную букву Мхедрули : ჼ.
  • В блоке Канбун есть надстрочные символы аннотации, используемые в японских копиях Классического китайского тексты: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆘ ㆛ ㆜ ㆝ ㆞ ㆟.
  • В блоке Tifinagh есть одна надстрочная буква: ⵯ.
  • Унифицированная слоговая система канадских аборигенов и ее блоки Расширенный содержат несколько преимущественно согласных букв для обозначения слоговой коды, называемой Финал, а также некоторые символы, обозначающие средний слог, известные как Medials: Основной блок ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐣ ᐤ ᐥ ᐦ ᐨ ᐩ ᐪ ᑉ ᑊ ᒃ ᒄ ᒡ ᒢ ᒻ ᒼ ᒽ ᒾ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔇ ᔈ ᔉ ᔊ ᔋ ᔥ ᔾ ᕐ ᕑ ᕝ ᕪ ᕻ ᕽ ᖅ ᖕ ᖮ ᗮ ᘁ ᙆ ᙇ ᙚ ᙾ ᙿ, Расширенный блок ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ. Кроме того, есть два финала, средний и две знаки препинания, написанные выпуклыми символами в основном блоке: ᐀ ᐧ ᕀ ᕁ ᕯ.

Латинская и греческая таблицы

Сводные, стандарт Unicode содержит надстрочный и подстрочный индекс версии подмножества латинских и греческих букв. Здесь они расположены в алфавитном порядке для сравнения (или для удобства копирования и вставки). Поскольку эти символы появляются в разных диапазонах Unicode, они могут отличаться по размеру и положению из-за подстановки шрифта в браузере. Заштрихованные ячейки отмечают заглавные буквы, которые не очень отличаются от минускул, и греческие буквы, которые неотличимы от латинских, и поэтому не ожидается, что они будут поддерживаться Unicode.

Латинские надстрочные и подстрочные буквы
ABCDEFGHIJKLMNOPQRSTUVWXYZÞ
Надстрочные буквы с заглавной буквыᴿ
Надстрочные с маленькой буквы
Надстрочные минускулыʰʲˡʳˢʷˣʸ
Надстрочные буквы с малыми буквами◌ᷛ◌ᷞ◌ᷟ◌ᷡ◌ᷢ
Надстрочные минускульные знаки◌ͣ◌ᷨ◌ͨ◌ͩ◌ͤ◌ᷫ◌ᷚ◌ͪ◌ͥ◌ᷜ◌ᷝ◌ͫ◌ᷠ◌ͦ◌ᷮ◌ͬ◌ᷤ◌ͭ◌ͧ◌ͮ◌ᷱ◌ͯ◌ᷦ
Подстрочные минускульные знаки
Подстрочный минускул◌᷊◌ᪿ
Греческий надстрочный индекс и подстрочные буквы
ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ
Надстрочный минускул⁽ᵋ⁾ᶿ⁽ᶥ⁾⁽ᶹ⁾
Надстрочный минускул◌ᷩ
Подстрочный минускул
другое Надстрочные буквы IPA
ɐɑɒæçɔɕðəɜɛɟɡɦɥɨɩʝɭɱɯɰŋɲɳɵœɹɻʁʂʃƫʉʊʋʌɣʍʐʑʒɸʔʕ
Надстрочные символы⁽ᶜ̧⁾ʱʴʵʶˠˀˁ, ˤ
Надстрочные буквы◌ᷧ◌ᷔ◌ᷗ◌ᷙ◌ᷪ◌ᷯ◌̉
Подстрочные символы
Подстрочные буквы◌ᫀ

См. Также строчные буквы в Юникоде, Надстрочные буквы IPA.

Составные символы

В первую очередь для совместимости с более ранними наборами символов Unicode содержит ряд символов, которые составляют надстрочные и подстрочные индексы с другими символами. В большинстве шрифтов они отображаются намного лучше, чем попытки построить эти символы из указанных выше символов или с помощью разметки.

  • Единая слоговая система канадских аборигенов и ее блоки Extended содержат несколько букв, составленных с надстрочными буквами для обозначения расширенных звуковых значений: Основной блок ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖂ ᖃ ᖏ ᖐ ᖑ ᖒ ᖓ ᙰ ᙲ ᙳ ᙴ ᙶ, Расширенный блок ᢰ ᢱ ᢲ ᢳ ᢵ ᢶ ᢸ ᢹ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣄ ᣅ.

Notes

Ссылки

  • icon Writing portal
Последняя правка сделана 2021-06-20 11:00:51
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте