объединяющий графемный соединитель (CGJ), U + 034F ͏ COMBINING GRAPHEME JOINER (HTML ͏
) - это символ Unicode, который не имеет видимого глифа и "по умолчанию игнорируется" приложениями. Его название неправильное и не описывает его функции; персонаж не присоединяется к графемам. Его цель - семантически разделить символы, которые не должны рассматриваться орграфами, а также заблокировать каноническое переупорядочение объединенных знаков во время нормализации.
Например, в В контексте венгерского языка, соседние буквы c и s обычно считаются эквивалентами орграфа cs. Если они разделены CGJ, они будут рассматриваться как две отдельные графемы. Однако, в отличие от объединителя нулевой ширины и аналогичных символов, CGJ не влияет на то, отображаются ли две буквы отдельно, в виде лигатуры или курсивного соединения - поведение по умолчанию для этого определяется шрифтом..
CGJ также необходим для сложных скриптов. Например, в большинстве случаев предполагается, что иврит кантилляция акцент Метег слева от гласной, и по умолчанию большинство систем отображения будут отображать его как это, даже если оно напечатано перед гласной. Но в некоторых словах в библейском иврите Metheg появляется справа от гласной, и чтобы указать механизму отображения, чтобы он отображал его правильно справа, CGJ необходимо ввести между Metheg и гласной. Сравните:
he | ה |
pathah (гласный) | ַ |
metheg | ֽ |
he + pathah + metheg | הַֽ |
he + metheg + pathah | הַֽ |
he + metheg + CGJ + pathah | הֽ͏ַ |
В случае нескольких последовательных , сочетающих диакритические знаки, промежуточный CGJ указывает, что они не должны подвергаться каноническому изменению порядка.
Сравните с это «не соединяющийся с нулевой шириной » в U + 200C в диапазоне Общая пунктуация, который предотвращает превращение двух соседних символов в лигатуру.