Windows-1252

редактировать
Кодовая страница, используемая для латинских алфавитов западноевропейских языков
Windows-1252
Windows-1252-ink.svg
MIME / IANAwindows-1252
Язык (и)Практически все поддерживаются ISO / IEC 8859-1 например английский, ирландский, итальянский, норвежский, португальский, испанский, шведский. Плюс еще немецкий, финский и французский. И голландский, кроме символа. И словенский, за исключением символа č.
СозданоMicrosoft
StandardWHATWG Encoding Standard
Classificationрасширенный ASCII, Windows-125x
РасширяетISO 8859-1 (за исключением элементов управления C1)
Преобразует / кодируетISO 8859-15
  • v
  • t

Windows-1252 или CP -1252 (кодовая страница 1252) - однобайтовая кодировка символов из латинского алфавита, используемая по умолчанию в устаревшем компоненты Microsoft Windows для английского и многих европейских языков, включая испанский, французский и немецкий.

Это наиболее часто используемая кодировка однобайтовых символов в мире. По состоянию на октябрь 2020 года 0,4% всех веб-сайтов заявили об использовании Windows-1252, но в то же время 1,9% использовали ISO 8859-1 (в то время как только 0,8% из 1000 сайтов), что, по Стандарты HTML5 следует рассматривать как одну и ту же кодировку, так что 2,3% веб-сайтов эффективно используют Windows-1252. Страницы, объявленные как US- ASCII, также будут считаться этим набором символов. Неизвестное (но, вероятно, большое) подмножество других страниц использует только часть ASCII UTF-8 или только коды, соответствующие Windows-1252 из их объявленного набора символов, и также может быть подсчитано.

Содержание
  • 1 Подробности
  • 2 Набор символов
    • 2.1 История
    • 2.2 Расширения OS / 2
    • 2.3 Расширения MSDOS [редко]
  • 3 См. Также
  • 4 Ссылки
  • 5 Внешние ссылки
Подробности

Эта кодировка символов является надмножеством из ISO 8859-1 с точки зрения печатаемых символов, но отличается от ISO- 8859-1, используя отображаемые символы вместо управляющих символов в диапазоне от 80 до 9F (шестнадцатеричный ). Примечательные дополнительные символы включают фигурные кавычки и все печатаемые символы, которые находятся в ISO 8859-15 (в местах, отличных от ISO 8859-15). Он известен Windows по кодовой странице номер 1252 и по одобренному IANA имени "windows-1252".

Очень часто неправильно маркировать текст Windows-1252 меткой кодировки ISO-8859-1. Обычным результатом было то, что все кавычки и апострофы (созданные «умными кавычками» в текстовых редакторах) были заменены вопросительными знаками или квадратами в операционных системах, отличных от Windows, что затрудняло чтение текста. Большинство современных веб-браузеров и клиентов электронной почты обрабатывают кодировку типа носителя ISO-8859-1 как Windows-1252, чтобы избежать такой неправильной маркировки. Теперь это стандартное поведение в спецификации HTML5, которое требует, чтобы документы, рекламируемые как ISO-8859-1, фактически анализировались в кодировке Windows-1252.

Исторически фраза «Кодовая страница ANSI» использовалась в Windows для обозначения кодировок, отличных от DOS; Предполагалось, что большинство из них будут стандартами ANSI, такими как ISO-8859-1. Несмотря на то, что Windows-1252 была первой и, безусловно, самой популярной кодовой страницей, названной так на языке Microsoft Windows, кодовая страница никогда не была стандартом ANSI. Microsoft объясняет: «Термин ANSI, используемый для обозначения кодовых страниц Windows, является исторической справкой, но в настоящее время это неправильное название, которое продолжает сохраняться в сообществе Windows».

В пакетах LaTeX, CP-1252 упоминается как «ансинью».

IBM использует кодовую страницу 1252 (CCSID 1252 и знак евро расширенный CCSID 5348) для Windows-1252.

Набор символов

В следующей таблице показан Windows-1252. Каждый символ отображается с его эквивалентом Unicode на основе сопоставления Unicode.org Windows-1252 с «наилучшим соответствием». Десятичные числа (стиль 0123 ) - это альтернативный код, который можно использовать для их ввода в системах Windows. Отличия от ISO-8859-1 показаны более темным оттенком поверх цвета их легенды.

Windows-1252 (CP1252)
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_. 0NUL. 0000. 0SOH. 0001. 01STX. 0002. 02ETX. 0003. 03EOT. 0004. 04ENQ. 0005. 05ACK. 0006. 06BEL. 0007. 07BS. 0008. 08HT. 0009. 09LF. 000A. 010VT. 000B. 011FF. 000C. 012CR. 000D. 013SO. 000E. 014SI. 000F. 015
1_. 16DLE. 0010. 016DC1. 0011. 017DC2. 0012. 018DC3. 0013. 019DC4. 0014. 020NAK. 0015. 021SYN. 0016. 022ETB. 0017. 023CAN. 0018. 024EM. 0019. 025SUB. 001A. 026ESC. 001B. 027FS. 001C. 028GS. 001D. 029RS. 001E. 030US. 001F. 031
2_. 32SP. 0020. 32!. 0021. 33". 0022. 34#. 0023. 35$. 0024. 36%. 0 025. 37. 0026. 38'. 0027. 39(. 0028. 40). 0029. 41*. 002A. 42+. 002B. 43,. 002C. 44-. 002D. 45.. 002E. 46/. 002F. 47
3_. 480. 0030. 481. 0031. 492. 0032. 503. 0033. 514. 0034. 525. 0035. 536. 0036. 547. 0037. 558. 0038. 569. 0039. 57:. 003A. 58;. 003B. 59<. 003C. 60=. 003D. 61>. 003E. 62?. 003F. 63
4_. 64@. 0040. 64A. 0041. 65B. 0042. 66C. 0043. 67D. 0044. 68E. 0045. 69F. 0046. 70G. 0047. 71H. 0048. 72I. 0049. 73J. 004A. 74K. 004B. 75L. 004C. 76M. 004D. 77N. 004E. 78O. 004F. 79
5_. 80P. 0050. 80Q. 0051. 81R. 0052. 82S. 0053. 83T. 0054. 84U. 0055. 85V. 0056. 86W. 0057. 87X. 0058. 88Y. 0059. 89Z. 005A. 90[. 005B. 91\. 005C. 92]. 005D. 93^. 005E. 94_. 005F. 95
6_. 96`. 0060. 96a. 0061. 97b. 0062. 98c. 0063. 99d. 0064. 100e. 0065. 101f. 0066. 102g. 0067. 103h. 0068. 104i. 0069. 105j. 006A. 106k. 006B. 107l. 006C. 108m. 006D. 109n. 006E. 110o. 006F. 111
7_. 112p. 0070. 112q. 0071. 113r. 0072. 114s. 0073. 115t. 0074. 116u. 0075. 117v. 0076. 11 8w. 0077. 119x. 0078. 120y. 0079. 121z. 007A. 122{. 007B. 123|. 007C. 124}. 007D. 125~. 007E. 126DEL. 007F. 0127
8_. 128. 20AC. 0128. 201A. 0130ƒ. 0192. 0131. 201E. 0132. 2026. 0133. 2020. 0134. 2021. 0135ˆ. 02C6. 0136. 2030. 0137Š. 0160. 0138. 2039. 0139Œ. 0152. 0140Ž. 017D. 0142
9_. 144. 2018. 0145. 2019. 0146. 201C. 0147. 201D. 0148. 2022. 0149. 2013. 0150. 2014. 0151˜. 02DC. 0152. 2122. 0153š. 0161. 0154. 203A. 0155œ. 0153. 0156ž. 017E. 0158Ÿ. 0178. 0159
A_. 160NBSP. 00A0. 0160¡. 00A1. 0161¢. 00A2. 0162£. 00A3. 0163¤. 00A4. 0164¥. 00A5. 0165¦. 00A6. 0166§. 00A7. 0167¨. 00A8. 0168©. 00A9. 0169ª. 00AA. 0170«. 00AB. 0171¬. 00AC. 0172SHY. 00AD. 0173®. 00AE. 0174¯. 00AF. 0175
B_. 176°. 00B0. 0176±. 00B1. 0177². 00B2. 0178³. 00B3. 0179´. 00B4. 0180µ. 00B5. 0181. 00B6. 0182·. 00B7. 0183¸. 00B8. 0184¹. 00B9. 0185º. 00BA. 0186». 00BB. 0187¼. 00BC. 0188½. 00BD. 0189¾. 00BE. 0190¿. 00BF. 0191
C_. 192À. 00C0. 0192Á. 00C1. 0193Â. 00C2. 0194Ã. 00C3. 0195Ä. 00C4. 0196Å. 00C5. 0197Æ. 00C6. 0198Ç. 00C7. 0199È. 00C8. 0200É. 00C9. 0201Ê. 00CA. 0202Ë. 00CB. 0203Ì. 00CC. 0204Í. 00CD. 0205Î. 00CE. 0206Ï. 00CF. 0207
D_. 208Ð. 00D0. 0208Ñ. 00D1. 0209Ò. 00D2. 0210Ó. 00D3. 0211Ô. 00D4. 0212Õ. 00D5. 0213Ö. 00D6. 0214×. 00D7. 0215Ø. 00D8. 0216Ù. 00D9. 0217Ú. 00DA. 0218Û. 00DB. 0219Ü. 00DC. 0220Ý. 00DD. 0221Þ. 00DE. 0222ß. 00DF. 0223
E_. 224à. 00E0. 0224á. 00E1. 0225â. 00E2. 0226ã. 00E3. 0227ä. 00E4. 0228å. 00E5. 0229æ. 00E6. 0230ç. 00E7. 0231è. 00E8. 0232é. 00E9. 0233ê. 00EA. 0234ë. 00EB. 0235ì. 00EC. 0236í. 00ED. 0237î. 00EE. 0238ï. 00EF. 0239
F_. 240ð. 00F0. 0240ñ. 00F1. 0241ò. 00F2. 0242ó. 00F3. 0243ô. 00F4. 0244õ. 00F5. 0245ö. 00F6. 0246÷. 00F7. 0247ø. 00F8. 0248ù. 00F9. 0249ú. 00FA. 0250û. 00FB. 0251ü. 00FC. 0252ý. 00FD. 0253þ. 00FE. 0254ÿ. 00FF. 0255

L etter Число Знаки пунктуации Символ Другое Не определено

Согласно информации на сайтах Microsoft и Консорциума Unicode, позиции 81, 8D, 8F, 90 и 9D не используются; однако Windows API MultiByteToWideChar сопоставляет их с соответствующими управляющими кодами C1. Отображение «наилучшего соответствия» также документирует это поведение.

История

  • В первой версии кодовой страницы 1252, используемой в Microsoft Windows 1.0, не были определены позиции D7 и F7. Все символы в диапазонах 80–9F также не были определены.
  • Вторая версия, используемая в Microsoft Windows 2.0, позиции D7, F7, 91 и 92 были определены.
  • Третья версия версия, используемая с Microsoft Windows 3.1, имела все современные позиции, кроме знака евро и Z с парой символов caron.
  • Последняя версия, указанная выше дебютировал в Microsoft Windows 98 и был перенесен на более старые версии Windows с обновлением символа евро.

Расширения OS / 2

Операционная система OS / 2 поддерживает кодировку по имени из Кодовая страница 1004 (CCSID 1004) или "Windows Extended". Это в основном соответствует кодовой странице 1252, за исключением некоторых управляющих символов C0, замененных на диакритические символы. Отличия от ISO-8859-1 показаны более темным оттенком поверх цветов их легенды.

Кодовая страница 1004 (только разные строки)
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_. 0NUL. 0000SOH. 0001STX. 0002ETX. 0003ˉ. 02C9˘. 02D8˙. 02D9BEL. 0007˚. 02DAHT. 0009˝. 02DD˛. 02DBˇ. 02C7CR. 000DSO. 000ESI. 000F

Расширения MSDOS [редко]

Существует редко используемая, но полезная расширенная кодовая страница 1252 графики, где коды от 0x00 до 0x1f позволяют рисовать прямоугольники, как это используется в таких приложениях, как MSDOS Edit и Codeview. Одним из приложений, использующих эту кодовую страницу, была утилита установки / восстановления образа диска корпорации Intel, выпущенная в середине / конце 1995 года. Эти программы были написаны для компьютеров с пользовательской тестовой программой P6 (пример для США). Он использовался исключительно в тогдашнем регионе EMEA (Европа, Ближний Восток и Африка). Со временем программы были изменены для использования кодовой страницы 850.

Графическая расширенная кодовая страница 1252
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_. 0○. 25CB■. 25A0↑. 2191↓. 2193→. 2192←. 2190║. 2551═. 2550╔. 2554╗. 2557╚. 255A╝. 255D░. 2591▒. 2592►. 25BA◄. 25C4
1_. 16│. 2502─. 2500┌. 250C┐. 2510└. 2514┘. 2518├. 251C┤. 2524┴. 2534┬. 252C♦. 2666┼. 253C█. 2588▄. 2584▀. 2580▬. 25AC
См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-21 10:41:22
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте