Кодовая страница 437

редактировать

Кодовая страница 437
Codepage-437.png Кодовая страница 437, отображаемая на IBM PC с использованием стандарта VGA
MIME / IANAIBM437
Псевдоним (а)cp437, 437, csPC8CodePage437, OEM-US
Язык (и)Английский
КлассификацияРасширенный ASCII, Кодовая страница OEM
РасширяетUS-ASCII
Прочие связанные кодировкиКодовая страница 850, CWI-2
  • v
  • t

Кодовая страница 437 (CCSID 437) - это набор символов исходного IBM PC (персональный компьютер). Он также известен как CP437, OEM-US, OEM 437, PC-8 или DOS Latin US. В набор входят все печатаемые символы ASCII, расширенные коды для акцентированных букв (диакритические знаки ), некоторые греческие буквы, значки и символы рисования линий. Иногда его называют «OEM-шрифт», «высокий ASCII» или «расширенный ASCII » (одно из многих взаимно несовместимых расширений ASCII).

Этот набор символов остается основным набором в ядре любой графической карты, совместимой с EGA и VGA. Текст, отображаемый при перезагрузке ПК, прежде чем любой другой шрифт может быть загружен с носителя, обычно отображается в этом наборе символов. Многие форматы файлов, разработанные во времена IBM PC, также основаны на кодовой странице 437.

Содержание

  • 1 Дисплейные адаптеры
  • 2 Альтернативные коды
  • 3 Набор символов
  • 4 История
  • 5 Интернационализация
  • 6 См. Также
  • 7 Примечания
  • 8 Ссылки
  • 9 Внешние ссылки

Видеоадаптеры

Исходный IBM PC содержал этот шрифт в виде шрифта 9 × 14 пикселей на символ, хранящегося в ПЗУ IBM Monochrome Display Adapter (MDA) и шрифт 8 × 8 пикселей на символ карт Color Graphics Adapter (CGA ). IBM Enhanced Graphics Adapter (EGA) содержал версию 8 × 14 пикселей на символ, а VGA содержал версию 9 × 16.

Все это видеоадаптеры имеют текстовые режимы, в которых каждая символьная ячейка содержит 8-битный символ кодовая точка (см. подробности ), что дает 256 возможных значений для графических символов. Всем 256 кодам был присвоен графический символ в ПЗУ, включая коды от 0 до 31, которые были зарезервированы в ASCII для неграфических управляющих символов.

В разных восточноевропейских ПК использовались разные наборы символов, которые иногда выбирались пользователем с помощью перемычек или настройки CMOS. Эти наборы были разработаны так, чтобы максимально соответствовать 437, например, разделять кодовые точки для многих символов рисования линий, при этом позволяя отображать текст на местном языке.

Альтернативные коды

Унаследованная кодовая страница 437 - это числовые комбинации, используемые в альтернативных кодах клавиш Windows. Пользователь мог ввести символ, удерживая клавишу Alt и вводя трехзначный десятичный код клавиши Alt на цифровой клавиатуре, и многие пользователи запомнили числа, необходимые для CP437 (или для аналогичных кодовая страница 850 ). Когда Microsoft перешла на свои собственные наборы символов (например, CP1252 ) и более поздние версии Unicode в Windows, исходные коды были сохранены; Microsoft добавила возможность вводить код в новом наборе символов, вводя цифровую клавиатуру 0 перед цифрами.

Набор символов

В следующих таблицах показана кодовая страница 437. Каждый символ показан с его эквивалентом Кодовая точка Unicode и ее десятичный код Alt-код. См. Также примечания ниже, поскольку для некоторых кодовых точек существует несколько эквивалентных символов Unicode.

Хотя ПЗУ предоставляет графику для всех 256 различных возможных 8-битных кодов, некоторые API-интерфейсы не будут печатать некоторые кодовые точки, в частности диапазон 0–31 и код 127. Вместо этого они будут интерпретировать их в качестве управляющих символов. Например, многие методы вывода текста на исходном IBM PC интерпретируют коды для BEL, BS, CR и LF. Многие принтеры также не могли печатать эти символы.

Кодовая страница 437
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_NUL. 0000. 0. 263A. 1. 263B. 2. 2665. 3. 2666. 4. 2663. 5. 2660. 6. 2022. 7. 25D8. 8. 25CB. 9. 25D9. 10. 2642. 11. 2640. 12. 266A. 13. 266B. 14. 263C. 15
1_. 25BA. 16. 25C4. 17. 2195. 18. 203C. 19. 00B6. 20§. 00A7. 21. 25AC. 22. 21A8. 23. 2191. 24. 2193. 25. 2192. 26. 2190. 27. 221F. 28. 2194. 29. 25B2. 30. 25BC. 31
2_SP. 0020. 32!. 0021. 33". 0022. 34#. 0023. 35$. 0024. 36%. 0025. 37. 0026. 38'. 0027. 39(. 0028. 40). 0029. 41*. 002A. 42+. 002B. 43,. 002C. 44-. 002D. 45.. 002E. 46/. 002F. 47
3_0. 0030. 481. 0031. 492. 0032. 503. 0033. 514. 0034. 525. 0035. 536. 0036. 547. 0037. 558. 0038. 569. 0039. 57:. 003A. 58;. 003B. 59<. 003C. 60=. 003D. 61>. 003E. 62?. 003F. 63
4_@. 0040. 64A. 0041. 65B. 0042. 66C. 0043. 67D. 0044. 68E. 0045. 69F. 0046. 70G. 0047. 71H. 0048. 72I. 0049. 73J. 004A. 74K. 004B. 75L. 004C. 76M. 004D. 77N. 004E. 78O. 004F. 79
5_P. 0050. 80Q. 0051. 81R. 0052. 82S. 0053. 83T. 0054. 84U. 0055. 85V. 0056. 86W. 0057. 87X. 0058. 88Y. 0059. 89Z. 005A. 90[. 005B. 91\. 005C. 92]. 005D. 93^. 005E. 94_. 005F. 95
6_`. 0060. 96a. 0061. 97b. 0062. 98c. 0063. 99d. 0064. 100e. 0065. 101f. 0066. 102g. 0067. 103h. 0068. 104i. 0069. 105j. 006A. 106k. 006B. 107l. 006C. 108m. 006D. 109n. 006E. 110o. 006F. 111
7_p. 0070. 112q. 0071. 113r. 0072. 114s. 0073. 115t. 0074. 116u. 0075. 117v. 0076. 118w. 0077. 119x. 0078. 120y. 0079. 121z. 007A. 122{. 007B. 123|. 007C. 124}. 007D. 125~. 007E. 126. 2302. 127
8_Ç. 00C7. 128ü. 00FC. 129é. 00E9. 130â. 00E2. 131ä. 00E4. 132à. 00E0. 133å. 00E5. 134ç. 00E7. 135ê. 00EA. 136ë. 00EB. 137è. 00E8. 138ï. 00EF. 139î. 00EE. 140ì. 00EC. 141Ä. 00C4. 142Å. 00C5. 143
9_É. 00C9. 144æ. 00E6. 145Æ. 00C6. 146ô. 00F4. 147ö. 00F6. 148ò. 00F2. 149û. 00FB. 150ù. 00F9. 151ÿ. 00FF. 152Ö. 00D6. 153Ü. 00DC. 154¢. 00A2. 155£. 00A3. 156¥. 00A5. 157. 20A7. 158ƒ. 0192. 159
A_á. 00E1. 160í. 00ED. 161ó. 00F3. 162ú. 00FA. 163ñ. 00F1. 164Ñ. 00D1. 165ª. 00AA. 166º. 00BA. 167¿. 00BF. 168. 2310. 169¬. 00AC. 170½. 00BD. 171¼. 00BC. 172¡. 00A1. 173«. 00AB. 174». 00BB. 175
B_. 2591. 176. 2592. 177. 2593. 178. 2502. 179. 2524. 180. 2561. 181. 2562. 182. 2556. 183. 2555. 184. 2563. 185. 2551. 186. 2557. 187. 255D. 188. 255C. 189. 255B. 190. 2510. 191
C_. 2514. 192. 2534. 193. 252C. 194. 251C. 195. 2500. 196. 253C. 197. 255E. 198. 255F. 199. 255A. 200. 2554. 201. 2569. 202. 2566. 203. 2560. 204. 2550. 205. 256C. 206. 2567. 207
D_. 2568. 208. 2564. 209. 2565. 210. 2559. 211. 2558. 212. 2552. 213. 2553. 214. 256B. 215. 256A. 216. 2518. 217. 250C. 218. 2588. 219. 2584. 220. 258C. 221. 2590. 222. 2580. 223
E_α. 03B1. 224ß. 00DF. 225Γ. 0393. 226π. 03C0. 227Σ. 03A3. 228σ. 03C3. 229µ. 00B5. 230τ. 03C4. 231Φ. 03A6. 232Θ. 0398. 233Ω. 03A9. 234δ. 03B4. 235. 221E. 236φ. 03C6. 237ε. 03B5. 238. 2229. 239
F_. 2261. 240±. 00B1. 241. 2265. 242. 2264. 243. 2320. 244. 2321. 245÷. 00F7. 246. 2248. 247°. 00B0. 248. 2219. 249·. 00B7. 250. 221A. 251. 207F. 252². 00B2. 253. 25A0. 254nbsp. 00A0. 255

Буква Число Знаки препинания Символ Другое Не определено

Сравнение символов в диапазоне от E0 до EF в различных продуктах IBM.

При преобразовании в Unicode некоторые коды не имеют уникального единственного эквивалента Unicode; правильный выбор может зависеть от контекста.

История

Репертуар кодовой страницы 437 был взят из набора символов Ванга текстовых процессоров, согласно Биллу Гейтсу в интервью с Гейтсом и Полом Алленом, которое появилось в выпуске журнала Fortune Magazine от 2 октября 1995 года:

«... Мы также были очарованы специальными текстовыми редакторами от Вана, потому что мы верили, что машины общего назначения могли сделать это с тем же успехом. Вот почему, когда пришло время разработать клавиатуру для IBM PC, мы поместили в машину забавный набор символов Ванга - вы знаете, смайлики, прямоугольники, треугольники и все такое. Мы думали, что мы «Хотел бы когда-нибудь сделать клон текстового редактора Wang».

Согласно интервью с Дэвидом Дж. Брэдли (разработчиком ROM-BIOS для ПК), Персонажи были определены во время четырехчасовой встречи во время перелета из Сиэтла в Атланту Энди Саенсом (ответственным за видеокарту), Лью Эггебрехтом (главным инженером ПК) и привет mself.

Выбор графических символов имеет некоторую внутреннюю логику:

  • строки таблицы 0 и 1, коды от 0 до 31 (от 00 шестнадцатеричный до 1F шестнадцатеричный), это разные дингбаты (дополнительные и декоративные символы). Изолированный символ 127 (7F шестнадцатеричный) также принадлежит к этой группе.
  • Строки со 2 по 7 таблицы, коды с 32 по 126 (20 шестнадцатеричное от до 7E шестнадцатеричный), являются стандартными печатаемыми символами ASCII.
  • Строки таблицы с 8 по 10, коды от 128 до 175 (от 80 шестнадцатеричный до AF шестнадцатеричный), представляют собой набор международных текстовых символов.
  • Строки таблицы с 11 по 13, коды с 176 по 223 (от B0 шестнадцатеричный до DF шестнадцатеричный) являются рисунок рамки и блок символов. Этот блок устроен так, что символы с 192 по 223 (от C0 шестнадцатеричный до DF шестнадцатеричный) содержат все правые ветви и области, заполненные справа. Исходный адаптер дисплея IBM PC MDA хранил кодовую страницу 437 символов глифов как растровые изображения шириной восемь пикселей, но для визуального улучшения отображали их каждые девять пикселей на экране. В этом диапазоне символов восьмой столбец пикселей дублировался специальной аппаратной схемой, таким образом заполняя пробелы в строках и заполненные области. Адаптер VGA позволяет включать и выключать это поведение.
  • Строки 14 и 15 таблицы, коды с 224 по 254 (от E0 шестнадцатеричный до FE шестнадцатеричный) выделены в математические символы, где первые двенадцать представляют собой набор греческих букв, обычно используемых в физике.

Большинство шрифтов для Microsoft Windows включают специальные графические символы в показанных индексах Unicode, поскольку они являются частью WGL4 набор, который Microsoft рекомендует разработчикам шрифтов поддерживать. (Семейство моноширинных растровых шрифтов Терминал было ранним шрифтом, который воспроизводил все 437 символов кодовой страницы, по крайней мере, при некоторых разрешениях.) Чтобы рисовать эти символы непосредственно из этих кодовых точек, Microsoft Windows Шрифт MS Linedraw воспроизводит все 437 символов кодовой страницы, обеспечивая тем самым один способ отображения текста DOS на современной машине Windows, как это было показано в DOS, с ограничениями.

Интернационализация

Кодовая страница 437 имеет серию международных символов, в основном значения от 128 до 175 (от 80 шестнадцатеричное до AF шестнадцатеричное). Однако он полностью охватывает только несколько основных западноевропейских языков, включая английский, немецкий и шведский, и поэтому в нем отсутствуют некоторые символы (в основном заглавные буквы). на многие основные западноевропейские языки:

  • испанский : Á, Í, Ó и Ú
  • французский : À, Â, È, Ê, Ë, Î, Ï, Ô, Œ, œ, Ù, Û и Ÿ
  • португальский : Á, À, Â,, ã, Ê, Í, Ó,, Õ, õ и Ú
  • каталонский : À, È, Í, Ï, Ò, Ó и Ú
  • итальянский : À, È, Ì, Ò и Ù
  • исландский : Á, Ð, ð, Í, Ó, Ú, Ý, ý, Þ и þ
  • датский / норвежский : Ø и ø. Символ номер 237 (ED шестнадцатеричный), маленький фи (закрытая форма), может использоваться в качестве суррогата, даже если он может плохо отображаться (кроме того, он имеет тенденцию отображаться в Unicode и / или отображаться в Шрифты Unicode, такие как открытая форма phi или закрытая вертикальная форма phi, которые даже дальше от O с штрихом). В качестве компенсации кодовые страницы датского / норвежского и исландского (865 и 861 ) заменили знак цента ( ¢) с ø и знак йены (¥) с Ø.
  • Большинство символов греческого алфавита были опущены, за исключением основных математических символов. (Они были включены в кодовые страницы греческого языка 737 и 869. У некоторых греческих символов, которые уже были в кодовой странице 437, были изменены глифы с математических или научных форм для соответствия фактическое употребление в греческом языке.)

Наряду с центом (¢), фунтом стерлингов (£) и йеной / юанем (¥) символы валюты, на нем есть пара бывших символов европейской валюты: флорин (ƒ, Нидерланды) и песета (₧, Испания). Наличие последней необычно, поскольку испанская песета никогда не была международной валютой, а также никогда не имела собственного символа; его просто сокращали как «Pt», «Pta», «Pts» или «Ptas». Однако испанские модели электрической пишущей машинки IBM также имели одну позицию, посвященную ей.

Более поздние наборы символов DOS, такие как кодовая страница 850 (DOS Latin-1), кодовая страница 852 (DOS центральноевропейская) и кодовая страница 737 (греческий DOS), заполнив пробелы для международного использования с некоторой совместимостью с кодовой страницей 437, сохранив одиночные и двойные символы рисования прямоугольником, отбросив смешанные (например, горизонтальный двойной / вертикальный одиночный). Все символы кодовой страницы 437 имеют похожие глифы в Unicode и в наборе символов Microsoft WGL4, и поэтому доступны в большинстве шрифтов в Microsoft Windows, а также в шрифт VGA по умолчанию для ядра Linux и шрифты ISO 10646 для X11.

См. также

Примечания

Ссылки

  1. ^Наборы символов, Internet Assigned Numbers Authority ( IANA), 12 декабря 2018 г.
  2. ^«Информационный документ CCSID 437». Архивировано из исходного 27 марта 2016 года.
  3. ^«OEM 437». Перейти в Глобальный центр разработчиков. Microsoft. Архивировано с исходного 9 июня 2016 г. Получено 22 сентября 2011 г.
  4. ^ "OEM font". Энциклопедия. PCmag.com. Проверено 15 ноября 2011.
  5. ^Кано, Надин. «Приложение H Кодовые страницы». Глобализация и локализация: кодовая страница 437 DOS Latin US. Разработка международного программного обеспечения. Microsoft. Архивировано из оригинала 17 марта 2016 г. Получено 14 ноября 2011 г.
  6. ^ «Глоссарий терминов, используемых на этом сайте». Microsoft. (См. Описание термина «Alt + Numpad»). Архивировано из оригинального 8 сентября 2012 года. Получено 17 августа 2018 года.
  7. ^Мюррей Сарджент. «Ввод символов Unicode - Мюррей Сарджент: математика в офисе». Проверено 17 августа 2018 г.
  8. ^«Комбинации клавиш ALT + NUMPAD ASCII: α и Ω создания непонятных паролей». Проверено 17 августа 2018 г.
  9. ^«Вставка латинских символов и символов ASCII или Unicode - служба поддержки Office». Microsoft. Проверено 17 августа 2018 г.
  10. ^«Информационный документ кодовой страницы SBCS CPGID 00437». Наборы кодированных символов и связанные ресурсы. IBM. 1986 [1984-05-01]. Заархивировано из оригинала 9 июня 2016 г. Получено 14 ноября 2011 г.
  11. ^Стил, Шон (24 апреля 1996 г.). «cp437_DOSLatinUS в таблицу Unicode» (TXT). 2.00. Консорциум Unicode. Архивировано из оригинала 9 июня 2016 г. Получено 14 ноября 2011 г.
  12. ^Кодовая страница CPGID 00437 (pdf) (PDF), IBM
  13. ^Кодовая страница CPGID 00437 (txt), IBM
  14. ^Международные компоненты для Unicode (ICU), ibm-437_P100-1995.ucm, 3 декабря 2002 г.
  15. ^«Кодовая страница (CPGID): 00437». Наборы кодированных символов и связанные ресурсы. IBM. 1984. Проверено 25 февраля 2017 года.
  16. ^ «Графические идентификаторы символов: алфавит, греческий». Наборы кодированных символов и связанные ресурсы. IBM. Проверено 25 февраля 2017 г.
  17. ^Консорциум Unicode (21 мая 2003 г.). «Глава 7: Европейские алфавиты». Стандарт Unicode 4.0 (PDF). Аддисон-Уэсли (опубликовано в августе 2003 г.). п. 176. ISBN 0-321-18578-1. Проверено 9 июня 2016 г.
  18. ^«cpython / cp437.py на master · python / cpython · GitHub». Проверено 17 августа 2018 г.
  19. ^«Греческий и коптский: диапазон: 0370–03FF» (PDF). Стандарт Unicode версии 9.0. Консорциум Unicode. Проверено 25 февраля 2017 г.
  20. ^Эдвардс, Бендж (6 ноября 2015 г.) [2011]. «Истоки смайлика ASCII: обмен электронной почтой с доктором Дэвидом Брэдли». Заархивировано из оригинала 28 ноября 2016 г. Получено 27 ноября 2016 г. […] Если вы посмотрите на первые 32 символа в наборе символов IBM PC, вы увидите множество причудливых персонажей - смайлик, музыкальные ноты, масти игральных карт и другие. Они были предназначены для игр с персонажами […] Так как мы использовали 8-битные символы, у нас было 128 новых мест, которые нужно было заполнить. Мы поместили туда серьезные символы - три столбца иностранных символов, основываясь на нашем опыте Datamaster. Три столбца блочных графических символов […] у многих клиентов с Monochrome Display Adapter вообще не будет графики. […] В двух столбцах были математические символы, греческие буквы (для математики) и другие […] о первых 32 символах (x00-x1F)? […] Эти символы возникли при передаче по телетайпу. Но мы могли отображать их на экранах персонажей. Итак, мы добавили набор «несерьезных» персонажей. Они были предназначены только для отображения символов, а не для передачи или хранения. Наиболее вероятно их использование в играх с персонажами. […] Как и в большинстве случаев для IBM PC, годичный график разработки оставлял мало времени для размышлений и пересмотра. […] Набор персонажей был разработан в ходе четырехчасовой встречи из трех человек, и я был одним из тех, кто летел из Сиэтла в Атланту. После этой встречи были внесены некоторые незначительные изменения, но нужно было спроектировать / исправить / решить множество других вещей, так что это все. […] Другими участниками той поездки на самолете были Энди Саенс - ответственный за видеокарту и Лью Эггебрехт - главный инженер ПК.
  21. ^Уилтон, Ричард (декабрь 1987 г.). Руководство программиста по видеосистемам для ПК и PS / 2: максимальная производительность видео в EGA, VGA, HGC и MCGA (1-е изд.). Microsoft Press. ISBN 1-55615-103-9. ISBN 978-1-55615-103-3.
  22. ^Джошуа Д. Нил, Регистры контроллера атрибутов : Регистр управления режимом атрибутов, страница информации о программировании видео VGA и SVGA на аппаратном уровне: бит 2 - включение линейной графики.
  23. ^Майк Джейкобс. «Семейство шрифтов MS LineDraw - Typography | Microsoft Docs». Типографика Microsoft. 2.00. Корпорация Майкрософт. Проверено 17 августа 2018 г.
  24. ^Staff (26 октября 2013 г.). «WD97: Шрифт MS LineDraw не используется в Word». Microsoft. 2.0. Microsoft. KB179422, Q179422. Заархивировано из оригинала 24 марта 2016 г. Получено 1 июля 2012 г.

Внешние ссылки

Последняя правка сделана 2021-05-15 13:40:58
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте