ISO / IEC 8859

редактировать

Семейство кодировок ISO 8859
Стандарт	ISO / IEC 8859
Классификация	8-битный расширенный ASCII, ISO 4873 уровень 1
Расширяет	US-ASCII
Предыдущий	ISO 646
Преемник	ISO / IEC 10646 (Unicode )
Другая связанная кодировка (и)	Windows-125x
v t

ISO / IEC 8859 является объединением ISO и серия стандартов IEC для 8-битных кодировок символов. Серия стандартов состоит из пронумерованных частей, например ISO / IEC 8859-1, ISO / IEC 8859-2 и т. Д. Есть 15 частей, не считая заброшенного ISO / IEC 8859-12. Рабочая группа ISO, поддерживающая эту серию стандартов, была распущена.

ISO / IEC 8859 части 1, 2, 3 и 4 изначально были Ecma International стандартом ECMA-94 .

Содержание

1 Введение
2 символа
3 Части ISO / IEC 8859
- 3.1 Таблица
4 Связь с Unicode и UC S
5 Текущее состояние
6 См. Также
7 Примечания
8 Ссылки

Введение

В то время как битовые шаблоны 95 printable Для обмена информацией в современном английском достаточно символов ASCII, для большинства других языков, использующих латинские алфавиты, требуются дополнительные символы, не охватываемые ASCII. ИСО / МЭК 8859 попытался решить эту проблему, используя восьмой бит в 8-битном байте , чтобы разрешить позиции для других 96 печатаемых символов. Раннее кодирование было ограничено 7 битами из-за ограничений некоторых протоколов передачи данных и частично по историческим причинам. Однако требовалось больше символов, чем могло поместиться в одной 8-битной кодировке символов, поэтому было разработано несколько отображений, в том числе по крайней мере десять, подходящих для различных латинских алфавитов.

Кодировки ISO / IEC 8859-n содержат только печатаемые символы и были разработаны для использования вместе с управляющими символами, сопоставленными с неназначенными байтами. С этой целью серия кодировок, зарегистрированных в IANA, добавляет контрольный набор C0 (управляющие символы отображаются в байты с 0 по 31) из ISO 646 и C1 контрольный набор (управляющие символы сопоставлены байтам со 128 по 159) из ISO 6429, что приводит к полному 8-битному отображению символов с большинством, если не всеми, назначенными байтами. Эти наборы имеют ISO-8859-n в качестве предпочтительного имени MIME или, в случаях, когда предпочтительное имя MIME не указано, их каноническое имя. Многие люди используют термины ISO / IEC 8859-n и ISO-8859-n как синонимы. ISO / IEC 8859-11 не получил такой кодировки, предположительно потому, что он почти идентичен TIS 620.

Символы

Разработан стандарт ISO / IEC 8859 для надежного обмена информацией, а не типографика ; в стандарте отсутствуют символы, необходимые для высококачественной типографики, такие как необязательные лигатуры, фигурные кавычки, тире и т. д. В результате в высококачественных системах набора часто используются собственные или идиосинкразические расширения поверх ASCII и стандартами ISO / IEC 8859 или используйте вместо него Unicode.

Как показывает практика, если символ или символ еще не был частью широко используемого набора символов обработки данных, а также обычно не предоставлялся на клавиатурах пишущих машинок для национального языка, они не попадали в него. Следовательно, были включены направленные двойные кавычки «и», используемые для некоторых европейских языков, но не направленные двойные кавычки «и», используемые для английского и некоторых других языков.

Французский язык не получил своих лигатур œ и, потому что их можно было набрать как «oe». Аналогично, Ÿ, необходимая для текста, состоящего только из заглавных букв, также была удалена. Эти три символа, хотя и под разными кодовыми точками, были позже повторно введены в ISO / IEC 8859-15 в 1999 году, в котором также был введен новый знак евро символ €. Точно так же голландский язык не получил букв ĳ и Ĳ, потому что носители голландского языка привыкли набирать их как две буквы.

Румынский язык изначально не получил своих букв Ș / ș и Ț / ț (с запятой ), потому что эти буквы изначально были объединены с / ş и Ţ / ţ (с cedilla ) Консорциумом Unicode, учитывая, что формы с запятой ниже являются вариантами глифа форм с седилем. Однако буквы с явной запятой ниже были позже добавлены в стандарт Unicode, а также в ISO / IEC 8859-16.

Большинство кодировок ISO / IEC 8859 содержат диакритические знаки, необходимые для различных европейских языков с использованием латиницы. сценарий. Другие используют нелатинские алфавиты: греческий, кириллица, иврит, арабский и тайский. Большинство кодировок содержат только пробелов, хотя тайский, еврейский и арабский также содержат комбинирующие символы.

Стандарт не предусматривает сценариев восточноазиатских языков (CJK ), поскольку их идеографические системы письма требуют многих тысяч кодовых точек. Хотя в нем используются символы на основе латиницы, вьетнамский не помещается в 96 позиций (без использования комбинированных диакритических знаков, таких как Windows-1258 ). Каждый японский слоговой алфавит (хирагана или катакана, см. Кана ) подойдет, как в JIS X 0201, но, как и некоторые другие алфавиты мира, они не закодированы в ISO / IEC. Система 8859.

Разделы ISO / IEC 8859

ISO / IEC 8859 разделены на следующие части:

Часть	Название	Редакции	Другие стандарты	Описание
Часть 1	Latin-1. Западноевропейская	1987, 1998	ECMA-94 (1985, 1986)	Возможно, наиболее широко используемая часть ISO / IEC 8859, охватывающая большинство западноевропейских языков: датский (частично), голландский (частично), английский, фарерский, финский (частично), французский (частично), немецкий, исландский, ирландский, итальянский, норвежский, португальский, рето-романский, шотландский гэльский, испанский, каталонский и шведский. Охватываются также языки из других частей мира, в том числе: восточноевропейский албанский, юго-восточноазиатский индонезийский, а также африканские языки африкаанс и Суахили. Отсутствующий знак евро и заглавная буква Ÿ присутствуют в новой версии ISO / IEC 8859-15 (см. Ниже). Соответствующий набор символов IANA - ISO-8859-1.
Часть 2	Latin-2. Центральноевропейская	1987, 1999	ECMA-94 (1986)	Поддерживает центральные и Восточноевропейские языки, использующие латинский алфавит, включая боснийский, польский, хорватский, чешский, словацкий, словенский, сербский и венгерский. Отсутствующий знак евро можно найти в версии ISO / IEC 8859-16.
Часть 3	Latin-3. Южноевропейский	1988, 1999		Турецкий, Мальтийский и Эсперанто. В значительной степени заменен ISO / IEC 8859-9 для турецкого языка.
Часть 4	Latin-4. Северная Европа	1988, 1998		Эстонский, Латышский, Литовский, гренландский и саамский.
часть 5	латынь / кириллица	1988, 1999	ECMA-113 (1988, 1999)	Охватывает в основном славянские языки с кириллицей, включая белорусский, болгарский, македонский, русский, сербский и украинский (частично).
часть 6	латинский / арабский	1987, 1999	ASMO 708 (1986) / ECMA-114 (1986, 2000)	Охватывает наиболее распространенные символы арабского языка. Не поддерживает другие языки, использующие арабский шрифт. Необходимо обработать BiDi и курсивное соединение для отображения.
Часть 7	Латинский / Греческий	1987, 2003	ELOT 928 (1986) / ECMA-118 (1986)	Охватывает современный греческий язык (монотонная орфография ). Также может использоваться для древнегреческого греческого, написанного без ударения или в монотонной орфографии, но без диакритических знаков для политонической орфографии. Они были введены в Unicode.
Часть 8	Латинский / Иврит	1988, 1999	ECMA-121 (1987, 2000) / SI 1311 (2002 )	Охватывает современный еврейский алфавит, используемый в Израиле. На практике существуют две разные кодировки: логический порядок (должен быть BiDi обработан для отображения) и визуальный (слева направо). -право) порядок (фактически, после обработки двунаправленного текста и разрыва строки).
Часть 9	Latin-5. Турецкий	1989, 1999	ECMA-128 (1988, 1999)	В основном то же, что и ISO / IEC 8859-1, с заменой редко используемых исландских букв на турецких.
Часть 10	Latin-6. Nordic	1992, 1998	ECMA-144 (1990, 1992, 2000)	Перегруппировка Latin- 4. Считается более полезным для скандинавских языков. В балтийских языках больше используется Latin-4.
Часть 11	Latin / Thai	2001	TIS-620 (1990)	Содержит символы, необходимые для тайского языка. Практически идентичны TIS 620.
~~Часть 12~~	Latin / D evanagari	N / A	-	Работа по созданию части 8859 для Деванагари была официально прекращена в 1997 году. ISCII и Unicode / ISO / IEC 10646 охват Деванагари.
Часть 13	Latin-7. Baltic Rim	1998	-	Добавлены некоторые символы для балтийских языков, которые отсутствовали в Latin-4 и Latin-6. Относится к ранее опубликованной Windows-1257.
Part 14	Latin-8. Celtic	1998	-	Охватывает кельтские языки, такие как Gaelic и Бретонский язык.
Часть 15	Latin-9	1999	-	Редакция 8859-1, в которой удалены некоторые малоиспользуемые символы, заменены на знак евро € и буквы Š, š, Ž, ž, Œ, œ и Ÿ, что завершает охват французского, финского и эстонского.
части 16	латыни -10. Юго-Восточная Европа	2001	SR 14111 (1998)	Предназначено для албанцев, хорватов, Венгерский, итальянский, польский, румынский и словенский, а также финский, французский, немецкий и ирландский Гэльский (новая орфография). Акцент делается больше на буквы, чем на символы. Знак валюты заменяется знаком евро.

Каждая часть ISO / IEC 8859 разработана для поддержки языков, которые часто заимствуют друг у друга, поэтому символы, необходимые для каждого языка, обычно используются одной частью. Однако есть некоторые символы и языковые комбинации, которые нельзя использовать без транскрипции. Были приложены усилия, чтобы преобразование было максимально плавным. Например, в немецком языке все семь специальных символов находятся на одних и тех же позициях во всех латинских вариантах (1–4, 9, 10, 13–16), и во многих позициях символы различаются только диакритическими знаками между наборами. В частности, варианты 1–4 были разработаны совместно и обладают тем свойством, что каждый закодированный символ появляется либо в определенной позиции, либо не появляется вовсе.

Таблица

Сравнение различных частей (1–16) ISO / IEC 8859
Двоичный	Окт	Dec	Hex	1	2	3	4	5	6	7	8	9	10	11	13	14	15	16
1010 0000	240	160	A0	Неразрывный пробел (NBSP)
1010 0001	241	161	A1	¡	Ą	Ħ	Ą	Ё		‘		¡	Ą	ก	”	Ḃ	¡	Ą
1010 0010	242	162	A2	¢	˘		ĸ	Ђ		’	¢	¢	Ē	ข	¢	ḃ	¢	ą
1010 0011	243	163	A3	£	Ł	£	Ŗ	Ѓ		£			Ģ	ฃ	£			Ł
1010 0100	244	164	A4	¤				Є	¤	€	¤		Ī	ค	¤	Ċ	€
1010 0101	245	165	A5	¥	Ľ		Ĩ	Ѕ		₯	¥		Ĩ	ฅ	„	ċ	¥	„
1010 0110	246	166	A6	¦	Ś	Ĥ	Ļ	І		¦			Ķ	ฆ	¦	Ḋ	Š
1010 0111	247	167	A7	§				Ї		§				ง	§
1010 1000	250	168	A8	¨				Ј		¨			Ļ	จ	Ø	Ẁ	š
1010 1001	251	169	A9	©	Š	İ	Š	Љ		©			Đ	ฉ	©
1010 1010	252	170	AA	ª	Ş		Ē	Њ		ͺ	×	ª	Š	ช	Ŗ	Ẃ	ª	Ș
1010 1011	253	171	AB	«	Ť	Ğ	Ģ	Ћ		«			Ŧ	ซ	«	ḋ	«
1010 1100	254	172	AC	¬	Ź	Ĵ	Ŧ	Ќ	،	¬			Ž	ฌ	¬	Ỳ	¬	Ź
1010 1101	255	173	AD	Мягкий дефис (SHY)										ญ	SHY
1010 1110	256	174	AE	®	Ž		Ž	Ў			®		Ū	ฎ	®			ź
1010 1111	25 7	175	AF	¯	Ż		¯	Џ		―	¯		Ŋ	ฏ	Æ	Ÿ	¯	Ż
1011 0000	260	176	B0	°				А		°				ฐ	°	Ḟ	°
1011 0001	261	177	B1	±	ą	ħ	ą	Б		±			ą	ฑ	±	ḟ	±
1011 0010	262	178	B2	²	˛	²	˛	В		²			ē	ฒ	²	Ġ	²	Č
1011 0011	263	179	B3	³	ł	³	ŗ	Г		³			ģ	ณ	³	ġ	³	ł
1011 0100	264	180	B4	´				Д		΄	´		ī	ด	“	Ṁ	Ž
1011 0101	265	181	B5	µ	ľ	µ	ĩ	Е		΅	µ		ĩ	ต	µ	ṁ	µ	”
1011 0110	266	182	B6	¶	ś	ĥ	ļ	Ж		Ά	¶		ķ	ถ	¶
1011 0111	267	183	B7	·	ˇ	·	ˇ	З		·				ท	·	Ṗ	·
1011 1000	270	184	B8	¸				И		Έ	¸		ļ	ธ	ø	ẁ	ž
1011 1001	271	185	B9	¹	š	ı	š	Й		Ή	¹		đ	น	¹	ṗ	¹	č
1011 1010	272	186	BA	º	ş		ē	К		Ί	÷	º	š	บ	ŗ	ẃ	º	ș
1011 1011	273	187	BB	»	ť	ğ	ģ	Л	؛	»			ŧ	ป	»	Ṡ	»
1011 1100	274	188	BC	¼	ź	ĵ	ŧ	М		Ό	¼		ž	ผ	¼	ỳ	Œ
1011 1101	275	189	BD	½	˝	½	Ŋ	Н		½			―	ฝ	½	Ẅ	œ
1011 1110	276	190	BE	¾	ž		ž	О		Ύ	¾		ū	พ	¾	ẅ	Ÿ
1011 1111	277	191	BF	¿	ż		ŋ	П	؟	Ώ		¿	ŋ	ฟ	æ	ṡ	¿	ż
1100 0000	300	192	C0	À	Ŕ	À	Ā	Р		ΐ		À	Ā	ภ	Ą	À
1100 0001	301	193	C1	Á				С	ء	Α		Á		ม	Į	Á
1100 0010	302	194	C2	Â				Т	آ	Β		Â		ย	Ā	Â
1100 0011	303	195	C3	Ã	Ă		Ã	У	أ	Γ		Ã		ร	Ć	Ã		Ă
1100 0100	304	196	C4	Ä				Ф	ؤ	Δ		Ä		ฤ	Ä
1100 0101	305	197	C5	Å	Ĺ	Ċ	Å	Х	إ	Ε		Å		ล	Å			Ć
1100 0110	306	198	C6	Æ	Ć	Ĉ	Æ	Ц	ئ	Ζ		Æ		ฦ	Ę	Æ
1100 0111	307	199	C7	Ç			Į	Ч	ا	Η		Ç	Į	ว	Ē	Ç
1100 1000	310	200	C8	È	Č	È	Č	Ш	ب	Θ		È	Č	ศ	Č	È
1100 1001	311	201	C9	É				Щ	ة	Ι		É		ษ	É
1100 1010	312	202	CA	Ê	Ę	Ê	Ę	Ъ	ت	Κ		Ê	Ę	ส	Ź	Ê
1100 1011	313	203	CB	Ë				Ы	ث	Λ		Ë		ห	Ė	Ë
1100 1100	314	204	CC	Ì	Ě	Ì	Ė	Ь	ج	Μ		Ì	Ė	ฬ	Ģ	Ì
1100 1101	315	205	CD	Í				Э	ح	Ν		Í		อ	Ķ	Í
1100 1110	316	206	CE	Î				Ю	خ	Ξ		Î		ฮ	Ī	Î
1100 1111	317	207	CF	Ï	Ď	Ï	Ī	Я	د	Ο		Ï		ฯ	Ļ	Ï
двоичный	окт	декабрь	шестнадцатеричный	1	2	3	4	5	6	7	8	9	10	11	13	14	15	16
1101 0000	320	208	D0	Ð	Đ		Đ	а	ذ	Π		Ğ	Ð	ะ	Š	Ŵ	Ð
1101 0001	321	209	D1	Ñ	Ń	Ñ	Ņ	б	ر	Ρ		Ñ	Ņ	ั	Ń	Ñ		Ń
1101 0010	322	210	D2	Ò	Ň	Ò	Ō	в	ز			Ò	Ō	า	Ņ	Ò
1101 0011	323	211	D3	Ó			Ķ	г	س	Σ		Ó		ำ	Ó
1101 0100	324	212	D4	Ô				д	ش	Τ		Ô		ิ	Ō	Ô
1101 0101	325	213	D5	Õ	Ő	Ġ	Õ	е	ص	Υ		Õ		ี	Ő
1101 0110	326	214	D6	Ö				ж	ض	Φ		Ö		ึ	Ö
1101 0111	327	215	D7	×				з	ط	Χ		×	Ũ	ื	×	Ṫ	×	Ś
1101 1000	330	216	D8	Ø	Ř	Ĝ	Ø	и	ظ	Ψ		Ø		ุ	Ų	Ø		Ű
1101 1001	331	217	D9	Ù	Ů	Ù	Ų	й	ع	Ω		Ù	Ų	ู	Ł	Ù
1101 1010	332	218	DA	Ú				к	غ	Ϊ		Ú		ฺ	Ś	Ú
1101 1011	333	219	DB	Û	Ű	Û		л		Ϋ		Û			Ū	Û
1101 1100	334	220	DC	Ü				м		ά		Ü			Ü
1101 1101	335	221	DD	Ý		Ŭ	Ũ	н		έ		İ	Ý		Ż	Ý		Ę
1101 1110	336	222	DE	Þ	Ţ	Ŝ	Ū	о		ή		Ş	Þ		Ž	Ŷ	Þ	Ț
1101 1111	337	223	DF	ß				п		ί	‗	ß		฿	ß
1110 0000	340	224	E0	à	ŕ	à	ā	р	ـ	ΰ	א	à	ā	เ	ą	à
1110 0001	341	225	E1	á				с	ف	α	ב	á		แ	į	á
1110 0010	342	226	E2	â				т	ق	β	ג	â		โ	ā	â
1110 0011	343	227	E3	ã	ă		ã	у	ك	γ	ד	ã		ใ	ć	ã		ă
1110 0100	344	228	E4	ä				ф	ل	δ	ה	ä		ไ	ä
1110 0101	345	229	E5	å	ĺ	ċ	å	х	م	ε	ו	å		ๅ	å			ć
1110 0110	346	230	E6	æ	ć	ĉ	æ	ц	ن	ζ	ז	æ		ๆ	ę	æ
1110 0111	347	231	E7	ç			į	ч	ه	η	ח	ç	į	็	ē	ç
1110 1000	350	232	E8	è	č	è	č	ш	و	θ	ט	è	č	่	č	è
1110 1001	351	233	E9	é				щ	ى	ι	י	é		้	é
1110 1010	352	234	EA	ê	ę	ê	ę	ъ	ي	κ	ך	ê	ę	๊	ź	ê
1110 1011	353	235	EB	ë				ы	ً	λ	כ	ë		๋	ė	ë
1110 1100	354	236	EC	ì	ě	ì	ė	ь	ٌ	μ	ל	ì	ė	์	ģ	ì
1110 1101	355	237	ED	í				э	ٍ	ν	ם	í		ํ	ķ	í
1110 1110	356	238	EE	î				ю	َ	ξ	מ	î		๎	ī	î
1110 1111	357	239	EF	ï	ď	ï	ī	я	ُ	ο	ן	ï		๏	ļ	ï
1111 0000	360	240	F0	ð	đ		đ	№	ِ	π	נ	ğ	ð	๐	š	ŵ	ð	đ
1111 0001	361	241	F1	ñ	ń	ñ	ņ	ё	ّ	ρ	ס	ñ	ņ	๑	ń	ñ		ń
1111 0010	362	242	F2	ò	ň	ò	ō	ђ	ْ	ς	ע	ò	ō	๒	ņ	ò
1111 0011	363	243	F3	ó			ķ	ѓ		σ	ף	ó		๓	ó
1111 0100	364	244	F4	ô				є		τ	פ	ô		๔	ō	ô
1111 0101	365	245	F5	õ	ő	ġ	õ	ѕ		υ	ץ	õ		๕	ő
1111 0110	366	246	F6	ö				і		φ	צ	ö		๖	ö
1111 0111	367	247	F7	÷				ї		χ	ק	÷	ũ	๗	÷	ṫ	÷	ś
1111 1000	370	248	F8	ø	ř	ĝ	ø	ј		ψ	ר	ø		๘	ų	ø		ű
1111 1001	371	249	F9	ù	ů	ù	ų	љ		ω	ש	ù	ų	๙	ł	ù
111 1 1010	372	250	FA	ú				њ		ϊ	ת	ú		๚	ś	ú
1111 1011	373	251	FB	û	ű	û		ћ		ϋ		û		๛	ū	û
1111 1100	374	252	FC	ü				ќ		ό		ü			ü
1111 1101	375	253	FD	ý		ŭ	ũ	§		ύ	LRM	ı	ý		ż	ý		ę
1111 1110	376	254	FE	þ	ţ	ŝ	ū	ў		ώ	RLM	ş	þ		ž	ŷ	þ	ț
1111 1111	377	255	FF	ÿ	˙			џ				ÿ	ĸ		’	ÿ
Binary	Oct	Dec	Hex	1	2	3	4	5	6	7	8	9	10	11	13	14	15	16

В позиции 0xA0 всегда есть неразрывный пробел, а 0xAD - это в основном мягкий дефис, который отображается только в разрывах строки. Другие пустые поля либо не назначены, либо используемая система не может их отобразить.

Есть новых дополнений в виде версий ISO / IEC 8859-7: 2003 и ISO / IEC 8859-8: 1999. LRM означает знак с направлением слева направо (U + 200E), а RLM означает знак с направлением справа налево (U + 200F).

Связь с Unicode и UCS

С 1991 года Консорциум Unicode работал с ISO и IEC над разработкой стандарта Unicode и ISO / IEC 10646 : тандемный универсальный набор символов (UCS). Более новые версии ISO / IEC 8859 выражают символы в терминах их имен Unicode / UCS и нотации U + nnnn, фактически заставляя каждую часть ISO / IEC 8859 быть схемой кодирования символов Unicode / UCS, которая отображает очень небольшое подмножество ПСК в одиночные 8-битные байты. Первые 256 символов в Unicode и UCS идентичны таковым в ISO / IEC-8859-1 (Latin-1 ).

Однобайтовые наборы символов, включая части ISO / IEC 8859 и производные от них, пользовались популярностью на протяжении 1990-х годов, имея преимущества в том, что они хорошо известны и их легче реализовать в программном обеспечении: уравнение одного байта к один символ прост и подходит для большинства одноязычных приложений, и здесь нет комбинируемых символов или вариантов форм. По мере того, как операционные системы с поддержкой Unicode стали более распространенными, ISO / IEC 8859 и другие устаревшие кодировки стали менее популярными. В то время как остатки стандарта ISO 8859 и однобайтовых символьных моделей по-прежнему укоренились во многих операционных системах, языках программирования, системах хранения данных, сетевых приложениях, аппаратном обеспечении дисплея и прикладном программном обеспечении для конечных пользователей, большинство современных вычислительных приложений используют Unicode для внутренних целей и полагаются на преобразование таблицы для сопоставления с другими кодировками, когда это необходимо.

Текущее состояние

Стандарт ISO / IEC 8859 поддерживался Объединенным техническим комитетом ISO / IEC 1, Подкомитетом 2, Рабочей группой 3 (ISO / IEC JTC 1 / SC 2 / WG 3). В июне 2004 г. WG 3 была расформирована, а обязанности по обслуживанию были переданы SC 2. Стандарт в настоящее время не обновляется, так как единственная оставшаяся рабочая группа Подкомитета, WG 2, концентрируется на разработке универсального кодированного набора символов.

Кодировки WHATWG. Стандарт, который определяет кодировки символов, разрешенные в HTML5, которые должны поддерживать совместимые браузеры, включает большинство частей ISO / IEC 8859, за исключением частей 1, 9 и 11, которые вместо этого интерпретируются как Windows- 1252, Windows-1254 и Windows-874 соответственно. Авторам новых страниц и разработчикам новых протоколов рекомендуется использовать UTF-8 вместо.

См. Также

Список компьютерных наборов символов
Набор символов RPL (Расширенный набор ISO 8859-1 для калькуляторов HP, также называемый «ECMA-94»)
Многонациональный набор символов DEC (MCS)
Национальный заменяемый набор символов DEC (NRCS)

Примечания

Ссылки

Опубликованные версии каждой части ISO / IEC 8859 доступны за плату на сайте каталога ISO и в Интернет-магазине IEC.
PDF-версии окончательных проектов некоторых частей ISO / IEC 8859, представленных в ISO / IEC JTC 1 / SC 2 / WG 3 для обзора и публикации, доступны на веб-сайте WG 3 :
- ISO / IEC 8859-1: 1998 - 8-битные однобайтовые наборы графических символов, Часть 1: Латинский алфавит № 1 (черновик от 12 февраля 1998 г., опубликован 15 апреля 1998 г.)
- ISO / IEC 8859-4: 1998 - 8-битные однобайтовые наборы графических символов, Часть 4: Латинский алфавит № 4 (черновик от февраля 12 января 1998 г., опубликовано 1 июля 1998 г.)
- ISO / IEC 8859-7: 1999 - 8-битные однобайтовые наборы графических символов, Часть 7: Латинский / греческий алфавит (черновик от 10 июня, 1999; заменен ISO / IEC 8859-7: 2003, опубликованным 10 октября 2003 г.)
- ISO / IEC 8859-10: 1998 - 8-битные однобайтовые наборы графических символов, Часть 10: Латинский алфавит No. 6 (черновик от 12 февраля 1998 г., опубликован 15 июля 1998 г.)
- ISO / IEC 8859-11: 1999 - 8-битные однобайтовые наборы графических символов, Часть 11: Набор латинских / тайских символов ( проект от 22 июня 1999 г.; заменен ISO / IEC 8859-11: 2001, опубликован 15 декабря 2001 г.)
- ISO / IEC 8859-13: 1998 - 8-битные однобайтовые графические наборы символов, Часть 13: Латинский алфавит № 7 (черновик от 15 апреля 1998 г., опубликован 15 октября 1998 г.)
- ISO / IEC 8859-15: 1998 - 8-битные однобайтовые наборы графических символов, Часть 15: Латинский алфавит № 9 (проект от 1 августа 1997 г.; заменен ISO / IEC 8859-15: 1999, опубликован 15 марта 1999 г.)
- ISO / IEC 8859-16: 2000 - 8-битный одинарный наборы графических символов с байтовым кодированием, Часть 16: Латинский алфавит № 10 (черновик от 15 ноября 1999 г.; заменен ISO / IEC 8859-16: 2001, опубликован 15 июля 200 г. 1)
Стандарты ECMA, которые по замыслу точно соответствуют стандартам набора символов ISO / IEC 8859, можно найти по адресу:
- Стандарт ECMA-94 : 8-битный однобайтовый графический символ Наборы - латинские алфавиты с №1 по №4, 2-е издание (июнь 1986 г.)
- Стандартный ECMA-113 : 8-битные однобайтовые графические наборы символов - латинский / кириллический алфавит, 3-е издание (декабрь 1999 г.)
- Стандартный ECMA-114 : 8-битные однобайтовые графические наборы символов - латинский / арабский алфавит 2-е издание (декабрь 2000 г.)
- Стандартный ECMA-118 : 8-битные однобайтовые графические символы Наборы символов - латинский / греческий алфавит (декабрь 1986 г.)
- Стандартный ECMA-121 : 8-битные однобайтовые графические наборы символов - латинский / еврейский алфавит 2-е издание (декабрь 2000 г.)
- Стандартный ECMA-128 : 8-битные однобайтовые наборы графических символов - латинский алфавит № 5, 2-е издание (декабрь 1999 г.)
- Стандартный ECMA-144 : 8-битные однобайтовые кодированные символы - латинский алфавит Нет. 6 3-е издание (декабрь 2000 г.)
Таблицы сопоставления ISO / IEC 8859-1 в Unicode в виде текстовых файлов находятся на FTP-сайте Unicode.
Неофициальные описания и таблицы кодов для большинства стандартов ISO / IEC 8859 доступны в ISO / IEC 8859 Alphabet Soup (Зеркало)