Целое число (информатика)

редактировать

Датум целочисленного типа данных

В информатике целое число данные интегрального типа данных, тип данных, который представляет некоторый диапазон математических целых чисел. Интегральные типы данных могут иметь разные размеры и могут содержать или не содержать отрицательные значения. Целые числа обычно представлены в компьютере как группа двоичных цифр (битов). Размер группировки варьируется, поэтому набор доступных целочисленных размеров варьируется для разных типов компьютеров. Компьютерное оборудование, включая виртуальные машины, почти всегда обеспечивает способ представления регистра процессора или адреса памяти в виде целого числа.

Содержание

1 Значение и представление
2 Общие целые типы данных
- 2.1 Байты и октеты
- 2.2 Слова
- 2.3 Короткое целое число
- 2.4 Длинное целое
- 2.5 Длинное длинное
3 См. Также
4 Примечания
5 Ссылки

Значение и представление

Значение элемента с целочисленным типом - это математическое целое число, которому он соответствует. Целочисленные типы могут быть беззнаковыми (способными представлять только неотрицательные целые числа) или знаковыми (способными также представлять отрицательные целые числа).

Целочисленное значение обычно указывается в исходном коде документа программа в виде последовательности цифр, необязательно с префиксом + или -. Некоторые языки программирования допускают другие обозначения, например шестнадцатеричные (основание 16) или восьмеричные (основание 8). Некоторые языки программирования также допускают разделители групп цифр.

. Внутреннее представление этой базы данных - это способ сохранения значения в памяти компьютера. В отличие от математических целых чисел, типичные данные в компьютере имеют минимальное и максимальное возможное значение.

Наиболее распространенное представление положительного целого числа - это строка из битов с использованием двоичной системы счисления. Порядок в памяти байтов, в которых хранятся биты, меняется; см. порядок байтов. Ширина или точность целочисленного типа - это количество бит в его представлении. Целочисленный тип с n битами может кодировать 2 числа; например, беззнаковый тип обычно представляет неотрицательные значения от 0 до 2-1. Иногда используются другие кодировки целочисленных значений в битовые шаблоны, например двоично-десятичный код или код Грея, или в виде печатных кодов символов, таких как ASCII.

. четыре хорошо известных способа представления чисел со знаком в двоичной вычислительной системе. Наиболее распространенным является дополнение до двух, которое позволяет целочисленному типу со знаком с n битами представлять числа от -2 до 2-1. Арифметика дополнения до двух удобна тем, что существует идеальное взаимно-однозначное соответствие между представлениями и значениями (в частности, нет отдельных +0 и -0), и потому что сложение, вычитание и умножение не требует различения между знаковыми и беззнаковыми типами. Другие возможности включают двоичное смещение, знак-величина и дополнение до единиц.

. Некоторые компьютерные языки определяют целочисленные размеры машинно-независимым способом; другие имеют разные определения в зависимости от размера слова процессора. Не все языковые реализации определяют переменные всех целочисленных размеров, а определенные размеры могут даже не различаться в конкретной реализации. Целое число на одном языке программирования может иметь другой размер на другом языке или на другом процессоре.

Общие целые типы данных

Биты	Имя	Диапазон (при условии дополнения до двух для со знаком )	Десятичные цифры	Использует	реализации
Биты	Имя	Диапазон (при условии дополнения до двух для со знаком )	Десятичные цифры	Использует	C /C ++	C#	Pascal и Delphi	Java	SQL	FORTRAN	D
4	полубайт, семиоктет	со знаком: От -8 до 7, от - (2) до 2-1	1	Десятичное число с двоичным кодом, представление одной десятичной цифры	н / д	н / д	н / д	н / д	н / д	н / д	н / д
4	полубайт, семиоктет	Без знака: от 0 до 15, что равно 2-1	2		н / д	н / д	н / д	н / д	н / д	н / д	н / д
8	байт, октет, i8, u8	со знаком: от −128 до 127, от - (2) до 2-1	3	символов ASCII, кодовых единиц в кодировке UTF-8 символов	`int8_t`, `signed char`	`sbyte`	`Shortint`	`byte`	`tinyint`	`integer (1)`	`byte`
8	байт, октет, i8, u8	Без знака: от 0 до 255, что равно 2-1	3	символов ASCII, кодовых единиц в кодировке UTF-8 символов	`uint8_t`, `unsigned char`	`byte`	`Byte`	n / a	`unsigned tinyint`	n / a	`ubyte`
16	полуслово, слово, шор t, i16, u16	со знаком: от -32,768 до 32,767, от - (2) до 2-1	5	UCS-2 символов, кодовых единиц в UTF-16 кодировка символов	`int16_t`, `short`, `int`	`short`	`Smallint`	`short`	`smallint`	`integer (2)`	`short`
16	полуслово, слово, шор t, i16, u16	Unsigned: от 0 до 65 535, что равно 2-1	5	UCS-2 символов, кодовых единиц в UTF-16 кодировка символов	`uint16_t, unsigned`, `unsigned int`	`ushort`	`Word`	`char`	`unsigned smallint`	н / д	`ushort`
32	word, long, doubleword, longword, int, i32, u32	Подписано: From −2 147 483 648 до 2 147 483 647, от - (2) до 2 - 1	10	UTF-32 символов, истинный цвет с альфа-каналом, FourCC, указатели в 32-битные вычисления	`int32_t`, `int`, `long`	`int`	`LongInt`; `Integer`	`int`	`int`	`integer (4)`	`int`
32	word, long, doubleword, longword, int, i32, u32	Без знака: от 0 до 4 294 967 295, что равно 2-1	10		`uint32_t, без знака`, `unsigned int`, `unsigned long`	`uint`	`LongWord`; `DWord`; `Кардинал`	н / д	`unsigned int`	н / д	`uint`
64	слово, двойное слово, длинное слово, длинное длинное, четверное, четверное слово, qword, int64, i64, u64	Подписано: от -9,223,372,036,854,775,808 до 9,223,372,036,854,775,807, от - (2) до 2-1	19	Время (миллисекунды с эпохи Unix ), указатели в 64-битные вычисления	`int64_t`, `long`, `long long`	`long`	`Int64`	`long`	`bigint`	`integer (8)`	`long`
64		Без знака: от 0 до 18 446 744 073 709 551 615, что равно 2 - 1	20		`uint64_t`, `беззнаковое длинное длинное`	`ulong`	`UInt64`; `QWord`	н / д	`беззнаковый bigint`	н / д	`ulong`
128	октаворд, двойное четырехслово, i128, u128	Подпись: От - 170,141,183,460,469,231,731,687,303,715,884,105,728 до 170,141,183,460,469,231,731,687,303,715,884,105,727, от - (2) до 2-1	39	Сложные научные вычисления, IPv6 адреса, только стандартные идентификаторы GUID <-265>C: добавочный	н / д	н / п	н / д	н / д	`целое число (16)`	`цент`
128	октаворд, двойное четырехслово, i128, u128	Без знака: от 0 до 340,282,366,920,938,463,463,374,607,431,768,211,455, что равно 2-1	39		н / д	н / п	н / д	н / д	н / д	`ucent`
n	n-битное целое число. (общий случай)	со знаком: - (2) до (2-1)	⌈ (n - 1) log 10 2⌉		Ada : `диапазон -2 (n-1).. 2 (n-1) -1`
n	n-битное целое число. (общий случай)	Без знака: от 0 до (2-1)	⌈n log 10 2⌉		Ada: `диапазон 0..2 n-1`, `mod 2 n`; Классы BigDecimal или Decimal стандартных библиотек или сторонних произвольных арифметических библиотек на многих языках, таких как Python, C ++ и т. д.

Различные ЦП поддерживают разные интегральные типы данных. Обычно оборудование поддерживает как подписанные, так и беззнаковые типы, но только небольшой фиксированный набор значений ширины.

В приведенной выше таблице перечислены ширины интегрального типа, которые аппаратно поддерживаются общими процессорами. Языки программирования высокого уровня предоставляют больше возможностей. Обычно используется целочисленный тип с двойной шириной, который имеет вдвое больше битов, чем самый крупный тип, поддерживаемый оборудованием. Во многих языках также есть типы битовых полей (указанное количество битов, обычно ограничиваемое максимальной шириной, поддерживаемой оборудованием) и типы диапазонов (которые могут представлять только целые числа в указанном диапазоне).

Некоторые языки, например Lisp, Smalltalk, REXX, Haskell, Python, и Raku поддерживают целые числа произвольной точности (также известные как целые числа бесконечной точности или bignums ). Другие языки, которые не поддерживают эту концепцию в качестве конструкции верхнего уровня, могут иметь библиотеки для представления очень больших чисел с использованием массивов меньших переменных, таких как Java-класс BigIntegerили Perl. Пакет "bigint". Они используют столько памяти компьютера, сколько необходимо для хранения чисел; однако компьютер имеет ограниченный объем памяти, поэтому они также могут представлять только конечное подмножество математических целых чисел. Эти схемы поддерживают очень большие числа, например, один килобайт памяти можно использовать для хранения чисел длиной до 2466 десятичных цифр.

A Boolean или Тип флага - это тип, который может представлять только два значения: 0 и 1, обычно идентифицируемые как false и true соответственно. Этот тип может храниться в памяти с использованием одного бита, но часто ему дается полный байт для удобства адресации и скорости доступа.

Четырехбитная величина известна как полубайт (при приеме пищи меньше порции) или полубайт (каламбур на форме байта слова). Один полубайт соответствует одной цифре в шестнадцатеричном формате и содержит одну цифру или знаковый код в двоично-десятичной системе счисления.

Байты и октеты

Термин «байт» изначально означал «наименьшую адресуемую единицу памяти». Раньше использовались 5-, 6-, 7-, 8- и 9-битные байты. Также были компьютеры, которые могли адресовать отдельные биты («машина с битовой адресацией») или которые могли адресовать только 16- или 32-битные величины («машина с адресацией по словам»). Термин «байт» обычно вообще не использовался в отношении машин с битовой и словарной адресацией.

Термин октет всегда относится к 8-битовой величине. В основном он используется в области компьютерных сетей, где могут связываться компьютеры с разной шириной байта.

В современном использовании байт почти всегда означает восемь бит, поскольку все другие размеры вышли из употребления; таким образом, байт стал синонимом октета.

Слова

Термин «слово» используется для небольшой группы битов, которые одновременно обрабатываются процессорами конкретной архитектуры. Таким образом, размер слова зависит от процессора. Используются слова разных размеров, включая 6, 8, 12, 16, 18, 24, 32, 36, 39, 40, 48, 60 и 64 бит. Поскольку это архитектурно, размер слова обычно устанавливается первым процессором в семействе, а не характеристиками более позднего совместимого процессора. Значения терминов, производных от слова, таких как длинное слово, двойное слово, четверное слово и полуслово, также различаются в зависимости от ЦП и ОС.

Практически все новые настольные процессоры способны использовать 64-битные слова, хотя встроенные процессоры с размером слова 8 и 16 бит все еще распространены. 36-битная длина слова была распространена в первые дни компьютеров.

Одной из важных причин непереносимости программного обеспечения является неправильное предположение, что все компьютеры имеют тот же размер слова, что и компьютер, используемый программистом. Например, если программист, использующий язык C, неправильно объявляет как intпеременную, которая будет использоваться для хранения значений больше 2-1, программа завершится ошибкой на компьютерах с 16-битными целыми числами. Эта переменная должна быть объявлена как long, которая имеет не менее 32 бита на любом компьютере. Программисты также могут ошибочно предполагать, что указатель может быть преобразован в целое число без потери информации, что может работать на (некоторых) 32-разрядных компьютерах, но не работать на 64-разрядных компьютерах с 64-разрядными указателями и 32-разрядными целыми числами. Эта проблема решена с помощью C99 в stdint.h в форме intptr_t.

Короткое целое число

Короткое целое число может представлять целое число, которое может занимать меньше места, а имеющий меньший диапазон по сравнению со стандартным целым числом на той же машине.

В C он обозначается коротким. Он должен быть не менее 16 битов и часто меньше стандартного целого числа, но это не обязательно. Соответствующая программа может предполагать, что она может безопасно хранить значения от - (2-1) до 2-1, но не может предполагать, что диапазон не больше. В Java shortвсегда является 16-битным целым числом. В Windows API тип данных SHORTопределяется как 16-разрядное целое число со знаком на всех машинах.

Общие короткие целые размеры
Язык программирования	Тип данных имя	Подпись	Размер в байтах	Минимальное значение	Максимальное значение
C и C ++	`короткий`	подписанный	2	−32,767	+32,767
C и C ++	`беззнаковый короткий`	беззнаковый	2	0	65,535
C#	`короткий`	подписанный	2	−32,768	+32,767
C#	`ushort`	беззнаковый	2	0	65,535
Java	`короткий`	со знаком	2	−32,768	+32,767

Длинное целое

Длинное целое число может представлять целое целое, диапазон которого больше или равен диапазону стандартного целого числа на том же компьютере.

В C он обозначается длинным. Он должен быть не менее 32 бита и может быть или не быть больше стандартного целого числа. Соответствующая программа может предполагать, что она может безопасно хранить значения от - (2-1) до 2-1, но не может предполагать, что диапазон не больше.

<22,073 651 546 754 188>VB.NET

Обычные длинные целые числа
Язык программирования	Тип утверждения	Платформы	Имя типа данных	Хранение в байтах	Подписанный диапазон	Беззнаковый диапазон
C ISO / ANSI C99	Международный стандарт	Unix, 16/32-битные системы. Windows, 16/32/64 -битные системы	`long`	4. (минимальное требование 4)	от −2 147 483 647 до +2 147 483 647	от 0 до 4 294 967 295. (минимальное требование)
C ISO / ANSI C99	Международный стандарт	Unix,. 64-битные системы	`long`	8. (минимальное требование 4)	от -9,223,372,036,854,775,807 до +9,223,372,036,854,775,807	0 до 18 446 744 073 709 551 615
C ++ ISO / ANSI	Международный стандарт	Unix, Windows,. 16/32-разрядная система	`long`	4. (минимальное требование 4)	от –2 147 483 648 до +2 147 483 647.	от 0 до 4 294 967 295. (минимальное требование)
C ++ / CLI	Международный стандарт. ECMA-372	Unix, Windows,. 16 / 32-битные системы	`long`	4. (минимальное требование 4)	от −2 147 483 648 до +2 147 483 647.	от 0 до 4 294 967 295. (минимальное требование)
VB	Стандарт компании	Windows	`Long`	4	от –2 147 483 648 до +2 147 483 647	Н / Д
VBA	Стандарт компании	Windows, Mac OS X	`Длинный`	4	От −2 147 483 648 до +2 147 483 647	Н / Д
SQL Server	Стандарт компании	Windows	`BigInt`	8	от −9 223 372 036 854 775 808 до +9 223 372 036 854 775 807	Международный стандарт ECMA	Microsoft.NET	`long`или `Int64`	8	от −9,223,372,036,854,775,808 до +9,223,372,036,854,775,807	от 0 до 18,446,744,073,709,551,615
Java	Международный / Стандарт компании	Платформа Java	`long`	8	от −9,223,372,036,854,775,808 до +9,223,372,036,854,775,807	Н / Д
Pascal	?	Windows, UNIX	`int64`	8	от −9,223,372,036,854,775,808 до +9,223,372,036,854,775,807	0 до 18,446,744,073,709,551, 615 (тип Qword)

Long long

В версии C99 языка программирования C и версии C ++ 11 из C ++, поддерживается тип long long, который имеет вдвое большую минимальную емкость, чем стандартный long. Этот тип не поддерживается компиляторами, которым требуется, чтобы код C соответствовал предыдущему стандарту C ++, C ++ 03, поскольку тип long longне существовал в C ++ 03. Для компилятора, совместимого с ANSI / ISO, должны быть выполнены минимальные требования для указанных диапазонов, то есть от - (2-1) до 2-1 для подписанных и от 0 до 2-1 для беззнаковых; однако расширение этого диапазона разрешено. Это может быть проблемой при обмене кодом и данными между платформами или при прямом доступе к оборудованию. Таким образом, существует несколько наборов заголовков, обеспечивающих независимые от платформы типы точной ширины. Стандартная библиотека C предоставляет stdint.h ; это было введено в C99 и C ++ 11.

См. Также

Представление чисел со знаком
Десятичное число с двоичным кодом, представление целых чисел, обычно используемое в финансовых приложениях мэйнфреймов и в базах данных
Целочисленное переполнение
Типы данных C

Примечания

Ссылки