Примитивный тип данных

редактировать

В информатике примитивный тип данных может быть одним из следующих:

базовый тип - это тип данных, предоставляемый языком программирования в качестве базового строительного блока. Большинство языков позволяют рекурсивно конструировать более сложные составные типы, начиная с базовых типов.
встроенный тип - это тип данных, для которого язык программирования обеспечивает встроенную поддержку.

В большинстве языков программирования все основные типы данных встроены. Кроме того, многие языки также предоставляют набор составных типов данных.

В зависимости от языка и его реализации, примитивные типы данных могут иметь или не иметь однозначное соответствие с объектами в памяти компьютера. Однако обычно ожидается, что операции с базовыми примитивными типами данных будут самыми быстрыми языковыми конструкциями из существующих. Сложение целых чисел, например, может выполняться как одна машинная команда, а некоторые процессоры предлагают специальные инструкции для обработки последовательностей символов с помощью одной инструкции. В частности, в стандарте C упоминается, что «простой объект типа int имеет естественный размер, предполагаемый архитектурой среды выполнения». Это означает, что int, вероятно, будет иметь длину 32 бита в 32-битной архитектуре. Базовые примитивные типы почти всегда являются типами значений.

Большинство языков не позволяют программам изменять поведение или возможности примитивных (встроенных или базовых) типов данных. Исключения включают Smalltalk, который позволяет расширять все типы данных в программе, добавляя к операциям, которые могут выполняться с ними, или даже переопределяя встроенные операции.

Содержание

1 Обзор
2 Особые примитивные типы данных
- 2.1 Целые числа
- 2.2 Числа с плавающей запятой
- 2.3 Числа с фиксированной запятой
- 2.4 Логические
- 2.5 Символы и строки
- 2.6 Диапазоны числовых типов данных
3 См. Также
4 Ссылки
5 Внешние ссылки

Обзор

Фактический диапазон доступных примитивных типов данных зависит от конкретного языка программирования, который используется. Например, в C#, строки являются составным, но встроенным типом данных, тогда как в современных диалектах BASIC и в JavaScript они ассимилируются с примитивными данными. тип, который бывает как базовым, так и встроенным.

Классические базовые примитивные типы могут включать:

Character (character, char);
Integer (integer, int, short, long, byte) с множеством точности ;
Число с плавающей запятой ( float, double, real, double precision);
число с фиксированной точкой (fixed) с разнообразие точности и выбранный программистом масштаб.
логический, логические значения истина и ложь .
ссылка (также называемая указатель или дескриптор или дескриптор), значение, относящееся к другому объекту. Ссылка может быть адресом памяти или индексом для набора значений.

Вышеупомянутые примитивы обычно поддерживаются более или менее непосредственно компьютерным оборудованием, за исключением, возможно, операций с плавающей запятой, поэтому операции с такими примитивами обычно довольно эффективны. Некоторые языки программирования поддерживают текстовые строки как примитивы (например, BASIC), в то время как другие обрабатывают текстовую строку как ar луч символов (например, C). Некоторое компьютерное оборудование (например, x86) имеет инструкции, которые помогают работать с текстовыми строками, но полная аппаратная поддержка текстовых строк встречается редко.

Строки могут быть любой серией символов в используемой кодировке . Чтобы отделить строки от кода, большинство языков заключают их в одинарные или двойные кавычки. Например, «Привет, мир» или «Привет, мир». Обратите внимание, что «200» можно ошибочно принять за целочисленный тип, но на самом деле это строковый тип, поскольку он заключен в двойные кавычки.

Более сложные типы, которые могут быть встроены, включают:

Tuple в Standard ML, Python, Scala, Swift, Elixir
List в Common Lisp, Python, Scheme, Haskell
Комплексное число в C99, Fortran, Common Lisp, Python, D, Go
Рациональное число в Common Lisp, Haskell
Ассоциативный массив в Perl, Python, Ruby, JavaScript, Lua, D, Go
Функция первого класса, на всех функциональных языках, JavaScript, Lua, D, Go и в новых стандартах C ++, Java, C#, Perl

Конкретные примитивные типы данных

Целые числа

Тип данных integer представляет некоторый диапазон математических целых чисел. Целые числа могут быть знаковыми (допускаются отрицательные значения) или беззнаковыми (только неотрицательные целые числа ). Общие диапазоны:

Размер (байтов )	Размер (битов )	Имена	Диапазон со знаком (при условии дополнение до двух для подписанный )	Беззнаковый диапазон
1 байт	8 бит	Байт, октет, минимальный размер `char`в C99 (см. limits.h CHAR_BIT)	от −128 до +127	от 0 до 255
2 байта	16 бит	x86 word, минимальный размер `short`и `int`в C	от −32,768 до +32,767	0 до 65 535
4 байта	32 бита	двойное слово x86, минимальный размер `long`в C, фактический размер `int`для большинства современные компиляторы C, указатель для IA-32 -совместимых процессоров	от -2 147 483 648 до +2 147 483 647	от 0 до 4 294 967 295
8 байт	64 бита	четырехкратное слово x86, минимальный размер `long long`в C, фактический размер `long`для большинства современных компиляторов C, указатель для x86-64 -совместимых процессоров	от −9,223,372,036,854,775,808 до +9, 223,372,036,854,775,807	от 0 до 18,446,744,073,709,551,615
без ограничений / 8	без ограничений	Bignum	от –2/2 до + (2/2 - 1)	0 to 2 - 1

Литералы для целых чисел могут быть записаны как обычные арабские цифры, состоящие из последовательности цифр и с отрицанием, обозначенным знаком минус перед значением. Однако большинство языков программирования не допускают использование запятых или пробелов для группировки цифр. Примеры целочисленных литералов:

42
10000
-233000

Существует несколько альтернативных методов записи целочисленных литералов во многих языках программирования:

Большинство языков программирования, особенно те, на которые влияет C, добавьте к целочисленному литералу префикс 0Xили 0xдля представления шестнадцатеричного значения , например 0xDEADBEEF. На других языках могут использоваться другие обозначения, например некоторые языки ассемблера добавляют Hили hв конец шестнадцатеричного значения.
Perl, Ruby, Java, Julia, D, Rust и Python (начиная с версии 3.6) допускают встроенные символы подчеркивания для ясности, например 10_000_000, а фиксированная форма Fortran игнорирует встроенные пробелы в целочисленных литералах.
В C и C ++ ведущий ноль указывает на восьмеричное значение, например 0755. Это в первую очередь предназначалось для использования с режимами Unix ; однако его критиковали, потому что нормальные целые числа могут также начинать с нуля. Таким образом, Python, Ruby, Haskell и OCaml префикс восьмеричных значений с 0Oили 0o, в соответствии с макетом, используемым шестнадцатеричными значениями.
Несколько языков, включая Java, C#, Scala, Python, Ruby, и OCaml, могут представлять двоичные значения, добавляя к числу префикс 0Bили 0b.

числа с плавающей запятой

A число с плавающей запятой представляет собой число с ограниченной точностью рациональное число, которое может иметь дробную часть. Эти числа хранятся внутри в формате, эквивалентном экспоненциальному представлению, обычно в двоичном, но иногда в десятичном. Поскольку числа с плавающей запятой имеют ограниченную точность, только подмножество действительных или рациональных чисел могут быть точно представлены; остальные числа можно представить только приблизительно.

Многие языки имеют как тип одинарной точности (часто называемый «float»), так и тип двойной точности.

Литералы для чисел с плавающей запятой включают десятичную точку и обычно используют eили Eдля обозначения экспоненциальной записи. Примеры литералов с плавающей запятой:

20.0005
99.9
-5000.12
6.02e23

Некоторые языки (например, Fortran, Python, D ) также имеют тип комплексного числа, состоящий из двух чисел с плавающей запятой: действительной части и мнимой части.

Числа с фиксированной запятой

A Число с фиксированной запятой представляет собой рациональное число ограниченной точности, которое может иметь дробную часть. Эти числа хранятся внутри в виде масштабированного целого числа, обычно в двоичном, но иногда в десятичном. Поскольку числа с фиксированной запятой имеют ограниченную точность, только подмножество действительных или рациональных чисел могут быть точно представлены; остальные числа можно представить только приблизительно. Числа с фиксированной запятой также имеют более ограниченный диапазон значений, чем с плавающей запятой, и поэтому программист должен быть осторожен, чтобы избежать переполнения в промежуточных вычислениях, а также в конечном результате.

Booleans

A boolean тип, обычно обозначаемый «bool» или «boolean», обычно представляет собой логический тип, который может иметь либо значение «true», либо значение «false». Хотя для размещения набора значений «истина» и «ложь» необходим только один бит, языки программирования обычно реализуют логические типы как один или несколько байтов.

Многие языки (например, Java, Pascal и Ada ) реализуют логические значения, придерживаясь концепции логического значения как отдельного логического типа. Однако языки могут неявно преобразовывать логические значения в числовые типы время от времени, чтобы дать расширенную семантику логическим значениям и логическим выражениям или для достижения обратной совместимости с более ранними версиями языка. Например, ранние версии языка программирования C, которые следовали за ANSI C и его прежними стандартами, не имели специального логического типа. Вместо этого числовые значения нуля интерпретируются как «ложь», а любое другое значение интерпретируется как «истина». В более новом C99 добавлен отдельный логический тип, который может быть включен в stdbool.h, а C ++ поддерживает boolкак встроенный type и «true» и «false» как зарезервированные слова.

Символы и строки

A character Тип (обычно называемый «char») может содержать одну букву, цифра, знак препинания, символ, код форматирования, управляющий код или какой-либо другой специализированный код (например, порядок байтов знак ). В C, charопределяется как наименьшая адресуемая единица памяти. В большинстве систем это 8 бит ; Некоторые стандарты, такие как POSIX, требуют, чтобы он был такого размера. Некоторые языки имеют два или более типа символов, например однобайтовый тип для символов ASCII и многобайтовый тип для символов Unicode. Термин «символьный тип» обычно используется даже для типов, значения которых более точно представляют кодовые единицы, например, кодовые единицы UTF-16, как в Java ( поддержка ограничена только 16-битными символами) и JavaScript.

Символы могут быть объединены в строки. Строковые данные могут включать числа и другие числовые символы, но обрабатываются как текст. Например, математические операции, которые могут выполняться с числовым значением (например, 200), обычно не могут быть выполнены с тем же значением, записанным в виде строки (например, «200»).

Строки реализуются по-разному, в зависимости от языка программирования. Самый простой способ реализовать строки - создать их как массив символов, за которым следует символ-разделитель, используемый для обозначения конца строки, обычно NUL. Они называются строками с завершающим нулем и обычно встречаются в языках с небольшим количеством аппаратной абстракции, таких как C и Assembly.. Несмотря на простоту реализации, строки с завершающим нулем подвергались критике за то, что вызывали переполнение буфера. Большинство языков сценариев высокого уровня, таких как Python, Ruby и многие диалекты BASIC, не имеют отдельного типа символов; строки длиной один обычно используются для представления отдельных символов. Некоторые языки, такие как C ++ и Java, имеют возможность использовать строки с завершающим нулем (обычно для мер обратной совместимости), но дополнительно предоставляют свой собственный класс для обработки строк (std :: string и java.lang.Stringсоответственно) в стандартной библиотеке.

Существует также разница в том, являются ли строки изменяемыми или неизменяемыми в языке. Изменяемые строки могут быть изменены после их создания, в то время как неизменяемые строки сохраняют постоянный размер и содержимое. В последнем случае единственный способ изменить строки - создать новые. У каждого подхода есть как преимущества, так и недостатки: хотя неизменяемые строки намного менее гибки, они проще и полностью потокобезопасны. Некоторые примеры языков, использующих изменяемые строки, включают C ++, Perl и Ruby, тогда как языки, которые не включают JavaScript, Lua, Python и Go. Некоторые языки, такие как Objective-C, предоставляют разные типы для изменяемых и неизменяемых строк.

Литералы для символов и строк обычно заключаются в кавычки : иногда одинарные кавычки (') используются для символов и двойных кавычек (") используются для строк. Python принимает любой вариант в качестве строковой нотации.

Примеры символьных литералов в синтаксисе C:

'A'
'4'
'$'
'\ t'(символ табуляции )

Примеры строковых литералов в синтаксисе C:

«A»
«Hello World»
«Есть 4 кота. "

Диапазоны числовых типов данных

Каждый числовой тип данных имеет максимальное и минимальное значение, известное как диапазон. Попытка сохранить число вне диапазона может привести к ошибкам компилятора / времени выполнения. или из-за неверных вычислений (из-за усечения ) в зависимости от используемого языка.

Диапазон переменной основан на количестве байтов, используемых для сохранения значения, и целое число тип данных обычно может хранить 2 значения (где n - количество бит, которые вносят вклад к значению). Для других типов данных (например, значения с плавающей запятой ) диапазон более сложный и будет варьироваться в зависимости от метода, используемого для его хранения. Есть также некоторые типы, которые не используют целые байты, например логическое, которое требует одного бита и представляет собой двоичное значение (хотя на практике часто используется байт, а оставшиеся 7 бит являются избыточными). Некоторые языки программирования (такие как Ada и Pascal ) также допускают противоположное направление, то есть программист определяет диапазон и точность, необходимые для решения данной проблемы, а компилятор выбирает наиболее соответствующий целочисленный тип или тип с плавающей запятой автоматически.

См. Также

Ссылки

Внешние ссылки

СМИ, относящиеся к примитивным типам на Wikimedia Commons