Язык программирования

редактировать

Язык для передачи инструкций на machine

Исходный код для простой компьютерной программы, написанной на языке программирования C. Когда скомпилирован и запускает, он выдаст вывод «Hello, world! ".

A язык программирования - это формальный язык, содержащий набор инструкций, которые производят различные виды вывода. Языки программирования используются в компьютерном программировании для реализации алгоритмов.

Большинство языков программирования состоят из инструкции для компьютеров. Существуют программируемые машины, которые используют набор специальных инструкций, а не общих языков программирования. Ранние из них предшествовали изобретение цифрового компьютера, первым из которых, вероятно, был автоматический флейтист, описанный в 9 веке братьями Мусой в Багдаде, во время Золотой Возраст. С начала 1800-х годов для управления поведением таких машин использовались программы, как ткацкие станки, музыкальные шкатулки и пианино. программы для этих машин (например, пианино crolls) не вызывали различного поведения в ответ на разные входные данные или условия.

Были созданы тысячи различных языков программирования, и с каждым годом создается все больше. Многие языки программирования написаны в императивной форме (т. Е. В виде последовательности выполняемых операций), в то время как другие языки используют декларативную форму (т. Е. Указывается желаемый результат, а не то, как Добейся этого).

Описание языка программирования обычно делится на два компонента: синтаксис (форма) и семантика (значение). Некоторые языки определены в документе спецификации (например, язык программирования C указан в стандарте ISO ), в то время как другие языки (такие как Perl ) имеют доминирующая реализация , которая рассматривается как ссылка. В некоторых языках есть и то, и другое, при этом основной язык определяется стандартом, а расширения, взятые из доминирующей реализации, являются общими.

Содержание

1 Определения
2 История
- 2.1 Ранние разработки
- 2.2 Уточнение
- 2.3 Консолидация и рост
3 элемента
- 3.1 Синтаксис
- 3.2 Семантика
  - 3.2.1 Статическая семантика
  - 3.2.2 Динамическая семантика
- 3.3 Система типов
  - 3.3.1 Типизированные и нетипизированные языки
  - 3.3.2 Статическая и динамическая типизация
  - 3.3.3 Слабая и строгая типизация
- 3.4 Стандартная библиотека и система времени выполнения
4 Дизайн и реализация
- 4.1 Спецификация
- 4.2 Реализация
5 Собственные языки
6 Использование
- 6.1 Измерение использования языка
7 Диалекты, разновидности и реализации
8 Таксономии
9 См. также
10 Ссылки
11 Дополнительная литература
12 Внешние ссылки

Определения

Язык программирования - это обозначение для записи программы, которые являются спецификациями вычисления или алгоритма. Некоторые авторы ограничивают термин «язык программирования» теми языками, которые могут выражать все возможные алгоритмы. Характеристики, которые часто считаются важными для того, что составляет язык программирования, включают:

Функция и цель: Язык компьютерного программирования - это язык, используемый для написания компьютерных программ, которые включает компьютер, выполняющий какие-то вычисления или алгоритм и, возможно, управляющие внешними устройствами, такими как принтеры, дисковые накопители, роботы и так далее. Например, программы PostScript часто создаются другой программой для управления компьютерным принтером или дисплеем. В более общем плане язык программирования может описывать вычисления на некоторой, возможно, абстрактной машине. Принято считать, что полная спецификация языка программирования включает описание, возможно, идеализированное, машины или процессора для этого языка. В большинстве практических контекстов язык программирования включает компьютер; следовательно, языки программирования обычно определяются и изучаются таким образом. Языки программирования отличаются от естественных языков тем, что естественные языки используются только для взаимодействия между людьми, в то время как языки программирования также позволяют людям передавать инструкции машинам.
Абстракции: Программирование языки обычно содержат абстракции для определения и управления структурами данных или управления потоком выполнения. Практическая необходимость того, чтобы язык программирования поддерживал адекватные абстракции, выражается принципом абстракции . Этот принцип иногда формулируется как рекомендация программисту правильно использовать такие абстракции.
Выразительная сила: теория вычислений классифицирует языки по вычислениям, которыми они являются способен выразить. Все полные языки по Тьюрингу могут реализовывать один и тот же набор алгоритмов. ANSI / ISO SQL-92 и являются примерами языков, которые не являются полными по Тьюрингу, но часто называются языками программирования.

Языки разметки, такие как XML, HTML или troff, которые определяют структурированные данные, обычно не считаются языками программирования. Однако языки программирования могут разделять синтаксис с языками разметки, если определена вычислительная семантика. XSLT, например, является полным по Тьюрингу языком, полностью использующим синтаксис XML. Более того, LaTeX, который в основном используется для структурирования документов, также содержит полное подмножество Тьюринга.

Термин компьютерный язык иногда используется как синоним языка программирования. Однако использование обоих терминов варьируется среди авторов, включая точную область применения каждого из них. Одно использование описывает языки программирования как подмножество компьютерных языков. Точно так же языки, используемые в вычислениях, которые имеют иную цель, чем выражение компьютерных программ, обычно называются компьютерными языками. Например, языки разметки иногда называют компьютерными языками, чтобы подчеркнуть, что они не предназначены для использования в программировании.

Другое использование рассматривает языки программирования как теоретические конструкции для программирования абстрактных машин, а компьютерные языки как подмножество которые работают на физических компьютерах, имеющих ограниченные аппаратные ресурсы. Джон С. Рейнольдс подчеркивает, что языки формальной спецификации являются такими же языками программирования, как и языки, предназначенные для исполнения. Он также утверждает, что текстовые и даже графические форматы ввода, которые влияют на поведение компьютера, являются языками программирования, несмотря на то, что они обычно не являются полными по Тьюрингу, и отмечает, что незнание концепций языка программирования является причиной многих недостатков в форматах ввода.

История

Ранние разработки

Очень ранние компьютеры, такие как Colossus, программировались без помощи сохраненной программы путем изменения их схем или установки банков физических средств управления.

Чуть позже программы могли быть написаны на машинном языке, где программист записывает каждую инструкцию в числовой форме, которую оборудование может выполнять напрямую. Например, инструкция по сложению значения в двух ячейках памяти может состоять из трех чисел: «код операции», который выбирает операцию «сложение», и две ячейки памяти. Программы в десятичной или двоичной форме считывались с перфокарт, бумажной ленты, магнитной ленты или включались переключателями на передней панели устройства. компьютер. Машинные языки позже были названы языками программирования первого поколения (1GL).

Следующим шагом была разработка так называемых языков программирования второго поколения (2GL) или языков ассемблера, которые все еще были тесно связаны с инструкцией . установить архитектуру конкретного компьютера. Это сделало программу более удобочитаемой и избавило программиста от утомительных и подверженных ошибкам вычислений адресов.

Первые языки программирования высокого уровня или языки программирования третьего поколения (3GL) были написаны в 1950-х годах. Первым языком программирования высокого уровня, который должен был быть разработан для компьютеров, был Plankalkül, разработанный для немецкого Z3 Конрадом Цузе в период с 1943 по 1945 год. не был реализован до 1998 и 2000 гг.

Сокращенный код Джона Мочли, предложенный в 1949 году, был одним из первых языков высокого уровня, когда-либо разработанных для электронных компьютеров. В отличие от машинного кода , операторы Short Code представляют математические выражения в понятной форме. Однако программу приходилось транслировать в машинный код каждый раз при запуске, что делало процесс намного медленнее, чем выполнение эквивалентного машинного кода.

В Манчестерском университете Алик Гленни разработал Автокод в начале 1950-х годов. В качестве языка программирования он использовал компилятор для автоматического преобразования языка в машинный код. Первый код и компилятор были разработаны в 1952 году для компьютера Mark 1 в Манчестерском университете и считаются первым скомпилированным языком программирования высокого уровня.

Второй автокод был разработан для Mark 1 R. А. Брукером в 1954 году и назывался «Автокод Марк 1». Брукер также разработал автокод для Ferranti Mercury в 1950-х годах совместно с Манчестерским университетом. Версия для EDSAC 2 была разработана Д. Ф. Хартли из математической лаборатории Кембриджского университета в 1961 году. Известный как EDSAC 2 Autocode, он был непосредственной разработкой Mercury Autocode, адаптированной к местным условиям, и был известен своей оптимизацией объектного кода и исходным кодом. языковая диагностика, продвинутая в то время. Atlas Autocode, современный, но отдельный поток разработки, был разработан для машины Atlas 1 Манчестерского университета .

В 1954 году FORTRAN был изобретен в IBM Джоном Бэкусом. Это был первый широко используемый язык программирования общего назначения высокого уровня, который имел функциональную реализацию, а не просто дизайн на бумаге. Он по-прежнему остается популярным языком для высокопроизводительных вычислений и используется для программ, которые оценивают и оценивают самые быстрые суперкомпьютеры в мире.

Другой ранний язык программирования был разработан Грейс Хоппер в США называется FLOW-MATIC. Он был разработан для UNIVAC I в Remington Rand в период с 1955 по 1959 год. Хоппер обнаружил, что клиентам, занимающимся обработкой бизнес-данных, не нравятся математические обозначения, и в начале 1955 года она и ее команда написала спецификацию для английского языка программирования и реализовала прототип. Компилятор FLOW-MATIC стал общедоступным в начале 1958 года и был практически завершен в 1959 году. FLOW-MATIC оказал большое влияние на разработку COBOL, поскольку только он и его прямой потомок AIMACO фактически использовались в то время.

Уточнение

Более широкое использование языков высокого уровня ввело требование для языков программирования низкого уровня или системы языки программирования. Эти языки в той или иной степени предоставляют возможности между языками ассемблера и языками высокого уровня. Их можно использовать для выполнения задач, которые требуют прямого доступа к аппаратным средствам, но при этом обеспечивают структуры управления более высокого уровня и проверку ошибок.

Период с 1960-х до конца 1970-х годов привел к развитию основных языковых парадигм, используемых сейчас:

APL представил программирование массивов и повлиял на функциональное программирование.
АЛГОЛ усовершенствовал как структурированное процедурное программирование, так и дисциплину спецификации языка ; «Пересмотренный отчет по алгоритмическому языку АЛГОЛ 60 » стал образцом того, как были написаны более поздние спецификации языка.
Лисп, реализованный в 1958 году, был первым функциональным программированием с динамической типизацией language.
В 1960-х годах Simula был первым языком, разработанным для поддержки объектно-ориентированного программирования ; в середине 1970-х за Smalltalk последовал первый «чисто» объектно-ориентированный язык.
C был разработан между 1969 и 1973 годами как язык системного программирования для операционной системы Unix и остается популярным.
Prolog, разработанный в 1972 году, был первым языком логического программирования.
В 1978 году ML построил систему полиморфных типов помимо Lisp, новаторские статически типизированные языки функционального программирования.

Каждый из этих языков породил потомков, и большинство современных языков программирования насчитывают по крайней мере один из их по происхождению.

В 1960-е и 1970-е годы также велись серьезные споры о достоинствах структурного программирования и о том, должны ли языки программирования разрабатываться для его поддержки. Эдсгер Дейкстра в знаменитом В письме 1968 года, опубликованном в Коммуникациях ACM, утверждалось, что операторы Goto должны быть исключены из всех языков программирования «более высокого уровня».

Консолидация и рост

Подборка учебников по программированию на популярных и малоизвестных языках. Это лишь некоторые из тысяч языков программирования и диалектов, которые были созданы в истории.

80-е годы были годами относительной консолидации. C ++ объединил объектно-ориентированное и системное программирование. Правительство США стандартизировало Ada, язык системного программирования, полученный на основе Pascal и предназначенный для использования оборонными подрядчиками. В Японии и других странах были потрачены огромные суммы на исследование так называемых языков «пятого поколения», которые включали конструкции логического программирования. Сообщество функциональных языков перешло к стандартизации ML и Lisp. Вместо того, чтобы изобретать новые парадигмы, все эти движения развивали идеи, изобретенные в предыдущие десятилетия.

Одной из важных тенденций в разработке языков для программирования крупномасштабных систем в 1980-х годах было повышенное внимание к использованию модулей или крупномасштабных организационных единиц кода. Modula-2, Ada и ML разработали в 1980-х годах известные модульные системы, которые часто объединялись с конструкциями общего программирования.

Быстрый рост Интернет в середине 1990-х годов создал возможности для новых языков. Perl, первоначально инструмент сценариев Unix, впервые выпущенный в 1987 году, стал обычным явлением на динамических веб-сайтах. Java стал использоваться для программирования на стороне сервера, и виртуальные машины с байт-кодом снова стали популярными в коммерческих условиях с их обещанием «писать один раз, запускать где угодно » (UCSD Pascal было популярно какое-то время в начале 1980-х). Эти разработки не были принципиально новыми; скорее, они были уточнением многих существующих языков и парадигм (хотя их синтаксис часто был основан на семействе языков программирования C).

Развитие языков программирования продолжается как в промышленности, так и в исследованиях. Текущие направления включают проверку безопасности и надежности, новые виды модульности (примеси, делегаты, аспекты ) и интеграцию с базами данных, такую как LINQ <423 от Microsoft.>Языки программирования четвертого поколения (4GL) - это компьютерные языки программирования, которые стремятся обеспечить более высокий уровень абстракции деталей внутреннего компьютерного оборудования, чем 3GL. Языки программирования пятого поколения (5GL) - это языки программирования, основанные на решении проблем с использованием ограничений, заданных программе, а не на использовании алгоритма , написанного программистом.

Элементы

Все языки программирования имеют некоторые примитивные строительные блоки для описания данных и процессов или преобразований, применяемых к ним (например, сложение двух чисел или выбор предмета из коллекции). Эти примитивы определяются синтаксическими и семантическими правилами, которые описывают их структуру и значение соответственно.

Синтаксис

Дерево синтаксического анализа из кода Python со вставкой токенизации

Подсветка синтаксиса часто используется для помощи программистам в распознавании элементов исходного кода. Вышеупомянутый язык - Python.

Поверхностная форма языка программирования известна как его синтаксис . Большинство языков программирования являются чисто текстовыми; они используют последовательности текста, включая слова, числа и знаки препинания, во многом как письменные естественные языки. С другой стороны, есть некоторые языки программирования, которые по своей природе являются более графическими, использующими визуальные отношения между символами для определения программы.

Синтаксис языка описывает возможные комбинации символов, которые образуют синтаксически правильную программу. Значение, данное комбинации символов, обрабатывается семантикой (либо формальным, либо жестко запрограммированным в эталонной реализации ). Поскольку большинство языков являются текстовыми, в этой статье обсуждается текстовый синтаксис.

Синтаксис языка программирования обычно определяется с использованием комбинации регулярных выражений (для лексической структуры) и формы Бэкуса – Наура (для грамматическая структура). Ниже приводится простая грамматика, основанная на выражении Lisp :

:: = atom | list atom :: = number | номер символа :: = [+ -]? ['0' - '9'] + символ :: = ['A' - 'Z''a' - 'z']. * list :: = '(' выражение * ')'

Эта грамматика определяет следующее:

выражение - это либо атом, либо список;
атом - это либо число, либо символ;
число представляет собой непрерывную последовательность из одной или нескольких десятичных цифр, которым может предшествовать знак плюс или минус;
символ - это буква, за которой следует ноль или более любых символов (за исключением пробелов); и
список - это совпадающая пара круглых скобок, в которой содержится ноль или более выражений.

Ниже приведены примеры правильно сформированных последовательностей токенов в этой грамматике: 12345, ()и (ab c232 (1)).

Не все синтаксически правильные программы семантически правильны. Многие синтаксически правильные программы, тем не менее, плохо сформированы в соответствии с правилами языка; и может (в зависимости от языковой спецификации и надежности реализации) привести к ошибке при переводе или выполнении. В некоторых случаях такие программы могут демонстрировать неопределенное поведение. Даже если программа четко определена в языке, она может иметь значение, не предназначенное для ее написания.

Используя естественный язык в качестве примера, может оказаться невозможным присвоить значение грамматически правильному предложению или предложение может быть ложным:

"Бесцветные зеленые идеи яростно спят. "грамматически правильно сформирован, но не имеет общепринятого значения.
" Джон - холостяк, состоящий в браке. "грамматически правильно сформирован, но выражает значение, которое не может быть истинным.

Следующий фрагмент языка C синтаксически корректен, но выполняет операции, которые не определены семантически (операция * p>>4не имеет значения для значения, имеющего сложный тип и p->imне определен, поскольку значение pявляется нулевым указателем ):

комплексный * p = NULL; комплексный abs_p = sqrt ( * p>>4 + p->im);

Если бы объявление типа в первой строке было опущено, программа выдала бы ошибку в неопределенной переменной «p» во время компиляции. Однако программа все равно будет синтаксически правильной, поскольку объявление типа s предоставляют только семантическую информацию.

Грамматика, необходимая для определения языка программирования, может быть классифицирована по ее положению в иерархии Хомского. Синтаксис большинства языков программирования можно указать с помощью грамматики типа 2, то есть это контекстно-свободные грамматики. Некоторые языки, включая Perl и Lisp, содержат конструкции, которые позволяют выполнение во время фазы синтаксического анализа. Языки, в которых есть конструкции, позволяющие программисту изменять поведение синтаксического анализатора, делают синтаксический анализ неразрешимой проблемой и, как правило, стирают различие между синтаксическим анализом и выполнением. В отличие от макросистемы Lisp и блоков Perl BEGIN, которые могут содержать общие вычисления, макросы C представляют собой просто замену строк и не требуют выполнения кода.

Семантика

Термин семантика относится к значению языков, а не к их форме (синтаксис).

Статическая семантика

Статическая семантика определяет ограничения на структуру действительных текстов, которые трудно или невозможно выразить в стандартных синтаксических формализмах. Для скомпилированных языков статическая семантика по существу включает те семантические правила, которые можно проверить во время компиляции. Примеры включают проверку того, что каждый идентификатор объявлен до его использования (в языках, требующих таких объявлений) или что метки на ответвлениях оператора case различны. Многие важные ограничения этого типа, такие как проверка того, что идентификаторы используются в соответствующем контексте (например, не добавление целого числа к имени функции), или того, что вызовы подпрограммы имеют соответствующее количество и тип аргументов, могут быть осуществляется путем определения их как правил в логике , называемой системой типов . Другие формы статического анализа, такие как анализ потока данных, также могут быть частью статической семантики. Новые языки программирования, такие как Java и C #, имеют анализ определенных назначений, форму анализа потока данных, как часть их статической семантики.

Динамическая семантика

После того, как данные были указаны, компьютер должен быть проинструктирован о выполнении операций с данными. Например, семантика может определять стратегию, с помощью которой выражения оцениваются в значения, или способ, которым управляющие структуры условно выполняют операторы. Динамическая семантика (также известная как семантика выполнения) языка определяет, как и когда различные конструкции языка должны вызывать поведение программы. Есть много способов определить семантику выполнения. Естественный язык часто используется для определения семантики выполнения языков, обычно используемых на практике. Значительный объем академических исследований был посвящен формальной семантике языков программирования, которые позволяют формально определять семантику выполнения. Результаты этой области исследований нашли ограниченное применение в разработке и реализации языков программирования за пределами академических кругов.

Система типов

Система типов определяет, как язык программирования классифицирует значения и выражения по типам, как он может управлять этими типами и как они взаимодействуют. Целью системы типов является проверка и обычно обеспечение определенного уровня корректности в программах, написанных на этом языке, путем обнаружения определенных некорректных операций. Любая разрешимая система типов связана с компромиссом: отвергая множество неправильных программ, она может также запрещать некоторые правильные, хотя и необычные программы. Чтобы обойти этот недостаток, в ряде языков есть лазейки для типов, обычно не отмеченные преобразованием, которые могут использоваться программистом для явного разрешения обычно запрещенных операций между разными типами. В большинстве типизированных языков система типов используется только для проверки типов программ, но ряд языков, обычно функциональных, выводят типы, избавляя программиста от необходимости писать тип аннотации. Формальное проектирование и изучение систем типов известно как теория типов.

Типизированные и нетипизированные языки

Язык является типизированным, если спецификация каждой операции определяет типы данных, к которым эта операция применима. Например, данные, представленные как «этот текст в кавычках»- это строка, и во многих языках программирования деление числа на строку не имеет значения и не будет выполняться. Недопустимая операция может быть обнаружена при компиляции программы («статическая» проверка типа) и будет отклонена компилятором с сообщением об ошибке компиляции, или она может быть обнаружена во время работы программы («динамическая» проверка типа), в результате во время выполнения исключение. Многие языки позволяют функции, называемой обработчиком исключений, обрабатывать это исключение и, например, всегда возвращать в качестве результата «-1».

Особым случаем типизированных языков являются однотипные языки. Часто это языки сценариев или разметки, такие как REXX или SGML, которые имеют только один тип данных - чаще всего символьные строки, которые используются как для символьных, так и для числовых данных.

Напротив, нетипизированный язык, такой как большинство языков ассемблера, позволяет выполнять любую операцию с любыми данными, как правило, с последовательностями битов различной длины. Нетипизированные языки высокого уровня включают BCPL, Tcl и некоторые разновидности Forth.

на практике, хотя некоторые языки считаются типизированными в соответствии с теорией типов (проверка или отклонение всех операций) большинство современных языков предлагают определенную степень набора текста. Многие рабочие языки предоставляют средства для обхода или подрыва системы типов, жертвуя безопасностью типов для более тонкого контроля над выполнением программы (см. приведение типов ).

Статическая и динамическая типизация

В статической типизации все выражения имеют свои типы, определенные до выполнения программы, обычно во время компиляции. Например, 1 и (2 + 2) - целочисленные выражения; они не могут быть переданы функции, которая ожидает строку, или сохранены в переменной, которая определена для хранения дат.

Языки со статической типизацией могут иметь явно типизированный или тип - предполагаемый. В первом случае программист должен явно писать типы в определенных текстовых позициях (например, в объявлениях переменных ). Во втором случае компилятор определяет типы выражений и объявлений на основе контекста. Большинство основных языков со статической типизацией, таких как C ++, C# и Java, явно типизированы. Полный вывод типов традиционно ассоциировался с менее распространенными языками, такими как Haskell и ML. Однако многие явно типизированные языки поддерживают частичный вывод типов; например, C ++, Java и C # все выявляют типы в определенных ограниченных случаях. Кроме того, некоторые языки программирования позволяют автоматически преобразовывать одни типы в другие; например, int можно использовать там, где программа ожидает float.

Динамическая типизация, также называемая скрытой типизацией, определяет типобезопасность операций во время выполнения; другими словами, типы связаны со значениями времени выполнения, а не с текстовыми выражениями. Как и языки с предполагаемым типом, языки с динамической типизацией не требуют от программиста написания явных аннотаций типов к выражениям. Среди прочего, это может позволить одной переменной ссылаться на значения разных типов в разных точках выполнения программы. Однако ошибки типа не могут быть автоматически обнаружены, пока не будет выполнен фрагмент кода, что потенциально затрудняет отладку . Lisp, Smalltalk, Perl, Python, JavaScript и Ruby - все примеры динамически типизированных языков.

Слабая и строгая типизация

Слабая типизация позволяет обрабатывать значение одного типа как другое, например обрабатывать строку как число. Иногда это может быть полезно, но также может позволить некоторым видам программных ошибок оставаться незамеченными во время компиляции и даже во время времени выполнения.

Строгая типизация предотвращает эти программные ошибки. Попытка выполнить операцию с неверным типом значения вызывает ошибку. Строго типизированные языки часто называют типобезопасными или безопасными.

. Альтернативное определение для «слабо типизированных» относится к языкам, таким как Perl и JavaScript, которые позволяют большое количество неявных преобразований типов. В JavaScript, например, выражение 2 * xнеявно преобразует xв число, и это преобразование будет успешным, даже если xравно null, undefined, Массивили строка букв. Такие неявные преобразования часто полезны, но они могут маскировать ошибки программирования. Сильный и статичный в настоящее время обычно считаются ортогональными понятиями, но их использование в литературе отличается. Некоторые используют термин строго типизированный для обозначения строго, статически типизированного или, что еще более сбивает с толку, для обозначения просто статически типизированного. Таким образом, C был назван как строго типизированным, так и слабо статически типизированным.

Некоторым профессиональным программистам может показаться странным, что C может быть «слабо, статически типизированным». Однако обратите внимание, что использование универсального указателя, указателя void *, действительно позволяет преобразовывать указатели в другие указатели без необходимости выполнять явное преобразование. Это очень похоже на приведение массива байтов к любому типу данных в C без использования явного приведения, такого как (int)или (char).

Стандартная библиотека и run- система времени

Большинство языков программирования имеют связанную базовую библиотеку (иногда называемую «стандартной библиотекой», особенно если она включена как часть опубликованного стандарта языка), которая обычно создается доступен для всех реализаций языка. Базовые библиотеки обычно включают определения для часто используемых алгоритмов, структур данных и механизмов ввода и вывода.

Граница между языком и его основной библиотекой отличается от языка к языку. В некоторых случаях разработчики языка могут рассматривать библиотеку как отдельный объект от языка. Однако основная библиотека языка часто рассматривается пользователями как часть языка, а некоторые спецификации языка даже требуют, чтобы эта библиотека была доступна во всех реализациях. В самом деле, некоторые языки спроектированы так, что значения некоторых синтаксических конструкций невозможно даже описать без обращения к основной библиотеке. Например, в Java строковый литерал определяется как экземпляр класса java.lang.String; аналогично, в Smalltalk выражение анонимной функции («блок») конструирует экземпляр библиотечного класса BlockContext. И наоборот, Схема содержит несколько согласованных подмножеств, которых достаточно для построения остальной части языка в виде библиотечных макросов, и поэтому разработчики языка даже не удосуживаются сказать, какие части языка должны быть реализованы как языковые конструкции, и которые должны быть реализованы как части библиотеки.

Проектирование и реализация

Языки программирования имеют общие свойства с естественными языками, связанные с их назначением в качестве средств коммуникации, имеют синтаксическую форму, отдельную от своей семантики, и демонстрируют языковые семейства связанных языков, ответвление одного из еще один. Но как искусственные конструкции они также фундаментально отличаются от языков, которые развились в результате использования. Существенное отличие состоит в том, что язык программирования можно полностью описать и изучить целиком, поскольку он имеет точное и конечное определение. Напротив, естественные языки имеют изменяющиеся значения, данные их пользователями в разных сообществах. Хотя сконструированные языки также являются искусственными языками, разработанными с нуля с определенной целью, им не хватает точного и полного семантического определения, которое имеет язык программирования.

Многие языки программирования были разработаны с нуля, изменены для удовлетворения новых потребностей и объединены с другими языками. Многие в конечном итоге вышли из употребления. Хотя были попытки создать один «универсальный» язык программирования, который бы служил всем целям, все они не получили всеобщего признания в качестве выполняющих эту роль. Потребность в различных языках программирования возникает из-за разнообразия контекстов, в которых используются языки:

Программы варьируются от крошечных скриптов, написанных отдельными любителями, до огромных систем, написанных сотнями программистов.
Опыт программистов варьируется от новичков тем, кому простота важнее всего, экспертам, которые могут быть довольны значительной сложностью.
Программы должны сочетать скорость, размер и простоту в системах от микроконтроллеров до суперкомпьютеров.
Программы могут быть написаны один раз и не изменяться из поколения в поколение, или они могут подвергаться постоянным изменениям.
Программисты могут просто отличаться во вкусах: они могут быть привыкли обсуждать проблемы и выражать их на определенном языке.

Одной из распространенных тенденций в разработке языков программирования было добавление дополнительных возможностей для решения проблем с использованием более высокого уровня абстракции. Самые ранние языки программирования были очень тесно связаны с аппаратным обеспечением компьютера. По мере развития новых языков программирования были добавлены функции, позволяющие программистам выражать идеи, более далекие от простого перевода в базовые аппаратные инструкции. Поскольку программисты менее привязаны к сложности компьютера, их программы могут выполнять больше вычислений с меньшими усилиями со стороны программиста. Это позволяет им писать больше функций в единицу времени.

Программирование на естественном языке было предложено как способ устранить необходимость в специализированном языке программирования. Однако эта цель остается далекой, и ее преимущества открыты для обсуждения. Эдсгер В. Дейкстра придерживался позиции, что использование формального языка необходимо для предотвращения появления бессмысленных конструкций, и отклонил программирование на естественном языке как «глупое». Алан Перлис также отверг эту идею. В структурированном английском и SQL.

были применены гибридные подходы. Разработчики и пользователи языка должны создать ряд артефактов, которые управляют и позволяют практиковать программирование. Наиболее важными из этих артефактов являются спецификация и реализация языка.

Спецификация

Спецификация языка программирования - это артефакт, который пользователи языка и разработчики могут использовать для согласования того, является ли часть исходный код - это действующая программа на этом языке, и если да, то каким должно быть ее поведение.

Спецификация языка программирования может принимать несколько форм, включая следующие:

Явное определение синтаксиса, статической семантики и семантики выполнения языка. Хотя синтаксис обычно определяется с использованием формальной грамматики, семантические определения могут быть написаны на естественном языке (например, как в языке C ) или в формальной семантике (например, как в Стандарт ML и Scheme specifications).
Описание поведения переводчика для языка (например, C ++ и спецификации Fortran ). Синтаксис и семантика языка должны быть выведены из этого описания, которое может быть написано на естественном или формальном языке.
A ссылка или реализация модели, иногда написана на указанном языке (например, Prolog или ANSI REXX ). Синтаксис и семантика языка явно указаны в поведении эталонной реализации.

Реализация

Реализация языка программирования предоставляет способ писать программы на этом языке и выполнять их в одной или нескольких конфигурациях аппаратного и программного обеспечения. В целом, существует два подхода к реализации языка программирования: компиляция и интерпретация. Как правило, можно реализовать язык, используя любой из этих методов.

Вывод компилятора может выполняться аппаратными средствами или программой, называемой интерпретатором. В некоторых реализациях, использующих подход интерпретатора, нет четкой границы между компиляцией и интерпретацией. Например, некоторые реализации BASIC компилируют, а затем выполняют исходный код построчно.

Программы, которые выполняются непосредственно на оборудовании, обычно работают намного быстрее, чем те, которые интерпретируются в программном обеспечении.

Одним из способов повышения производительности интерпретируемых программ является своевременное выполнение компиляция. Здесь виртуальная машина непосредственно перед выполнением транслирует блоки байт-кода , которые будут использоваться, в машинный код для прямого выполнения на оборудовании.

Собственные языки

Хотя большинство наиболее часто используемых языков программирования имеют полностью открытые спецификации и реализации, многие языки программирования существуют только как проприетарные языки программирования с реализацией, доступной только от одного поставщика, который могут утверждать, что такой проприетарный язык является их интеллектуальной собственностью. Проприетарные языки программирования - это обычно предметные языки или внутренние языки сценариев для одного продукта; некоторые проприетарные языки используются только внутри поставщика, в то время как другие доступны для внешних пользователей.

Некоторые языки программирования существуют на границе между проприетарным и открытым; например, Oracle Corporation заявляет права собственности на некоторые аспекты языка программирования Java и языка программирования C # Microsoft, который имеет открытые реализации большинства частей системы, а также Common Language Runtime (CLR) в качестве закрытой среды.

Многие проприетарные языки широко используются, несмотря на их проприетарный характер; примеры включают MATLAB, VBScript и Wolfram Language. Некоторые языки могут перейти от закрытого к открытому; например, Erlang изначально был внутренним языком программирования Ericsson.

Использование

Были созданы тысячи различных языков программирования, в основном в области вычислений. В отдельных проектах программного обеспечения обычно используется пять или более языков программирования.

Языки программирования отличаются от большинства других форм человеческого выражения тем, что они требуют большей степени точности и полноты. При использовании естественного языка для общения с другими людьми авторы и носители-люди могут быть двусмысленными и допускать небольшие ошибки, но при этом ожидать, что их намерения будут поняты. Однако, образно говоря, компьютеры «делают именно то, что им говорят», и не могут «понять», какой код намеревался написать программист. Комбинация определения языка, программы и входных данных программы должна полностью определять внешнее поведение, которое происходит при выполнении программы в пределах области управления этой программой. С другой стороны, идеи об алгоритме могут быть переданы людям без точности, необходимой для выполнения, с помощью псевдокода, который чередует естественный язык с кодом, написанным на языке программирования.

Язык программирования предоставляет структурированный механизм для определения частей данных и операций или преобразований, которые могут выполняться автоматически с этими данными. Программист использует абстракции , присутствующие в языке, для представления концепций, задействованных в вычислениях. Эти концепции представлены в виде набора простейших доступных элементов (называемых примитивами ). Программирование - это процесс, с помощью которого программисты объединяют эти примитивы для создания новых программ или адаптации существующих к новым программам. использования или меняющейся окружающей среды.

Программы для компьютера могут выполняться в пакетном процессе без вмешательства человека, или пользователь может вводить команды в интерактивный сеанс интерпретатора . В этом случае «команды» - это просто программы, выполнение которых связано друг с другом. Когда язык может выполнять свои команды через интерпретатор (например, оболочку Unix или другой интерфейс командной строки ) без компиляции, он называется языком сценариев.

Измерение использования языка

Определить, какой язык программирования является наиболее широко используемым, сложно, поскольку определение использования зависит от контекста. Один язык может занимать большее количество часов программиста, другой имеет больше строк кода, а третий может потреблять больше всего процессорного времени. Некоторые языки очень популярны для определенных типов приложений. Например, COBOL по-прежнему используется в корпоративных центрах обработки данных, часто на больших мэйнфреймах ; Fortran в научных и инженерных приложениях; Ada в аэрокосмической, транспортной, военной промышленности, в приложениях реального времени и встроенных приложениях; и C во встроенных приложениях и операционных системах. Другие языки регулярно используются для написания самых разных приложений.

Были предложены различные методы измерения популярности языка, каждый из которых имеет различную предвзятость по отношению к измеряемой величине:

подсчет количества объявлений о вакансиях, в которых упоминается язык
количество проданные книги, которые обучают или описывают язык
оценки количества существующих строк кода, написанного на этом языке, что может недооценивать языки, которые не часто встречаются при общедоступном поиске
количество языковых ссылок (т. е., к названию языка), найденного с помощью поисковой системы.

Объединяя и усредняя информацию с разных интернет-сайтов, stackify.com сообщил о десяти самых популярных языках программирования (в порядке убывания общей популярности): Java, C, C ++, Python, C#, JavaScript, VB.NET, R, PHP и MATLAB.

Диалекты, разновидности и реализации

A диалект языка программирования или языка обмена данными является (относительно небольшим) вариантом или расширением языка это не меняет его внутренней природы. Для таких языков, как Scheme и Forth, разработчики могут счесть стандарты недостаточными, неадекватными или незаконными, поэтому часто они будут отклоняться от стандарта, создавая новый диалект . В других случаях диалект создается для использования в предметно-ориентированном языке, часто в подмножестве. В мире Lisp большинство языков, использующих базовый синтаксис S-выражения и подобную Lisp семантику, считаются диалектами Lisp, хотя они сильно различаются, как, например, Racket и Clojure. Поскольку один язык обычно имеет несколько диалектов, неопытному программисту может быть довольно сложно найти нужную документацию. язык программирования BASIC имеет много диалектов.

Бурный рост диалектов Forth привел к высказыванию «Если вы видели один Forth... вы видели один Forth».

Таксономии

Для языков программирования нет всеобъемлющей схемы классификации. У данного языка программирования обычно нет единого языка-предка. Языки обычно возникают путем объединения элементов нескольких предшествующих языков с новыми идеями, циркулирующими в то время. Идеи, возникшие на одном языке, распространяются в семье родственных языков, а затем внезапно перепрыгивают через семейные разрывы и появляются в совершенно другой семье.

Задача усложняется еще и тем, что языки можно классифицировать по нескольким осям. Например, Java является как объектно-ориентированным языком (потому что он поощряет объектно-ориентированную организацию), так и параллельным языком (поскольку он содержит встроенные конструкции для параллельного выполнения нескольких потоков ). Python - объектно-ориентированный язык сценариев.

В общих чертах, языки программирования делятся на парадигмы программирования и классификацию по предполагаемой области использования с общими -целевые языки программирования, отличные от предметно-ориентированных языков программирования. Традиционно языки программирования рассматривались как описывающие вычисления в терминах императивных предложений, то есть выдачи команд. Обычно их называют языками императивного программирования. Большое количество исследований в области языков программирования было направлено на стирание различия между программой как набором инструкций и программой как утверждением о желаемом ответе, что является основной особенностью декларативного программирования. Более изощренные парадигмы включают в себя процедурное программирование, объектно-ориентированное программирование, функциональное программирование и логическое программирование ; некоторые языки представляют собой гибриды парадигм или мультипарадигматические. язык ассемблера - это не столько парадигма, сколько прямая модель базовой машинной архитектуры. По назначению языки программирования могут рассматриваться как языки общего назначения, языки системного программирования, языки сценариев, предметно-ориентированные языки или параллельные / распределенные языки (или их комбинация). Некоторые языки общего назначения были разработаны в основном с образовательными целями.

Язык программирования также можно классифицировать по факторам, не связанным с парадигмой программирования. Например, в большинстве языков программирования используются ключевые слова английского языка, в то время как меньшинство не используют. Другие языки могут быть классифицированы как намеренно эзотерические или нет.

См. Также

Портал компьютерного программирования

Ссылки

Дополнительная литература

Внешние ссылки