Стандартная библиотека C или libc - это стандартная библиотека для языка программирования C, как указано в стандарте ANSI C. Он был разработан одновременно с спецификацией POSIX библиотеки C, которая является ее надмножеством. Поскольку ANSI C был принят Международной организацией по стандартизации, стандартная библиотека C также называется библиотекой ISO C .
Стандартная библиотека C предоставляет макросы, определения типа и функции для таких задач, как обработка строки, математические вычисления, обработка ввода / вывода, управление памятью и несколько других служб операционной системы.
интерфейс прикладного программирования (API) стандартной библиотеки C объявлен в ряде файлов заголовков. Каждый файл заголовка содержит одно или несколько объявлений функций, определений типов данных и макросов.
После длительного периода стабильности три новых файла заголовков (iso646.h
, wchar.h
и wctype.h
) были добавлен Нормативным Приложением 1 (NA1), дополнением к Стандарту Си, ратифицированному в 1995 г. Еще шесть файлов заголовков (complex.h
, fenv.h
, inttypes.h
, stdbool.h
, stdint.h
и tgmath.h
) были добавлены с помощью C99, новой версии Стандарт C, опубликованный в 1999 г., и еще пять файлов (stdalign.h
, stdatomic.h
, stdnoreturn.h
, threads.h
, и uchar.h
) с C11 в 2011 году. Всего сейчас 29 файлов заголовков:
Name | From | Описание |
---|---|---|
| Содержит макрос assert, используемый для помощи в обнаружении логических ошибок и других типов ошибок при отладке версий программы. | |
| C99 | A набор функций для управления комплексными числами. |
| Определяет набор функций, используемых для классификации символов по их типам или для преобразования между верхним и нижним регистром в способом, который не зависит от используемого набора символов (обычно ASCII или одно из его расширений, хотя также известны реализации, использующие EBCDIC ). | |
| Для тестирования кодов ошибок, сообщаемых библиотечными функциями. | |
| C99 | Определяет набор функций для управления средой с плавающей запятой. |
| Определяет макроконстанты, определяющие зависящие от реализации свойства библиотеки с плавающей запятой. | |
| C99 | Определяет целочисленные типы точной ширины. |
| NA1 | Определяет несколько макросов, реализующих альтернативные способы выражения нескольких стандартных токенов. Для программирования в вариантах ISO 646 наборов символов. |
| Определяет макроконстанты, определяющие зависящие от реализации свойства целочисленных типов. | |
| Определяет функции локализации.. | |
| Определяет общие математические функции. | |
| Объявляет макросы setjmp и longjmp , которые используются для нелокальных выходов. | |
| Определяет функции обработки сигналов. | |
| C11 | Для запроса и указания выравнивания объектов. |
| Для доступа к переменному количеству аргументов, передаваемых функциям. | |
| C11 | Для атомарных операций с данными, совместно используемыми потоками. |
| C99 | Определяет логический тип данных. |
| Определяет несколько полезных типов и макросов. | |
| C99 | Определяет целочисленные типы точной ширины. |
| Определяет основные функции ввода и вывода | |
| Определяет функции числового преобразования, функции генерации псевдослучайных чисел, распределение памяти, функции управления процессом | |
| C11 | Для указания невозвратных функций |
| Определяет функции обработки строк | |
| C99 | Определяет универсальные математические функции типа. |
| C11 | Определяет функции для управления несколькими потоками, мьютексами и условными переменными |
| Определяет функции обработки даты и времени | |
| C11 | Типы и функции для управления символами Unicode |
| NA1 | Определяет функции обработки широких строк |
| NA1 | Определяет набор функций, используемых для классификации широких символов по их типам или для преобразования между верхним и нижним регистром |
Три файлов заголовков (complex.h
, stdatomic.h
и threads.h
) являются условными функциями, которые реализации не должны поддерживать.
Стандарт POSIX добавил несколько нестандартных заголовков C для специфичных для Unix функций. Многие нашли свой путь к другим архитектурам. Примеры включают unistd.h
и signal.h
. Ряд других групп используют другие нестандартные заголовки - в GNU C Library есть alloca.h
, а в HP OpenVMS есть va_count ()
функция.
В Unix-подобных системах авторитетная документация фактически реализованного API предоставляется в виде страниц руководства. В большинстве систем справочные страницы стандартных библиотечных функций находятся в разделе 3; раздел 7 может содержать несколько более общих страниц по базовым концепциям (например, man 7 math_error
в Linux ).
Unix-подобные системы обычно имеют библиотеку C в форме разделяемой библиотеки, но файлы заголовков (и набор инструментов компилятора) могут отсутствовать при установке, поэтому C развитие может оказаться невозможным. Библиотека C считается частью операционной системы в Unix-подобных системах. Функции C, включая стандартные функции ISO C, широко используются программами и рассматриваются так, как если бы они были не только реализацией чего-то на языке C, но и де-факто частью интерфейса операционной системы. Unix-подобные операционные системы обычно не могут работать, если библиотека C. Это верно для приложений, которые связаны динамически, а не статически. Кроме того, само ядро (по крайней мере, в случае Linux) работает независимо от каких-либо библиотек.
В Microsoft Windows базовые системные динамические библиотеки (DLL ) предоставляют реализацию стандартной библиотеки C для компилятора Microsoft Visual C ++ v6.0; стандартная библиотека C для новых версий компилятора Microsoft Visual C ++ предоставляется каждым компилятором индивидуально, а также распространяемыми пакетами. Скомпилированные приложения, написанные на C, либо статически связаны с библиотекой C, либо связаны с динамической версией библиотеки, которая поставляется с этими приложениями, вместо того, чтобы полагаться на присутствие в целевых системах. Функции библиотеки C компилятора не рассматриваются как интерфейсы для Microsoft Windows.
Существует множество других реализаций, поставляемых как с различными операционными системами, так и с компиляторами C. Некоторые из популярных реализаций следующие:
Некоторые компиляторы (например, GCC ) предоставляют встроенные версии многих функций стандартной библиотеки C; то есть реализации функций записываются в скомпилированный объектный файл , и программа вызывает встроенные версии вместо функций в файле общего объекта библиотеки C . Это снижает накладные расходы на вызовы функций, особенно если вызовы функций заменены на встроенные варианты, и позволяет использовать другие формы оптимизации (поскольку компилятор знает поток управления характеристики встроенных вариантов), но может вызвать путаницу при отладке (например, встроенные версии нельзя заменить на оснащенные варианты).
Однако встроенные функции должны вести себя как обычные функции в соответствии с ISO C. Основное значение заключается в том, что программа должна иметь возможность создавать указатель на эти функции, принимая их адреса, и вызывать функцию. с помощью этого указателя. Если два указателя на одну и ту же функцию получены в двух разных единицах трансляции в программе, эти два указателя должны сравниваться одинаково; то есть адрес приходит путем разрешения имени функции, которая имеет внешнюю (программную) связь.
В FreeBSD и Linux математические функции (как объявлено в math.h
) объединены отдельно в математической библиотеке libm. Если какой-либо из них используется, компоновщику должна быть дана директива -lm
.
Согласно стандарту C макрос __STDC_HOSTED__
должен быть определен как 1, если реализация размещена. Размещенная реализация имеет все заголовки, указанные в стандарте C. Реализация также может быть автономной, что означает, что эти заголовки не будут присутствовать. Если реализация является автономной, она должна определять от __STDC_HOSTED__
до 0.
Некоторые функции в стандартной библиотеке C были печально известны за наличие уязвимостей переполнения буфера и, как правило, поощрение ошибочного программирования с момента их принятия. Наиболее критикуемыми элементами являются:
strcpy ()
и strcat ()
, из-за отсутствия проверки границ и возможных переполнений буфера, если границы не проверяются вручную;printf ()
семейство подпрограмм, для порчи стека выполнения , когда строка формата не соответствует заданным аргументам. Этот фундаментальный недостаток создал целый класс атак: атаки строки формата ;получают ()
и scanf ()
семейство подпрограмм ввода-вывода., из-за отсутствия (любой или простой) проверки длины ввода.За исключением крайнего случая с gets ()
, всех уязвимостей безопасности можно избежать, введя вспомогательный код для выполнения управления памятью, проверки границ, проверка ввода и т. д. Это часто делается в форме оболочек, которые делают стандартные библиотечные функции более безопасными и простыми в использовании. Это восходит к книге Б. Кернигана и Р. Пайка Практика программирования, авторы которой обычно используют программы-оболочки, которые выводят сообщения об ошибках и закрывают программу в случае возникновения ошибки.
Комитет ISO C опубликовал технические отчеты TR 24731-1 и работает над TR 24731-2, чтобы предложить принятие некоторых функций с проверкой границ и автоматическим распределением буфера, соответственно. Первый встретил резкую критику и некоторые похвалы, второй получил смешанные отзывы. Несмотря на это, TR 24731-1 был реализован в стандартной библиотеке Microsoft C, и ее компилятор выдает предупреждения при использовании старых «небезопасных» функций.
Подпрограмму strerror ()
критикуют за то, что она небезопасна для потоков и другие уязвимы для состояния гонки.
Обработка ошибок функций в стандартной библиотеке C непоследовательна и иногда сбивает с толку. Согласно странице руководства Linux math_error
, «Текущая (версия 2.8) ситуация с glibc запутана. Большинство (но не все) функций вызывают исключения при ошибках. Некоторые также устанавливают errno. Некоторые функции устанавливают errno, но не вызывайте исключения. Очень немногие функции не делают ни того, ни другого ».
Исходный язык C не предусматривал встроенных функций, таких как ввод-вывод операции, в отличие от традиционных языков, таких как COBOL и Fortran. Со временем сообщества пользователей C делились идеями и реализациями того, что сейчас называется стандартными библиотеками C. Многие из этих идей со временем были включены в определение стандартизованного языка C.
И Unix, и C были созданы в Bell Laboratories компании ATT в конце 1960-х - начале 1970-х годов. В течение 1970-х годов язык Си становился все более популярным. Многие университеты и организации начали создавать свои собственные варианты языка для своих проектов. К началу 1980-х годов стали очевидны проблемы совместимости между различными реализациями C. В 1983 году Американский национальный институт стандартов (ANSI) сформировал комитет для разработки стандартной спецификации языка C, известной как «ANSI C ». Эта работа завершилась созданием так называемого стандарта C89 в 1989 году. Частью полученного стандарта стал набор программных библиотек, называемых стандартной библиотекой ANSI C.
POSIX, а также SUS, определяют количество подпрограмм, которые должны быть доступны помимо подпрограмм в базовой стандартной библиотеке C. Спецификация POSIX включает файлы заголовков, среди прочего, для многопоточности, сетей и регулярных выражений. Они часто реализуются вместе со стандартной функциональностью библиотеки C с разной степенью близости. Например, glibc реализует такие функции, как fork
в пределах libc.so
, но до того, как NPTL был объединен с glibc он представляет собой отдельную библиотеку со своим собственным аргументом флага компоновщика. Часто эта функциональность, указанная в POSIX, рассматривается как часть библиотеки; базовая библиотека C может быть идентифицирована как библиотека C ANSI или ISO.
BSD libc - это расширенный набор стандартной библиотеки POSIX, поддерживаемой библиотеками C, включенными в BSD операционные системы, например FreeBSD, NetBSD, OpenBSD и macOS. BSD libc имеет некоторые расширения, которые не определены в исходном стандарте, многие из которых впервые появились в выпуске 4.4BSD 1994 года (первое, которое в значительной степени было разработано после выпуска первого стандарта в 1989 году). Вот некоторые из расширений BSD libc:
sys / tree.h
- содержит реализацию красно-черного дерева и Splay tree sys / queue.h
- реализации Связанного списка, очередей и т. Д.fgetln ()
- определены в stdio.h
. Это можно использовать для чтения файла построчно.fts.h
- содержит некоторые функции для обхода файловой иерархииdb.h
- некоторые функции для подключения к Berkeley DB strlcat ()
и strlcpy ()
- безопасные альтернативы для strncat ()
и strncpy ()
err.h
- содержит некоторые функции для печати форматированных сообщений об ошибкахvis.h
- содержит функцию vis ()
. Эта функция используется для отображения непечатаемых символов в визуальном формате.Некоторые языки включают функциональность стандартной библиотеки C в свои собственные библиотеки. Библиотека может быть адаптирована для лучшего соответствия структуре языка, но операционная семантика остается аналогичной. Например, язык C ++ включает функциональные возможности стандартной библиотеки C в пространстве имен std
(например, std :: printf
, std :: atoi
, std :: feof
), в файлах заголовков с именами, похожими на имена C (cstdio
, cmath
, cstdlib
и т. Д.). Другие языки, использующие аналогичные подходы, - это D, Perl, Ruby и основная реализация Python, известная как CPython. В Python 2, например, встроенные файловые объекты определены как «реализованные с использованием пакета C stdio
», поэтому ожидается, что доступные операции (открытие, чтение, запись и т. Д.) Будут иметь такое же поведение, как и соответствующие функции C. Rust имеет ящик под названием libc, который позволяет использовать несколько функций C, структур и других определений типов.
Стандартная библиотека C мала по сравнению со стандартными библиотеками некоторых других языков. Библиотека C предоставляет базовый набор математических функций, операций со строками, преобразования типов, а также файлового и консольного ввода-вывода. Он не включает стандартный набор «типов контейнеров », таких как C++ Стандартная библиотека шаблонов, не говоря уже о полном графическом пользовательском интерфейсе (GUI), сетевые инструменты и множество других функций, которые Java и .NET Framework предоставляют в качестве стандартных. Основное преимущество небольшой стандартной библиотеки состоит в том, что создать рабочую среду ISO C намного проще, чем с другими языками, и, следовательно, перенос C на новую платформу сравнительно прост.