В вычислениях, файловая система или файловая система ( часто сокращенно fs ) управляет тем, как данные хранятся и извлекаются. Без файловой системы данные, помещенные на носитель данных, были бы одним большим массивом данных без возможности сказать, где заканчивается один фрагмент данных и начинается следующий. Разделив данные на части и присвоив каждой части имя, данные легко изолировать и идентифицировать. Получив свое название от названия системы управления бумажными данными, каждая группа данных называется «файлом ». Структура и логические правила, используемые для управления группами данных и их именами, называются «файловой системой».
Есть много разных файловых систем. Каждый из них имеет различную структуру и логику, свойства скорости, гибкости, безопасности, размера и т. Д. Некоторые файловые системы были разработаны для использования в определенных приложениях. Например, файловая система ISO 9660 разработана специально для оптических дисков.
Файловые системы могут использоваться на различных типах запоминающих устройств, которые используют различные типы носителей.. По состоянию на 2019 год жесткие диски были ключевыми устройствами хранения и, по прогнозам, останутся таковыми в обозримом будущем. Другие используемые типы носителей включают SSD, магнитные ленты и оптические диски. В некоторых случаях, например, с tmpfs, основная память компьютера (оперативная память, RAM) используется для создания временной файловой системы для краткосрочного использования.
Некоторые файловые системы используются на локальных устройствах хранения данных ; другие обеспечивают доступ к файлам через сетевой протокол (например, клиенты NFS, SMB или 9P ). Некоторые файловые системы являются «виртуальными», что означает, что предоставленные «файлы» (называемые виртуальными файлами ) вычисляются по запросу (например, procfs и sysfs ) или являются просто отображением в другую файловую систему, используемую в качестве резервного хранилища. Файловая система управляет доступом как к содержимому файлов, так и к метаданным об этих файлах. Он отвечает за организацию места для хранения вещей; надежность, эффективность и настройка физического носителя данных являются важными аспектами проектирования.
До с появлением компьютеров термин файловая система использовался для описания метода хранения и поиска бумажных документов. К 1961 году этот термин стал применяться к компьютеризированной архивации наряду с первоначальным значением. К 1964 году это было широко распространено.
Файловая система состоит из двух или трех уровней. Иногда уровни явно разделяются, а иногда функции объединяются.
Логическая файловая система отвечает за взаимодействие с пользовательским приложением. Он предоставляет интерфейс прикладной программы (API) для файловых операций - OPEN
, CLOSE
, READ
и т. Д. И передает запрошенные на уровень ниже для обработки. Логическая файловая система «управляет записями открытой таблицы файлов и дескрипторами файлов для каждого процесса». Этот уровень обеспечивает «доступ к файлам, операции с каталогами, [и] безопасность и защиту».
Второй дополнительный уровень - это виртуальная файловая система. «Этот интерфейс позволяет поддерживать несколько одновременных экземпляров физических файловых систем, каждая из которых называется реализацией файловой системы».
Третий уровень - это физическая файловая система. Этот уровень связан с физической работой запоминающего устройства (например, диска). Он обрабатывает физические блоки при чтении или записи. Он обрабатывает буферизацию и управление памятью и отвечает за физическое размещение блоков в определенных местах на носителе данных. Физическая файловая система взаимодействует с драйверами устройств или с каналом, чтобы управлять устройством хранения.
Примечание: это применимо только к файловым системам, используемым в устройствах хранения.
Пример свободного места, продемонстрированный с 4096- байтами кластерами NTFS: 100 000 файлов, каждые пять байтов на файл, что равно 500 000 байтов фактических данных, но требует 409 600 000 байт дискового пространства для храненияФайловые системы распределяют пространство детально, обычно несколько физических единиц на устройстве. Файловая система отвечает за организацию файлов и каталогов и отслеживание того, какие области носителя принадлежат какому файлу, а какие не используются. Например, в Apple DOS начала 1980-х для 256-байтовых секторов на 140-килобайтной гибкой дискете использовалась карта дорожек / секторов.
Это приводит к неиспользуемому пространству, когда файл не является точное кратное единице распределения, иногда называемое резервным пространством. Для выделения 512 байт среднее неиспользуемое пространство составляет 256 байт. Для кластеров размером 64 КБ средний размер неиспользуемого пространства составляет 32 КБ. Размер единицы размещения выбирается при создании файловой системы. Выбор размера выделения на основе среднего размера файлов, ожидаемых в файловой системе, может минимизировать объем неиспользуемого пространства. Часто выделение по умолчанию может обеспечить разумное использование. Выбор слишком маленького размера выделения приводит к чрезмерным накладным расходам, если файловая система будет содержать в основном очень большие файлы.
Файловые системы могут стать фрагментированнымиФрагментация файловой системы происходит, когда неиспользуемое пространство или отдельные файлы не являются смежными. При использовании файловой системы файлы создаются, изменяются и удаляются. Когда файл создается, файловая система выделяет место для данных. Некоторые файловые системы позволяют или требуют указывать начальное выделение пространства и последующие инкрементные выделения по мере роста файла. Когда файлы удаляются, пространство, которое им было выделено, в конечном итоге считается доступным для использования другими файлами. Это создает чередующиеся используемые и неиспользуемые области различного размера. Это фрагментация свободного пространства. Когда файл создается и для его начального распределения нет непрерывной области пространства, пространство должно быть выделено фрагментами. Когда файл изменяется так, что он становится больше, он может превышать пространство, изначально выделенное для него, другое выделение должно быть назначено в другом месте, и файл становится фрагментированным.
В некоторых операционных системах системный администратор может использовать дисковые квоты для ограничения выделения дискового пространства.
A имя_файла (или имя файла ) используются для идентификации места хранения в файловой системе. Большинство файловых систем имеют ограничения на длину имен файлов. В некоторых файловых системах имена файлов не чувствительны к регистру (т.е. имена MYFILE
и myfile
относятся к одному и тому же файлу в каталоге); в других именах файлов учитывается регистр (то есть имена MYFILE
, MyFile
и myfile
относятся к трем отдельным файлам, которые находятся в одном каталоге).
Большинство современных файловых систем позволяют именам файлов содержать широкий диапазон символов из набора символов Unicode. Однако у них могут быть ограничения на использование определенных специальных символов, запрещающих их использование в именах файлов; эти символы могут использоваться для обозначения устройства, типа устройства, префикса каталога, разделителя пути к файлу или типа файла.
Файловые системы обычно имеют каталоги (также называемые папками ), которые позволяют пользователю группировать файлы в отдельные коллекции. Это может быть реализовано путем связывания имени файла с индексом в таблице содержания или с индексом inode в Unix-подобной файловой системе. Структуры каталогов могут быть плоскими (т. Е. Линейными) или допускать иерархии, в которых каталоги могут содержать подкаталоги. Первая файловая система, поддерживающая произвольную иерархию каталогов, использовалась в операционной системе Multics. Собственные файловые системы Unix-подобных систем также поддерживают произвольные иерархии каталогов, как, например, Apple Hierarchical File System и ее преемник HFS + в классической Mac OS, файловой системе FAT в MS-DOS 2.0 и более поздних версиях MS-DOS и в Microsoft Windows, файловая система NTFS в семействе операционных систем Windows NT, а также ODS-2 (On-Disk Structure-2) и более высокие уровни Files-11 файловая система в OpenVMS.
Другая бухгалтерская информация обычно связана с каждым файлом в файловой системе. Длина данных, содержащихся в файле, может быть сохранена как количество блоков, выделенных для файла, или как счетчик байтов. время последнего изменения файла может быть сохранено как отметка времени файла. Файловые системы могут хранить время создания файла, время последнего обращения к нему, время изменения метаданных файла или время последнего резервного копирования файла. Другая информация может включать в себя тип устройства файла (например, блок, символ, сокет, подкаталог и т. Д.), его владелец идентификатор пользователя и идентификатор группы, его права доступа и другие атрибуты файла (например, доступен ли файл только для чтения, исполняемый файл и т. Д.).
Файловая система хранит все метаданные, связанные с файлом, включая имя файла, длину содержимого файла и расположение файла в иерархии папок, отдельно от содержимого файла..
Большинство файловых систем хранят имена всех файлов в одном каталоге в одном месте - в таблице каталогов для этого каталога - которая часто сохраняется, как и любой другой файл. Многие файловые системы помещают только часть метаданных для файла в таблицу каталогов, а остальные метаданные для этого файла в полностью отдельной структуре, такой как inode.
. Большинство файловых систем также хранят метаданные, не связанные с любым конкретным файлом. Такие метаданные включают информацию о неиспользуемых областях - битовая карта свободного пространства, карта доступности блоков - и информацию о сбойных секторах. Часто такая информация о группе распределения хранится внутри самой группы распределения.
В файловых системах могут быть связаны дополнительные атрибуты, например NTFS, XFS, ext2, ext3, некоторые версии UFS и HFS + с использованием расширенных атрибутов файла. Некоторые файловые системы предоставляют определенные пользователем атрибуты, такие как автор документа, кодировка символов документа или размер изображения.
Некоторые файловые системы позволяют связывать разные коллекции данных с одним именем файла. Эти отдельные коллекции могут называться потоками или ветвями. Apple уже давно использует разветвленную файловую систему на Macintosh, а Microsoft поддерживает потоки в NTFS. Некоторые файловые системы поддерживают несколько прошлых ревизий файла под одним именем файла; имя файла само по себе извлекает самую последнюю версию, в то время как предыдущая сохраненная версия может быть доступна с использованием специального соглашения об именах, такого как «имя файла; 4» или «имя файла (-4)» для доступа к версии, сохраненной четыре назад.
См. сравнение файловых систем # Метаданные для получения подробной информации о том, какие файловые системы поддерживают какие типы метаданных.
В некоторых случаях файловая система может не использовать запоминающее устройство, но может использоваться для организации и представления доступа к любым данным, будь то хранятся или генерируются динамически (например, procfs ).
Файловые системы включают утилиты для инициализации, изменения параметров и удаления экземпляра файловой системы. Некоторые включают возможность расширения или сокращения пространства, выделенного файловой системе.
Утилиты каталога могут использоваться для создания, переименования и удаления записей каталога, которые также известны как dentries (в единственном числе: dentry), а также для изменения метаданных, связанных с каталогом. Утилиты каталогов могут также включать возможности для создания дополнительных ссылок на каталог (жесткие ссылки в Unix ), для переименования родительских ссылок («..» в Unix-подобных операционных систем), а также для создания двунаправленных ссылок на файлы.
Файловые утилиты создают, перечисляют, копируют, перемещают и удаляют файлы, а также изменяют метаданные. Они могут обрезать данные, обрезать или увеличивать выделенное пространство, добавлять, перемещать и изменять файлы на месте. В зависимости от базовой структуры файловой системы они могут предоставлять механизм для добавления или усечения от начала файла, вставки записей в середину файла или удаления записей из файла.
Утилиты для освобождения места для удаленных файлов, если файловая система поддерживает функцию восстановления, также относятся к этой категории.
Некоторые файловые системы откладывают такие операции, как реорганизация свободного пространства, безопасное стирание свободного пространства и восстановление иерархических структур, предоставляя служебные программы для выполнения этих функций в моменты минимальной активности. Примером могут служить утилиты дефрагментации файловой системы .
Некоторые из наиболее важных функций утилит файловой системы включают действия по контролю, которые могут включать в себя обход владения или прямой доступ к базовому устройству. К ним относятся высокопроизводительное резервное копирование и восстановление, репликация данных и реорганизация различных структур данных и таблиц размещения в файловой системе.
Файловые системы используют несколько механизмов для управления доступом к данным. Обычно цель состоит в том, чтобы предотвратить чтение или изменение файлов пользователем или группой пользователей. Другая причина - обеспечить контролируемое изменение данных, чтобы доступ мог быть ограничен определенной программой. Примеры включают пароли, хранящиеся в метаданных файла или в другом месте, и права доступа к файлам в форме битов разрешений, списки управления доступом или возможности. Необходимость в утилитах файловой системы для доступа к данным на уровне носителя для реорганизации структур и обеспечения эффективного резервного копирования обычно означает, что они эффективны только для вежливых пользователей, но неэффективны против злоумышленников.
В файловую систему иногда включаются методы шифрования файловых данных. Это очень эффективно, поскольку утилитам файловой системы не нужно знать начальное значение шифрования для эффективного управления данными. Риски, связанные с использованием шифрования, включают тот факт, что злоумышленник может скопировать данные и использовать грубую силу для дешифрования данных. Потеря начального числа означает потерю данных.
Одной из важных задач файловой системы является обеспечение целостности структуры независимо от действий программ, обращающихся к данным. Сюда входят действия, предпринимаемые, если программа, изменяющая данные, аварийно завершает свою работу или не сообщает файловой системе о завершении своей деятельности. Это может включать обновление метаданных, записи каталога и обработку любых данных, которые были буферизованы, но еще не обновлены на физическом носителе.
Другие сбои, с которыми должна справиться файловая система, включают сбои носителей или потерю соединения с удаленными системами.
В случае сбоя операционной системы или «мягкого» сбоя питания должны быть вызваны специальные процедуры в файловой системе, аналогичные тем, которые возникают при сбое отдельной программы.
Файловая система также должна иметь возможность исправлять поврежденные структуры. Это может произойти в результате сбоя операционной системы, при котором операционная система не смогла уведомить файловую систему, сбоя питания или сброса.
Файловая система также должна записывать события, чтобы можно было анализировать системные проблемы, а также проблемы с конкретными файлами или каталогами.
Самая важная цель файловой системы - управлять пользовательскими данными. Это включает в себя хранение, получение и обновление данных.
Некоторые файловые системы принимают данные для хранения в виде потока байтов, которые собираются и хранятся эффективным для носителя образом. Когда программа извлекает данные, она определяет размер буфера памяти, и файловая система передает данные с носителя в буфер. Подпрограмма библиотеки времени выполнения может иногда позволять пользовательской программе определять запись на основе вызова библиотеки с указанием длины. Когда пользовательская программа считывает данные, библиотека извлекает данные через файловую систему и возвращает запись.
Некоторые файловые системы позволяют указывать фиксированную длину записи, которая используется для всех операций записи и чтения. Это облегчает поиск n записи, а также обновлениезаписей.
Идентификация каждой записи, также известная как ключ, делает файловую систему более сложной. Программа пользователя может читать, записывать и обновлять записи независимо от их местоположения. Это сложного управления блоками мультимедиа, обычно разделяющих ключевые блоки и блоки данных. Для поиска записей можно разработать очень эффективные алгоритмы со структурой пирамиды.
Утилиты, библиотеки времени для конкретных языков и пользовательские программы используют API файловой системы делать запросы к файловой системе. К ним защищенных данных передача, позиционирование, обновление метаданных, управление каталогами, управление спецификациями доступа и удаление.
Часто системы розничной торговли конфигурируются с одной файловой системой, занимающей все устройство хранения.
Другой подход - разбиение диск, чтобы можно было использовать несколько файловых систем с разными атрибутами. Одна файловая система для использования в качестве кеша. Это дополнительное преимущество, заключающееся в сохранении безумной активности по созданию и удалению файлов. Аналогичный раздел может быть создан для электронной почты. Другой раздел и файловая система могут быть созданы для хранения аудио или видео файлов с большим объемом памяти. Одна из файловых систем обычно может быть установлена только для чтения и только периодически.
Третий подход, который в основном используется в облачных системах, заключается в использовании «образовательных дисков » для размещения дополнительных файловых систем с теми же атрибутами или без них в другом (хостовом) файле. система в виде файла. Тип примером виртуальная среда: один пользователь может запустить экспериментальный дистрибутив Linux (с использованием файлов системы ext4 ) на данной машине в своей производственной среде Windows (используя NTFS ). Файловая система ext4 в образе диска который обрабатывается как файл (или несколько файлов, в зависимости от гипервизора и настроек) в файловой системе хоста NTFS.
Наличие нескольких файловых систем в одной системе дает дополнительное преимущество, заключающееся в том, что в случае повреждения одного раздела оставшиеся файлы часто остаются нетронутыми. Это включает в себя вирусное уничтожение системного раздела или даже системы, которая не загружается. Утилиты файловой системы, которым требуется выделенный доступ, могут быть эффективно выполнены по частям. Кроме того, дефрагментация может быть более эффективной. Некоторые служебные программы обслуживания системы, такие как сканирование на вирусы и резервное копирование, также могут обрабатываться в сегментах. Например, нет необходимости создания системы файловой системы, вместе со всеми другими системами. Что касается изображений, можно легко «выделить» файлы изображений, которые содержат «только» данные, записанные в новые (исходное) изображение. "Одноразовая" система - может быть быстро восстановлена в случае уничтожения или заражения вирусом, поскольку старый образ может быть удален, а новый образ может быть создан за считанные секунды, даже без автоматизированные процедуры) и быстрое развертывание виртуальных машин (поскольку отличные образы могут быть быстро созданы с помощью сценария в пакетном режиме).
Все файловые системы имеют некоторые функциональные ограничения, определяющие максимальную емкость хранимых данных в системе. Эти функциональные ограничения - это попытка создания системы наугад, основанная на том, насколько велики системы хранения сейчас и большими, вероятно, вероятными системами хранения в будущем. Объем дисковой памяти продолжал увеличиваться почти с экспоненциальной скоростью (см. Мура ), поэтому через несколько лет файловые системы продолжали достигать проектных ограничений, которые требовали от пользователей компьютеров многократно переходить на новую систему с еще большей емкостью.
Сложность файловой системы обычно зависит от доступной емкости хранилища. Файловые системы начала 1980-х домашних компьютеров объемом памяти от 50 до 512 КБ не были бы разумным выбором для современных систем хранения с емкостью в сотни гигабайт. Точно так же современные файловые системы не были бы разумным выбором для этих ранних систем хранения.
Типы файловых систем можно разделить на дисковые / ленточные файловые системы, сетевые файловые системы и файловые системы специального назначения.
Дисковая файловая система использует преимущества дисковых носителей для произвольной адресации данных за короткий промежуток времени. Дополнительные варианты включают скорость доступа к данным после запрошенных и ожидание того, что следующие данные также могут быть запрошены. Это позволяет нескольким пользователям (или данным процессам) получать доступ к различным системам независимо от их последовательного расположения. Примеры включают FAT (FAT12, FAT16, FAT32 ), exFAT, NTFS, HFS и HFS +, HPFS, APFS, UFS, ext2, ext3, ext4, XFS, btrfs, Files-11, Veritas File System, VMFS, ZFS и ReiserFS. Некоторые файловые системы на дисках - это журнальные файловые системы или файловые системы с поддержкой версий.
ISO 9660 и Universal Disk Format (UDF) - два общих формата, предназначенные для дисков компакт-диски, DVD и диски Blu-ray. Mount Rainier - это упрощенное перезапись на DVD, поддерживаемое начиная с версии 2.6 ядра Linux и расширение с Windows Vista.
Файловая система флэш-памяти учитывает особые возможности, производительность и ограничения устройств флэш-память. Часто файловая система на диске может использовать устройство флэш-памяти в качестве основного носителя, но гораздо лучше использовать файловую систему, специально разработанную для флэш-устройства.
Ленточные файловые системы - это файловая система и форматные ленты, предназначенные для хранения файлов на ленте. Магнитные ленты представляют собой последовательные носители информации со более длительным временем произвольного доступа к данным, чем диски, которые создают проблемы для создания и эффективного управления файловой системой общего назначения.
В файловой системе диска обычно есть главный каталог файла и карта используемых и свободных данных. Любые добавления, изменения или удаления файлов требуют обновления каталога и используемых карт. Произвольный доступ к областям данных измеряется в миллисекундах, поэтому эта система хорошо работает с дисками.
Ленте требуется линейное движение для наматывания и разматывания маленького очень длинных рулонов носителя. Это движение ленты может заменить несколько секунд до нескольких минут, чтобы заменить головку чтения / записи одного конца на другую.
Следовательно, основные каталоги файлов и карта использования системы эффективно используемой системы. Запись обычно включает чтение карты использования блоков для поиска свободных блоков для записи, обновление карты использования и каталога для добавления данных, а затем продвижение ленты для записи данных в нужное место. Каждая запись в файл требует обновления карты и каталога и записи данных, что может занять несколько секунд для каждого файла.
Ленточные файловые системы вместо этого обычно позволяют распределить каталог файлов по ленте вместе с данными, что называется потоковой передачей, так что для записи новых данных не требуются длительные и повторяющиеся движения ленты.
. Прочитать все разрозненные записи каталога. Большинство программ для создания файлов, которые работают с ленточными хранилищами, сохраняют локальную копию ленточного каталога в файловой системе диска, так что добавление файлов на ленту может быть выполнено быстро без повторного сканирования ленточного носителя. Копия локального ленточного каталога обычно отбрасывается, если не используется в течение определенного периода времени.
IBM разработала файловую систему для ленты, которая называется Linear Tape File System. Реализация этой файловой системы IBM была выпущена как продукт с открытым исходным кодом IBM Linear Tape File System - Single Drive Edition (LTFS-SDE). Файловая система Linear Tape File System использует отдельный раздел на ленте для записи метаданных индексов, что позволяет избежать проблем, связанных с разбросом записей каталога по всей ленте.
Запись данных на ленту, стирание или форматирование ленты часто требует значительных затрат времени и может занять часов на больших лентах. При использовании многих технологий ленточных данных нет необходимости форматировать ленту перед перезаписью новых данных на ленту. Это происходит из-за разрушительного характера перезаписи последовательных носителей.
используется форматирование ленты, которое обычно используется для использования. Все, что обычно необходимо, - это записать даже идентификационную этикетку носителя на ленту перед, когда новая лента используется в первый раз.
Другой концепцией управления файлами идея файловой системы на основе базы данных. Вместо или в дополнение к иерархическому структурированному управлению файлы идентифицируются по характеристикам, таким как тип файла, автор или аналогичные расширенные метаданные.
IBM DB2 для i (ранее известные как DB2 / 400 и DB2 для i5 / OS) - это файловая система базы данных как часть объектной операционной системы IBM i (ранее известная как OS / 400 и i5 / OS), включающая одноуровневое хранилище и работающая на IBM Power Системы (ранее известные как AS / 400 и iSeries), разработанные Фрэнком Г. Солтисом, бывшим главным научным сотрудником IBM по IBM i. Примерно с 1978 по 1988 год Фрэнк Г. Солтис и его команда в IBM Rochester успешно разработали и применили такие технологии, как файловая система базы данных, чего позже другим, вроде Microsoft, не удалось. Эти технологии неофициально известны как «Крепость Рочестер» и в нескольких основных аспектах были расширены от ранних технологий мэйнфреймов, но во многих отношениях были более продвинутыми с технологической точки зрения.
Некоторые другие проекты, которые не являются "чистыми" файловыми системами баз данных, но используют некоторые аспекты файловой системы базы данных:
Некоторым программам необходимо либо внести несколько изменений в файловую систему, либо, если одно или несколько изменений не выполняются по какой-либо причине, не вносите никаких изменений. Например, программа, устанавливает или обновляющая программное обеспечение, может записывать исполняемые файлы, библиотеки и / или файлы конфигурации. Если часть записи не удается, использование программного обеспечения остается частично используемым или обновленным, используемым программным обеспечением. Неполное обновление ключевой системной утилиты, такое как команда shell, может оставить всю систему в непригодном для использования состоянии.
Обработка транзакций ввод гарантией атомарности, гарантирую, что операции внутри транзакций либо будут зафиксированы, либо транзакция может быть прервана, а система отбрасывает все свои частичные. Это означает, что в случае сбоя или сбоя питания после восстановления сохраненное состояние будет согласованным. Либо программное обеспечение будет полностью установлено, либо неудачная установка будет полностью откатана, но непригодная для использования частичная установка не останется в системе. Транзакции также обеспечивают гарантию изоляция, что означает, что операции внутри транзакции скрыты от других потоков в системе до тех пор, пока транзакция не будет зафиксирована, и что мешающие операции в системе будут правильно сериализованы с перевод.
Windows, начиная с Vista, добавила поддержку транзакций в NTFS в функции под названием Transactional NTFS, но теперь ее использование не рекомендуется. Существует ряд исследовательских прототипов транзакционных файловых систем для систем UNIX, включая файловую систему Valor, Amino, LFS и транзакционную файловую систему ext3 в ядре TxOS, а также транзакционные файловые системы, предназначенные для встроенных системы, такие как TFFS.
Обеспечение согласованности между несколькими операциями файловой системы сложно, если вообще возможно, без транзакций файловой системы. Блокировка файлов может использоваться как механизм управления параллелизмом для отдельных файлов, но обычно она не защищает структуру каталогов или метаданные файла. Например, блокировка файла не может предотвратить состояние гонки TOCTTOU на символических ссылках. Блокировка файлов также не может автоматически откатить неудачную операцию, такую как обновление программного обеспечения; для этого требуется атомарность.
Журналирование файловых систем - это один из методов, используемых для обеспечения согласованности на уровне транзакций в структурах файловой системы. Операции журнала не доступны программам как часть API ОС; они используются только для внутреннего использования, чтобы обеспечить согласованность на уровне детализации одного системного вызова.
Системы резервного копирования данных обычно не поддерживают прямое резервное копирование данных, хранящихся в транзакционном режиме, что затрудняет восстановление надежных и согласованных наборов данных. Большинство программ резервного копирования просто отмечает, какие файлы были изменены с определенного времени, независимо от состояния транзакции, совместно используемого для нескольких файлов в общем наборе данных. В качестве обходного пути некоторые системы баз данных просто создают заархивированный файл состояния, содержащий все данные до этого момента, а программное обеспечение резервного копирования только выполняет резервное копирование и вообще не взаимодействует напрямую с активными транзакционными базами данных. Восстановление требует отдельного воссоздания базы данных из файла состояния после того, как файл был восстановлен программой резервного копирования.
Сетевая файловая система - это файловая система, которая действует как клиент для протокола удаленного доступа к файлам, обеспечивая доступ к файлам на сервере. Программы, использующие локальные интерфейсы, могут прозрачно создавать, управлять и получать доступ к иерархическим каталогам и файлам на удаленных компьютерах, подключенных к сети. Примеры сетевых файловых систем включают клиентов для протоколов NFS, AFS, SMB и клиентов, подобных файловой системе, для FTP и WebDAV.
Файловая система совместно используемых дисков - это система, в которой несколько машин (обычно серверов) имеют доступ к одной и той же внешней дисковой подсистеме (обычно SAN). Файловая система определяет доступ к этой подсистеме, предотвращая конфликты записи. Примеры включают GFS2 от Red Hat, GPFS от IBM, SFS от DataPlow, CXFS от SGI и StorNext от Quantum Corporation.
В специальной файловой системе нефайловые элементы операционной системы представлены в виде файлов, чтобы с ними можно было работать по использованию API файловой системы. Чаще всего это делается в Unix-подобных операционных системах, но устройства получают имена файлов и в некоторых не-Unix-подобных операционных системах.
Файловая система устройства представляет устройства ввода-вывода и псевдоустройства в виде файлов, называемых файлами устройств. Примеры в Unix-подобных системах включают devfs, а в Linux 2.6 системах - udev. В не-Unix-подобных системах, таких как TOPS-10 и других операционных системах, на которые он влияет, где полное имя файла или путь файла может включать префикс устройства, устройства другие чем те, которые содержат файловые системы, обозначаются префиксом устройства, указывающим устройство, без каких-либо следов после него.
В 1970-х дисковые и цифровые ленточные устройства были слишком дорогими для некоторых первых пользователей микрокомпьютеров. Была найдена недорогая базовая система хранения данных, в которой использовалась обычная аудиокассета .
Когда система требует записать данные, пользователь был уведомлен о нажатии кнопки «ЗАПИСЬ» на кассетном магнитофоне, а затем нажмите кнопку «ВОЗВРАТ» на клавиатуре, чтобы уведомить систему о том, что кассетный магнитофон выполняет. Система записала звук, чтобы обеспечить синхронизацию времени, затем модулировал звуки, которые закодировали префикс, данные, контрольную сумму и суффикс. Когда системе требовалось прочитать данные, пользователю предлагалось нажать «PLAY» на кассетном магнитофоне. Система будет слушать звуки на ленте, ожидая, пока вспышка звука не будет распознана как синхронизация. Затем система будет интерпретировать последующие звуки как данные. Когда считывание данных было завершено, система уведомляла пользователя о необходимости нажать «СТОП» на кассетном магнитофоне. Это было примитивно, но работало (большую часть времени). Данные хранились последовательно, обычно в безымянном формате, хотя некоторые системы (например, серия компьютеров Commodore PET ) позволяли давать файлам имена. Множественные наборы данных могут быть записаны и обнаружены путем быстрой перемотки ленты вперед и наблюдения за счетчиком ленты, чтобы найти приблизительное начало следующей области данных на ленте. Пользователю, возможно, придется прислушаться к звукам, чтобы найти правильное место для начала воспроизведения следующей области данных. Некоторые реализации даже включали слышимые звуки, перемежающиеся с данными.
В плоской файловой системе нет подкаталогов ; записи каталога для всех файлов хранятся в одном каталоге.
Когда дискета носитель был впервые доступен, этот тип файловой системы был подходящим из-за относительно небольшого объема доступного пространства для данных. Машины CP / M имели плоскую файловую систему, в которой файлы можно было назначить одной из 16 пользовательских областей, а общие файловые операции сузились до работы в одной, а не по умолчанию для работы со всеми из них. Эти пользовательские области были не более чем специальными атрибутами, связанными с файлами; то есть не было необходимости определять конкретную квоту для каждой из этих областей, и файлы можно было добавлять в группы до тех пор, пока на диске оставалось свободное место для хранения. Ранний Apple Macintosh также имел плоскую файловую систему, Macintosh File System. Это было необычно, поскольку программа управления файлами (Macintosh Finder ) создавала иллюзию частично иерархической файловой системы поверх EMFS. Эта структура требовала, чтобы каждый файл имел уникальное имя, даже если он находился в отдельной папке. IBM DOS / 360 и OS / 360 хранят записи для всех файлов на дисковом пакете (томе) в каталоге пакета, который называется том Оглавление (VTOC).
Простые, плоские файловые системы становятся неудобными по мере роста количества файлов и затрудняют организацию данных в связанные группы файлов.
Недавнее дополнение к семейству плоских файловых систем - это Amazon S3, служба удаленного хранения, которая намеренно упрощена, чтобы позволить пользователям настраивать способ их данные хранятся. Единственные конструкции - это корзины (представьте себе диск неограниченного размера) и объекты (похожие, но не идентичные стандартной концепции файла). Расширенное управление файлами разрешено благодаря возможности использовать практически любой символ (включая '/') в имени объекта и возможность выбирать подмножества содержимого корзины на основе идентичных префиксов.
Многие операционные системы включают поддержку более чем одной файловой системы. Иногда ОС и файловая система настолько тесно взаимосвязаны, что трудно разделить функции файловой системы.
Между пользователем и файловой системой должен быть интерфейс, обеспечиваемый программным обеспечением операционной системы. Этот интерфейс может быть текстовым (например, предоставляемым интерфейсом командной строки, например оболочкой Unix или OpenVMS DCL ) или графическим (например, предоставляемым графический пользовательский интерфейс, например файловые браузеры ). В графическом виде часто используется метафора папки, содержащей документы, другие файлы и вложенные папки (см. Также: каталог и папка).
Unix-подобные операционные системы создают виртуальную файловую систему, в которой все файлы на всех устройствах кажутся существующими в единой иерархии. Это означает, что в этих системах есть один корневой каталог , и каждый файл, существующий в системе, находится где-то в нем. Unix-подобные системы могут использовать RAM-диск или общий сетевой ресурс в качестве корневого каталога.
Unix-подобные системы назначают имя устройства каждому устройству, но это не способ доступа к файлам на этом устройстве. Вместо этого, чтобы получить доступ к файлам на другом устройстве, операционная система должна сначала узнать, где в дереве каталогов должны появиться эти файлы. Этот процесс называется монтированием файловой системы. Например, чтобы получить доступ к файлам на CD-ROM, нужно сказать операционной системе: «Возьмите файловую систему с этого CD-ROM и поместите ее в такой-то каталог». Каталог, предоставленный операционной системе, называется точкой монтирования - это может быть, например, / media. Каталог / media существует во многих системах Unix (как указано в Стандарте иерархии файловой системы ) и предназначен специально для использования в качестве точки монтирования для съемных носителей, таких как компакт-диски, DVD-диски, USB-накопители или гибкие диски. диски. Он может быть пустым или содержать подкаталоги для установки отдельных устройств. Как правило, только администратор (т.е. пользователь root ) может авторизовать монтирование файловых систем.
Unix-подобные операционные системы часто включают программное обеспечение и инструменты, которые помогают в процессе монтирования и предоставляют ему новые функции. Некоторые из этих стратегий были придуманы как «автоматический монтаж» как отражение их цели.
Linux поддерживает множество файловых систем, но часто выбирается для системного диска на блочном устройстве включают семейство ext * (ext2, ext3 и ext4 ), XFS, JFS и btrfs. Для необработанной флэш-памяти без уровня трансляции флэш-памяти (FTL) или устройства с технологией памяти (MTD) существуют UBIFS, JFFS2 и ЯФФС и др. SquashFS - это обычная сжатая файловая система, доступная только для чтения.
Solaris в более ранних выпусках по умолчанию (без ведения журнала или без ведения журнала) UFS для загрузочных и дополнительных файловых систем. Solaris по умолчанию использует UFS, поддерживает и расширяет его.
Поддержка других файловых систем и значительные улучшения были добавлены со временем, в том числе Veritas Software Corp. (ведение журнала) VxFS, Sun Microsystems (кластеризация) QFS, Sun Microsystems (ведение журнала) UFS и Sun Microsystems (открытый исходный код, объединение в пул, 128-битное сжатие и исправление ошибок) ZFS.
В Solaris были добавлены расширения ядра для обеспечения возможности загрузки Veritas VxFS. Ведение журнала или журналирование было добавлено в UFS в Sun Solaris 7. Выпуски Solaris 10, Solaris Express, OpenSolaris и другие варианты операционной системы Solaris с открытым исходным кодом, позже поддерживаемые загрузочным ZFS.
Logical Volume Management, позволяют охват файловой системы на нескольких устройствах с целью добавления избыточности, емкости и / или пропускной способности. Устаревшие среды в Solaris могут использовать Solaris Volume Manager (ранее известный как Solstice DiskSuite ). Veritas Volume Manager могут использовать несколько операционных систем (включая Solaris). Современные операционные системы на основе Solaris затмевают потребность в управлении томами за счет использования пулов виртуальных носителей в ZFS.
macOS (ранее Mac OS X) использует Apple File System ( APFS), который недавно заменил файловую систему, унаследованную от классической Mac OS, под названием HFS Plus (HFS +). Apple также использует термин «Mac OS Extended» для HFS +. HFS Plus - это файловая система с расширенными метаданными и с сохранением регистра, но (обычно) без учета регистра. Из-за Unix-корней macOS в HFS Plus были добавлены разрешения Unix. В более поздних версиях HFS Plus добавлено ведение журнала для предотвращения повреждения структуры файловой системы и внесен ряд оптимизаций в алгоритмы распределения в попытке автоматически дефрагментировать файлы без использования внешнего дефрагментатора.
Имена файлов могут содержать до 255 символов. HFS Plus использует Unicode для хранения имен файлов. В macOS тип файла может происходить из кода типа , хранящегося в метаданных файла, или расширения имени файла .
HFS Plus имеет три типа ссылок: в стиле Unix жесткие ссылки, символические ссылки в стиле Unix и псевдонимы. Псевдонимы предназначены для сохранения ссылки на исходный файл, даже если они перемещены или переименованы; они интерпретируются не самой файловой системой, а кодом диспетчера файлов в пользовательской среде.
macOS 10.13 High Sierra, о которой было объявлено 5 июня 2017 года на мероприятии Apple WWDC, использует файловую систему Apple на твердотельных накопителях.
macOS также поддерживает файловую систему UFS, полученную из BSD быстрой файловой системы Unix через NeXTSTEP. Однако, начиная с версии Mac OS X Leopard, macOS больше нельзя было установить на том UFS, а систему до Leopard, установленную на томе UFS, нельзя было обновить до Leopard. Начиная с Mac OS X Lion поддержка UFS была полностью прекращена.
Более новые версии macOS могут читать и записывать в устаревшие файловые системы FAT (16 и 32), распространенные в Windows. Они также могут читать новые файловые системы NTFS для Windows. Для записи в файловую систему NTFS в версиях macOS до Mac OS X Snow Leopard необходимо стороннее программное обеспечение. Mac OS X 10.6 (Snow Leopard) и более поздние версии позволяют запись в файловые системы NTFS, но только после нетривиального изменения системных настроек (существует стороннее программное обеспечение, которое автоматизирует это).
Наконец, macOS поддерживает чтение и запись файловой системы exFAT начиная с Mac OS X Snow Leopard, начиная с версии 10.6.5.
OS / 2 1.2 представила High Файловая система производительности (HPFS). HPFS поддерживает имена файлов со смешанным регистром на разных кодовых страницах, длинные имена файлов (255 символов), более эффективное использование дискового пространства, архитектуру, которая хранит связанные элементы близко друг к другу на томе диска, меньшая фрагментация данные, распределение пространства на основе экстентов, структура B + tree для каталогов и корневой каталог, расположенный в средней точке диска, для более быстрого среднего доступа. журналируемая файловая система (JFS) была поставлена в 1999 году.
PC-BSD - настольная версия FreeBSD, унаследованная от FreeBSD ZFS, аналогично FreeNAS. Новый графический установщик PC-BSD может обрабатывать / (root ) в пулах ZFS и RAID-Z, а также шифрование диска с использованием Гели с самого начала простым и удобным (GUI ) способом. Текущая версия PC-BSD 9.0+ «Isotope Edition» имеет файловую систему ZFS версии 5 и пул устройств хранения ZFS версии 28.
Plan 9 от Bell Labs обрабатывает все как файл и обращается ко всем к объектам как к файлу (т. е. отсутствует ioctl или mmap ): доступ к сети, графике, отладке, аутентификации, возможностям, шифрованию и другим службам осуществляется через I / O операции с файловыми дескрипторами . Протокол 9P устраняет разницу между локальными и удаленными файлами. Файловые системы в Plan 9 организованы с помощью частных пространств имен для каждого процесса, что позволяет каждому процессу иметь различное представление о множестве файловых систем, которые предоставляют ресурсы в распределенной системе.
Операционная система Inferno разделяет эти концепции с Plan 9.
Windows использует файловые системы FAT, NTFS, exFAT, Live File System и ReFS ( последний из них поддерживается и может использоваться только в Windows Server 2012, Windows Server 2016, Windows 8, Windows 8.1 и Windows 10 ; Windows не может загрузиться с него).
Windows использует абстракцию буквы диска на уровне пользователя, чтобы отличить один диск или раздел от другого. Например, path C: \ WINDOWS представляет каталог WINDOWS в разделе, представленном буквой C. Диск C: чаще всего используется для основного жесткого диска . раздел, на котором обычно устанавливается Windows и с которого она загружается. Эта «традиция» настолько прочно укоренилась, что во многих приложениях существуют ошибки, предполагающие, что диск, на котором установлена операционная система, - это C. Использование букв дисков и традиция использования буквы «C» в качестве буквы диска для раздел основного жесткого диска можно отследить до MS-DOS, где буквы A и B были зарезервированы для двух дисководов гибких дисков. Это, в свою очередь, произошло от CP / M 1970-х годов и, в конечном итоге, от IBM CP / CMS 1967 года.
Семейство Файловые системы FAT поддерживаются практически всеми операционными системами для персональных компьютеров, включая все версии Windows и MS-DOS / PC DOS, OS / 2 и DR-DOS. (PC DOS - это OEM-версия MS-DOS, MS-DOS изначально была основана на 86-DOS SCP. DR-DOS была основана на Digital Research Concurrent DOS, преемник CP / M-86. Таким образом, файловые системы FAT хорошо подходят в качестве универсального формата обмена между компьютерами и устройствами практически любого тип и возраст.
Корни файловой системы FAT восходят к (несовместимому) 8-битному предшественнику FAT в Standalone Disk BASIC и недолговечному проекту MDOS / MIDAS.
За прошедшие годы файловая система была расширена с FAT12 до FAT16 и FAT32. В файловую систему были добавлены различные функции, включая подкаталоги , поддержку кодовой страницы , расширенные атрибуты и длинные имена файлов. Третьи стороны, такие как Digital Research, включили дополнительную поддержку для отслеживания удаления и многопользовательские схемы безопасности на основе томов / каталогов / файлов для поддержки паролей и разрешений файлов и каталогов, таких как права доступа на чтение / запись / выполнение / удаление. Большинство этих расширений не поддерживаются Windows.
Файловые системы FAT12 и FAT16 имели ограничение на количество записей в корневом каталоге файловой системы и имели ограничения на максимальный размер дисков в формате FAT или разделы.
FAT32 устраняет ограничения в FAT12 и FAT16, за исключением предельного размера файла, близкого к 4 ГБ, но он остается ограниченным по сравнению с NTFS.
FAT12, FAT16 и FAT32 также имеют ограничение в восемь символов для имени файла и три символа для расширения (например, .exe ). Это обычно называется пределом 8.3 filename. VFAT, дополнительное расширение для FAT12, FAT16 и FAT32, представленное в Windows 95 и Windows NT 3.5, допускало длинные имена файлов (LFN ) для хранения в файловой системе FAT с обратной совместимостью.
NTFS, представленная в операционной системе Windows NT в 1993 году, позволяла управлять разрешениями на основе ACL. Другие функции, также поддерживаемые NTFS, включают жесткие ссылки, несколько файловых потоков, индексацию атрибутов, отслеживание квот, разреженные файлы, шифрование, сжатие и точки повторной обработки (каталоги, работающие как точки монтирования для других файловых систем, символические ссылки, развязки, ссылки удаленного хранилища).
exFAT имеет определенные преимущества перед NTFS в отношении файлов.
exFAT не имеет обратной совместимости с файловыми системами FAT, такими как FAT12, FAT16 или FAT32. Файловая система поддерживается более новыми системами Windows, такими как Windows XP, Windows Server 2003, Windows Vista, Windows 2008, Windows 7, Windows 8 и Windows 10.
exFAT поддерживается в macOS, начиная с версии 10.6..5 (Снежный барс). Поддержка в других операционных системах ограничена, поскольку для реализации поддержки exFAT требуется лицензия. exFAT - единственная файловая система, полностью поддерживаемая как в macOS, так и в Windows, которая может хранить файлы размером более 4 ГБ.
До введения В системах VSAM, OS / 360 реализована необычная гибридная файловая система. Система была разработана для простой поддержки сменных дисковых пакетов, поэтому информация, относящаяся ко всем файлам на одном диске (том в терминологии IBM), хранится на этом диске в плоском системном файле , который называется Оглавление тома (VTOC). VTOC хранит все метаданные для файла. Позже была наложена иерархическая структура каталогов с введением системного каталога, который может дополнительно каталогизировать файлы (наборы данных) на резидентных и съемных томах. Каталог содержит только информацию, позволяющую связать набор данных с определенным объемом. Если пользователь запрашивает доступ к набору данных на автономном томе и у него есть соответствующие права, система попытается смонтировать требуемый том. Каталогизированные и некаталогизированные наборы данных могут быть доступны с использованием информации в VTOC, минуя каталог, если требуемый идентификатор тома предоставлен в запросе OPEN. Еще позже VTOC был проиндексирован для ускорения доступа.
Компонент IBM Conversational Monitor System (CMS) в VM / 370 использует отдельнуюплоскую файловую систему для каждого виртуальный диск (минидиск). Данные файла и управляющая информация разбросаны и перемешаны. Якорь - это запись, называемая главным каталогом файлов (MFD), всегда расположенная в четвертом блоке на диске. Первоначально CMS использовала 800-байтовые блоки фиксированной длины, но в более поздних версиях использовались блоки большего размера до 4K. Для доступа к записи данных требуется два уровня косвенного обращения, где запись каталога файла (называемая записью таблицы состояния файла (FST)) указывает на блоки, содержащие список адресов отдельных записей.
Данные в AS / 400 и его преемниках состоят из системных объектов, отображенных в системное виртуальное адресное пространство в одноуровневом хранилище. Определены многие типы объектов AS / 400, включая каталоги и файлы из других файловых систем. Файловые объекты, наряду с другими типами объектов, составляют основу поддержки AS / 400 интегрированной реляционной базы данных.
Это может быть полезно или необходимо иметь файлы в файловой системе, отличной от существующей в настоящее время. Причины включают необходимость увеличения требований к пространству за пределами текущей файловой системы. Возможно, потребуется увеличить глубину пути сверх ограничений файловой системы. Могут быть соображения производительности или надежности. Другой причиной является предоставление доступа к другой операционной системе, которая не поддерживает существующую файловую систему.
В некоторых случаях преобразование может быть выполнено на месте, хотя миграция файловой системы является более консервативной, поскольку она включает создание копии данных и рекомендуется. В Windows файловые системы FAT и FAT32 можно преобразовать в NTFS с помощью утилиты convert.exe, но не наоборот. В Linux ext2 можно преобразовать в ext3 (и преобразовать обратно), а ext3 можно преобразовать в ext4 (но не обратно), а ext3 и ext4 можно преобразовать в btrfs и преобразовать обратно до тех пор, пока информация об отмене удаляется. Эти преобразования возможны благодаря использованию того же формата для самих данных файла и перемещению метаданных в пустое пространство, в некоторых случаях с использованием поддержки разреженного файла.
Недостаток миграции состоит в том, что требуется дополнительное пространство, хотя он может быть быстрее. Лучше всего, если на носителе есть неиспользуемое пространство, которое будет содержать окончательную файловую систему.
Например, чтобы перенести файловую систему FAT32 в файловую систему ext2. Сначала создайте новую файловую систему ext2, затем скопируйте данные в файловую систему, затем удалите файловую систему FAT32.
Альтернативой, когда недостаточно места для сохранения исходной файловой системы до создания новой, является использование рабочей области (например, съемного носителя). Это занимает больше времени, но резервное копирование данных - хороший побочный эффект.
В иерархических файловых системах доступ к файлам осуществляется с помощью пути, который представляет собой список ветвлений каталогов, содержащих файл. Разные файловые системы имеют разные ограничения на глубину пути. Файловые системы также имеют ограничение на длину отдельного имени файла.
Копирование файлов с длинными именами или файлов, находящихся на значительной глубине, из одной файловой системы в другую может привести к нежелательным результатам. Это зависит от того, как утилита, выполняющая копирование, обрабатывает несоответствие.
The Wikibook В руководстве по Unix есть страница по теме: Файловые системы и своп |
Викискладе есть носители, относящиеся к Файловым системам. |