Компьютерное хранилище данных - это технология, состоящая из компьютерных компонентов и носителя записи, которые используются для хранения цифровых данных. Это основная функция и фундаментальный компонент компьютеров.
центральный процессор (ЦП) - это то, что управляет данными, выполняя вычисления. На практике почти все используют иерархию хранения , которая ставит быстрые, но дорогие и небольшие варианты хранения ближе к ЦП, а более медленные, но менее дорогие и большие варианты - дальше. Обычно быстрые энергозависимые технологии (которые теряют данные при отключении питания) используются как «память», тогда как более медленные устойчивые технологии включают как «хранилище».
Даже первые разработки компьютеров, Аналитическая машина Чарльза Бэббиджа и Аналитическая машина Перси Ладгейта, четко различали обработку и память (Бэббидж хранил числа как обороты шестерен, а Ладгейт сохранял числа как перемещение стержней в челноках). Это различие было расширено в проекторе фон Неймана, где ЦП состоит из двух основных частей: блока управления и арифметико-логического блока (ALU). Первый контролирует поток данных между ЦП и памятью, а второй выполняет арифметические и логические операции с данными.
Без значительного объем памяти компьютер мог бы просто выполнить фиксированные операции и немедленно выводить результат. Чтобы изменить его поведение, его придется перенастроить. Это приемлемо для таких устройств, как настольные калькуляторы, процессоры цифровых сигналов и другие специализированные устройства. Машины фон Неймана отличаются наличием памяти, в которой они хранят свои рабочие инструкции и данные. Такие компьютеры более универсальны в том смысле, что им не нужно реконфигурировать свое оборудование для новой программы, их можно просто перепрограммировать с помощью новых инструкций в памяти; Они также имеют тенденцию быть более простыми в разработке, поскольку состояние между последовательными вычислениями для создания сложных процедур результатов. Большинство современных компьютеров - это машины фон Неймана.
Современный цифровой компьютер представляет данные с использованием двоичной системы счисления. Текст, числа, изображения, аудио и почти любая другая форма информации может быть преобразована в строку бит или двоичных цифр, каждая из которых имеет значение 1 или 0. Наиболее распространенная единица измерения памяти - это байт, равный 8 битам. Часть может обрабатываться любым компьютером или частью памяти которого достаточно велик для размещения двоичного представления просто данных. Например, полное собрание сочинений Шекспира, около 1250 страниц в печатном виде, может храниться примерно в пяти мегабайтах (40 миллионов бит) с одним байтом на символ.
Данные кодируются путем присвоения битовой комбинации каждому символу ,, цифре или мультимедийному объекту. Для кодирования множества стандартов (например, кодировки символов, такие как ASCII, кодировки изображений, такие как JPEG, кодировки видео, такие как MPEG- 4 ).
За счет добавления битов к каждой кодированной единице избыточность позволяет обнаруживать ошибки в кодированных данных, так и исправлять их на основе математических алгоритмов. Ошибки обычно возникают с низкой вероятностью из-за случайного переворота битового значения или «усталости битов», потери физического бита в хранилище из-за его способности поддерживать различимое значение (0 или 1) или из-за ошибки в меж- или внутрикомпьютерной коммуникации. Случайное переключение битов (например, из-за случайного излучения ) обычно корректируется при обнаружении. Бит или группа неисправных физических битов (не всегда известен конкретный дефектный бит; определение группы зависит от конкретного запоминающего устройства) обычно автоматически изолируются, выводятся из использования и заменяются другой функционирующей группой в устройстве, где восстанавливаются исправленные битовые значения (если возможно). Метод циклического контроля избыточности (CRC) обычно используется при обмене данными и хранении для обнаружения ошибок. Обнаруженная ошибка повторяется.
Сжатие данных методы позволяют во многих случаях (например, в базе данных) использовать строку битов более короткой битовой строкой («сжатие») и при необходимости восстанавливать исходную строку («распаковывать»). При этом используется значительно меньшее хранилище (десятки процентов) для многих типов счетного объема вычислений (сжимайте и распаковывайте при необходимости). Анализ компромисса между экономией на хранении и затратами на вычислениях и возможными задержками в доступности данных принимаются до принятия решения о том.
По соображениям безопасности стандартные данные (например, информация о кредитной карте) могут храниться зашифрованными в хранилище, чтобы предотвратить возможность несанкционированного восстановления информации из фрагментов снимков хранилища.
Как правило, чем ниже в иерархии находится хранилище, тем меньше его пропускная способность и тем больше задержка доступа поступает от ЦП. Это традиционное разделение хранилища на первичное, вторичное, третичное и автономное также зависит от стоимости за бит.
В современном использовании "память" обычно полупроводниковая память чтения-записи оперативная память, обычно DRAM (динамическое ОЗУ) или другие быстрые, но временного хранения. «Хранилище» состоит из запоминающих устройств и их носителей, к которым не имеет прямого доступа ЦП (вторичная или третичная память ), обычно жесткие диски, оптические диски, приводы и другие устройства, более медленные, чем ОЗУ, но энергонезависимые (сохраняющие содержимое при отключении питания).
Исторически память называлась основная память, основная память, реальная память или внутренняя память. Между тем, энергонезависимые запоминающие устройства используются как вторичная память, внешняя память или вспомогательная / периферийная память.
Первичная память (также известная как основная память, внутренняя память или основная память), часто называемая памятью, является единственной, доступной напрямую для ЦП. ЦП непрерывно считывает хранимые там инструкции и их по мере необходимости. Любые данные, с которыми активно работают, также хранятся там единообразно.
Исторически ранние компьютеры использовали линии задержки, трубки Вильямса или вращающиеся магнитные барабаны в качестве основного хранилища. К 1954 году эти ненадежные методы были в основном заменены памятью на магнитных сердечниках. Базовая память оставалась доминирующей до 1970-х годов, когда достижения в технологиях интегральных схем позволяли полупроводниковой памяти стать экономически конкурентоспособной.
Это произошло к современной оперативной памяти (ОЗУ). Он малогабаритный, легкий, но при этом достаточно дорогой. (Конкретные типы ОЗУ, используемые для первичного запоминающего устройства, также являются энергозависимыми, т.е. они теряют информацию при отключении питания).
Как показано на диаграмме, помимо основного ОЗУ большой емкости, традиционно существует еще два подуровня первичной памяти:
Основная память прямо или косвенно связана с центральным процессором через шину памяти. Фактически это две шины (не на схеме): адресная шина и шина данных . ЦП сначала отправляет число через адресную шину, называемое адресом памяти, указывает желаемое расположение данных. Затем он считывает или записывает данные в ячейки памяти, используя шину данных. Кроме того, блок управления памятью (MMU) представляет собой небольшое устройство между ЦП и ОЗУ, пересчитывающее фактическое устройство памяти, например, для обеспечения абстракции предлагаем или других задач.
Тип ОЗУ, используется для первичного хранилища, являются энергозависимыми (не инициализируются при запуске), компьютер, предоставляется только такое хранилище, не будет иметь источника для чтения инструкций, чтобы запустить компьютер. Следовательно, энергонезависимое хранилище, заложенное небольшую программу запуска (BIOS ), используется для начальной загрузки компьютера, есть для чтения более крупной программы из не -вторичное энергозависимое хранилище в ОЗУ и начать его выполнение. Энергонезависимая технология, используемая для этой цели, ПЗУ для называется постоянной памятью (терминология может несколько сбивать с толку, обычными типами ПЗУ произвольный доступ ).
Многие типы «ПЗУ» буквально не только для чтения, поскольку их обновления возможны; однако он медленный, и перед повторной записью память необходимо стирать большими частями. Некоторые встроенные системы запускают программы непосредственно из ПЗУ (или подобного), потому что такие программы редко меняются. Стандартные компьютеры неэлементарные программы в ПЗУ, а, скорее, используют большую емкость вторичной памяти, которая также является энергонезависимой и не такой дорогой.
В последнее время вторичное хранилище и третичное хранилище в некоторых случаях.
Вторичная память (также известная как внешняя память или вспомогательная память) отличается от первичной памяти тем, что она не доступна напрямую для ЦП. Компьютер использует свои каналы ввода / вывода для доступа к вторичной памяти и передачи необходимых данных в первичной памяти. Вторичное хранилище является энергонезависимым (сохраняет данные при отключении питания). Современные компьютерные системы обычно имеют на два порядка больше вторичного хранилища, чем первичное хранилище дешевле.
В современных компьютерах жесткие диски (HDD) или твердотельные диски (SSD) обычно используются в качестве вторичного хранилища. время доступа на байт для HDD или SSD обычно измеряется в миллисекундах (одна тысячная секунда), в то время как время доступа на байт для первичного хранилища измеряется в наносекундах (одна миллиардная секунда). Таким образом, вторичное хранилище значительно медленнее, чем первичное хранилище. Поворотные оптические запоминающие устройства, такие как CD и DVD приводы, имеют еще большее время доступа. Другие примеры технологий вторичного хранения включают USB-накопители, гибкие диски, магнитную ленту, бумажную ленту, перфокарты. и RAM-диски.
Как только дисковая головка чтения / записи на жестких дисках надлежащего места и данных, последующие данные на дорожке становятся доступными очень быстро. Чтобы уменьшить время поиска и задержку вращения, данные передаются на диски с дисками большими непрерывными блоками. Последовательный или блочный доступ к дискам на порядки быстрее, чем произвольный доступ, и был разработан набор сложных парадигм для разработки эффективных алгоритмов, основанных на последовательном и блочном доступе. Другой способ уменьшить узкое место ввода-вывода - использовать несколько дисков для увеличения пропускной способности между первичной и вторичной памятью.
Вторичное хранилище часто форматируется в соответствии с файловой системой формат, который обеспечивает абстракцию, специальные для организации данных в файлы и каталоги, а также метаданные, описывающий владельца файла, время доступа, разрешение на доступ и другую информацию.
Большинство компьютерных операционных систем используют концепцию виртуальной памяти, что позволяет использовать больше первичной памяти, чем физически доступно в системе. По мере заполнения первичной памяти система перемещает использованные фрагменты (страниц ) в файл подкачки или файл подкачки во вторичной памяти, извлекая их позже, когда необходимо это использовать. Если много перемещается в более медленное вторичное хранилище, цена системы снижается.
Третичное хранилище или вторичная память находится на уровне ниже хранилища. Как правило, он включает в себя роботизированный механизм, который будет устанавливать (вставлять) и демонтировать съемные носители данных в запоминающее устройство в соответствии с требованиями системы; такие данные часто копируются во вторичное хранилище перед использованием. Он в основном используется для архивирования редко используемой информации, чем вторичное хранилище (например, 5–60 секунд против 1–10 миллисекунд). Это в первую очередь полезно для больших хранилищ данных, доступ к которому осуществляется без участия человека. Типичные примеры включают ленточные библиотеки и оптические музыкальные автоматы.
. Когда компьютеру требуется прочитать информацию из третьего хранилища, он сначала обращается к каталогу базе данных, чтобы определить, какая лента или диск содержит информацию. Затем компьютер даст команду роботизированной руки извлечь носитель и поместить его в привод. Когда компьютер закончит считывать информацию, роботизированная рука вернет носитель на свое место в библиотеке.
Третичное хранилище также известно как оперативное хранилище, потому что оно «близко к оперативному». Формальное различие между оперативным, оперативным и автономным хранилищами заключается в следующем:
Например, постоянно работающие вращающиеся жесткие диски являются онлайн-хранилищами, а вращающиеся диски, которые замедляются автоматически, например, в массивных массивы бездействующих дисков (MAID ), являются хранилищем на складе. Съемные носители, такие как ленточные картриджи, которые можно загружать автоматически, как в ленточных библиотеках, представляют собой почти оперативное хранилище, а ленточные картриджи, которые необходимо загружать вручную, являются автономным хранилищем.
Автономное хранилище - это компьютерное хранилище данных на носителе или устройстве, которые не находятся под управлением блока обработки. Носитель записывается, обычно на вторичном или третичном запоминающем устройстве, а затем физически удаляется или отключается. Он должен быть вставлен или подключен оператором, прежде чем компьютер снова сможет получить к нему доступ. В отличие от третичного хранилища, к нему нельзя получить доступ без вмешательства человека.
Автономное хранилище используется для передачи информации, поскольку отсоединенный носитель можно легко физически транспортировать. Кроме того, это полезно в случаях сбоя, когда, например, пожар уничтожает исходные данные, носитель в удаленном месте не пострадает, что позволяет аварийное восстановление. Автономное хранилище повышает общую информационную безопасность, поскольку оно физически недоступно с компьютера, а конфиденциальность или целостность данных не могут быть затронуты компьютерными атаками. Кроме того, если доступ к информации, хранящейся в архивных целях, осуществляется редко, автономное хранение обходится дешевле, чем третичное хранение.
В современных персональных компьютерах большинство вторичных и третичных носителей информации также используются для хранения в автономном режиме. Оптические диски и устройства флэш-памяти являются наиболее популярными, и в гораздо меньшей степени съемными жесткими дисками. На предприятиях преобладает магнитная лента. Более старые примеры - дискеты, Zip-диски или перфокарты.
Технологии хранения на всех уровнях иерархии хранилища можно различать путем оценки определенных основных характеристик, а также измерения характеристик, характерных для конкретной реализации. Эти основные характеристики - изменчивость, изменчивость, доступность и адресуемость. Для любой конкретной реализации любой технологии хранения стоит измерить характеристики - это емкость и производительность.
Энергонезависимая память сохраняет сохраненную информацию даже в том случае, если на нее не постоянно подается электроэнергия. Подходит для длительного хранения информации. Энергозависимая память требует постоянного питания для поддержания сохраненной информации. Самые быстрые технологии памяти - энергозависимые, хотя это не универсальное правило. Поскольку первичное хранилище должно быть очень быстрым, оно в основном использует энергозависимую память.
Динамическая память с произвольным доступом - это форма энергозависимой памяти, которая также требует, чтобы хранимая информация периодически перечитывалась и перезаписывалась или обновлялась, в противном случае она исчезла бы. Статическая память с произвольным доступом представляет собой разновидность энергозависимой памяти, подобной DRAM, за исключением того, что ее никогда не нужно обновлять, пока подается питание; он теряет свое содержание при потере питания.
Источник бесперебойного питания (ИБП) может использоваться для предоставления компьютеру короткого промежутка времени для перемещения информации из основного энергозависимого хранилища в энергонезависимое хранилище до того, как батареи разрядятся. Некоторые системы, например EMC Symmetrix, имеют встроенные батареи, обеспечивающие энергозависимое хранение в течение нескольких минут.
Утилиты, такие как hdparm и sar можно использовать для измерения производительности ввода-вывода в Linux.
Шифрование всего диска, шифрование тома и виртуального диска, и или шифрование файлов / папок доступно для большинства устройств хранения.
Аппаратное шифрование памяти доступно в архитектуре Intel, поддерживая полное шифрование памяти (TME) и гранулярное шифрование памяти с несколькими ключами (MKTME). и в поколении SPARC M7 с октября 2015 года.
По состоянию на 2011 год наиболее часто используемыми носителями данных являются полупроводниковые, магнитные и оптические, а бумажные все еще видит некоторое ограниченное использование. Некоторые другие фундаментальные технологии хранения, такие как all-flash array (AFA), предлагаются для разработки.
Полупроводниковая память использует полупроводниковые -содержащие интегральные схемы (IC) для хранения информации. Данные обычно хранятся в ячейках памяти металл-оксид-полупроводник (MOS) . Микросхема полупроводниковой памяти может содержать миллионы ячеек памяти, состоящих из крошечных полевых МОП-транзисторов (MOSFET) и / или МОП-конденсаторов. Существуют как энергозависимые, так и энергонезависимые формы полупроводниковой памяти: первая использует стандартные полевые МОП-транзисторы, а вторая - полевые МОП-транзисторы с плавающим затвором.
. память (RAM), в частности, динамическая память с произвольным доступом (DRAM). С начала века тип энергонезависимой памяти с плавающим затвором полупроводниковой памяти, известной как флэш-память, постоянно набирает популярность в качестве автономного хранилища для домашних компьютеров. Энергонезависимая полупроводниковая память также используется для вторичного хранения в различных современных электронных устройствах и специализированных компьютерах, которые предназначены для них.
Еще в 2006 году производители ноутбуков и настольных компьютеров начали использовать твердотельные накопители (SSD) на основе флэш-памяти в качестве параметров конфигурации по умолчанию. для вторичного хранилища либо в дополнение к более традиционному жесткому диску, либо вместо него.
Магнитный накопитель использует различные шаблоны намагничивания на магнитном поверхность с покрытием для хранения информации. Магнитное хранилище энергонезависимо. Доступ к информации осуществляется с помощью одной или нескольких головок чтения / записи, которые могут содержать один или несколько преобразователей записи. Головка чтения / записи покрывает только часть поверхности, поэтому головку или носитель, или и то, и другое необходимо перемещать относительно другого для доступа к данным. В современных компьютерах магнитное хранилище принимает следующие формы:
В ранних компьютерах магнитное хранилище также использовалось как:
Оптический накопитель, Типичный оптический диск хранит информацию о деформациях на поверхности круглого диска и считывает эту информацию, освещая поверхность лазерным диодом и наблюдая за отражением. Хранение на оптических дисках энергонезависимо. Деформации могут быть постоянными (носители только для чтения), образованными однократно (носители с однократной записью) или обратимыми (носители с возможностью записи или чтения / записи). В настоящее время широко используются следующие формы:
Устройство хранения на магнитооптических дисках - это хранилище на оптических дисках, в котором магнитное состояние на ферромагнитной поверхности хранит информацию. Информация считывается оптически и записывается путем сочетания магнитных и оптических методов. Магнитооптический диск - это энергонезависимое хранилище с последовательным доступом, медленной записью и быстрым чтением, используемое для третичного и автономного хранилища.
Трехмерное оптическое хранилище данных также было предложено.
Плавление намагниченности, индуцированное светом в магнитных фотопроводниках, также было предложено для высокоскоростной магнитооптической памяти с низким энергопотреблением.
Хранение данных на бумаге, обычно в форма бумажной ленты или перфокарт долгое время использовалась для хранения информации для автоматической обработки, особенно до появления компьютеров общего назначения. Информация записывалась путем пробивания отверстий в бумажном или картонном носителе и считывалась механически (или позже оптически), чтобы определить, было ли конкретное место на носителе твердым или содержало отверстие. Некоторые технологии позволяют людям делать отметки на бумаге, которые легко читаются машиной - они широко используются для подсчета голосов и оценки стандартизированных тестов. Штрих-коды позволяли любому объекту, который должен был быть продан или транспортироваться, иметь некоторую компьютерно-читаемую информацию, надежно прикрепленную к нему.
Пока группа Неисправность битов может быть решена с помощью механизмов обнаружения и исправления ошибок (см. выше), неисправность запоминающего устройства требует других решений. Следующие решения обычно используются и действительны для большинства устройств хранения:
Зеркальное отображение устройств и типичный RAID предназначены для обработки отказа одного устройства в группе устройств RAID. Однако если второй сбой произойдет до того, как группа RAID будет полностью восстановлена после первого сбоя, данные могут быть потеряны. Вероятность единичного отказа обычно мала. Таким образом, вероятность двух сбоев в одной RAID в близком времени намного меньше (квадрат вероятности, то есть умноженный на себя). Если база данных не может выдержать даже такую меньшую вероятность потерь данных, тогда сама группа RAID реплицируется (зеркалируется). Во многих случаях такое зеркальное отображение выполняется географически удаленно, в массиве хранения, чтобы обработать также восстановление после сбоев (см. Аварийное восстановление выше).
Вторичное или третичное хранилище может подключаться к компьютеру, использующему компьютерные сети. Эта концепция не относится к первичному хранилищу, которое в меньшей степени используется используемыми процессорами.
Большие количества отдельных магнитных лент, а также оптических или магнитооптических дисков могут храниться в роботизированных третичных запоминающих устройств. В области хранения на магнитной ленте они известны как ленточные библиотеки, а в области оптического хранения оптические музыкальные автоматы или библиотеки оптических дисков по аналогии. Наименьшие формы любой технологии, состоящей из одного только одно приводного устройства, называются автозагрузчиками или автоматическими переключателями.
устройства хранения с роботизированным доступом иметь несколько слотов, каждый из которых содержит отдельные носители, и обычно они содержат несколько носителей. роботов-захватчиков, которые пересекают слоты и загружают носители во встроенные накопители. Расположение слотов и устройств захвата влияет на производительность. Важными характеристиками хранилища являются возможные варианты расширения: добавление слотов, модулей, накопителей, роботов. Ленточные библиотеки могут иметь от 10 до более чем 100 000 слотов и обеспечивать терабайт или петабайт информации, близкой к линии. Оптические музыкальные автоматы - это несколько меньшие по размеру решения, до 1000 слотов.
Роботизированное хранилище используется для резервное копирование, а также для архивов большой емкости в индустрии обработки изображений, медицине и видео. Иерархическое управление хранилищем - наиболее известная стратегия архивирования, заключающаяся в автоматическом переносе давно неиспользуемых файлов с жесткого диска в библиотеке или музыкальные автоматы. Если файлы необходимы, они загружаются обратно на диск.
На Викискладе есть носители, связанные с памятью компьютера. |
Викискладе есть учебные ресурсы по компьютерному хранилищу данных |
Эта статья включает материалы общедоступного домена из документа General Services Administration : «Федеральный стандарт 1037C».