Сохранение данных - это действие и поддержание как целостности данных. Сохранение осуществляется посредством формальных действий, которые регулируются политиками, правилами и стратегиями, направленными на защиту и продление существования и подлинности данных и их метаданных. Данные можно описать как элементы или единицы, в которых создаются знания и информация, а метаданные - это обобщающие подмножества элементов данных; или данные о данных. Основная цель сохранения данных - защитить данные от потери или уничтожения и способствовать их повторному использованию и развитию.
Большая часть исторических данных, собранных с течением времени, потеряна или уничтожена. Причиной этого стали войны и стихийные бедствия в сочетании с отсутствием материалов и необходимых методов для сохранения и защиты данных. Обычно сохранялись только самые важные наборы данных, такие как правительственные отчеты и статистика, юридические контракты и экономические операции. Данные научных исследований и докторских диссертаций в основном были уничтожены из-за неправильного хранения и недостаточной осведомленности о сохранении данных и их выполнения. Со временем сохранение данных развивалось и приобрело важность и осведомленность. Теперь у нас есть много разных способов сохранения данных, и в этом участвует множество различных важных организаций.
Первые решения для хранения цифровых данных появились в 1950-х годах, которые обычно были плоскими или иерархически структурированными. Хотя с этими решениями все еще были проблемы, они сделали хранение данных намного дешевле и более доступным. В 1970-х годах появились реляционные базы данных, а также электронные таблицы. Реляционные базы данных структурируют данные в таблицы с использованием языков структурированных запросов, что сделало их более эффективными, чем предыдущие решения для хранения, а электронные таблицы содержат большие объемы числовых данных, которые могут быть применены к этим реляционным базам данных для создания производных данных. Совсем недавно нереляционные (неструктурированный язык запросов ) базы данных появились как дополнения к реляционным базам данных, которые содержат большие объемы неструктурированных или полуструктурированных данных.
Сфера сохранения данных огромна. Все, от правительственных и деловых записей до произведений искусства, по сути, может быть представлено в виде данных и может быть потеряно. Затем это приводит к потере человеческой истории на вечность.
Данные могут быть потеряны в небольшом или независимом масштабе, будь то потеря личных данных или потеря данных внутри предприятий и организаций, а также в более крупном, национальном или глобальном масштабе, что может негативно и потенциально навсегда повлиять на такие вещи. защита окружающей среды, медицинские исследования, национальная безопасность, общественное здоровье и безопасность, экономическое развитие и культура. Механизмы потери данных столь же разнообразны, как и катастрофы, войны, утечки данных, халатность, вплоть до простого забывания до естественного разрушения.
Способы использования коллекций данных при правильном сохранении и хранении можно увидеть в США. Геологическая служба, в которой хранятся коллекции данных о природных опасностях, природных ресурсах и ландшафтах. Данные, собранные в рамках Обзора, используются федеральными и государственными агентствами по управлению земельными ресурсами для планирования и управления землепользованием, и им постоянно требуется доступ к историческим справочным данным.
В отличие от хранилищ данных представляют собой коллекции собранных данных, которые хранятся неформально и не подлежат долгосрочному хранению. Например, сбор или резервное копирование личных файлов. Хранение данных - это обычно методы хранения, которые использовались в прошлом, когда данные были потеряны из-за экологических и других исторических катастроф.
Кроме того, хранение данных отличается от сохранения данных в том смысле, что по определению, чтобы сохранить объект (данные), означает удерживать или сохранять владение или использование объекта. Сохранить объект - значит защитить, поддерживать и поддерживать для будущего использования. Политики хранения часто повторяются, когда данные также следует целенаправленно удалять и держать из общего доступа, в то время как сохранение сосредоточено на постоянстве и более широком совместном доступе.
Таким образом, сохранение данных превышает концепцию наличия или владения данными или резервными копиями данных. Сохранение данных обеспечивает постоянный доступ к данным за счет планирования стратегий резервного копирования и восстановления, предшествующих событию бедствия или технологического изменения.
Цифровое сохранение - это аналогичен сохранению данных, но в основном касается технологических угроз и исключительно цифровых данных. По сути, цифровые данные - это набор формальных действий, обеспечивающих постоянное или постоянное использование и доступ к цифровым данным, превышающее вероятность технологических сбоев или изменений. Сохранение цифровых данных осознает неизбежные изменения в технологиях и протоколах, и для подготовки данных необходимо, чтобы они были доступны для новых типов технологий и платформ, сохраняя при этом целостность данных и метаданных.
Технология, в то время как обеспечение отличного процесса сохранения данных, который, возможно, был невозможен в прошлом, также меняется с такой быстрой скоростью, что цифровые данные могут быть больше не доступны из-за несовместимости формата с новым программным обеспечением. Без использования сохранения данных большая часть наших существующих цифровых данных находится под угрозой.
Большинство методов, используемых сегодня для сохранения данных, являются цифровыми методами, которые пока являются наиболее эффективными из существующих.
Архивы - это собрание исторических документов и записей. Архивы способствуют сохранению данных и работают над их сохранением, собирая данные, которые хорошо организованы, и при этом предоставляют соответствующие метаданные для их подтверждения.
Примером важного архива данных является The LONI Image Data Archive, который является архивом который собирает данные о клинических испытаниях и клинических исследованиях.
Каталоги, каталоги и порталы - это консолидированные ресурсы, которые хранятся отдельными учреждениями и связаны с архивами данных и холдинги. Другими словами, данные не представлены на сайте, но вместо этого могут действовать как метаданные и агрегаторы, а также могут управлять тщательной инвентаризацией.
Репозитории - это места, где могут храниться архивы и хранилища данных. быть доступным и храниться. Цель репозиториев - убедиться, что все требования и протоколы архивов и хранилищ выполняются, а данные проходят сертификацию для обеспечения целостности данных и доверия пользователей.
Репозитории на одном сайте
Репозиторий, в котором хранятся все данные устанавливается на одном сайте.
Пример крупного односайтового репозитория - Data Archiving and Networking Services, который представляет собой репозиторий, который обеспечивает постоянный доступ к цифровым исследовательским ресурсам для Нидерландов.
Многосайтовые репозитории.
Репозиторий, в котором хранятся наборы данных на нескольких институциональных сайтах.
Примером хорошо известного многосайтового репозитория является OpenAIRE, который представляет собой репозиторий, в котором хранятся данные исследований и публикации, сотрудничающие со всеми странами ЕС и др.. OpenAIRE продвигает открытую стипендию и стремится улучшить возможности обнаружения и повторного использования данных.
Надежный цифровой репозиторий
Репозиторий, который стремится обеспечить надежный, доверенный доступ в течение длительного периода времени. Репозиторий может быть одно- или многосайтовым, но он должен взаимодействовать с эталонной моделью для открытой архивной информационной системы, а также придерживаться набора правил или атрибутов, которые способствуют его доверию, таких как постоянная финансовая ответственность, организационная жизнеспособность, административная ответственность, безопасность и безопасность.
Примером надежного цифрового репозитория является Digital Repository of Ireland (DRI), который представляет собой многосайтовый репозиторий, в котором хранятся наборы данных по гуманитарным и социальным наукам Ирландии.
Кибер-инфраструктуры, состоящие из архивных коллекций, которые доступны через систему оборудования, технологий, программного обеспечения, политик, услуг и инструментов. Кибер-инфраструктуры предназначены для обмена данными, поддерживающими одноранговое сотрудничество и культурное сообщество.
Примером крупной кибер-инфраструктуры является Канадская инфраструктура гео-пространственных данных, которая обеспечивает доступ к пространственным данным в Канада.
| journal =
()| journal =
()