Сохранение базы данных обычно включает преобразование информации, хранящейся в базе данных, в форму, которая, вероятно, будет доступна в долгосрочной перспективе по мере изменения технологии, без потеря исходных характеристик (контекст, содержание, структура, внешний вид и поведение) данных.
Версия 1.0 формата программного независимого архивирования реляционных баз данных (SIARD) была разработана Швейцарскими федеральными архивами в 2007 году. для архивирования реляционных баз данных в независимой от производителя форме. Архив SIARD - это пакет файлов в формате ZIP, основанный на XML и SQL: 1999. Файл SIARD включает в себя как содержимое базы данных, так и структурные метаданные, обрабатываемые компьютером, которые записывают структуру таблиц базы данных и их взаимосвязи. ZIP-файл содержит XML-файл с описанием структуры базы данных (metadata.xml), а также коллекцию XML-файлов, по одному на таблицу, захватывающих содержимое таблицы. Архив SIARD может также содержать текстовые файлы и двоичные файлы, представляющие большие объекты базы данных (BLOB и CLOB). SIARD обеспечивает прямой доступ к отдельным таблицам с помощью инструментов ZIP. Архив SIARD не является оперативной базой данных, но поддерживает реинтеграцию заархивированной базы данных в другую систему управления реляционными базами данных (RDBMS), которая поддерживает SQL: 1999. Кроме того, SIARD поддерживает добавление описательных и контекстных метаданных, которые не записываются в самой базе данных, и встраивание файлов документации в архив. Версия 1.0 SIARD была омологирована как стандарт eCH-0165 в 2013 году.
Версия 2.0 формата сохранения SIARD была разработана и разработана Швейцарскими федеральными архивами под эгидой проекта E-ARK. Версия 2.0 основана на версии 1.0 и определяет формат, обратно совместимый с версией 1.0. Новые функции в версии 2.0 включают:
Схема XML была создана исследователем Хосе Карлосом Рамальо из Университета Минью для захвата табличной информации и данных из реляционной базы данных. Он был опубликован в 2007 году.
Database Preservation Toolkit (DBPTK) позволяет преобразовывать между форматами базы данных, включая подключение к действующим системам, для целей базы данных с цифровым сохранением. Этот инструментарий позволяет преобразовывать действующие базы данных или базы данных с резервными копиями в форматы сохранения, такие как SIARD, формат на основе XML, созданный с целью сохранения базы данных. Этот инструментарий также позволяет преобразовывать форматы сохранения обратно в действующие системы, чтобы обеспечить полную функциональность баз данных. Например, он поддерживает специализированный экспорт в MySQL, оптимизированный для PhpMyAdmin, поэтому с базой данных можно полностью экспериментировать с использованием веб-интерфейса.
Этот инструментарий изначально был частью проекта RODA, а затем выпущен отдельно. Он получил дальнейшее развитие в проекте E-ARK вместе с новой версией формата сохранения SIARD.
Инструментарий использует модули ввода и вывода. Каждый модуль поддерживает чтение и / или запись в конкретный формат базы данных или действующую систему. Новые модули могут быть легко добавлены путем реализации нового интерфейса и добавления новых драйверов.
Исследовательские проекты в этом отношении включают: