Система баз данных объединения

редактировать

A Система баз данных объединения является типом мета- система управления базами данных (СУБД), которая прозрачно отображает несколько автономных систем баз данных в единую объединенную базу данных . Составляющие базы данных связаны между собой через компьютерную сеть и могут быть географически децентрализованы. Поскольку составляющие системы баз данных остаются автономными, система федеративных баз данных является контрастной альтернативой (иногда сложной) задаче слияния нескольких разрозненных баз данных. База данных объединения, или виртуальная база данных, представляет собой составную часть всех составляющих баз данных в системе баз данных объединения. Фактическая интеграция данных в составляющих разрозненных базах данных отсутствует в результате объединения данных.

Посредством абстракции данных системы баз данных объединения могут предоставлять единый пользовательский интерфейс, позволяя пользователям и клиентам хранить и получить данные из нескольких несмежных баз данных с помощью одного запроса - даже если составляющие базы данных разнородны. С этой целью система федеративных баз данных должна иметь возможность разложить запрос на подзапросы для отправки в соответствующие составляющие СУБД, после чего система должна составить наборы результатов подзапросов. Поскольку в разных системах управления базами данных используются разные языки запросов, системы федеративных баз данных могут применять оболочки к подзапросам, чтобы переводить их на соответствующие языки запросов.

Содержание
  • 1 Определение
  • 2 Архитектура FDBS
    • 2.1 Распределение
      • 2.1.1 Неоднородность
      • 2.1.2 Сопоставление схемы, отображение схемы
    • 2.2 Автономность
    • 2.3 Управление параллелизмом
  • 3 Пятиуровневая архитектура схемы для FDBS
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
Определение

МакЛеод и Хаймбигнер были одними из первых, кто определил систему федеративных баз данных в середине 1980-х.

FDBS - это та, которая «определяет [ые] архитектуру и соединяет [ые] базы данных, которые минимизируют центральную власть, но поддерживают частичное совместное использование и координацию между системами баз данных». Это описание может неточно отражать определение федеративной базы данных, данное Маклеодом / Хаймбигнером. Скорее, это описание соответствует тому, что Маклеод / Хаймбигнер назвал составной базой данных. Федеративная база данных Маклеода / Хаймбигнера представляет собой набор автономных компонентов, которые делают свои данные доступными для других членов федерации посредством публикации схемы экспорта и операций доступа; не существует единой центральной схемы, охватывающей информацию, доступную от членов федерации.

Среди других опросов специалисты-практики определяют Федеративную базу данных как совокупность взаимодействующих компонентных систем, которые являются автономными и, возможно, разнородными.

Тремя важными компонентами FDBS являются автономность, неоднородность и раздача. Еще одним аспектом, который также был рассмотрен, является сетевая среда Компьютерная сеть, например, многие DBS по LAN или многие DBS по WAN обновляют связанные функции участия DBS (например, отсутствие обновлений, неатомарные переходы, атомарные обновления ).

Архитектура FDBS

A СУБД может быть классифицирована как централизованная или распределенная. Централизованная система управляет одной базой данных, а распределенная - несколькими базами данных. Компонент DBS в СУБД может быть централизованным или распределенным. Множественные DBS (MDBS) можно разделить на два типа в зависимости от автономности компонентной DBS как федеративные и нефедеративные. Система нефедеративных баз данных представляет собой интеграцию компонентов СУБД, которые не являются автономными. Система объединенной базы данных состоит из компонентов DBS, которые являются автономными, но участвуют в объединении, чтобы обеспечить частичное и контролируемое совместное использование своих данных.

Объединенные архитектуры различаются в зависимости от уровней интеграции с системами компонентных баз данных и объема услуг, предлагаемых федерацией. FDBS можно разделить на системы со слабой или сильной связью.

  • Для слабосвязанных баз данных компонентов требуется создание собственной объединенной схемы . Обычно пользователь получает доступ к другим системам компонентных баз данных, используя язык с несколькими базами данных, но это удаляет любые уровни прозрачности местоположения, вынуждая пользователя иметь непосредственное знание объединенной схемы. Пользователь импортирует требуемые данные из других компонентных баз данных и интегрирует их со своими собственными для формирования объединенной схемы.
  • Тесно связанная система состоит из компонентных систем, которые используют независимые процессы для создания и публикации интегрированной объединенной схемы.

Множественные DBS, из которых FDBS являются определенным типом, можно охарактеризовать по трем параметрам: распределение, неоднородность и автономность. Другая характеристика может быть основана на измерении сети, например, отдельные базы данных или несколько баз данных в LAN или WAN.

Distribution

Распределение данных в FDBS необходимо. к существованию нескольких DBS до построения FDBS. Данные могут быть распределены между несколькими базами данных, которые могут храниться на одном компьютере или на нескольких компьютерах. Эти компьютеры могут быть географически расположены в разных местах, но связаны между собой сетью. Преимущества распределения данных помогают повысить доступность и надежность, а также сократить время доступа.

Неоднородность

Неоднородность в базах данных возникает из-за таких факторов, как различия в структурах, семантике данных, поддерживаемых ограничениях или языке запросов. Различия в структуре возникают, когда две модели данных предоставляют разные примитивы, такие как объектно-ориентированные (ОО) модели, которые поддерживают специализацию и наследование, и реляционные модели, которые этого не делают. Различия из-за ограничений возникают, когда две модели поддерживают два разных ограничения. Например, тип набора в схеме CODASYL может быть частично смоделирован как ограничение ссылочной целостности в схеме взаимосвязи. CODASYL поддерживает вставку и сохранение, которые не фиксируются только ссылочной целостностью. Язык запросов, поддерживаемый одной СУБД, также может способствовать гетерогенности между другими компонентами СУБД. Например, различия в языках запросов с одинаковыми моделями данных или разными версиями языков запросов могут способствовать неоднородности.

Семантические неоднородности возникают, когда существует разногласие по поводу значения, интерпретации или предполагаемого использования данные. На уровне схемы и данных классификация возможных неоднородностей включает:

  • конфликты имен, например базы данных, использующие разные имена для представления одной и той же концепции.
  • Конфликты доменов или конфликты представления данных, например базы данных, использующие разные значения для представления одной и той же концепции.
  • Конфликты точности, например базы данных, использующие одинаковые значения данных из доменов разной мощности для одних и тех же данных.
  • конфликты метаданных, например одинаковые концепции представлены на уровне схемы и уровне экземпляра.
  • Данные конфликты, например отсутствуют атрибуты
  • Схема конфликтует, например. Конфликт таблиц и таблиц, который включает конфликты имен, конфликты данных и т. д.

При создании объединенной схемы необходимо устранить такие неоднородности перед интеграцией компонентных схем БД.

Сопоставление схемы, отображение схемы

Работа с несовместимыми типами данных или синтаксисом запроса - не единственное препятствие для конкретной реализации FDBS. В системах, которые не планируются сверху вниз, общая проблема заключается в сопоставлении семантически эквивалентных, но с разными именами частей из разных схем (= моделей данных) (таблиц, атрибутов). Попарное сопоставление между n атрибутами приведет к n (n - 1) 2 {\ displaystyle n (n-1) \ over 2}{n (n-1) \ over 2} правила сопоставления (с учетом сопоставлений эквивалентности) - число, которое быстро становится слишком большим для практических целей. Обычный выход - предоставить глобальную схему, которая включает в себя соответствующие части всех схем элементов и обеспечивает сопоставления в форме представлений базы данных. Два основных подхода зависят от направления отображения:

  1. Global as View (GaV): глобальная схема определяется в терминах базовых схем
  2. Local as View (LaV): определяются локальные схемы с точки зрения глобальной схемы

Оба являются примерами интеграции данных, называемой проблемой сопоставления схемы.

Автономия

Принципиальным отличием MDBS от FDBS является концепция автономности. Важно понимать аспекты автономии компонентных баз данных и то, как они могут быть решены, когда компонентная DBS участвует в FDBS. Рассматриваются четыре вида автономий:

  • Автономность проектирования, которая относится к способности выбирать свой дизайн независимо от данных, языка запросов или концептуализации, функциональности реализации системы.

Неоднородности в FDBS в первую очередь связаны с автономность дизайна.

  • Под автономностью связи понимается общая операция СУБД, связанная с другими СУБД или нет.
  • Автономность выполнения позволяет компонентной СУБД контролировать операции, запрашиваемые локальными и внешними операциями.
  • Автономия ассоциации дает возможность компоненту DBS отключиться от федерации, что означает, что FDBS может работать независимо от любого отдельного DBS.

Исследовательская группа ANSI / X3 / SPARC представила трехуровневое описание данных архитектура, компонентами которой являются концептуальная схема, внутренняя схема и внешняя схема баз данных. Однако трехуровневая архитектура неадекватна для описания архитектур FDBS. Поэтому он был расширен для поддержки трех измерений FDBS, а именно: Распределение, Автономия и Гетерогенность. Ниже описывается пятиуровневая архитектура схемы.

Управление параллелизмом

Требования гетерогенности и автономности создают особые проблемы, касающиеся управления параллелизмом в FDBS, что имеет решающее значение для правильного выполнения параллельных транзакций (см. Также Глобальный контроль параллелизма ). Достижение глобальной сериализуемости, основного критерия корректности, в соответствии с этими требованиями было охарактеризовано как очень сложное и нерешенное. Упорядочивание обязательств, введенное в 1991 году, предоставило общее решение этой проблемы (см. Глобальная сериализуемость ; см. Заказ на обязательство также для архитектурных аспектов решения).

Пятиуровневая архитектура схемы для FDBS

Пятиуровневая архитектура схемы включает в себя следующее:

  • Локальная схема - это в основном концептуальная модель базы данных компонентов, выраженная в собственной модели данных.
  • Схема компонентов - это подмножество локальной схемы, которой организация-владелец желает поделиться с другими пользователями FDBS, и она переведена в общую модель данных.
  • Схема экспорта представляет собой подмножество схема компонентов, доступная определенной федерации. Он может включать информацию об управлении доступом, касающуюся его использования конкретным пользователем федерации. Схема экспорта помогает в управлении потоком управления данными.
  • Схема объединения - это интеграция нескольких схем экспорта. Он включает информацию о распределении данных, которая создается при интеграции схем экспорта.
  • Внешняя схема извлекается из объединенной схемы и определяется для пользователей / приложений конкретной федерации.

При точном представлении состояния В области интеграции данных вышеупомянутая пятиуровневая архитектура схемы действительно страдает серьезным недостатком, а именно внешним видом, навязанным ИТ. Современные пользователи данных требуют контроля над представлением данных; их потребности несколько противоречат подобным восходящим подходам к интеграции данных.

См. Также
Ссылки
  1. ^ "Маклеод и Хаймбигнер (1985). «Федеративная архитектура для управления информацией». Транзакции ACM по информационным системам, том 3, выпуск 3. С. 253–278.
  2. ^ "Шет и Ларсон (1990). «Объединенные системы баз данных для управления распределенными, гетерогенными и автономными базами данных». ACM Computing Surveys, Vol. 22, №3. стр. 183–236.
  3. ^ Масуд, Найер; Иглстоун, Барри (декабрь 2003 г.). «Концептуальные модели компонентов и федерации в системе федеративных баз данных» (PDF). Малазийский журнал компьютерных наук. 16 (2): 47–57. Архивировано из оригинального (PDF) от 07.03.2016. Проверено 3 марта 2016 г.
Внешние ссылки
Последняя правка сделана 2021-05-20 12:48:11
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте