A модель данных (или модель данных ) - это абстрактная модель, которая организует элементы данных и стандартизирует их взаимосвязь друг с другом и со свойствами реального мира. сущности. Например, модель данных может указывать, что элемент данных, представляющий автомобиль, представляет собой набор других элементов, которые, в свою очередь, включают цвет и размер автомобиля и определяют его владельца.
Термин модель данных может относиться к двум, различным существующим понятиям. Иногда это относится к абстрактной формализации объектов и отношений, обнаруженных в конкретной области приложения: например, клиентов, продуктов и заказов, найденных в производственной организации. В других случаях это относится к набору концепций, используемых при определении таких формализаций: например, таких понятий, как сущности, атрибуты, отношения или таблицы. Таким образом, "модель данных" банковского приложения может быть определена с использованием "модели данных" сущность-связь. В этой статье термин используется в обоих смыслах.
Обзор контекста моделирования данных: модель данных на основе данных, взаимосвязи данных, семантике данных и ограничении данных. Модель данных обеспечивает детали информации, приводным способом является создание компьютерного программного кода для приложения или подготовка функциональная спецификация для помощи компьютерному программному обеспечению при принятии решения о покупке или изготовлении. На рисунке показан пример взаимодействия между процессом и моделями данных.Модель данных явно определяет данные. Модели данных обычно задаются специалистом по данным, библиотекарем данных или специалистом по цифровым гуманитарным наукам в нотации моделирования данных. Эти обозначения часто представлены в графической форме.
Модель данных иногда может упоминаться как структура данных, особенно в контексте языков программирования. Модели данных часто дополняются функциональными моделями, особенно в контексте моделей предприятия.
Управление большими объемами структурированных и неструктурированных является основной функцией информационных систем. Модели данных описывают структуру, манипуляции и аспекты функционирования данных, хранящихся в системах управления данными, как реляционные базы данных. Обычно они не описывают неструктурированные данные, такие как текстовые документы, сообщения электронной почты, изображения, цифровое аудио и видео.
Основная цель моделей данных - поддержка информационных систем путем предоставления и определения формата данных. Согласно Уэсту и Фаулеру (1999), «если это делается в разных системах, можно достичь совместимости данных. Используются одни и те же структуры данных для хранения данных и доступа к ним. Результаты этого указаны выше.. Однако создание, эксплуатация и обслуживание систем и интерфейса часто обходятся дороже, чем они должны. Они могут ограничивать бизнес, а также его поддерживать. Основная роль моделей причина заключается в низком уровне данных, реализованных в системах и интерфейсах. ".
Причиной этих проблем является отсутствие стандартов, которые обеспечивают соответствие моделей, соответствующих потребностям бизнеса и согласованным.
Модель данных явно соответствует потребностям бизнеса и согласованным. Типичные применения включают модели баз данных, проектирование информационных систем и обеспечение обмена данными. Обычно модели задаются на языке моделирования данных. [3]
Экземпляр модели данных может быть из одного типа согласно ANSI в 1975 году:
Значение этого подхода, согласно ANSI, заключается в том, что он позволяет трем перспективе быть относительно независимыми друг от друга. Технология хранения может измениться, не рассматривая ни логическую, ни концептуальную модель. Структура таблицы / столбца может изменяться без (обязательно) влияния на концептуальную модель. В каждом случае, конечно, структуры должны оставаться совместимыми с другой моделью. Структура таблицы / столбца может отличаться от прямого преобразования классов сущностей и атрибутов, но в итоге она должна соответствовать целям классов структуры структуры сущностей. На ранних этапах многих проектов разработки программного обеспечения особое внимание уделяется разработке концептуальной модели данных. Такой дизайн можно детализировать в логической модели данных. На более поздних этапах эта модель может быть переведена в физическую модель данных. Однако также возможно реализовать концептуальную модель напрямую.
Одна из первых новаторских работ по моделированию информационных систем была сделана Янгом и Кентом (1958), которые выступали за «точный и абстрактный способ определения информационных и временных характеристик проблема обработки данных ". Они создали« нотацию, которая должна создать аналитику организовать проблему вокруг любой части оборудования ». Их работа была первой попыткой создать абстрактную спецификацию и инвариантную основу для разработки различных альтернативных реализаций с использованием различных аппаратных компонентов. Следующий шаг в моделировании ИБ был сделан CODASYL, консорциумом ИТ-индустрии, основанным в 1959 году, который, по сути, стремился к тому же, что и Янг и Кент: разработка « надлежащей структуры для машинно-независимого языка определения проблем., на системном уровне обработки данных »это привело к развитию информационных алгоритмов IS .
. ие данных приобрело большее значение путем создания информационной системы управления (MIS). Согласно Леондесу (2002), «в это время информационная система предоставления данных и информации для целей управления. Система баз данных первого поколения, называемая интегрированная хранилищем данных (IDS), резерв Чарльзом Бахманом в General Electric. В этот период времени были предложены две известные модели баз данных, сетевая модель данных и иерархическая модель данных ". К концу 1960-х годов Эдгар Ф. Кодд разработал свои теории организации данных и применяемую реляционную модель для управления базами данных, основ на логике предикатов первого порядка.
В 1970-х годах моделирование отношений сущностей возникло как новый тип концептуального модели данных, предложенный в 1976 году Питером Ченом. Модели отношений используются на первом этапе моделирования информационных систем во время анализа требований для описания информационных потребностей или типа информация, которая должна быть сохранена в базе данных. Этот метод может описывать любую онтологию, то есть обзор и классификацию концепций и их взаимосвязь для определенной области интересов.
В 1970-е годы GM Нейссен разработал метод «Метод анализа информации на естественном языке» (NIAM), который в 1980-х годах сотрудничество с Терри Халпином разработал в объектно-ролевое моделирование (ORM). Однако именно докторская диссертация Терри Халпина в 1989 году создала формальную основу, на которой основывается объектно-ролевое моделирование.
Билл Кент в своей книге 1978 года «Данные и реальность» сравнил модель данных на территории, подчеркнув, что в реальном мире «шоссе не окрашены в красный цвет, у рек нет линий графства. посередине, и вы не видите линий линий на горе ». В отличие от других исследователей, которые создают математически чистые и элегантные модели, необходимо указать особую беспорядок в реальном мире и создать инструмент моделирования создать порядок из хаоса, не искаженная истину.
В 1980-х годах, согласно Яну Л. Харрингтону (2000), «развитие объектно-ориентированной парадигмы привело к фундаментальным изменениям в нашем взгляде на данные и процедуры. которые работают с данными. Традиционно данные и процедуры хранились отдельно: данные и их взаимосвязь в базе данных, процедуры в прикладной программе. Однако ориентация на объекты объединила сущность с ее данными. "
Модель базы данных - это спецификация, описывающая структура и использование базы данных.
Было предложено несколько таких моделей. К общим моделям класса:
Концептуально-ориентированная модель
Диаграмма структуры данных (DSD) - это диаграмма и модель данных, используемая для описания концептуальных моделей данных с помощью графического представления. нотации, которые документируют объекты и их отношения, а также ограничения , которые их связывают. Основными графическими элементами DSD являются поля , представляющие сущность, стрелки, представляющие отношения. Диаграммы структуры данных наиболее полезны для документирования сложных объектов данных.
Диаграммы структуры данных обладают расширением модели сущность-связь (модель ER). В DSD атрибуты указываются внутри блоков сущностей, а не вне их, в то время как отношения изображаются в виде блоков, составленных из атрибутов, которые определяют ограничения, связывающие сущности вместе. DSD отличается от модели ER, когда модель ER фокусируется на отношениях между различными объектами, тогда как DSD фокусируется на отношениях между элементами внутри объекта и позволяет пользователям полностью видеть связи и отношения между каждым объектом.
Существует несколько стилей для представления диаграмм структуры данных, с заметной разницей в способе определения мощности. Возможен выбор между наконечниками стрелок, перевернутыми наконечниками стрелок (гусиные лапки ) или числовым представлением мощности.
Пример IDEF1X диаграмм отношений сущностей, используемых для моделирования самого IDEF1XМодель отношений сущностей (ERM), иногда называемая сущностью- диаграмма отношений (ERD), может Введение для представления абстрактной концептуальной модели данных (или семантической модели данных или физических моделей данных), используемой в разработке программного обеспечения для представления структурированные данные. Для ERM используется несколько обозначений. Как и в DSD, атрибуты указываются внутри блоков сущностей, а не вне их, в то время как отношения изображаются в виде линий, а ограниченияей - в виде описаний в строке. Модель E-R, хотя и является надежной, может стать визуально громоздкой при представлении сущностей с использованием атрибутами.
Существует несколько стилей для представлений структуры данных с заметным различием в способе определения количества элементов. Возможен выбор между наконечниками стрелок, перевернутыми наконечниками стрелок (гусиные лапки) или числовым представлением мощности.
Модель данных в Географических информационных систем - это математическая конструкция для представления географических объектов или поверхностей в виде данных. Например,
Группы относятся к процессу создания карты
Приложения моделей данных NGMDB
Связанные вместе базы данных NGMDB
Представление информации о трехмерных картах
Общие модели данных являются обобщением обычных моделей данных. Они определяют стандартизированные общие типы отношений вместе с видами вещей, которые могут быть связаны с помощью такого типа отношения. Общие модели данных разрабатываются как подход к устранению некоторых недостатков традиционных моделей данных. Например, разные разработчики моделей обычно создают разные традиционные модели данных одной и той же области. Это может затруднить объединение моделей разных людей и препятствовать обмену данными и интеграции данных. Однако неизменно эта разница объясняется разными уровнями абстракции в моделях и различиями в типах фактов, которые могут быть инстанцированы (возможности семантического выражения моделей). Разработчикам моделей необходимо сообщить и согласовать определенные элементы, которые должны быть представлены более конкретно, чтобы различия были менее значительными.
Семантическая модель данных в программной инженерии - это метод определения значения данных в контексте их взаимосвязей с другими данными. Семантическая модель данных - это абстракция, которая определяет, как хранимые символы относятся к реальному миру. Семантическую модель данных иногда называют концептуальной моделью данных.
Логическая структура данных системы управления базами данных (СУБД), будь то иерархическая, сеть или реляционный, не может полностью удовлетворить требованиям к концептуальному определению данных, потому что оно ограничено по объему и смещено в сторону стратегии реализации, используемой СУБД. Следовательно, необходимость определения данных из концептуального представления привела к развитию методов семантического моделирования данных. То есть методы определения значения данных в контексте их взаимосвязей с другими данными. Как показано на рисунке. Реальный мир с точки зрения ресурсов, идей, событий и т. Д. Символически определяется в физических хранилищах данных. Семантическая модель данных - это абстракция, которая определяет, как хранимые символы относятся к реальному миру. Таким образом, модель должна быть истинным представлением реального мира.
Архитектура данных - это дизайн данных для использования при определении целевого состояния и последующее планирование необходимо для достижения целевого состояния. Обычно это один из нескольких архитектурных доменов, которые составляют основу архитектуры предприятия или архитектуры решения.
Архитектура данных описывает структуры данных, используемые бизнесом и / или его приложения. Есть описания данных в хранилище и данных в движении;описания хранилищ данных, групп данных и элементов данных; и сопоставления этих артефактов данных с качествами данных, приложениями, местоположениями и т. д.
Важная для реализации целевого состояния, архитектура данных, как данные обрабатываются, хранятся и используются в данной системе. Он соответствует требованиям для обработки данных, которые позволяют проектировать потоки данных, а также управлять потоком данных в системе.
Моделирование данных в разработке программного обеспечения - это процесс создания моделей данных путем применения формальных описаний модели данных с использованием методов моделирования данных. Моделирование данных - это метод определения бизнес- требований к базе данных. Иногда это называют моделированием базы данных, потому что модель данных в конечном итоге реализуется в базе данных.
На рисунке показано, как модели представлены и используются сегодня. концептуальная модель данных разрабатывается на основе данных требований для разрабатываемого приложения, возможно, в контексте модели деятельности. Модель обычно состоит из типов сущностей, атрибутов, отношений, правил целостности и определений этих объектов. Затем используется как начальная точка для интерфейса или дизайна базы данных.
Некоторые важные свойства данных, для которых необходимо выполнить требования:
Другой вид модели данных, как организовать данные с помощью системы управления базами данных или другие технологии управления данными. Он присутствует, например, реляционные таблицы и столбцы или объектно-ориентированные классы и атрибуты. Такую модель данных иногда называют физической моделью данных, но в исходной трехсхемной архитектуре ANSI она называется «логической». В этой индустрии физическая модель представители данных (цилиндры, дорожки и табличные пространства). В идеале эта модель является производной от более концептуальной модели данных, описанной выше. Однако он может отличаться, чтобы учесть ограничения, такие как обработка и шаблоны использования.
Хотя анализ данных является общим термином для моделирования данных, на самом деле эта деятельность имеет больше общего с идеями и методами синтез (общих понятий из конкретных примеров), чем с анализ (выделение концепций компонентов из более общих). {Предположительно мы называем себя системными аналитиками, потому что что не может сказать системные синтезаторы.} Моделирование данных стремится объединить интересующие структуры данных в единое, неразрывное целое за счет исключения ненужных данных избыточности и связывая структуры данных с отношениями.
Другой подход заключается в использовании <таких>адаптивных систем, как искусственные нейронные сети, которые могут автономно создавать неявные модели данных.
Структура данных - это способ хранения данных на компьютере, чтобы его можно было эффективно использовать. Это организация математических и логических концепций данных. Часто тщательно подобранная структура данных позволяет использовать наиболее эффективный алгоритм. Выбор структуры данных часто начинается с выбора абстрактного типа данных.
Модель измененных данных в пределах данного домена, косвенно, основную структуру этого домена. Это означает, что модель данных на самом деле определяет специальную грамматику для выделенного искусственного языка для этой области. Модель данных представляет классы сущностей (виды вещей), информацию о которых хочет хранить, атрибуты информации, отношения между этими сущностями и (неявные) отношения между этими атрибутами. Модель до некоторой категории представленных данных независимо от того, как данные представлены в компьютерной системе.
Сущности, представленные модели данных, могут быть материальными сущностями, но модели, которые включают такие классы сущностей, тенденцию меняться со временем. Надежные модели данных часто идентифицируют абстракции таких сущностей. Например, модель данных может быть в себя класс сущности под названием «Человек», представляющий всех людей, которые взаимодействуют с организацией. Такой класс абстрактной сущности обычно более уместен, чем классы под названием «Поставщик» или «Сотрудник», которые определяют роли, которые играют эти люди.
Термин модель данных может иметь два значения:
Теория моделей состоит из основных трех компонентов:
Например, в реляционной модели структурная часть основ на модифицированной концепции математическое отношение ; часть целостности выражается в логике первого порядка, часть манипуляции с помощью реляционной алгебры, кортежного исчисления и доменного исчисления.
Экземпляр модели данных создается путем применения теории модели данных. Обычно это делается для решения некоторых бизнес-требований. Бизнес-требования обычно фиксируются семантической логической моделью данных. Он преобразуется в экземпляр физической модели данных, из которого создается физическая база данных. Например, разработчик моделей данных может использовать инструмент моделирования данных для создания модели отношений сущностей корпоративного репозитория данных некоторого коммерческого предприятия. Эта модель преобразуется в реляционную модель, которая, в свою очередь, генерирует реляционную базу данных.
Шаблоны - это общие структуры моделирования данных, которые встречаются во многих моделях данных.
Диаграмма потока данных (DFD) - это графическое представление «потока» данных через информационная система. Она отличается от блок-схем , поскольку показывает поток данных вместо потока управления программы. Диаграмма литератора также известная языковая группа визу из обработки (структурированный дизайн). Диаграммы потоков данных были изобретены Ларри Константином, первоначальным разработчиком структурированного дизайна на основе моделей вычислений Мартина и Эстрина «граф потока».
Обычно сначала рисуется диаграмма потоковых данных на уровне контекста, которая показывает взаимодействие между системой и внешними объектами. DFD предназначен для демонстрации того, как система делится на более мелкие части, и для выделения данных между этими частями. Эта диаграмма потоковых данных на уровне контекста затем «разобранна», чтобы показать более подробную информацию о моделируемой системе
Информационная модель - это не тип модели данных, а более или менее альтернативная модель. В области разработки программного обеспечения и информационных систем могут быть абстрактными, формальными представлениями, типами которых являются их свойства, отношения и операции, которые могут быть представлены. Типы сущностей в модели могут быть реальными объектами, такими как устройства в сети, или сами могут быть абстрактными, например, для сущностей, используемых в биллинговой системе. Обычно они используются для обозначенной области, которая может быть описана замкнутым набором типов сущностей, отношений и операций.
Согласно Ли (1999) информационная модель - это представление концепций, отношений, ограничений, правил и операций для определения семантики данных для выбранной области дискурс. Он может обеспечить общую, стабильную и организованную информационные требования для контекста предметной области. В более общем смысле термин информационная модель используется для отдельных объектов, здания, технологические объекты и т. Д. В этой концепции специализирована на Информационная модель объекта, Информационная модель здания., Информационная модель предприятия и др. Такая информационная модель представляет собой интеграцию модели объекта с данными и документами об объекте.
Информационная модель обеспечивает формализм описания проблемной области без ограничения того, как это описание отображается на фактическом уровне в программном секторе. Отображений информационных моделей может быть много. Такие сопоставления называются моделями данных независимо от того, являются ли они объектами моделями (например, с использованием UML ), моделями отношений сущностей или XML- схемами.
. Объектная модель документа, стандартная объектная модель для представления HTML или XMLОбъектная модель в информатике - это набор объектов или классы, с помощью определенных программ исследовать и некоторых конкретных частями своего мира. Другими словами, объектно-ориентированный интерфейс к некоторой системе или системе. Такой интерфейс называется объектной моделью представляемой услуги или системы. Например, объектная модель документа (DOM) [1] - это набор объектов, представляющих страницу в веб-браузере, используется программами сценария для проверки и динамического изменения страницы. Существует объектная модель Microsoft Excel для управления Microsoft Excel из других программ, драйвер телескопа ASCOM представляет собой объектную модель для управления астрономическим телескопом.
В вычислениях термин объектная модель имеет особое второе значение общих свойств объектов на конкретном компьютере языке программирования, технологии, нотацию или методологию, которая их использует. Например, объектная модель Java, объектная модель COM или объектная модель OMT. Такие объектные модели обычно определяются с использованием таких понятий, как класс, сообщение, наследование, полиморфизм и инкапсуляция.. Существует обширная литература по формализованным объектным моделям как подмножеству формальной семантики языков программирования.
Объектно-ролевое моделирование (ORM) - это метод концептуального моделирования, который может использоваться как инструмент для анализа информации и правил.
Объект -Ролевое моделирование - это метод, ориентированный на факты для выполнения системного анализа на концептуальном уровне. Качество приложения базы данных критически зависит от его дизайна. Чтобы обеспечить точность, ясность, адаптируемость и продуктивность, информационные системы лучше всего определять сначала на концептуальном уровне, используя концепции и язык, которые люди могут легко понять.
Концептуальный проект может включать данные, процессы и поведенческие аспекты, а фактическая СУБД, используемая для реализации проекта, может быть основана на одной из многих логических моделей данных (реляционной, иерархической, сетевой, объектно-ориентированной и т. Д.).
Унифицированный язык моделирования (UML) - это стандартизованный язык моделирования общего назначения в области разработки программного обеспечения. Это графический язык для визуализации, определения, построения и документирования артефактов программно-интенсивной системы. Унифицированный язык моделирования предлагает стандартный способ написания чертежей системы, включая:
UML предлагает сочетание функциональных моделей, моделей данных и моделей баз данных.