Gellish

редактировать

Gellish - это язык онтологий для хранения и передачи данных, разработанный и разработанный Андриесом ван Ренсеном с тех пор. середина 1990-х гг. Он начинался как язык инженерного моделирования («Generic Engineering Language», дав ему название «Gellish»), но превратился в универсальный и расширяемый язык концептуального моделирования данных с общими приложениями. Поскольку он включает в себя специфичную для предметной области терминологию и определения, он также является языком моделирования семантических данных, а методология моделирования Gellish является членом семейства методологий семантического моделирования.

Хотя его концепции имеют «имена» и определения на различных естественных языках, Gellish является естественным независимым формальным языком. Любой вариант естественного языка, такой как Gellish Formal English, является контролируемым естественным языком. Информация и знания могут быть выражены таким образом, что они могут быть интерпретированы компьютером, а также независимы от системы и естественного языка. Каждый вариант естественного языка представляет собой структурированное подмножество этого естественного языка и подходит для информационного моделирования и представления знаний на этом конкретном языке. Все выражения, концепции и отдельные вещи представлены в Gellish с помощью (числовых) уникальных идентификаторов (Gellish UID). Это позволяет программному обеспечению переводить выражения с одного формального естественного языка на любые другие формальные естественные языки.

.

Содержание
  • 1 Обзор
  • 2 Информационные модели в Gellish
  • 3 Gellish базы данных и сообщения обмена данными
  • 4 Gellish по сравнению с OWL
  • 5 История
  • 6 Ссылки
  • 7 Библиография
  • 8 Внешние ссылки
Обзор

Gellish предназначен для выражения фактов (утверждений), запросов, ответов и т. Д. Например, для полной и однозначной спецификации бизнес-процессов, продуктов, объектов. и физические процессы; для получения информации об их приобретении, изготовлении, установке, эксплуатации и обслуживании; и для обмена такой информацией между системами, хотя и системно-независимым, интерпретируемым компьютером и независимым от языка способом. Он также предназначен для выражения знаний и требований о таких вещах.

Определение Gellish можно вывести из определения Gellish Formal English, рассматривая «выражения» как отношения только между Уникальными идентификаторами. Определение Gellish Formal English дается в Gellish English Dictionary-Taxonomy, который представляет собой большой «интеллектуальный словарь » понятий со связями между этими понятиями (ранее он назывался STEPlib). Словарь-таксономия называется «умным словарем», потому что понятия организованы в иерархию подтипа -супертип, что делает его таксономией, которая поддерживает наследование свойства от понятий супертипа до понятий подтипа. Более того, поскольку вместе с другими отношениями между концептами интеллектуальный словарь расширяется до онтологии. Gellish имеет в основном расширенную структуру объект-отношение-объект для выражения фактов отношениями, тогда как каждый факт может сопровождаться рядом вспомогательных фактов о главном факте. Примерами вспомогательных фактов являются автор, дата, статус и т. Д. Для обеспечения однозначной интерпретации Gellish включает определение большого числа (более 650) стандартных типов отношений, которые определяют возможности богатого семантического выражения языка.

В принципе, для каждого естественного языка существует геллский вариант, специфичный для этого языка. Например, Gellish Dutch (Gellish Nederlands), Gellish Italian, Gellish English, Gellish Russian и т. Д. Gellish не изобретает собственной терминологии, такой как Эсперанто, но используются термины из естественных языков. Таким образом, словарь-таксономия Gellish English подобен (электронному) обычному словарю, который расширен дополнительными понятиями и отношениями между понятиями.

Например, словарь-таксономия Gellish содержит определения многих понятий, которые также встречаются в обычных словарях, таких как виды физических объектов, таких как здание, самолет, автомобиль, насос, труба, такие свойства, как масса и цвет, весы, такие как кг и бар, а также действия и процессы, такие как ремонт, отопление и т. д. В дополнение к этому, словарь содержит понятия с составными названиями, такими как «шпилька-теплообменник», которые не появятся в обычных словарях. Основное отличие от обычных словарей состоит в том, что словарь геллийского языка также включает определения стандартных видов отношений (типов отношений), которые обозначаются стандартными фразами гелльского английского языка. Например, он определяет типы отношений, такие как «является подтипом», «классифицируется как а», «имеет как аспект», «количественно определяется как», «может быть исполнителем а», «должен иметь как часть ⟩ И т. Д. Такие стандартные типы отношений и определения понятий позволяют программному обеспечению на основе Gellish правильно и однозначно интерпретировать выражения Gellish.

Выражения Gellish могут быть выражены в любом подходящем формате, например SQL или RDF или OWL или даже в форме таблицы электронных таблиц, при условии, что их содержимое эквивалентно табличной форме Gellish Naming Tables (которые определяют словарь) и Fact Tables (вместе определяют содержимое Gellish Database) или эквивалентно Gellish Message Tables (для обмена данными). Пример ядра таблицы сообщений:

Левый членТип отношенияПравый член
центробежный насос- это подтипнасос
P-123классифицируется какцентробежный насос
P-123имеет аспектмасса P-123
масса P-123классифицируется какмасса
масса P-123квалифицируется как50 кг

Полная таблица сообщений Gellish требует дополнительных столбцов для уникальных идентификаторов, цели выражения, языка выражения, количества элементов, единицы измерения, контекста действительности, статус, дата создания, автор, ссылки и другие столбцы. Gellish Light требует только трех столбцов, указанных выше, но тогда он не поддерживает, например, возможности различать омонимы ; автоматический перевод; управление версиями и т. д. Эти и некоторые другие возможности поддерживаются Full Gellish. В следующем примере показано использование некоторых дополнительных столбцов в таблице сообщений Gellish, где UoM означает «единица измерения».

Fact UIDIntentionLeft UIDЛевый членRelat. UIDТип отношенияПравый UIDПравый членUID единицы измеренияЕдиницы измеренияСтатус
201инструкция130058центробежный насос1146является подтипом130206насоспринято
202заявление102P-1231225классифицируется как130058центробежный насоспредложенный
203заявление102P-1231727имеет аспект103масса P-123предложенная
204инструкция103масса P-1231225классифицируется как550020массапредложенное
205утверждение103масса P-1235020квалифицируется как92030350570039kgпредложено

Набор стандартных типов отношений определяет виды фактов, которые могут быть выражены на гелльском языке, хотя каждый может создать свою собственную собственность. ry расширение словаря и, таким образом, может добавлять понятия и типы отношений по мере необходимости.

Поскольку Gellish является формальным языком, любое выражение Gellish может использовать только те концепции, которые определены в Gellish словаре, или определение любого понятия должно быть специальным в коллекции Gellish выражений. Базы знаний могут быть созданы с использованием Gellish языка и его определений понятий в Gellish Dictionary. Примеры применения словаря Gellish - это использование в качестве источника классов для классификации оборудования, документов и т. Д. Или в качестве стандартной терминологии (метаданные ) или для согласования данных в различных компьютерных системах., или в качестве тезауруса или таксономии в поисковой системе .

Gellish обеспечивает автоматический перевод и позволяет использовать синонимы, сокращения и коды, а также омонимы благодаря использованию уникального идентификатора, не зависящего от естественного языка (UID) для каждой концепции. Например, 130206 (насос) и 1225 (классифицируется как а). Это гарантирует, что понятия идентифицируются независимым от естественного языка способом. Поэтому разные словари Gellish используют одни и те же UID для одного и того же понятия. Это означает, что эти словари предоставляют переводы имен объектов, а также перевод стандартных типов отношений. UID позволяют автоматически переводить и представлять информацию и знания, выраженные в одном языковом варианте Gellish, и представлять их с помощью программного обеспечения на Gellish на любом другом языке, для которого доступен словарь Gellish. Например, фраза «классифицируется как a» и фраза «st klassifiziert als »являются обозначениями одного и того же UID 1225.. Например, компьютер может автоматически выразить вторую строку в приведенном выше примере на немецком языке следующим образом:

Левый членТип отношенияПравый член
P-123ist klassifiziert alsZentrifugalpumpe

Также могут быть высказаны вопросы (запросы). Запросы упрощаются с помощью стандартных терминов, таких как что, что, где и когда. Их можно использовать в сочетании с зарезервированными UID для неизвестных в диапазоне 1–100. Это позволяет использовать выражения Gellish для таких запросов, как:.

- query: what Paris

Программное обеспечение на основе Gellish должно быть способно предоставить правильный ответ на этот запрос, сравнивая выражение с фактами в базу данных, и должен ответить:

- ответ: Эйфелева башня Париж

Обратите внимание, что возможность автоматического перевода подразумевает, что запрос / вопрос, который выражен на определенном языке, скажем, английский, можно использовать для поиска в базе данных Gellish на другом языке (например, китайском), тогда как ответ может быть представлен на английском языке.

Информационные модели в Gellish

Информационные модели можно разделить на две основные категории:

  • Модели об отдельных вещах. Эти модели могут касаться отдельных физических объектов, а также действий, процессов и событий или их комбинации. Информационная модель об отдельном физическом объекте и, возможно, также о его эксплуатации и обслуживании, таком как технологический завод, корабль, самолет, объект инфраструктуры или типовая конструкция (например, автомобиля или компонента), называется Информационная модель объекта или Модель продукта, тогда как для здания это называется Информационная модель здания (BIM). Эти модели об отдельных предметах характеризуются иерархией их состава, которая определяет (все) их части, и тем фактом, что сборки, а также части классифицируются по видам или типам вещей.
  • Модели о видах вещей. Эти модели выражаются как совокупность отношений определенного вида между видами вещей. Их можно подразделить на следующие подкатегории:
- Модели знаний, которые представляют собой наборы выражений фактов о том, что может иметь место (смоделированные знания).
- Модели требований, которые представляют собой коллекции выражений фактов о том, что должно иметь место в конкретном контексте действительности (смоделированные требования). Это может включать смоделированные версии содержания документов требований, такие как стандартные спецификации и стандартные типы компонентов (например, в каталогах компонентов и оборудования)
- Модели определения, каждая из которых состоит из семантики рамка. Модель определения - это набор выражений о том, что по определению является случаем для всех вещей в своем роде. Электронный интеллектуальный словарь-таксономия или онтология Gellish является примером набора моделей определений.
- Модели, которые представляют собой коллекции, которые включают комбинацию выражений вышеуказанных типов.

Все эти категории моделей могут включать чертежи и другие документы, а также информацию о трехмерных формах (ядро трехмерных моделей). Все они могут быть выражены и интегрированы в Gellish.

Классификационное отношение между отдельными вещами и видами вещей делает определения, знания и требования о видах вещей доступными для отдельных вещей. Более того, иерархия подтипа-супертипа в Gellish Dictionary-Taxonomy подразумевает, что знания и требования, которые определены для определенного типа вещей, наследуются всеми их подтипами. Как следствие, когда кто-то проектирует индивидуальный элемент и классифицирует его по определенному типу, тогда все знания и требования, которые известны для супертипов этого типа, также будут распознаны и могут быть доступны автоматически.

Каждая категория информационной модели требует своей собственной семантики, потому что выражение отдельного факта, что что-то реальное имеет место, требует других видов отношений, чем выражение общего факта, что что-то может иметь место, что опять же отличается от факта, который выражает, что что-то должно иметь место в конкретном контексте или что что-то по определению всегда имеет место. Эти семантические различия приводят к тому, что различные категории информационных моделей требуют своих собственных подмножеств стандартных типов отношений. Поэтому Геллиш проводит различие между следующими категориями типов отношений:

  • Типы отношений для отношений между видами вещей (классами). Они предназначены для выражения знаний, требований и определений. Различные подкатегории знаний, требований и определений моделируются с помощью различных видов отношений: типов отношений для вещей, которые могут иметь место, вещей, которые должны иметь место, и вещей, которые по определению имеют место. Все три в пределах применимых ограничений мощности. Например, отношение специализации в первой строке в приведенном выше примере используется для определения концепции (центробежный насос). Типы отношений и являются примерами видов отношений, которые используются для определения знаний и требований соответственно.
  • Типы отношений для отношений между отдельными объектами. Они предназначены для выражения информации об отдельных вещах. Например, наличие аспектного отношения в третьей из приведенных выше строк.
  • Типы отношений для отношений между отдельными вещами и видами вещей. Они предназначены для связи между отдельными вещами и общими понятиями в словаре (или с частными расширениями этого словаря). Например, приведенные выше классификационные и квалификационные отношения.
  • Типы отношений для отношений между коллекциями и для отношений между коллекцией и элементом в коллекции или общий аспект всех элементов.
Gellish базы данных и сообщения обмена данными

Gellish обычно выражается в форме Gellish Data Tables. Существует три категории таблиц данных:

  • Таблицы именования, которые содержат словарь словаря и собственные термины, которые используются в выражениях.
  • Таблицы фактов, которые содержат выражения фактов в форме взаимосвязей между UID вместе с рядом вспомогательных фактов.

A Gellish Database обычно состоит из одной или нескольких таблиц именования и одной или нескольких таблиц фактов вместе. Таблицы данных и таблицы фактов однозначно эквивалентны таблицам сообщений.

  • Таблицы сообщений, которые объединяют содержимое таблиц именования и таблиц фактов в объединенные таблицы. Таблицы сообщений предназначены для обмена данными между системами и сторонами. Таблица сообщений - это единая стандартная таблица для выражения любых фактов, включая уникальные идентификаторы (UID 'для фактов), типы отношений и связанные объекты, но также включая их имена (термины) и ряд вспомогательных фактов, все объединено в одну таблицу. Несколько таблиц сообщений в разных местах могут быть объединены в одну распределенную базу данных.

Все столбцы таблицы стандартизированы, так что каждая таблица данных Gellish категории содержит одни и те же стандартные столбцы или подмножество стандартных столбцов. Это обеспечивает стандартные интерфейсы для обмена данными между системами приложений. Содержимое таблиц данных может также включать ограничения и требования (модели данных ), которые определяют тип данных, которые должны и могут быть предоставлены для конкретных приложений. Такие модели требований делают специализированные проекты баз данных излишними. Таблицы Gellish Data могут использоваться как часть центральной базы данных или могут формировать распределенные базы данных, но таблицами также можно обмениваться в файлах обмена данными или в качестве тела Gellish Messages.

Таблица именования связывает термины в языковом и языковом сообществе («речевое сообщество») с уникальным идентификатором. Это позволяет однозначно использовать синонимы, сокращения и коды, а также омонимы на нескольких языках. Следующая таблица является примером таблицы именования:

UID языкаUID языкового сообществаUID для терминаОбратный индикаторТермин (имя)Комментарий
9100361932631302060насосАнглийский инженерный термин для концепции 130206
9100381932631302060PumpeGerman
9100371932631302060pompГолландский

Обратный индикатор уместен только тогда, когда фразы используются для обозначения типов отношений, потому что каждый стандартный тип отношения обозначается как минимум одной стандартной фразой, а также как минимум одной стандартной обратной фразой. Например, фраза имеет обратную фразу . Обе фразы обозначают один и тот же вид отношения (композиционное отношение). Однако, когда обратная фраза используется для выражения факта, тогда левый и правый объекты в выражении должны иметь обратное положение. Таким образом, следующие выражения будут распознаны как два равнозначных выражения одного и того же факта (с одним и тем же UID факта):

- A B - B A

Итак, обратный индикатор указывает на отношение вводит, является ли фраза базовой фразой (1) или обратной фразой (2).

Таблица фактов содержит выражения любых фактов, каждый из которых сопровождается рядом вспомогательных фактов, которые предоставляют дополнительную информацию, относящуюся к основным фактам. Примеры вспомогательных фактов: намерение, статус, автор, дата создания и т. Д.

Gellish Fact Table состоит из столбцов для основного факта и ряда столбцов для вспомогательных фактов. Вспомогательные факты позволяют указать такие вещи, как роли, мощности, контексты действительности, единицы измерения, дата последнего изменения, автор, ссылки и т. Д.:. Столбцы для основного факта в таблице фактов:

- UID факта, который выражен в этой строке в таблице. - UID намерения, с которым факт передается или сохраняется (например, как утверждение, запрос и т. Д.). - UID левого объекта. - UID типа отношения. - UID правого объекта. - UID единицы измерения (необязательно). - a строка, которая формирует описание (текстовое определение) левого объекта.

Эти столбцы также появляются в таблице сообщений, как показано ниже.

Полная таблица Gellish Message фактически представляет собой комбинацию таблицы имен и таблицы фактов. Он содержит не только столбцы для выражения фактов, но также столбцы для имен связанных объектов и дополнительные столбцы для выражения вспомогательных фактов. Это позволяет использовать единую таблицу, а также для спецификации и использования синонимов и омонимов, нескольких языков и т. Д. Ядро таблицы сообщений показано в следующей таблице:

ЯзыкUID левого объектаИмя левого объектаUID фактаUID типа отношенияИмя типа отношенияUID правого объектаИмя правого объектаСтатус
Английский101Эйфелева башня2015138находится в102Парижпринят
Английский101Эйфелева башня2021225классифицируется как40903башняпринято
английский102Париж2031225классифицируется как700008городпринят

В приведенном выше примере, концепции с именами, а также (стандартные) типы отношений выбираются с их UID из словаря Gellish English Dictionary.

Таблица Gellish Database может быть реализована в любом табличном формате. Например, он может быть реализован как база данных на основе SQL или иначе, как файл STEP (в соответствии с ISO 10303 -21), или как простая таблица электронной таблицы, как в Excel, например Gellish Dictionary. сам.. Таблицы базы данных Gellish также могут быть описаны в эквивалентной форме с использованием RDF / Notation3 или XML. Представление «Gellish in XML» определено в стандартной XML-схеме. XML-файл с данными в соответствии с этой XML-схемой рекомендуется иметь в качестве расширения файла GML, тогда как GMZ означает «Gellish in XML zipped».

Одно из различий между Gellish и RDF, XML или OWL состоит в том, что Gellish English включает обширный английский словарь понятий, в том числе большой (и расширяемый) набор стандартных типов отношений для создания интерпретируемых компьютером выражений ( в форме, удобной для чтения не ИТ-специалистам). С другой стороны, «языки», такие как RDF, XML и OWL, определяют только несколько основных концепций, что оставляет большую свободу их пользователям определять свои собственные концепции «языка предметной области».. Эта привлекательная свобода имеет тот недостаток, что пользователи «языков», таких как RDF, XML или OWL, по-прежнему не используют общий язык и по-прежнему не могут интегрировать данные, полученные из разных источников. Gellish разработан, чтобы обеспечить реальный общий язык, по крайней мере, в гораздо большей степени, и поэтому обеспечивает гораздо большую стандартизацию и единообразие терминологии и выражений.

Gellish по сравнению с OWL

OWL (Web Ontology Language / Ontological Web Language) и Gellish оба предназначены для использования в семантической сети. Gellish можно использовать в сочетании с OWL или отдельно. Между двумя языками есть много общего, например, использование уникальных идентификаторов (Gellish UID, OWL URI (Uniform Resource Identifiers )), но также и важные различия. Основные отличия заключаются в следующем:

1. Целевая аудитория и метауровень . OWL - это метаязык, включающий базовую грамматику, но без словаря. OWL предназначен для использования разработчиками компьютерных систем и разработчиками онтологий для создания онтологий. Gellish - это язык, который включает в себя грамматику, а также словарь-таксономию и онтологию. Gellish предназначен для использования разработчиками компьютерных систем, а также конечными пользователями, а также может использоваться разработчиками онтологий, когда они хотят расширить онтологию Gellish или построить свою собственную онтологию предметной области. Gellish не делает различия между метаязыком и языком пользователя; концепции из обоих «миров» объединены на одном языке. Итак, словарь Gellish English содержит понятия, эквивалентные концепциям OWL, но также содержит понятия из обычного английского словаря.

2. Словари и онтологии . OWL можно использовать для явного представления значения терминов в словарях и отношений между этими терминами. Другими словами, его можно использовать для определения таксономий или онтологий. Термины из такого словаря не становятся частью языка OWL. Таким образом, OWL не содержит определений терминов на естественном языке, таких как дорога, автомобиль, болт или длина. Однако его можно использовать для их определения и построения онтологии.. Верхняя часть онтологии Gellish также может использоваться для определения терминов и отношений между ними. Однако многие из таких терминов естественного языка уже определены в самой нижней части словаря-таксономии Gellish. Таким образом, в гелльском языке такие термины, как дорога, машина, болт или длина, являются частью гелльского языка. Следовательно, Gellish English - это разновидность естественного английского языка..

3. Синонимы и многоязычные возможности . Gellish проводит различие между концепциями и различными терминами, которые используются в качестве имен (синонимы, аббревиатуры и переводы) для обозначения этих концепций в разных контекстах и ​​на разных языках. Каждое понятие идентифицируется уникальным идентификатором, который не зависит от естественного языка и может иметь множество различных терминов на разных языках для обозначения концепции. Это обеспечивает автоматический перевод между различными версиями Gellish на естественном языке. В OWL различные термины на разных языках и синонимы в принципе представляют собой разные концепции, которые необходимо объявить одинаковыми с помощью явных отношений эквивалентности (если альтернативы не выражены в терминах свойств аннотации альтернативных меток). С одной стороны, подход OWL проще, но он делает выражения неоднозначными и значительно усложняет интеграцию данных и автоматический перевод.

4. Верхняя онтология . OWL может рассматриваться как верхняя онтология, состоящая из 54 «языковых конструкций» (конструкторов или концептов). Верхняя часть онтологии Gellish в настоящее время состоит из более чем 1500 концептов, из которых около 650 являются стандартными типами отношений. В дополнение к этому Gellish Dictionary-Taxonomy содержит более 40 000 концепций. Это указывает на большое семантическое богатство и возможности выражения Gellish. Кроме того, Gellish содержит определения многих фактов об определенных концепциях, которые выражаются как отношения между этими концепциями.

5. Расширяемость . OWL имеет фиксированный набор концепций (терминов), которые расширяются только при расширении стандарта OWL. Gellish может быть расширен любым пользователем в условиях Open Source.

История

Gellish - это дальнейшее развитие ISO 10303 -221 (AP221) и ISO 15926. Gellish - это интеграция и расширение концепций, определенных в обоих стандартах. Основное отличие от обоих стандартов ISO заключается в том, что Gellish проще в реализации и имеет более (точные) возможности семантического выражения, а также подходит для выражения запросов и ответов. Особая философия пространственно-временных частей, которая используется в ISO 15926 для представления дискретных периодов времени для представления времени, также может использоваться в Gellish, однако рекомендуемое представление времени в Gellish является более интуитивным методом, который указывает, что факты имеют определенную достоверность. продолжительность. Например, каждое свойство может иметь несколько числовых значений на шкале, которая выражается в виде нескольких фактов, тогда как для каждого из этих фактов может быть добавлена ​​(необязательная) спецификация момента или периода времени, в течение которого этот факт действителен.

Подмножество Gellish Dictionary (Taxonomy) используется для создания ISO 15926 -4. Gellish в RDF стандартизируется как ISO 15926 -11.

Ссылки
Библиография
Внешние ссылки
Последняя правка сделана 2021-05-21 14:05:29
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте