Gellish - это язык онтологий для хранения и передачи данных, разработанный и разработанный Андриесом ван Ренсеном с тех пор. середина 1990-х гг. Он начинался как язык инженерного моделирования («Generic Engineering Language», дав ему название «Gellish»), но превратился в универсальный и расширяемый язык концептуального моделирования данных с общими приложениями. Поскольку он включает в себя специфичную для предметной области терминологию и определения, он также является языком моделирования семантических данных, а методология моделирования Gellish является членом семейства методологий семантического моделирования.
Хотя его концепции имеют «имена» и определения на различных естественных языках, Gellish является естественным независимым формальным языком. Любой вариант естественного языка, такой как Gellish Formal English, является контролируемым естественным языком. Информация и знания могут быть выражены таким образом, что они могут быть интерпретированы компьютером, а также независимы от системы и естественного языка. Каждый вариант естественного языка представляет собой структурированное подмножество этого естественного языка и подходит для информационного моделирования и представления знаний на этом конкретном языке. Все выражения, концепции и отдельные вещи представлены в Gellish с помощью (числовых) уникальных идентификаторов (Gellish UID). Это позволяет программному обеспечению переводить выражения с одного формального естественного языка на любые другие формальные естественные языки.
.
Gellish предназначен для выражения фактов (утверждений), запросов, ответов и т. Д. Например, для полной и однозначной спецификации бизнес-процессов, продуктов, объектов. и физические процессы; для получения информации об их приобретении, изготовлении, установке, эксплуатации и обслуживании; и для обмена такой информацией между системами, хотя и системно-независимым, интерпретируемым компьютером и независимым от языка способом. Он также предназначен для выражения знаний и требований о таких вещах.
Определение Gellish можно вывести из определения Gellish Formal English, рассматривая «выражения» как отношения только между Уникальными идентификаторами. Определение Gellish Formal English дается в Gellish English Dictionary-Taxonomy, который представляет собой большой «интеллектуальный словарь » понятий со связями между этими понятиями (ранее он назывался STEPlib). Словарь-таксономия называется «умным словарем», потому что понятия организованы в иерархию подтипа -супертип, что делает его таксономией, которая поддерживает наследование свойства от понятий супертипа до понятий подтипа. Более того, поскольку вместе с другими отношениями между концептами интеллектуальный словарь расширяется до онтологии. Gellish имеет в основном расширенную структуру объект-отношение-объект для выражения фактов отношениями, тогда как каждый факт может сопровождаться рядом вспомогательных фактов о главном факте. Примерами вспомогательных фактов являются автор, дата, статус и т. Д. Для обеспечения однозначной интерпретации Gellish включает определение большого числа (более 650) стандартных типов отношений, которые определяют возможности богатого семантического выражения языка.
В принципе, для каждого естественного языка существует геллский вариант, специфичный для этого языка. Например, Gellish Dutch (Gellish Nederlands), Gellish Italian, Gellish English, Gellish Russian и т. Д. Gellish не изобретает собственной терминологии, такой как Эсперанто, но используются термины из естественных языков. Таким образом, словарь-таксономия Gellish English подобен (электронному) обычному словарю, который расширен дополнительными понятиями и отношениями между понятиями.
Например, словарь-таксономия Gellish содержит определения многих понятий, которые также встречаются в обычных словарях, таких как виды физических объектов, таких как здание, самолет, автомобиль, насос, труба, такие свойства, как масса и цвет, весы, такие как кг и бар, а также действия и процессы, такие как ремонт, отопление и т. д. В дополнение к этому, словарь содержит понятия с составными названиями, такими как «шпилька-теплообменник», которые не появятся в обычных словарях. Основное отличие от обычных словарей состоит в том, что словарь геллийского языка также включает определения стандартных видов отношений (типов отношений), которые обозначаются стандартными фразами гелльского английского языка. Например, он определяет типы отношений, такие как «является подтипом», «классифицируется как а», «имеет как аспект», «количественно определяется как», «может быть исполнителем а», «должен иметь как часть ⟩ И т. Д. Такие стандартные типы отношений и определения понятий позволяют программному обеспечению на основе Gellish правильно и однозначно интерпретировать выражения Gellish.
Выражения Gellish могут быть выражены в любом подходящем формате, например SQL или RDF или OWL или даже в форме таблицы электронных таблиц, при условии, что их содержимое эквивалентно табличной форме Gellish Naming Tables (которые определяют словарь) и Fact Tables (вместе определяют содержимое Gellish Database) или эквивалентно Gellish Message Tables (для обмена данными). Пример ядра таблицы сообщений:
Левый член | Тип отношения | Правый член |
---|---|---|
центробежный насос | - это подтип | насос |
P-123 | классифицируется как | центробежный насос |
P-123 | имеет аспект | масса P-123 |
масса P-123 | классифицируется как | масса |
масса P-123 | квалифицируется как | 50 кг |
Полная таблица сообщений Gellish требует дополнительных столбцов для уникальных идентификаторов, цели выражения, языка выражения, количества элементов, единицы измерения, контекста действительности, статус, дата создания, автор, ссылки и другие столбцы. Gellish Light требует только трех столбцов, указанных выше, но тогда он не поддерживает, например, возможности различать омонимы ; автоматический перевод; управление версиями и т. д. Эти и некоторые другие возможности поддерживаются Full Gellish. В следующем примере показано использование некоторых дополнительных столбцов в таблице сообщений Gellish, где UoM означает «единица измерения».
Fact UID | Intention | Left UID | Левый член | Relat. UID | Тип отношения | Правый UID | Правый член | UID единицы измерения | Единицы измерения | Статус |
---|---|---|---|---|---|---|---|---|---|---|
201 | инструкция | 130058 | центробежный насос | 1146 | является подтипом | 130206 | насос | принято | ||
202 | заявление | 102 | P-123 | 1225 | классифицируется как | 130058 | центробежный насос | предложенный | ||
203 | заявление | 102 | P-123 | 1727 | имеет аспект | 103 | масса P-123 | предложенная | ||
204 | инструкция | 103 | масса P-123 | 1225 | классифицируется как | 550020 | масса | предложенное | ||
205 | утверждение | 103 | масса P-123 | 5020 | квалифицируется как | 920303 | 50 | 570039 | kg | предложено |
Набор стандартных типов отношений определяет виды фактов, которые могут быть выражены на гелльском языке, хотя каждый может создать свою собственную собственность. ry расширение словаря и, таким образом, может добавлять понятия и типы отношений по мере необходимости.
Поскольку Gellish является формальным языком, любое выражение Gellish может использовать только те концепции, которые определены в Gellish словаре, или определение любого понятия должно быть специальным в коллекции Gellish выражений. Базы знаний могут быть созданы с использованием Gellish языка и его определений понятий в Gellish Dictionary. Примеры применения словаря Gellish - это использование в качестве источника классов для классификации оборудования, документов и т. Д. Или в качестве стандартной терминологии (метаданные ) или для согласования данных в различных компьютерных системах., или в качестве тезауруса или таксономии в поисковой системе .
Gellish обеспечивает автоматический перевод и позволяет использовать синонимы, сокращения и коды, а также омонимы благодаря использованию уникального идентификатора, не зависящего от естественного языка (UID) для каждой концепции. Например, 130206 (насос) и 1225 (классифицируется как а). Это гарантирует, что понятия идентифицируются независимым от естественного языка способом. Поэтому разные словари Gellish используют одни и те же UID для одного и того же понятия. Это означает, что эти словари предоставляют переводы имен объектов, а также перевод стандартных типов отношений. UID позволяют автоматически переводить и представлять информацию и знания, выраженные в одном языковом варианте Gellish, и представлять их с помощью программного обеспечения на Gellish на любом другом языке, для которого доступен словарь Gellish. Например, фраза «классифицируется как a» и фраза «st klassifiziert als »являются обозначениями одного и того же UID 1225.. Например, компьютер может автоматически выразить вторую строку в приведенном выше примере на немецком языке следующим образом:
Левый член | Тип отношения | Правый член |
---|---|---|
P-123 | ist klassifiziert als | Zentrifugalpumpe |
Также могут быть высказаны вопросы (запросы). Запросы упрощаются с помощью стандартных терминов, таких как что, что, где и когда. Их можно использовать в сочетании с зарезервированными UID для неизвестных в диапазоне 1–100. Это позволяет использовать выражения Gellish для таких запросов, как:.
- query: whatParis
Программное обеспечение на основе Gellish должно быть способно предоставить правильный ответ на этот запрос, сравнивая выражение с фактами в базу данных, и должен ответить:
- ответ: Эйфелева башняПариж
Обратите внимание, что возможность автоматического перевода подразумевает, что запрос / вопрос, который выражен на определенном языке, скажем, английский, можно использовать для поиска в базе данных Gellish на другом языке (например, китайском), тогда как ответ может быть представлен на английском языке.
Информационные модели можно разделить на две основные категории:
Все эти категории моделей могут включать чертежи и другие документы, а также информацию о трехмерных формах (ядро трехмерных моделей). Все они могут быть выражены и интегрированы в Gellish.
Классификационное отношение между отдельными вещами и видами вещей делает определения, знания и требования о видах вещей доступными для отдельных вещей. Более того, иерархия подтипа-супертипа в Gellish Dictionary-Taxonomy подразумевает, что знания и требования, которые определены для определенного типа вещей, наследуются всеми их подтипами. Как следствие, когда кто-то проектирует индивидуальный элемент и классифицирует его по определенному типу, тогда все знания и требования, которые известны для супертипов этого типа, также будут распознаны и могут быть доступны автоматически.
Каждая категория информационной модели требует своей собственной семантики, потому что выражение отдельного факта, что что-то реальное имеет место, требует других видов отношений, чем выражение общего факта, что что-то может иметь место, что опять же отличается от факта, который выражает, что что-то должно иметь место в конкретном контексте или что что-то по определению всегда имеет место. Эти семантические различия приводят к тому, что различные категории информационных моделей требуют своих собственных подмножеств стандартных типов отношений. Поэтому Геллиш проводит различие между следующими категориями типов отношений:
Gellish обычно выражается в форме Gellish Data Tables. Существует три категории таблиц данных:
A Gellish Database обычно состоит из одной или нескольких таблиц именования и одной или нескольких таблиц фактов вместе. Таблицы данных и таблицы фактов однозначно эквивалентны таблицам сообщений.
Все столбцы таблицы стандартизированы, так что каждая таблица данных Gellish категории содержит одни и те же стандартные столбцы или подмножество стандартных столбцов. Это обеспечивает стандартные интерфейсы для обмена данными между системами приложений. Содержимое таблиц данных может также включать ограничения и требования (модели данных ), которые определяют тип данных, которые должны и могут быть предоставлены для конкретных приложений. Такие модели требований делают специализированные проекты баз данных излишними. Таблицы Gellish Data могут использоваться как часть центральной базы данных или могут формировать распределенные базы данных, но таблицами также можно обмениваться в файлах обмена данными или в качестве тела Gellish Messages.
Таблица именования связывает термины в языковом и языковом сообществе («речевое сообщество») с уникальным идентификатором. Это позволяет однозначно использовать синонимы, сокращения и коды, а также омонимы на нескольких языках. Следующая таблица является примером таблицы именования:
UID языка | UID языкового сообщества | UID для термина | Обратный индикатор | Термин (имя) | Комментарий |
---|---|---|---|---|---|
910036 | 193263 | 130206 | 0 | насос | Английский инженерный термин для концепции 130206 |
910038 | 193263 | 130206 | 0 | Pumpe | German |
910037 | 193263 | 130206 | 0 | pomp | Голландский |
Обратный индикатор уместен только тогда, когда фразы используются для обозначения типов отношений, потому что каждый стандартный тип отношения обозначается как минимум одной стандартной фразой, а также как минимум одной стандартной обратной фразой. Например, фраза
- AB - B A
Итак, обратный индикатор указывает на отношение вводит, является ли фраза базовой фразой (1) или обратной фразой (2).
Таблица фактов содержит выражения любых фактов, каждый из которых сопровождается рядом вспомогательных фактов, которые предоставляют дополнительную информацию, относящуюся к основным фактам. Примеры вспомогательных фактов: намерение, статус, автор, дата создания и т. Д.
Gellish Fact Table состоит из столбцов для основного факта и ряда столбцов для вспомогательных фактов. Вспомогательные факты позволяют указать такие вещи, как роли, мощности, контексты действительности, единицы измерения, дата последнего изменения, автор, ссылки и т. Д.:. Столбцы для основного факта в таблице фактов:
- UID факта, который выражен в этой строке в таблице. - UID намерения, с которым факт передается или сохраняется (например, как утверждение, запрос и т. Д.). - UID левого объекта. - UID типа отношения. - UID правого объекта. - UID единицы измерения (необязательно). - a строка, которая формирует описание (текстовое определение) левого объекта.
Эти столбцы также появляются в таблице сообщений, как показано ниже.
Полная таблица Gellish Message фактически представляет собой комбинацию таблицы имен и таблицы фактов. Он содержит не только столбцы для выражения фактов, но также столбцы для имен связанных объектов и дополнительные столбцы для выражения вспомогательных фактов. Это позволяет использовать единую таблицу, а также для спецификации и использования синонимов и омонимов, нескольких языков и т. Д. Ядро таблицы сообщений показано в следующей таблице:
Язык | UID левого объекта | Имя левого объекта | UID факта | UID типа отношения | Имя типа отношения | UID правого объекта | Имя правого объекта | Статус |
---|---|---|---|---|---|---|---|---|
Английский | 101 | Эйфелева башня | 201 | 5138 | находится в | 102 | Париж | принят |
Английский | 101 | Эйфелева башня | 202 | 1225 | классифицируется как | 40903 | башня | принято |
английский | 102 | Париж | 203 | 1225 | классифицируется как | 700008 | город | принят |
В приведенном выше примере, концепции с именами, а также (стандартные) типы отношений выбираются с их UID из словаря Gellish English Dictionary.
Таблица Gellish Database может быть реализована в любом табличном формате. Например, он может быть реализован как база данных на основе SQL или иначе, как файл STEP (в соответствии с ISO 10303 -21), или как простая таблица электронной таблицы, как в Excel, например Gellish Dictionary. сам.. Таблицы базы данных Gellish также могут быть описаны в эквивалентной форме с использованием RDF / Notation3 или XML. Представление «Gellish in XML» определено в стандартной XML-схеме. XML-файл с данными в соответствии с этой XML-схемой рекомендуется иметь в качестве расширения файла GML, тогда как GMZ означает «Gellish in XML zipped».
Одно из различий между Gellish и RDF, XML или OWL состоит в том, что Gellish English включает обширный английский словарь понятий, в том числе большой (и расширяемый) набор стандартных типов отношений для создания интерпретируемых компьютером выражений ( в форме, удобной для чтения не ИТ-специалистам). С другой стороны, «языки», такие как RDF, XML и OWL, определяют только несколько основных концепций, что оставляет большую свободу их пользователям определять свои собственные концепции «языка предметной области».. Эта привлекательная свобода имеет тот недостаток, что пользователи «языков», таких как RDF, XML или OWL, по-прежнему не используют общий язык и по-прежнему не могут интегрировать данные, полученные из разных источников. Gellish разработан, чтобы обеспечить реальный общий язык, по крайней мере, в гораздо большей степени, и поэтому обеспечивает гораздо большую стандартизацию и единообразие терминологии и выражений.
OWL (Web Ontology Language / Ontological Web Language) и Gellish оба предназначены для использования в семантической сети. Gellish можно использовать в сочетании с OWL или отдельно. Между двумя языками есть много общего, например, использование уникальных идентификаторов (Gellish UID, OWL URI (Uniform Resource Identifiers )), но также и важные различия. Основные отличия заключаются в следующем:
1. Целевая аудитория и метауровень . OWL - это метаязык, включающий базовую грамматику, но без словаря. OWL предназначен для использования разработчиками компьютерных систем и разработчиками онтологий для создания онтологий. Gellish - это язык, который включает в себя грамматику, а также словарь-таксономию и онтологию. Gellish предназначен для использования разработчиками компьютерных систем, а также конечными пользователями, а также может использоваться разработчиками онтологий, когда они хотят расширить онтологию Gellish или построить свою собственную онтологию предметной области. Gellish не делает различия между метаязыком и языком пользователя; концепции из обоих «миров» объединены на одном языке. Итак, словарь Gellish English содержит понятия, эквивалентные концепциям OWL, но также содержит понятия из обычного английского словаря.
2. Словари и онтологии . OWL можно использовать для явного представления значения терминов в словарях и отношений между этими терминами. Другими словами, его можно использовать для определения таксономий или онтологий. Термины из такого словаря не становятся частью языка OWL. Таким образом, OWL не содержит определений терминов на естественном языке, таких как дорога, автомобиль, болт или длина. Однако его можно использовать для их определения и построения онтологии.. Верхняя часть онтологии Gellish также может использоваться для определения терминов и отношений между ними. Однако многие из таких терминов естественного языка уже определены в самой нижней части словаря-таксономии Gellish. Таким образом, в гелльском языке такие термины, как дорога, машина, болт или длина, являются частью гелльского языка. Следовательно, Gellish English - это разновидность естественного английского языка..
3. Синонимы и многоязычные возможности . Gellish проводит различие между концепциями и различными терминами, которые используются в качестве имен (синонимы, аббревиатуры и переводы) для обозначения этих концепций в разных контекстах и на разных языках. Каждое понятие идентифицируется уникальным идентификатором, который не зависит от естественного языка и может иметь множество различных терминов на разных языках для обозначения концепции. Это обеспечивает автоматический перевод между различными версиями Gellish на естественном языке. В OWL различные термины на разных языках и синонимы в принципе представляют собой разные концепции, которые необходимо объявить одинаковыми с помощью явных отношений эквивалентности (если альтернативы не выражены в терминах свойств аннотации альтернативных меток). С одной стороны, подход OWL проще, но он делает выражения неоднозначными и значительно усложняет интеграцию данных и автоматический перевод.
4. Верхняя онтология . OWL может рассматриваться как верхняя онтология, состоящая из 54 «языковых конструкций» (конструкторов или концептов). Верхняя часть онтологии Gellish в настоящее время состоит из более чем 1500 концептов, из которых около 650 являются стандартными типами отношений. В дополнение к этому Gellish Dictionary-Taxonomy содержит более 40 000 концепций. Это указывает на большое семантическое богатство и возможности выражения Gellish. Кроме того, Gellish содержит определения многих фактов об определенных концепциях, которые выражаются как отношения между этими концепциями.
5. Расширяемость . OWL имеет фиксированный набор концепций (терминов), которые расширяются только при расширении стандарта OWL. Gellish может быть расширен любым пользователем в условиях Open Source.
Gellish - это дальнейшее развитие ISO 10303 -221 (AP221) и ISO 15926. Gellish - это интеграция и расширение концепций, определенных в обоих стандартах. Основное отличие от обоих стандартов ISO заключается в том, что Gellish проще в реализации и имеет более (точные) возможности семантического выражения, а также подходит для выражения запросов и ответов. Особая философия пространственно-временных частей, которая используется в ISO 15926 для представления дискретных периодов времени для представления времени, также может использоваться в Gellish, однако рекомендуемое представление времени в Gellish является более интуитивным методом, который указывает, что факты имеют определенную достоверность. продолжительность. Например, каждое свойство может иметь несколько числовых значений на шкале, которая выражается в виде нескольких фактов, тогда как для каждого из этих фактов может быть добавлена (необязательная) спецификация момента или периода времени, в течение которого этот факт действителен.
Подмножество Gellish Dictionary (Taxonomy) используется для создания ISO 15926 -4. Gellish в RDF стандартизируется как ISO 15926 -11.
| journal =
()