Подход приблизительного набора на основе доминирования (DRSA ) расширение теории приблизительных множеств для многокритериального анализа решений (MCDA), представленное Греко, Матараццо и Словински. Основным изменением по сравнению с классическими грубыми наборами является замена отношения неразличимости отношением доминирования, что позволяет иметь дело с несоответствиями, типичными для рассмотрения критериев и предпочтения. -упорядоченные классы решений .
Содержание
- 1 Многокритериальная классификация (сортировка)
- 2 Представление данных
- 2.1 Таблица решений
- 2.2 Отношение выигрыша
- 2.3 Классы решений и объединения классов
- 3 Основные концепции
- 3.1 Доминирование
- 3.2 Грубые приближения
- 3.3 Качество приближения и редукции
- 4 Правила принятия решений
- 5 Пример
- 6 Расширения
- 6.1 Многокритериальный выбор и задачи ранжирования
- 6.2 Переменная -согласованность DRSA
- 6.3 Стохастический DRSA
- 7 Программное обеспечение
- 8 См. также
- 9 Ссылки
- 10 Внешние ссылки
Многокритериальная классификация (сортировка)
Многокритериальная классификация () - одна из проблем, рассматриваемых в MCDA, и ее можно сформулировать следующим образом: при заданном наборе объектов оценивается связанных набором (атрибутов с доменами порядка предпочтений), назначьте эти объекты некоторым предопределенным и упорядоченным по предпочтениям классам решений, так что каждый объект будет назначен ровно одному классу. За счет упорядочения предпочтений улучшение оценок объекта по критериям не должно ухудшать присвоение ему класса. Проблема сортировки очень похожа на проблему классификации, однако в последнем случае объекты оцениваются с помощью обычных атрибутов, а классы решений не обязательно упорядочены по предпочтениям. Проблема многокритериальной классификации также упоминается и часто возникает в реальных приложениях, когда свойства порядковый и монотонный вытекают из знания предметной области о проблеме.
В качестве наглядного примера рассмотрим задачу оценивания в средней школе. Директор школы хочет распределить учащихся (предметы) по трем классам: плохой, средний и хороший (обратите внимание, что хороший класс предпочтительнее среднего, а средний предпочтительнее плохого). Каждый учащийся описывается по трем критериям: уровень физики, математики и литературы, каждый из которых принимает одно из трех возможных значений: плохой, средний и хороший. Критерии упорядочены по предпочтениям, и повышение уровня по одному из предметов не должно приводить к ухудшению общей оценки (класса).
В качестве более серьезного примера рассмотрим классификацию клиентов банка с точки зрения риска банкротства на классы безопасных и рискованных. Это может включать такие характеристики, как «рентабельность капитала (ROE)», «рентабельность инвестиций (ROI)» и «рентабельность продаж (ROS)».. Домены этих атрибутов не просто упорядочены, но включают порядок предпочтений, поскольку с точки зрения менеджеров банка, более высокие значения ROE, ROI или ROS лучше для клиентов, анализируемых на предмет риска банкротства. Таким образом, эти атрибуты являются критериями. Пренебрежение этой информацией в knowledge discovery может привести к неверным выводам.
Представление данных
Таблица решений
В DRSA данные часто представляются с использованием определенной формы таблицы решений. Формально таблица решений DRSA представляет собой кортеж из 4 элементов , где - конечный набор объектов, - конечный набор критерии, где - это область определения критерия и - это информационная функция, такая что для каждого . Набор разделен на критерии условия (набор ) и критерий решения (класс) . Обратите внимание, что - это оценка объекта по критерию , а - присвоение класса (значение решения) объекта. Пример таблицы решений показан в таблице 1 ниже.
Отношение выигрыша
Предполагается, что область критерия полностью предварительно упорядочена на ; означает, что по крайней мере так же хорошо, как (превосходит) по критерию . Без ограничения общности, мы предполагаем, что область является подмножеством реалов, , и что соотношение выигрышей представляет собой простой порядок между действительными числами такое, что выполняется следующее соотношение: . Это соотношение является прямым для критерия типа усиления («чем больше, тем лучше»), например прибыль компании. Для критерия типа затрат («чем меньше, тем лучше»), например цена продукта, это соотношение может быть удовлетворено путем отрицания значений из .
Классы решений и объединения классов
Пусть . Область критерия решения, состоит из элементы (без ограничения общности мы предполагаем ) и индуцирует разделение в классы , где . Каждому объекту присвоен один и только один класс . Классы упорядочены по предпочтениям в соответствии с возрастающим порядком индексов классов, т.е. для всех таких, что , объекты из строго предпочтительнее объекты из . По этой причине мы можем рассматривать восходящие и нисходящие объединения классов, определяемые соответственно как:
Основные понятия
Доминирование
Мы говорим, что доминирует относительно , обозначается , если лучше, чем по каждому критерию из , . Для каждого отношение доминирования равно рефлексивный и транзитивный, то есть это частичный предварительный заказ. Для и , пусть
представляют P -доминирующий набор и P-доминирующий набор по отношению к соответственно.
Грубые приближения
Ключевая идея философии приблизительного набора - это приближение одного знания другим знанием. В DRSA аппроксимируемые знания представляют собой совокупность восходящих и нисходящих объединений классов решений, а «гранулы знания», используемые для аппроксимации, являются P-доминирующими и P-доминирующими множествами.
P-нижнее и P-верхнее приближение из в отношении , обозначается как и соответственно определяются как:
Аналогично, P-нижний и P-верхнее приближение относительно , обозначается как и соответственно определяются как:
Нижние приближения группируют объекты, которые определенно принадлежат классу объединение (соответственно ). Эта уверенность исходит из того факта, что объект принадлежит к нижнему приближению (соответственно ), если никакой другой объект в не противоречит этому утверждению, т.е. каждый объект , который P-доминирует , также принадлежит к объединению классов (соответственно ). Верхнее приближение группирует объекты, которые могут принадлежать (соответственно ), поскольку объект принадлежит к верхнему приближению (соответственно ), если существует другой объект с преобладанием P из объединения классов (соответственно ).
Аппроксимации P-нижний и P-верхний, определенные как выше, удовлетворяют следующим свойствам для всех и для любого :
P-границы (P-сомнительные области) и определяются как:
Качество приближения и понижает
Отношение
определяет качество приближения раздела в классы с помощью набора критериев . Это соотношение выражает отношение между всеми P-правильно классифицированными объектами и всеми объектами в таблице.
Каждое минимальное подмножество такое, что называется reduct из и обозначается . Таблица решений может иметь более одного сокращения. Пересечение всех редуктов называется ядром.
Правила принятия решений
На основе приближений, полученных с помощью отношений доминирования, можно вызвать обобщенное описание предпочтительной информации, содержащейся в таблице решений, в терминах правила принятия решений. Правила принятия решения - это выражения формы if [условие], затем [следствие], которые представляют форму зависимости между критериями условия и критериями решения. В процедурах генерации правил принятия решений из таблицы решений используется принцип индуктивного обучения. Можно выделить три типа правил: определенные, возможные и приблизительные. Некоторые правила генерируются из более низких приближений объединений классов; возможные правила генерируются из верхних приближений объединений классов, а приближенные правила генерируются из граничных областей.
Некоторые правила имеют следующую форму:
если и и , затем
, если и и тогда
Возможные правила имеют аналогичный синтаксис, однако последующая часть правила имеет вид: может принадлежать или форме : может принадлежать .
Наконец, приблизительные правила имеют синтаксис:
если и и и и и тогда
Определенные, возможные и приблизительные правила представляют собой определенные, возможные и неоднозначные знания, извлеченные из таблицы решений.
Каждое правило принятия решения должно быть минимальным. Поскольку решающее правило - это импликация, под минимальным решающим правилом мы понимаем такой импликации, что нет другого импликации с антецедентом, по крайней мере, такой же слабости (другими словами, правило, использующее подмножество элементарных условий или / и более слабых элементарных условия) и следствие, по крайней мере, такой же силы (другими словами, правило, относящее объекты к одному и тому же объединению или подсоюзу классов).
Набор правил принятия решений считается полным, если он может охватывать все объекты из таблицы решений таким образом, что согласованные объекты переклассифицируются в их исходные классы, а несогласованные объекты классифицируются в кластеры классов, ссылающихся на к этому несоответствию. Мы называем минимальным каждый набор правил принятия решений полным и неизбыточным, т.е. исключение любого правила из этого набора делает его неполным. Для получения набора решающих правил может быть принята одна из трех стратегий индукции:
- генерация минимального описания, т. Е. Минимального набора правил,
- генерация исчерпывающего описания, т. Е. Всех правил для данного матрица данных,
- генерация описания характеристики, т. е. набора правил, охватывающих относительно много объектов каждый, но все вместе не обязательно все объекты из таблицы решений
Самый популярный алгоритм индукции правил для доминирования - Основанный на приблизительном наборе подход - DOMLEM, который генерирует минимальный набор правил.
Пример
Рассмотрим следующую проблему оценок учащихся старших классов:
Таблица 1: Пример - оценки средней школыобъект (ученик) | . (математика) | . (физика) | . (литература) | | . (общая оценка) |
---|
| medium | medium | bad | | bad |
---|
| хорошо | medium | плохой | | средний |
---|
| средний | хороший | плохой | | средний |
---|
| плохой | средний | хорошее | | плохое |
---|
| плохое | плохое | среднее | | плохое |
---|
| плохо | среднее | среднее | | среднее |
---|
| хорошо | хорошее | плохо | | хорошо |
---|
| хорошо | medium | medium | | medium |
---|
| средний | средний | хороший | | хороший |
---|
| хороший | средний | хорошо | | хорошо |
---|
Каждый объект (студент) описывается тремя критериями , относящиеся к уровням математики, физики и литературы соответственно. В соответствии с атрибутом решения учащиеся делятся на три класса, упорядоченных по предпочтениям: , и . Таким образом, были аппроксимированы следующие объединения классов:
- т.е. класс (максимум) плохих учеников,
- т.е. класс не более средних студентов
- т.е. класс как минимум средних учеников,
- т.е. класс (по крайней мере) хороших студентов.
Обратите внимание, что оценки объектов и несовместимы, потому что имеет лучшие оценки по всем трем критериям, чем , но глобальный рейтинг хуже.
Следовательно, нижние приближения объединений классов состоят из следующих объектов:
Таким образом, только классы и нельзя точно определить. Их верхние приближения следующие:
, а их граничные области:
Конечно, поскольку и точно аппроксимируются, мы имеем , и
Следующий минимальный набор из 10 правил может быть выведен из таблицы решений:
- если , то
- если и и тогда
- если тогда
- если и тогда
- если и , тогда
- если и затем
- если и тогда
- если , то
- if тогда
- если и затем
Последнее правило является приблизительным, а остальные - точными.
Расширения
Многокритериальный выбор и задачи ранжирования
Две другие проблемы, рассматриваемые в рамках многокритериального анализа решений и ранжирования проблемы, также можно решить, используя приблизительный подход, основанный на преобладании. Это делается путем преобразования таблицы решений в (PCT).
DRSA с переменной согласованностью
Определения грубых приближений основаны на строгом применении принципа доминирования. Однако при определении однозначных объектов разумно принять ограниченную долю отрицательных примеров, особенно для больших таблиц решений. Такая расширенная версия DRSA называется моделью (VC-DRSA)
Стохастическим DRSA
В реальных данных, особенно для больших наборов данных, понятия грубых приближений оказались чрезмерно ограничительными. Поэтому было введено расширение DRSA, основанное на стохастической модели (), которое допускает некоторую несогласованность. Сформулировав вероятностную модель для задач порядковой классификации с ограничениями монотонности, концепции нижних приближений распространяются на стохастический случай. Метод основан на оценке условных вероятностей с использованием непараметрического метода максимального правдоподобия, который приводит к проблеме изотонической регрессии.
Приблизительные наборы на основе стохастического доминирования также можно рассматривать как своего рода переменную. -модель согласованности.
Программное обеспечение
4eMka2 - это система поддержки принятия решений для задач классификации по множеству критериев, основанных на приблизительных наборах на основе доминирования (DRSA). JAMM является более продвинутым преемником 4eMka2. Обе системы бесплатно доступны для некоммерческих целей на веб-сайте Лаборатории интеллектуальных систем поддержки принятия решений (IDSS).
См. Также
Ссылки
- Чахар С., Ишизака А., Лабиб А., Саад И. ( 2016). Основанный на доминировании приблизительный подход для групповых решений, European Journal of Operational Research, 251 (1): 206-224
- Ли С., Ли Т. Чжан З., Чен Х., Чжан Дж. (2015 г.)). Параллельное вычисление приближений в подходе грубых множеств на основе доминирования, системы, основанные на знаниях, 87: 102-111
- Ли С., Ли Т. (2015). Постепенное обновление приближений в подходе грубых множеств на основе доминирования при изменении значений атрибутов, Информационные науки, 294: 348-361
- Ли С., Ли Т., Лю Д. (2013). Динамическое поддержание приближений в подходе грубых множеств на основе доминирования при изменении множества объектов, International Journal of Intelligent Systems, 28 (8): 729-751
Внешние ссылки