Выбор модели

редактировать
Алгоритмические подходы к выбору модели в машинном обучении см. В разделах Выбор функций, Оптимизация гиперпараметров и Теория статистического обучения.

Выбор модели - это задача выбора статистической модели из набора моделей-кандидатов с учетом данных. В простейших случаях рассматривается уже существующий набор данных. Однако задача может также включать в себя такой план экспериментов, чтобы собранные данные хорошо подходили для задачи выбора модели. Учитывая возможные модели с аналогичной предсказательной или объяснительной способностью, простейшая модель, скорее всего, будет лучшим выбором ( бритва Оккама ).

Кониси и Китагава (2008, стр. 75) заявляют: «Большинство проблем статистического вывода можно рассматривать как проблемы, связанные со статистическим моделированием». В связи с этим Кокс (2006, стр. 197) сказал: «Как [] перевод предметной проблемы в статистическую модель часто является наиболее важной частью анализа».

Выбор модели может также относиться к проблеме выбора нескольких репрезентативных моделей из большого набора вычислительных моделей с целью принятия решений или оптимизации в условиях неопределенности.

СОДЕРЖАНИЕ
  • 1 Введение
  • 2 Два направления выбора модели
  • 3 Методы, помогающие выбрать набор моделей-кандидатов
  • 4 критерия
  • 5 См. Также
  • 6 Примечания
  • 7 ссылки
Вступление
Цикл научных наблюдений.

В самых основных формах выбор модели - одна из фундаментальных задач научного исследования. Определение принципа, объясняющего серию наблюдений, часто напрямую связано с математической моделью, предсказывающей эти наблюдения. Например, когда Галилей проводил свои эксперименты с наклонной плоскостью, он продемонстрировал, что движение шаров соответствует параболе, предсказанной его моделью.

Из бесчисленного количества возможных механизмов и процессов, которые могли бы произвести данные, как можно даже начать выбирать лучшую модель? Обычно применяемый математический подход определяет набор моделей-кандидатов; этот набор должен быть выбран исследователем. Часто используются простые модели, такие как полиномы, по крайней мере, на начальном этапе. Бернхэм и Андерсон (2002) на протяжении всей своей книги подчеркивают важность выбора моделей, основанных на надежных научных принципах, таких как понимание феноменологических процессов или механизмов (например, химических реакций), лежащих в основе данных.

После выбора набора моделей-кандидатов статистический анализ позволяет нам выбрать лучшую из этих моделей. То, что подразумевается под лучшим, является спорным. Хорошая методика выбора модели уравновешивает точность подгонки и простоту. Более сложные модели смогут лучше адаптировать свою форму для соответствия данным (например, полином пятого порядка может точно соответствовать шести точкам), но дополнительные параметры могут не представлять ничего полезного. (Возможно, эти шесть точек на самом деле просто случайным образом распределены по прямой.) Качество соответствия обычно определяется с использованием подхода отношения правдоподобия или его приближения, что приводит к критерию хи-квадрат. Сложность обычно измеряется путем подсчета количества параметров в модели.

Методы выбора модели можно рассматривать как оценки некоторой физической величины, например, вероятности того, что модель дает данные. Смещения и дисперсии являются важными показателями качества этой оценки; Эффективность также часто рассматривается.

Стандартный пример выбора модели - это подгонка кривой, где, учитывая набор точек и другие базовые знания (например, точки являются результатом выборки iid ), мы должны выбрать кривую, которая описывает функцию, которая сгенерировала точки.

Два направления выбора модели

Выводы и обучение на основе данных преследуют две основные цели. Один - для научного открытия, понимания лежащего в основе механизма генерации данных и интерпретации природы данных. Еще одна цель обучения на основе данных - прогнозирование будущих или невидимых наблюдений. Во второй задаче специалист по анализу данных не обязательно заботится о точном вероятностном описании данных. Конечно, могут быть интересны и оба направления.

В соответствии с двумя разными целями, выбор модели также может иметь два направления: выбор модели для вывода и выбор модели для прогнозирования. Первое направление - определить лучшую модель для данных, которая предпочтительно обеспечит надежную характеристику источников неопределенности для научной интерпретации. Для этой цели очень важно, чтобы выбранная модель не была слишком чувствительна к размеру выборки. Соответственно, подходящим понятием для оценки выбора модели является последовательность выбора, означающая, что наиболее надежный кандидат будет последовательно выбираться при достаточно большом количестве выборок данных.

Второе направление - выбрать модель в качестве механизма, обеспечивающего отличные прогностические характеристики. Для последнего, однако, выбранная модель может просто стать счастливым победителем среди нескольких близких конкурентов, но прогнозирующая эффективность все же может быть наилучшей из возможных. Если это так, выбор модели подходит для второй цели (прогноз), но использование выбранной модели для понимания и интерпретации может быть крайне ненадежным и вводящим в заблуждение. Более того, для очень сложных моделей, выбранных таким образом, даже прогнозы могут быть необоснованными для данных, лишь незначительно отличающихся от тех, по которым был сделан выбор.

Методы, помогающие выбрать набор моделей-кандидатов
Критерии

Ниже приведен список критериев выбора модели. Наиболее часто используемыми критериями являются (i) информационный критерий Акаике и (ii) байесовский фактор и / или байесовский информационный критерий (который в некоторой степени приближается к байесовскому фактору), см. Обзор в Stoica amp; Selen (2004).

Среди этих критериев перекрестная проверка обычно является наиболее точной и наиболее затратной с точки зрения вычислений для задач обучения с учителем.

Бернхэм и Андерсон (2002, §6.3) говорят следующее:

Существует множество методов выбора модели. Однако с точки зрения статистической производительности метода и предполагаемого контекста его использования существует только два различных класса методов: они были отмечены как эффективные и согласованные. (...) В рамках частотной парадигмы для выбора модели обычно используются три основных подхода: (I) оптимизация некоторых критериев выбора, (II) проверка гипотез и (III) специальные методы.

Смотрите также
Заметки
Рекомендации
Последняя правка сделана 2023-03-29 02:53:21
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте