Прогнозное моделирование

редактировать

Прогнозное моделирование использует статистику для прогнозирования результатов. Чаще всего нужно спрогнозировать событие в будущем, но прогнозное моделирование может применяться к любому типу неизвестного события, независимо от того, когда оно произошло. Например, прогностические модели часто используются для выявления преступлений и идентификации подозреваемых после совершения преступления.

Во многих случаях модель выбирается на основе теории обнаружения, чтобы попытаться предположить вероятность результата при заданном количестве входных данных, например, при наличии электронного письма, определяющего, насколько вероятно, что это спам.

Модели могут использовать один или несколько классификаторов в попытке определить вероятность принадлежности набора данных другому набору. Например, модель может использоваться для определения того, является ли электронное письмо спамом или «ветчиной» (не спамом).

В зависимости от границ определения, прогнозное моделирование является синонимом или в значительной степени частично совпадает с областью машинного обучения, поскольку его чаще называют в академическом контексте или в контексте исследований и разработок. При коммерческом развертывании прогнозное моделирование часто называют прогнозной аналитикой..

Прогнозное моделирование часто противопоставляется причинно-следственному моделированию / анализу. В первом случае можно полностью удовлетвориться использованием индикаторов или заместителей интересующего результата. В последнем стремятся определить истинные причинно-следственные связи. Это различие привело к появлению растущей литературы в области методов исследования и статистики, а также к распространенному утверждению, что «корреляция не подразумевает причинно-следственную связь ».

Содержание
  • 1 Модели
  • 2 Приложения
    • 2.1 Моделирование роста
    • 2.2 Археология
    • 2.3 Управление взаимоотношениями с клиентами
    • 2.4 Автострахование
    • 2.5 Здравоохранение
    • 2.6 Алгоритмическая торговля
    • 2.7 Заметные ошибки прогнозного моделирования
  • 3 Возможные фундаментальные ограничения прогнозных моделей, основанных на подборе данных
  • 4 См. Также
  • 5 Ссылки
  • 6 Дополнительная литература
Модели

Практически любую статистическую модель можно использовать для целей прогнозирования. Вообще говоря, существует два класса прогнозных моделей: параметрические и непараметрические. Третий класс, полупараметрические модели, включает в себя функции обоих. Параметрические модели делают «конкретные допущения в отношении одного или нескольких параметров совокупности, которые характеризуют основное распределение (я)». Непараметрические модели «обычно включают меньше предположений о структуре и форме распределения [чем параметрические модели], но обычно содержат сильные предположения о независимости».

Приложения

Моделирование подъемов

Моделирование подъемов - это метод моделирования изменения вероятности, вызванного действием. Обычно это маркетинговые действия, такие как предложение купить продукт, использовать продукт больше или повторно подписать контракт. Например, в кампании удержания вы хотите спрогнозировать изменение вероятности того, что клиент останется клиентом, если с ним свяжутся. Модель изменения вероятности позволяет нацелить кампанию удержания на тех клиентов, для которых изменение вероятности будет выгодным. Это позволяет программе удержания не вызывать ненужного оттока или ухода клиентов, не тратя деньги на связи с людьми, которые будут действовать так или иначе.

Археология

Прогнозное моделирование в археологии берет свое начало в работе Гордона Уилли в середине пятидесятых годов в долине Виру в Перу. Были проведены полные интенсивные исследования, после чего была определена ковариабельность между культурными остатками и природными особенностями, такими как склоны и растительность. Развитие количественных методов и большая доступность применимых данных привели к росту дисциплины в 1960-х, а к концу 1980-х годов крупные землеустроители во всем мире добились значительного прогресса.

Как правило, прогнозное моделирование в археологии устанавливает статистически обоснованные причинно-следственные или ковариативные отношения между естественными косвенными показателями, такими как типы почвы, высота, уклон, растительность, близость к воде, геология, геоморфология и т. Д., А также наличие археологических функции. Путем анализа этих поддающихся количественной оценке атрибутов земли, подвергшейся археологическим раскопкам, иногда можно предвидеть «археологическую уязвимость» неисследованных территорий на основе естественных заменителей этих территорий. Крупные управляющие земельными ресурсами в Соединенных Штатах, такие как Бюро землепользования (BLM), Министерство обороны (DOD) и многочисленные агентства по автострадам и паркам, успешно использовали эту стратегию. Используя прогнозное моделирование в своих планах управления культурными ресурсами, они могут принимать более обоснованные решения при планировании мероприятий, которые могут потребовать нарушения грунта и впоследствии повлиять на археологические памятники.

Управление взаимоотношениями с клиентами

Прогностическое моделирование широко используется в аналитических управлении взаимоотношениями с клиентами и интеллектуальном анализе данных для создания моделей на уровне клиентов, которые описывают вероятность что клиент предпримет определенное действие. Действия обычно связаны с продажами, маркетингом и удержанием клиентов.

Например, крупная потребительская организация, такая как оператор мобильной связи, будет иметь набор прогнозных моделей для продукта перекрестных продаж, глубоких продаж продукта (или дополнительных продаж ) и отток. Кроме того, в настоящее время для такой организации более распространено использование модели сохраняемости с использованием модели повышения. Это предсказывает вероятность того, что покупатель может быть спасен в конце периода контракта (изменение вероятности оттока), в отличие от стандартной модели прогнозирования оттока.

Автострахование

Прогнозное моделирование используется в автостраховании для распределения рисков происшествий между держателями полисов на основе информации, полученной от держателей полисов. Это широко используется в решениях по страхованию на основе использования, где в прогнозных моделях используются данные на основе телеметрии для построения модели прогнозируемого риска для вероятности претензий. В прогнозных моделях автострахования «черный ящик» используется только вход датчика GPS или акселерометра. Некоторые модели включают в себя широкий спектр прогнозных входных данных, помимо базовой телеметрии, включая расширенное поведение вождения, независимые записи о ДТП, историю дорожных происшествий и профили пользователей для обеспечения улучшенных моделей риска.

Здравоохранение

В 2009 году Parkland Health Hospital System приступила к анализу электронных медицинских карт с целью использования прогнозного моделирования для выявления пациентов с высоким риском повторной госпитализации. Первоначально больница была ориентирована на пациентов с застойной сердечной недостаточностью, но программа расширилась и теперь включает пациентов с диабетом, острым инфарктом миокарда и пневмонией.

В 2018 г. Banerjee et al. предложила модель глубокого обучения - вероятностные прогностические оценки выживаемости у пациентов с метастатическим раком (PPES-Met) - для оценки краткосрочной ожидаемой продолжительности жизни (>3 месяцев) пациентов путем анализа клинических заметок в свободном тексте в электронную медицинскую карту с сохранением временной последовательности посещений. Модель была обучена на большом наборе данных (10 293 пациента) и проверена на отдельном наборе данных (1818 пациентов). Он достиг области под кривой ROC (Рабочие характеристики приемника ) 0,89. Чтобы обеспечить способность объяснения, они разработали интерактивный графический инструмент, который может улучшить понимание врачом основы прогнозов модели. Высокая точность и объяснимая способность модели PPES-Met может позволить использовать модель в качестве инструмента поддержки принятия решений для персонализации лечения метастатического рака и оказать ценную помощь врачам.

Алгоритмическая торговля

Прогностическое моделирование в торговле - это процесс моделирования, в котором вероятность результата прогнозируется с использованием набора переменных-предикторов. Прогностические модели могут быть построены для различных активов, таких как акции, фьючерсы, валюты, товары и т. Д. Прогностическое моделирование все еще широко используется торговыми фирмами для разработки стратегий и торговли. Он использует математически продвинутое программное обеспечение для оценки индикаторов по цене, объему, открытому интересу и другим историческим данным, чтобы обнаружить повторяющиеся закономерности.

Заметные неудачи прогнозного моделирования

Хотя широко не обсуждаются в основных средствах прогнозирования Сообщество моделирования, прогнозное моделирование - это методология, которая широко использовалась в прошлом в финансовой индустрии, и некоторые из основных неудач привели к финансовому кризису 2007–2008 гг.. Эти неудачи демонстрируют опасность полагаться исключительно на модели, которые по своей сути являются ретроспективными. Следующие примеры ни в коем случае не являются полным списком:

1) Рейтинг облигаций. SP, Moody's и Fitch количественно определяют вероятность дефолта по облигациям с помощью дискретных переменных, называемых рейтингом. Рейтинг может принимать дискретные значения от AAA до D. Рейтинг является прогностическим фактором риска дефолта на основе множества переменных, связанных с заемщиком, и исторических макроэкономических данных. Рейтинговые агентства потерпели неудачу со своими рейтингами на рынке обеспеченных ипотечными долговыми обязательствами (CDO ) на сумму 600 миллиардов долларов США. Практически весь сектор AAA (и сектор супер-AAA - новый рейтинг, который рейтинговые агентства предоставили для представления сверхнадежных инвестиций) рынка CDO в течение 2008 г. допустил дефолт или был серьезно понижен, многие из которых получили свои рейтинги менее чем за год до этого.

2) Пока что никакие статистические модели, которые пытаются предсказать цены на фондовом рынке на основе исторических данных, не считаются последовательными, чтобы делать правильные прогнозы в долгосрочной перспективе. Особенно запомнилась неудача Long Term Capital Management, фонда, который нанял высококвалифицированных аналитиков, в том числе лауреата Нобелевской премии по экономическим наукам, для разработки сложной статистической модели, которая предсказывала разница в цене между разными ценными бумагами. Модели приносили впечатляющую прибыль, пока не случился крупный провал, который заставил тогдашнего председателя Федеральной резервной системы Алан Гринспен вмешаться, чтобы выступить посредником в плане спасения, разработанном брокерскими дилерами Уолл-Стрит чтобы предотвратить крах рынка облигаций.

Возможные фундаментальные ограничения прогнозных моделей, основанных на подборе данных

1) История не всегда может точно предсказать будущее. Использование отношений, полученных на основе исторических данных, для прогнозирования будущего неявно предполагает, что в сложной системе существуют определенные длительные условия или константы. Это почти всегда приводит к некоторой неточности, когда в системе задействованы люди.

2) Проблема неизвестных неизвестных. При сборе всех данных сборщик сначала определяет набор переменных, для которых собираются данные. Тем не менее, независимо от того, насколько тщательно сборщик рассматривает свой выбор переменных, всегда существует вероятность появления новых переменных, которые не были учтены или даже определены, но которые имеют решающее значение для результата.

3) Противоречивые поражение алгоритма. После того, как алгоритм становится общепринятым стандартом измерения, его могут использовать в своих интересах люди, которые понимают алгоритм и имеют стимул обмануть или манипулировать результатом. Вот что случилось с рейтингом CDO, описанным выше. Дилеры CDO активно выполняли предложения рейтинговых агентств по достижению AAA или супер-AAA по выдаваемым ими CDO, ловко манипулируя переменными, которые были «неизвестны» «сложным» моделям рейтинговых агентств.

См. Также
Литература
  1. ^Гейссер, Сеймур (1993). Прогнозный вывод: введение. Чепмен и Холл. п.. ISBN 978-0-412-03471-8.
  2. ^Финли, Стивен (2014). Прогнозная аналитика, интеллектуальный анализ данных и большие данные. Мифы, заблуждения и методы (1-е изд.). Пэлгрейв Макмиллан. п. 237. ISBN 978-1137379276.
  3. ^Шескин, Дэвид Дж. (27 апреля 2011 г.). Справочник по параметрическим и непараметрическим статистическим процедурам. CRC Нажмите. п. 109. ISBN 978-1439858011.
  4. ^Кокс, Д. Р. (2006). Принципы статистического вывода. Издательство Кембриджского университета. п. 2.
  5. ^Уилли, Гордон Р. (1953), «Образцы доисторических поселений в долине Виру, Перу», бюллетень 155. Бюро американской этнологии
  6. ^Гейдельберг, Курт и др. «Оценка программы исследования археологических образцов на испытательном и учебном полигоне в Неваде», Технический отчет SRI 02-16, 2002
  7. ^Джеффри Х. Альтшул, Линн Себастьян и Курт Хайдельберг, «Прогностическое моделирование в вооруженных силах: аналогичные цели., Divergent Paths », Серия исследований по сохранению 1, Фонд SRI, 2004
  8. ^« Больница использует аналитику данных и прогнозное моделирование для выявления и распределения скудных ресурсов среди пациентов из группы высокого риска, что ведет к меньшему количеству повторных госпитализаций ». Агентство медицинских исследований и качества. 2014-01-29. Проверено 19 марта 2019.
  9. ^Банерджи, Имон; и другие. (2018-07-03). «Вероятностные прогностические оценки выживаемости у пациентов с метастатическим раком (PPES-Met) с использованием клинических описаний в свободном тексте». Scientific Reports. 8(10037 (2018)): 10037. Bibcode : 2018NatSR... 810037B. DOI : 10.1038 / s41598-018-27946-5. PMC 6030075. PMID 29968730.
  10. ^«Торговые системы на основе прогнозных моделей, Часть 1 - Успех системного трейдера». Системный трейдер Успех. 2013-07-22. Проверено 25 ноября 2016 г.
Дополнительная литература
Последняя правка сделана 2021-06-02 04:29:36
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте