Достоверность теория

редактировать

Теория достоверности - это форма статистического вывода, используемая для прогнозирования неопределенного будущего события, разработанная Томасом Байесом. Его можно использовать, когда у вас есть несколько оценок будущего события, и вы хотите объединить эти оценки таким образом, чтобы получить более точную и актуальную оценку. Обычно это используется актуариями, работающими в страховых компаниях, при определении размера премии. Например, в групповом медицинском страховании страховщик заинтересован в расчете премии за риск, RP {\ displaystyle RP}{\ displaystyle RP} (то есть теоретической ожидаемой суммы страховых требований) для конкретного работодатель в наступающем году. Страховщик, вероятно, будет иметь оценку общего опыта претензий за прошлые периоды, x {\ displaystyle x}x , а также более конкретную оценку для рассматриваемого работодателя, y {\ displaystyle y }y . Присвоение коэффициента достоверности z {\ displaystyle z}z общему опыту страховых случаев (и взаимному опыту работодателя) позволяет страховщику получить более точную оценку премии за риск в следующих случаях: способ:

RP = xz + y (1 - z). {\ displaystyle RP = xz + y (1-z).}{\ displaystyle RP = xz + y (1-z).} Коэффициент достоверности выводится путем вычисления оценки максимального правдоподобия, которая минимизирует ошибку оценки. Предполагая, что дисперсия x {\ displaystyle x}x и y {\ displaystyle y}y - известные величины, принимающие значения u {\ displaystyle u }u и v {\ displaystyle v}v соответственно, можно показать, что z {\ displaystyle z}z должен быть равен: z = v / (u + v). {\ displaystyle z = v / (u + v).}{\ displaystyle z = v / (u + v).} Следовательно, чем больше неточности в оценке, тем ниже ее достоверность.
Содержание
  • 1 Типы достоверности
  • 2 Простой пример
  • 3 Актуарная достоверность
  • 4 Ссылки
  • 5 Дополнительная литература
Типы достоверности

Байесовская достоверность, мы разделяем каждый класс (B) и присваиваем им вероятность (Вероятность B). Затем мы выясняем, насколько вероятно, что наш опыт (A) соответствует каждому классу (вероятность A для данного B). Затем мы выясняем, насколько вероятно, что наш опыт был для всех классов (вероятность A). Наконец, мы можем найти вероятность нашего класса с учетом нашего опыта. Итак, возвращаясь к каждому классу, мы взвешиваем каждую статистику с вероятностью конкретного класса с учетом опыта.

Доверие к Бюльманну работает, глядя на дисперсию среди населения. В частности, он смотрит, какая часть общей дисперсии приписывается дисперсии ожидаемых значений каждого класса (дисперсия гипотетического среднего), а какая - ожидаемой дисперсии по всем классам (ожидаемое значение Дисперсия процесса). Допустим, у нас есть баскетбольная команда, у которой много очков за игру. Иногда они получают 128, а иногда 130, но всегда одно из двух. По сравнению со всеми баскетбольными командами это относительно невысокая дисперсия, что означает, что они очень мало влияют на ожидаемую ценность дисперсии процесса. Кроме того, их необычно высокое количество очков значительно увеличивает дисперсию населения, а это означает, что, если лига выгнала их, у них будет гораздо более предсказуемая сумма очков для каждой команды (меньшая дисперсия). Итак, эта команда определенно уникальна (они вносят большой вклад в дисперсию гипотетического среднего). Так что мы можем оценить опыт этой команды с довольно высоким доверием. Они часто / всегда набирают много очков (низкое ожидаемое значение отклонения от процесса), и не многие команды набирают столько же, сколько они (высокая дисперсия гипотетического среднего).

Простой пример

Предположим, в коробке две монеты. У одной с обеих сторон орла, а у другой - обычная монета с вероятностью выпадения орла или решки 50:50. Вам нужно сделать ставку на результат после того, как один из них будет случайно выбран и перевернут.

Вероятность выпадения орла 0,5 * 1 + 0,5 * 0,5 = 0,75. Это потому, что есть шанс 0,5 выбрать монету, состоящую только из орла, с вероятностью 100% и шанс 0,5 для справедливой монеты с вероятностью 50%.

Теперь та же монета используется повторно, и вас снова просят сделать ставку на результат.

Если первый бросок был решкой, есть 100% шанс, что вы имеете дело с честной монетой, поэтому следующий бросок имеет 50% шанс выпадения орла и 50% шанс выпадения решки.

Если первый бросок выпадал орлом, мы должны рассчитать условную вероятность того, что выбранная монета была только орлом, а также условную вероятность того, что монета была честной, после чего мы можем вычислить условную вероятность выпадения орла на следующий флип. Вероятность того, что он выпал из монетки, состоящей только из орла, с учетом того, что первым подбрасыванием выпадал орел, равна вероятности выбора монетки с одним орлом, умноженной на вероятность выпадения орла для этой монеты, деленную на начальную вероятность выпадения орла при первом подбрасывании, или. 5 * 1 / 0,75 = 2/3. Вероятность того, что он выпал из честной монеты с учетом того, что при первом подбрасывании орла выпала орда, равна вероятности выбора справедливой монеты, умноженной на вероятность выпадения орла для этой монеты, деленную на начальную вероятность выпадения орла при первом подбрасывании, или 0,5 * 0,5 / 0,75 = 1/3. Наконец, условная вероятность выпадения орла при следующем подбрасывании с учетом того, что первым подбрасыванием выпала орла, является условная вероятность выпадения орла, умноженная на вероятность выпадения орла для монетки, состоящей только из орла, плюс условная вероятность справедливой монеты, умноженная на вероятность. голов для справедливой монеты, или 2/3 * 1 + 1/3 *.5 = 5/6 ≈ 0,8333

Актуарная достоверность

Актуарная достоверность описывает подход, используемый актуариев для улучшения статистических оценок. Хотя подход может быть сформулирован в статистической настройке частотного анализа или байесовского, последний часто предпочтительнее из-за простоты распознавания более чем одного источника случайности с помощью как «выборки», так и «априорная» информация. В типичном приложении актуарий имеет оценку X на основе небольшого набора данных и оценку M на основе большего, но менее актуального набора данных. Оценка достоверности равна ZX + (1-Z) M, где Z - число от 0 до 1 (называемое «весом достоверности» или «фактором достоверности»), вычисленное для уравновешивания ошибки выборки X с возможное отсутствие релевантности (и, следовательно, ошибка моделирования) M.

Когда страховая компания рассчитывает размер премии, которую она будет взимать, она делит страхователей на группы. Например, водители могут быть разделены по возрасту, полу и типу автомобиля; молодой человек, ведущий быструю машину, считается высоким риском, а старуха, ведущая небольшую машину, считается низким риском. Разделение производится с учетом двух требований: риски в каждой группе достаточно схожи, а группа достаточно велика, чтобы можно было провести значимый статистический анализ опыта урегулирования убытков для расчета премии. Этот компромисс означает, что ни одна из групп не содержит только идентичных рисков. Тогда проблема состоит в том, чтобы разработать способ объединения опыта группы с опытом индивидуального риска для лучшего расчета страховой премии. Теория достоверности дает решение этой проблемы.

Для актуариев важно знать теорию достоверности, чтобы рассчитать премию для группы договоров страхования. Цель состоит в том, чтобы создать систему оценки опыта для определения премии в следующем году, принимая во внимание не только индивидуальный опыт работы в группе, но и коллективный опыт.

Есть две крайние позиции. Один из них - взимать со всех одинаковую премию, рассчитанную на основе общего среднего значения X ¯ {\ displaystyle {\ overline {X}}}{\ overline {X}} данных. Это имеет смысл только в том случае, если портфель однороден, что означает, что все ячейки рисков имеют одинаковые средние требования. Однако, если портфель неоднороден, не рекомендуется взимать премию таким образом (завышая плату за «хороших» людей и занижая плату за людей с «плохим» риском), поскольку «хорошие» риски унесут их бизнес в другое место, оставив страховщика только с «плохими» рисками. Это пример неблагоприятного выбора.

Другой способ - взимать плату за группу j {\ displaystyle j}jсвоих собственных средних требований, составляющих X j ¯ { \ displaystyle {\ overline {X_ {j}}}}{\ displaystyle {\ overline {X_ {j}}}} в качестве страхового взноса, взимаемого с застрахованного. Эти методы используются, если портфель неоднороден, при условии достаточно большого количества претензий. Чтобы скомпрометировать эти два крайних положения, мы берем средневзвешенное значение из двух крайних значений:

C = zj X j ¯ + (1 - zj) X ¯ {\ displaystyle C = z_ {j} { \ overline {X_ {j}}} + (1-z_ {j}) {\ overline {X}} \,}{\ displaystyle C = z_ {j} { \ overline {X_ {j}}} + (1-z_ {j}) {\ overline {X}} \,}

zj {\ displaystyle z_ {j}}z_ {j} имеет следующий интуитивно понятный значение: выражает, насколько «заслуживающим доверия» (приемлемым) является человек из ячейки j {\ displaystyle j}j. Если он высокий, используйте более высокое значение zj {\ displaystyle z_ {j}}z_ {j} , чтобы добавить больший вес к зарядке X j ¯ {\ displaystyle {\ overline {X_ {j }}}}{\ displaystyle {\ overline {X_ {j}}}} , и в этом случае zj {\ displaystyle z_ {j}}z_ {j} называется фактором достоверности, а такая начисленная премия называется премией за доверие..

Если бы группа была полностью однородной, то было бы разумно установить zj = 0 {\ displaystyle z_ {j} = 0}{\ displaystyle z_ {j} = 0} , а если бы группа была полностью неоднородной, тогда было бы разумно установить zj = 1 {\ displaystyle z_ {j} = 1}{\ displaystyle z_ {j} = 1} . Использование промежуточных значений разумно в той степени, в которой как индивидуальная, так и групповая история полезна для вывода будущего индивидуального поведения.

Например, у актуария есть исторические данные о несчастных случаях и заработной плате для обувной фабрики, предполагающие, что уровень несчастных случаев составляет 3,1 на миллион долларов заработной платы. У нее есть отраслевая статистика (по всем обувным фабрикам), согласно которой уровень несчастных случаев составляет 7,4 на миллион. При вероятности Z, равной 30%, она оценила бы коэффициент для завода как 30% (3,1) + 70% (7,4) = 6,1 аварий на миллион.

Ссылки
Дополнительная литература
Последняя правка сделана 2021-05-16 08:17:24
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте