Модель Ли – Картера

редактировать
Численный алгоритм прогнозирования смертности

Модель Ли – Картера - это числовой алгоритм, используемый в прогнозировании смертности и прогнозировании ожидаемой продолжительности жизни . Входными данными для модели является матрица возрастных коэффициентов смертности, монотонно упорядоченная по времени, обычно с возрастом в столбцах и годами в строках. Результатом является еще одна прогнозируемая матрица смертности.

Модель использует разложение по сингулярным значениям (SVD), чтобы найти одномерный временной ряд вектор "k t «, который отражает 80–90% тенденции смертности (здесь индекс« t »относится ко времени), вектор« b x », который описывает величину изменения смертности в данном возрасте для единицы ежегодное изменение общей смертности (здесь индекс «x» относится к возрасту) и коэффициент масштабирования (обозначаемый здесь как s 1, но не имеющий названия в литературе). Удивительно, но k t обычно является линейным, что означает, что увеличение продолжительности жизни является довольно постоянным год за годом для большинства групп населения. Перед вводом в SVD возрастные коэффициенты смертности преобразуются в «a x, t » путем взятия их логарифмов, а затем центрирования их путем вычитания их средние по возрасту (рассчитанные с течением времени). (Нижний индекс «x, t» указывает на тот факт, что a x, t охватывает как возраст, так и время.) Многие исследователи корректируют вектор k t, подгоняя его под эмпирическую продолжительность жизни для каждого года с использованием a x и b x, только что созданных с помощью SVD; при настройке с использованием этого подхода изменения k t обычно невелики.

Для прогнозирования смертности вышеуказанное k t (скорректированное или нет) прогнозируется в будущем с использованием методов временных рядов ARIMA, соответствующее будущее a x, t + n восстанавливается путем умножения k t + n на b x и соответствующий диагональный элемент S (когда [USV] = svd (mort)), а фактические показатели смертности восстанавливаются путем вычисления экспоненты от этого вектора. Из-за линейности k t это обычно моделируется как случайное блуждание с трендом. Ожидаемая продолжительность жизни и другие показатели таблицы продолжительности жизни могут быть рассчитаны на основе этой прогнозируемой матрицы после сложения средних значений и экспонент для получения регулярных показателей смертности.

В большинстве реализаций доверительные интервалы для прогнозов генерируются путем моделирования нескольких прогнозов смертности с использованием методов Монте-Карло ; диапазон смертности между 5% и 95% процентилями смоделированных результатов считается действительным прогнозом. Эти симуляции выполняются путем расширения k t на будущее с использованием рандомизации на основе стандартной ошибки k t, полученной из входных данных.

В схеме и псевдокоде в стиле Matlab алгоритм выглядит следующим образом:

  1. Создайте x, взяв логарифм уровней смертности. и центрирование результатов со средней логарифмической смертностью в заданном возрасте.
  2. Получите k t, собственное значение масштабирования, и b x из U (:, 1), S (1,1), V (1, :), где [USV] = svd (mort).
  3. Прогноз k t со стандартной одномерной ARIMA
  4. Используйте прогноз k t с исходными значениями b x и a x, чтобы рассчитать зарегистрированные коэффициенты смертности для каждого прогнозируемого года. 26>
  5. Восстановите регулярные уровни смертности, вычислив экспоненту прогнозируемых логарифмических коэффициентов смертности.

Без применения SVD или какого-либо другого метода уменьшения размерности таблица данных смертности представляет собой сильно коррелированные многомерные данные серии; сложность этих многомерных временных рядов делает их практически невозможными для прогнозирования. SVD стал широко использоваться как метод уменьшения размеров во многих разрозненных полях, в том числе в Google в их алгоритме рейтинга страниц.

Модель Ли-Картера была представлена ​​Лоуренсом Картером и Лоуренсом в 1992 году в статье «Моделирование и прогнозирование временных рядов смертности в США» (журнал Американской статистической ассоциации 87 (сентябрь): 659–671). Модель выросла из их работы в конце 1980-х - начале 1990-х годов, когда они пытались использовать ее для вывода показателей в исторической демографии. Модель использовалась Администрацией социального обеспечения США, Бюро переписи населения США и Организацией Объединенных Наций. Сегодня он стал наиболее широко используемым методом прогнозирования смертности в мире.

Были дополнения к шкале Ли-Картера, в первую очередь для учета пропущенных лет, коррелированности мужского и женского населения и крупномасштабной согласованности в популяции с одинаковым режимом смертности (например, Западная Европа). Многие статьи по теме можно найти на сайте профессора Рональда Ли.

На удивление мало программных пакетов для прогнозирования с помощью модели Ли – Картера. LCFIT - это веб-пакет с интерактивными формами. Профессор Роб Дж. Хайндман предоставляет пакет R для демографии, который включает процедуры для создания и прогнозирования модели Ли-Картера. Альтернативы в R включают пакет StMoMo Виллегаса, Миллоссовича и Кайшева (2015), а также некоторые другие, которые они перечисляют. Профессор Герман Родригес предоставляет код для модели Ли – Картера, используя Stata. Используя Matlab, профессор Эрик Жондо и профессор Майкл Рокингер собрали Longevity Toolbox для оценки параметров.

Ссылки
Последняя правка сделана 2021-05-26 05:08:54
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте