Теория экстремальных значений

редактировать
Теория экстремальных значений используется для моделирования риска экстремальных, редких событий, таких как лиссабонское землетрясение 1755 г..

Теория экстремальных значений или Анализ экстремальных значений (EVA ) - это ветвь статистики, имеющая дело с крайними отклонениями от медиана из распределений вероятностей. Он стремится оценить на основе заданной упорядоченной выборки заданной случайной величины вероятность событий, которые являются более экстремальными, чем любые из ранее наблюдавшихся. Анализ предельных значений широко используется во многих дисциплинах, таких как строительное проектирование, финансы, науки о Земле, прогнозирование трафика и инженерная геология. Например, EVA можно использовать в области гидрологии для оценки вероятности необычно большого наводнения, такого как 100-летнее наводнение. Аналогичным образом, при проектировании волнолома инженер береговой инженер постарается оценить 50-летнюю волну и спроектировать конструкцию соответствующим образом.

Содержание

  • 1 Анализ данных
  • 2 Приложения
  • 3 История
  • 4 Теория одномерных
  • 5 Теория многомерных
  • 6 См. Также
  • 7 Примечания
  • 8 Ссылки
  • 9 Программное обеспечение
  • 10 Внешние ссылки

Анализ данных

Для практического анализа экстремальных значений существует два подхода.

Первый метод основан на получении ряда максимумов (минимумов) блоков в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), создавая «Годовой ряд максимальных значений» (AMS).

Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом «пик превышения порога» (POT).

Для данных AMS анализ может частично опираться на результаты теоремы Фишера – Типпетта – Гнеденко, что приводит к выбору обобщенного распределения экстремальных значений для подбора.. Однако на практике для выбора между более широким диапазоном распределений применяются различные процедуры. Теорема здесь относится к предельным распределениям для минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределения, отличного от обобщенного распределения экстремальных значений (GEVD).

Для POT данных, анализ может включать подгонку двух распределений: одно для количества событий за рассматриваемый период времени, а второе для размера превышений.

Обычным допущением для первого является распределение Пуассона, при этом обобщенное распределение Парето используется для превышений. подгонка хвоста может быть основана на теореме Пикандса – Балкема – де Хаана.

Новак резервирует термин «метод POT» для случая, когда порог не случайный, и выделяет его. из случая, когда речь идет о превышении случайного порога.

Приложения

Приложения теории экстремальных значений включают в себя прогнозирование распределения вероятностей:

  • экстремальных наводнений ; Размер волн-уродов
  • Торнадо вспышек
  • Максимальные размеры экологических популяций
  • Побочные эффекты лекарств (например, Ксимелагатран )
  • Количество крупные страхование убытки
  • риски капитала ; повседневные рыночный риск
  • мутационные события в ходе эволюции
  • крупные лесные пожары
  • экологические нагрузки на конструкции
  • Оценить максимальное время, в течение которого люди могут пробежать 100 метров спринт и выступления в других спортивных дисциплинах.
  • Неисправности трубопроводов из-за точечной коррозии.
  • Аномальный сетевой трафик ИТ, не позволяющий злоумышленникам получить доступ к важным данным
  • Анализ безопасности дорожного движения
  • Беспроводная связь

История

Пионером в области теории экстремальных значений стал Леонард Типпет (1902–1985). Типпет работал в Британской ассоциации исследований хлопковой промышленности, где он работал над тем, чтобы сделать хлопковые нити более прочными. В своих исследованиях он понял, что прочность нити w как контролируемый прочностью его самых слабых волокон. С помощью Р. А. Фишер, Типпет получил три асимптотических предела, описывающих распределения экстремумов в предположении независимых переменных. Эмиль Джулиус Гамбель систематизировал эту теорию в своей книге 1958 года «Статистика крайностей», включая распределения Гамбеля, носящие его имя. Эти результаты могут быть расширены, чтобы учесть небольшие корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Особый интерес представляет один класс универсальности, в котором корреляции логарифмически убывают с расстоянием.

Краткое изложение исторически важных публикаций, относящихся к теории экстремальных значений, можно найти в статье Список публикаций по статистике.

Теория одномерных

Пусть X 1,…, X n {\ displaystyle X_ {1}, \ dots, X_ {n}}X_ {1}, \ dots, X_ {n} быть последовательностью независимых и одинаково распределенных случайных величин с кумулятивной функцией распределения F и пусть M n = max (X 1,…, X n) {\ displaystyle M_ {n} = \ max (X_ {1}, \ dots, X_ {n})}M_ {n} = \ max (X_ {1}, \ dots, X_ {n}) обозначают максимум.

Теоретически можно вывести точное распределение максимума:

Pr (M n ≤ z) = Pr (X 1 ≤ z,…, X n ≤ z) = Pr (X 1 ≤ z) ⋯ Pr (X n ≤ z) = (F (z)) n. {\ Displaystyle {\ begin {выровнен} \ Pr (M_ {n} \ leq z) = \ Pr (X_ {1} \ leq z, \ dots, X_ {n} \ leq z) \\ = \ Pr (X_ {1} \ leq z) \ cdots \ Pr (X_ {n} \ leq z) = (F (z)) ^ {n}. \ End {align}}}{\ begin {align} \ Pr (M_ {n} \ leq z) = \ Pr (X_ {1} \ leq z, \ dots, X_ {n} \ leq z) \\ = \ Pr (X_ {1} \ leq z) \ cdots \ Pr (X_ {n } \ leq z) = (F (z)) ^ {n}. \ end {align}}

Связанный индикатор функция I n = I (M n>z) {\ displaystyle I_ {n} = I (M_ {n}>z)}I_{n}=I(M_{n}>z) - это процесс Бернулли с вероятностью успеха p (z) = 1 - (F (z)) n {\ displaystyle p (z) = 1- (F (z)) ^ {n}}{\ displaystyle p (z) = 1- (F (z)) ^ {n}} , который зависит от величины z {\ displaystyle z}z экстремального события. Таким образом, количество экстремальных событий в рамках n {\ displaystyle n}n испытаний следует биномиальному распределению а количество попыток до наступления события соответствует геометрическому распределению с ожидаемым значением и стандартным отклонением того же порядка O (1 / p (z)) {\ displaystyle O (1 / p ( z))}O (1 / p (z)) .

На практике у нас может не быть дистрибьютора ion function F {\ displaystyle F}F , но теорема Фишера – Типпета – Гнеденко дает асимптотический результат. Если существуют последовательности констант an>0 {\ displaystyle a_ {n}>0}a_{n}>0 и bn ∈ R {\ displaystyle b_ {n} \ in \ mathbb {R}}b_ {n} \ in \ mathbb {R} такой, что

Pr {(M n - bn) / an ≤ z} → G (z) {\ displaystyle \ Pr \ {(M_ {n} -b_ {n}) / a_ {n} \ leq z \} \ rightarrow G (z)}\ Pr \ {(M_ {n} -b_ { n}) / a_ {n} \ leq z \} \ rightarrow G (z)

как n → ∞ {\ displaystyle n \ rightarrow \ infty}n \ rightarrow \ infty , затем

G (z) ∝ exp ⁡ [- (1 + ζ z) - 1 / ζ] {\ Displaystyle G (z) \ propto \ exp \ left [- (1+ \ zeta z) ^ {- 1 / \ zeta} \ right]}G (z) \ propto \ exp \ left [- (1+ \ zeta z) ^ {- 1 / \ zeta} \ right]

где ζ {\ displaystyle \ zeta}\ zeta зависит от формы хвоста распределения. После нормализации G принадлежит к одному из следующих семейств невырожденного распределения :

закон Вейбулла : G (z) = {exp ⁡ {- (- (z - ba)) α} z < b 1 z ≥ b {\displaystyle G(z)={\begin{cases}\exp \left\{-\left(-\left({\frac {z-b}{a}}\right)\right)^{\alpha }\right\}zG (z) = {\ begin {cases} \ exp \ left \ {- \ left (- \ left ({\ frac {zb} {a}}) \ right) \ right) ^ {\ alpha} \ right \} z <b \\ 1 z \ geq b \ end {cases}} , когда распределение M n {\ displaystyle M_ {n}}M_ {n} имеет светлый хвост с конечной верхней границей. Также известен как Тип 3.

Закон Гамбеля : G (z) = exp ⁡ {- exp ⁡ (- (z - b a))} для z ∈ R. {\ displaystyle G (z) = \ exp \ left \ {- \ exp \ left (- \ left ({\ frac {zb} {a}} \ right) \ right) \ right \} {\ text {for} } z \ in \ mathbb {R}.}G (z) = \ exp \ left \ {- \ exp \ left (- \ left ( {\ frac {zb} {a}} \ right) \ right) \ right \} {\ text {for}} z \ in \ mathbb {R}. , когда распределение M n {\ displaystyle M_ {n}}M_ {n} имеет экспоненциальный хвост. Также известен как Тип 1

Закон Фреше : G (z) = {0 z ≤ b exp ⁡ {- (z - b a) - α} z>b. {\ displaystyle G (z) = {\ begin {case} 0 z \ leq b \\\ exp \ left \ {- \ left ({\ frac {zb} {a}} \ right) ^ {- \ alpha} \ right \} z>b. \ end {ases}}}G(z)={\begin{cases}0z\leq b\\\exp \left\{-\left({\frac {z-b}{a}}\right)^{-\alpha }\right\}z>b. \ end {ases}} , когда распределение M n {\ displaystyle M_ {n}}M_ {n} имеет тяжелый хвост (включая распад полинома). Также известен как Тип 2.

Во всех случаях α>0 {\ displaystyle \ alpha>0}\alpha>0 .

Теория многих переменных

Теория экстремальных значений более чем одной переменной вызывает дополнительные проблемы, которые необходимо решить. Одна из возникающих проблем состоит в том, что нужно указать, что составляет экстремальное событие. Хотя это просто в одномерном случае, нет однозначного способа сделать это в многомерном случае. Основная проблема заключается в том, что, хотя можно упорядочить набор действительных чисел, нет естественного способа упорядочить набор векторов.

В качестве примера, в одномерном случае, учитывая набор наблюдений xi {\ displaystyle x_ {i}}x_ {i} , легко найти наиболее экстремальное событие, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае, учитывая набор наблюдений (xi, yi) {\ displaystyle (x_ {i}, y_ {i})}{\ displaystyle (x_ { i}, y_ {i})} , не сразу понятно, как найти самое экстремальное событие. Предположим, что измерены значения (3, 4) {\ displaystyle (3,4)}{\ displaystyle (3,4)} в определенное время, а значения (5, 2) {\ displaystyle (5, 2)}{\ displaystyle (5,2)} позднее. Какое из этих событий можно было бы считать более экстремальным? На этот вопрос нет универсального ответа.

Еще одна проблема в многомерном случае заключается в том, что ограничивающая модель не так полно предписана, как в одномерном случае. В одномерном случае модель (GEV distribution ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точный вид которой не предписывается теорией. Однако эта функция должна подчиняться определенным ограничениям.

В качестве примера приложения к исследованию океана была применена теория двумерных экстремальных значений.

См. Также

Примечания

Ссылки

  • Abarbanel, H.; Кунин, С.; Levine, H.; MacDonald, G.; Ротхаус, О. (январь 1992 г.), «Статистика экстремальных явлений в применении к климату» (PDF), ДЖЕЙСОН, JSR-90-30S, получено 03.03.2015
  • Альварадо, Эрнесто; Сандберг, Дэвид V.; Пикфорд, Стюарт Г. (1998), «Моделирование больших лесных пожаров как экстремальных явлений» (PDF), Northwest Science, 72 : 66–75, заархивировано из оригинала (PDF) от 26 февраля 2009 г., получено 06 февраля 2009 г.
  • Balkema, A.; Laurens (1974), «Остаточная продолжительность жизни в преклонном возрасте», Annals of Probability, 2 (5): 792–804, doi : 10.1214 / aop / 1176996548, JSTOR 2959306
  • Берри К.В. (1975). Статистические методы в прикладной науке. John Wiley Sons.
  • Кастильо Э. (1988) Теория экстремальных ценностей в инженерии. Academic Press, Inc. Нью-Йорк. ISBN 0-12-163475-2.
  • Кастильо, Э., Хади, А.С., Балакришнан, Н. и Сарабия, Дж. М. (2005) Экстремальные и связанные модели с приложениями в области инженерии и науки, серия Wiley по вероятности и статистике. Wiley, Hoboken, New Jersey. ISBN 0-471-67172-X.
  • Коулс С. (2001) Введение в статистическое моделирование экстремальных значений. Спрингер, Лондон.
  • Эмбрехтс П., Клюппельберг К. и Микош Т. (1997) Моделирование экстремальных событий для страхования и финансов. Берлин: Spring Verlag
  • Fisher, R.A.; Типпетт, L.H.C. (1928), "Предельные формы частотного распределения наибольшего и наименьшего члена выборки", Proc. Camb. Фил. Soc., 24 (2): 180–190, Bibcode : 1928PCPS... 24..180F, doi : 10.1017 / s0305004100015681
  • Гнеденко, Б.В. (1943), "Sur la distribution limit du terme maximum d'une serie aleatoire", Annals of Mathematics, 44(3): 423–453, doi : 10.2307 / 1968974, JSTOR 1968974
  • Гамбель, EJ (1935), «Les valeurs extrêmes des distributions statistiques» (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158, извлечено 2009-04- 01
  • Gumbel, EJ (2004) [1958], Statistics of Extremes, Mineola, NY: Dover, ISBN 978-0-486-43604-3
  • Макконен, Л. (2008), «Проблемы при анализе экстремальных значений», Структурная безопасность, 30 (5): 405–419, doi : 10.1016 / j.strusafe.2006.12.001
  • Лидбеттер, М.Р. (1991), «На основе моделирования« Пики выше порогового значения »», Статистические и вероятностные письма, 12 (4): 357–362, doi : 10.1016 / 0167-7152 (91) 90107-3
  • Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1982) Крайности и связанные свойства случайных последовательностей и процессов. Springer-Verlag, Нью-Йорк.
  • Lindgren, G.; Рутцен, Х. (1987), «Экстремальные значения: теория и технические приложения», Скандинавский журнал статистики, теории и приложений, 14 : 241–279
  • Новак С.Ю. (2011) Экстремальные методы ценности с приложениями к финансам. Chapman Hall / CRC Press, Лондон. ISBN 978-1-4398-3574-6
  • Пикандс, Дж. (1975), «Статистический вывод с использованием статистики крайнего порядка», Annals of Statistics, 3 : 119–131, doi : 10.1214 / aos / 1176343003

Программное обеспечение

Внешние ссылки

Последняя правка сделана 2021-05-19 10:22:52
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте