Каскадный отказ

редактировать
Система взаимосвязанных частей, в которой отказ одной или нескольких частей может вызвать отказ других Анимация, демонстрирующая, как единичный отказ может привести к другим сбоям в сети.

A каскадный сбой - это процесс в системе взаимосвязанных частей, в котором отказ одной или нескольких частей может вызвать отказ других частей и так далее. Такой отказ может произойти во многих типах систем, включая системы передачи энергии, компьютерные сети, финансы, транспортные системы, организмы, человеческое тело и экосистемы.

Каскадные отказы могут возникать при выходе из строя одной части системы. Когда это происходит, другие части должны компенсировать отказавший компонент. Это, в свою очередь, приводит к перегрузке этих узлов, вызывая их отказ, побуждая дополнительные узлы отказываться один за другим.

Содержание

  • 1 При передаче энергии
    • 1.1 Примеры
  • 2 В компьютерных сетях
    • 2.1 Признаки
    • 2.2 История
    • 2.3 Пример
  • 3 Каскадный структурный отказ
  • 4 Другое примеры
    • 4.1 Биология
    • 4.2 Электроника
    • 4.3 Финансы
  • 5 Взаимозависимые каскадные отказы
  • 6 Модель для каскадных отказов перегрузки
  • 7 См. также
  • 8 Ссылки
  • 9 Дополнительная литература
  • 10 Внешние ссылки

При передаче электроэнергии

Каскадный отказ является обычным явлением в электрических сетях, когда один из элементов выходит из строя (полностью или частично) и переключает свою нагрузку на соседние элементы в система. Затем эти соседние элементы выходят за пределы своих возможностей, поэтому они становятся перегруженными и перекладывают свою нагрузку на другие элементы. Каскадный отказ - частый эффект, наблюдаемый в высоковольтных системах, где единая точка отказа (SPF) в полностью загруженной или слегка перегруженной системе приводит к внезапному всплеску на всех узлах система. Этот импульсный ток может привести к отказу уже перегруженных узлов, вызывая дополнительные перегрузки и, таким образом, вывести из строя всю систему за очень короткое время.

Этот процесс отказа распространяется каскадом через элементы системы, как рябь на пруду, и продолжается до тех пор, пока практически все элементы в системе не выйдут из строя и / или система не станет функционально отключенной от источника своей нагрузки. Например, при определенных условиях большая энергосистема может выйти из строя после выхода из строя одного трансформатора.

Мониторинг работы системы в реальном времени и разумное отключение частей могут помочь остановить каскад. Другой распространенный метод - вычисление запаса безопасности для системы путем компьютерного моделирования возможных отказов, установление безопасных рабочих уровней, ниже которых ни один из рассчитанных сценариев не приведет к каскадному отказу, и выявление наиболее вероятных частей сети. вызвать каскадные отказы.

Одна из основных проблем предотвращения отказов электрической сети заключается в том, что скорость управляющего сигнала не превышает скорость распространяющейся перегрузки по мощности, т. е. поскольку и управляющий сигнал, и электрическая мощности движутся с одинаковой скоростью, невозможно изолировать отключение, отправив предупреждение заранее, чтобы изолировать элемент.

Вопрос о том, коррелируются ли отказы в электросети, изучался в Daqing Li et al. а также Полом Д.Х. Хайнсом и др.

Примеры

Каскадный отказ вызвал следующие отключения электроэнергии :

В компьютерных сетях

Каскадные сбои также могут возникать в компьютерных сетях (например, Интернет ) в который сетевой трафик серьезно нарушен или остановлен в или между более крупными участками сети из-за сбоя или отключения оборудования или программного обеспечения. В этом контексте каскадный сбой известен под термином каскадный сбой . Каскадный отказ может затронуть большие группы людей и системы.

Причиной каскадного сбоя обычно является перегрузка одного критически важного маршрутизатора или узла, в результате чего узел отключается даже на короткое время. Это также может быть вызвано отключением узла для обслуживания или обновления. В любом случае трафик направляется на другой (альтернативный) путь или через него. В результате этот альтернативный путь становится перегруженным, что приводит к его снижению и т. Д. Это также повлияет на системы, которые зависят от узла в регулярной работе.

Симптомы

Симптомы каскадного сбоя включают: потерю пакетов и высокую сетевую задержку не только для отдельных систем, но и для целых секций. сети или Интернета. Высокая задержка и потеря пакетов вызваны тем, что узлы не могут работать из-за коллапса перегрузки, из-за чего они все еще присутствуют в сети, но без какой-либо полезной связи, проходящей через них. В результате маршруты по-прежнему могут считаться действительными без фактического обеспечения связи.

Если из-за каскадного сбоя происходит отключение достаточного количества маршрутов, весь раздел сети или Интернета может стать недоступным. Хотя это и нежелательно, это может помочь ускорить восстановление после этого сбоя, поскольку время ожидания соединений истекает, и другие узлы откажутся от попыток установить соединения с секциями, которые были отключены, уменьшая нагрузку на задействованные узлы.

Обычным явлением во время каскадного отказа является переходящий отказ, когда секции опускаются, вызывая отказ следующей секции, после чего первая секция возвращается обратно. Эта пульсация может совершать несколько проходов через одни и те же секции или соединительные узлы, прежде чем стабильность будет восстановлена.

История

Каскадные отказы появились сравнительно недавно, со значительным увеличением трафика и высокой взаимосвязью между системами и сетями. Этот термин был впервые применен в этом контексте в конце 1990-х годов голландским ИТ-специалистом и постепенно стал относительно общим термином для такого рода крупномасштабных сбоев.

Пример

Сбои сети обычно запускаются при выходе из строя одного сетевого узла. Первоначально останавливается трафик, который обычно проходит через узел. Системы и пользователи получают ошибки о невозможности доступа к хостам. Обычно резервные системы провайдера реагируют очень быстро, выбирая другой путь через другую магистраль. Путь маршрутизации через этот альтернативный маршрут длиннее, с большим количеством переходов и, следовательно, через большее количество систем, которые обычно не обрабатывают внезапно предложенный объем трафика.

Это может привести к отказу одной или нескольких систем на альтернативном маршруте, создавая аналогичные собственные проблемы.

Также в этом случае затронуты связанные системы. Например, разрешение DNS может дать сбой, и то, что обычно вызывает взаимное соединение систем, может разорвать соединения, которые даже напрямую не задействованы в реальных вышедших из строя системах. Это, в свою очередь, может привести к возникновению проблем с кажущимися несвязанными узлами, которые сами по себе могут вызвать еще один каскадный отказ.

В декабре 2012 года частичная потеря (40%) услуги Gmail произошла во всем мире на 18 минут. Эта потеря обслуживания была вызвана обычным обновлением программного обеспечения балансировки нагрузки, которое содержало ошибочную логику - в этом случае ошибка была вызвана логикой, использующей несоответствующее все вместо более подходящего некоторых. Каскадная ошибка была исправлено путем полного обновления одного узла в сети вместо частичного обновления всех узлов одновременно.

Каскадное разрушение конструкции

Некоторые несущие конструкции с дискретными структурными элементами могут подвергаться «эффекту застежки-молнии», когда разрушение одного элемента конструкции увеличивает нагрузку на соседние элементы. В случае обрушения дорожки Hyatt Regency подвесная дорожка (которая уже была перенапряжена из-за ошибки в конструкции) вышла из строя, когда вышла из строя одна вертикальная штанга подвески, что привело к перегрузке соседних штанг, которые вышли из строя последовательно (т.е. молния ). Мост, который может иметь такое разрушение, называется критическим для разрушения, и многочисленные обрушения моста были вызваны выходом из строя одной детали. Правильно спроектированные конструкции используют соответствующий коэффициент безопасности и / или альтернативные пути нагружения для предотвращения этого типа механического каскадного разрушения.

Другие примеры

Биология

Биохимические каскады существуют в биологии, где небольшая реакция может иметь общесистемные последствия. Одним из отрицательных примеров является ишемический каскад, в котором небольшая ишемическая атака высвобождает токсины, которые убивают гораздо больше клеток, чем исходное повреждение, в результате чего выделяется больше токсинов.. Текущие исследования направлены на то, чтобы найти способ блокировать этот каскад у пациентов с инсультом, чтобы минимизировать ущерб.

При изучении вымирания иногда вымирание одного вида вызывает вымирание многих других. Такая разновидность известна как разновидность краеугольного камня.

Электроника

Другой пример - генератор Кокрофта – Уолтона, который также может испытывать каскадные отказы, в которых отказал один диод . может привести к отказу всех диодов за доли секунды.

Еще одним примером этого эффекта в научном эксперименте было сжатие в 2001 году нескольких тысяч хрупких стеклянных фотоумножителей, использованных в эксперименте Супер-Камиоканде, где Ударная волна, вызванная отказом одного детектора, по-видимому, вызвала взрыв других детекторов в цепной реакции.

Финансы

В финансах риск каскадных сбоев финансовых организаций называется системным риском : банкротство одного финансового учреждения может вызвать банкротство других финансовых учреждений (его контрагентов ), распространяясь по всей системе. Учреждения, которые считаются представляющими системный риск, считаются либо «слишком большими, чтобы потерпеть неудачу » (TBTF), либо «слишком взаимосвязанными, чтобы потерпеть неудачу» (TICTF), в зависимости от того, почему они кажутся представляющими угрозу.

Однако обратите внимание, что системный риск возникает не из-за отдельных организаций как таковых, а из-за взаимосвязей. Подробные модели в экономике и финансах см. В Elliott et al. (2014) и Acemoglu et al. (2015).

Связанный (хотя и отдельный) тип каскадных сбоев в финансах происходит на фондовом рынке, примером которого является Flash Crash 2010.

Для полезной основы для изучения и прогнозирования эффекта каскадных неудач в финансах см. Была разработана структура, основанная на теории сетей и каскадных сбоях, которая предоставляет полезные инструменты для разработчиков политики и для тестирования макропруденциального динамического стресса.

Взаимозависимые каскадные отказы

Рис. 1: Иллюстрация взаимозависимости между различными инфраструктурами Рис. 2. Схематическое изображение перколяционных переходов первого и второго рода. В случае второго порядка гигантская составляющая непрерывно приближается к нулю на пороге перколяции p = p c {\ displaystyle p_ {c}}p_ {c} . В случае первого порядка гигантский компонент скачкообразно приближается к нулю

Разнообразные инфраструктуры, такие как водоснабжение, транспорт, топливные и электростанции. связаны вместе и зависят друг от друга для функционирования, см. Рис. 1. Благодаря этой связи взаимозависимые сети чрезвычайно чувствительны к случайным сбоям, в частности к целевым атакам, таким образом, что сбой небольшой части узлов в одной сети может вызвать итеративный каскад отказов в нескольких взаимозависимых сетях. Электрические отключения часто возникают в результате каскада отказов между взаимозависимыми сетями, и проблема была наглядно продемонстрирована несколькими масштабные отключения электроэнергии, произошедшие в последние годы. Блэкауты - это увлекательная демонстрация той важной роли, которую играют зависимости между сетями. Например, отключение электроэнергии в Италии в 2003 г. привело к массовому отказу железнодорожной сети, систем здравоохранения и финансовых услуг и, Кроме того, сильно повлияли на телекоммуникационные сети. Частичный отказ системы связи, в свою очередь, еще больше повлиял на систему управления электрической сетью, тем самым создав положительную обратную связь по электросети. Этот пример подчеркивает, как взаимозависимость может значительно увеличить ущерб во взаимодействующей сетевой системе. Недавно была разработана структура для изучения каскадных отказов между связанными сетями на основе теории перколяции. Каскадные отказы могут привести к внезапному коллапсу по сравнению с перколяцией в одной сети, где отказ сети является непрерывным, см. Рис. 2. Было показано, что каскадные отказы в пространственно встроенных системах приводят к крайней уязвимости. Для динамического процесса каскадных отказов см. Исх. Модель исправления отказов во избежание каскадных отказов была разработана Ди Муро и др.

Кроме того, было показано, что такие взаимозависимые системы, когда они встроены в космос, чрезвычайно уязвимы для локальных атак или отказов. Выше критического радиуса повреждения отказ может распространиться на всю систему.

Каскадные отказы Распространение локализованных атак на пространственные мультиплексные сети со структурой сообщества изучалось Вакниным и др. Об универсальных особенностях каскадных отказов во взаимозависимых сетях сообщалось Duan et al. Смоляк и др. Разработали метод смягчения каскадных отказов в сетях с использованием локализованной информации.

Подробный обзор каскадных отказов в сложных сетях см. Вальдез и др.

Модель каскадирования перегрузки отказы

Модель каскадных отказов из-за распространения перегрузки - это модель Моттера – Лая. Пространственно-временное распространение таких отказов было изучено Джичаном Чжао и др.

См. Также

Ссылки

Дополнительная литература

Внешние ссылки

Последняя правка сделана 2021-05-14 10:53:05
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте