Неустойчивая неисправность

редактировать

Периодическая неисправность, часто называемая просто «прерывистой», - это неисправность устройства или системы, которая происходит с интервалами, обычно нерегулярными, в устройстве или системе, которые нормально функционируют в другое время. Периодические сбои присущи всем отраслям технологии, включая компьютер программное обеспечение. Периодическая неисправность вызвана несколькими факторами, некоторые из которых могут быть эффективно случайными, которые возникают одновременно. Чем сложнее задействованная система или механизм, тем выше вероятность возникновения периодической неисправности.

Периодические сбои нелегко повторить из-за сложного поведения. Их также иногда называют «мягкими» отказами, поскольку они не проявляются постоянно и исчезают непредсказуемым образом. Напротив, «серьезные» отказы - это постоянные отказы, которые происходят в течение определенного периода времени (или иногда бывают мгновенными). У них есть конкретное место сбоя (место сбоя), режим (как проявляется сбой) и механизм, и для отказавшей системы нет непредсказуемого восстановления. Поскольку периодические сбои нелегко повторить, для них труднее провести анализ отказов, понять их основные причины или изолировать место их отказа, чем для постоянных отказов.

Периодические отказы могут быть причиной случаи отсутствия неисправностей (NFF) в электронных продуктах и ​​системах. NFF подразумевает, что отказ (сбой) произошел или, как сообщалось, произошел во время использования продукта. Продукт был проанализирован или протестирован, чтобы подтвердить отказ, но «отказ или неисправность» обнаружить не удалось. Типичный пример феномена NFF возникает, когда ваш компьютер «зависает». Ясно, что произошел «сбой». Однако, если компьютер перезагружается, он часто снова работает. Влияние NFF и периодических сбоев может быть серьезным. Из-за своих характеристик производители могут предполагать причину (ы), а не тратить время и деньги на определение основной причины. Например, поставщик жестких дисков заявил, что NFF не является неисправностью, и разрешил возвращать все продукты NFF в поле. Позже было установлено, что эти продукты имеют значительно более высокий процент возврата, что позволяет предположить, что состояние NFF на самом деле было результатом периодических сбоев в продукте. В результате увеличились затраты на техническое обслуживание, снизилась доступность оборудования, увеличилось неудобство для клиентов, снизилось доверие клиентов, подорвалась репутация компании и в некоторых случаях возникла потенциальная угроза безопасности.

Простым примером эффективно случайной причины в физической системе является пограничное электрическое соединение в проводке или компонент цепи, где (причина 1, причина, которая должна быть идентифицирована и устранена) два проводника могут соприкоснуться с предметом (причина 2, которую не нужно идентифицировать) незначительное изменение температуры, вибрации, ориентации, напряжения и т. д. (Иногда это описывается как «прерывистое соединение», а не «сбой».) В компьютерном программном обеспечении программа может (причина 1) не выполнить инициализацию переменная, которая должна быть изначально равна нулю; если программа запускается в условиях, когда память почти всегда очищается перед ее запуском, она будет работать со сбоями в тех редких случаях, когда (причина 2) память, где хранится переменная, заранее не равна нулю.

Периодические сбои, как известно, сложно идентифицировать и устранять («устранение неполадок »), потому что каждый отдельный фактор не создает проблему сам по себе, поэтому факторы могут быть идентифицированы только в то время, когда сбой действительно возникает.. Человек, способный определить и решить проблему, редко бывает обычным оператором. Поскольку время сбоя непредсказуемо, а время простоя устройства или системы и время инженеров связаны с затратами, сбой часто просто терпят, если не слишком часто, если он не вызывает неприемлемых проблем или опасности. Например, некоторые периодические сбои в критически важном оборудовании, таком как медицинское оборудование жизнеобеспечения, могут привести к смерти пациента, а в авиации - к прерыванию полета или, в некоторых случаях, к аварии.

Если периодическая неисправность возникает достаточно долго во время поиска и устранения неисправностей, ее можно определить и устранить обычным способом.

Методы устранения неполадок

Некоторые методы устранения периодических сбоев:

  • Может помочь автоматическая регистрация соответствующих параметров в течение достаточно длительного времени для проявления сбоя; значения параметров во время сбоя могут определить причину, чтобы можно было предпринять соответствующие действия по исправлению.
  • Изменение рабочих условий при наличии отказа, чтобы увидеть, исчезнет ли сбой или изменится ли он временно. Например, постучать по компонентам, охладить их морозильным спреем, нагреть. Удар по шкафу может временно устранить неисправность.
  • база данных аналогичных неисправностей, которые были устранены в идентичном или подобном оборудовании.
  • предупредительные изменения без попытки точно определить неисправность. Например, электролитические конденсаторы, подверженные высоким токам пульсаций, можно заменить в обычном порядке, вообще не беспокоясь об устранении неисправности. Разъемы можно отсоединить и переустановить. Иногда это мера отчаяния; все меняется до тех пор, пока неисправность не перестанет происходить, и есть надежда, что она действительно устранена, а не бездействует.
  • В электрических системах и кабельных системах могут использоваться методы рефлектометрии во временной области: импульсы посылаются по электропроводке и отраженные назад импульсы исследуются на предмет аномалий, например, прерывистой утечки во время напряжений при эксплуатации самолета; это может быть выполнено только для одного тестового канала за раз и обычно ограничивается периодическими сбоями>100 миллисекунд.
  • В сложных многоканальных системах, где сбой / с может быть межсоединение, идеальный метод поиска Периодическая неисправность - это возможность непрерывно и одновременно отслеживать, обнаруживать и изолировать все каналы или электрические пути. Эта методология позволяет тестируемой системе получать преимущества от непрерывного и полного тестового покрытия при любых воздействиях окружающей среды на систему. Этот тип не может быть выполнен с помощью технологии сканирования сканирования, но должен иметь какую-либо электронную нейронную сеть, которая может выполнять эти тесты без необходимости какого-либо сканирования и / или цифрового усреднения; этот режим тестирования охвачен MIL-PRF-32516 Министерства обороны США, опубликованным в марте 2015 года, и он призывает к тому, чтобы технология тестирования работала в категории 1, чтобы эффективно бороться с периодическими сбоями.
  • Три основных метода устранения прерывистого поведения в интегральных схемах - это динамическая задержка инструкций, масштабирование частоты ядра и миграция потоков. Когда процессор затрачивает на выполнение процесса больше ожидаемого времени, возникают временная задержка и нарушение синхронизации. Этой ошибки можно избежать, используя такие методы, как динамическая задержка команд. Это тип алгоритма, который вычисляет приоритеты планирования во время работы системы. Цель состоит в том, чтобы динамически реагировать на меняющиеся условия и формировать самодостаточную оптимизированную конфигурацию. Другой подход к уменьшению задержки - это масштабирование частоты ядра, которое снижает производительность ЦП до более низкой частоты, когда требуется меньше, и масштабирует ее до более высокой частоты, когда требуется больше. Миграция потоков - еще один метод, используемый для преодоления периодических сбоев. Поток - это упорядоченный набор инструкций, который точно сообщает компьютеру, что делать. Когда конкретный поток сталкивается с ошибками, содержимое потока в неисправном ядре компьютера передается другому потоку в простаивающем ядре, где проблема решается и решается.
Ссылки
  1. ^ Bakhshi, Roozbeh; Кунче, Сурья; Печт, Майкл (18 февраля 2014 г.). «Периодические сбои в аппаратном и программном обеспечении». Журнал электронной упаковки. 136 (1): 011014. doi : 10.1115 / 1.4026639. ISSN 1043-7398.
  2. ^Qi, H.; Ganesan, S.; Печт, М. (май 2008 г.). «Неисправности и периодические отказы в электронных изделиях». Надежность микроэлектроники. 48 (5): 663–674. doi : 10.1016 / j.microrel.2008.02.003.
  3. ^Пример периодической ошибки ТВ в базе данных «Архивная копия». Архивировано из оригинального 13 апреля 2009 года. Проверено 19 июля 2010 г. CS1 maint: заархивированная копия как заголовок (ссылка ) : «Z3T CHASSIS - NO START UP - INTERMITTENT. D1124 (5.1V) ZENER LEAKY»
  4. ^"Рефлектометрия во временной области с расширенным спектром для Обнаружения периодически возникающих неисправностей Архивировано 01.05.2010 в Archive.today " Фурс, Синтия; Смит, Пол; ЖУРНАЛ IEEE SENSORS, ТОМ. 5, № 6 ДЕКАБРЯ 2005 г. «
  5. ^» Неисправность не обнаружена, повторный тест в порядке, дублирование невозможно или неисправность не обнаружена? - На пути к стандартизированной таксономии [1] «Самир Хан, Пол Филлипс, Крис Хокли, Ян Дженнионс»
Внешние ссылки
Последняя правка сделана 2021-05-24 04:18:15
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте