Split-brain (вычисления)

редактировать

Split-brain - компьютерный термин, основанный на аналогии с медицинским Split- мозг синдром. Он указывает на несоответствия данных или доступности, возникающие из-за обслуживания двух отдельных наборов данных с перекрытием в области действия, либо из-за серверов в структуре сети, либо из-за состояния отказа, основанного на том, что серверы не обмениваются данными и не синхронизируют свои данные с каждым. Другие. Этот последний случай также обычно называют разделом сети.

. Хотя термин split-brain обычно относится к состоянию ошибки, Split-brain DNS (или Split-horizon DNS ) иногда используется для описания преднамеренной ситуации, когда внутренние и внешние DNS-сервисы для корпоративной сети не взаимодействуют друг с другом, так что отдельные пространства имен DNS администрируются как для внешних компьютеров, так и для внутренних. Это требует двойного администрирования, и если есть доменное перекрытие в именах компьютеров, существует риск того, что одно и то же полное доменное имя (FQDN) может неоднозначно встречаться в обоих пространствах имен, ссылаясь на разные IP-адреса компьютеров.

Кластеры с высокой доступностью обычно используют частную сеть с периодическим сигналом, которая используется для мониторинга работоспособности и статуса каждого узла в кластере. Например, синдром расщепленного мозга может возникнуть, когда все частные ссылки отключаются одновременно, но узлы кластера все еще работают, каждый полагает, что работает только он один. Затем наборы данных каждого кластера могут случайным образом обслуживать клиентов посредством их собственных «идиосинкразических» обновлений набора данных без какой-либо координации с другими наборами данных. Это может привести к повреждению данных или другим несоответствиям данных, которые могут потребовать вмешательства оператора и очистки.

Подходы к работе с раздвоенным мозгом

Дэвидсон и др., Изучив несколько подходов к решению проблемы, классифицируют их как оптимистичные или пессимистические.

Оптимистический подход просто позволяет разделенным узлам работать как обычно; это обеспечивает более высокий уровень доступности за счет принесения в жертву правильности. После устранения проблемы может потребоваться автоматическое или ручное согласование, чтобы кластер находился в согласованном состоянии. Одной из текущих реализаций этого подхода является Hazelcast, который выполняет автоматическое согласование своего хранилища "ключ-значение".

Пессимистические подходы жертвуют доступностью в обмен на согласованность. После обнаружения разбиения сети доступ к подразделам ограничивается, чтобы гарантировать согласованность. Типичный подход, описанный Coulouris et al., Заключается в использовании подхода кворума -консенсуса. Это позволяет подразделу с большинством голосов оставаться доступным, в то время как оставшиеся подразделы должны перейти в режим авто- ограждения. Одной из текущих реализаций этого подхода является тот, который используется наборами реплик MongoDB. И еще одна такая реализация - репликация Galera для MariaDB и MySQL.

Современные коммерческие универсальные HA-кластеры обычно используют комбинацию сетевых подключений периодического действия между узлами кластера и кворум хранилище свидетелей. Проблема с двухузловыми кластерами заключается в том, что добавление устройства-свидетеля увеличивает стоимость и сложность (даже если оно реализовано в облаке), но без него, если тактовый сигнал не работает, члены кластера не могут определить, какое из них должно быть активным. В таких кластерах (без кворума), если член выходит из строя, даже если члены обычно присваивают хостам первичный и вторичный статусы, существует как минимум 50% вероятность того, что двухузловой HA-кластер полностью выйдет из строя, пока не будет обеспечено вмешательство человека., чтобы предотвратить независимую активацию нескольких элементов, а также прямое противоречие или повреждение данных.

Ссылки
Последняя правка сделана 2021-06-09 03:13:22
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте