Грид-вычисления

редактировать
Использование широко распределенных компьютерных ресурсов для достижения общей цели

Грид-вычисления - это использование широко распространенных компьютер ресурсы для достижения общей цели. Вычислительную сетку можно представить как распределенную систему с неинтерактивными рабочими нагрузками, включающими множество файлов. Грид-вычисления отличаются от традиционных высокопроизводительных вычислительных систем, таких как кластерные вычисления, в которых в сетевых компьютерах каждый узел установлен для выполнения разных задач / приложений. Грид-компьютеры также имеют тенденцию быть более разнородными и географически рассредоточенными (таким образом, физически не связанными), чем кластерные компьютеры. Хотя отдельная сетка может быть выделена для конкретного приложения, обычно сетка используется для различных целей. Сетки часто создаются с помощью программных библиотек общего назначения промежуточного программного обеспечения. Размеры грид могут быть довольно большими.

Грид - это форма распределенных вычислений, при которой «супер виртуальный компьютер» состоит из множества сетевых слабосвязанных компьютеров, действующих вместе для выполнять большие задачи. Для некоторых приложений распределенные или грид-вычисления можно рассматривать как особый тип параллельных вычислений, который полагается на полные компьютеры (со встроенными процессорами, хранилищем, источниками питания, сетевыми интерфейсами и т. Д.), Подключенными к компьютерная сеть (частная или общедоступная) с помощью обычного сетевого интерфейса, такого как Ethernet. Это контрастирует с традиционным представлением о суперкомпьютере, в котором множество процессоров соединены локальной высокоскоростной компьютерной шиной.

Содержание
  • 1 Обзор
  • 2 Сравнение сеток и обычные суперкомпьютеры
  • 3 Соображения дизайна и варианты
  • 4 Сегментация рынка сетевых вычислений
    • 4.1 Сторона провайдера
    • 4.2 Сторона пользователя
  • 5 Очистка ЦП
  • 6 История
    • 6.1 Прогресс
  • 7 Самые быстрые виртуальные суперкомпьютеры
  • 8 Проекты и приложения
    • 8.1 Определения
  • 9 См. Также
    • 9.1 Понятия, связанные с данным
    • 9.2 Альянсы и организации
    • 9.3 Производственные сети
    • 9.4 Международные проекты
    • 9.5 Национальные проекты
    • 9.6 Стандарты и API
    • 9.7 Структуры мониторинга
  • 10 Ссылки
    • 10.1 Библиография
Обзор

Грид-вычисления объединяют компьютеры из нескольких административных доменов в достичь общей цели, решить единственную задачу, а потом так же быстро может исчезнуть.

Размер сети может варьироваться от небольшого (например, ограниченного сетью компьютерных рабочих станций внутри корпорации) до крупных общественных коллективов во многих компаниях и сетях. «Понятие ограниченной сетки также может быть известно как взаимодействие внутри узлов, тогда как понятие более широкой и широкой сетки может, таким образом, относиться к взаимодействию между узлами».

Сетки представляют собой форму распределенные вычисления, в соответствии с которыми «супервиртуальный компьютер» состоит из множества сетевых слабосвязанных компьютеров, действующих вместе для выполнения очень больших задач. Эта технология применялась к ресурсоемким научным, математическим и академическим задачам с помощью добровольных вычислений, и она используется на коммерческих предприятиях для таких разнообразных приложений, как открытие лекарств, экономика прогнозирование, сейсмический анализ и бэк-офис обработка данных в поддержку электронной коммерции и веб-сервисов.

Координационные приложения в гридах может быть сложной задачей, особенно при координации потока информации через распределенные вычислительные ресурсы. Системы рабочих процессов сетки были разработаны как специализированная форма системы управления рабочими процессами, разработанная специально для составления и выполнения серии этапов вычислений или обработки данных или рабочего процесса в контексте сетки.

Сравнение гридов и обычных суперкомпьютеров

«Распределенные» или «сеточные» вычисления в целом - это особый тип параллельных вычислений, которые основаны на полных компьютерах (со встроенными ЦП, хранилище, источники питания, сетевые интерфейсы и т. д.), подключенные к сети (частной, общедоступной или Интернет ) с помощью обычного сетевого интерфейса, производящего серийное оборудование, по сравнению с более низкой эффективностью проектирования и изготовления небольшого числа специализированных суперкомпьютеров. Основной недостаток производительности заключается в том, что различные процессоры и локальные хранилища не имеют высокоскоростных соединений. Таким образом, такая компоновка хорошо подходит для приложений, в которых несколько параллельных вычислений могут выполняться независимо, без необходимости передавать промежуточные результаты между процессорами. Высококачественная масштабируемость географически распределенных сетей в целом благоприятна из-за низкой потребности в подключении между узлами по сравнению с пропускной способностью общедоступного Интернета.

Там Также есть некоторые отличия в программировании и MC. Написание программ, которые могут работать в среде суперкомпьютера, который может иметь настраиваемую операционную систему, или требовать, чтобы программа решала проблемы параллелизма, может быть дорогостоящим и трудным. Если проблема может быть адекватно распараллелена, «тонкий» слой «грид-инфраструктуры» может позволить обычным автономным программам, учитывая разные части одной и той же проблемы, работать на нескольких машинах. Это дает возможность писать и отлаживать на одном обычном компьютере и устраняет сложности из-за того, что несколько экземпляров одной и той же программы одновременно работают в одной и той же общей памяти и пространстве хранения.

Конструктивные соображения и варианты

Одной из особенностей распределенных гридов является то, что они могут быть сформированы из вычислительных ресурсов, принадлежащих одному или нескольким частным лицам или организациям (известным как несколько административных доменов ). Это может облегчить коммерческие транзакции, как в служебных вычислениях, или упростить сборку сетей добровольных вычислений.

Одним из недостатков этой функции является то, что компьютеры, которые фактически выполняют вычисления, могут быть не совсем надежными. Таким образом, разработчики системы должны принять меры для предотвращения сбоев в работе или получения злонамеренных участников ложных, вводящих в заблуждение или ошибочных результатов и использования системы в качестве вектора атаки. Это часто включает случайное распределение работы по разным узлам (предположительно с разными владельцами) и проверку того, что как минимум два разных узла сообщают одинаковый ответ для данной единицы работы. Несоответствия могут идентифицировать неисправные и вредоносные узлы. Однако из-за отсутствия централизованного управления оборудованием невозможно гарантировать, что узлы не выпадут из сети в случайное время. Некоторые узлы (например, ноутбуки или коммутируемые интернет-клиенты) также могут быть доступны для вычислений, но не для сетевых коммуникаций в течение непредсказуемых периодов. Эти вариации можно учесть, назначив большие рабочие единицы (таким образом, уменьшив потребность в непрерывном сетевом подключении) и переназначив рабочие единицы, когда данный узел не может сообщить о своих результатах в ожидаемое время.

Еще один набор проблем, которые можно было бы назвать проблемами социальной совместимости на заре грид-вычислений, связанных с целями разработчиков грид-технологий по вывозу своих инноваций за пределы исходной области высокопроизводительных вычислений и через дисциплинарные границы в новые области, например, в физике высоких энергий.

Влияние доверия и доступности на производительность и сложность разработки может повлиять на выбор развертывания в выделенном кластере, простаивающих машин внутри развивающейся организации или открытая внешняя сеть волонтеров или подрядчиков. Во многих случаях участвующие узлы должны доверять центральной системе, чтобы она не злоупотребляла предоставленным доступом, вмешиваясь в работу других программ, искажая хранимую информацию, передавая личные данные или создавая новые дыры в безопасности. В других системах используются меры по уменьшению степени доверия «клиентским» узлам к центральной системе, например, размещение приложений на виртуальных машинах.

Общедоступные системы или системы, пересекающие административные области (включая разные отделы в одной организации), часто приводят к необходимости работать на гетерогенных системах с использованием разных операционных систем и аппаратные архитектуры. Для многих языков существует компромисс между инвестициями в разработку программного обеспечения и количеством поддерживаемых платформ (и, следовательно, размером результирующей сети). Межплатформенные языки могут уменьшить необходимость идти на этот компромисс, хотя потенциально за счет высокой производительности на любом заданном узле (из-за интерпретации во время выполнения или отсутствия оптимизации для конкретная платформа). В различных проектах промежуточного программного обеспечения была создана общая инфраструктура, позволяющая различным научным и коммерческим проектам использовать конкретную связанную сетку или с целью создания новых гридов. BOINC часто используется для различных академических проектов, ищущих общественных волонтеров; другие перечислены в конце статьи.

Фактически, промежуточное ПО можно рассматривать как слой между аппаратным и программным обеспечением. Помимо промежуточного программного обеспечения, необходимо учитывать ряд технических областей, которые могут быть или не быть независимыми от промежуточного программного обеспечения. Примеры областей включают SLA управление, доверие и безопасность, управление виртуальной организацией, управление лицензиями, порталы и управление данными. Об этих технических областях можно позаботиться в коммерческом решении, хотя передовая часть каждой области часто находится в рамках конкретных исследовательских проектов, посвященных данной области.

Сегментация рынка распределенных вычислений

Для сегментации рынка распределенных вычислений необходимо учитывать две точки зрения: со стороны поставщика и со стороны пользователя:

сторона провайдера

Общий рынок электросетей включает несколько специфических рынков. Это рынок промежуточного программного обеспечения для сетей, рынок сетевых приложений, рынок служебных вычислений и рынок программного обеспечения как услуги (SaaS).

Grid промежуточное ПО - это особый программный продукт, который обеспечивает совместное использование гетерогенных ресурсов и виртуальных организаций. Он устанавливается и интегрируется в существующую инфраструктуру вовлеченной компании или компаний и обеспечивает специальный уровень, расположенный между разнородной инфраструктурой и конкретными пользовательскими приложениями. Основное промежуточное программное обеспечение grid: Globus Toolkit, gLite и UNICORE.

Коммунальные вычисления упоминаются как предоставление grid-вычислений и приложений как услуги либо как открытая сеточная утилита. или как хостинговое решение для одной организации или VO. Основными игроками на рынке коммунальных вычислений являются Sun Microsystems, IBM и HP.

Grid-приложения - это специальные программные приложения, которые могут использовать грид-инфраструктуру. Это стало возможным благодаря использованию промежуточного программного обеспечения grid, как указано выше.

Программное обеспечение как услуга (SaaS) - это «программное обеспечение, которое принадлежит, доставляется и управляется удаленно одним или несколькими поставщиками». (Gartner 2007) Кроме того, приложения SaaS основаны на едином наборе общих кодов и определений данных. Они используются по модели «один ко многим», а SaaS использует модель Pay As You Go (PAYG) или модель подписки, основанную на использовании. Провайдеры SaaS не обязательно сами владеют вычислительными ресурсами, которые необходимы для работы их SaaS. Поэтому поставщики SaaS могут использовать рынок коммунальных услуг. Рынок коммунальных услуг предоставляет вычислительные ресурсы поставщикам SaaS.

Пользовательская сторона

Для компаний, занимающихся спросом или пользователем на рынке распределенных вычислений, различные сегменты имеют существенное значение для их стратегии развертывания ИТ. Стратегия развертывания ИТ, а также тип инвестиций в ИТ являются важными аспектами для потенциальных пользователей сети и играют важную роль для внедрения сети.

очистка ЦП

очистка ЦП, очистка цикла или общие вычисления создает «сетку» из простаивающих ресурсов в сети участники (как во всем мире, так и внутри организации). Как правило, этот метод использует «запасные» командные циклы, возникающие из-за периодического бездействия, которое обычно происходит ночью, во время обеденных перерывов или даже во время (сравнительно незначительных, хотя и многочисленных) моментов ожидания, что современный рабочий стол Работа ЦП в течение дня (, когда компьютер ожидает ввода-вывода от пользователя, сети или хранилища ). На практике участвующие компьютеры также предоставляют некоторый поддерживаемый объем дискового пространства для хранения, ОЗУ и пропускную способность сети в дополнение к чистой мощности ЦП.

Многие проекты добровольных вычислений, такие как BOINC, используйте модель очистки ЦП. Поскольку узлы могут время от времени отключаться, так как их владельцы используют свои ресурсы для своей основной цели, эта модель должна быть разработана для обработки таких непредвиденных обстоятельств.

Создание оппортунистической среды - это еще одна реализация очистки ЦП, при которой специальная система управления рабочими нагрузками собирает простаивающие настольные компьютеры для выполнения ресурсоемких задач, она также называется Enterprise Desktop Grid (EDG). Например, HTCondor программный фреймворк с открытым исходным кодом для высокопроизводительных вычислений для крупномасштабной распределенной рационализации вычислительно-ресурсоемких задач можно настроить для использования только настольных компьютеров, на которых клавиатура и мышь простаивают, для эффективного использования израсходованного ЦП. питание от простаивающих настольных рабочих станций. Как и другие полнофункциональные пакетные системы, HTCondor предоставляет механизм очередей заданий, политику планирования, схему приоритетов, мониторинг ресурсов и управление ресурсами. Он также может использоваться для управления рабочей нагрузкой на выделенном кластере компьютеров или может легко интегрировать как выделенные ресурсы (монтируемые в стойку кластеры), так и невыделенные настольные машины (циклическая очистка) в одной вычислительной среде.

История

Термин «сетевые вычисления» возник в начале 1990-х годов как метафора для упрощения доступа к компьютерной энергии, как к электросети . Метафора энергосистемы для доступных вычислений быстро стала канонической, когда Ян Фостер и Карл Кессельман опубликовали свою основополагающую работу «Grid: Blueprint для новой вычислительной инфраструктуры» (1999). Этому десятилетиями предшествовала метафора служебных вычислений (1961): вычисления как общественная полезность, аналогичная телефонной системе.

очистка ЦП и добровольные вычисления были популяризированы, начиная с 1997 г. distribution.net, а затем в 1999 г. SETI @ home, чтобы использовать возможности сетевых ПК по всему миру для решения исследовательских задач, требующих интенсивного использования ЦП.

Идеи грида (в том числе идеи распределенных вычислений, объектно-ориентированного программирования и веб-сервисов) были объединены Яном Фостером и из Чикагского университета, и Карл Кессельман из Института информационных наук Университета Южной Калифорнии . Трио, возглавлявшее усилия по созданию Globus Toolkit, широко известно как «отцов сети». Этот инструментарий включает не только управление вычислениями, но также управление хранилищем, обеспечение безопасности, перемещение данных, мониторинг и набор инструментов для разработки дополнительных услуг на основе той же инфраструктуры, включая согласование соглашений, механизмы уведомления, триггерные службы и агрегирование информации. Хотя Globus Toolkit остается фактическим стандартом для построения грид-решений, был создан ряд других инструментов, отвечающих определенному подмножеству сервисов, необходимых для создания корпоративной или глобальной грид-сети.

В 2007 году термин приобрели популярность облачные вычисления, которые концептуально аналогичны каноническому определению Фостера грид-вычислений (с точки зрения потребляемых вычислительных ресурсов, поскольку электроэнергия поступает из энергосистемы ) и более ранних коммунальных вычислений. Действительно, грид-вычисления часто (но не всегда) связаны с поставкой систем облачных вычислений, как это продемонстрировано системой AppLogic из 3tera.

Progress

В ноябре 2006 года Зайдель получил Премия Сидни Фернбаха на конференции по суперкомпьютерам в Тампе, Флорида. «За выдающийся вклад в разработку программного обеспечения для высокопроизводительных вычислений и грид-вычислений, позволяющего проводить совместные численные исследования сложных проблем физики, в частности, моделирования столкновений черных дыр». Эта награда, которая является одной из высших наград в области вычислений, была присуждена за его достижения в области числовой теории относительности.

Самые быстрые виртуальные суперкомпьютеры
  • По состоянию на 7 апреля 2020 года BOINC - 29,8 PFLOPS.
  • По состоянию на март 2020 года Folding @ home - 1,1 exaFLOPS.
  • По состоянию на февраль 2018 г., Einstein @ Home - 3,489 PFLOPS.
  • По состоянию на 7 апреля 2020 года SETI @ Home - 1,11 PFLOPS.
  • По состоянию на 7 апреля 2020 года MilkyWay @ Home - 1,465 PFLOPS.
  • По состоянию на март 2019 года GIMPS - 0,558 PFLOPS.

Кроме того, по состоянию на март 2019 года Биткойн-сеть имела измеренную вычислительную мощность, эквивалентную более 80000 exaFLOPS (операций с плавающей запятой в секунду). Это измерение отражает количество FLOPS, необходимое для равного хэш-вывода сети Биткойн, а не ее пропускную способность для общих арифметических операций с плавающей запятой, поскольку элементы сети Биткойн (майнинг биткойнов ASIC ) выполняют только конкретное криптографическое вычисление хэша, требуемое протоколом Биткойн.

Проекты и приложения

Грид-вычисления предлагают способ решения проблем Grand Challenge, таких как сворачивание белков, финансовое моделирование, Моделирование землетрясений, и климата, / погоды,, и было неотъемлемой частью создания Большого адронного коллайдера в ЦЕРНе. Гриды предлагают способ оптимального использования ресурсов информационных технологий внутри организации. Они также предоставляют средства для предложения информационных технологий в качестве полезности для коммерческих и некоммерческих клиентов, причем эти клиенты платят только за то, что они используют, например, за электричество или воду.

По состоянию на октябрь 2016 года более 4 миллионов машин, на которых работает платформа Открытая инфраструктура Berkeley для сетевых вычислений (BOINC) с открытым исходным кодом, являются членами World Community Grid. Одним из проектов, использующих BOINC, является SETI @ home, который использовал более 400 000 компьютеров для достижения 0,828 TFLOPS по состоянию на октябрь 2016 г. По состоянию на октябрь 2016 г. Folding @ home, которая не является частью BOINC, достигла более 101 петафлопс в эквиваленте x86 на более чем 110 000 машин.

Европейский Союз финансировал проекты через рамочные программы Европейской комиссии. (Бизнес-эксперименты в сети) - это исследовательский проект, финансируемый Европейской комиссией как интегрированный проект в рамках спонсорской программы Шестой рамочной программы (FP6). Начатый 1 июня 2006 года, проект длился 42 месяца, до ноября 2009 года. Проект координировал Atos Origin. Согласно информационному бюллетеню проекта, их миссия состоит в том, чтобы «установить эффективные маршруты для содействия внедрению грид-вычислений в ЕС и стимулировать исследования инновационных бизнес-моделей с использованием грид-технологий». Чтобы извлечь передовой опыт и общие темы из экспериментальных реализаций, две группы консультантов анализируют серию пилотных проектов: одну техническую, другую - бизнес. Проект важен не только своей длительностью, но и своим бюджетом, который составляет 24,8 миллиона евро, что является крупнейшим из всех интегрированных проектов FP6. Из них 15,7 миллиона предоставлены Европейской комиссией, а оставшаяся часть - 98 компаниями-партнерами. С момента окончания проекта результаты BEinGRID были приняты и реализованы.

Проект «Обеспечивающие сети для E-sciencE», основанный в Европейском Союзе и включающий сайты в Азии и США, был продолжением проекта European DataGrid (EDG) и превратилась в Европейскую сетевую инфраструктуру. Это, наряду с LHC Computing Grid (LCG), было разработано для поддержки экспериментов с использованием CERN большого адронного коллайдера. Список активных сайтов, участвующих в LCG, можно найти в Интернете, как и мониторинг инфраструктуры EGEE в реальном времени. Соответствующее программное обеспечение и документация также общедоступны. Есть предположение, что выделенные оптоволоконные каналы, такие как те, которые установлены ЦЕРНом для удовлетворения потребностей LCG в обработке данных, могут однажды стать доступными для домашних пользователей, тем самым предоставляя интернет-услуги со скоростью до 10 000 раз быстрее, чем традиционное широкополосное соединение. Европейская грид-инфраструктура также использовалась для других исследовательских работ и экспериментов, таких как моделирование онкологических клинических испытаний.

Проект distribution.net был начат в 1997 году..180>Усовершенствованный суперкомпьютерный центр NASA (NAS) запускал генетические алгоритмы с использованием мусорщика цикла Condor, работающего примерно на 350 Sun Microsystems и SGI рабочие станции.

В 2001 году United Devices руководила Проектом исследования рака United Devices на основе своего продукта Grid MP, который циклически очищает компьютеры добровольцев. подключен к Интернету. Перед закрытием в 2007 году проект выполнялся примерно на 3,1 миллионах компьютеров.

Определения

Сегодня существует множество определений grid-вычислений:

  • В его статье «Что такое Grid? Контрольный список из трех пунктов », Ян Фостер перечисляет следующие основные атрибуты:
  • Плащак / Велнер определяют грид-технологию как «технологию, которая обеспечивает виртуализацию ресурсов, предоставление по запросу и совместное использование услуг (ресурсов) между организациями».
  • IBM определяет грид-вычисления как «возможность, используя набор открытых стандартов и протоколов, получать доступ к приложениям и данным, вычислительной мощности, емкости хранения и огромному количеству других вычислительных ресурсов через Интернет. Грид - это тип параллельной и распределенной системы, которая обеспечивает совместное использование, выбор и агрегацию ресурсов, распределенных по «нескольким» административным доменам, в зависимости от их доступности (ресурсов), емкости, производительности, стоимости и требований пользователей к качеству обслуживания.
  • Более ранним примером представления о вычислениях как о полезности был в 1965 году Фернандо Корбато из Массачусетского технологического института. Корбато и другие разработчики операционной системы Multics представили компьютерный комплекс, работающий «как энергетическая компания или компания водоснабжения».
  • Буйя / Венугопал определяют сеть как «тип параллельной и распределенной системы, которая позволяет совместно использовать, выбор и агрегирование географически распределенных автономных ресурсов динамически во время выполнения в зависимости от их доступности, возможностей, производительности, стоимости и требований пользователей к качеству обслуживания ».
  • CERN, один из крупнейшие пользователи грид-технологий говорят о Grid : «службе для совместного использования мощности компьютеров и емкости хранения данных через Интернет.”
См. также

Понятия, связанные с данным

Альянсы и организации

Производственные сети

Международные проекты

ИмяРегионНачалоКонец
Европейская грид-инфраструктура (EGI)Европамай 2010 г.декабрь 2014 г.
Открытая инфраструктура промежуточного программного обеспечения Институт Европы (OMII-Europe)Европамай 2006 г.май 2008 г.
Включение гридов для E-sciencE (EGEE, EGEE II и EGEE III)Европамарт 2004 г.апрель 2010 г.
Grid-enabled Remote Instrumentation with Distributed Control and Computing (GridCC)Европасентябрь 2005 г.сентябрь 2008 г.
Европейская инициатива по промежуточному программному обеспечению (EMI)Европамай 2010 г.активный
KnowARC Европаиюнь 2006 г.ноябрь 2009 г.
Nordic Data Grid Facility Скандинавия и Финляндияиюнь 2006 г.декабрь 2012 г.
World Community Grid Global20 ноября 04активный
XtreemOS Европаиюнь 2006 г.(май 2010 г.) доб. по сентябрь 2010 г.
OurGrid Бразилиядекабрь 2004 г.активны

Национальные проекты

Стандарты и API

Платформа мониторинга

Ссылки

Библиография

Последняя правка сделана 2021-05-22 10:48:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте