Симметричная многопроцессорная обработка

редактировать

Схема симметричной многопроцессорной системы

Симметричная многопроцессорная обработка или многопроцессорность с общей памятью ( SMP) включает в себя многопроцессорную компьютерную аппаратную и программную архитектуру, в которой два или более идентичных процессора подключены к одной общей основной памяти, имеют полный доступ ко всем устройствам ввода и вывода и управляются одним Экземпляр операционной системы, который обрабатывает все процессоры одинаково, не резервируя ни одного для специальных целей. Большинство многопроцессорных систем сегодня используют архитектуру SMP. В случае многоядерных процессоров архитектура SMP применяется к ядрам, рассматривая их как отдельные процессоры.

Профессор Джон Д. Кубятович считает, что традиционно системы SMP содержат процессоры без кешей. Каллер и Пал-Сингх в своей книге 1998 года «Параллельная компьютерная архитектура: аппаратно-программный подход» упоминают: «Термин SMP широко используется, но вызывает некоторую путаницу. [...] Более точное описание того, что подразумевается под SMP - это мультипроцессор с разделяемой памятью, в котором стоимость доступа к ячейке памяти одинакова для всех процессоров; то есть у нее одинаковая стоимость доступа, когда доступ фактически осуществляется к памяти. Если местоположение кэшируется, доступ будет быстрее, но время доступа к кэш-памяти и время доступа к памяти одинаковы для всех процессоров ».

Системы SMP - это тесно связанные многопроцессорные системы с пулом однородных процессоров, работающих независимо друг от друга. Каждый процессор, выполняющий разные программы и работающий с разными наборами данных, может совместно использовать общие ресурсы (память, устройство ввода-вывода, система прерываний и т. Д.), Которые соединены с помощью системной шины или кроссбара.

СОДЕРЖАНИЕ

1 Дизайн
2 История
3 использования
4 Достоинства / недостатки
5 Программирование
6 Производительность
7 альтернатив
8 переменных SMP
9 См. Также
10 Ссылки
11 Внешние ссылки

Дизайн

Системы SMP имеют централизованную разделяемую память, называемую основной памятью (MM), работающую под управлением одной операционной системы с двумя или более однородными процессорами. Обычно с каждым процессором связана частная высокоскоростная память, известная как кэш-память (или кэш), для ускорения доступа к данным основной памяти и уменьшения трафика системной шины.

Процессоры могут быть связаны между собой с помощью шин, перекрестных переключателей или ячеистых сетей на кристалле. Узким местом в масштабируемости SMP с использованием шин или перекрестных переключателей является пропускная способность и потребляемая мощность межсоединения между различными процессорами, памятью и дисковыми массивами. Сеточные архитектуры избегают этих узких мест и обеспечивают почти линейную масштабируемость для гораздо большего количества процессоров в жертву программируемости:

С такой архитектурой остаются серьезные проблемы программирования, потому что она требует двух различных режимов программирования; один для самих ЦП и один для соединения между ЦП. Единый язык программирования должен уметь не только разделять рабочую нагрузку, но и понимать локальность памяти, что является серьезным условием для архитектуры на основе сетки.

Системы SMP позволяют любому процессору работать над любой задачей независимо от того, где данные для этой задачи расположены в памяти, при условии, что каждая задача в системе не выполняется на двух или более процессорах одновременно. При надлежащей поддержке операционной системы системы SMP могут легко перемещать задачи между процессорами, чтобы эффективно сбалансировать рабочую нагрузку.

История

Самой ранней производственной системой с несколькими идентичными процессорами была Burroughs B5000, которая работала примерно в 1961 году. Однако во время выполнения это было асимметрично : один процессор ограничивался прикладными программами, а другой процессор в основном обрабатывал операционную систему и аппаратные прерывания. В Burroughs D825 впервые был реализован SMP в 1962 году.

IBM предложила двухпроцессорные компьютерные системы на основе своей System / 360 Model 65 и родственных Model 67 и 67–2. На этих машинах работали операционные системы OS / 360 M65MP и TSS / 360. Другое программное обеспечение, разработанное в университетах, особенно Michigan Terminal System (MTS), использовало оба процессора. Оба процессора могут получать доступ к каналам данных и инициировать ввод-вывод. В OS / 360 M65MP периферийные устройства обычно могут быть подключены к любому процессору, поскольку ядро операционной системы работает на обоих процессорах (хотя и с «большой блокировкой» вокруг обработчика ввода-вывода). Супервизор MTS (UMMPS) может работать на обоих ЦП модели IBM System / 360 67–2. Блокировки супервизора были небольшими и использовались для защиты отдельных общих структур данных, к которым можно было получить доступ одновременно с любого процессора.

Другие мэйнфреймы, поддерживающие SMP, включали UNIVAC 1108 II, выпущенный в 1965 году, который поддерживал до трех процессоров, а также GE-635 и GE-645, хотя GECOS в многопроцессорных системах GE-635 работал асимметрично, в отличие от ведущего-ведомого. Multics на многопроцессорных системах GE-645, которые работали симметрично.

Начиная с версии 7.0 (1972 г.), операционная система TOPS-10 от Digital Equipment Corporation реализовывала функцию SMP, самой ранней системой, работающей на SMP, была система с двумя процессорами DECSystem 1077 с двумя процессорами KI10. Позже система KL10 могла объединять до 8 процессоров в режиме SMP. В противоположность этому, РИК первый многопроцессорной VAX системы, VAX-11/782 был асимметричным, но позже VAX многопроцессорные системы были SMP.

Ранние коммерческие реализации SMP для Unix включали Sequent Computer Systems Balance 8000 (выпущенный в 1984 году) и Balance 21000 (выпущенный в 1986 году). Обе модели были основаны на процессорах National Semiconductor NS32032 с тактовой частотой 10 МГц, каждый из которых имел небольшой кэш со сквозной записью, подключенный к общей памяти для формирования системы с общей памятью. Другой ранней коммерческой реализацией SMP для Unix была система Honeywell Information Systems Italy XPS-100 на базе NUMA, разработанная Дэном Гиланом из VAST Corporation в 1985 году. Ее конструкция поддерживала до 14 процессоров, но из-за электрических ограничений самой крупной продаваемой версией была двухпроцессорная система.. Операционная система была получена и перенесена корпорацией VAST на основе кода ATamp;T 3B20 Unix SysVr3, используемого внутри компании ATamp;T.

Ранее существовали некоммерческие многопроцессорные порты UNIX, в том числе порт под названием MUNIX, созданный в Военно-морской аспирантуре к 1975 году.

Использует

Системы с разделением времени и серверные системы часто могут использовать SMP без изменения приложений, поскольку в них может быть несколько процессов, работающих параллельно, а система с несколькими запущенными процессами может запускать разные процессы на разных процессорах.

На персональных компьютерах SMP менее полезен для приложений, которые не были изменены. Если система редко запускает более одного процесса одновременно, SMP полезен только для приложений, которые были модифицированы для многопоточной (многозадачной) обработки. Программное обеспечение, запрограммированное на заказ, может быть написано или изменено для использования нескольких потоков, так что оно может использовать несколько процессоров.

Многопоточные программы также могут использоваться в системах с разделением времени и в серверных системах, которые поддерживают многопоточность, что позволяет им более эффективно использовать несколько процессоров.

Преимущества недостатки

В современных системах SMP все процессоры тесно связаны внутри одного блока с шиной или коммутатором; в более ранних системах SMP один ЦП занимал весь шкаф. Некоторые из общих компонентов - это глобальная память, диски и устройства ввода-вывода. На всех процессорах работает только одна копия ОС, и ОС должна быть спроектирована так, чтобы использовать преимущества этой архитектуры. Некоторые из основных преимуществ включают рентабельные способы увеличения пропускной способности. Для решения различных проблем и задач SMP применяет несколько процессоров к одной задаче, известной как параллельное программирование.

Однако есть несколько ограничений масштабируемости SMP из-за согласованности кеша и общих объектов.

Программирование

Однопроцессорные системы и системы SMP требуют различных методов программирования для достижения максимальной производительности. Программы, работающие в системах SMP, могут увеличивать производительность, даже если они были написаны для однопроцессорных систем. Это связано с тем, что аппаратные прерывания обычно приостанавливают выполнение программы, в то время как ядро, которое их обрабатывает, может вместо этого выполняться на простаивающем процессоре. Эффект в большинстве приложений (например, игр) заключается не столько в увеличении производительности, сколько в том, что программа работает более плавно. Некоторые приложения, в частности, создание программного обеспечения и некоторые проекты распределенных вычислений, работают быстрее в (почти) раз на количество дополнительных процессоров. (Компиляторы сами по себе являются однопоточными, но при создании программного проекта с несколькими модулями компиляции, если каждый модуль компиляции обрабатывается независимо, это создает неприятно параллельную ситуацию во всем проекте с несколькими модулями компиляции, что позволяет практически линейное масштабирование компиляции. время. Проекты распределенных вычислений изначально параллельны.)

Системные программисты должны встроить поддержку SMP в операционную систему, в противном случае дополнительные процессоры останутся простаивающими, а система будет функционировать как однопроцессорная.

Системы SMP также могут усложнять наборы инструкций. Однородная процессорная система обычно требует дополнительных регистров для «специальных инструкций», таких как SIMD (MMX, SSE и т. Д.), В то время как гетерогенная система может реализовывать различные типы оборудования для разных инструкций / использования.

Представление

Когда одновременно выполняется несколько программ, система SMP имеет значительно лучшую производительность, чем однопроцессор, потому что разные программы могут работать на разных процессорах одновременно. И наоборот, асимметричная многопроцессорная обработка (AMP) обычно позволяет только одному процессору запускать программу или задачу одновременно. Например, AMP можно использовать для назначения конкретных задач ЦП на основе приоритета и важности выполнения задачи. AMP был создан задолго до SMP с точки зрения обработки нескольких процессоров, что объясняет отсутствие производительности на основе приведенного примера.

В случаях, когда среда SMP обрабатывает много заданий, администраторы часто теряют эффективность оборудования. Программное обеспечение было разработано для планирования заданий и других функций компьютера, чтобы использование процессора достигло своего максимального потенциала. Хорошие программные пакеты могут реализовать этот максимальный потенциал за счет отдельного планирования каждого ЦП, а также возможности интеграции нескольких SMP-машин и кластеров.

Доступ к ОЗУ сериализован; это и проблемы с когерентностью кэша приводят к небольшому отставанию производительности от количества дополнительных процессоров в системе.

Альтернативы

Схема типичной SMP-системы. Три процессора подключены к одному модулю памяти через системную шину или кросс-переключатель.

SMP использует одну общую системную шину, которая представляет собой один из самых ранних стилей архитектур многопроцессорных машин, обычно используемый для создания небольших компьютеров с 8 процессорами.

В более крупных компьютерных системах могут использоваться более новые архитектуры, такие как NUMA (неоднородный доступ к памяти), которая выделяет разные банки памяти для разных процессоров. В архитектуре NUMA процессоры могут обращаться к локальной памяти быстрее, а к удаленной памяти - медленнее. Это может значительно улучшить пропускную способность памяти, если данные локализованы для определенных процессов (и, следовательно, процессоров). С другой стороны, NUMA удорожает перемещение данных от одного процессора к другому, как при балансировке рабочей нагрузки. Преимущества NUMA ограничены конкретными рабочими нагрузками, особенно на серверах, где данные часто прочно связаны с определенными задачами или пользователями.

Наконец, есть компьютерная кластерная многопроцессорная обработка (например, Beowulf ), в которой не вся память доступна для всех процессоров. Методы кластеризации довольно широко используются для создания очень больших суперкомпьютеров.

Переменный SMP

Переменная симметричная многопроцессорная обработка (vSMP) - это особая технология мобильного использования, инициированная NVIDIA. Эта технология включает в себя дополнительное пятое ядро в четырехъядерном устройстве, называемое ядром Companion, созданное специально для выполнения задач на более низкой частоте во время активного режима ожидания мобильного устройства, воспроизведения видео и музыки.

Проект Kal-El ( Tegra 3 ), запатентованный NVIDIA, был первым SoC (System on Chip), в котором реализована эта новая технология vSMP. Эта технология не только снижает энергопотребление мобильного устройства в активном режиме ожидания, но также максимизирует производительность четырехъядерного процессора во время активного использования для интенсивных мобильных приложений. В целом эта технология удовлетворяет потребность в увеличении времени автономной работы при активном и резервном использовании за счет снижения энергопотребления мобильных процессоров.

В отличие от текущих архитектур SMP, ядро vSMP Companion прозрачно для ОС, что означает, что операционная система и запущенные приложения совершенно не знают об этом дополнительном ядре, но все же могут использовать его преимущества. Некоторые из преимуществ архитектуры vSMP включают согласованность кэша, эффективность ОС и оптимизацию энергопотребления. Преимущества этой архитектуры объясняются ниже:

Когерентность кэша: нет никаких последствий для синхронизации кешей между ядрами, работающими на разных частотах, поскольку vSMP не позволяет ядру Companion и основным ядрам работать одновременно.
Эффективность ОС: это неэффективно, когда несколько ядер ЦП работают на разных асинхронных частотах, потому что это может привести к возможным проблемам с планированием. С vSMP активные ядра ЦП будут работать с одинаковой частотой для оптимизации планирования ОС.
Оптимизация мощности: в архитектуре на основе асинхронной синхронизации каждое ядро находится на отдельной плоскости питания, чтобы обрабатывать регулировку напряжения для разных рабочих частот. В результате это может повлиять на производительность. Технология vSMP может динамически включать и отключать определенные ядра для активного и резервного использования, снижая общее энергопотребление.

Эти преимущества приводят к тому, что архитектура vSMP значительно выигрывает по сравнению с другими архитектурами, использующими технологии асинхронной синхронизации.

Смотрите также

Асимметричная многопроцессорная обработка
Машина двоичного модульного потока данных
Локаль (компьютерное оборудование)
Массивно параллельный
Разделенное глобальное адресное пространство
Одновременная многопоточность - функциональные элементы ядра ЦП распределяются по нескольким потокам выполнения.
Блокировка программного обеспечения
Ксеон Пхи