МОЩНОСТЬ7

редактировать

МОЩНОСТЬ7
Power7 4ghz 9119 8way chipTop sonic84 IMG 1422.jpg 8-процессорный процессор IBM Power7 4 ГГц (снятый с производства) от IBM 9119
Общая информация
Запущен 2010 г.
Разработано IBM
Представление
Максимум. Тактовая частота процессора От 2,4 ГГц до 4,25 ГГц
Кеш
Кэш L1 32 + 32 КБ / ядро
Кэш L2 256 КБ / ядро
Кэш L3 4 МБ / ядро
Архитектура и классификация
Мин. размер элемента 45 нм
Набор инструкций Power ISA ( Power ISA v.2.06 )
Физические характеристики
Ядра
История
Предшественник МОЩНОСТЬ6
Преемник МОЩНОСТЬ8

POWER7 - это семейство суперскалярных многоядерных микропроцессоров на основе архитектуры набора команд Power ISA 2.06, выпущенной в 2010 году и пришедшей на смену POWER6 и POWER6 +. POWER7 был разработан IBM на нескольких объектах, включая IBM в Рочестере, Миннесота ; Остин, Техас; Essex Junction, VT ; Исследовательский центр Т.Дж. Уотсона, Нью-Йорк; Лаборатории Bromont, QC и IBM Deutschland Research amp; Development GmbH, Бёблинген, Германия. IBM анонсировала серверы на базе POWER7 8 февраля 2010 года.

8-процессорный процессор IBM Power7 4 ГГц и IHS от IBM 9119 IBM Power7, 8-процессорный процессор с тактовой частотой 4 ГГц, лучший по IHS из IBM 9119 8-процессорный нижний процессор IBM Power7 4 ГГц от IBM 9119 Съемный 8-процессорный промежуточный преобразователь IBM Power7 4 ГГц от IBM 9119
СОДЕРЖАНИЕ
  • 1 История
  • 2 Дизайн
  • 3 Технические характеристики
  • 4 МОЩНОСТИ7 +
  • 5 продуктов
  • 6 См. Также
  • 7 ссылки
  • 8 Внешние ссылки
История

В ноябре 2006 года IBM выиграла контракт DARPA на 244 миллиона долларов на разработку архитектуры суперкомпьютера с петафактором до конца 2010 года в рамках проекта HPCS. В контракте также указано, что архитектура должна быть коммерчески доступной. Предложение IBM, PERCS (производительная, простая в использовании, надежная компьютерная система), благодаря которому они выиграли контракт, основано на процессоре POWER7, операционной системе AIX и общей параллельной файловой системе.

Одна из функций, над которой совместно работали IBM и DARPA, - это модификация аппаратного обеспечения адресации и таблицы страниц для поддержки глобального общего пространства памяти для кластеров POWER7. Это позволяет ученым-исследователям программировать кластер, как если бы это была единая система, без использования передачи сообщений. С точки зрения производительности это важно, поскольку некоторые ученые не знакомы с MPI или другими методами параллельного программирования, используемыми в кластерах.

Дизайн

Суперскалярная многоядерная архитектура POWER7 представляет собой существенную эволюцию проекта POWER6, в которой больше внимания уделяется энергоэффективности за счет использования нескольких ядер и одновременной многопоточности (SMT). Архитектура POWER6 была создана с нуля, чтобы максимизировать частоту процессора за счет энергоэффективности. Он достиг замечательной частоты 5 ГГц. В то время как POWER6 оснащен двухъядерным процессором, каждый из которых поддерживает двустороннюю одновременную многопоточность (SMT), процессор IBM POWER 7 имеет до восьми ядер и четыре потока на ядро, что в сумме составляет 32 одновременных потока.

IBM заявила на ISCA 29, что пиковая производительность достигается за счет высокочастотных конструкций с 10–20 задержками FO4 на ступень конвейера за счет энергоэффективности. Однако двоичный модуль с плавающей запятой POWER6 обеспечивает «6- тактный конвейер из 13 FO4 ». Таким образом, конвейер для процессора POWER7 был снова изменен, как и для проектов POWER5 и POWER6. В некотором отношении эта переработка аналогична повороту Intel в 2005 году, когда была оставлена ​​микроархитектура x86 7-го поколения P4.

Характеристики

POWER7 доступен с 4, 6 или 8 физическими ядрами на микрочип, в конструкции от 1 до 32, с до 1024 SMT и немного другой микроархитектурой и интерфейсами для поддержки расширенных / дополнительных спецификаций по отношению к Power ISA. и / или разные системные архитектуры. Например, в Supercomputing (HPC) System Power 775 он упакован как 32-процессорный четырехчиповый модуль (QCM) с 256 физическими ядрами и 1024 SMT. Существует также специальный режим TurboCore, который может отключать половину ядер восьмиядерного процессора, но эти 4 ядра имеют доступ ко всем контроллерам памяти и кеш- памяти L3 на увеличенных тактовых частотах. Это повышает производительность каждого ядра, что важно для рабочих нагрузок, требующих максимальной последовательной производительности за счет снижения параллельной производительности. Режим TurboCore может снизить «затраты на программное обеспечение вдвое для тех приложений, которые лицензируются на каждое ядро, при одновременном повышении производительности этого программного обеспечения на каждое ядро». Новые масштабируемые высокопроизводительные серверы IBM Power 780 с новым режимом оптимизации рабочих нагрузок TurboCore обеспечивают удвоенную производительность на ядро ​​систем на базе POWER6.

Каждое ядро ​​поддерживает четырехстороннюю одновременную многопоточность (SMT). POWER7 имеет приблизительно 1,2 миллиарда транзисторов и имеет размер 567 мм 2, изготовленный по 45-нм техпроцессу. Заметным отличием от POWER6 является то, что POWER7 выполняет инструкции не по порядку, а по порядку. Несмотря на снижение максимальной частоты по сравнению с POWER6 (4,25 ГГц против 5,0 ГГц), каждое ядро ​​имеет более высокую производительность, чем POWER6, в то время как каждый процессор имеет в 4 раза больше ядер.

POWER7 имеет следующие характеристики:

  • 45 нм процесс SOI, 567 мм 2
  • 1,2 миллиарда транзисторов
  • Тактовая частота 3,0–4,25 ГГц
  • макс.4 микросхемы на четырехчиповый модуль
    • 4, 6 или 8 ядер C1 на чип
      • 4 потока SMT на ядро ​​C1 (доступно в AIX 6.1 TL05 (выпуск в апреле 2010 г.) и выше)
      • 12 исполнительных блоков на ядро ​​C1:
        • 2 устройства с фиксированной точкой
        • 2 единицы загрузки / магазина
        • 4 модуля с плавающей запятой двойной точности
        • 1 векторный блок, поддерживающий VSX
        • 1 десятичный блок с плавающей запятой
        • 1 филиал
        • 1 блок регистра условий
    • 32 + 32 КБ кэш-памяти L1 для инструкций и данных (на ядро)
    • Кэш L2 256 КБ (на ядро ​​C1)
    • Кэш L3 4 МБ на каждое ядро ​​C1 с поддержкой до 32 МБ. Кэш реализован в eDRAM, которая не требует такого количества транзисторов на ячейку, как стандартная SRAM, поэтому позволяет использовать кэш большего размера при использовании той же области, что и SRAM.

В технической спецификации дополнительно указывается:

Каждое ядро ​​процессора POWER7 реализует агрессивное выполнение инструкций вне очереди (OoO), чтобы обеспечить высокую эффективность использования доступных путей выполнения. Процессор POWER7 имеет блок последовательности инструкций, который может отправлять до шести инструкций за цикл в набор очередей. Блокам выполнения инструкций может быть передано до восьми инструкций за цикл.

Это дает следующие теоретические показатели производительности одинарной точности (SP) (на основе 8-ядерной реализации 4,14 ГГц):

  • макс 99,36 GFLOPS на ядро
  • макс 794,88 GFLOPS на чип

4 64-битных модуля SIMD на ядро ​​и 128-битный модуль SIMD VMX на ядро ​​могут выполнять 12 операций умножения-сложения за цикл, что дает 24 операции SP FP за цикл. На частоте 4,14 ГГц это дает 4,14 миллиарда * 24 = 99,36 SP GFLOPS, а на 8 ядрах - 794,88 SP GFLOPS.

Пиковая производительность с двойной точностью (DP) составляет примерно половину от максимальной производительности SP.

Для сравнения, последняя микроархитектура от Intel, Haswell (вышедшая на 3 года позже, чем POWER7!), Может выполнять 16 DP FLOP или 32 SP FLOP за цикл (8/16 DP / SP слияния с умножением-сложением на 2 × 256 -разрядные AVX2 векторных единицы FP). На частоте 3,4 ГГц (i7-4770) это означает 108,8 SP GFLOPS на ядро ​​и 435,2 SP GFLOPS на пиковую производительность 4-ядерного чипа, что дает примерно одинаковые уровни производительности на каждое ядро, без учета эффектов или преимуществ Intel Turbo Boost. технология.

Это теоретическое сравнение пиковой производительности справедливо и на практике: POWER7 и i7-4770 получили одинаковые результаты в тестах SPEC CPU2006 с плавающей запятой (однопоточные): 71,5 для POWER7 против 74,0 для i7-4770.

Обратите внимание, что чип POWER7 значительно превзошел (2 × –5 ×) i7 в некоторых тестах (bwaves, cactusADM, lbm), а также был значительно медленнее (2x-3x) в большинстве других. Это указывает на основные архитектурные различия между двумя чипами / материнскими платами / системами памяти и т. Д.: они были разработаны с учетом различных рабочих нагрузок.

Однако в целом, в очень широком смысле, можно сказать, что производительность с плавающей запятой у POWER7 аналогична таковой у Haswell i7.

МОЩНОСТЬ7 +

IBM представила процессор POWER7 + на конференции Hot Chips 24 в августе 2012 года. Это обновленная версия с более высокими скоростями, большим объемом кэш-памяти и встроенными ускорителями. Он изготовлен по 32-нм техпроцессу.

Первыми коробками с процессорами POWER7 + были серверы IBM Power 770 и 780. Чипы имеют до 80 МБ кэш-памяти третьего уровня (10 МБ на ядро), повышенную тактовую частоту (до 4,4 ГГц) и 20 разделов LPAR на ядро.

Продукты

По состоянию на октябрь 2011 года линейка систем на базе POWER7, включая модели IBM Power Systems «Express» (710, 720, 730, 740 и 750), модели Enterprise (770, 780 и 795) и модели высокопроизводительных вычислений (755 и 775).). Корпоративные модели отличаются наличием возможностей Capacity on Demand. Максимальные характеристики приведены в таблице ниже.

Серверы IBM POWER7 и POWER7 +
Имя Количество розеток Количество ядер Тактовая частота процессора
710 Экспресс 1 6 4,2 ГГц
710 Экспресс 1 8 4,2 ГГц
720 Express (8202-E4B, POWER7) 1 8 3,0 ГГц
720 Express (8202-E4D, POWER7 +) 1 8 3,6 ГГц
730 Экспресс 2 12 4,2 ГГц
730 Экспресс 2 16 3,6 ГГц или 4,2 ГГц
740 Экспресс 2 12 4,2 ГГц
740 Экспресс 2 16 3,6 ГГц или 4,2 ГГц
750 Экспресс 4 24 3,72 ГГц
750 Экспресс 4 32 3,22 ГГц или 3,61 ГГц
755 4 32 3,61 ГГц
770 8 48 3,7 ГГц
770 8 64 3,3 ГГц
775 (на узел) 32 256 3,83 ГГц
780 (режим MaxCore) 8 64 3,92 ГГц
780 (режим TurboCore) 8 32 4,14 ГГц
780 (4-розеточный узел) 16 96 3,44 ГГц
795 32 192 3,72 ГГц
795 (режим MaxCore) 32 256 4,0 ГГц
795 (режим TurboCore) 32 128 4,25 ГГц

IBM также предлагает 5 BladeCenters на базе POWER7. Технические характеристики приведены в таблице ниже.

Блейд-серверы IBM POWER7
Имя Количество ядер Тактовая частота процессора Требуются слоты для лезвий
BladeCenter PS700 4 3,0 ГГц 1
BladeCenter PS701 8 3,0 ГГц 1
BladeCenter PS702 16 3,0 ГГц 2
BladeCenter PS703 16 2,4 ГГц 1
BladeCenter PS704 32 2,4 ГГц 2

Следующие суперкомпьютерные проекты используют процессор POWER7:

Смотрите также
использованная литература
внешние ссылки
Последняя правка сделана 2023-03-29 06:37:10
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте