Общая информация | |
---|---|
Запущен | 2017 г. |
Разработано | IBM |
Общий производитель (и) | |
Представление | |
Максимум. Тактовая частота процессора | 4 ГГц |
Кэш | |
Кэш L1 | 32 + 32 КБ на ядро |
Кэш L2 | 512 КБ на ядро |
Кэш L3 | 120 МБ на чип |
Кэш L4 | через Кентавра |
Архитектура и классификация | |
Мин. размер элемента | 14 нм ( FinFET ) |
Набор инструкций | Power ISA ( Power ISA v.3.0 ) |
Физические характеристики | |
Ядра | |
История | |
Предшественник | МОЩНОСТЬ8 |
Преемник | Мощность10 |
Архитектуры POWER, PowerPC и Power ISA |
---|
NXP (ранее Freescale и Motorola) |
IBM |
|
IBM / Nintendo |
Другой |
Ссылки по теме |
Отменено серым цветом, историческое - курсивом |
|
POWER9 - это семейство суперскалярных, многопоточных, многоядерных микропроцессоров, основанных на Power ISA, анонсированной в августе 2016 года на конференции Hot Chips. Процессоры на базе POWER9 производятся по 14-нм техпроцессу FinFET в 12- и 24-ядерных версиях для масштабирования и масштабирования приложений и, возможно, других вариантов, поскольку архитектура POWER9 открыта для лицензирования и модификации OpenPOWER. Члены фонда.
Summit, второй по скорости суперкомпьютер в мире, основан на POWER9, а также использует графические процессоры Nvidia Tesla в качестве ускорителей.
Ядро POWER9 поставляется в двух вариантах, с четырьмя путями многопоточного один называется SMT4 и восемь-полосные один называется SMT8. Ядра SMT4 и SMT8 похожи в том, что они состоят из ряда так называемых слайсов, обслуживаемых общими планировщиками. Срез - это элементарное 64-битное ядро однопоточной обработки с загрузочным блоком хранения (LSU), целочисленным блоком (ALU) и векторным скалярным блоком (VSU, выполняющим SIMD и с плавающей запятой). Супер-срез представляет собой сочетание двух слоев. Ядро SMT4 состоит из кэша L1 32 КиБ (1 КиБ = 1024 байта), кэша данных L1 32 КБ, блока выборки инструкций (IFU) и блока упорядочения инструкций (ISU), который обрабатывает два суперсреза. Ядро SMT8 имеет два набора кэшей L1, IFU и ISU для подачи четырех супер-слайсов. В результате 12-ядерная и 24-ядерная версии POWER9 состоят из одинакового количества слайсов (по 96 каждого) и одинакового объема кэша L1.
Ядро POWER9, будь то SMT4 или SMT8, имеет 12-ступенчатый конвейер (на пять этапов короче, чем его предшественник, POWER8 ), но стремится сохранить тактовую частоту около 4 ГГц. Это будет первая версия, которая будет включать элементы Power ISA v.3.0, выпущенной в декабре 2015 года, в том числе инструкции VSX-3. Конструкция POWER9 сделана так, чтобы быть модульной и использоваться в большем количестве вариантов процессоров и использоваться для лицензирования в процессе изготовления, отличном от процесса IBM. На кристалле находятся сопроцессоры для сжатия и криптографии, а также большой кэш eDRAM L3 с малой задержкой.
POWER9 поставляется с новой архитектурой контроллера прерываний, называемой «механизм виртуализации внешних прерываний» (XIVE), которая заменяет гораздо более простую архитектуру, которая использовалась в POWER4 - POWER8. XIVE также будет использоваться в Power10.
Оба варианта POWER9 могут поставляться в версиях с отключенными некоторыми ядрами из-за соображений производительности, поскольку такие Raptor Computing Systems сначала продавали 4-ядерные чипы, и даже IBM изначально продавала свои системы AC922 не более чем с 22-ядерными чипами, хотя оба типа На кристаллах микросхем установлено 24 ядра.
На кристалле есть много средств, помогающих с высокой производительностью ввода-вывода вне кристалла:
Чипы POWER9 могут быть выполнены с двумя типами ядер и в конфигурации Scale Out или Scale Up. Ядра POWER9 - это либо SMT4, либо SMT8, причем ядра SMT8 предназначены для систем PowerVM, а ядра SMT4 предназначены для систем PowerNV, которые не используют PowerVM и преимущественно работают под управлением Linux. В POWER9 микросхемы, предназначенные для Scale Out, могут поддерживать напрямую подключаемую память, в то время как микросхемы Scale Up предназначены для использования с машинами с более чем двумя сокетами ЦП и используют буферизованную память.
PowerNV | PowerVM | |
---|---|---|
24 × SMT4 ядро | 12 × SMT8 ядро | |
Уменьшить масштаб | Нимбус | неизвестный |
Увеличить масштаб | Кучевые облака |
На портале IBM для OpenPOWER перечислены три доступных модуля для чипа Nimbus, хотя в варианте Scale-Out SMT8 для PowerVM также используется модуль / сокет LaGrange:
Модули Сфорца использовать массив земли сетки (LGA) 2601-контактный разъем.
Talos II - двухпроцессорная рабочая станция / серверная платформа с процессорами POWER9 SMT4 Sforza; доступны как сервер 2U, сервер 4U, башня или системная плата EATX. Проданный как безопасные и владелец-управляемо бесплатно и с открытым исходным кодом и встроенным программным обеспечением. Первоначально поставляется с вариантами чипов с 4, 8, 18 и 22 ядрами, пока не появятся чипы с большим количеством ядер.
Talos II Lite - однопроцессорный вариант материнской платы Talos II, выполненный на той же печатной плате.
Blackbird - односокетная платформа microATX с использованием процессоров SMT4 Sforza (до 8-ядерного варианта мощностью 160 Вт), 4–8 ядер, 2 слота RAM (с поддержкой до 256 ГиБ )
Barreleye G2 / Zaius - двухпроцессорная серверная платформа на процессорах LaGrange; в корпусе Barreleye G2 и Zaius используется материнская плата Zaius POWER9.
Power Systems AC922 - 2U, 2 × POWER9 SMT4 Monza, до 6 × графических процессоров Nvidia Volta, 2 подключенных ускорителя CAPI 2.0 и 1 ТиБ DDR4 RAM. AC здесь - это сокращение от Accelerated Computing; эта система также известна как «Уизерспун» или «Ньюэлл».
Power Systems L922 - 2U, 1–2 × POWER9 SMT8, 8–12 ядер на процессор, до 4 ТиБ ОЗУ DDR4 (1 ТиБ = 1024 ГиБ), PowerVM под управлением Linux.
Power Systems S914 - 4U, 1 × POWER9 SMT8, 4–8 ядер, до 1 ТиБ ОЗУ DDR4, PowerVM под управлением AIX / IBM i / Linux.
Power Systems S922 - 2U, 1–2 × POWER9 SMT8, 4–10 ядер на процессор, до 4 ТиБ ОЗУ DDR4, PowerVM под управлением AIX / IBM i / Linux.
Power Systems S924 - 4U, 2 × POWER9 SMT8, 8–12 ядер на процессор, до 4 ТиБ ОЗУ DDR4, PowerVM под управлением AIX / IBM i / Linux.
Power Systems H922 - 2U, 1–2 × POWER9 SMT8, 4–10 ядер на процессор, до 4 ТиБ ОЗУ DDR4, PowerVM под управлением SAP HANA (в Linux) с AIX / IBM i на 25% системы.
Power Systems H924 - 4U, 2 × POWER9 SMT8, 8–12 ядер на процессор, до 4 ТиБ ОЗУ DDR4, PowerVM под управлением SAP HANA (в Linux) с AIX / IBM i на 25% системы.
Power Systems E950 - 4U, 2–4 × POWER9 SMT8, 8–12 ядер на процессор, ОЗУ DDR4 с буферизацией до 16 ТиБ
Power Systems E980 - 1–4 × 4U, 4–16 × POWER9 SMT8, 8–12 ядер на процессор, ОЗУ DDR4 с буферизацией до 64 ТиБ
Консоль аппаратного управления 7063-CR2 - 1U, 1 × POWER9 SMT8, 6 ядер, 64-128 ГБ оперативной памяти DDR4.
Magna PE2112GTX - двухпроцессорный сервер высотой 2U для высокопроизводительных вычислений с использованием процессоров LaGrange. Изготовлено Wistron.
Summit и Sierra - Министерство энергетики США вместе с Национальной лабораторией Ок-Ридж и Ливерморской национальной лабораторией заключили контракт с IBM и Nvidia на создание двух суперкомпьютеров Summit и Sierra, основанных на процессорах POWER9 в сочетании с графическими процессорами Nvidia Volta. Эти системы планируется ввести в эксплуатацию в 2017 году. Sierra базируется на вычислительном узле IBM Power Systems AC922. Первые стойки Summit были доставлены в Национальную лабораторию Ок-Ридж 31 июля 2017 года.
MareNostrum 4 - Один из трех кластеров в блоке новых технологий четвертого суперкомпьютера MareNostrum - это кластер POWER9 с графическими процессорами Nvidia Volta. Ожидается, что при установке этот кластер обеспечит вычислительную мощность более 1,5 петафлопс. Блок новых технологий MareNostrum 4 существует для проверки того, могут ли новые разработки быть «подходящими для будущих версий MareNostrum».
Как и его предшественник, POWER9 поддерживается FreeBSD, IBM AIX, IBM i, Linux (как с PowerVM, так и без него) и OpenBSD.
Реализация поддержки POWER9 в ядре Linux началась с версии 4.6 в марте 2016 года.
Red Hat Enterprise Linux (RHEL), SUSE Linux Enterprise (SLES), Debian Linux и CentOS поддерживаются с августа 2018 года.