МОЩНОСТЬ3

редактировать
МОЩНОСТЬ3
Общая информация
Запущен 1998 г.
Разработано IBM
Архитектура и классификация
Набор инструкций PowerPC
История
Предшественник МОЩНОСТЬ2
Преемник МОЩНОСТЬ4
Два процессора IBM POWER3-II 375 МГц на модуле ЦП RS / 6000 44P 270.

POWER3 является микропроцессор, разработанный и исключительно производства IBM, который реализовал 64-разрядную версию PowerPC архитектуры набора команд (ISA), включая все дополнительные инструкции в ISA (в то время), такие как инструкции, присутствующие в Версия POWER2 POWER ISA, но не в PowerPC ISA. Он был представлен 5 октября 1998 года и дебютировал в RS / 6000 43P Model 260, высокопроизводительной графической рабочей станции. Первоначально POWER3 должен был называться PowerPC 630, но был переименован, вероятно, чтобы отличить серверные процессоры POWER, которые он заменил, от более ориентированных на потребителя 32-битных PowerPC. POWER3 был преемником P2SC, производного от POWER2, ​​и завершил давно отложенный переход IBM от POWER к PowerPC, который первоначально планировалось завершить в 1995 году. POWER3 использовался в серверах и рабочих станциях IBM RS / 6000 на частоте 200 МГц. Он конкурировал с Digital Equipment Corporation (DEC) Alpha 21264 и Hewlett-Packard (HP) PA-8500.

СОДЕРЖАНИЕ
  • 1 Описание
  • 2 POWER3-II
  • 3 См. Также
  • 4 Примечания
  • 5 ссылки
Описание
Логическая схема процессора POWER3

POWER3 был основан на PowerPC 620, более ранней 64-битной реализации PowerPC, которая была запоздалой, недостаточно производительной и коммерчески неудачной. Как и PowerPC 620, POWER3 имеет три блока с фиксированной точкой, но один блок с плавающей запятой (FPU) был заменен двумя объединенными блоками умножения-сложения с плавающей запятой, а также был добавлен дополнительный блок загрузки-хранения (всего из двух) для повышения производительности с плавающей запятой. POWER3 - это суперскалярная конструкция, в которой инструкции выполнялись не по порядку. Он имеет семиступенчатый целочисленный конвейер, минимальный восьмиступенчатый конвейер загрузки / сохранения и десятиступенчатый конвейер с плавающей запятой.

Передняя часть состоит из двух этапов: выборки и декодирования. На первом этапе восемь инструкций были извлечены из кэша инструкций 32 КБ и помещены в буфер инструкций с 12 записями. На втором этапе четыре инструкции были взяты из буфера команд, декодированы и отправлены в очереди команд. Ограничений на выдачу инструкций немного: из двух очередей целочисленных инструкций только одна может принимать одну инструкцию, другая может принимать до четырех, как и очередь инструкций с плавающей запятой. Если в очередях недостаточно неиспользуемых записей, инструкции не могут быть выданы. Передняя часть имеет короткий конвейер, что приводит к небольшому штрафу за ошибочное предсказание ветвления за три цикла.

На третьем этапе инструкции в очередях инструкций, готовые к выполнению, читают свои операнды из файлов регистров. Файл регистров общего назначения содержит 48 регистров, из которых 32 - регистры общего назначения, а 16 - регистры переименования для переименования регистров. Чтобы уменьшить количество портов, необходимых для предоставления данных и получения результатов, файл регистров общего назначения дублируется так, чтобы было две копии, первая из которых поддерживает три целочисленных исполнительных блока, а вторая - два блока загрузки / сохранения. Эта схема была похожа на современный микропроцессор DEC Alpha 21264, но была проще, поскольку не требовала дополнительного тактового цикла для синхронизации двух копий из-за более высокого времени цикла POWER3. Файл регистров с плавающей запятой содержит 56 регистров, из которых 32 являются регистрами с плавающей запятой и 24 регистра переименования. По сравнению с PowerPC 620 было больше регистров переименования, что позволяло выполнять больше инструкций не по порядку, повышая производительность.

Казнь начинается на четвертом этапе. Очереди инструкций отправляют до восьми инструкций в исполнительные блоки. Целочисленные инструкции выполняются в трех целочисленных исполнительных модулях (IBM называет их «модулями с фиксированной точкой»). Два модуля идентичны и выполняют все целочисленные инструкции, кроме умножения и деления. Все выполняемые ими инструкции имеют задержку в один цикл. Третий блок выполняет инструкции умножения и деления. Эти инструкции не конвейерные и имеют многоцикловые задержки. 64-битное умножение имеет задержку в девять циклов, а 64-битное деление имеет задержку в 37 циклов.

Инструкции с плавающей запятой выполняются в двух модулях с плавающей запятой (FPU). FPU могут объединять операции умножения и сложения, когда умножение и сложение выполняются одновременно. Такие инструкции, наряду с индивидуальным сложением и умножением, имеют задержку в четыре цикла. Инструкции деления и извлечения квадратного корня выполняются в одних и тех же FPU, но им помогает специализированное оборудование. Инструкции деления с одинарной точностью (32 бита) и извлечения квадратного корня имеют задержку в 14 циклов, тогда как команды деления с двойной точностью (64 бита) и извлечения квадратного корня имеют задержку в 18 и 22 цикла соответственно.

После завершения выполнения инструкции хранятся в буферах, прежде чем будут зафиксированы и сделаны видимыми для программного обеспечения. Выполнение завершается на пятом этапе для целочисленных инструкций и на восьмом этапе для вычислений с плавающей запятой. Фиксация происходит на шестом этапе для целых чисел и девятом этапе для чисел с плавающей запятой. Обратная запись происходит на этапе после фиксации. POWER3 может выводить до четырех инструкций за цикл.

Кэш данных PowerPC 620 оптимизирован для технических и научных приложений. Его емкость была увеличена вдвое до 64 КБ, чтобы повысить скорость попадания в кэш; кэш был двухпортовым, реализованным путем чередования восьми банков, что позволяло в некоторых случаях выполнять две загрузки или два сохранения за один цикл; и размер строки был увеличен до 128 байт. Ширина кэш-шины L2 была увеличена вдвое до 256 бит, чтобы компенсировать больший размер строки кэша и сохранить четырехцикловую задержку для пополнения кэша.

POWER3 содержал 15 миллионов транзисторов на 270 мм 2 головки. Он был изготовлен по технологии IBM CMOS-6S2, дополнительному процессу металл-оксид-полупроводник, который представляет собой гибрид элементов размером 0,25 мкм и металлических слоев 0,35 мкм. Процесс состоит из пяти слоев алюминия. Он был упакован в ту же решетку из керамических колонн на 1088 столбцов, что и P2SC, но с другим выводом.

POWER3-II
POWER3-II

POWER3-II был улучшенным POWER3, который увеличил тактовую частоту до 450 МГц. Он содержит 23 миллиона транзисторов и имеет размер 170 мм 2. Он был изготовлен по технологии IBM CMOS7S, 0,22 мкм CMOS-технологии с шестью уровнями медных соединений. На смену ему пришел POWER4 в 2001 году.

Смотрите также
Примечания
использованная литература
Последняя правка сделана 2023-04-13 09:36:57
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте