F16C

редактировать

Набор команд F16C (ранее / неофициально известный как CVT16 ) - это x86 архитектура набора команд расширение, которое обеспечивает поддержку преобразования между половинной точностью и стандартными IEEE форматами с плавающей запятой одинарной точности.

Содержание

1 История
2 Техническая информация
3 ЦП с F16C
4 Ссылки
5 Внешние ссылки

История

Набор команд CVT16, анонсированный AMD в мае 1, 2009, является расширением 128-битных инструкций ядра SSE в наборе инструкций x86 и AMD64.

CVT16 - это пересмотр части предложения по набору инструкций SSE5, объявленного 30 августа 2007 г., которое дополняется XOP и FMA4 наборы инструкций. Эта версия делает двоичное кодирование предлагаемых новых инструкций более совместимым с расширениями инструкций AVX от Intel, при этом функциональные возможности инструкций остаются неизменными.

В последних документах имя F16C формально используется в спецификациях архитектуры как Intel, так и AMD x86-64.

Техническая информация

Существуют варианты, которые преобразуют четыре значения с плавающей запятой в регистре XMM или 8 значений с плавающей запятой в регистре YMM.

Инструкции представляют собой аббревиатуры для "векторного преобразования упакованной половины в упакованную одиночную" и наоборот:

VCVTPH2PS xmmreg, xmmrm64- преобразовать четыре значения с плавающей запятой половинной точности в памяти или нижнюю половину регистра XMM в четыре одиночных -precision значения с плавающей запятой в регистре XMM.
VCVTPH2PS ymmreg, xmmrm128- преобразовать восемь значений с плавающей запятой половинной точности в памяти или регистре XMM (нижняя половина регистра YMM) в восемь значений одинарной точности значения с плавающей запятой в регистре YMM.
VCVTPS2PH xmmrm64, xmmreg, imm8- преобразовать четыре значения с плавающей запятой одинарной точности в регистре XMM в значения с плавающей запятой половинной точности в памяти или в нижнюю половину XMM регистр.
VCVTPS2PH xmmrm128, ymmreg, imm8- преобразовать восемь значений с плавающей запятой одинарной точности в регистр YMM в значения с плавающей запятой половинной точности в памяти или регистре XMM.

8-битный непосредственный аргумент для VCVTPS2PHвыбирает режим округления. Значения 0–4 выбирают ближайший, вниз, вверх, усечение, и режим, установленный в MXCSR.RC.

Поддержка этих инструкций указывается битом 29 ECX после CPUID с EAX = 1.

Процессоры с процессорами F16C

AMD :
- на базе Jaguar и более новыми процессорами
- на базе Puma и более новыми процессорами
- «Heavy Equipment»
  - на базе Bulldozer, четвертый квартал 2011 года
  - процессоры на базе Piledriver, четвертый квартал 2012 года
  - на базе Steamroller процессоры, первый квартал 2014 года
  - на базе экскаватора процессоры и новее, 2015 год
- Zen- процессоры на базе, Q1 2017
- Zen + -based, Q2 2018
- Zen2 процессоры, Q3 2019
Intel :
- Ivy Bridge процессоры и новее

Ссылки

Внешние ссылки

Новые инструкции Bulldozer и Piledriver [1]
DirectX math F16C и FMA [2]
Руководство программиста по архитектуре AMD64 Том 1 [3]
Руководство программиста архитектуры AMD64, том 2 [4]
Руководство программиста архитектуры AMD64, том 3 [5]
Руководство программиста архитектуры AMD64 Руководство, том 4 [6]
Руководство программиста по архитектуре AMD64, том 5 [7]
Руководство разработчика программного обеспечения по архитектуре IA32 [8estive