F16C

редактировать

Набор команд F16C (ранее / неофициально известный как CVT16 ) - это x86 архитектура набора команд расширение, которое обеспечивает поддержку преобразования между половинной точностью и стандартными IEEE форматами с плавающей запятой одинарной точности.

Содержание
  • 1 История
  • 2 Техническая информация
  • 3 ЦП с F16C
  • 4 Ссылки
  • 5 Внешние ссылки
История

Набор команд CVT16, анонсированный AMD в мае 1, 2009, является расширением 128-битных инструкций ядра SSE в наборе инструкций x86 и AMD64.

CVT16 - это пересмотр части предложения по набору инструкций SSE5, объявленного 30 августа 2007 г., которое дополняется XOP и FMA4 наборы инструкций. Эта версия делает двоичное кодирование предлагаемых новых инструкций более совместимым с расширениями инструкций AVX от Intel, при этом функциональные возможности инструкций остаются неизменными.

В последних документах имя F16C формально используется в спецификациях архитектуры как Intel, так и AMD x86-64.

Техническая информация

Существуют варианты, которые преобразуют четыре значения с плавающей запятой в регистре XMM или 8 значений с плавающей запятой в регистре YMM.

Инструкции представляют собой аббревиатуры для "векторного преобразования упакованной половины в упакованную одиночную" и наоборот:

  • VCVTPH2PS xmmreg, xmmrm64- преобразовать четыре значения с плавающей запятой половинной точности в памяти или нижнюю половину регистра XMM в четыре одиночных -precision значения с плавающей запятой в регистре XMM.
  • VCVTPH2PS ymmreg, xmmrm128- преобразовать восемь значений с плавающей запятой половинной точности в памяти или регистре XMM (нижняя половина регистра YMM) в восемь значений одинарной точности значения с плавающей запятой в регистре YMM.
  • VCVTPS2PH xmmrm64, xmmreg, imm8- преобразовать четыре значения с плавающей запятой одинарной точности в регистре XMM в значения с плавающей запятой половинной точности в памяти или в нижнюю половину XMM регистр.
  • VCVTPS2PH xmmrm128, ymmreg, imm8- преобразовать восемь значений с плавающей запятой одинарной точности в регистр YMM в значения с плавающей запятой половинной точности в памяти или регистре XMM.

8-битный непосредственный аргумент для VCVTPS2PHвыбирает режим округления. Значения 0–4 выбирают ближайший, вниз, вверх, усечение, и режим, установленный в MXCSR.RC.

Поддержка этих инструкций указывается битом 29 ECX после CPUID с EAX = 1.

Процессоры с процессорами F16C
Ссылки
Внешние ссылки
  • Новые инструкции Bulldozer и Piledriver [1]
  • DirectX math F16C и FMA [2]
  • Руководство программиста по архитектуре AMD64 Том 1 [3]
  • Руководство программиста архитектуры AMD64, том 2 [4]
  • Руководство программиста архитектуры AMD64, том 3 [5]
  • Руководство программиста архитектуры AMD64 Руководство, том 4 [6]
  • Руководство программиста по архитектуре AMD64, том 5 [7]
  • Руководство разработчика программного обеспечения по архитектуре IA32 [8estive
Последняя правка сделана 2021-05-20 06:33:03
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте