AMD FireStream

редактировать

AMD FireStreamбыло торговой маркой AMD для их Radeon Линия продуктов на основе, ориентированная на потоковую обработку и / или GPGPU в суперкомпьютерах. Первоначально разработанная ATI Technologies в Radeon X1900 XTX в 2006 году, линейка продуктов ранее называлась как ATI FireSTREAM, так и AMD Stream Processor. AMD FireStream также может использоваться как плавающий -point сопроцессор для разгрузки вычислений ЦП, что является частью инициативы Torrenza. Линия FireStream была прекращена с 2012 года, когда рабочие нагрузки GPGPU были полностью объединены в линейку AMD FirePro.

Содержание

1 Обзор
2 История
3 Модели
4 Программное обеспечение
- 4.1 Комплект разработчика программного обеспечения
  - 4.1.1 AMD APP SDK
5 Тесты
6 Ограничения
7 См. Также
8 Ссылки
9 Внешние ссылки

Обзор

Линия FireStream - это серия дополнительных карт расширения, выпущенных с 2006 по 2010 гг. , основанный на стандартных графических процессорах Radeon, но предназначенный для использования в качестве сопроцессора общего назначения , а не для рендеринга и вывода 3D-графики. Как и линейка FireGL / FirePro, им было предоставлено больше памяти и пропускная способность памяти, но карты FireStream не обязательно имеют порты вывода видео. Все они поддерживают 32-битную single-precision плавающую точку, и все, кроме первой версии, поддерживают 64-битную двойную точность. Линия была объединена с новыми API-интерфейсами, чтобы обеспечить более высокую производительность по сравнению с существующими шейдерными API-интерфейсами OpenGL и Direct3D, начиная с Close to Metal, за которым следует OpenCL и SDK для потоковых вычислений и, в конечном итоге, интегрированный в APP SDK.

Для высокопараллельных математических рабочих нагрузок с плавающей запятой карты могут ускорить большие вычисления более чем в 10 раз; Folding @ Home, один из первых и наиболее заметных пользователей GPGPU, получил производительность процессора в 20-40 раз выше. Каждый пиксельный и вершинный шейдер или унифицированный шейдер в более поздних моделях может выполнять произвольные вычисления с плавающей запятой.

История

После выпуска Radeon R520 и GeForce G70 ядер графического процессора с программируемыми шейдерами, большие плавающие Пропускная способность точки привлекла внимание академических и коммерческих групп, экспериментирующих с ее использованием для неграфической работы. Интерес привел ATI (и Nvidia ) к созданию продуктов GPGPU, способных вычислять математические формулы общего назначения массово параллельным способом - для обработки тяжелых вычислений, традиционно выполняемых на процессорах и специализированных плавающих точечная математика сопроцессоры. Предполагалось, что блоки GPGPU будут иметь немедленный прирост производительности в 10 или более раз по сравнению с современными расчетами, рассчитанными только на несколько сокетов.

Когда разработка высокопроизводительного X1900 XFX почти завершена, ATI основала на нем свой первый потоковый процессор и анонсировала его как грядущий ATI FireSTREAMвместе с новым Close к Metal API на SIGGRAPH 2006. Само ядро практически не изменилось, за исключением удвоения встроенной памяти и пропускной способности, как в FireGL V7350 ; поддержка новых драйверов и программного обеспечения составила основную разницу. Folding @ home начал использовать X1900 для общих вычислений, используя предварительный выпуск версии 6.5 драйвера ATI Catalyst, и сообщил о 20-40-кратном улучшении GPU по сравнению с CPU. Первый продукт был выпущен в конце 2006 года и был переименован в AMD Stream Processorпосле слияния с AMD.

Бренд стал AMD FireStreamсо вторым поколением потоковых процессоров. в 2007 году на базе чипа RV650 с новыми унифицированными шейдерами и поддержкой двойной точности. Асинхронный DMA также улучшил производительность, позволив увеличить пул памяти без помощи ЦП. Была выпущена одна модель, 9170, по начальной цене 1999 долларов. Планы включали разработку к 2008 году потокового процессора на модуле MXM для портативных компьютеров, но так и не были выпущены.

Третье поколение быстро последовало в 2008 году с резким улучшением производительности ядра RV770; 9250 имел почти вдвое большую производительность, чем 9170, и стал первым однокристальным процессором терафлоп, несмотря на снижение цены до уровня ниже 1000 долларов. Вскоре после этого был выпущен более быстрый собрат, 9270, за 1999 долларов.

В 2010 году вышло последнее поколение FireStreams, карты 9350 и 9370 на базе чипа Cypress, представленного в HD 5800. Это поколение снова удвоило производительность по сравнению с предыдущим, до 2 терафлопс в 9350 и 2,6 терафлопс в 9370, и был первым, созданным с нуля для OpenCL. Это поколение также было единственным с полностью пассивным охлаждением, а активное охлаждение было недоступно.

Поколения Северных и Южных островов были пропущены, и в 2012 году AMD объявила, что новые серии FirePro W (рабочая станция) и S (сервер) на основе новой архитектуры Graphics Core Next будут заменяют карты FireStream.

Модели

FireStream 9170 включают Direct3D 10.1, OpenGL 3.3 и APP Stream
FireStream 92x0 включают Direct3D 10.1, OpenGL 3.3 и OpenCL 1.0
FireStream 93x0 включают Direct3D 11, OpenGL 4.3 и OpenCL 1.2 с последними обновлениями драйверов

Модель (Кодовое имя )	Launch	Архитектура (Fab )	Bus интерфейс	Потоковые процессоры	Тактовая частота		Память				Мощность процессора (GFLOPS )		TDP (Вт )
Модель (Кодовое имя )	Launch	Архитектура (Fab )	Bus интерфейс	Потоковые процессоры	Ядро (МГц)	Память (МГц)	Размер (MB )	Тип	Ширина шины (бит )	Пропускная способность (ГБ / с)	Один	Двойной	TDP (Вт )
потоковый процессор (R580)	2006	R500 80 нм		240	600		1024	GDDR3	256	83,2	375	Н / Д	165
FireStream 9170 (RV670)	8 ноября 2007 г.	TeraScale 1 55 нм	PCIe 2.0 x16	320	800	800	2048	GDDR3	256	51,2	512	102,4	105
FireStream 9250 (RV770)	16 июня 2008 г.	TeraScale 1 55 нм	PCIe 2.0 x16	800	625	993	1024	GDDR3	256	63,6	1000	200	150
FireStream 9270 (RV770)	13 ноября 2008 г.	TeraScale 1 55 нм	PCIe 2.0 x16	800	750	850	2048	GDDR5	256	108,8	1200	240	160
FireStream 9350 (Cypress XT)	23 июня 2010 г.	TeraScale 2 40 нм	PCIe 2,1 x16	1440	700	1000	2048	GDDR5	256	128	2016	403.2	150
FireStream 9370 (Cypress XT)	23 июня 2010 г.	TeraScale 2 40 п m	PCIe 2.1 x16	1600	825	1150	4096	GDDR5	256	147.2	2640	528	225

Программное обеспечение

AMD FireStream был запущен с поддержкой широкого спектра программных платформ. Одной из поддерживающих фирм была PeakStream (приобретенная Google в июне 2007 года), которая первой предоставила открытую бета версию программного обеспечения для поддержки CTM и AMD. FireStream, а также процессоры x86 и Cell (Cell Broadband Engine). После запуска программного обеспечения PeakStream было заявлено, что FireStream в типичных приложениях работает в 20 раз быстрее, чем обычные процессоры. RapidMind также предоставил программное обеспечение для потоковой обработки, которое работало с ATI и NVIDIA, а также с процессорами Cell.

Software Development Kit

После отказа от их недолговечного Close переходя на Metal API, AMD сосредоточилась на OpenCL. AMD впервые выпустила свой Stream Computing SDK (v1.0) в декабре 2007 года в рамках AMD EULA для работы в Windows XP. SDK включает "Brook +", оптимизированную для оборудования AMD версию языка Brook, разработанного Стэнфордским университетом, который сам является вариантом ANSI C (язык C ) , с открытым кодом и оптимизирован для потоковых вычислений. AMD Core Math Library (ACML) и AMD Performance Library (APL) с оптимизацией для AMD FireStream и видеотеки COBRA (далее переименованной в «Accelerated Video Transcoding» или AVT) для перекодирования видео также будет включено ускорение. Другая важная часть SDK, Compute Abstraction Layer (CAL), представляет собой уровень разработки программного обеспечения, предназначенный для низкоуровневого доступа через CTM h ardware, к архитектуре графического процессора для программного обеспечения для настройки производительности, написанного на различных языках программирования высокого уровня .

В августе 2011 года AMD выпустила версию 2.5 комплекта разработки программного обеспечения ATI APP, которая включает поддержку OpenCL 1.1., язык параллельных вычислений, разработанный Khronos Group. Концепция вычислительных шейдеров, официально называемых DirectCompute, в API следующего поколения от Microsoft под названием DirectX 11 уже включена в графические драйверы с поддержкой DirectX 11.

AMD APP SDK

Тесты

Согласно продемонстрированной AMD системе с двумя двухъядерными процессорами AMD Opteron и двумя запущенными ядрами графического процессора Radeon R600 на Microsoft Windows XP Professional, 1 терафлоп (TFLOP) может быть получен с помощью универсального вычисления умножения-сложения (MADD). Для сравнения: процессор Intel Core 2 Quad Q9650 с тактовой частотой 3,0 ГГц в то время мог выдавать 48 гигафлопс.

При демонстрации антивирусного сканирования Kaspersky SafeStream, оптимизированного для потоковых процессоров AMD, удалось сканировать 21 раз быстрее с ускорением на основе R670, чем с поиском, выполняемым полностью на Opteron, в 2007 году.

Ограничения

Рекурсивные функции не поддерживаются в Brook +, поскольку все вызовы функций встроены во время компиляции. При использовании клиентской лицензии функции (рекурсивные или иные) поддерживаются до 32 уровней.
Поддерживается только билинейная фильтрация текстур; mipmapped текстуры и анизотропная фильтрация не поддерживаются.
Функции не могут иметь переменное количество аргументов. Та же проблема возникает для рекурсивных функций.
Преобразование чисел с плавающей запятой в целые на графических процессорах выполняется иначе, чем на процессорах x86; он не полностью соответствует IEEE-754.
Выполнение «глобальной синхронизации» на GPU не очень эффективно, что заставляет GPU разделить ядро и выполнить синхронизация на CPU. Учитывая переменное количество мультипроцессоров и другие факторы, может не быть идеального решения этой проблемы.
Пропускная способность шины и задержка между ЦП и ГП могут стать узким местом.

См. Также

Потоковая обработка
Архитектура гетерогенной системы
NVIDIA Tesla аналогичное решение от Nvidia
Intel Xeon Phi аналогичное решение от Intel
Open Computing Language (OpenCL ) - отраслевой стандарт
Compute Unified Device Architecture (CUDA ) - собственное решение только для Nvidia
Список графических процессоров AMD

Ссылки

Внешние ссылки