AMD FireStreamбыло торговой маркой AMD для их Radeon Линия продуктов на основе, ориентированная на потоковую обработку и / или GPGPU в суперкомпьютерах. Первоначально разработанная ATI Technologies в Radeon X1900 XTX в 2006 году, линейка продуктов ранее называлась как ATI FireSTREAM, так и AMD Stream Processor. AMD FireStream также может использоваться как плавающий -point сопроцессор для разгрузки вычислений ЦП, что является частью инициативы Torrenza. Линия FireStream была прекращена с 2012 года, когда рабочие нагрузки GPGPU были полностью объединены в линейку AMD FirePro.
Линия FireStream - это серия дополнительных карт расширения, выпущенных с 2006 по 2010 гг. , основанный на стандартных графических процессорах Radeon, но предназначенный для использования в качестве сопроцессора общего назначения , а не для рендеринга и вывода 3D-графики. Как и линейка FireGL / FirePro, им было предоставлено больше памяти и пропускная способность памяти, но карты FireStream не обязательно имеют порты вывода видео. Все они поддерживают 32-битную single-precision плавающую точку, и все, кроме первой версии, поддерживают 64-битную двойную точность. Линия была объединена с новыми API-интерфейсами, чтобы обеспечить более высокую производительность по сравнению с существующими шейдерными API-интерфейсами OpenGL и Direct3D, начиная с Close to Metal, за которым следует OpenCL и SDK для потоковых вычислений и, в конечном итоге, интегрированный в APP SDK.
Для высокопараллельных математических рабочих нагрузок с плавающей запятой карты могут ускорить большие вычисления более чем в 10 раз; Folding @ Home, один из первых и наиболее заметных пользователей GPGPU, получил производительность процессора в 20-40 раз выше. Каждый пиксельный и вершинный шейдер или унифицированный шейдер в более поздних моделях может выполнять произвольные вычисления с плавающей запятой.
После выпуска Radeon R520 и GeForce G70 ядер графического процессора с программируемыми шейдерами, большие плавающие Пропускная способность точки привлекла внимание академических и коммерческих групп, экспериментирующих с ее использованием для неграфической работы. Интерес привел ATI (и Nvidia ) к созданию продуктов GPGPU, способных вычислять математические формулы общего назначения массово параллельным способом - для обработки тяжелых вычислений, традиционно выполняемых на процессорах и специализированных плавающих точечная математика сопроцессоры. Предполагалось, что блоки GPGPU будут иметь немедленный прирост производительности в 10 или более раз по сравнению с современными расчетами, рассчитанными только на несколько сокетов.
Когда разработка высокопроизводительного X1900 XFX почти завершена, ATI основала на нем свой первый потоковый процессор и анонсировала его как грядущий ATI FireSTREAMвместе с новым Close к Metal API на SIGGRAPH 2006. Само ядро практически не изменилось, за исключением удвоения встроенной памяти и пропускной способности, как в FireGL V7350 ; поддержка новых драйверов и программного обеспечения составила основную разницу. Folding @ home начал использовать X1900 для общих вычислений, используя предварительный выпуск версии 6.5 драйвера ATI Catalyst, и сообщил о 20-40-кратном улучшении GPU по сравнению с CPU. Первый продукт был выпущен в конце 2006 года и был переименован в AMD Stream Processorпосле слияния с AMD.
Бренд стал AMD FireStreamсо вторым поколением потоковых процессоров. в 2007 году на базе чипа RV650 с новыми унифицированными шейдерами и поддержкой двойной точности. Асинхронный DMA также улучшил производительность, позволив увеличить пул памяти без помощи ЦП. Была выпущена одна модель, 9170, по начальной цене 1999 долларов. Планы включали разработку к 2008 году потокового процессора на модуле MXM для портативных компьютеров, но так и не были выпущены.
Третье поколение быстро последовало в 2008 году с резким улучшением производительности ядра RV770; 9250 имел почти вдвое большую производительность, чем 9170, и стал первым однокристальным процессором терафлоп, несмотря на снижение цены до уровня ниже 1000 долларов. Вскоре после этого был выпущен более быстрый собрат, 9270, за 1999 долларов.
В 2010 году вышло последнее поколение FireStreams, карты 9350 и 9370 на базе чипа Cypress, представленного в HD 5800. Это поколение снова удвоило производительность по сравнению с предыдущим, до 2 терафлопс в 9350 и 2,6 терафлопс в 9370, и был первым, созданным с нуля для OpenCL. Это поколение также было единственным с полностью пассивным охлаждением, а активное охлаждение было недоступно.
Поколения Северных и Южных островов были пропущены, и в 2012 году AMD объявила, что новые серии FirePro W (рабочая станция) и S (сервер) на основе новой архитектуры Graphics Core Next будут заменяют карты FireStream.
Модель (Кодовое имя ) | Launch | Архитектура (Fab ) | Bus интерфейс | Потоковые процессоры | Тактовая частота | Память | Мощность процессора (GFLOPS ) | TDP (Вт ) | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ядро (МГц) | Память (МГц) | Размер (MB ) | Тип | Ширина шины (бит ) | Пропускная способность (ГБ / с) | Один | Двойной | ||||||
потоковый процессор (R580) | 2006 | R500 80 нм | 240 | 600 | 1024 | GDDR3 | 256 | 83,2 | 375 | Н / Д | 165 | ||
FireStream 9170 (RV670) | 8 ноября 2007 г. | TeraScale 1 55 нм | PCIe 2.0 x16 | 320 | 800 | 800 | 2048 | GDDR3 | 256 | 51,2 | 512 | 102,4 | 105 |
FireStream 9250 (RV770) | 16 июня 2008 г. | TeraScale 1 55 нм | PCIe 2.0 x16 | 800 | 625 | 993 | 1024 | GDDR3 | 256 | 63,6 | 1000 | 200 | 150 |
FireStream 9270 (RV770) | 13 ноября 2008 г. | TeraScale 1 55 нм | PCIe 2.0 x16 | 800 | 750 | 850 | 2048 | GDDR5 | 256 | 108,8 | 1200 | 240 | 160 |
FireStream 9350 (Cypress XT) | 23 июня 2010 г. | TeraScale 2 40 нм | PCIe 2,1 x16 | 1440 | 700 | 1000 | 2048 | GDDR5 | 256 | 128 | 2016 | 403.2 | 150 |
FireStream 9370 (Cypress XT) | 23 июня 2010 г. | TeraScale 2 40 п m | PCIe 2.1 x16 | 1600 | 825 | 1150 | 4096 | GDDR5 | 256 | 147.2 | 2640 | 528 | 225 |
AMD FireStream был запущен с поддержкой широкого спектра программных платформ. Одной из поддерживающих фирм была PeakStream (приобретенная Google в июне 2007 года), которая первой предоставила открытую бета версию программного обеспечения для поддержки CTM и AMD. FireStream, а также процессоры x86 и Cell (Cell Broadband Engine). После запуска программного обеспечения PeakStream было заявлено, что FireStream в типичных приложениях работает в 20 раз быстрее, чем обычные процессоры. RapidMind также предоставил программное обеспечение для потоковой обработки, которое работало с ATI и NVIDIA, а также с процессорами Cell.
После отказа от их недолговечного Close переходя на Metal API, AMD сосредоточилась на OpenCL. AMD впервые выпустила свой Stream Computing SDK (v1.0) в декабре 2007 года в рамках AMD EULA для работы в Windows XP. SDK включает "Brook +", оптимизированную для оборудования AMD версию языка Brook, разработанного Стэнфордским университетом, который сам является вариантом ANSI C (язык C ) , с открытым кодом и оптимизирован для потоковых вычислений. AMD Core Math Library (ACML) и AMD Performance Library (APL) с оптимизацией для AMD FireStream и видеотеки COBRA (далее переименованной в «Accelerated Video Transcoding» или AVT) для перекодирования видео также будет включено ускорение. Другая важная часть SDK, Compute Abstraction Layer (CAL), представляет собой уровень разработки программного обеспечения, предназначенный для низкоуровневого доступа через CTM h ardware, к архитектуре графического процессора для программного обеспечения для настройки производительности, написанного на различных языках программирования высокого уровня .
В августе 2011 года AMD выпустила версию 2.5 комплекта разработки программного обеспечения ATI APP, которая включает поддержку OpenCL 1.1., язык параллельных вычислений, разработанный Khronos Group. Концепция вычислительных шейдеров, официально называемых DirectCompute, в API следующего поколения от Microsoft под названием DirectX 11 уже включена в графические драйверы с поддержкой DirectX 11.
Согласно продемонстрированной AMD системе с двумя двухъядерными процессорами AMD Opteron и двумя запущенными ядрами графического процессора Radeon R600 на Microsoft Windows XP Professional, 1 терафлоп (TFLOP) может быть получен с помощью универсального вычисления умножения-сложения (MADD). Для сравнения: процессор Intel Core 2 Quad Q9650 с тактовой частотой 3,0 ГГц в то время мог выдавать 48 гигафлопс.
При демонстрации антивирусного сканирования Kaspersky SafeStream, оптимизированного для потоковых процессоров AMD, удалось сканировать 21 раз быстрее с ускорением на основе R670, чем с поиском, выполняемым полностью на Opteron, в 2007 году.