AMD FireStream

редактировать

AMD FireStreamбыло торговой маркой AMD для их Radeon Линия продуктов на основе, ориентированная на потоковую обработку и / или GPGPU в суперкомпьютерах. Первоначально разработанная ATI Technologies в Radeon X1900 XTX в 2006 году, линейка продуктов ранее называлась как ATI FireSTREAM, так и AMD Stream Processor. AMD FireStream также может использоваться как плавающий -point сопроцессор для разгрузки вычислений ЦП, что является частью инициативы Torrenza. Линия FireStream была прекращена с 2012 года, когда рабочие нагрузки GPGPU были полностью объединены в линейку AMD FirePro.

Содержание
  • 1 Обзор
  • 2 История
  • 3 Модели
  • 4 Программное обеспечение
    • 4.1 Комплект разработчика программного обеспечения
      • 4.1.1 AMD APP SDK
  • 5 Тесты
  • 6 Ограничения
  • 7 См. Также
  • 8 Ссылки
  • 9 Внешние ссылки
Обзор

Линия FireStream - это серия дополнительных карт расширения, выпущенных с 2006 по 2010 гг. , основанный на стандартных графических процессорах Radeon, но предназначенный для использования в качестве сопроцессора общего назначения , а не для рендеринга и вывода 3D-графики. Как и линейка FireGL / FirePro, им было предоставлено больше памяти и пропускная способность памяти, но карты FireStream не обязательно имеют порты вывода видео. Все они поддерживают 32-битную single-precision плавающую точку, и все, кроме первой версии, поддерживают 64-битную двойную точность. Линия была объединена с новыми API-интерфейсами, чтобы обеспечить более высокую производительность по сравнению с существующими шейдерными API-интерфейсами OpenGL и Direct3D, начиная с Close to Metal, за которым следует OpenCL и SDK для потоковых вычислений и, в конечном итоге, интегрированный в APP SDK.

Для высокопараллельных математических рабочих нагрузок с плавающей запятой карты могут ускорить большие вычисления более чем в 10 раз; Folding @ Home, один из первых и наиболее заметных пользователей GPGPU, получил производительность процессора в 20-40 раз выше. Каждый пиксельный и вершинный шейдер или унифицированный шейдер в более поздних моделях может выполнять произвольные вычисления с плавающей запятой.

История

После выпуска Radeon R520 и GeForce G70 ядер графического процессора с программируемыми шейдерами, большие плавающие Пропускная способность точки привлекла внимание академических и коммерческих групп, экспериментирующих с ее использованием для неграфической работы. Интерес привел ATI (и Nvidia ) к созданию продуктов GPGPU, способных вычислять математические формулы общего назначения массово параллельным способом - для обработки тяжелых вычислений, традиционно выполняемых на процессорах и специализированных плавающих точечная математика сопроцессоры. Предполагалось, что блоки GPGPU будут иметь немедленный прирост производительности в 10 или более раз по сравнению с современными расчетами, рассчитанными только на несколько сокетов.

Когда разработка высокопроизводительного X1900 XFX почти завершена, ATI основала на нем свой первый потоковый процессор и анонсировала его как грядущий ATI FireSTREAMвместе с новым Close к Metal API на SIGGRAPH 2006. Само ядро ​​практически не изменилось, за исключением удвоения встроенной памяти и пропускной способности, как в FireGL V7350 ; поддержка новых драйверов и программного обеспечения составила основную разницу. Folding @ home начал использовать X1900 для общих вычислений, используя предварительный выпуск версии 6.5 драйвера ATI Catalyst, и сообщил о 20-40-кратном улучшении GPU по сравнению с CPU. Первый продукт был выпущен в конце 2006 года и был переименован в AMD Stream Processorпосле слияния с AMD.

Бренд стал AMD FireStreamсо вторым поколением потоковых процессоров. в 2007 году на базе чипа RV650 с новыми унифицированными шейдерами и поддержкой двойной точности. Асинхронный DMA также улучшил производительность, позволив увеличить пул памяти без помощи ЦП. Была выпущена одна модель, 9170, по начальной цене 1999 долларов. Планы включали разработку к 2008 году потокового процессора на модуле MXM для портативных компьютеров, но так и не были выпущены.

Третье поколение быстро последовало в 2008 году с резким улучшением производительности ядра RV770; 9250 имел почти вдвое большую производительность, чем 9170, и стал первым однокристальным процессором терафлоп, несмотря на снижение цены до уровня ниже 1000 долларов. Вскоре после этого был выпущен более быстрый собрат, 9270, за 1999 долларов.

В 2010 году вышло последнее поколение FireStreams, карты 9350 и 9370 на базе чипа Cypress, представленного в HD 5800. Это поколение снова удвоило производительность по сравнению с предыдущим, до 2 терафлопс в 9350 и 2,6 терафлопс в 9370, и был первым, созданным с нуля для OpenCL. Это поколение также было единственным с полностью пассивным охлаждением, а активное охлаждение было недоступно.

Поколения Северных и Южных островов были пропущены, и в 2012 году AMD объявила, что новые серии FirePro W (рабочая станция) и S (сервер) на основе новой архитектуры Graphics Core Next будут заменяют карты FireStream.

Модели
  • FireStream 9170 включают Direct3D 10.1, OpenGL 3.3 и APP Stream
  • FireStream 92x0 включают Direct3D 10.1, OpenGL 3.3 и OpenCL 1.0
  • FireStream 93x0 включают Direct3D 11, OpenGL 4.3 и OpenCL 1.2 с последними обновлениями драйверов
Модель
(Кодовое имя )
LaunchАрхитектура
(Fab )
Bus интерфейс Потоковые процессоры Тактовая частотаПамять Мощность процессора
(GFLOPS )
TDP (Вт )
Ядро (МГц)Память (МГц)Размер (MB )ТипШирина шины (бит )Пропускная способность (ГБ / с)Один Двойной
потоковый процессор
(R580)
2006R500
80 нм
2406001024GDDR3 25683,2375Н / Д165
FireStream 9170
(RV670)
8 ноября 2007 г.TeraScale 1
55 нм
PCIe 2.0 x163208008002048GDDR3 25651,2512102,4105
FireStream 9250
(RV770)
16 июня 2008 г.TeraScale 1
55 нм
PCIe 2.0 x168006259931024GDDR3 25663,61000200150
FireStream 9270
(RV770)
13 ноября 2008 г.TeraScale 1
55 нм
PCIe 2.0 x168007508502048GDDR5 256108,81200240160
FireStream 9350
(Cypress XT)
23 июня 2010 г.TeraScale 2
40 нм
PCIe 2,1 x16144070010002048GDDR5 2561282016403.2150
FireStream 9370
(Cypress XT)
23 июня 2010 г.TeraScale 2
40 п m
PCIe 2.1 x16160082511504096GDDR5 256147.22640528225



Программное обеспечение

AMD FireStream был запущен с поддержкой широкого спектра программных платформ. Одной из поддерживающих фирм была PeakStream (приобретенная Google в июне 2007 года), которая первой предоставила открытую бета версию программного обеспечения для поддержки CTM и AMD. FireStream, а также процессоры x86 и Cell (Cell Broadband Engine). После запуска программного обеспечения PeakStream было заявлено, что FireStream в типичных приложениях работает в 20 раз быстрее, чем обычные процессоры. RapidMind также предоставил программное обеспечение для потоковой обработки, которое работало с ATI и NVIDIA, а также с процессорами Cell.

Software Development Kit

После отказа от их недолговечного Close переходя на Metal API, AMD сосредоточилась на OpenCL. AMD впервые выпустила свой Stream Computing SDK (v1.0) в декабре 2007 года в рамках AMD EULA для работы в Windows XP. SDK включает "Brook +", оптимизированную для оборудования AMD версию языка Brook, разработанного Стэнфордским университетом, который сам является вариантом ANSI C (язык C ) , с открытым кодом и оптимизирован для потоковых вычислений. AMD Core Math Library (ACML) и AMD Performance Library (APL) с оптимизацией для AMD FireStream и видеотеки COBRA (далее переименованной в «Accelerated Video Transcoding» или AVT) для перекодирования видео также будет включено ускорение. Другая важная часть SDK, Compute Abstraction Layer (CAL), представляет собой уровень разработки программного обеспечения, предназначенный для низкоуровневого доступа через CTM h ardware, к архитектуре графического процессора для программного обеспечения для настройки производительности, написанного на различных языках программирования высокого уровня .

В августе 2011 года AMD выпустила версию 2.5 комплекта разработки программного обеспечения ATI APP, которая включает поддержку OpenCL 1.1., язык параллельных вычислений, разработанный Khronos Group. Концепция вычислительных шейдеров, официально называемых DirectCompute, в API следующего поколения от Microsoft под названием DirectX 11 уже включена в графические драйверы с поддержкой DirectX 11.

AMD APP SDK

Тесты

Согласно продемонстрированной AMD системе с двумя двухъядерными процессорами AMD Opteron и двумя запущенными ядрами графического процессора Radeon R600 на Microsoft Windows XP Professional, 1 терафлоп (TFLOP) может быть получен с помощью универсального вычисления умножения-сложения (MADD). Для сравнения: процессор Intel Core 2 Quad Q9650 с тактовой частотой 3,0 ГГц в то время мог выдавать 48 гигафлопс.

При демонстрации антивирусного сканирования Kaspersky SafeStream, оптимизированного для потоковых процессоров AMD, удалось сканировать 21 раз быстрее с ускорением на основе R670, чем с поиском, выполняемым полностью на Opteron, в 2007 году.

Ограничения
  • Рекурсивные функции не поддерживаются в Brook +, поскольку все вызовы функций встроены во время компиляции. При использовании клиентской лицензии функции (рекурсивные или иные) поддерживаются до 32 уровней.
  • Поддерживается только билинейная фильтрация текстур; mipmapped текстуры и анизотропная фильтрация не поддерживаются.
  • Функции не могут иметь переменное количество аргументов. Та же проблема возникает для рекурсивных функций.
  • Преобразование чисел с плавающей запятой в целые на графических процессорах выполняется иначе, чем на процессорах x86; он не полностью соответствует IEEE-754.
  • Выполнение «глобальной синхронизации» на GPU не очень эффективно, что заставляет GPU разделить ядро ​​ и выполнить синхронизация на CPU. Учитывая переменное количество мультипроцессоров и другие факторы, может не быть идеального решения этой проблемы.
  • Пропускная способность шины и задержка между ЦП и ГП могут стать узким местом.
См. Также
Последняя правка сделана 2021-06-07 21:40:39
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте