Производительность на ватт

редактировать
Энергоэффективность компьютера

В вычислениях, производительность на ватт - мера энергоэффективности конкретной компьютерной архитектуры или компьютерного оборудования. Буквально он измеряет скорость вычислений, которую может выполнить компьютер на каждые ватт потребляемой мощности. Эта скорость обычно измеряется производительностью в тесте LINPACK при попытке сравнения между вычислительными системами.

Системные проектировщики, создающие параллельные компьютеры, такие как аппаратное обеспечение Google, выбирают ЦП в зависимости от их производительности на ватт мощности, поскольку стоимость питания ЦП перевешивает затраты самого процессора.

Содержание
  • 1 Определение
  • 2 FLOPS на ватт
    • 2.1 Примеры
  • 3 Список Green500
  • 4 Эффективность GPU
  • 5 Проблемы
  • 6 Другая энергоэффективность меры
  • 7 См. также
  • 8 Примечания и ссылки
  • 9 Дополнительная литература
  • 10 Внешние ссылки
Определение

Используемые показатели производительности и энергопотребления зависят от определения; разумными показателями производительности являются FLOPS, MIPS или оценка любого теста производительности . В зависимости от целей метрики могут использоваться несколько показателей использования энергии; например, метрика может учитывать только электрическую мощность, подаваемую непосредственно на машину, в то время как другая может включать всю мощность, необходимую для работы компьютера, например системы охлаждения и мониторинга. Измерение мощности часто представляет собой среднюю мощность, используемую во время выполнения теста, но могут использоваться и другие меры использования мощности (например, пиковая мощность, мощность в режиме ожидания).

Например, ранний компьютер UNIVAC I выполнял приблизительно 0,015 операций в ватт-секунду (выполняя 1905 операций в секунду (OPS) при потреблении 125 кВт). Выпущена система Fujitsu FR-V VLIW / векторный процессор на микросхеме в варианте с 4 ядрами FR550 2005 выполняет 51 гигабайт в секунду при потребляемой мощности 3 Вт, что дает 17 миллиардов операций на ватт-секунду. Это улучшение более чем в триллион раз за 54 года.

Большая часть энергии, потребляемой компьютером, преобразуется в тепло, поэтому системе, потребляющей меньше ватт для выполнения работы, потребуется меньше охлаждения для поддержания заданной рабочей температуры. Снижение требований к охлаждению упрощает бесшумность компьютера. Более низкое энергопотребление также может сделать его менее затратным в эксплуатации и снизить воздействие питания компьютера на окружающую среду (см. экологически чистые вычисления ). Если установлен там, где ограничено климат-контроль, компьютер с меньшей мощностью будет работать при более низкой температуре, что может сделать его более надежным. В среде с контролируемым климатом сокращение прямого энергопотребления может также способствовать экономии энергии для управления климатом.

Потребление вычислительной энергии иногда также измеряется путем отчета об энергии, необходимой для выполнения определенного теста, например EEMBC EnergyBench. Показатели энергопотребления для стандартной рабочей нагрузки могут облегчить оценку эффекта от повышения энергоэффективности.

Производительность (в операциях / секунду) на ватт также можно записать как операции / ватт-секунду или операции / джоуль, поскольку 1 ватт = 1 джоуль в секунду.

FLOPS на ватт
Экспоненциальный рост производительности суперкомпьютера на ватт на основе данных из списка Green500. Красные кресты обозначают самый энергоэффективный компьютер, а синие - компьютер с рейтингом 500.

FLOPS на ватт - это общепринятая мера. Подобно метрике FLOPS (Floating Point Operations Per Second), на которой она основана, эта метрика обычно применяется к научным вычислениям и моделированию, включающим множество плавающих пункт расчеты.

Примеры

По состоянию на июнь 2016 года в списке Green500 два самых эффективных суперкомпьютера занимают самые высокие места - оба они основаны на одном и том же ускорителе manycore. PEZY-SCnp Японская технология в дополнение к процессорам Intel Xeon - оба на RIKEN, лучшая - 6673,8 MFLOPS / Вт; и третье место занимает китайская технология Sunway TaihuLight (гораздо более крупная машина, которая занимает 2-е место в TOP500, других нет в этом списке) со скоростью 6051,3 MFLOPS / ватт..

В июне 2012 года список Green500 оценил BlueGene / Q, Power BQC 16C как самый эффективный суперкомпьютер в TOP500 с точки зрения FLOPS на ватт при 2100,88 MFLOPS / ватт.

В ноябре 2010 года машина IBM, Blue Gene / Q достигла 1684 MFLOPS / ватт.

9 июня 2008 года CNN сообщила, что IBM Roadrunner производительность суперкомпьютера 376 MFLOPS / ватт.

В рамках исследовательского проекта Intel Tera-Scale команда разработала 80-ядерный ЦП, который может достигать более 16000 MFLOPS / Вт. Будущее этого процессора не определено.

Microwulf, недорогой настольный компьютер кластер Beowulf из четырех двухъядерных компьютеров Athlon 64 X2 3800+, производительность 58 MFLOPS / ватт.

Kalray разработал 256-ядерный ЦП VLIW, обеспечивающий производительность 25 000 MFLOPS / ватт. Ожидается, что следующее поколение достигнет 75 000 MFLOPS / Вт. Однако в 2019 году их последний чип для встраиваемых систем является 80-ядерным и требует до 4 терафлопс при 20 Вт.

Adapteva анонсировала Epiphany V, 1024-ядерный 64-разрядный RISC-процессор. предназначены для достижения 75 гигафлопс / ватт, а позже они объявили, что Epiphany V «маловероятно» станет доступным в качестве коммерческого продукта

Патент США 10,020,436, июль 2018 г. утверждает три интервала по 100, 300 и 600 ГФЛОПС / Вт.

Список Green500

Список Green500 ранжирует компьютеры из списка суперкомпьютеров TOP500 с точки зрения энергоэффективности, обычно измеряемой как LINPACK FLOPS на ватт.

По состоянию на ноябрь 2012 года суперкомпьютер Appro International, Inc. Xtreme-X () возглавил список Green500 с 2499 LINPACK MFLOPS / W. Beacon внедряется сетевым адаптером Университета Теннесси и представляет собой компьютер GreenBlade GB824M, Xeon E5-2670, восемь ядер (8C), 2,6 ГГц, Infiniband FDR, компьютер Intel Xeon Phi 5110P.

По состоянию на июнь 2013 года суперкомпьютер Eurotech Eurora на Cineca возглавлял список Green500 с 3208 LINPACK MFLOPS / W. Суперкомпьютер Cineca Eurora оснащен двумя процессорами Intel Xeon E5-2687W и двумя подключенными через PCI-e ускорителями NVIDIA Tesla K20 на каждый узел. Водяное охлаждение и конструкция электроники позволяют достичь очень высокой плотности с максимальной производительностью 350 терафлопс на стойку.

По состоянию на ноябрь 2014 года суперкомпьютер L-CSC Ассоциации Гельмгольца на GSI в Дармштадте Германия возглавил список Green500 с показателем 5271 MFLOPS / Вт и стал первым кластером, эффективность которого превысила 5 GFLOPS / W. Он работает на процессорах Intel Xeon E5-2690 с архитектурой Intel Ivy Bridge и ускорителях графического процессора AMD FirePro S9150. Он использует водяное охлаждение в стойке и градирни для снижения энергии, необходимой для охлаждения.

По состоянию на август 2015 года из RIKEN за пределами Токио Япония возглавила список Green500 с показателем 7032 MFLOPS / Вт. Три лучших суперкомпьютера в списке использовали ускорители PEZY-SC (GPU, аналогичные тем, которые используют OpenCL ) от PEZY Computing с 1024 ядрами каждый и 6– Эффективность 7 Гфлопс / Вт.

По состоянию на июнь 2019 г., DGX SaturnV Volta, с использованием NVIDIA DGX-1 Volta 36, Xeon E5-2698v4 20C 2,2 ГГц, Infiniband EDR, NVIDIA Tesla V100 "возглавляет список Green500 с показателем 15 113 MFLOPS / Вт, занимая лишь 469-е место в Top500. Он лишь немного более эффективен, чем гораздо более крупный Summit, занявший 2-е место, а 1-е место в Top500 с 14 719 MFLOPS / Вт, используя процессоры IBM POWER9, а также графические процессоры Nvidia Tesla V100.

Топ-10 позиций GREEN500 в ноябре 2019 года
РейтингПроизводительность. на ватт..НазваниеМодель. Процессоры, межсоединенияПроизводительСайт. Страна, годRmax.
116,876Прототип A64FXFujitsu A64FX . Fujitsu A64FX 48C 2GHz, Tofu межсоединение DFujitsu Numazu. Япония, 20181,999
216,256NA-1ZettaScaler-2.2 . Xeon D-1571 16C 1,3 ГГц, Infiniband EDR, PEZY-SC2 700 МГцPEZY Computing KKJAMSTEC Йокогамский институт наук о Земле, Йокогама. Япония, 20191.303
315,771AiMOSIBM Power System AC922 . IBM POWER9 20C 3,45 ГГц, Dual-Rail Mellanox EDR Infiniband, NVIDIA Volta GV100IBM Политехнический институт Ренсселера, Трой,. США, 20188,045
415,574SatoriIBM Power System AC922 . IBM POWER9 20C 2,4 ГГц, Infiniband EDR, NVIDIA Tesla V100 SXM2IBM MIT / MGHPCC, Холиок, Массачусетс,. США, 20181,464
514,719Summit IBM Power Система AC922 . IBM POWER9 22C 3,07 ГГц, NVIDIA Volta GV100, Dual-Rail Mellanox EDR InfinibandIBM Национальная лаборатория Ок-Ридж, Дуб Ридж, Теннесси. США, 2018148,600
614,423Мостовая облачная инфраструктура AI (ABCI) Primergy CX2570 M4 . Xeon Gold, Tesla V100 SXM2, Infiniband EDRFujit su Объединенный центр передовых высокопроизводительных вычислений, Кашива. Япония, 201819.880
714.131MareNostrum P9 CTE IBM Power System AC922 . IBM POWER9 22C, 3,1 ГГц, Dual-Rail Mellanox EDR Infiniband, NVIDIA Tesla V100IBM Barcelona Supercomputing Center, Барселона,. Испания, 20191,145
813,704TSUBAME3.0 SGI ICE XA . IP139-SXM2, Xeon E5-2680v4 14C 2,4 ГГц, Intel Omni-Path, NVIDIA Tesla P100 SXM2Hewlett-Packard Токийский технологический институт, Токио,. Япония, 20178.045
913.065PANGEA IIIIBM Power System AC922 . A III - IBM Power System AC922, IBM POWER9 18C 3,45 ГГц, двухканальный Mellanox EDR Infiniband, NVIDIA Volta GV100IBM Total SA, По,. Франция, 201917.860
1012.723Sierra IBM Power System AC922 . - IBM Power System AC922, IBM POWER9 22C 3,1 ГГц, NVIDIA Volta GV100, двухканальный Mell anox EDR InfinibandIBM Ливерморская национальная лаборатория, Ливермор,. США, 201894,640
Эффективность графического процессора

Графические процессоры (GPU) продолжает увеличивать потребление энергии, в то время как разработчики процессоров недавно сосредоточили внимание на повышении производительности на ватт. Высокопроизводительные графические процессоры могут потреблять большое количество энергии, поэтому для управления энергопотреблением графического процессора требуются интеллектуальные методы. Такие показатели, как оценка 3DMark2006 на ватт, могут помочь определить более эффективные графические процессоры. Однако это может не адекватно отражать эффективность при типичном использовании, когда много времени тратится на выполнение менее ресурсоемких задач.

В современных графических процессорах потребление энергии является важным ограничением максимальных вычислительных возможностей, которые могут быть достигнуты. Конструкции графических процессоров обычно хорошо масштабируются, что позволяет производителю размещать несколько микросхем на одной видеокарте или использовать несколько видеокарт, работающих параллельно. Пиковая производительность любой системы существенно ограничена количеством потребляемой мощности и количеством тепла, которое она может рассеять. Следовательно, производительность на ватт конструкции графического процессора напрямую влияет на пиковую производительность системы, в которой используется эта конструкция.

Поскольку графические процессоры также могут использоваться для некоторых вычислений общего назначения, иногда их производительность измеряется в терминах, также применяемых к процессорам, например, FLOPS на ватт.

Проблемы

Хотя производительность на ватт полезна, требования к абсолютной мощности также важны. Заявления об улучшении производительности на ватт могут использоваться для маскировки возрастающих требований к мощности. Например, хотя архитектуры графических процессоров нового поколения могут обеспечивать более высокую производительность на ватт, продолжающееся повышение производительности может свести на нет повышение эффективности, и графические процессоры продолжают потреблять большое количество энергии.

Тесты, измеряющие мощность при большой нагрузке, могут не адекватно отражают типичную эффективность. Например, 3DMark подчеркивает 3D-производительность графического процессора, но многие компьютеры тратят большую часть своего времени на выполнение менее интенсивных задач отображения (простоя, 2D-задачи, отображение видео). Таким образом, эффективность графической системы в 2D или в режиме ожидания может иметь не меньшее значение для общей энергоэффективности. Точно так же системы, которые проводят большую часть своего времени в режиме ожидания или плавном выключении, не обладают достаточной эффективностью под нагрузкой. Чтобы решить эту проблему, некоторые тесты, такие как SPECpower, включают измерения на нескольких уровнях нагрузки.

Эффективность некоторых электрических компонентов, таких как регуляторы напряжения, снижается с повышением температуры, поэтому потребляемая мощность может увеличиваться с увеличением температуры. Источники питания, материнские платы и некоторые видеокарты - вот некоторые из подсистем, на которые это влияет. Таким образом, их потребляемая мощность может зависеть от температуры, и при измерении следует учитывать температурную или температурную зависимость.

Производительность на ватт также обычно не включает в себя затраты на полный жизненный цикл. Поскольку производство компьютеров требует больших затрат энергии, а компьютеры часто имеют относительно короткий срок службы, энергия и материалы, задействованные в производстве, распространении, утилизации и переработке, часто составляют значительную часть их стоимости, энергии использование и воздействие на окружающую среду.

Энергия, необходимая для контроля микроклимата вокруг компьютера, часто не учитывается при расчете мощности, но может быть значительной.

Другие меры по повышению энергоэффективности

SWaP (объем, мощность и производительность) - это показатель Sun Microsystems для центров обработки данных, включающий энергию и пространство:

SW a P = P erformance S pace ⋅ P ower {\ displaystyle \ mathrm {SWaP} = {\ frac {\ mathrm {Performance}} {\ mathrm {Space} \ cdot \ mathrm {Power}}}}{\ displaystyle \ mathrm {SWaP} = {\ frac {\ mathrm {Performance}} {\ mathrm {Space} \ cdot \ mathrm {Power}}} }

Где производительность измеряется любым подходящим тестом, а пространство размер компьютера.

См. также
Тесты энергоэффективности
  • Средняя мощность процессора (ACP) - показатель потребляемой мощности w при выполнении нескольких стандартных тестов
  • EEMBC - EnergyBench
  • SPECpower - эталонный тест для веб-серверов с Java (количество операций Java на стороне сервера на джоуль)
Другое
Примечания и ссылки
Дополнительная литература
Внешние ссылки
Последняя правка сделана 2021-06-01 09:20:45
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте