Nvidia Tesla

редактировать
Эта статья про карты GPGPU. Для получения информации о микроархитектуре графического процессора см. Tesla (микроархитектура). "Tesla P100" перенаправляется сюда. Для линии производительности автомобилей Тесла Моторс (P100D), см Tesla Model S и Tesla Model X.

Nvidia Tesla
Графический процессор Nvidia Tesla
Производитель Nvidia
Введено 2 мая 2007 г. ; 14 лет назад ( 2007-05-02)
Тип Потребительские видеокарты

Nvidia Tesla - это линейка продуктов Nvidia, предназначенных для потоковой обработки или универсальных графических процессоров (GPGPU), названная в честь новаторского инженера-электрика Николы Тесла. Ее продукты начали использовать графические процессоры серии G80 и продолжали сопровождать выпуск новых чипов. Их можно программировать с помощью API CUDA или OpenCL.

Линия продуктов Nvidia Tesla конкурировала с линейками AMD Radeon Instinct и Intel Xeon Phi в области глубокого обучения и видеокартами.

Nvidia отказалась от бренда Tesla в мае 2020 года, как сообщается, из-за возможной путаницы с маркой автомобилей. Его новые графические процессоры - это графические процессоры Nvidia Data Center, такие как графические процессоры Ampere A100.

СОДЕРЖАНИЕ
  • 1 Обзор
  • 2 Приложения
  • 3 Характеристики
  • 4 Смотрите также
  • 5 использованная литература
  • 6 внешние ссылки
Обзор
Nvidia Tesla C2075

Предлагая вычислительную мощность, намного превышающую традиционные микропроцессоры, продукты Tesla нацелены на рынок высокопроизводительных вычислений. По состоянию на 2012 год на базе Nvidia Teslas находятся одни из самых быстрых суперкомпьютеров в мире, в том числе Summit в Национальной лаборатории Ок-Ридж и Tianhe-1A в Тяньцзине, Китай.

Карты Tesla обладают в четыре раза большей производительностью с двойной точностью, чем карты Nvidia GeForce на базе Fermi, с аналогичной производительностью с одинарной точностью. В отличие от потребительских карт Nvidia GeForce и профессиональных карт Nvidia Quadro, карты Tesla изначально не могли выводить изображения на дисплей. Однако последние продукты Tesla C-класса включали один порт Dual-Link DVI.

В рамках проекта Denver Nvidia намеревается встраивать процессорные ядра ARMv8 в свои графические процессоры. Это будет 64-битное продолжение 32-битных чипов Tegra.

Тесла Р100 использует TSMC «с 16 нанометрового FinFET процесс изготовления полупроводниковых, который является более продвинутой, чем 28-нанометрового процесса, ранее используемого AMD и Nvidia GPU, между 2012 и 2016 Р100 также использует Samsung » ы HBM2 памяти.

Приложения

Продукты Tesla в основном используются для моделирования и крупномасштабных вычислений (особенно вычислений с плавающей запятой), а также для создания высококачественных изображений в профессиональных и научных областях.

В 2013 году на оборонную промышленность приходилось менее одной шестой продаж Tesla, но Сумит Гупта прогнозировал увеличение продаж на рынке геопространственной разведки.

Характеристики
Модель Микро- архитектура Запуск Чипсы Частота ядра ( МГц ) Шейдеры объем памяти Вычислительная мощность ( GFLOPS ) Вычислительная способность CUDA TDP (Вт) Примечания, form_factor
Ядра Cuda (всего) Базовая частота ( МГц ) Макс. Частота разгона ( МГц ) Тип автобуса Ширина шины ( бит ) Размер ( ГБ ) Часы ( МТ / с ) Пропускная способность ( ГБ / с) Одинарная точность (MAD + MUL) Одинарная точность (MAD или FMA ) Двойная точность ( FMA )
Единицы МГц МГц W
Вычислительный модуль C870 GPU Тесла 2 мая 2007 г. 1 × G80 600 128 1350 N / A GDDR3 384 1.5 1600 76,8 518,4 345,6 Нет 1.0 170,9 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Настольный компьютер D870 2 мая 2007 г. 2 × G80 600 256 1350 N / A GDDR3 2 × 384 2 × 1,5 1600 2 × 76,8 1036,8 691,2 Нет 1.0 520 Внешние графические процессоры для настольного монтажа или монтажа в стойку 3U
Вычислительный сервер S870 GPU 2 мая 2007 г. 4 × G80 600 512 1350 N / A GDDR3 4 × 384 4 × 1,5 1600 4 × 76,8 2073,6 1382,4 Нет 1.0 Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 16)
Вычислительный модуль C1060 GPU 9 апреля 2009 г. 1 × GT200 602 240 1296 N / A GDDR3 512 4 1600 102,4 933,12 622,08 77,76 1.3 187,8 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный сервер S1070 GPU "400 конфигурация" 1 июня 2008 г. 4 × GT200 602 960 1296 N / A GDDR3 4 × 512 4 × 4 1538,4 4 × 98,5 3732,5 2488,3 311,0 1.3 800 Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный сервер S1070 GPU "конфигурация 500" 1440 N / A 4147,2 2764,8 345,6
Вычислительный сервер S1075 GPU 1 июня 2008 г. 4 × GT200 602 960 1440 N / A GDDR3 4 × 512 4 × 4 1538,4 4 × 98,5 4147,2 2764,8 345,6 1.3 Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 1 × PCIe (× 8 или × 16)
Система визуальных вычислений Quadro Plex 2200 D2 2 × GT200GL 648 480 1296 N / A GDDR3 2 × 512 2 × 4 1600 2 × 102,4 1866,2 1244,2 155,5 1.3 Внешние графические процессоры для настольного монтажа или монтажа в стойку высотой 3U с 4 двухканальными выходами DVI
Система визуальных вычислений Quadro Plex 2200 S4 4 × GT200GL 648 960 1296 N / A GDDR3 4 × 512 4 × 4 1600 4 × 102,4 3732,5 2488,3 311,0 1.3 1200 Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный модуль C2050 GPU Ферми 25 июля 2011 г. 1 × GF100 575 448 1150 N / A GDDR5 384 3 3000 144 Нет 1030,4 515,2 2.0 247 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный модуль M2050 GPU 25 июля 2011 г. N / A 3092 148,4 Нет 225
Вычислительный модуль C2070 GPU 25 июля 2011 г. 1 × GF100 575 448 1150 N / A GDDR5 384 6 3000 144 Нет 1030,4 515,2 2.0 247 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный модуль C2075 GPU 25 июля 2011 г. N / A 3000 144 Нет 225
Вычислительный модуль M2070 / M2070Q GPU 25 июля 2011 г. N / A 3132 150,336 Нет 225
Вычислительный модуль M2090 GPU 25 июля 2011 г. 1 × GF110 650 512 1300 N / A GDDR5 384 6 3700 177,6 Нет 1331,2 665,6 2.0 225 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный сервер S2050 GPU 25 июля 2011 г. 4 × GF100 575 1792 1150 N / A GDDR5 4 × 384 4 × 3 3 4 × 148,4 Нет 4121,6 2060,8 2.0 900 Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный сервер S2070 GPU N / A 4 × 6 Нет
Графический ускоритель K10 Кеплер 1 мая 2012 г. 2 × ГК104 N / A 3072 745 ? GDDR5 2 × 256 2 × 4 5000 2 × 160 Нет 4577 190,7 3.0 225 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K20 12 ноября 2012 г. 1 × GK110 N / A 2496 706 758 GDDR5 320 5 5200 208 Нет 3524 1175 3.5 225 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K20X 12 ноября 2012 г. 1 × GK110 N / A 2688 732 ? GDDR5 384 6 5200 250 Нет 3935 1312 3.5 235 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K40 8 октября 2013 г. 1 × ГК110Б N / A 2880 745 875 GDDR5 384 12 6000 288 Нет 4291–5040 1430–1680 3.5 235 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K80 17 ноября 2014 г. 2 × ГК210 N / A 4992 560 875 GDDR5 2 × 384 2 × 12 5000 2 × 240 Нет 5591–8736 1864–2912 3,7 300 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M4 Максвелл 10 ноября 2015 г. 1 × GM206 N / A 1024 872 1072 GDDR5 128 4 5500 88 Нет 1786–2195 55,81–68,61 5.2 50–75 Внутренний графический процессор PCIe (половинной высоты, один слот)
Графический ускоритель M6 30 августа 2015 г. 1 × GM204-995-A1 N / A 1536 722 1051 GDDR5 256 8 4600 147,2 Нет 2218–3229 69,3–100,9 5.2 75–100 Внутренний графический процессор MXM
Графический ускоритель M10 4 × GM107 N / A 2560 1033 ? GDDR5 4 × 128 4 × 8 5188 4 × 83 Нет 5289 165,3 5.2 225 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M40 10 ноября 2015 г. 1 × GM200 N / A 3072 948 1114 GDDR5 384 12 6000 288 Нет 5825–6844 182,0–213,9 5.2 250 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M60 30 августа 2015 г. 2 × GM204-895-A1 N / A 4096 899 1178 GDDR5 2 × 256 2 × 8 5000 2 × 160 Нет 7365–9650 230,1–301,6 5.2 225–300 Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель P4 Паскаль 13 сентября 2016 г. 1 × GP104 N / A 2560 810 1063 GDDR5 256 8 6000 192,0 Нет 4147–5443 129,6–170,1 6.1 50-75 Карта PCIe
Графический ускоритель P6 24 марта 2017 г. 1 × GP104-995-A1 N / A 2048 1012 1506 GDDR5 256 16 3003 192,2 Нет 6169 192,8 6.1 90 Карта MXM
Графический ускоритель P40 13 сентября 2016 г. 1 × GP102 N / A 3840 1303 1531 GDDR5 384 24 7200 345,6 Нет 10007–11758 312,7–367,4 6.1 250 Карта PCIe
Графический ускоритель P100 (мезонин) 5 апреля 2016 г. 1 × GP100-890-A1 N / A 3584 1328 1480 HBM2 4096 16 1430 732 Нет 9519–10609 4760–5304 6.0 300 Карта NVLink
Графический ускоритель P100 (карта 16 ГБ) 20 июня 2016 г. 1 × GP100 N / A 1126 1303 Нет 8071‒9340 4036‒4670 250 Карта PCIe
Графический ускоритель P100 (карта 12 ГБ) 20 июня 2016 г. N / A 3072 12 549 Нет 8071‒9340 4036‒4670
GPU-ускоритель V100 (мезонин) Вольта 1 × GV100-895-A1 N / A 5120 Неизвестный 1455 HBM2 4096 16 или 32 1750 900 Нет 14899 7450 7.0 300 Карта NVlink
Ускоритель графического процессора V100 (карта PCIe) 21 июня 2017 г. 1 × GV100 N / A Неизвестный 1370 Нет 14028 7014 250 Карта PCIe
Графический ускоритель V100 (карта PCIe FHHL) 27 марта 2018 г. 1 × GV100 N / A 937 1290 16 1620 829,44 Нет 13210 6605 250 Карта PCIe FHHL
Графический ускоритель T4 (карта PCIe) Тьюринг 12 сентября 2018 г. 1 × ТУ104-895-А1 N / A 2560 585 1590 GDDR6 256 16 Неизвестный 320 Нет 8100 Неизвестный 7,5 70 Карта PCIe
Ускоритель графического процессора A10 (карта PCIe) Ампер 12 апреля 2021 г. 1 × GA102-890-A1 N / A 9216 885 1695 GDDR6 384 24 Неизвестный 600 Нет 31240 976 8,6 150 Карта PCIe (однослотовая)
Графический ускоритель A16 (карта PCIe) 12 апреля 2021 г. 4 × GA107 N / A 10240 885 1695 GDDR6 4x 128 4x 16 Неизвестный 4x 231,9 Нет 34712 1084,8 8,6 250 Карта PCIe (двухслотовая)
Графический ускоритель A30 (карта PCIe) 12 апреля 2021 г. 1 × GA100 N / A 3584 930 1440 HBM2 3072 24 Неизвестный 933,1 Нет 10320 5161 8.0 165 Карта PCIe (двухслотовая)
Ускоритель графического процессора A40 (карта PCIe) 5 октября 2020 г. 1 × GA102 N / A 10752 1305 1740 г. GDDR6 384 48 Неизвестный 695,8 Нет 37420 1168 8,6 300 Карта PCIe (двухслотовая)
Ускоритель графического процессора A100 (карта PCIe) 14 мая 2020 1 × GA100-883AA-A1 N / A 6912 765 1410 HBM2 5120 40 Неизвестный 1555 Нет 19500 9700 8.0 250 Карта PCIe
Модель Микро- архитектура Запуск Чипсы Частота ядра ( МГц ) Шейдеры объем памяти Вычислительная мощность ( GFLOPS ) Вычислительная способность CUDA TDP (Вт) Примечания, форм-фактор
Ядра Cuda (всего) Базовая частота ( МГц ) Макс. Частота разгона ( МГц ) Тип автобуса Ширина шины ( бит ) Размер ( ГБ ) Часы ( МТ / с ) Пропускная способность (общая) ( ГБ / с) Одинарная точность (MAD + MUL) Одинарная точность (MAD или FMA ) Двойная точность ( FMA )

Примечания

Смотрите также
использованная литература
внешние ссылки
Последняя правка сделана 2023-04-05 06:27:58
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте