Nvidia Tesla

редактировать

Эта статья про карты GPGPU. Для получения информации о микроархитектуре графического процессора см. Tesla (микроархитектура). "Tesla P100" перенаправляется сюда. Для линии производительности автомобилей Тесла Моторс (P100D), см Tesla Model S и Tesla Model X.

Nvidia Tesla

Производитель	Nvidia
Введено	2 мая 2007 г. ; 14 лет назад ( 2007-05-02)
Тип	Потребительские видеокарты

Nvidia Tesla - это линейка продуктов Nvidia, предназначенных для потоковой обработки или универсальных графических процессоров (GPGPU), названная в честь новаторского инженера-электрика Николы Тесла. Ее продукты начали использовать графические процессоры серии G80 и продолжали сопровождать выпуск новых чипов. Их можно программировать с помощью API CUDA или OpenCL.

Линия продуктов Nvidia Tesla конкурировала с линейками AMD Radeon Instinct и Intel Xeon Phi в области глубокого обучения и видеокартами.

Nvidia отказалась от бренда Tesla в мае 2020 года, как сообщается, из-за возможной путаницы с маркой автомобилей. Его новые графические процессоры - это графические процессоры Nvidia Data Center, такие как графические процессоры Ampere A100.

СОДЕРЖАНИЕ

1 Обзор
2 Приложения
3 Характеристики
4 Смотрите также
5 использованная литература
6 внешние ссылки

Обзор

Nvidia Tesla C2075

Предлагая вычислительную мощность, намного превышающую традиционные микропроцессоры, продукты Tesla нацелены на рынок высокопроизводительных вычислений. По состоянию на 2012 год на базе Nvidia Teslas находятся одни из самых быстрых суперкомпьютеров в мире, в том числе Summit в Национальной лаборатории Ок-Ридж и Tianhe-1A в Тяньцзине, Китай.

Карты Tesla обладают в четыре раза большей производительностью с двойной точностью, чем карты Nvidia GeForce на базе Fermi, с аналогичной производительностью с одинарной точностью. В отличие от потребительских карт Nvidia GeForce и профессиональных карт Nvidia Quadro, карты Tesla изначально не могли выводить изображения на дисплей. Однако последние продукты Tesla C-класса включали один порт Dual-Link DVI.

В рамках проекта Denver Nvidia намеревается встраивать процессорные ядра ARMv8 в свои графические процессоры. Это будет 64-битное продолжение 32-битных чипов Tegra.

Тесла Р100 использует TSMC «с 16 нанометрового FinFET процесс изготовления полупроводниковых, который является более продвинутой, чем 28-нанометрового процесса, ранее используемого AMD и Nvidia GPU, между 2012 и 2016 Р100 также использует Samsung » ы HBM2 памяти.

Приложения

Продукты Tesla в основном используются для моделирования и крупномасштабных вычислений (особенно вычислений с плавающей запятой), а также для создания высококачественных изображений в профессиональных и научных областях.

В 2013 году на оборонную промышленность приходилось менее одной шестой продаж Tesla, но Сумит Гупта прогнозировал увеличение продаж на рынке геопространственной разведки.

Характеристики

Модель	Микро- архитектура	Запуск	Чипсы	Частота ядра ( МГц )	Шейдеры			объем памяти					Вычислительная мощность ( GFLOPS )			Вычислительная способность CUDA	TDP (Вт)	Примечания, form_factor
Модель	Микро- архитектура	Запуск	Чипсы	Частота ядра ( МГц )	Ядра Cuda (всего)	Базовая частота ( МГц )	Макс. Частота разгона ( МГц )	Тип автобуса	Ширина шины ( бит )	Размер ( ГБ )	Часы ( МТ / с )	Пропускная способность ( ГБ / с)	Одинарная точность (MAD + MUL)	Одинарная точность (MAD или FMA )	Двойная точность ( FMA )	Вычислительная способность CUDA	TDP (Вт)	Примечания, form_factor
Единицы						МГц	МГц										W
Вычислительный модуль C870 GPU	Тесла	2 мая 2007 г.	1 × G80	600	128	1350	N / A	GDDR3	384	1.5	1600	76,8	518,4	345,6	Нет	1.0	170,9	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Настольный компьютер D870		2 мая 2007 г.	2 × G80	600	256	1350	N / A	GDDR3	2 × 384	2 × 1,5	1600	2 × 76,8	1036,8	691,2	Нет	1.0	520	Внешние графические процессоры для настольного монтажа или монтажа в стойку 3U
Вычислительный сервер S870 GPU		2 мая 2007 г.	4 × G80	600	512	1350	N / A	GDDR3	4 × 384	4 × 1,5	1600	4 × 76,8	2073,6	1382,4	Нет	1.0		Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 16)
Вычислительный модуль C1060 GPU		9 апреля 2009 г.	1 × GT200	602	240	1296	N / A	GDDR3	512	4	1600	102,4	933,12	622,08	77,76	1.3	187,8	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный сервер S1070 GPU "400 конфигурация"		1 июня 2008 г.	4 × GT200	602	960	1296	N / A	GDDR3	4 × 512	4 × 4	1538,4	4 × 98,5	3732,5	2488,3	311,0	1.3	800	Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный сервер S1070 GPU "конфигурация 500"			4 × GT200	602	960	1440	N / A	GDDR3	4 × 512	4 × 4	1538,4	4 × 98,5	4147,2	2764,8	345,6	1.3	800
Вычислительный сервер S1075 GPU		1 июня 2008 г.	4 × GT200	602	960	1440	N / A	GDDR3	4 × 512	4 × 4	1538,4	4 × 98,5	4147,2	2764,8	345,6	1.3		Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 1 × PCIe (× 8 или × 16)
Система визуальных вычислений Quadro Plex 2200 D2			2 × GT200GL	648	480	1296	N / A	GDDR3	2 × 512	2 × 4	1600	2 × 102,4	1866,2	1244,2	155,5	1.3		Внешние графические процессоры для настольного монтажа или монтажа в стойку высотой 3U с 4 двухканальными выходами DVI
Система визуальных вычислений Quadro Plex 2200 S4			4 × GT200GL	648	960	1296	N / A	GDDR3	4 × 512	4 × 4	1600	4 × 102,4	3732,5	2488,3	311,0	1.3	1200	Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный модуль C2050 GPU	Ферми	25 июля 2011 г.	1 × GF100	575	448	1150	N / A	GDDR5	384	3	3000	144	Нет	1030,4	515,2	2.0	247	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный модуль M2050 GPU		25 июля 2011 г.	1 × GF100	575	448	1150	N / A	GDDR5	384	3	3092	148,4	Нет	1030,4	515,2	2.0	225
Вычислительный модуль C2070 GPU		25 июля 2011 г.	1 × GF100	575	448	1150	N / A	GDDR5	384	6	3000	144	Нет	1030,4	515,2	2.0	247	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный модуль C2075 GPU		25 июля 2011 г.					N / A				3000	144	Нет				225
Вычислительный модуль M2070 / M2070Q GPU		25 июля 2011 г.					N / A				3132	150,336	Нет				225
Вычислительный модуль M2090 GPU		25 июля 2011 г.	1 × GF110	650	512	1300	N / A	GDDR5	384	6	3700	177,6	Нет	1331,2	665,6	2.0	225	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный сервер S2050 GPU		25 июля 2011 г.	4 × GF100	575	1792	1150	N / A	GDDR5	4 × 384	4 × 3	3	4 × 148,4	Нет	4121,6	2060,8	2.0	900	Внешние графические процессоры высотой 1U для монтажа в стойку, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный сервер S2070 GPU			4 × GF100	575	1792	1150	N / A	GDDR5	4 × 384	4 × 6	3	4 × 148,4	Нет	4121,6	2060,8	2.0	900
Графический ускоритель K10	Кеплер	1 мая 2012 г.	2 × ГК104	N / A	3072	745	?	GDDR5	2 × 256	2 × 4	5000	2 × 160	Нет	4577	190,7	3.0	225	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K20		12 ноября 2012 г.	1 × GK110	N / A	2496	706	758	GDDR5	320	5	5200	208	Нет	3524	1175	3.5	225	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K20X		12 ноября 2012 г.	1 × GK110	N / A	2688	732	?	GDDR5	384	6	5200	250	Нет	3935	1312	3.5	235	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K40		8 октября 2013 г.	1 × ГК110Б	N / A	2880	745	875	GDDR5	384	12	6000	288	Нет	4291–5040	1430–1680	3.5	235	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K80		17 ноября 2014 г.	2 × ГК210	N / A	4992	560	875	GDDR5	2 × 384	2 × 12	5000	2 × 240	Нет	5591–8736	1864–2912	3,7	300	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M4	Максвелл	10 ноября 2015 г.	1 × GM206	N / A	1024	872	1072	GDDR5	128	4	5500	88	Нет	1786–2195	55,81–68,61	5.2	50–75	Внутренний графический процессор PCIe (половинной высоты, один слот)
Графический ускоритель M6		30 августа 2015 г.	1 × GM204-995-A1	N / A	1536	722	1051	GDDR5	256	8	4600	147,2	Нет	2218–3229	69,3–100,9	5.2	75–100	Внутренний графический процессор MXM
Графический ускоритель M10			4 × GM107	N / A	2560	1033	?	GDDR5	4 × 128	4 × 8	5188	4 × 83	Нет	5289	165,3	5.2	225	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M40		10 ноября 2015 г.	1 × GM200	N / A	3072	948	1114	GDDR5	384	12	6000	288	Нет	5825–6844	182,0–213,9	5.2	250	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M60		30 августа 2015 г.	2 × GM204-895-A1	N / A	4096	899	1178	GDDR5	2 × 256	2 × 8	5000	2 × 160	Нет	7365–9650	230,1–301,6	5.2	225–300	Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель P4	Паскаль	13 сентября 2016 г.	1 × GP104	N / A	2560	810	1063	GDDR5	256	8	6000	192,0	Нет	4147–5443	129,6–170,1	6.1	50-75	Карта PCIe
Графический ускоритель P6		24 марта 2017 г.	1 × GP104-995-A1	N / A	2048	1012	1506	GDDR5	256	16	3003	192,2	Нет	6169	192,8	6.1	90	Карта MXM
Графический ускоритель P40		13 сентября 2016 г.	1 × GP102	N / A	3840	1303	1531	GDDR5	384	24	7200	345,6	Нет	10007–11758	312,7–367,4	6.1	250	Карта PCIe
Графический ускоритель P100 (мезонин)		5 апреля 2016 г.	1 × GP100-890-A1	N / A	3584	1328	1480	HBM2	4096	16	1430	732	Нет	9519–10609	4760–5304	6.0	300	Карта NVLink
Графический ускоритель P100 (карта 16 ГБ)		20 июня 2016 г.	1 × GP100	N / A		1126	1303		4096	16		732	Нет	8071‒9340	4036‒4670		250	Карта PCIe
Графический ускоритель P100 (карта 12 ГБ)		20 июня 2016 г.	1 × GP100	N / A		1126	1303		3072	12		549	Нет	8071‒9340	4036‒4670		250	Карта PCIe
GPU-ускоритель V100 (мезонин)	Вольта		1 × GV100-895-A1	N / A	5120	Неизвестный	1455	HBM2	4096	16 или 32	1750	900	Нет	14899	7450	7.0	300	Карта NVlink
Ускоритель графического процессора V100 (карта PCIe)		21 июня 2017 г.	1 × GV100	N / A		Неизвестный	1370			16 или 32	1750	900	Нет	14028	7014		250	Карта PCIe
Графический ускоритель V100 (карта PCIe FHHL)		27 марта 2018 г.	1 × GV100	N / A		937	1290			16	1620	829,44	Нет	13210	6605		250	Карта PCIe FHHL
Графический ускоритель T4 (карта PCIe)	Тьюринг	12 сентября 2018 г.	1 × ТУ104-895-А1	N / A	2560	585	1590	GDDR6	256	16	Неизвестный	320	Нет	8100	Неизвестный	7,5	70	Карта PCIe
Ускоритель графического процессора A10 (карта PCIe)	Ампер	12 апреля 2021 г.	1 × GA102-890-A1	N / A	9216	885	1695	GDDR6	384	24	Неизвестный	600	Нет	31240	976	8,6	150	Карта PCIe (однослотовая)
Графический ускоритель A16 (карта PCIe)		12 апреля 2021 г.	4 × GA107	N / A	10240	885	1695	GDDR6	4x 128	4x 16	Неизвестный	4x 231,9	Нет	34712	1084,8	8,6	250	Карта PCIe (двухслотовая)
Графический ускоритель A30 (карта PCIe)		12 апреля 2021 г.	1 × GA100	N / A	3584	930	1440	HBM2	3072	24	Неизвестный	933,1	Нет	10320	5161	8.0	165	Карта PCIe (двухслотовая)
Ускоритель графического процессора A40 (карта PCIe)		5 октября 2020 г.	1 × GA102	N / A	10752	1305	1740 г.	GDDR6	384	48	Неизвестный	695,8	Нет	37420	1168	8,6	300	Карта PCIe (двухслотовая)
Ускоритель графического процессора A100 (карта PCIe)		14 мая 2020	1 × GA100-883AA-A1	N / A	6912	765	1410	HBM2	5120	40	Неизвестный	1555	Нет	19500	9700	8.0	250	Карта PCIe
Модель	Микро- архитектура	Запуск	Чипсы	Частота ядра ( МГц )	Шейдеры			объем памяти					Вычислительная мощность ( GFLOPS )			Вычислительная способность CUDA	TDP (Вт)	Примечания, форм-фактор
Модель	Микро- архитектура	Запуск	Чипсы	Частота ядра ( МГц )	Ядра Cuda (всего)	Базовая частота ( МГц )	Макс. Частота разгона ( МГц )	Тип автобуса	Ширина шины ( бит )	Размер ( ГБ )	Часы ( МТ / с )	Пропускная способность (общая) ( ГБ / с)	Одинарная точность (MAD + MUL)	Одинарная точность (MAD или FMA )	Двойная точность ( FMA )	Вычислительная способность CUDA	TDP (Вт)	Примечания, форм-фактор

Примечания

Смотрите также

использованная литература

внешние ссылки