Серия GeForce 700

редактировать

Серия графических процессоров

Серия GeForce 700
Карты
. Geforce GTX 780ti Founders Edition
Дата выпуска	19 февраля 2013 г.; 7 лет назад (19 февраля 2013 г.)
Кодовое имя	GK110 GK208
Архитектура	Kepler
Модели	GeForce Series GeForce GT Series GeForce GTX Series
Транзисторы	585M 28 нм (GF117) 1,02B 28 нм (GK208) 1,27B 28 нм (GK107) 3,54B 28 нм (GK104) 7,08B 28 нм (GK110)
Процесс изготовления	40 нм TSMC 28 нм
Начального уровня	GeForce GT 705 GeForce GT 710 GeForce GT 720 GeForce GT 730 GeForce GT 740 GeForce GTX 745
среднего уровня	GeForce GTX 750 GeForce GTX 750 Ti GeForce GTX 760 192-бит GeForce GTX 760 GeForce GTX 760 Ti
High-end	GeForce GTX 770 GeForce GTX 780 GeForce GTX 780 Ti
Enthusiast	GeForce GTX Titan GeForce GTX Titan Black GeForce GTX Titan Z
API поддержка
Direct3D	Direct3D 12.0 (уровень функций 11_0)
OpenCL	OpenCL 1.2
OpenGL	OpenGL 4.6
Vulkan	Vulkan 1.1. SPIR-V
История
Предшественник	серия GeForce 600
Вариант	серия GeForce 800M
Преемник	GeForce 900 серия

GeForce 700 series (стилизованная под GEFORCE GTX 700 SERIES ) представляет собой серию графических процессоров, разработанных Nvidia. Хотя в основном это обновление микроархитектуры Kepler (чипы с кодовым названием GK), некоторые карты используют Fermi (GF), а более поздние карты используют Maxwell (GM). Карты серии GeForce 700 были впервые выпущены в 2013 году, начиная с выпуска GeForce GTX Titan 19 февраля 2013 года, а затем GeForce GTX 780 23 мая 2013 года. Первые мобильные чипы серии GeForce 700 были выпущены в апреле 2013 года.

Содержание

1 Обзор
2 Архитектура
- 2.1 Оптимизация SMX для вычислений
- 2.2 Новые инструкции по перетасовке
- 2.3 NVENC
- 2.4 Hyper-Q
- 2.5 Поддержка Microsoft DirectX
- 2.6 Динамический параллелизм
3 продукта
- 3.1 GeForce 700 (7xx) series
- 3.2 GeForce 700M (7xxM) series
4 Таблица наборов микросхем
5 Прекращенная поддержка
6 См. Также
7 Ссылки
8 Внешние ссылки

Обзор

GK110 был разработан и продается с расчетом на производительность вычислений. Он содержит 7,1 миллиарда транзисторов. Эта модель также пытается максимизировать энергоэффективность за счет выполнения как можно большего количества задач параллельно в соответствии с возможностями потоковых процессоров.

С GK110 наблюдается увеличение объема памяти и пропускной способности как для файла регистров, так и для кэша L2 по сравнению с предыдущими моделями. На уровне SMX регистровое файловое пространство GK110 увеличилось до 256 КБ, состоящих из 64 КБ 32-битных регистров, по сравнению с 32-разрядными 32-разрядными регистрами Fermi, всего 128 КБ. Что касается кеш-памяти второго уровня, то пространство кэша второго уровня GK110 увеличено до 1,5 МБ, что в 2 раза больше, чем у GF110. Пропускная способность кэша L2 и файла регистров также увеличилась вдвое. Производительность в сценариях с нехваткой регистров также повышается, поскольку для каждого потока доступно больше регистров. Это сопровождается увеличением общего числа регистров, которые может адресовать каждый поток, с переходом от 63 регистров на поток к 255 регистрам на поток с GK110.

В GK110 Nvidia также переработала кеш текстуры GPU , который будет использоваться для вычислений. Имея размер 48 КБ, при вычислении кэш текстур становится доступным только для чтения, специализируясь на рабочих нагрузках невыровненного доступа к памяти. Кроме того, были добавлены возможности обнаружения ошибок, чтобы сделать его более безопасным для использования с рабочими нагрузками, которые полагаются на ECC.

Эта серия поддерживает DirectX 12 в Windows 10.

Было добавлено динамическое суперразрешение (DSR). Графические процессоры Kepler с новейшими драйверами Nvidia.

Архитектура

PCB GTX 780.

Нижняя сторона печатной платы GTX 780.

GPU GTX 780M с разъемом MXM.

Серия GeForce 700 содержит функции как GK104, так и GK110. Члены серии 700 на базе Kepler добавляют к семейству GeForce следующие стандартные функции.

На основе GK104:

Интерфейс PCI Express 3.0
DisplayPort 1.2
HDMI 1.4a видеовыход 4K x 2K
Purevideo VP5 аппаратное ускорение видео (декодирование до 4K x 2K H.264)
Блок аппаратного ускорения кодирования H.264 (NVENC)
Поддержка до 4 независимых 2D-дисплеев или 3-х стереоскопических / 3D-дисплеев отображает (NV Surround)
текстуры без привязки
GPU Boost
TXAA
Изготовлено TSMC по 28-нм техпроцессу

Новые функции GK110:

Улучшение Compute Focus SMX
CUDA Compute Capability 3.5
Новые инструкции перемешивания
Динамический параллелизм
Hyper-Q ( Запас функциональности MPI Hyper-Q только для Tesla)
Grid Management Unit
NVIDIA GPUDirect (резерв функциональности RDMA GPU Direct только для Tesla и Quadro)

Повышение внимания SMX к вычислениям

В GK110 Nvidia решила повысить производительность вычислений. Единственное самое большое изменение по сравнению с GK104 заключается в том, что вместо 8 выделенных ядер FP64 CUDA GK110 имеет до 64, что дает ему в 8 раз большую пропускную способность FP64 по сравнению с GK104 SMX. SMX также видит увеличение пространства для файла реестра. Регистровое файловое пространство увеличено до 256 КБ по сравнению с Fermi. Также улучшен кеш текстур. Имея 48 КБ пространства, кэш текстур может стать кешем только для чтения для вычислительных рабочих нагрузок.

Новые инструкции перемешивания

На низком уровне GK110 видит дополнительные инструкции и операции для дальнейшего повышения производительности. Новые инструкции перемешивания позволяют потокам в пределах деформации обмениваться данными без возврата в память, что делает процесс намного быстрее, чем предыдущий метод загрузки / совместного использования / сохранения. Атомарные операции также были переработаны, увеличена скорость выполнения атомарных операций и добавлены некоторые операции FP64, которые ранее были доступны только для данных FP32.

NVENC

Hyper-Q

Hyper-Q увеличивает количество рабочих очередей оборудования GK110 с 1 до 32. Важность этого заключалась в том, что наличие единственной очереди работ означало, что Ферми иногда мог быть недостаточно занят, поскольку в этой очереди не было достаточно работы, чтобы заполнить все SM. Имея 32 рабочие очереди, GK110 может во многих сценариях достичь более высокого уровня использования, имея возможность помещать различные потоки задач в то, что в противном случае было бы неактивным SMX. Простая природа Hyper-Q дополнительно подкрепляется тем фактом, что он легко отображается на MPI, общий интерфейс передачи сообщений, часто используемый в HPC. Поскольку у устаревших алгоритмов на основе MPI, которые изначально были разработаны для многопроцессорных систем, которые оказались узкими местами из-за ложных зависимостей, теперь есть решение. Увеличив количество заданий MPI, можно использовать Hyper-Q в этих алгоритмах для повышения эффективности без изменения самого кода.

Поддержка Microsoft DirectX

Графические процессоры NVIDIA Kepler для GeForce 700-я серия полностью поддерживает DirectX 11.0.

NVIDIA поддерживает DX12 API на всех графических процессорах класса DX11, которые она поставила; они принадлежат к архитектурным семействам Ферми, Кеплера и Максвелла.

Динамический параллелизм

Способность динамического параллелизма позволяет ядрам отправлять другие ядра. С Fermi только ЦП мог отправлять ядро, что влечет за собой определенные накладные расходы из-за необходимости обратной связи с ЦП. Предоставляя ядрам возможность отправлять свои собственные дочерние ядра, GK110 может как сэкономить время, не возвращаясь к ЦП, так и в процессе освободить ЦП для работы над другими задачами.

Продукты

Серия GeForce 700 (7xx)

Серия GeForce 700 для настольной архитектуры. Ожидалось, что со временем будут выпущены более дешевые и менее эффективные продукты. Kepler поддерживает функции 11.1 с уровнем функций 11_0 через API DirectX 11.1, однако Nvidia не включила четыре неигровые функции в Аппаратном обеспечении в Kepler (для 11_1).

Шейдерные процессоры : Блоки отображения текстуры : Единицы вывода рендеринга
Скорость заполнения пикселей вычисляется как количество ROP, умноженное на базовую тактовую частоту ядра.
Скорость заполнения текстуры рассчитывается как количество TMU, умноженное на базовую тактовую частоту ядра.
Производительность с одинарной точностью рассчитывается как удвоенное количество шейдеров, умноженное на базовую тактовую частоту ядра.
Производительность с двойной точностью GTX Titan и GTX Titan Black составляет 1/3 или 1/24 производительности одинарной точности в зависимости от выбранного пользователем параметра конфигурации в драйвере, который повышает производительность одинарной точности, если для двойной точности установлено значение 1/24 одинарной точности производительность, в то время как производительность двойной точности других чипов Kepler зафиксирована на уровне 1/24 от производительности одинарной точности. Производительность микросхем серии GeForce 700 Maxwell с двойной точностью составляет 1/32 от производительности с одинарной точностью.
SLI поддерживает подключение до 4 идентичных видеокарт для конфигурации 4-way SLI. Те, кто поддерживает 4-way SLI, могут поддерживать 3-way и 2-way SLI, однако карта с двумя GPU уже внутренне реализует 2-way SLI, поэтому только 2 карты с двумя GPU могут использоваться в SLI для обеспечения 4-way SLI. конфигурации.

Модель	Запуск	Кодовое название	Fab (nm )	Транзисторы (миллион)	Размер кристалла (mm )	Шина интерфейс	Конфигурация ядра	Тактовые частоты			Скорость заполнения		Память				Поддержка API (версия)				Мощность обработки (GFLOPS)		TDP (Вт)	SLI support	Стартовая цена (долл. США)
Модель	Запуск	Кодовое название	Fab (nm )	Транзисторы (миллион)	Размер кристалла (mm )	Шина интерфейс	Конфигурация ядра	Базовая частота ядра (МГц )	Повышенная частота ядра (МГц )	Память (МТ / с )	Пиксель (GP / с)	Текстура (GT / с)	Размер (MB )	Пропускная способность (ГБ / с)	Тип	Ширина шины (бит )	DirectX	OpenGL	OpenCL	Vulkan	Одинарная точность	Двойная точность	TDP (Вт)	SLI support	Стартовая цена (долл. США)
GeForce GT 705	27 марта 2014 г.	GF119	40	292	79	PCIe 2.0 x16	48: 8: 4	874	Н / Д	1800	1,75	7,0	1024. 2048	14,4.	DDR3	64	12,0 (11_0)	4,6	1,1	Н / Д	168	14	29	Н / Д	OEM
GeForce GT 710	29 января 2016 г.	GK208-301-A1	28	1020	87	PCIe 2.0 x8	192: 16: 8	954		1800. 5000	7,6	15,2	1024. 2048	14,4. 40	DDR3. GDDR5	32 / 64			1,2	1,1	366	15,2	19	Н / Д	42 $
GeForce GT 720	27 марта 2014 г.	GK208-201-B1	28	1020	87	PCIe 2.0 x8	192: 16: 8	797		1800. 5000	6,4	12,8	1024. 2048	14,4. 40	DDR3. GDDR5	32 / 64			1,2	1,1	306	12,8	19	Н / Д	49 <267 долл. США>GeForce GT 730 (DDR3, 128-бит)	18 июня 2014 г.	GF108	40	585	116	PCIe 2.0 x16	96: 16: 4	700	1800	2,8	11,2	1024 2048 4096	28,8	DDR3	128	1,1	Н / Д	134	Неизвестно	49	Н / Д	Неизвестно
GeForce GT 730 (DDR3, 64-бит)	GK208-301-A1	TSMC 28 нм	1020	79	PCIe 2.0 x8	384: 16: 8	902	7.2		14,4	1024. 2048 4096	14,4	64	1,2	?	693			28,9	23	Н / Д	Неизвестно												1800					DDR3
GeForce GT 730 (GDDR5)	GK208-400-A1		1020	79	PCIe 2.0 x8	384: 16: 8	902	7.2		14,4	5000	1024. 2048	64		?	693			28,9	40	GDDR5	25	Н / Д	Неизвестно
GeForce GT 740 (DDR3)	29 мая, 2014		GK107	1270	118	PCIe 3.0 x16	384: 32: 16	993		1800	15,9	31,8	2048		28,8	DDR3			128	1,1	762	31,8	64	Н / Д	89 $
GeForce GT 740 (GDDR5)	29 мая, 2014		GK107	1270	118		384: 32: 16	993. 1085		5000	15,9. 17,3	31,8. 34,7	2048. 4096		80	GDDR5					762. 832	31,8. 34,7	64	Н / Д	89 $
GeForce GTX 745 (OEM)	18 февраля 2014 г.		GM107	1870	148		384: 24: 16	1033		Неизвестно	1800	16,5	24,8		4096	28,8					DDR3	793	24,8	55	Н / Д	OEM
GeForce GTX 750	29 февраля 2014 г.. 1 декабря 2015 г.		GM107. GM206				512: 32: 16	1020	1085	5000	16,3	32,6	1024. 2048. 4096		80,2	GDDR5					12,0 (11_0). 12,0 (12_1)	1044	32,6	55	Н / Д	119 долларов
GeForce GTX 750 Ti	18 февраля 2014 г.		GM107				640: 40: 16	1020	1085	5000	16,3	40,8	1024. 2048. 4096		86,4		12,0 (11_0)				1306	40,8	60	Н / Д	149 долл. США
GeForce GTX 760 192-бит	Неизвестно		GK104	3540	294		1152: 96: 24	823	888	5808	19,8	79	1536. 3072		134				192		1896	79	130	3-way	OEM
GeForce GTX 760	25 июня 2013 г.						1152 : 96: 32	980	1033	6008	31,4	94,1	2048. 4096		192				256		2258	94,1	170		249 $
GeForce GTX 760 Ti	Неизвестно						1344: 112: 32	915	980	6008	29,3	103	2048		192						2460	103	170		OEM
GeForce GTX 770	30 мая 2013 г.						1536: 128: 32	1046	10 85	7010	33,5	134	2048. 4096		224						3213	134	230		399 долларов
GeForce GTX 780	23 мая 2013 г.		GK110	7080	561		2304: 192: 48	863	900	6008	41,4	166	3072. 6144		288				384		3977	166	250		649 долларов
GeForce GTX 780 Ti	7 ноября 2013 г.						2880: 240: 48	876	928	7000	42,0	210	3072		336						5046	210		4-процессорный	699 долл. США
GeForce GTX Titan	19 февраля 2013 г.						2688: 224: 48	837	876	6008	40,2	188	6144		288						4500	1500			999 долларов
GeForce GTX Titan Black	18 февраля 2014 г.						2880: 240: 48	889	980	7000	42,7	213	6144		336						5121	1707	250		999 долларов
GeForce GTX Titan Z	25 марта 2014 г.		2 × GK110	2 × 7080	2 × 561		2 × 2880: 240: 48	705	876	7000	2 × 33,8	2 × 169	2 × 6144		2 × 336				2 × 384		8122	2707	375	4-ходовой на 2 картах	2999 долл. США
Модель	Запуск	Кодовое имя	Fab (nm )	Транзисторы (миллион)	Размер кристалла (mm )	Шина интерфейс	Конфигурация ядра	Тактовые частоты			Скорость заполнения		Память				Поддержка API (версия)				Вычислительная мощность (GFLOPS)		TDP (Вт)	SLI поддержка	Стартовая цена (долл. США)
Модель	Запуск	Кодовое имя	Fab (nm )	Транзисторы (миллион)	Размер кристалла (mm )	Шина интерфейс	Конфигурация ядра	Базовая частота ядра (МГц )	Повышенная частота ядра (МГц )	Память (MT / s )	Пиксель (GP / с)	Текстура (GT / с)	Размер (MB )	Пропускная способность (ГБ / с)	Тип	Ширина шины (бит )	DirectX		OpenGL	OpenCL	Vulkan	одинарная точность	TDP (Вт)	SLI поддержка	Стартовая цена (долл. США)	двойная точность

серия GeForce 700M (7xxM)

Некоторые реализации могут использовать другие спецификации.

Унифицированные шейдеры : Блоки отображения текстуры : Блоки вывода рендера

Модель	Запуск	Кодовое имя	Fab (nm )	Шина интерфейс	Конфигурация ядра	Тактовая частота			Скорость заполнения		Память				Поддержка API (версия)				Мощность процессора. (GFLOPS)	TDP (Вт)	Примечания
Модель	Запуск	Кодовое имя	Fab (nm )	Шина интерфейс	Конфигурация ядра	Ядро (МГц )	Шейдер (МГц )	Память (MT / s )	Пиксель (GP / с)	Текстура (GT / с)	Размер (MB )	Пропускная способность (ГБ / с)	Тип	Ширина шины (бит )	DirectX	OpenGL	OpenCL	Vulkan	Мощность процессора. (GFLOPS)	TDP (Вт)	Примечания
GeForce 705M	1 июня 2013 г.	GF119	40	PCIe 2.0 x16	48: 8: 4	775	1550	1800	1,48	5,9	до 2048	?	DDR3	64	12,0 (11_0)	4,6	1,1	Н / Д	141,7	12	520 млн.
GeForce 710M	1 апреля 2013 г.	GF117	28		96: 16: 4	775	1550	1800	3,1	12,4	до 2048	14,4		64					297,6	15
GeForce GT 720M	1 апреля 2013 г.	GF117			96: 16: 4	800	1600	1600	2,5	10	до 2048 г.	12,8		64					240	33
GeForce GT 720M	25 декабря 2013 г.	GK208			192: 16: 8	800	800	1600	2,9	11,5	до 2048 г.	12,8		64			1,2	?	276	33
GeForce GT 730M	1 апреля 2013 г.	GK107		PCIe 3.0 x16	384: 32: 16	725	725	1800	5,8	23	до 2048	14,4 - 64,0	DDR3 GDDR5	128			1,1	1,1	552,2	33
GeForce GT 730M	6 марта 2014 г.	GK208		PCIe 2.0 x8	384: 16: 8	725	725	1800	5,8	11,5	до 2048	14,4 - 64,0	DDR3 GDDR5	64			1,1		552,2	33
GeForce GT 735M	1 апреля, 2013	GK208		PCIe 2.0 x 8	384: 32: 8	889	889	2000	4,6	9,2	до 2048	16,0	DDR3	64			1,2		441,6	33
GeForce GT 740M	1 апреля 2013 г.	GK107		PCIe 3.0 x16	384: 32: 16	810-1033	810-1033	1800/3600	6,48	25,9	до 2048	14,4 - 57,6	DDR3 GDDR5	128			1,1		622,1	45
GeForce GT 740M	20 июня 2013 г.	GK208		PCIe 3.0 x8	384: 16: 8	980-1033	980-1033	1800/3600	7,84	15,7	до 2048	14,4 - 57,6		64			1,2		752,6	33
GeForce GT 745M	1 апреля 2013 г.	GK107		PCIe 3.0 x16	384: 32: 16	837	837	2000–5000	4,39	17,6	до 2048	32,0 - 80,0		128			1,2		642,8	45
GeForce GT 750M	1 апреля 2013 г.				384: 32: 16	967	967	2000–5000	7,53	30,1	до 4096	32-80		128			1,1		722,7	50
GeForce GT 755M	Неизвестно				384: 32: 16	1020	1020	5400	15,7	31,4	до 2048	86,4	GDDR5	128					752,6	50
GeForce GTX 760M	30 мая 2013 г.	GK106			768: 64: 16	657	657	4008	10	40,2	2048	64,1		128					964,6	55
GeForce GTX 765M	30 мая 2013 г.				768: 64: 16	850	850	4008	12,8	51	2048	64,1		128			1.2		1224	75
GeForce GTX 770M	30 мая 2013 г.				960: 80: 24	811	811	4008	14,1	56,5	3072	96,2		192					1356	75
GeForce GTX 780M	30 мая 2013 г.	GK104			1536: 128: 32	823	823	5000	24,7	98,7	4096	160,0		256					2369	100

Таблица наборов микросхем

Прекращение поддержки

Nvidia объявила, что после выпуска драйверов 390.x она больше не будет выпускать 32-разрядные драйверы для 32-разрядных операционных систем.

Nvidia объявила, что графические процессоры для ноутбуков Kepler перейдут на поддержку устаревших версий с апреля 2019 года и будут поддерживаться до апреля 2020 года. Это изменение коснется всех графических процессоров для ноутбуков из семейства 7xxM.

В Windows последний драйвер, полностью поддерживающий CUDA с возможностью 64-битных вычислений 3.5 для Kepler в Windows 7 и Windows 8.1 64-бит, - 388.71, протестирован с последними версиями CUDA-Z и GPU-Z, после этого драйвера, поддержка 64-битного CUDA прекращается для GeForce серии 700 GK110 с архитектурой Kepler.

Драйвер 388.71 для 64-разрядной версии Windows 7 / W8.1 https://www.nvidia.com/download/driverResults.aspx/128419/en-us. Драйвер 388.71 для 64-разрядной версии Windows 10 https://www.nvidia.com/download/driverResults.aspx/128421/en-us

В OSX последним драйвером CUDA, полностью поддерживающим GTX Titan 6GB, является cudadriver-8.0. 90-macos.dmg https://www.nvidia.com/en-us/drivers/cuda/macosx-cuda-8-0-90-driver/

См. Также

Справочная информация

Внешняя ссылки

На Викискладе есть материалы, связанные с видеокартами Nvidia GeForce серии 700.