Серия GeForce 700

редактировать
Серия графических процессоров

Серия GeForce 700
Логотип серии GTX 700 с slogan.png . Nvidia Geforce GTX 780ti.png Geforce GTX 780ti Founders Edition
Дата выпуска19 февраля 2013 г.; 7 лет назад (19 февраля 2013 г.)
Кодовое имя
  • GK110
  • GK208
АрхитектураKepler
МоделиGeForce Series
  • GeForce GT Series
  • GeForce GTX Series
Транзисторы
  • 585M 28 нм (GF117)
  • 1,02B 28 нм (GK208)
  • 1,27B 28 нм (GK107)
  • 3,54B 28 нм (GK104)
  • 7,08B 28 нм (GK110)
Процесс изготовления
Карты
Начального уровня
  • GeForce GT 705
  • GeForce GT 710
  • GeForce GT 720
  • GeForce GT 730
  • GeForce GT 740
  • GeForce GTX 745
среднего уровня
  • GeForce GTX 750
  • GeForce GTX 750 Ti
  • GeForce GTX 760 192-бит
  • GeForce GTX 760
  • GeForce GTX 760 Ti
High-end
  • GeForce GTX 770
  • GeForce GTX 780
  • GeForce GTX 780 Ti
Enthusiast
  • GeForce GTX Titan
  • GeForce GTX Titan Black
  • GeForce GTX Titan Z
API поддержка
Direct3D Direct3D 12.0 (уровень функций 11_0)
OpenCL OpenCL 1.2
OpenGL OpenGL 4.6
Vulkan Vulkan 1.1. SPIR-V
История
Предшественниксерия GeForce 600
Вариантсерия GeForce 800M
ПреемникGeForce 900 серия

GeForce 700 series (стилизованная под GEFORCE GTX 700 SERIES ) представляет собой серию графических процессоров, разработанных Nvidia. Хотя в основном это обновление микроархитектуры Kepler (чипы с кодовым названием GK), некоторые карты используют Fermi (GF), а более поздние карты используют Maxwell (GM). Карты серии GeForce 700 были впервые выпущены в 2013 году, начиная с выпуска GeForce GTX Titan 19 февраля 2013 года, а затем GeForce GTX 780 23 мая 2013 года. Первые мобильные чипы серии GeForce 700 были выпущены в апреле 2013 года.

Содержание
  • 1 Обзор
  • 2 Архитектура
    • 2.1 Оптимизация SMX для вычислений
    • 2.2 Новые инструкции по перетасовке
    • 2.3 NVENC
    • 2.4 Hyper-Q
    • 2.5 Поддержка Microsoft DirectX
    • 2.6 Динамический параллелизм
  • 3 продукта
    • 3.1 GeForce 700 (7xx) series
    • 3.2 GeForce 700M (7xxM) series
  • 4 Таблица наборов микросхем
  • 5 Прекращенная поддержка
  • 6 См. Также
  • 7 Ссылки
  • 8 Внешние ссылки
Обзор

GK110 был разработан и продается с расчетом на производительность вычислений. Он содержит 7,1 миллиарда транзисторов. Эта модель также пытается максимизировать энергоэффективность за счет выполнения как можно большего количества задач параллельно в соответствии с возможностями потоковых процессоров.

С GK110 наблюдается увеличение объема памяти и пропускной способности как для файла регистров, так и для кэша L2 по сравнению с предыдущими моделями. На уровне SMX регистровое файловое пространство GK110 увеличилось до 256 КБ, состоящих из 64 КБ 32-битных регистров, по сравнению с 32-разрядными 32-разрядными регистрами Fermi, всего 128 КБ. Что касается кеш-памяти второго уровня, то пространство кэша второго уровня GK110 увеличено до 1,5 МБ, что в 2 раза больше, чем у GF110. Пропускная способность кэша L2 и файла регистров также увеличилась вдвое. Производительность в сценариях с нехваткой регистров также повышается, поскольку для каждого потока доступно больше регистров. Это сопровождается увеличением общего числа регистров, которые может адресовать каждый поток, с переходом от 63 регистров на поток к 255 регистрам на поток с GK110.

В GK110 Nvidia также переработала кеш текстуры GPU , который будет использоваться для вычислений. Имея размер 48 КБ, при вычислении кэш текстур становится доступным только для чтения, специализируясь на рабочих нагрузках невыровненного доступа к памяти. Кроме того, были добавлены возможности обнаружения ошибок, чтобы сделать его более безопасным для использования с рабочими нагрузками, которые полагаются на ECC.

Эта серия поддерживает DirectX 12 в Windows 10.

Было добавлено динамическое суперразрешение (DSR). Графические процессоры Kepler с новейшими драйверами Nvidia.

Архитектура
PCB GTX 780. Нижняя сторона печатной платы GTX 780. GPU GTX 780M с разъемом MXM.

Серия GeForce 700 содержит функции как GK104, так и GK110. Члены серии 700 на базе Kepler добавляют к семейству GeForce следующие стандартные функции.

На основе GK104:

  • Интерфейс PCI Express 3.0
  • DisplayPort 1.2
  • HDMI 1.4a видеовыход 4K x 2K
  • Purevideo VP5 аппаратное ускорение видео (декодирование до 4K x 2K H.264)
  • Блок аппаратного ускорения кодирования H.264 (NVENC)
  • Поддержка до 4 независимых 2D-дисплеев или 3-х стереоскопических / 3D-дисплеев отображает (NV Surround)
  • текстуры без привязки
  • GPU Boost
  • TXAA
  • Изготовлено TSMC по 28-нм техпроцессу

Новые функции GK110:

  • Улучшение Compute Focus SMX
  • CUDA Compute Capability 3.5
  • Новые инструкции перемешивания
  • Динамический параллелизм
  • Hyper-Q ( Запас функциональности MPI Hyper-Q только для Tesla)
  • Grid Management Unit
  • NVIDIA GPUDirect (резерв функциональности RDMA GPU Direct только для Tesla и Quadro)

Повышение внимания SMX к вычислениям

В GK110 Nvidia решила повысить производительность вычислений. Единственное самое большое изменение по сравнению с GK104 заключается в том, что вместо 8 выделенных ядер FP64 CUDA GK110 имеет до 64, что дает ему в 8 раз большую пропускную способность FP64 по сравнению с GK104 SMX. SMX также видит увеличение пространства для файла реестра. Регистровое файловое пространство увеличено до 256 КБ по сравнению с Fermi. Также улучшен кеш текстур. Имея 48 КБ пространства, кэш текстур может стать кешем только для чтения для вычислительных рабочих нагрузок.

Новые инструкции перемешивания

На низком уровне GK110 видит дополнительные инструкции и операции для дальнейшего повышения производительности. Новые инструкции перемешивания позволяют потокам в пределах деформации обмениваться данными без возврата в память, что делает процесс намного быстрее, чем предыдущий метод загрузки / совместного использования / сохранения. Атомарные операции также были переработаны, увеличена скорость выполнения атомарных операций и добавлены некоторые операции FP64, которые ранее были доступны только для данных FP32.

NVENC

Hyper-Q

Hyper-Q увеличивает количество рабочих очередей оборудования GK110 с 1 до 32. Важность этого заключалась в том, что наличие единственной очереди работ означало, что Ферми иногда мог быть недостаточно занят, поскольку в этой очереди не было достаточно работы, чтобы заполнить все SM. Имея 32 рабочие очереди, GK110 может во многих сценариях достичь более высокого уровня использования, имея возможность помещать различные потоки задач в то, что в противном случае было бы неактивным SMX. Простая природа Hyper-Q дополнительно подкрепляется тем фактом, что он легко отображается на MPI, общий интерфейс передачи сообщений, часто используемый в HPC. Поскольку у устаревших алгоритмов на основе MPI, которые изначально были разработаны для многопроцессорных систем, которые оказались узкими местами из-за ложных зависимостей, теперь есть решение. Увеличив количество заданий MPI, можно использовать Hyper-Q в этих алгоритмах для повышения эффективности без изменения самого кода.

Поддержка Microsoft DirectX

Графические процессоры NVIDIA Kepler для GeForce 700-я серия полностью поддерживает DirectX 11.0.

NVIDIA поддерживает DX12 API на всех графических процессорах класса DX11, которые она поставила; они принадлежат к архитектурным семействам Ферми, Кеплера и Максвелла.

Динамический параллелизм

Способность динамического параллелизма позволяет ядрам отправлять другие ядра. С Fermi только ЦП мог отправлять ядро, что влечет за собой определенные накладные расходы из-за необходимости обратной связи с ЦП. Предоставляя ядрам возможность отправлять свои собственные дочерние ядра, GK110 может как сэкономить время, не возвращаясь к ЦП, так и в процессе освободить ЦП для работы над другими задачами.

Продукты

Серия GeForce 700 (7xx)

Серия GeForce 700 для настольной архитектуры. Ожидалось, что со временем будут выпущены более дешевые и менее эффективные продукты. Kepler поддерживает функции 11.1 с уровнем функций 11_0 через API DirectX 11.1, однако Nvidia не включила четыре неигровые функции в Аппаратном обеспечении в Kepler (для 11_1).

  • Шейдерные процессоры : Блоки отображения текстуры : Единицы вывода рендеринга
  • Скорость заполнения пикселей вычисляется как количество ROP, умноженное на базовую тактовую частоту ядра.
  • Скорость заполнения текстуры рассчитывается как количество TMU, умноженное на базовую тактовую частоту ядра.
  • Производительность с одинарной точностью рассчитывается как удвоенное количество шейдеров, умноженное на базовую тактовую частоту ядра.
  • Производительность с двойной точностью GTX Titan и GTX Titan Black составляет 1/3 или 1/24 производительности одинарной точности в зависимости от выбранного пользователем параметра конфигурации в драйвере, который повышает производительность одинарной точности, если для двойной точности установлено значение 1/24 одинарной точности производительность, в то время как производительность двойной точности других чипов Kepler зафиксирована на уровне 1/24 от производительности одинарной точности. Производительность микросхем серии GeForce 700 Maxwell с двойной точностью составляет 1/32 от производительности с одинарной точностью.
  • SLI поддерживает подключение до 4 идентичных видеокарт для конфигурации 4-way SLI. Те, кто поддерживает 4-way SLI, могут поддерживать 3-way и 2-way SLI, однако карта с двумя GPU уже внутренне реализует 2-way SLI, поэтому только 2 карты с двумя GPU могут использоваться в SLI для обеспечения 4-way SLI. конфигурации.
МодельЗапускКодовое название Fab (nm )Транзисторы (миллион)Размер кристалла (mm )Шина интерфейс Конфигурация ядраТактовые частотыСкорость заполнения ПамятьПоддержка API (версия)Мощность обработки (GFLOPS)TDP (Вт)SLI supportСтартовая цена (долл. США)
Базовая частота ядра (МГц )Повышенная частота ядра (МГц )Память (МТ / с )Пиксель (GP / с)Текстура (GT / с)Размер (MB )Пропускная способность (ГБ / с)ТипШирина шины (бит )DirectX OpenGL OpenCL Vulkan Одинарная точностьДвойная точность
GeForce GT 70527 марта 2014 г.GF1194029279PCIe 2.0 x1648: 8: 4874Н / Д18001,757,01024. 204814,4.DDR36412,0 (11_0)4,61,1Н / Д1681429Н / ДOEM
GeForce GT 71029 января 2016 г.GK208-301-A128102087PCIe 2.0 x8192: 16: 89541800. 50007,615,21024. 204814,4. 40DDR3. GDDR532

/

64

1,21,136615,219Н / Д42 $
GeForce GT 72027 марта 2014 г.GK208-201-B17976,412,830612,8Н / Д49 <267 долл. США>GeForce GT 730 (DDR3, 128-бит)18 июня 2014 г.GF10840585116PCIe 2.0 x1696: 16: 470018002,811,21024

2048

4096

28,8DDR31281,1Н / Д134Неизвестно49Н / ДНеизвестно
GeForce GT 730 (DDR3, 64-бит)GK208-301-A1TSMC 28 нм 102079PCIe 2.0 x8384: 16: 89027.214,41024. 2048

4096

14,4641,2?69328,923Н / ДНеизвестно
GeForce GT 730 (GDDR5)GK208-400-A150001024. 204840GDDR525Н / ДНеизвестно
GeForce GT 740 (DDR3)29 мая, 2014GK1071270118PCIe 3.0 x16384: 32: 16993180015,931,8204828,8DDR31281,176231,864Н / Д89 $
GeForce GT 740 (GDDR5)993. 1085500015,9. 17,331,8. 34,72048. 409680GDDR5762. 83231,8. 34,7Н / Д
GeForce GTX 745 (OEM)18 февраля 2014 г.GM1071870148384: 24: 161033Неизвестно180016,524,8409628,8DDR379324,855Н / ДOEM
GeForce GTX 75029 февраля 2014 г.. 1 декабря 2015 г.GM107. GM206512: 32: 1610201085500016,332,61024. 2048. 409680,2GDDR512,0 (11_0). 12,0 (12_1)104432,6Н / Д119 долларов
GeForce GTX 750 Ti18 февраля 2014 г.GM107640: 40: 1616,340,81024. 2048. 409686,412,0 (11_0)130640,860Н / Д149 долл. США
GeForce GTX 760 192-битНеизвестноGK10435402941152: 96: 24823888580819,8791536. 30721341921896791303-wayOEM
GeForce GTX 76025 июня 2013 г.1152 : 96: 329801033600831,494,12048. 4096192256225894,1170249 $
GeForce GTX 760 TiНеизвестно1344: 112: 3291598029,310320481922460103OEM
GeForce GTX 77030 мая 2013 г.1536: 128: 32104610 85701033,51342048. 40962243213134230399 долларов
GeForce GTX 78023 мая 2013 г.GK11070805612304: 192: 48863900600841,41663072. 61442883843977166250649 долларов
GeForce GTX 780 Ti7 ноября 2013 г.2880: 240: 48876928700042,0210307233650462104-процессорный699 долл. США
GeForce GTX Titan19 февраля 2013 г.2688: 224: 48837876600840,2188614428845001500999 долларов
GeForce GTX Titan Black18 февраля 2014 г.2880: 240: 48889980700042,721333651211707250
GeForce GTX Titan Z25 марта 2014 г.2 × GK1102 × 70802 × 5612 × 2880: 240: 487058762 × 33,82 × 1692 × 61442 × 3362 × 384812227073754-ходовой на 2 картах2999 долл. США
МодельЗапускКодовое имя Fab (nm )Транзисторы (миллион)Размер кристалла (mm )Шина интерфейс Конфигурация ядраТактовые частотыСкорость заполнения ПамятьПоддержка API (версия)Вычислительная мощность (GFLOPS)TDP (Вт)SLI поддержкаСтартовая цена (долл. США)
Базовая частота ядра (МГц )Повышенная частота ядра (МГц )Память (MT / s )Пиксель (GP / с)Текстура (GT / с)Размер (MB )Пропускная способность (ГБ / с)ТипШирина шины (бит )DirectX OpenGL OpenCL Vulkan одинарная точностьдвойная точность

серия GeForce 700M (7xxM)

Некоторые реализации могут использовать другие спецификации.

МодельЗапускКодовое имя Fab (nm )Шина интерфейс Конфигурация ядраТактовая частотаСкорость заполнения ПамятьПоддержка API (версия)Мощность процессора. (GFLOPS)TDP (Вт)Примечания
Ядро (МГц )Шейдер (МГц )Память (MT / s )Пиксель (GP / с)Текстура (GT / с)Размер (MB )Пропускная способность (ГБ / с)ТипШирина шины (бит )DirectX OpenGL OpenCL Vulkan
GeForce 705M1 июня 2013 г.GF11940PCIe 2.0 x1648: 8: 4775155018001,485,9до 2048?DDR36412,0 (11_0)4,61,1Н / Д141,712520 млн.
GeForce 710M1 апреля 2013 г.GF1172896: 16: 4775155018003,112,4до 204814,464297,615
GeForce GT 720M1 апреля 2013 г.96: 16: 4800160016002,510до 2048 г.12,86424033
25 декабря 2013 г.GK208192: 16: 88002,911,51,2?27633
GeForce GT 730M1 апреля 2013 г.GK107PCIe 3.0 x16384: 32: 1672572518005,823до 204814,4 - 64,0DDR3 GDDR51281,11,1552,233
6 марта 2014 г.GK208PCIe 2.0 x8384: 16: 85,811,564
GeForce GT 735M1 апреля, 2013PCIe 2.0 x 8384: 32: 888988920004,69,2до 204816,0DDR3641,2441,633
GeForce GT 740M1 апреля 2013 г.GK107PCIe 3.0 x16384: 32: 16810-1033810-10331800/36006,4825,9до 204814,4 - 57,6DDR3 GDDR51281,1622,145
20 июня 2013 г.GK208PCIe 3.0 x8384: 16: 8980-1033980-10337,8415,7641,2752,633
GeForce GT 745M1 апреля 2013 г.GK107PCIe 3.0 x16384: 32: 168378372000–50004,3917,6до 204832,0 - 80,0128642,845
GeForce GT 750M1 апреля 2013 г.384: 32: 169679672000–50007,5330,1до 409632-801281,1722,750
GeForce GT 755MНеизвестно384: 32: 1610201020540015,731,4до 204886,4GDDR5128752,650
GeForce GTX 760M30 мая 2013 г.GK106768: 64: 1665765740081040,2204864,1128964,655
GeForce GTX 765M30 мая 2013 г.768: 64: 16850850400812,851204864,11281.2122475
GeForce GTX 770M30 мая 2013 г.960: 80: 24811811400814,156,5307296,2192135675
GeForce GTX 780M30 мая 2013 г.GK1041536: 128: 32823823500024,798,74096160,02562369100
Таблица наборов микросхем
Прекращение поддержки

Nvidia объявила, что после выпуска драйверов 390.x она больше не будет выпускать 32-разрядные драйверы для 32-разрядных операционных систем.

Nvidia объявила, что графические процессоры для ноутбуков Kepler перейдут на поддержку устаревших версий с апреля 2019 года и будут поддерживаться до апреля 2020 года. Это изменение коснется всех графических процессоров для ноутбуков из семейства 7xxM.

В Windows последний драйвер, полностью поддерживающий CUDA с возможностью 64-битных вычислений 3.5 для Kepler в Windows 7 и Windows 8.1 64-бит, - 388.71, протестирован с последними версиями CUDA-Z и GPU-Z, после этого драйвера, поддержка 64-битного CUDA прекращается для GeForce серии 700 GK110 с архитектурой Kepler.

Драйвер 388.71 для 64-разрядной версии Windows 7 / W8.1 https://www.nvidia.com/download/driverResults.aspx/128419/en-us. Драйвер 388.71 для 64-разрядной версии Windows 10 https://www.nvidia.com/download/driverResults.aspx/128421/en-us

В OSX последним драйвером CUDA, полностью поддерживающим GTX Titan 6GB, является cudadriver-8.0. 90-macos.dmg https://www.nvidia.com/en-us/drivers/cuda/macosx-cuda-8-0-90-driver/

См. Также
Справочная информация
Внешняя ссылки
На Викискладе есть материалы, связанные с видеокартами Nvidia GeForce серии 700.
Последняя правка сделана 2021-05-21 13:39:39
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте