Суперсэмплинг глубокого обучения

редактировать

Суперсэмплинг глубокого обучения (DLSS ) - это технология масштабирования изображения, разработанная Nvidia для использования в режиме реального времени в выбранном видео. игры, использующие глубокое обучение для повышения разрешения изображений с более низким разрешением до более высокого разрешения для отображения на компьютерных мониторах с более высоким разрешением. Nvidia утверждает, что эта технология повышает качество изображений до качества, аналогичного качеству рендеринга изображения в исходном Более высокое разрешение, но с меньшим объемом вычислений, выполняемых видеокартой , что позволяет использовать более высокие графические настройки и частоту кадров для данного разрешения.

По состоянию на сентябрь 2020 года это Технология доступна на графических процессорах серий GeForce RTX 20 и GeForce RTX 30.

Содержание

1 История
- 1.1 История выпусков
2 Алгоритм
- 2.1 DLSS 1.0
- 2.2 DLSS 2.0
3 Архитектура
4 См. Также
5 Ссылки

История

Nvidia рекламировала DLSS как ключевую особенность графических процессоров серии GeForce RTX 20, когда они были выпущены в сентябре 2018 года. В то время результаты были ограничены несколькими видеоиграми (а именно Battlefield V и Metro Exodus ), потому что алгоритм нужно было обучать специально для каждой игры, в которой он применялся, и результаты обычно были не такими хорошими, как простое масштабирование разрешения.

В 2019 году видеоигра Control поставлялась с трассировкой лучей и улучшенной версией DLSS, в которой не использовались тензорные ядра.

В апреле 2020 года, Nvidia рекламировала и поставляла с драйвером версии 445.75 улучшенную версию DLSS под названием DLSS 2.0, которая была доступна для нескольких существующих игр, включая Control и Wolfenstein: Youngblood, и будет доступна позже для предстоящих игр. На этот раз Nvidia заявила, что снова использовала тензорные ядра и что ИИ не нужно обучать специально для каждой игры.

Побочным эффектом DLSS 2.0 является то, что он, похоже, не очень хорошо работает с методы сглаживания, такие как MSAA или TSAA, при этом на производительность очень сильно влияет использование этих методов поверх DLSS.

Как на апрель 2020 г., DLSS 2.0 по-прежнему должен быть включен для каждой игры разработчиками игр.

История выпусков

Выпуск	Дата выпуска	Основные моменты
1.0	февраль 2019 г.	Первая версия, с использованием ИИ и специально обученная для некоторых конкретных игр, включая Battlefield V и Metro Exodus
2.0 (первая итерация)	Август 2019 г.	Первая версия 2.0, также упоминаемая как версия 1.9, с использованием приблизительного ИИ незавершенной версии 2.0, работающей на ядрах шейдера CUDA и специально адаптированной для Control
2,0 (вторая итерация)	апрель 2020 г.	второй 2.0, снова с использованием тензорных ядер и общего обучения

Алгоритм

DLSS 1.0

Nvidia объяснила, что DLSS 1.0 работает для каждого целевого игрового изображения, создавая «идеальный кадр» с использованием традиционного суперсэмплинг, затем обучил нейронную сеть на этих результирующих изображениях. На втором этапе модель была обучена распознавать входные данные с псевдонимами в исходном результате.

DLSS 2.0

DLSS 2.0 работает следующим образом:

нейронная сеть обучается Nvidia с использованием «идеальных» изображений видеоигр сверхвысокого разрешения на суперкомпьютерах и изображений с низким разрешением тех же игр. Результат сохраняется в драйвере видеокарты . Говорят, что Nvidia использует серверы DGX-1 для обучения сети.
Нейронная сеть, хранящаяся в драйвере, сравнивает фактическое изображение низкого разрешения с эталоном и производит полное результат высокого разрешения. Входные данные, используемые обученной нейронной сетью, - это изображения с низким разрешением с псевдонимами, визуализированные игровым движком, и с низким разрешением, векторы движения из тех же изображений, также генерируется игровым движком. Векторы движения сообщают сети, в каком направлении объекты в сцене перемещаются от кадра к кадру, чтобы оценить, как будет выглядеть следующий кадр.

Архитектура

DLSS доступен только на GeForce Графические процессоры серии RTX 20 и GeForce RTX 30 в выделенных ускорителях искусственного интеллекта, называемых тензорными ядрами .

тензорными ядрами, доступны начиная с Nvidia Volta GPU микроархитектура, которая впервые была использована в линейке продуктов Tesla V100. Их специфика состоит в том, что каждое тензорное ядро работает с 16-битными матрицами с плавающей запятой 4 x 4 и, похоже, предназначено для использования на уровне CUDA C ++, даже на уровень компилятора.

Тензорные ядра используют примитивы CUDA Warp -Level на 32 параллельных потоках, чтобы воспользоваться преимуществами своей параллельной архитектуры. Деформация - это набор из 32 потоков, которые сконфигурированы для выполнения одной и той же инструкции.

См. Также

Масштабирование изображения
Глубокое обучение
Суперсэмплинг
GeForce
Nvidia DGX
Блок тензорной обработки, интегральная схема для конкретного приложения ускорителя AI ( ASIC) разработан Google
Список игр с поддержкой DLSS

Ссылки