Суперсэмплинг глубокого обучения

редактировать

Суперсэмплинг глубокого обучения (DLSS ) - это технология масштабирования изображения, разработанная Nvidia для использования в режиме реального времени в выбранном видео. игры, использующие глубокое обучение для повышения разрешения изображений с более низким разрешением до более высокого разрешения для отображения на компьютерных мониторах с более высоким разрешением. Nvidia утверждает, что эта технология повышает качество изображений до качества, аналогичного качеству рендеринга изображения в исходном Более высокое разрешение, но с меньшим объемом вычислений, выполняемых видеокартой , что позволяет использовать более высокие графические настройки и частоту кадров для данного разрешения.

По состоянию на сентябрь 2020 года это Технология доступна на графических процессорах серий GeForce RTX 20 и GeForce RTX 30.

Содержание
  • 1 История
    • 1.1 История выпусков
  • 2 Алгоритм
    • 2.1 DLSS 1.0
    • 2.2 DLSS 2.0
  • 3 Архитектура
  • 4 См. Также
  • 5 Ссылки
История

Nvidia рекламировала DLSS как ключевую особенность графических процессоров серии GeForce RTX 20, когда они были выпущены в сентябре 2018 года. В то время результаты были ограничены несколькими видеоиграми (а именно Battlefield V и Metro Exodus ), потому что алгоритм нужно было обучать специально для каждой игры, в которой он применялся, и результаты обычно были не такими хорошими, как простое масштабирование разрешения.

В 2019 году видеоигра Control поставлялась с трассировкой лучей и улучшенной версией DLSS, в которой не использовались тензорные ядра.

В апреле 2020 года, Nvidia рекламировала и поставляла с драйвером версии 445.75 улучшенную версию DLSS под названием DLSS 2.0, которая была доступна для нескольких существующих игр, включая Control и Wolfenstein: Youngblood, и будет доступна позже для предстоящих игр. На этот раз Nvidia заявила, что снова использовала тензорные ядра и что ИИ не нужно обучать специально для каждой игры.

Побочным эффектом DLSS 2.0 является то, что он, похоже, не очень хорошо работает с методы сглаживания, такие как MSAA или TSAA, при этом на производительность очень сильно влияет использование этих методов поверх DLSS.

Как на апрель 2020 г., DLSS 2.0 по-прежнему должен быть включен для каждой игры разработчиками игр.

История выпусков

ВыпускДата выпускаОсновные моменты
1.0февраль 2019 г.Первая версия, с использованием ИИ и специально обученная для некоторых конкретных игр, включая Battlefield V и Metro Exodus
2.0 (первая итерация)Август 2019 г.Первая версия 2.0, также упоминаемая как версия 1.9, с использованием приблизительного ИИ незавершенной версии 2.0, работающей на ядрах шейдера CUDA и специально адаптированной для Control
2,0 (вторая итерация)апрель 2020 г.второй 2.0, снова с использованием тензорных ядер и общего обучения
Алгоритм

DLSS 1.0

Nvidia объяснила, что DLSS 1.0 работает для каждого целевого игрового изображения, создавая «идеальный кадр» с использованием традиционного суперсэмплинг, затем обучил нейронную сеть на этих результирующих изображениях. На втором этапе модель была обучена распознавать входные данные с псевдонимами в исходном результате.

DLSS 2.0

DLSS 2.0 работает следующим образом:

  • нейронная сеть обучается Nvidia с использованием «идеальных» изображений видеоигр сверхвысокого разрешения на суперкомпьютерах и изображений с низким разрешением тех же игр. Результат сохраняется в драйвере видеокарты . Говорят, что Nvidia использует серверы DGX-1 для обучения сети.
  • Нейронная сеть, хранящаяся в драйвере, сравнивает фактическое изображение низкого разрешения с эталоном и производит полное результат высокого разрешения. Входные данные, используемые обученной нейронной сетью, - это изображения с низким разрешением с псевдонимами, визуализированные игровым движком, и с низким разрешением, векторы движения из тех же изображений, также генерируется игровым движком. Векторы движения сообщают сети, в каком направлении объекты в сцене перемещаются от кадра к кадру, чтобы оценить, как будет выглядеть следующий кадр.
Архитектура

DLSS доступен только на GeForce Графические процессоры серии RTX 20 и GeForce RTX 30 в выделенных ускорителях искусственного интеллекта, называемых тензорными ядрами .

тензорными ядрами, доступны начиная с Nvidia Volta GPU микроархитектура, которая впервые была использована в линейке продуктов Tesla V100. Их специфика состоит в том, что каждое тензорное ядро ​​работает с 16-битными матрицами с плавающей запятой 4 x 4 и, похоже, предназначено для использования на уровне CUDA C ++, даже на уровень компилятора.

Тензорные ядра используют примитивы CUDA Warp -Level на 32 параллельных потоках, чтобы воспользоваться преимуществами своей параллельной архитектуры. Деформация - это набор из 32 потоков, которые сконфигурированы для выполнения одной и той же инструкции.

См. Также
Ссылки
Последняя правка сделана 2021-05-17 11:10:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте