Синтез человеческого образа

редактировать

В этой системе анимации морфинга четыре «выражения» были определены как деформации геометрии модели. Любую комбинацию этих четырех выражений можно использовать для анимации формы рта. Подобные элементы управления могут применяться для анимации всей модели, похожей на человека.

Синтез человеческого изображения - это технология, которая может применяться для создания правдоподобных и даже фотореалистичных изображений человеческих образов, движущихся или неподвижных. Фактически он существует с начала 2000-х годов. Во многих фильмах, использующих компьютерные образы, были представлены синтетические изображения человекоподобных персонажей, в цифровой форме наложенные на реальный или другой смоделированный киноматериал. К концу 2010-х годов искусственный интеллект с глубоким обучением был применен для синтеза изображений и видео, похожих на людей, без помощи человека, после завершения фазы обучения, тогда как старый школьный 7D-маршрут требовал огромного количества человеческой работы..

СОДЕРЖАНИЕ
  • 1 Хронология синтеза человеческих изображений
  • 2 Ключевой прорыв в фотореализме: захват отражения
  • 3 Захват
  • 4 Синтез
  • 5 подход к машинному обучению
  • 6 приложений
  • 7 Связанные вопросы
  • 8 См. Также
  • 9 ссылки
Хронология синтеза человеческих изображений
Основные статьи: История компьютерной анимации и Хронология компьютерной анимации в кино и на телевидении BRDF в сравнении с подповерхностным рассеянием, включая BSSRDF, т.е. функция распределения двунаправленного рассеяния-поверхностного отражения
  • В конце 2017 - начале 2018 года всплыли споры о дипфейках, когда порно-видео были подделаны с использованием глубокого машинного обучения, так что лицо актрисы было заменено мнением программного обеспечения о том, как будет выглядеть лицо другого человека в той же позе и освещении.
  • В 2018 году GDC Epic Games и Tencent Games продемонстрировали «Сирену», цифровую копию актрисы Бинджи Цзян. Это стало возможным с помощью следующих технологий: CubicMotion «s компьютерное зрение системы, 3Lateral » такелаж лицевой системы s и Vicon система захвата движения «s. Демонстрация проходила практически в реальном времени со скоростью 60 кадров в секунду в Unreal Engine 4.
  • В 2018 году на Всемирной конференции Интернет в Wuzhen Агентство Синьхуа представила два цифровых двойники, сделанные в сходстве его реальные новости якорей Цю Хао (китайский язык) и Чжан Чжао (английский язык). Цифровые двойники были созданы совместно с Sogou. Ни синтез речи, ни жесты цифровых якорей-двойников не были достаточно хороши, чтобы обмануть наблюдателя и принять их за реальных людей, изображенных телекамерой.
  • В сентябре 2018 года Google добавил «непроизвольные синтетические порнографические изображения» в свой список запретов, позволяя любому запрашивать результаты блокировки поисковой системы, которые ложно изображают их как «обнаженные или в откровенно сексуальной ситуации».
  • С 1 сентября 2019 года вступил в силу законопроект сената Техаса SB 751 о поправках к избирательному кодексу, согласно которым кандидатам на выборах предоставляется 30-дневный период защиты от выборов, в течение которого создание и распространение цифровых двойников или синтетических подделок кандидатов является правонарушением. В тексте закона субъект закона определяется как « видеоролик, созданный с целью обмана, на котором изображено реальное лицо, выполняющее действие, которого не было на самом деле ».
  • В сентябре 2019 года финская государственная телерадиокомпания Yle представила результаты экспериментальной журналистики - дипфейк действующего президента Саули Ниинистё в своей основной новостной передаче с целью освещения передовых технологий дезинформации и связанных с ними проблем.
  • 1 января 2020 года в Калифорнии вступил в силу закон штата AB-602, запрещающий производство и распространение синтетической порнографии без согласия изображенных людей. AB-602 предоставляет жертвам синтетической порнографии судебный запрет и представляет собой юридическую угрозу в виде законодательной и штрафной компенсации преступникам, создающим или распространяющим синтетическую порнографию без согласия. Законопроект AB-602 был подписан губернатором Калифорнии Гэвином Ньюсомом 3 октября 2019 года и был автором члена Ассамблеи штата Калифорния Марка Бермана.
  • 1 января 2020 года вступил в силу китайский закон, требующий, чтобы на синтетически фальшивых кадрах было четко указано, что это фальшивка. Невыполнение требований может рассматриваться как преступление, о котором Администрация киберпространства Китая сообщила на своем веб-сайте. Китай объявил об этом новом законе в ноябре 2019 года. Китайское правительство, похоже, оставляет за собой право преследовать как пользователей, так и онлайн-видеоплатформы, не соблюдающие правила.
Ключевой прорыв в фотореализме: захват отражения
ESPER LightCage - это пример сферической световой сцены с многокамерной установкой вокруг сферы, пригодной для захвата в 7D-модель отражательной способности.

В 1999 г. Пол Дебевек и др. из USC сделали первый известный снимок отражательной способности человеческого лица с их чрезвычайно простой световой сценой. Они представили свой метод и результаты в SIGGRAPH 2000.

Функция распределения двунаправленного рассеяния (BSDF) для подобия кожи человека требует как BRDF, так и специального случая BTDF, когда свет входит в кожу, передается и выходит из кожи.

Научный прорыв потребовал обнаружения подповерхностного светового компонента (имитационные модели слегка светятся изнутри), который можно найти, зная, что свет, отраженный от слоя нефти и воздуха, сохраняет свою поляризацию, а подповерхностный свет теряет поляризацию. Таким образом, он оснащен только подвижным источником света, подвижной видеокамерой, двумя поляризаторами и компьютерной программой, выполняющей чрезвычайно простую математику, и последняя деталь, необходимая для достижения фотореализма, была получена.

Для получения правдоподобного результата и свет, отраженный от кожи ( BRDF ) и внутри кожи (частный случай BTDF ), которые вместе составляют BSDF, должны быть захвачены и смоделированы.

Захватывать
Ручной трехмерный сканер.
Синтез

Весь процесс создания цифровых двойников т.е. символы настолько реалистично и реалистично, что они могут быть переданы от как картины человека является очень сложной задачей, поскольку это требует photorealistically моделирования, анимации, кросс-отображение и рендеринг в мягкие динамики тела из человеческий облик.

Синтез с действующим лицом и подходящими алгоритмами применяется с использованием мощных компьютеров. Роль актера в синтезе состоит в том, чтобы имитировать человеческие выражения при синтезе неподвижного изображения, а также человеческое движение при синтезе кинофильма. Алгоритмы необходимы для моделирования законов физики и физиологии и для сопоставления моделей и их внешнего вида, движений и взаимодействия соответственно.

Часто в части синтеза используются моделирование и рендеринг как на основе физики / физиологии (т.е. скелетная анимация ), так и на основе изображений. Гибридные модели, использующие оба подхода, показали наилучшие результаты с точки зрения реалистичности и простоты использования. Целевая анимация морфинга снижает рабочую нагрузку, предоставляя более высокий уровень управления, где различные выражения лица определяются как деформации модели, а выражение лица позволяет интуитивно настраивать выражения. Затем анимация цели морфинга может преобразовывать модель между различными определенными выражениями лица или позами тела без особого вмешательства человека.

Использование карты смещения играет важную роль в получении реалистичного результата с мелкими деталями кожи, такими как поры и морщины размером до 100 мкм.

Подход машинного обучения

В конце 2010-х годов NVIDIA использовала машинное обучение, а точнее генеративные состязательные сети (GAN), для создания случайных, но фотореалистичных портретов, похожих на людей. Система под названием StyleGAN была обучена на базе данных из 70 000 изображений с веб-сайта хранилища изображений Flickr. Исходный код был опубликован на GitHub в 2019 году. Выходные данные сети генератора из случайных входных данных были общедоступны на ряде веб-сайтов.

Аналогично, так как 2018, deepfake технология позволила GANS на грани своп между субъектами; Таким образом, в сочетании с возможностью подделывать голоса GAN могут создавать поддельные видеоролики, которые кажутся убедительными.

Приложения

Основные приложения относятся к области стоковой фотографии, синтетических наборов данных, виртуальной кинематографии, компьютерных и видеоигр и скрытых дезинформационных атак.

Кроме того, некоторые исследования показывают, что это может иметь терапевтический эффект, поскольку « психологи и консультанты также начали использовать аватары для оказания терапии клиентам, имеющим фобии, травмы в анамнезе, зависимости, синдром Аспергера или социальную тревогу ». Эффект сильного отпечатка памяти и активации мозга, вызванный просмотром вашего цифрового двойного аватара, получил название эффекта Доппельгангера. Эффект двойника может лечить, когда скрытая дезинформационная атака подвергается атаке как таковая.

Связанные вопросы

Синтеза речи была доходящей быть полностью неотличимы от записи голоса реального человека со времени 2016 года внедрение голосового редактирования и программного обеспечения генерации Adobe VOCO, прототип намечен, чтобы быть частью Adobe Creative Suite и DeepMind WaveNet, прототип от Google. Возможность воровать и манипулировать голосами других людей вызывает очевидные этические проблемы.

На конференции по системам обработки нейронной информации (NeurIPS) 2018 года исследователи из Google представили работу «Перенос обучения от проверки говорящего на синтез речи с несколькими дикторами», которая переносит обучение от проверки говорящего на синтез текста в речь. можно заставить звучать почти как любой из 5-секундного фрагмента речи (слушайте).

Использование изображений для обучения ИИ поднимает вопрос о конфиденциальности, поскольку люди, которых используют для обучения, не давали на это согласия.

Цифровые звуковые технологии попали в руки преступников, поскольку в 2019 году исследователям Symantec было известно о трех случаях использования технологий в преступных целях.

Это в сочетании с тем, что (по состоянию на 2016 г.) методов, которые позволяют практически в реальном времени с подделками из мимики в существующих 2D видео было правдоподобно продемонстрированной Увеличивает нагрузку на ситуации дезинформации.

Смотрите также
использованная литература
Последняя правка сделана 2024-01-06 05:05:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте