DeepDream

редактировать

Программа

DeepDream - это программа компьютерного зрения, созданная инженером Google Александром Мордвинцевым, в которой используется сверточная нейронная сеть для поиска и улучшения шаблонов в изображениях с помощью алгоритмической парейдолии, создавая таким образом мечту -подобие галлюциногенное появление в преднамеренно чрезмерно обработанных изображениях.

Программа Google популяризовала термин (глубокое) «сновидение» для обозначения генерации изображений которые производят желаемые активации в обученной глубокой сети, и теперь этот термин относится к набору связанных подходов.

Содержание

1 История
2 Процесс
3 Использование
4 См. Также
5 Ссылки
6 Внешние ссылки

История

Программное обеспечение DeepDream, возникла в глубокой сверточной сети под кодовым названием «Начало» после одноименного фильма, была разработана для крупномасштабной задачи визуального распознавания ImageNet (ILSVRC) в 2014 году и выпущен в июле 2015 года.

Идея и название сновидения стали популярными в Интернете в 2015 году благодаря программе DeepDream от Google. Идея зародилась в начале истории нейронных сетей, и аналогичные методы использовались для синтеза визуальных текстур. Связанные с этим идеи визуализации были разработаны (до работы Google) несколькими исследовательскими группами.

После того, как Google опубликовал свои методы и сделал свой код открытым исходным кодом, появился ряд инструментов в виде веб- на рынке появились сервисы, мобильные приложения и программное обеспечение для настольных компьютеров, позволяющие пользователям преобразовывать свои собственные фотографии.

Процесс

Изображение медузы, обработанное DeepDream после десяти итераций

Изображение медузы, обработанное DeepDream после пятидесяти итераций

Исходное изображение (вверху) после применения десяти (в центре) и пятидесяти (внизу) итераций DeepDream, сеть, обученная распознавать собак

Программное обеспечение предназначено для обнаружения лиц и других рисунков на изображениях с целью автоматической классификации изображений. Однако после обучения сеть также может работать в обратном направлении, ее попросят немного скорректировать исходное изображение, чтобы данный выходной нейрон (например, тот, который используется для лиц или определенных животных) имел более высокий показатель достоверности. Это может использоваться для визуализации, чтобы лучше понять возникающую структуру нейронной сети, и является основой концепции DeepDream. Эта процедура обращения никогда не бывает совершенно ясной и недвусмысленной, поскольку в ней используется процесс отображения «один ко многим». Однако после достаточного количества повторений даже изображения, изначально лишенные искомых характеристик, будут достаточно скорректированы, чтобы получилась форма парейдолии, по которой психоделические и сюрреалистические изображения становятся генерируется алгоритмически. Оптимизация похожа на обратное распространение, однако вместо корректировки весов сети веса остаются фиксированными, а входные данные корректируются.

Например, существующее изображение можно изменить так, чтобы оно стало «более похожим на кошку», а получившееся улучшенное изображение можно снова ввести в процедуру. Это использование напоминает поиск животных или других фигур в облаках.

Применение градиентного спуска независимо к каждому пикселю ввода создает изображения, в которых соседние пиксели имеют мало взаимосвязи, и, таким образом, изображение содержит слишком много высокочастотной информации. Сгенерированные изображения можно значительно улучшить, включив предварительный или регуляризатор, который предпочитает входные данные с естественной статистикой изображения (без предпочтения какого-либо конкретного изображения) или просто сглаженными. Например, Mahendran et al. использовал регуляризатор общей вариации, который предпочитает кусочно-постоянные изображения. Различные регуляризаторы обсуждаются далее. Подробное визуальное исследование методов визуализации функций и регуляризации было опубликовано совсем недавно.

Указанное сходство изображений с LSD - и галлюцинации, вызванные псилоцибином, наводят на мысль о функциональном сходстве между искусственными нейронными сетями и определенными слоями зрительной коры.

Использование

Фотография трех мужчин в бассейне, сильно обработанная DeepDream

Идея сновидения может быть применена к скрытым (внутренним) нейронам, отличным от тех, что находятся на выходе, что позволяет исследовать роли и представления различных частей сети. Также можно оптимизировать входные данные для удовлетворения требований либо одного нейрона (такое использование иногда называют максимизацией активности), либо всего слоя нейронов.

Хотя сновидение чаще всего используется для визуализации сетей или создания компьютерного искусства, недавно было предложено, что добавление «сновидений» к обучающей выборке может сократить время обучения абстракциям в информатике.

Модель DeepDream также продемонстрировала свою применимость в области истории искусства..

DeepDream использовался в видеоклипе Foster the People на песню "Doing It for the Money".

В 2017 году исследовательская группа из Университета Сассекса создала машину галлюцинаций, применив алгоритм DeepDream к предварительно записанному панорамному видео, что позволяет пользователям исследовать среды виртуальной реальности, имитируя переживания психоактивных веществ. и / или психопатологические состояния. Они смогли продемонстрировать, что субъективные переживания, вызванные машиной галлюцинаций, значительно отличаются от контрольных (не «галлюциногенных») видео, но имеют феноменологическое сходство с психоделическим состоянием (после введения псилоцибина).

См. Также

Художественный портал

Ссылки

Внешние ссылки

Викискладе есть медиафайлы, связанные с изображениями Deep Dream.

Deep Dream, python notebook на GitHub
Мордвинцев, Александр; Олах, Кристофер; Тыка, Майк (17 июня 2015 г.). «Inceptionism: углубляясь в нейронные сети». Архивировано из оригинала 03.07.2015.