Дэвид Сильвер (ученый-компьютерщик)

редактировать

Дэвид Сильвер (1976 г.р.) возглавляет обучение с подкреплением r поисковой группы в DeepMind и был ведущим исследователем на AlphaGo, AlphaZero и одним из руководителей AlphaStar.

. Он окончил Кембриджский университет в 1997 году с награду Эддисона-Уэсли и подружился с Демисом Хассабисом, пока был там. Впоследствии Сильвер стал соучредителем компании по производству видеоигр Elixir Studios, где он был техническим директором и ведущим программистом, получив несколько наград за технологии и инновации.

Сильвер вернулся в академию в 2004 году на Университет Альберты для получения докторской степени по обучению с подкреплением, где он стал соавтором алгоритмов, используемых в первых магистерских программах 9 × 9 Go. Его версия программы MoGo (в соавторстве с Sylvain Gelly) была одной из самых сильных программ Go по состоянию на 2009 год.

Сильвер был удостоен исследовательской стипендии Королевского общества в 2011 году и впоследствии стал лектором в Университетский колледж Лондона, где он сейчас профессор. Его лекции по обучению с подкреплением доступны на YouTube. Сильвер консультировал DeepMind с момента его создания, присоединившись к нему на полную ставку в 2013 году.

Его недавняя работа была сосредоточена на сочетании обучения с подкреплением с глубоким обучением, включая программу, которая учится играть в игры Atari прямо из пикселей. Сильвер возглавил проект AlphaGo, кульминацией которого стала первая программа по победе над лучшим профессиональным игроком в полноразмерной игре го. AlphaGo впоследствии получила почетную профессиональную сертификацию 9 дан; и получил премию «Каннский лев» за инновации. Затем он руководил разработкой AlphaZero, который использовал тот же ИИ, чтобы научиться играть в го с нуля (обучаясь только самим, а не человеческими играми), прежде чем научиться играть в шахматы и сёги таким же образом, чтобы уровень выше, чем у любой другой компьютерной программы.

Сильвер является одним из наиболее публикуемых сотрудников DeepMind, с более чем 57 000 цитирований и имеет h-index, равный 64.

Он был награжден премией ACM 2019 в области вычислительной техники за прорыв в компьютерных играх.

Источники