DeepMind

редактировать

DeepMind Technologies Limited

Тип бизнеса	Дочерняя компания
Основана	23 сентября 2010 г.; 10 лет назад (23.09.2010)
Штаб-квартира	6 Pancras Square,. Лондон N1C 4AG, UK
Основатель (и)	Демис Хассабис, Шейн Легг, Мустафа Сулейман
Генеральный директор	Демис Хассабис
Генеральный директор	Лила Ибрагим
Промышленность	Искусственный интеллект
Сотрудники	1000+ по состоянию на июнь 2020 г.
Родитель	Независимый (2010–2014). Google Inc. (2014–2015). Alphabet Inc. (2015 – настоящее время)
URL	www.deepmind.com

Вход в здание, где расположены Google и DeepMind, на площади Панкрас, 6, Лондон, Великобритания.

DeepMind Technologies - это британская компания и исследовательская лаборатория в области искусственного интеллекта, основанная в сентябре 2010 года и приобретенная компанией Google в 2014 году. Компания базируется в Лондоне, с исследовательскими центрами в Канаде, Франции и США. В 2015 году она стала 100% дочерней компанией Alphabet Inc.

. Компания создала нейронную сеть, которая учится играть в видеоигры аналогично человека, а также нейронная машина Тьюринга или нейронная сеть, которая может иметь доступ к внешней памяти, как обычная машина Тьюринга, в результате чего получается компьютер, который имитирует кратковременная память человеческого мозга.

Компания попала в заголовки газет в 2016 году после того, как ее программа AlphaGo победила человека-профессионала го игрока Ли Седол, чемпион мира, в матче из пяти игр, о котором был снят документальный фильм. Более общая программа, AlphaZero, победила самые мощные программы, играющие в go, шахматы и сёги (японские шахматы), после нескольких дней игры против самой себя, используя Обучение с подкреплением.

Содержание

1 История
2 Машинное обучение
- 2.1 Глубокое обучение с подкреплением
- 2.2 AlphaGo и его последователи
  - 2.2.1 Технология
- 2.3 AlphaFold
- 2.4 WaveNet и WaveRNN
- 2.5 AlphaStar
- 2.6 Разное участие в Google
3 DeepMind Health
- 3.1 Противоречие между NHS в отношении обмена данными
4 Этика и общество DeepMind
5 См. Также
6 Ссылки
7 Внешние ссылки

История

стартап был основан Демисом Хассабисом, Шейном Леггом и Мустафой Сулейманом в 2010 году. Хассабис и Легг впервые встретились в University College London 's Gatsby Computational Neuroscience Unit.

Во время одного из интервью Демис Хассабис сказал, что стартап начал работать над искусственным интеллектом. интеллектуальных технологий, научив их играть в ол d игр семидесятых и восьмидесятых годов, которые относительно примитивны по сравнению с теми, которые доступны сегодня. Некоторые из этих игр включали Breakout, Pong и Space Invaders. ИИ вводился в одну игру за раз без какого-либо предварительного знания ее правил. Потратив некоторое время на изучение игры, ИИ в конечном итоге стал в ней экспертом. «Считается, что когнитивные процессы, через которые проходит ИИ, очень похожи на те, которые человек, никогда не видевший игру, использовал бы, чтобы понять ее и попытаться овладеть ею». Цель основателей - создать ИИ общего назначения, который может быть полезным и эффективным практически для чего угодно.

Крупные венчурные компании Horizons Ventures и Founders Fund инвестировали в компанию, а также предприниматели Скотт Бэнистер, Питер Тиль и Илон Маск. Яан Таллинн был одним из первых инвесторов и советником компании. 26 января 2014 года Google объявил, что компания приобрела DeepMind за 500 миллионов долларов и согласилась приобрести DeepMind Technologies. Продажа Google произошла после того, как Facebook, как сообщается, завершил переговоры с DeepMind Technologies в 2013 году. Впоследствии компания была переименована в Google DeepMind и сохраняла это имя около двух лет.

В 2014 году DeepMind получила награда «Компания года» от Кембриджской компьютерной лаборатории.

В сентябре 2015 года DeepMind и Royal Free NHS Trust подписали свое первоначальное соглашение об обмене информацией (ISA) для совместной разработки приложения для управления клиническими задачами Streams.

После приобретения Google компания создала совет по этике искусственного интеллекта. Совет по этике для исследований ИИ остается загадкой, поскольку и Google, и DeepMind отказываются раскрывать, кто сидит в этом совете. DeepMind вместе с Amazon, Google, Facebook, IBM и Microsoft является одним из основателей Partnership on AI, организации, занимающейся интерфейсом общества и ИИ. DeepMind открыла новое подразделение под названием DeepMind Ethics and Society, которое сосредоточило внимание на этических и социальных вопросах, поднимаемых искусственным интеллектом, с участием выдающегося философа Ника Бострома в качестве советника. В октябре 2017 года DeepMind запустила новую исследовательскую группу для изучения этики ИИ.

В декабре 2019 года соучредитель Сулейман объявил, что покидает DeepMind и присоединяется к Google, работая на политическом посту.

Машинное обучение

Согласно веб-сайту компании, цель DeepMind Technologies - объединить «лучшие методы из машинного обучения и системной нейробиологии для создания мощных универсальных алгоритмы обучения ".

В 2016 году Google Research выпустила документ, посвященный безопасности ИИ и предотвращению нежелательного поведения в процессе обучения ИИ. Deepmind также выпустила несколько публикаций на своем веб-сайте. В 2017 году DeepMind выпустила GridWorld, испытательная площадка с открытым исходным кодом для оценки того, учится ли алгоритм отключать свой выключатель отключения или иным образом проявляет нежелательное поведение.

В июле 2018 года исследователи DeepMind обучили одну из его систем игре компьютерная игра Quake III Arena.

По состоянию на 2020 год Deep Компания Mind опубликовала более тысячи статей, в том числе тринадцать статей, которые были приняты Nature или Science. DeepMind привлекала внимание средств массовой информации в период AlphaGo; согласно поиску LexisNexis, 1842 опубликовали новостные статьи с упоминанием DeepMind в 2016 году, снизившись до 1363 в 2019 году.

Глубокое обучение с подкреплением

В отличие от других ИИ, таких как IBM Deep Blue или Watson, которые были разработаны для заранее определенной цели и функционируют только в рамках своей области, DeepMind утверждает, что ее система не является предварительно -запрограммированный: он учится на опыте, используя только необработанные пиксели в качестве входных данных. Технически он использует глубокое обучение на сверточной нейронной сети с новой формой Q-Learning, формой безмодельного обучения с подкреплением. Они тестируют систему на видеоиграх, особенно в ранних аркадных играх, таких как Space Invaders или Breakout. Не изменяя код, ИИ начинает понимать, как играть в игру, и через некоторое время играет в несколько игр (в первую очередь Breakout), что делает игру более эффективной, чем когда-либо мог бы любой человек.

В 2013 году, DeepMind опубликовала исследование системы искусственного интеллекта, которая может превзойти человеческие способности в таких играх, как Pong, Breakout и Enduro, при этом превзойдя современную производительность на Seaquest, Beamrider и Q * bert. Сообщается, что эта работа привела к приобретению компании Google. Искусственный интеллект DeepMind применялся в видеоиграх 1970-х и 1980-х годов ; продолжалась работа над более сложными 3D-играми, такими как Doom, который впервые появился в начале 1990-х.

В 2020 году DeepMind опубликовал Agent57, AI Agent, который превосходит человеческий уровень производительности по всем 57 параметрам. игры из набора Atari2600.

AlphaGo и последователи

В 2014 году компания опубликовала исследование компьютерных систем, которые могут воспроизводить Go.

. В октябре 2015 года компьютер Go программа AlphaGo, разработанная DeepMind, победила чемпиона Европы по го Фань Хуэй, 2 дан (из 9 возможных) профессионала, со счетом пять против нуля. Это первый раз, когда искусственный интеллект (ИИ) победил профессионального игрока в го. Ранее было известно, что компьютеры играли в го только на «любительском» уровне. Считается, что для компьютеров в го гораздо труднее выиграть по сравнению с другими играми, такими как шахматы, из-за гораздо большего количества возможностей, что делает его слишком сложным для традиционных методов ИИ, таких как грубая сила.

В марте 2016 года он победил Ли Седола - игрока с 9 даном Го и одного из лучших игроков в мире - со счетом 4-1 в матче из пяти игр.

В 2017 году Future of Go Summit AlphaGo выиграла матч из трех игр с Кэ Джи, который в то время непрерывно занимал первое место в мире в течение двух лет. Он использовал протокол контролируемого обучения, изучая большое количество игр, в которые люди играли друг против друга.

В 2017 году улучшенная версия AlphaGo Zero обошла AlphaGo 100 игр до 0. AlphaGo Zero. стратегии были самоучками. AlphaGo Zero смог превзойти своего предшественника всего за три дня с меньшей вычислительной мощностью, чем AlphaGo; для сравнения, оригинальному AlphaGo требовались месяцы, чтобы научиться играть.

Позже в том же году AlphaZero, модифицированная версия AlphaGo Zero, но для ведения любой игры с идеальной информацией для двух игроков, приобрела сверхчеловеческие способности в шахматах и сёги. Как и AlphaGo Zero, AlphaZero учился исключительно через самостоятельную игру.

Технология

Технология AlphaGo была разработана на основе подхода глубокого обучения с подкреплением. Это отличает AlphaGo от остальных технологий ИИ на рынке. С учетом сказанного, «мозг» AlphaGo был представлен для различных ходов на основе исторических данных турниров. Количество ходов увеличивалось постепенно, пока в итоге не было обработано более 30 миллионов из них. Цель заключалась в том, чтобы система имитировала человека-игрока и в конечном итоге стала лучше. Он играл против самого себя и учился не только на собственных поражениях, но и на победах; таким образом, он научился совершенствоваться с течением времени и в результате увеличил свой выигрыш.

AlphaGo использовала две глубокие нейронные сети: политическую сеть для оценки вероятностей перемещения и сеть ценностей для оценки позиций. Сеть политик обучена посредством контролируемого обучения, а затем была усовершенствована с помощью градиента политики обучения с подкреплением. Сеть создания ценности научилась предсказывать победителей в играх, в которых политическая сеть играет против самой себя. После обучения эти сети использовали опережающий поиск по дереву Монте-Карло (MCTS), используя сеть политик для определения возможных ходов с высокой вероятностью, в то время как сеть значений (в сочетании с развертыванием Монте-Карло с использованием политики быстрого развертывания) оценил позиции в дереве.

Zero обучен с использованием обучения с подкреплением, в котором система сыграла миллионы игр против самой себя. Единственным его руководством было увеличение винрейта. Он сделал это, не извлекая уроки из игр, в которые играли люди. Его единственные входные функции - это черные и белые камни с доски. Он использует одну нейронную сеть, а не отдельные сети политик и значений. Упрощенный поиск по дереву использует эту нейронную сеть для оценки позиций и выборочных перемещений без развертывания Монте-Карло. Новый алгоритм обучения с подкреплением включает опережающий поиск внутри цикла обучения. В AlphaGo Zero работало около 15 человек и миллионы вычислительных ресурсов. В конечном итоге ему требовалось гораздо меньше вычислительной мощности, чем AlphaGo, работающему на четырех специализированных ИИ-процессорах (Google TPU ), вместо 48 AlphaGo.

AlphaFold

В 2016 году DeepMind перевернула его искусственный интеллект для сворачивания белка, одной из самых сложных проблем в науке. В декабре 2018 года DeepMind AlphaFold выиграл 13-ю Critical Assessment of Techniques for Protein Structure Prediction (CASP), успешно предсказав наиболее точную структуру для 25 из 43 белков. «Это проект-маяк, наша первая крупная инвестиция в людях и ресурсах в фундаментальную, очень важную, реальную научную проблему», - сказал Хассабис The Guardian.

WaveNet и WaveRNN

В 2016 году DeepMind представила WaveNet, систему преобразования текста в речь . Первоначально он был слишком ресурсоемким для использования в потребительских товарах, но в конце 2017 года он стал готов к использованию в таких потребительских приложениях, как Google Assistant. В 2018 году Google запустил коммерческий продукт преобразования текста в речь Cloud Text-to-Speech на основе WaveNet.

В 2018 году DeepMind представила более эффективную модель под названием WaveRNN, разработанную совместно с Google AI.. В 2019 году Google начал внедрять его среди пользователей Google Duo.

AlphaStar

В 2016 году Хассабис обсудил игру StarCraft как будущее вызов, поскольку он требует стратегического мышления и обработки несовершенной информации.

В январе 2019 года DeepMind представила AlphaStar, программу для игры в стратегию в реальном времени StarCraft II. AlphaStar использовала обучение с подкреплением, основанное на повторах человеческих игроков, а затем играла против себя, чтобы улучшить свои навыки. На момент презентации AlphaStar обладал знаниями, эквивалентными 200 годам игрового времени. Он выиграл 10 матчей подряд у двух профессиональных игроков, хотя у него было несправедливое преимущество - он мог видеть все поле, в отличие от игрока-человека, которому приходится перемещать камеру вручную. Предварительная версия, в которой это преимущество было зафиксировано, проиграла в последующем матче.

В июле 2019 года AlphaStar начала играть против случайных людей в публичном европейском многопользовательском рейтинге 1 на 1. В отличие от первой версии AlphaStar, в которой играли только Протоссов v. Протоссы, этот играл за все расы игры, и ранее у него были исправлены несправедливые преимущества. К октябрю 2019 года AlphaStar достиг уровня Грандмастера в лестнице StarCraft II во всех трех гонках StarCraft, став первым ИИ, достигшим высшей лиги широко популярного киберспорта без каких-либо игровых ограничений.

Разные материалы для Google

Google заявил, что алгоритмы DeepMind значительно повысили эффективность охлаждения его центров обработки данных. Кроме того, DeepMind (вместе с другими исследователями Alphabet AI) помогает Google Play составлять персонализированные рекомендации по приложениям. DeepMind также сотрудничал с командой Android в Google для создания двух новых функций, которые стали доступны людям с устройствами под управлением Android Pie, девятого выпуска. мобильной операционной системы Google. Эти функции, Adaptive Battery и Adaptive Brightness, используют машинное обучение для экономии энергии и упрощения использования устройств с операционной системой. Впервые DeepMind использует эти методы в таком небольшом масштабе, когда типичные приложения машинного обучения требуют на порядок большей вычислительной мощности.

DeepMind Health

В июле 2016 года сотрудничество между Было объявлено, что DeepMind и глазная больница Мурфилдс разработают приложения искусственного интеллекта для здравоохранения. DeepMind будет применяться для анализа анонимных сканирований глаз для поиска ранних признаков заболеваний, ведущих к слепоте.

. В августе 2016 года была проведена исследовательская программа с больницей Лондонского университетского колледжа было объявлено с целью разработки алгоритма, который может автоматически различать здоровые и раковые ткани в областях головы и шеи.

Есть также проекты с Royal Free London NHS Foundation Trust и Imperial College Healthcare NHS Trust для разработки новых клинических мобильных приложений, связанных с электронными картами пациентов. Сообщается, что в декабре 2017 года сотрудники Королевской бесплатной больницы заявили, что доступ к данным пациентов через приложение сэкономил «огромное количество времени» и внес «феноменальные» изменения в ведение пациентов с острой болезнью. травма почек. Данные результатов тестирования отправляются на мобильные телефоны персонала и предупреждают их об изменении состояния пациента. Это также позволяет персоналу видеть, ответил ли кто-то еще, и показывать пациентам их результаты в наглядной форме.

В ноябре 2017 года DeepMind объявила о партнерстве в области исследований с Центром исследований рака UK в Имперский колледж Лондона с целью улучшить обнаружение рака груди за счет применения машинного обучения в маммографии. Кроме того, в феврале 2018 года DeepMind объявила о сотрудничестве с США. Департамент по делам ветеранов в попытке использовать машинное обучение для прогнозирования начала острого повреждения почек у пациентов, а также в более широком смысле общего ухудшения состояния пациентов во время пребывания в больнице, чтобы врачи и медсестры могли быстрее лечить пациентов

DeepMind разработала приложение под названием Streams, которое отправляет предупреждения врачам о пациентах, которым грозит серьезная травма. 13 ноября 2018 года DeepMind объявила, что ее подразделение здравоохранения и приложение Streams будут включены в Google Health. Защитники конфиденциальности заявили, что это объявление не оправдало доверия пациентов и противоречит предыдущим заявлениям DeepMind о том, что данные пациентов не будут связаны с учетными записями или службами Google. Представитель DeepMind заявил, что данные пациентов по-прежнему будут храниться отдельно от сервисов или проектов Google.

Противоречие между NHS в отношении обмена данными

В апреле 2016 года New Scientist получил копия соглашения об обмене данными между DeepMind и Royal Free London NHS Foundation Trust. Последний управляет тремя лондонскими больницами, в которых ежегодно проходят лечение около 1,6 миллиона пациентов. Соглашение показывает, что DeepMind Health имела доступ к данным о госпитализации, выписке и передаче, несчастным случаям и неотложной помощи, патологии и радиологии, а также к интенсивной терапии в этих больницах. Сюда входили личные данные, например, был ли у пациентов диагностирован ВИЧ, страдали ли они депрессией или когда-либо делали аборт, чтобы провести исследование для поиска лучших результатов. в различных состояниях здоровья.

В Офис Комиссара по информации (ICO) была подана жалоба, в которой утверждалось, что данные должны быть псевдонимами и зашифрованы. В мае 2016 года New Scientist опубликовал еще одну статью, в которой утверждалось, что проекту не удалось получить одобрение Консультативной группы по конфиденциальности Агентства по регулированию лекарственных средств и медицинских товаров.

. В мае 2017 года Sky News опубликовала просочившееся письмо от National Data Guardian, Дама Фиона Калдикотт, сообщая, что, по ее «взвешенному мнению», соглашение о совместном использовании данных между DeepMind и Royal Free было заключено на «ненадлежащей правовой основе». В июле 2017 года Управление комиссара по информации постановило, что больница Royal Free не соблюла Закон о защите данных, когда передала DeepMind личные данные 1,6 миллиона пациентов.

DeepMind Ethics and Society

В октябре 2017 года DeepMind объявила о создании нового исследовательского подразделения DeepMind Ethics Society. Их цель - финансирование внешних исследований по следующим темам: конфиденциальность, прозрачность и справедливость; экономические последствия; управление и подотчетность; управление рисками ИИ; Мораль и ценности ИИ; и как ИИ может решить мировые проблемы. В результате команда надеется глубже понять этические последствия ИИ и помочь обществу увидеть, что ИИ может быть полезным.

Это новое подразделение DeepMind является полностью отдельным от партнерства ведущих компаний, использующих ИИ. академические круги, организации гражданского общества и некоммерческие организации под названием Партнерство по искусственному интеллекту на благо людей и общества, частью которого также является DeepMind. Совет по этике и обществу DeepMind также отличается от обсуждаемого Совета по этике ИИ, который Google первоначально согласился сформировать при приобретении DeepMind.

См. Также

Глоссарий искусственного интеллекта

Ссылки

Внешние ссылки