Рэй Соломонофф

редактировать

Американский изобретатель алгоритмической вероятности и исследователь искусственного интеллекта

Рэй Соломонофф (25 июля 1926 г. - 7 декабря 2009 г.) был изобретателем алгоритмической вероятности, его общей теории индуктивного вывода (также известной как универсальный индуктивный вывод), и был основателем теории алгоритмической информации. Он был создателем ветки искусственного интеллекта, основанной на машинном обучении, прогнозировании и вероятности. Он распространил первый отчет о несемантическом машинном обучении в 1956 году.

Соломонов впервые описал алгоритмическую вероятность в 1960 году, опубликовав теорему, которая положила начало сложности Колмогорова и теории алгоритмической информации. Впервые он описал эти результаты на конференции в Калифорнийском технологическом институте в 1960 г. и в отчете в феврале 1960 г. «Предварительный отчет по общей теории индуктивного вывода». Он более полно разъяснил эти идеи в своих публикациях 1964 года «Формальная теория индуктивного вывода», часть I и часть II.

Алгоритмическая вероятность - это математически формализованная комбинация бритвы Оккама и Принцип множественных объяснений. Это машинно-независимый метод присвоения значения вероятности каждой гипотезе (алгоритму / программе), объясняющей данное наблюдение, при этом самая простая гипотеза (самая короткая программа) имеет наивысшую вероятность, а все более сложные гипотезы получают все более малые вероятности.

Соломонов основал теорию универсального индуктивного вывода, основанную на прочных философских основах и уходящую корнями в сложность Колмогорова и алгоритмическую теорию информации. Теория использует алгоритмическую вероятность в байесовской структуре. Универсальный априор берется над классом всех вычислимых мер; никакая гипотеза не будет иметь нулевой вероятности. Это позволяет использовать правило Байеса (причинно-следственной связи) для предсказания наиболее вероятного следующего события в серии событий и того, насколько вероятным оно будет.

Хотя он наиболее известен благодаря алгоритмической вероятности и его общей теории индуктивного вывода, он сделал много других важных открытий на протяжении своей жизни, большинство из которых были направлены на достижение его цели в области искусственного интеллекта: разработки машины, которая могла бы решать сложные задачи с использованием вероятностных методов.

Содержание

1 История жизни до 1964 года
2 История работы до 1964 года
3 История работы с 1964 по 1984 год
4 История работы - более поздние годы
5 См. Также
6 Ссылки
7 Внешние ссылки

История жизни до 1964 года

Рэй Соломонофф родился 25 июля 1926 года в Кливленде, штат Огайо, в семье еврея русского Иммигранты Филипп Юлий и Сара Машман Соломонова. Он учился в средней школе Гленвилля, которую окончил в 1944 году. В 1944 году он поступил на службу в ВМС США в качестве инструктора по электронике. С 1947–1951 он учился в Чикагском университете, обучаясь у таких профессоров, как Рудольф Карнап и Энрико Ферми, и получил диплом со степенью магистра наук. в 1951 г. по физике.

С самого раннего детства его двигала чистая радость математических открытий и желание исследовать то, чего никто раньше не делал. В возрасте 16 лет, в 1942 году, он начал искать общий метод решения математических задач.

В 1952 году он встретил Марвина Мински, Джона Маккарти и других, заинтересованных в машинном интеллекте. В 1956 году Мински, Маккарти и другие организовали Дартмутскую летнюю исследовательскую конференцию по искусственному интеллекту, на которую Соломонов был одним из первых 10 приглашенных - он, Маккарти и Мински были единственными, кто остался все лето. Именно для этой группы искусственный интеллект был впервые назван наукой. Компьютеры в то время могли решать очень конкретные математические задачи, но не более того. Соломонофф хотел задать более важный вопрос: как сделать машины более разумными и как компьютеры могут использовать для этой цели вероятность.

История работы до 1964 года

Он написал три статьи, две с Анатолем Рапопортом, в 1950–52 годах, которые считаются самым ранним статистическим анализом сетей.

Он был одним из 10 участников Дартмутского летнего исследовательского проекта по искусственному интеллекту в 1956 году . Он написал и распространил среди участников доклад: «Машина индуктивного вывода». Он рассматривал машинное обучение как вероятностный, с акцентом на важность обучающих последовательностей и на использование частей предыдущих решений проблем при построении пробных решений для новых проблем. Он опубликовал версию своих открытий в 1957 году. Это были первые статьи о вероятностном машинном обучении.

В конце 1950-х он изобрел вероятностные языки и связанные с ними грамматики. Вероятностный язык присваивает значение вероятности каждой возможной строке.

Обобщение концепции вероятностных грамматик привело его к открытию в 1960 году «алгоритмической вероятности и общей теории индуктивного вывода».

До 1960-х годов обычный метод расчета вероятности основывался на частоте: взятии отношения благоприятных результатов к общему количеству испытаний. В своей публикации 1960 года и, более полно, в своих публикациях 1964 года Соломонов серьезно пересмотрел это определение вероятности. Он назвал эту новую форму вероятности «алгоритмической вероятностью» и показал, как использовать ее для предсказания в своей теории индуктивного вывода. В рамках этой работы он разработал философское основание для использования правила причинности Байеса для предсказания.

Основная теорема того, что позже было названо колмогоровской сложностью, была частью его общей теории. Написав в 1960 году, он начинает: «Рассмотрим очень длинную последовательность символов... Мы будем считать такую последовательность символов« простой »и имеющей высокую априорную вероятность, если существует очень краткое описание этой последовательности - используя, конечно, какой-то предусмотренный метод описания.Точнее, если мы будем использовать только символы 0 и 1 для выражения нашего описания, мы присвоим вероятность 2 последовательности символов, если ее кратчайшее возможное двоичное описание содержит N цифр. «

Вероятность дана со ссылкой на конкретную универсальную машину Тьюринга. Соломонов показал и в 1964 году доказал, что выбор машины, хотя она и может добавлять постоянный множитель, не сильно изменит отношения вероятностей. Эти вероятности не зависят от машины.

В 1965 году русский математик Колмогоров независимо опубликовал аналогичные идеи. Когда он узнал о работе Соломонова, он признал Соломонова, и в течение нескольких лет работы Соломонова были более известны в Советском Союзе, чем в западном мире. Однако общее мнение в научном сообществе заключалось в том, чтобы связывать этот тип сложности с Колмогоровым, которого больше интересовала случайность последовательности. Алгоритмическая вероятность и универсальная (Соломонова) индукция стали ассоциироваться с Соломоновым, который был сосредоточен на предсказании - экстраполяции последовательности.

Позже, в той же публикации 1960 года, Соломонов описывает свое расширение теории единственного кратчайшего кода. Это алгоритмическая вероятность. Он заявляет: «Казалось бы, если существует несколько различных методов описания последовательности, каждому из этих методов следует придать определенный вес при определении вероятности этой последовательности». Затем он показывает, как эту идею можно использовать для генерации универсального априорного распределения вероятностей и как она позволяет использовать правило Байеса для индуктивного вывода. Индуктивный вывод путем суммирования прогнозов всех моделей, описывающих конкретную последовательность, с использованием подходящих весов, основанных на длинах этих моделей, позволяет получить распределение вероятностей для расширения этой последовательности. Этот метод предсказания с тех пор стал известен как индукция Соломонова.

Он расширил свою теорию, опубликовав ряд отчетов, приведших к публикациям в 1964 году. В статьях 1964 года дается более подробное описание алгоритмической вероятности и индукции Соломонова., представляя пять различных моделей, в том числе модель, широко известную как универсальное распределение.

История работы с 1964 по 1984 гг.

Другие ученые, принимавшие участие в Дартмутской летней конференции 1956 г. (такие как Ньюэлл и Саймон ), разрабатывали ветвь искусственного интеллекта, которая использовала машины, управляемые правилами «если-то», основанными на фактах. Соломонов развивал ветвь искусственного интеллекта, которая фокусировалась на вероятности и предсказании; его особый взгляд на А.И. описал машины, которые управлялись распределением алгоритмической вероятности. Машина генерирует теории вместе с соответствующими вероятностями для решения проблем, и по мере развития новых проблем и теорий обновляет распределение вероятностей теорий.

В 1968 году он нашел доказательство эффективности алгоритмической вероятности, но, главным образом, из-за отсутствия всеобщего интереса в то время, опубликовал его только через 10 лет. В своем отчете он опубликовал доказательство теоремы о сходимости.

В годы, прошедшие после открытия алгоритмической вероятности, он сосредоточился на том, как использовать эту вероятность и индукцию Соломонова в реальном прогнозировании и решении задач для искусственного интеллекта. Он также хотел понять более глубокие последствия этой системы вероятностей.

Одним из важных аспектов алгоритмической вероятности является то, что она является полной и неисчислимой.

В отчете за 1968 год он показывает, что алгоритмическая вероятность полна; то есть, если есть какая-либо описываемая закономерность в теле данных, алгоритм алгоритмической вероятности в конечном итоге обнаружит эту закономерность, для чего потребуется относительно небольшая выборка этих данных. Алгоритмическая вероятность - единственная система вероятностей, которая, как известно, завершена таким образом. Как необходимое следствие своей полноты, это не поддается расчету. Невозможно вычислить, потому что некоторые алгоритмы - подмножество частично рекурсивных - никогда не могут быть оценены полностью, потому что это займет слишком много времени. Но эти программы, по крайней мере, будут признаны возможными решениями. С другой стороны, любая вычислимая система неполна. Всегда будут описания вне области поиска этой системы, которые никогда не будут признаны или рассмотрены, даже через бесконечное количество времени. Вычислимые модели прогнозирования скрывают этот факт, игнорируя такие алгоритмы.

Во многих своих статьях он описывал, как искать решения проблем, и в 1970-х и начале 1980-х разработал то, что, по его мнению, было лучшим способом обновить машину.

Однако использование вероятности в искусственном интеллекте не имело полностью гладкого пути. В первые годы развития искусственного интеллекта актуальность вероятности была проблематичной. Многие в A.I. сообщество считало, что вероятность неприменима в их работе. В области распознавания образов действительно использовалась форма вероятности, но поскольку не существовало широко обоснованной теории того, как включить вероятность в любой ИИ. поле, большинство полей вообще не использовали его.

Однако были такие исследователи, как Перл и Питер Чизман, которые утверждали, что вероятность можно использовать в искусственном интеллекте.

Примерно в 1984 году на ежегодном собрании Американской ассоциации искусственного интеллекта (AAAI) было решено, что вероятность никоим образом не имеет отношения к А.И.

Сформировалась протестная группа, и в следующем году на собрании AAAI был проведен семинар, посвященный «Вероятности и неопределенности в ИИ». Этот ежегодный семинар продолжается и по сей день.

В рамках протеста на первом семинаре Соломонов выступил с докладом о том, как применить универсальное распределение к проблемам в А.И. Это была ранняя версия системы, которую он разрабатывал с того времени.

В этом отчете он описал разработанную им технику поиска. В задачах поиска наилучший порядок поиска - это время $T i / P i {\ displaystyle T_ {i} / P_ {i}}$ $T_ {i} / P_ {i}$ , где $T i {\ displaystyle T_ {i}}$ $T_ {i}$ - время, необходимое для тестирования испытания, а $P i {\ displaystyle P_ {i}}$ $P_ {i}$ - вероятность успеха этого испытания. Он назвал это «концептуальным размером прыжка» проблемы. Методика поиска Левина приближается к этому порядку, и поэтому Соломонов, изучавший работы Левина, назвал эту технику поиска Lsearch.

История работы - более поздние годы

В других статьях он исследовал, как ограничить время, необходимое для поиска решений, написав о поиске с ограничением ресурсов. Пространство поиска ограничено доступным временем или стоимостью вычислений, а не вырезанием пространства поиска, как это делается в некоторых других методах прогнозирования, таких как минимальная длина описания.

На протяжении всей своей карьеры Соломонов был озабочен потенциальными преимуществами и опасностями ИИ, обсуждая это во многих своих опубликованных отчетах. В 1985 году он проанализировал вероятную эволюцию искусственного интеллекта, предложив формулу, предсказывающую, когда он достигнет «точки бесконечности». Эта работа является частью истории мысли о возможной технологической сингулярности.

Первоначально методы алгоритмической индукции экстраполировали упорядоченные последовательности строк. Нужны были методы для работы с другими видами данных.

Отчет 1999 г. обобщает теоремы универсального распределения и связанной с ним сходимости на неупорядоченные наборы строк, а отчет 2008 г. - на неупорядоченные пары строк.

В 1997, 2003 и 2006 годах он показал, что невычислимость и субъективность являются необходимыми и желательными характеристиками любой высокоэффективной индукционной системы.

В 1970 году он основал свою собственную компанию Oxbridge Research и продолжил там свои исследования, за исключением периодов работы в других учреждениях, таких как Массачусетский технологический институт, Саарский университет в Германии и Институт искусственного интеллекта Далле Молле в Лугано, Швейцария. В 2003 году он стал первым лауреатом Колмогоровской премии Исследовательского центра компьютерного обучения при Лондонском университете Ройал Холлоуэй, где он прочитал первую лекцию Колмогорова. Соломонов совсем недавно был приглашенным профессором в CLRC.

В 2006 году он выступал на AI @ 50, «Дартмутская конференция по искусственному интеллекту: следующие пятьдесят лет», посвященной пятидесятилетию первоначальной летней исследовательской группы в Дартмуте. Соломонов был одним из пяти первоначальных участников.

В феврале 2008 года он выступил с основным докладом на конференции «Современные тенденции в теории и применении компьютерных наук» (CTTACS), проходившей в Университете Нотр-Дам в Ливане. После этого он прочитал короткую серию лекций и начал исследования новых приложений алгоритмической вероятности.

Алгоритмическая вероятность и индукция Соломонова имеют много преимуществ для искусственного интеллекта. Алгоритмическая вероятность дает чрезвычайно точные оценки вероятности. Эти оценки можно пересмотреть с помощью надежного метода, чтобы они оставались приемлемыми. Он очень эффективно использует время поиска. Помимо оценок вероятности, «Алгоритмическая вероятность» «имеет для ИИ еще одно важное значение: ее множество моделей дает нам множество различных способов понимания наших данных;

Описание жизни и работы Соломонова до 1997 г. находится в« Открытие алгоритмической вероятности », Журнал компьютерных и системных наук, том 55, № 1, стр. 73–88, август 1997 г. Этот документ, а также большинство других упомянутых здесь статей, доступны на его веб-сайте по адресу страница публикаций.

В статье, опубликованной в год его смерти, в журнальной статье о Соломонове говорится: «Ученый, придерживающийся самых традиционных взглядов, понимает свою науку, используя единственную« текущую парадигму »- способ понимания, который наиболее моден в настоящее время. настоящее время. Более творческий ученый понимает свою науку по-разному, и ему легче создавать новые теории, новые способы понимания, когда «текущая парадигма» больше не соответствует текущим данным ».

См. Также

Мин Ли и Пол Витани, Введение в сложность Колмогорова и ее приложения. Springer-Verlag, NY, 2008, включает исторические заметки о Соломонове, а также описание и анализ его работы.
Маркус Хаттер. Универсальный искусственный интеллект

Ссылки

Внешние ссылки

Домашняя страница Рэя Соломоноффа
Для подробного описания алгоритмической вероятности см. «Алгоритмическая вероятность» от Hutter, Легг и Витани в научном журнале.
Рэй Соломонов (1926–2009) 85-я мемориальная конференция, Мельбурн, Австралия, ноябрь / декабрь 2011 г. и Proceedings, «Algorithmic Probability and Friends. Байесовское прогнозирование и искусственный интеллект », Springer, LNAI / LNCS 7070.
Пионер машинного обучения отмечен 14 декабря 2011 г.