Джерард Солтон | |
---|---|
Родился | (1927-03-08) 8 марта 1927 года. Нюрнберг |
Умер | 28 августа 1995 (1995-08- 28) (68 лет) |
Alma mater | Гарвардский университет |
Известный как | отец информационного поиска. Премия Джерарда Салтона |
Научная карьера | |
Филдс | поиск информации |
Учреждения | Корнельский университет |
Диссертация | Автоматическая система обработки данных для учета доходов от коммунальных услуг (1958) |
Докторант | Ховард Эйкен |
Докторанты | |
Джерард А. "Ге Рри Солтон (8 марта 1927 г., Нюрнберг - 28 августа 1995 г.), был профессором информатики в Корнельском университете. Солтон был, вероятно, ведущим компьютерным ученым, работавшим в области поиска информации в свое время, и «отцом поиска информации». Его группа в Корнелле разработала Информационно-поисковую систему SMART, которую он инициировал, когда был в Гарварде. Это была первая система, в которой использовалась популярная сейчас модель векторного пространства для поиска информации.
Салтон родился Герхард Антон Зальманн 8 марта 1927 года в Нюрнберге, Германия. Он получил степень бакалавра (1950) и магистра (1952) по математике в Бруклинском колледже, а также степень доктора философии. из Гарварда в Прикладная математика в 1958 году, последний из докторантов Говарда Эйкена, и преподавал там до 1965 года, когда он поступил в Корнельский университет и соучредителем его отдела компьютерных наук.
Солтон был, пожалуй, наиболее известен разработкой широко используемой ныне модели векторного пространства для информационного поиска. В этой модели и документы, и запросы представлены как векторы количества терминов, а сходство между документом и запросом задается косинусом между вектором термина и вектором документа. В этой статье он также представил TF-IDF, или частоту-обратную-документальную частоту терминов, модель, в которой оценка термина в документе представляет собой отношение количества терминов в этом документе. деленное на частоту количества документов, в которых встречается этот термин. (Понятие обратной частоты документов, мера специфичности, было введено в 1972 г. Карен Спарк-Джонс.) Позже он заинтересовался автоматическим обобщением и анализом текста, а также автоматическим гипертекстом. поколение. За свою жизнь он опубликовал более 150 научных статей и 5 книг.
Солтон был главным редактором Коммуникаций ACM и Журнала ACM и возглавлял Специальную группу по поиску информации (СИГИР). Он был младшим редактором журнала Транзакции ACM по информационным системам. Он был членом ACM (избран в 1995 г.), получил награду за заслуги перед Американским обществом информационных наук (1989 г.) и был первым лауреатом премии SIGIR за выдающийся вклад. на изучение поиска информации (1983) - теперь называется Премия Джерарда Солтона.