Фредерик Елинек

редактировать

Фредерик Елинек
Родился	Бедржих Елинек. (1932-11-18) 18 ноября 1932 г.. Кладно, ныне Чехия
Умер	14 сентября 2010 г. (2010-09-14) (77 лет). Балтимор, США
Гражданство	Американец
Alma mater	Массачусетский технологический институт
Известен как	Развитие технологий обработки естественного языка
Супруг (-и)	Милена Елинек
Награды	Премия Джеймса Л. Фланагана (2005) ACL Жизненные достижения Премия (2009 г.)
Научная карьера
Области	Теория информации, обработка естественного языка
Учреждения	Корнельский университет, IBM Research, Университет Джона Хопкинса
Докторант	Роберт Фано
Известные студенты	Нил Слоан e
Влияния	Роман Якобсон

Фредерик Елинек (18 ноября 1932 - 14 сентября 2010) был чешско-американским исследователем в теории информации, автоматическое распознавание речи и обработка естественного языка. Он хорошо известен своим часто цитируемым заявлением: «Каждый раз, когда я увольняю лингвиста, производительность распознавателя речи повышается».

Елинек родился в Чехословакии незадолго до вспышки болезни. Второй мировой войны и эмигрировал со своей семьей в Соединенные Штаты в первые годы коммунистического режима. Он изучал инженерное дело в Массачусетском технологическом институте и преподавал в течение 10 лет в Корнельском университете, прежде чем ему предложили работу в IBM Research. В 1961 году он женился на чешской сценаристе Милене Елинек. В IBM его команда продвинула подходы к компьютерному распознаванию речи и машинному переводу. После IBM он 17 лет возглавил Центр обработки речи и языка в Университете Джона Хопкинса, где он все еще работал в день своей смерти.

Содержание

1 Личная жизнь
2 Исследования и наследие
3 Избранные публикации
4 Ссылки
5 Внешние ссылки

Личная жизнь

Елинек родился в ноябре 18, 1932, как Бедржих Елинек в Кладно Вилему и Труде Елинек. Его отец был евреем; его мать родилась в Швейцарии в семье чешских католиков и обратилась в иудаизм. Елинек старший, дантист, заранее спланировал побег в Англию; он договорился о паспорте, визе и доставке стоматологических материалов. Пара планировала отдать сына в английскую частную школу. Однако Вилем решил остаться в последний момент и в конце концов был отправлен в концлагерь Терезиенштадт, где умер в 1945 году. Семья была вынуждена переехать в Прагу в 1941 году, но Фредерик, его сестра и мать - благодаря прошлому последнего - избежали концентрационных лагерей.

Принято считать, что научный талант проявляется в ранней юности.... Это было не в моем случае. Я как-то соскользнул в свою научную профессию. Моя мама хотела, чтобы я стал врачом, как и мой отец.... Я сам хотел быть адвокатом, защитником несправедливо обвиняемых. Но моя карьера является результатом политических обстоятельств, академических возможностей и счастливых случайностей.

- Рассказ о своей жизни в речи 2001 года.

После войны Елинек поступил в гимназию, несмотря на он пропустил несколько лет обучения, потому что образование еврейских детей было запрещено с 1942 года. Его мать, обеспокоенная тем, чтобы ее сын получил хорошее образование, приложила большие усилия для их эмиграции, особенно когда стало ясно, что ему не позволят даже попытаться выпускной экзамен. Его мать надеялась, что ее сын станет врачом, но Елинек мечтала стать юристом. Он изучал инженерное дело в вечерних классах Городского колледжа Нью-Йорка и получал стипендии от Национального комитета за свободную Европу, что позволило ему учиться в Массачусетском технологическом институте.. О выборе специальности он сказал: «К счастью, к электротехнике принадлежала дисциплина, целью которой не было построение физических систем: теория информации». Он получил докторскую степень. в 1962 году с Робертом Фано в качестве его советника.

В 1957 году Елинек нанес неожиданный визит в Прагу. Он был в Вене и подал заявление на визу, надеясь снова увидеть своих бывших знакомых. Он встретился со своим старым другом Милошем Форманом, который познакомил его со студенткой-киноведом Миленой Таболовой, по сценарию которой был снят фильм «Легкая жизнь» (Snadný život). Его обратный рейс в США сделал остановку в Мюнхене, во время которой он позвонил ей, чтобы сделать предложение. Таболова считалась диссиденткой, и власти остались недовольны ее фильмом. Елинек попросил помощи у Джерома Визнера и Сайруса Итона, последнего, который лоббировал Никиту Хрущева. После инаугурации Джона Ф. Кеннеди группе чешских диссидентов было разрешено эмигрировать в январе 1961 года. Благодаря лоббированию будущая Милена Елинек стала одной из них.

После завершения В аспирантуре Елинек, который проявлял интерес к лингвистике, планировал работать с Чарльзом Ф. Хокеттом в Корнельском университете. Однако они провалились, и в течение следующих десяти лет он продолжал изучать теорию информации. Ранее он работал в IBM во время творческого отпуска, а в 1972 году начал работать полный рабочий день - сначала в отпуске в Корнелле, но постоянно с 1974 года. Он оставался там более двадцати лет. Хотя сначала ему предложили постоянную исследовательскую работу, по прибытии он узнал, что недавно был назначен главой недавно открытой Исследовательской лаборатории IBM в Хайфе, и стал руководителем группы распознавания непрерывной речи в Институте. Исследовательский центр Томаса Дж. Ватсона. Несмотря на успехи его команды в этой области, работа Елинека оставалась малоизвестной в его родной стране, потому что чешским ученым не разрешалось участвовать в ключевых конференциях.

После падения коммунизма в 1989 году Елинек помог установить научные связи, регулярно посещая читать лекции и помогать уговаривать IBM основать вычислительный центр в Карловом университете. В 1993 году он ушел из IBM и поступил в Центр обработки речи и языка Университета Джонса Хопкинса, где был директором и профессором электротехники и вычислительной техники Джулиана Синклера Смита. Он все еще работал там на момент своей смерти; Елинек умер от сердечного приступа в конце обычного рабочего дня в середине сентября 2010 года. У него остались жена, дочь и сын, сестра, сводная сестра и трое внуков, включая Софи Голд Елинек.

Исследования и наследие

Теория информации была модным научным подходом в середине 50-х годов. Однако пионер Клод Шеннон писал в 1956 году, что эта тенденция опасна. Он сказал: «Наши коллеги-ученые во многих различных областях, привлеченные фанфарами и новыми возможностями, открытыми для научного анализа, используют эти идеи в своих собственных проблемах... Нашему несколько искусственному процветанию будет очень легко рухнуть. в одночасье, когда становится понятно, что использование нескольких захватывающих слов, таких как информация, энтропия, избыточность, не решает всех наших проблем ». В течение следующего десятилетия сочетание факторов остановило применение теории информации к проблемам обработки естественного языка (НЛП), в частности, к машинному переводу. Одним из факторов была публикация в 1957 году книги Ноама Хомского Syntactic Structures, в которой говорилось, что «вероятностные модели не дают понимания основных проблем синтаксической структуры». Это хорошо соответствовало философии исследований искусственного интеллекта того времени, которые продвигали подходы, основанные на правилах. Другим фактором был отчет ALPAC 1966 года, в котором правительству рекомендовалось прекратить финансирование исследований в области машинного перевода. Председатель ALPAC Джон Пирс позже сказал, что поле было заполнено «сумасшедшими изобретателями или ненадежными инженерами». Он сказал, что основные лингвистические проблемы должны быть решены, прежде чем попытки НЛП могут быть разумно предприняты. Эти элементы фактически остановили исследования в этой области.

Елинек начал проявлять интерес к лингвистике после иммиграции своей жены, которая первоначально поступила на лингвистическую программу Массачусетского технологического института с помощью Романа Якобсона. Елинек часто сопровождал ее на лекции Хомского и даже обсуждал возможность смены ориентации со своим наставником. Фано был «очень расстроен», и после провала его проекта с Хокеттом в Корнелле, он не возвращался к этой области исследований, пока не начал работать в IBM. Объем исследований в IBM значительно отличался от такового в большинстве других команд. Согласно Марку Либерману, «В то время как [Елинек] возглавлял усилия IBM по решению общей проблемы диктовки в течение примерно десяти лет после 1972 года, большинство других американских компаний и академических исследователей работали над очень ограниченными проблемами... или вообще оставались вне поля зрения ".

Он не был пионером распознавания речи, он был пионером распознавания речи.

- Стив Янг (2010)

Елинек считал распознавание речи как проблема теории информации - зашумленный канал, в данном случае акустический сигнал, - что некоторые наблюдатели сочли смелым подходом. Концепция недоумения была введена в их первой модели New Raleigh Grammar, которая была опубликована в 1976 году как статья «Распознавание непрерывной речи статистическими методами» в журнале Proceedings of the IEEE. По словам Янга, базовый подход с использованием шумных каналов «сводил проблему распознавания речи к одной из двух статистических моделей». В то время как New Raleigh Grammar была скрытой марковской моделью, их следующая модель, названная Tangora, была более широкой и включала n-граммы, в частности триграммы. Несмотря на то, что «всем было очевидно, что эта модель безнадежно обеднела», она не была улучшена до тех пор, пока Елинек не представил еще одну статью в 1999 году. Тот же подход триграмм был применен к телефонам одним словом. Хотя идентификация частей речи оказалась не очень полезной для распознавания речи, методы маркировки, разработанные в ходе этих проектов, теперь используются в различных приложениях НЛП.

Методы дополнительных исследований, разработанные в В конечном итоге IBM стала доминирующей в этой области после того, как DARPA в середине 80-х вернулась к исследованиям НЛП и ввела эту методологию участвующим группам, разделяя общие цели, данные и точные показатели оценки.. Исследование Continuous Speech Recognition Group, которое требовало больших объемов данных для обучения алгоритмов, в конечном итоге привело к созданию Linguistic Data Consortium. В 1980-е годы, хотя более широкая проблема распознавания речи оставалась нерешенной, они пытались применить разработанные методы к другим проблемам; машинный перевод и прогнозирование стоимости акций рассматривались как варианты. Группа исследователей IBM перешла на работу в Renaissance Technologies. Елинек писал: «О деятельности фонда Renaissance ходят легенды, но я понятия не имею, использовались ли когда-либо какие-либо методы, которые мы впервые применили в IBM. Мои бывшие коллеги не скажут мне: их работа ведется очень секретно!» Методы, очень похожие на методы, разработанные для распознавания речи, лежат в основе большинства используемых сегодня систем машинного перевода. Наблюдатели заявили, что парадигма Пирса, согласно которой инженерные достижения в этой области будут основываться на научном прогрессе, была перевернута, и достижения в области инженерии лежат в основе ряда научных открытий.

Работы Елинека несколько раз выигрывал награды за лучшую работу, а за время своей работы в IBM он получил несколько наград компании. Он получил награду Общества за «выдающийся технический вклад и лидерство» от Общества обработки сигналов IEEE за 1997 год и медаль ESCA за научные достижения в 1999 году. Он был награжден Медаль третьего тысячелетия IEEE в 2000 г., первая премия Антонио Замполли Европейской ассоциации языковых ресурсов в 2004 г., премия Джеймса Л. Фланагана за речь и обработку звука в 2005 г. и за заслуги в жизни 2009 г. Награда от Ассоциации компьютерной лингвистики. Он получил почетную степень доктора философии. от Карлова университета в 2001 году, был избран членом Национальной инженерной академии в 2006 году и стал одним из двенадцати инаугурационных членов Международной ассоциации речевой коммуникации в 2008 году..

Избранные публикации

Ссылки

Примечания

Ссылки

Внешние ссылки

Викицитатник содержит цитаты, связанные с: Фредом Елинеком

Институциональным страница в университете Джона Хопкинса

Предшествовал. Фумитада Итакура	Общество обработки сигналов IEEE Награда . 1997	Преемник. Бернард Уидроу
Предыдущий. Марио Росси	Медаль ISCA за научные достижения . 1999	Преемник. Луи Полс
Предыдущий. Гуннар Фант	IEEE Джеймс Л. Фланаган. Премия за обработку речи и аудио. 2005	Преемник.
Преступник. Йорик Уилкс	ACL Награда за заслуги перед жизнью . 2009	Преемник. Уильям Аарон Вудс