Арви Хурскайнен | |
---|---|
Арви Хурскайнен в 2002 году | |
Родился | (1941-01-25) 25 января 1941 (возраст 79). Китее, Финляндия |
Национальность | Финн |
Известен | разработкой САЛАМА, вычислительная среда для языковых технологий |
Научная карьера | |
Сферы | Лингвистика Языковые технологии, Машинный перевод |
Учреждения | U Университет Хельсинки |
Докторанты | Юха Пентикяйнен и [fi ] |
Арви Йоханнес Хурскайнен (родился 25 января 1941 года в Китее ) Финский ученый в области языковых технологий и лингвистики. С 1985 года он разработал основанную на правилах языковую технологию в основном для суахили, но также и для других языков, включая машинный перевод с английского на финский. Он создал среду разработки под названием SALAMA (аббревиатура от Swahili Language Manager), но она подходит для любого языка. К основным разработанным на данный момент приложениям относятся следующие: проверка орфографии для суахили, аннотатор корпусных текстов, расширенный словарь между суахили и английским языком и переводчики с суахили на английский, с английского на суахили и с английского на финский. Он также разработал продвинутую систему изучения суахили и систему для создания целевых словарей для изучающих язык. Хурскайнен составил два аннотированных корпуса, Хельсинский корпус суахили 1.0 и Хельсинский корпус суахили 2.0.
Сначала он изучал богословие в Университете Хельсинки. Позже, после работы в Танзании, он изучал антропологию и опубликовал докторскую диссертацию «Крупный рогатый скот и культура». Структура пастырского общества паракуджо. В 1976 году он работал исследователем в проекте Jipemoyo, спонсируемом Академией Финляндии в Танзании, а в 1977–1980 годах - в финской лютеранской миссии в Хельсинки.
Хурскайнен работал в Университете Хельсинки сначала преподавателем в 1981–1989 годах, а затем профессором в 1989–2006 годах. Между тем, в 1984–1985 годах он работал в университете Тумаини в Танзании. До университетской карьеры он восемь лет работал в Танзании, выполняя различные педагогические задания. В 1999–2001 годах он был директором Департамента азиатских и африканских исследований. Он вышел на пенсию в 2006 году.
В 1988–1992 годах он руководил полевым проектом «Язык и фольклор суахили», спонсируемым Министерством иностранных дел Финляндии и Университетом Дар-эс-Салама. В рамках проекта был подготовлен речевой корпус DAHE (Дар-эс-Салам - Хельсинки), который впоследствии был оцифрован.
Хурскайнен разработал языковую технологию, используя подробный анализ языка. Базовое описание языка производится с помощью преобразователей с конечным числом состояний, впервые разработанных Киммо Коскенниеми. Затем отдельные слова устраняют неоднозначность с использованием технологии грамматики ограничений. Кроме того, на этом этапе выполняется синтаксическое отображение . Устранение неоднозначности и синтаксическое сопоставление выполняются с использованием грамматики ограничений 3.0, первоначально разработанной Фредом Карлссоном и реализованной Паси Тапанайненом из Connexor.
Подход на основе правил, разработанный Хурскайненом, имеет сходство с другими правилами: системы на основе, такие как Grammatical Framework и Nooj. Подходы к языковым технологиям, основанные на правилах, особенно в том, что касается машинного перевода, считаются подходящими для малоресурсных языков с богатой морфологией, таких как языки банту.