Microsoft Translator

редактировать
Логотип Microsoft Translator
Microsoft Translator Logo.png и значок переводчика Microsoft, который отображается вдоль заголовка в веб-браузере
Тип сайтаМашинный перевод
ВладелецMicrosoft
URLwww.microsoft.com / translator
РегистрацияНеобязательно
Текущий статусАктивный

Microsoft Translator - это многоязычная облачная служба машинного перевода, предоставляемая Microsoft. Microsoft Translator интегрирован во множество продуктов для потребителей, разработчиков и предприятий; включая Bing, Microsoft Office, SharePoint, Microsoft Edge, Microsoft Lync, Yammer, Skype Translator, Visual Studio, Internet Explorer и приложения Microsoft Translator для Windows, Windows Phone, iPhone и Apple Watch, а также телефон Android и Android Wear.

Microsoft Translator также предлагает перевод текста и речи через облачные сервисы для предприятий. Услуги по переводу текста через Translator Text API варьируются от бесплатного уровня, поддерживающего два миллиона символов в месяц, до платных уровней, поддерживающих миллиарды символов в месяц. Перевод речи через службы Microsoft Speech предлагается в зависимости от времени аудиопотока.

По состоянию на май 2020 года служба поддерживает 73 языковых системы. Она также поддерживает 11 систем перевода речи, которые в настоящее время поддерживают функцию живого разговора Microsoft Translator, Skype Translator и Skype для рабочего стола Windows, а также приложения Microsoft Translator для iOS. и Android.

Содержание
  • 1 Разработка
    • 1.1 История
    • 1.2 Методология перевода и исследования
    • 1.3 Точность
  • 2 Основные продукты
    • 2.1 Облачный перевод Microsoft Translator
    • 2.2 Пользовательский переводчик
    • 2.3 Функция Live
    • 2.4 Microsoft Translator Hub
    • 2.5 Набор инструментов для многоязычных приложений (MAT)
  • 3 Веб-приложение Microsoft Translator
  • 4 Поддерживаемые продукты
    • 4.1 Связь
    • 4.2 Microsoft Office
    • 4.3 Приложения
  • 5 Устаревшие продукты
    • 5.1 Структура совместных переводов (CTF)
    • 5.2 Веб-виджет переводчика
  • 6 Поддерживаемые языки
  • 7 Партнеры по сообществу
  • 8 См. Также
  • 9 Ссылки
  • 10 Внешние ссылки
    • 10.1 Разработка ПО
Разработка

История

Первая версия Система машинного перевода Microsoft была разработана в период с 1999 по 2000 год в рамках Microsoft Research. Эта система была основана на семантических структурах предикат-аргумент, известных как логические формы (LF), и была основана на функции исправления грамматики, разработанной для Microsoft Word. Эта система в конечном итоге использовалась для перевода всей базы знаний Microsoft на испанский, французский, немецкий и японский языки.

Подход Microsoft к машинному переводу, как и большинство современных систем машинного перевода, основан на «управлении данными ": вместо того, чтобы полагаться на написание явных правил для перевода естественного языка, алгоритмы обучаются понимать и интерпретировать переведенные параллельные тексты, что позволяет им автоматически учиться переводить новые естественные язык текста. Опыт Microsoft с системой LF привел непосредственно к системе преобразования древовидных схем, которая упростила LF до деревьев зависимостей и, в конечном итоге, до модели шаблона заказа, значительно улучшив скорость и позволив включать новые целевые языки.

Ориентированный на потребителя сайт переводов, известный как Bing Translator (ранее известный как переводчик Windows Live), был запущен в 2007 году и предоставляет бесплатные переводы текста и веб-сайтов в Интернете. Текст переводится непосредственно на веб-странице Bing Translator, в то время как веб-сайты переводятся с помощью инструментов Bilingual Viewer.

В 2011 году услуга была расширена за счет включения многочисленных продуктов Microsoft Translator с помощью облачной интерфейс прикладного программирования, который поддерживает продукты, доступные как для обычных, так и для корпоративных пользователей. Дополнительная возможность перевода речи была представлена ​​в марте 2016 года.

В мае 2018 года было представлено обновление API. Эта новая версия предлагала нейронный машинный перевод в качестве метода перевода по умолчанию. Помимо перевода, новая версия включает транслитерацию и двуязычный словарь для поиска слов для поиска альтернативных переводов и просмотра примеров в предложениях.

Речевой перевод был интегрирован в службы Microsoft Speech в Сентябрь 2018 г., обеспечивает непрерывный перевод речи, преобразования речи в текст и преобразования текста в речь.

Методология перевода и исследования

Microsoft Translator использует машинный перевод для создания мгновенных переводов с одного естественного языка на другой. Эта система основана на четырех различных областях компьютерного обучения, описанных ниже.

Тип обученияВлияние на перевод
Нейронные сети. Нейронный машинный перевод Нейронные сети пытаются имитировать работу мозга при переводе с одного языка на другой. На высоком уровне перевод нейронной сети работает в два этапа. Во-первых, на первом этапе моделируется слово, которое необходимо перевести, на основе контекста этого слова (и его возможных переводов) в рамках всего предложения. Во-вторых, нейронная сеть переводит эту словесную модель (не само слово, а модель построенных из него нейронных сетей) в контексте предложения на другой язык. Нейронный машинный перевод - это метод перевода по умолчанию для Microsoft Translator API.
SMT на основе синтаксиса.Перевод на основе синтаксиса основан на идее перевода синтаксических единиц, а не слова или строки слов. Microsoft использовала SMT на основе синтаксиса для перевода большей части своих компьютерных текстов с английского на несколько целевых языков. Текущие исследования в этой области позволили улучшить флексию слов и порядок слов.
SMT на основе фразВ SMT на основе фраз машина изучает соответствие между языками из параллельного текста без помощи лингвистов. Это обеспечивает лучший перевод за меньшее время, чем другие системы.
Выравнивание слов в битексте Системы SMT полагаются на существующие переведенные данные, чтобы научиться автоматически переводить с одного языка на другой. Для обучения систем решающее значение имеет определение соответствий слов (или выравнивания слов). Microsoft разработала как дискриминационный, так и генеративный подходы к выравниванию слов, что привело к более быстрым алгоритмам и более высокому качеству и переводу.
Языковое моделирование Языковое моделирование использует n-граммовые модели для построения понятных переводов на целевой язык. Это гарантирует, что перевод на выходе будет плавным и читаемым.

Точность

Качество результатов машинного перевода Microsoft Translator оценивается с использованием метода, называемого BLEU score.

BLEU (Bilingual Evaluation Understudy) - это алгоритм для оценка качества текста, который был автоматически переведен с одного естественного языка на другой. Качество считается соответствием продукции машины и продукции человека. BLEU был одним из первых показателей, достигших высокой корреляции с человеческими оценками качества, и остается одним из самых популярных автоматизированных и недорогих показателей.

Поскольку машинный перевод основан на статистических алгоритмах, а не на людях-переводчиках, автоматические переводы, которые он производит, не всегда полностью точны. Microsoft Translator ввел в свои продукты различные функции обратной связи, такие как платформа совместных переводов, чтобы пользователи могли предлагать альтернативные переводы. Эти альтернативные переводы затем интегрируются в алгоритмы переводчика Microsoft для улучшения будущих переводов.

В ноябре 2016 года Microsoft Translator представила перевод с использованием глубоких нейронных сетей на девяти из наиболее загруженных языков, включая все языки речи и японский. Нейронные сети обеспечивают лучший перевод, чем стандартное статистическое машинное обучение.

Основные продукты

Microsoft Translator - это облачный API, интегрированный во многие продукты и услуги Microsoft. API-интерфейс переводчика может использоваться сам по себе и может быть настроен для использования в среде до публикации или после публикации. API, доступный по подписке, бесплатен для небольших объемов переводов и взимается в соответствии с многоуровневой системой оплаты за объемы, превышающие два миллиона символов в месяц. Остальные основные продукты доступны бесплатно.

Облачный перевод Microsoft Translator

Microsoft Translator - это облачная служба автоматического перевода, которую можно использовать для создания приложений, веб-сайтов и инструментов, требующих многоязыковой поддержки.

  • Перевод текста: Microsoft Translator Text API может использоваться для перевода текста на любой из языков, поддерживаемых службой.
  • Перевод речи: Microsoft Translator интегрирован в службы Microsoft Speech, что является конечным -закончить API на основе REST, который можно использовать для создания приложений, инструментов или любого решения, требующего многоязычного перевода речи. Перевод речи в речь доступен на любой из языков разговора или с любого языка, а перевод речи в текст доступен с языков разговора на любую из языковых систем, поддерживаемых Microsoft Translator.

Пользовательский переводчик

Пользовательский переводчик - это функция служб Microsoft Translator, которая позволяет предприятиям, разработчикам приложений и поставщикам языковых услуг создавать системы нейронного перевода, которые понимают терминологию, используемую в их собственном бизнесе и отрасли. Настроенные переводы затем могут быть доставлены в существующие приложения, рабочие процессы и веб-сайты с помощью обычного вызова Microsoft Translator API. Пользовательский переводчик можно использовать при переводе текста с помощью Microsoft Translator Text API и при переводе речи с помощью служб Microsoft Speech.

Функция Live

Персональный универсальный переводчик, позволяющий работать до 500 человек., на нескольких устройствах, на нескольких языках, беседы с личным переводом. Эта функция в настоящее время бесплатна и доступна в приложениях Microsoft Translator (Android, iOS или Windows) и в браузере по адресу: http://translator.microsoft.com.

Microsoft Translator Hub

Microsoft Translator Hub позволяет предприятиям и поставщикам языковых услуг создавать собственные системы перевода, которые понимают бизнес-терминологию и отраслевую терминологию. Hub также можно использовать вместе с CTF, что позволяет администраторам утверждать результаты CTF и добавлять их непосредственно в Hub. Microsoft Translator Hub доступен только для статистического машинного перевода и не может использоваться с новейшей версией Microsoft Translator API.

Центр также использовался для сохранения языка, позволяя сообществам создавать свои собственные системы языкового перевода для сохранения языка и культуры. Hub использовался для создания систем перевода для таких языков, как хмонг, майя, непальский и валлийский.

Multilingual App Toolkit (MAT)

Multilingual App Toolkit (MAT) - это интегрированный инструмент Visual Studio, который позволяет разработчикам оптимизировать рабочие процессы локализации своих приложений для Windows, Windows Phone и настольных приложений. MAT улучшает локализацию управления файлами, поддержку перевода и инструменты редактирования.

Веб-приложение Microsoft Translator
Microsoft Translator
Тип сайтаСтатистический машинный перевод
Доступно всм. ниже
ВладелецMicrosoft
URLwww.bing.com / translator /
CommercialNo
РегистрацияНеобязательно
Запущениюнь 3, 2009; 11 лет назад (03.06.2009) (в качестве переводчика Live Search)
Текущий статусАктивный

Microsoft Translator (ранее Live Search Translator, Windows Live Translator и Bing Translator ) - это портал перевода, доступный пользователю, предоставляемый Microsoft как часть своих служб Bing для перевода текстов или всего веб-страницы на разные языки. Все пары переводов поддерживаются Microsoft Translator, платформой статистического машинного перевода и веб-службой, разработанной Microsoft Research в качестве внутреннего программного обеспечения для перевода. Две пары транслитерации (между китайским (упрощенным) и китайским (традиционным) ) предоставляются командой Microsoft Windows International.

С мая 2020 года Bing Translator предлагает переводы в 73 различных языковых системах.

Двуязычный просмотрщик, показывающий английский перевод французской Википедии главной страницы.

Переводчик Bing может переводить фразы, введенные пользователя или получить ссылку на веб-страницу и полностью ее перевести. При переводе всей веб-страницы или когда пользователь выбирает «Перевести эту страницу» в результатах поиска Bing, отображается двуязычная программа просмотра, которая позволяет пользователям просматривать исходный текст веб-страницы и переводить параллельно, поддерживается синхронизированными выделениями, прокруткой и навигацией. Доступны четыре макета двуязычного средства просмотра:

  • Рядом
  • сверху и снизу
  • Оригинал с переводом при наведении
  • Перевод с исходным наведением

Переводчик Bing интегрируется с несколькими другие продукты Microsoft. Ниже приводится таблица продуктов, в которые Bing Translator интегрирован или может быть интегрирован:

Интегрируется вСреднее значение интеграции
Мгновенные ответы Bing Уже интегрировано
Internet Explorer Accelerator для Internet Explorer 8 или выше
Поддерживаемые продукты

Благодаря своим основным предложениям продуктов Microsoft Translator поддерживает функции перевода многих продуктов Microsoft на потребительский и корпоративный уровни. Эти продукты можно разделить на три категории: коммуникационные продукты, Microsoft Office и приложения.

Связь

Microsoft Office

Приложения

Устаревшие продукты

Платформа совместных переводов (CTF)

Платформа совместных переводов (CTF) - это расширение Microsoft Translator API, которое позволяет улучшить переведенный текст после публикации. Используя CTF, читатели имеют возможность предлагать переводы, альтернативные тем, которые предоставляет API, или голосовать за ранее предложенные альтернативы. Затем эта информация передается в API для улучшения будущих переводов.

Веб-виджет переводчика

Веб-виджет переводчика - это инструмент перевода, который можно добавить на веб-страницы, вставив на страницу заранее определенный фрагмент кода JavaScript. Веб-виджет предоставляется Microsoft бесплатно и поддерживает как предварительную публикацию настроенных переводов с помощью концентратора переводчиков, так и улучшения после публикации с использованием платформы совместных переводов.

Поддерживаемые языки

По состоянию на октябрь 2020 года Microsoft Translator поддерживает 79 различных языковых систем. Список поддерживаемых языков доступен на веб-сайте Microsoft Translator, а также может быть получен программно через облачные службы.

  1. африкаанс
  2. арабский
  3. ассамский
  4. бенгальский
  5. боснийский
  6. болгарский
  7. Кантонский
  8. каталонский
  9. китайский (упрощенный)
  10. китайский (традиционный)
  11. хорватский
  12. чешский
  13. датский
  14. дари
  15. голландский
  16. английский
  17. эстонский
  18. Фиджиец
  19. Филиппинский
  20. Финский
  21. Французский (Франция)
  22. Французский (Канада)
  23. Галисийский
  24. Грузинский
  25. Немецкий
  26. Греческий
  27. Гаитянский креольский
  28. Иврит
  29. Хинди
  30. Хмонг Дау
  31. Венгерский
  32. Исландский
  33. Индонезийский
  34. Ирландский
  35. Итальянский
  36. Японский
  37. Клингонский
  38. Корейский
  39. Курдский (Курманджи)
  40. Курдский (Сорани)
  41. латышский
  42. литовский
  43. люксембургский
  44. македонский
  45. малагасийский
  46. малайский
  47. малаялам
  48. мальтийский
  49. маори
  50. норвежский
  51. одия
  52. Пушту
  53. Персидский
  54. Польский
  55. Португальский (Бразилия)
  56. Португальский (Португалия)
  57. Пенджаби (Гурмухи)
  58. Керетаро Отоми
  59. Румынский
  60. Русский
  61. Самоанский
  62. сербский (кириллица)
  63. сербский (латиница)
  64. словацкий
  65. словенский
  66. испанский
  67. суахили
  68. шведский
  69. таитянский
  70. тамильский
  71. телугу
  72. Тайский
  73. Тонганский
  74. Турецкий
  75. Украинский
  76. Урду
  77. Вьетнамский
  78. Валлийский
  79. Юкатек Майя
Партнеры сообщества

Переводчик Microsoft взаимодействовал с партнерами сообщества увеличить количество языков и улучшить общее качество языкового перевода. Ниже приведен список партнеров сообщества, с которыми сотрудничает Microsoft Translator.

Дополнительно, Microsoft объединилась с Институтом клингонского языка, который продвигает искусственный язык клингонский, который используется в вымышленной вселенной Звездного пути, созданной Paramount и CBS Studios. Klingon поддерживается Microsoft Translator с мая 2013 года.

См. Также
Ссылки
Внешние ссылки

Разработка ПО

Последняя правка сделана 2021-05-30 10:14:35
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте