Нейронный машинный перевод Google

редактировать
Система, разработанная Google для повышения беглости и точности Google Translate

Нейронный машинный перевод Google (GNMT) - это система нейронного машинного перевода (NMT), разработанная Google и представленная в ноябре 2016 года, которая использует искусственную нейронную сеть для повышения беглости и точности Google Translate.

GNMT улучшает качество перевода за счет применения основанного на примерах (EBMT) метода машинного перевода, при котором система «учится на миллионах примеров». Предложенная GNMT архитектура системного обучения была сначала протестирована более чем на ста языках, поддерживаемых Google Translate. Благодаря большой сквозной структуре система со временем учится создавать более качественные и естественные переводы. GNMT может переводить целые предложения за раз, а не просто по частям. Сеть GNMT может выполнять межъязыковой машинный перевод путем кодирования семантики предложения, а не путем запоминания фразовых переводов.

Содержание
  • 1 История
  • 2 Оценка
  • 3 Языки, поддерживаемые GNMT
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
История

Проект Google Brain был основан в 2011 году в «секретной Исследовательская лаборатория Google X »научного сотрудника Google Джеффа Дина, исследователя Google, и Стэнфордского университета профессора компьютерных наук Эндрю Нг. Работа Нг привела к одним из самых крупных достижений в Google и Стэнфорде.

В сентябре 2016 года исследовательская группа Google объявила о разработке системы нейронного машинного перевода Google (GNMT), и к ноябрю Google Translate начал использовать нейронный машинный перевод (NMT) по сравнению с его предыдущими статистическими методами (SMT), которые использовались с октября 2007 года, с его собственной собственной технологией SMT.

Система NMT Google Translate использует большую искусственную нейронную сеть, способную к глубокому обучению. Используя миллионы примеров, GNMT улучшает качество перевода, используя более широкий контекст для определения наиболее подходящего перевода. Затем результат перестраивается и адаптируется к грамматически основанному человеческому языку. Предложенная GNMT архитектура системного обучения была сначала протестирована более чем на ста языках, поддерживаемых Google Translate. GNMT не создавал своего собственного универсального интерлингва, а скорее был нацелен на общность, обнаруживаемую между многими языками, которые, как считается, представляют больший интерес для психологов и лингвистов, чем для компьютерных ученых. Новая система перевода была впервые включена для восьми языков: на английский и французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий и обратно в 2016 году. В марте 2017 года были включены три дополнительных языка: русский, хинди и вьетнамский. с тайским языком, поддержка которого была добавлена ​​позже. В том же месяце была добавлена ​​поддержка иврита и арабского языка с помощью сообщества Google Translate. В середине апреля 2017 года компания Google в Нидерландах объявила о поддержке голландского и других европейских языков, связанных с английским. Дополнительная поддержка была добавлена ​​для девяти индийских языков: хинди, бенгали, маратхи, гуджарати, пенджаби, тамильского, телугу, малаялам и каннада в конце апреля 2017 года.

Оценка

Система GNMT - это Говорят, что он представляет собой улучшение по сравнению с прежним переводчиком Google Translate в том, что он сможет обрабатывать "нулевой перевод", то есть напрямую переводить один язык на другой (например, с японского на корейский). Google Translate ранее сначала переводил исходный язык на английский, а затем переводил английский на целевой язык, а не переводил напрямую с одного языка на другой.

A Июль 2019 г. Исследование, проведенное в Annals of Internal Medicine, показало, что «Google Translate - жизнеспособный и точный инструмент для перевода испытаний на неанглоязычные языки». Только одно разногласие между рецензентами, читающими испытания с машинным переводом, было связано с ошибкой перевода. Поскольку многие медицинские исследования исключаются из систематических обзоров, потому что рецензенты не понимают язык, GNMT может снизить систематическую ошибку и повысить точность таких обзоров.

Языки, поддерживаемые GNMT

По состоянию на В октябре 2020 года количество языков, поддерживаемых Google Translate, увеличилось до 109, включая киргизский, белорусский, латинский, мальтийский и суданский языки

  1. африкаанс
  2. албанский
  3. амхарский
  4. арабский
  5. Армянский
  6. Азербайджанский
  7. Баскский
  8. Белорусский
  9. Бенгальский
  10. Боснийский
  11. Болгарский
  12. Бирманский
  13. Каталонский
  14. Кебуанский
  15. Чичева
  16. Китайский (упрощенный)
  17. Китайский (традиционный)
  18. корсиканский
  19. хорватский
  20. чешский
  21. датский
  22. голландский
  23. английский
  24. эсперанто
  25. эстонский
  26. филиппинский
  27. финский
  28. французский
  29. Галисийский
  30. Грузинский
  31. Немецкий
  32. Греческий
  33. Гуджарати
  34. Гаитянский креол
  35. Хауса
  36. Гавайский
  37. Иврит
  38. Хинди
  39. Хмонг
  40. Венгерский
  41. Исландский
  42. игбо
  43. индонезийский
  44. ирландский
  45. итальянский
  46. японский
  47. Яванский
  48. каннада
  49. казахский
  50. кхмерский
  51. корейский
  52. курдский (курманджи )
  53. лаосский
  54. латышский
  55. литовский
  56. люксембургский
  57. македонский
  58. малагасийский
  59. малайский
  60. малаялам
  61. мальтийский
  62. маори
  63. маратхи
  64. монгольский
  65. непальский
  66. норвежский (букмол )
  67. пушту
  68. Персидский
  69. Польский
  70. Португальский
  71. Пенджаби
  72. Румынский
  73. Русский
  74. Самоанский
  75. Шотландский Гэльский
  76. Сербский
  77. Сесото
  78. Шона
  79. Синдхи
  80. Сингальский
  81. словацкий
  82. словенский
  83. сомалийский
  84. испанский
  85. сунданский
  86. суахили
  87. шведский
  88. таджикский
  89. тамильский
  90. телугу
  91. тайский
  92. турецкий
  93. украинский
  94. урду
  95. узбекский
  96. вьетнамский
  97. валлийский
  98. западно-фризский
  99. коса
  100. идиш
  101. йоруба
  102. зулу
См. Также
Литература
Внешние ссылки
В Викиверситете есть учебные ресурсы по Тема: Вычислительная лингвистика
Последняя правка сделана 2021-05-22 14:02:50
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте