Штучний інтелект перекладає новини так само добре, як і людина
Переклад традиційно вважався роботою, в якій чарівний людський контакт завжди в кінцевому підсумку перевершив би машину. Це може бути вже не так, оскільки перекладач Microsoft AI просто прибив одну з найскладніших проблем: переклад китайців на англійську з точністю, порівнянної з двомовною.
Китайська мова настільки складний, що потрібно багато років для того, щоб нерідних оратор міг просто управляти 3000 символів, необхідними для читання газети. Попередні спроби автоматичного перекладу вразили світ, з такими дорогоцінними каменями, як «ручна граната», щоб вказати вогнегасник або таємниче «все» блюдо в меню ресторану.
«Для алфавітних мов є те, що вони називають доброчесним циклом між листом, розмовою і слуханням - ці три категорії складають один складний навик», - сказав в інтерв'ю Los Angeles Times лінгвіст Девід Мозер. «Але проблема з китайцями [...] полягає в тому, що вона порушує цю петлю. Виступ не обов'язково допомагає вашому читання. Читання не обов'язково допомагає вашого листа ». Це три різних навички, які при вивченні китайської мови повинні бути освоєні паралельно.
Після довгих років роботи над тим, що здавалося майже неможливим, інженери Microsoft нарешті досягли так званого «людського паритету» в перекладі прикладу пропозицій з китайських статей новин на англійську мову.
Команда використовувала зразок 2000 пропозицій з інтернет-газет, які раніше були переведені професіоналом. Вони не тільки порівнювали роботу машини з роботою перекладача, а й наймали групу незалежних консультантів на двох мовах, щоб стежити за процесом.
«Знаходження людського паритету в завданні машинного перекладу - це мрія, яку всі ми мали», - розповів блог компанії Xuedong Huang, технічний фахівець з питань мови Microsoft, природної мови і машинного перекладу. «Ми просто не розуміли, що ми зможемо це вдарити так скоро».
Викладання системи для перекладу мови особливо складно, тому що два різних перекладу одного і того ж слова можуть звучати однаково правильно. Люди вибирають різні слова в залежності від контексту, настрою і того, з ким вони спілкуються.
«Машинний переклад набагато складніше, ніж завдання розпізнавання чистого шаблону», - сказав у своєму блозі Microsoft помічник керуючого директора Microsoft Research Asia Мін Чжоу. «Люди можуть використовувати різні слова, щоб висловити те ж саме, але ви не можете сказати, який з них краще».
Наступним завданням, за його словами, буде тестування нового перекладача AI на новинних новинах в режимі реального часу.
Джерела: The AI Blog