Головна Новини

Дослідники створили систему штучного інтелекту, яка сама вчиться новим мовам

Дві нові статті пропонують новітній метод для нейронних мереж вирішення проблем перекладу. Замість того, щоб використовувати контрольоване машинне навчання, ці дослідження дозволили системам самим вирішувати, що їм для цього потрібно.

Вивчення мови

В останні роки комп'ютери стали набагато більш майстерними в перекладі з однієї мови на іншу завдяки застосуванню нейронних мереж. Однак для цих систем AI зазвичай потрібно багато контенту, переведених людьми для комп'ютерів, на яких можна вчитися, а дві нові статті демонструють, що можна розробити систему, яка не покладається на паралельні тексти.

Мікель Артекс, комп'ютерний вчений з Університету Країни Басків (UPV) і автор однієї з цих робіт, порівнює ситуацію з наданням комусь різних книг китайською мовою і різними книгами на арабській мові без будь-яких однакових текстів перекриття. Людині було б дуже важко навчитися перекладати з китайської на арабську мову в цьому сценарії, але комп'ютер не може.

В типовому процесі машинного навчання система AI буде контролюватися. Це означає, що він спробує знайти правильну відповідь по будь-якої заданої проблеми, людина скаже, чи правильно це чи ні, і в міру необхідності буде змінювати свою діяльність. Це не відноситься до цими двома статтями.

Замість цього вони залежать від того, як слова пов'язані однаковим чином на різних мовах - наприклад, «таблиця» і «стілець» часто використовуються разом, незалежно від діалекту. Зіставляючи ці сполуки для кожної мови, а потім порівнюючи їх, можна отримати гідне представлення про те, які терміни пов'язані один з одним. Цей процес не контролюється людиною.

Системи можуть використовуватися для перекладу повних пропозицій, а не тільки окремих слів, використовуючи дві додаткові стратегії навчання. Зворотній переклад передбачає, що пропозиція, написане на одній мові, грубо перекладається в інше, а потім назад до першого, при цьому система налаштовує свої протоколи, якщо результат не зовсім те ж саме. Denoising - аналогічний процес, але зі словами, які видаляються або додаються в пропозицію для різних перекладів. Працюючи в синхронізації, ці методи допомагають машині краще зрозуміти, як працює мова.

Тест на словник

Дві системи - одна, розроблена в UPV, а інша - комп'ютерним вченим Facebook Гійомом Ламплером, - поки ще не розглянуті експертами, але вони показали багатообіцяючі результати в ранньому тестуванні.

Єдиний спосіб прямого порівняння їх можливостей полягає в тому, щоб оцінити їх здатність перекладати текст англійською та французькою, який надходить із загального пулу близько 30 мільйонів пропозицій. Обидва зуміли забити двомовну оцінку дублера оцінки близько 15.

Google Translate, який використовує контрольоване машинне навчання, оцінює близько 40 по цьому заході, тоді як людські перекладачі можуть набирати 50 балів. Однак неконтрольовані бали є значним поліпшенням у порівнянні з базовим перекладом словесного слова.

Дійсно, дослідники, що стоять за обома документами, згодні з тим, що кожен з них може підвищити свою систему, спираючись на роботу іншого. Їх можна було б зробити більш здатними, якби їх напівкерованих, вводячи кілька тисяч паралельних пропозицій в свою навчальну програму, - яка все одно скоротила б час і дані, необхідні для навчання.

Література: Останні новини з журналу Science, arXiv, arXiv

Автор: Бред Джонс
Читайте також:
putin-khuylo
Вакцинуйся!
ОСТАННІ КОМЕНТАРІ