Дивовижний штучний інтелект говорить іншою мовою вашим голосом

Дивовижний штучний інтелект говорить іншою мовою вашим голосом
Google/Victor Tangermann
Гугл представив систему мовного перекладу Translatotron, яка відтворює ваш голос в перекладеному аудіо.

Технічна розмова

В середу Google представив Translatotron, що знаходиться в розробці систему перекладу мови в мову.

Це не перша система для перекладу мови з однієї мови на іншу, але Google розробив Translatotron для того, щоб робити те, що інші системи не можуть: зберігати голос вихідного говорить в перекладеному аудіо.

Іншими словами, технологія може створити враження, що ви говорите на мові, якого ви не знаєте, — чудовий крок вперед на шляху до подолання глобального мовного бар'єру.

Спрощена мова

Згідно з ШІ блогом Гугла, більшість систем перекладу мови в три етапи. Спочатку вони транскрибують мова. Потім вони переводять транскрипцію на мову перекладу, перш ніж, нарешті, генерувати аудіо перекладеної мови.

Translatotron, однак, повністю пропускає текстову частину цього процесу і натомість перетворює мова в спектрограму, зображення, яке відображає звукові частоти. Потім система створює нову спектрограму, на цей раз на цільовому мовою, яку вона використовує для створення нового звуку.

Перші кроки

Теоретично Translatotron буде працювати набагато швидше, ніж інші системи перекладу мови, оскільки йому потрібно виконати тільки один процес, а не три. Використання спектрограм також полегшує збереження елементів оригінального звуку, таких як голос мовця і ритм.

Система ще не готова до розгортання — приклади, представлені на сторінці Google GitHub, все ще звучать досить роботизованих, а переклади далекі від досконалості — але технологія пропонує захоплюючий погляд на майбутнє комунікацій.

Джерела: Engadget

Автор: Крістін Хаузер
ОСТАННІ КОМЕНТАРІ