Новий ШІ від АйБіЕм робить щось дивовижне: він вчиться на «спогадах»

Tag Hartman-Simkins

Технічна компанія IBM заявляє, що створила алгоритм, який може навчатися на льоту для адаптації до змінного середовища без необхідності навчання з нуля.

Безперервне навчання

Коли алгоритм ШІ вивчає нову навичку — скажімо, відеогру, таку як StarCraft II, - він може стати досить хорошим, щоб повалити кращих професіоналів.

Але це тільки так, якщо всі грають за правилами. Змініть параметри гри, і ШІ виявиться абсолютно нездатним адаптуватися. ШІ, що перевершує в грі пінг-понг, не може впоратися навіть з найменшим зміною відстані між двома веслами.

Тепер нове дослідження IBM, яке буде представлено на конференції по штучному інтелекту в травні, може змінити це. Технічна компанія заявляє, що створила алгоритм, який може навчатися на льоту, використовуючи щось, що нагадує віртуальну пам'ять, для адаптації до змінного середовища без необхідності навчання з нуля.

Наприклад, коли він грав у гру Flappy Bird, алгоритм міг продовжувати грати, навіть якщо відстань між трубами й перешкодами постійно змінювалося, відповідно до дослідницької роботи, нещодавно опублікованій в онлайн-лабораторії IBM-Watson AI - чудовий приклад гнучкого мислення з боку ШІ наступного покоління і, можливо, ознака прийдешніх подій.

Чистий аркуш

Кінцева мета подібних проектів — створити штучний загальний інтелект або подібний людському або надлюдською ШІ з наукової фантастики. Це нове дослідження ще не завершено, але воно дозволяє ШІ вчитися більш людяно, імітуючи гнучкість мозку і здатність з часом оновлювати свою базу знань.

Вчений з IBM Метт Ример (Matt Riemer) описує, як дослідження його команди вирішують проблему забудькуватого ШІ, в неопублікованому пості блогу, який ще не пройшов внутрішню рецензію в IBM, яка була розглянута Futurism. Як правило, алгоритм стає жертвою так званого «катастрофічного забуття», коли ШІ забуває свою попередню тренування, витираючи чисту дошку і забуваючи всі попередні тренування, як тільки вони навчаються нового завдання.

Інші вчені зайнялися катастрофічним забуттям. Одна команда з Google DeepMind навіть створила алгоритм з подобою уяви, який дозволив йому краще зберігати «спогади». Це нове дослідження вирішує ту ж проблему, що і дослідження DeepMind, але під іншим кутом зору, представник IBM Фіона Доертітольд Футуризм.

Поступовий переклад

Але Ример писав, що утримання алгоритму від забуття не так добре, як створення ШІ, який може адаптуватися і вивчати нові речі.

«Однак підходи, які розглядають тільки стабілізацію безперервного навчання шляхом скорочення« забуття », розглядають тільки половину картини, тому легко створювати домени там, де вони зазнають невдачі», - написав Ример в блозі.

Основна відмінність полягає в тому, що команда IBM знайшла спосіб навчати ШІ, щоб, коли він стикається зі змінами у своєму середовищі, будь то відстань між каналами в Flappy Bird або чимось ще, його існуючі знання і навчання замість цього переносилися в цю нову задачу втручатися в це.

Зрештою, пише Ример, мета полягає в тому, щоб створити ШІ, який може займатися своїми справами, навчаючись і адаптуючись, не вимагаючи, щоб людина контролювала і тримала руку на своєму шляху.