Головна Новини

ДіпМаінд від Гугла тепер має пам'ять

ДіпМаінд від Гугла  тепер має пам'ять
Hans Joachim Roy/Shutterstock
Починаючи з 2014 року, ДіпМаінд (DeepMind) грає у відеоігри Атарі. Для кожної гри створювалася нова нейронна мережа. ДіпМаінд ніколи не мав вигоди зі свого власного досвіду - до сих пір.

Наслідуючи Людський мозок

Починаючи з 2014 року, DeepMind грає у відеоігри Atari. Спочатку його системи машинного навчання можуть навчитися перемагати і бити людські оцінки, але не міг пригадати, як йому вдалося це зробити. Таким чином, для кожної гри Atari, була створена нова нейронна мережа. DeepMind ніколи не мали вигоду зі свого власного досвіду-до сих пір.

Команда дослідників з DeepMind і Imperial College London створили алгоритм, який дарує пам'ять про систему, що дозволяє йому вчитися, зберігати знання, і використовувати його. Система використовує контрольовані навчання і навчання з підкріпленням тести, щоб дізнатися в послідовності.

У людському мозку, синаптичної консолідації є основою для безперервного навчання. Збереження отримані знання і передача його від завдання до завдання має вирішальне значення для шляху людей вчитися. Нездатність зробити це є ключовим збій в машинному навчанні. Алгоритм, званий "пружним вага консолідації" (ЕКО), вибирає найбільш корисні частини того, що допомогло грати машини і виграти гри в минулому, потім передає тільки ті частини вперед.

Додатки вищого рівня

Система вражає, але ще не є ідеальним. DeepMind тепер може зберегти найважливішу інформацію з його попереднього досвіду для того, щоб дізнатися, але, незважаючи на цей величезний банк досвідом, він до цих пір не може виконати, а також нейронної мережі, яка завершує одну гру. Ефективність навчання є наступним кроком, якщо машинного навчання, щоб відповідати - або в кінцевому рахунку затемнення - в реальному світі навчання.

Пружні консолідація ваги є ключовим компонентом будь-якої розвідки - біологічного або штучного - оскільки воно дозволяє мислителя освоїти завдання поспіль, не забуваючи. Новий алгоритм DeepMind підтримує безперервне навчання так само, як синаптичної консолідації людського мозку, який є наступним кроком для ІІ з точки зору освоєння більш складних завдань і навчання контексти. Іншими словами, це буде означати, що системи ІІ краще здатні взяти на себе творчі та інтелектуальні завдання; раніше вважалися єдиною провінцією людства.

Список літератури: дротова Великобританії, Праці Національної академії наук, Грані, DeepMind блог

Автор: Карла Лент, Еббі Норман
Читайте також:
putin-khuylo
Вакцинуйся!
ОСТАННІ КОМЕНТАРІ