Штучні алгоритми об'єдналися, щоб перемогти людей в стратегічній грі

Ютуб

Некомерційна дослідницька компанія AI OpenAI розробила OpenAI Five, групу з п'яти нейронних мереж, що призначена для роботи в команді в комп'ютерній стратегічній грі в режимі реального часу під назвою Dota 2.

ДО ВЕЛИКОЇ ЛІГИ. У минулий понеділок некомерційна дослідницька компанія AI OpenAI опублікувала повідомлення в блозі про OpenAI Five, групі з п'яти нейронних мереж, призначеної для роботи в команді, граючи в комп'ютерну стратегічну гру в режимі реального часу під назвою Dota 2. Згідно з повідомленням, OpenAI Five тепер може перемогти команду з п'яти чоловік-любителів-аматорів в грі, хоча і з певними обмеженнями, встановленими на ігровий процес. У серпні він спробує перемогти команду професійних гравців Dota 2 в The International (TI), щорічний турнір Dota 2, організований розробником гри Valve Corporation.

АЛГОРИТМ КОМАНДИ. У Dota 2 дві команди з п'яти гравців борються за знищення «Стародавній» команди іншої команди в центрі своєї бази. Кожен гравець управляє іншим персонажем, відомим як «герой». У цих героїв є свій творчий хист, сильні і слабкі сторони, і здатність команди до співпраці є ключем до її успіху. Розробники призначили кожен алгоритм OpenAI Five конкретним героєм, встановивши обмеження на символи для обліку областей гри, в які вони не інтегрувалися.

ПРАКТИКА РОБИТЬ ВДОСКОНАЛЮВАТИ. OpenAI Five тренується спочатку як індивідуальні алгоритми в одному-в-одному, а потім як команда, граючи проти себе і минулих версій. Як команда, він збирав 180-річний досвід роботи в протягом кожного дня навчання, в кінцевому підсумку піднімаючи стратегії, як правило, використовується професійними гравцями Dota 2. Жоден з алгоритмів не міг спілкуватися один з одним - співпраця була просто одним із стимулів кожного алгоритму. Це співробітництво тривало, коли людський гравець замінив один з алгоритмів.

ГЕРОЇ, ЯКІ ПОТРІБНІ. З OpenAI Five ми могли бачити попередній перегляд майбутнього ШІ. У Dota 2 кожен алгоритм повинен вибирати між приблизно 1000 можливих рухів кожну восьму секунду - набагато більш складну, ніж гра, така як Go, в якій ШІ повинен вибирати між 250 ходами за раз. Алгоритми зазвичай не працюють як команди, але цей проект Dota 2 показує, що вони більш ніж здатні співпрацювати один з одним - і люди теж.

Джерела: OpenAI