Головна Новини

Штучний інтелект після перегляду 600 годин телепедерач вірно прогнозує наступні події

Дослідники MIT створили алгоритм, який, як очікується, зможе розуміти візуальні соціальні сигнали людей і передбачати, що станеться далі. Надання штучному інтелекту здатності розуміти і передбачати людські соціальні взаємодії може прокласти шлях до ефективних систем домашнього помічника, а також інтелектуальних камер безпеки, які зможуть завчасно викликати швидку або поліцію.

Отримати Smarter з телевізором?

Массачусетського технологічного інституту комп'ютерних наук та штучного інтелекту Лабораторія створили алгоритм, який використовує глибоке навчання, яке дозволяє штучного інтелекту (ІІ), щоб використовувати зразки людської взаємодії, щоб передбачити, що станеться далі. Дослідники годували програму з відео за участю соціальних взаємодій людини і протестували його, щоб побачити, якщо він "дізнався" досить добре, щоб бути в змозі передбачити їх.

зброю дослідників вибору? 600 годин Youtube відео і комедій, в тому числі в офісі, Відчайдушні домогосподарки, і Scrubs. У той час як цей склад може здатися сумнівним, MIT докторант і дослідник проекту Карл Vondrick міркує, що доступність і реалізм були частиною критеріїв.

"Ми просто хотіли використовувати випадкові відео з YouTube," сказав Vondrick. "Причина, по телебаченню, що це легко для нас, щоб отримати доступ до цих даних, і це кілька реалістичним з точки зору опису повсякденних ситуаціях."

Вони показали комп'ютерні відео людей, які за одну секунду від виконання одного з цих чотирьох дій: обіймаються, цілуються, високою fiving і рукостискання. Штучний інтелект був в стані вгадати правильно 43% часу в порівнянні з людьми, які мали рацію 71% часу.

потенціал майбутнього

Надання ІІ здатність розуміти візуальні ефекти на те, як люди можуть може бути попередником того, що б бути ефективними домашні помічники, а також інтелектуальні камери безпеки, які могли б викликати швидку або поліцію завчасно.

Незважаючи на те, що це не перша спроба передбачення відео, це є найбільш точним досі. Причина полягає в тому, що, по-перше, новий алгоритм відрізняється від попередніх спроб відео передбачення, в якому піксель за пікселем подання є одним з пріоритетів. Він пророкує, використовуючи абстрактне уявлення і фокусується на важливих ознак: він може бути навчений самостійно і використовує так звані "візуальні уявлення" розрізняти візуальні сигнали, які відіграють важливу роль в соціальних взаємодіях від тих, які такими не є. Це те, що приходить природно для людини, але набагато складніше в AI.

"Це не дуже відрізняється від деяких інших речей, які зробили люди, але вони отримали суттєво кращі результати з нього, ніж люди в цій галузі раніше," говорить Педро Домінгуш, експерт машинного навчання і професор в Університеті штату Вашингтон.

Джерело: NPR.org

Автор: Сесіль Де Хесус
Читайте також:
putin-khuylo
Вакцинуйся!
ОСТАННІ КОМЕНТАРІ