Цей новий штучний інтелект, що генерує відео, дуже вражає

Runway

"Gen-3 Alpha може створювати високодеталізовані відео зі складними змінами сцен, широким діапазоном кінематографічних варіантів і детальними художніми напрямками."

Нью-йоркський стартап Runway, який займається штучним інтелектом, випустив новітній відеогенератор зі штучним інтелектом під назвою Gen-3 Alpha. Судячи зі зразків відеороликів, якими компанія поділилася наразі, він справді вражає.

Від астронавта, що біжить по провулку в Ріо-де-Жанейро, до правдоподібного приміського району, затопленого водою й оточеного кораловим рифом, Gen-3 Alpha служить ще одним нагадуванням про те, як далеко зайшов генеративний ШІ.

Рівень реалістичності вражає: від дивної та жахливої істоти, що блукає освітленою ліхтарями вулицею, до жінки, що біжить до ракети, що запускається. Людські особи, зокрема, неймовірно реалістичні: в одному кліпі показано, як лисому чоловіку «раптово падає на голову перука з кучерявим волоссям і сонцезахисними окулярами».

Коротко кажучи, це дивовижний, хоч і жахливий погляд на найближче майбутнє. І, судячи з відеороликів, остання модель штучного інтелекту від Runway може позмагатися з нещодавно анонсованою Sora від OpenAI, яка ще не представлена публіці. Але перш ніж ми зможемо визначити переможця, ми зачекаємо, доки у нас з'явиться можливість випробувати будь-який із цих інструментів самостійно.

Проте деякі інтернет-експерти, схоже, вже ухвалили рішення.

"Навіть якщо вони ретельно відібрані, вони вже виглядають краще, ніж Сора", — заявив один із користувачів Reddit.

Introducing Gen-3 Alpha: Runway’s new base model for video generation.

Gen-3 Alpha can create highly detailed videos with complex scene changes, a wide range of cinematic choices, and detailed art directions.https://t.co/YQNE3eqoWf

(1/10) pic.twitter.com/VjEG2ocLZ8
— Runway (@runwayml) June 17, 2024

Окрім найновішого відеогенератора Runway також випускає ряд інструментів тонкої настройки, включаючи розширені елементи керування камерою.

Компанія стверджує, що Gen-3 — це крок до її більш амбітної мети щодо реалізації того, що вона називає «Загальними моделями світу», тобто «системою штучного інтелекту, яка створює внутрішнє уявлення довкілля та використовує її для моделювання майбутніх подій у цьому середовищі.»

Як і Sora з OpenAI, компанія Runway поки не назвала точну дату запуску моделі. Також неясно, чи Runway стягуватиме з користувачів плату за доступ. Компанія вже продає підписки на свої чинні інструменти штучного інтелекту, у тому числі на два попередники Gen-3, а також інші інструменти для редагування відео на основі штучного інтелекту.

За словами співзасновника та технічного директора Runway Анастасіса Германідіса, Gen-3 Alpha «скоро буде доступний у продукті Runway і підтримуватиме всі наявні режими, до яких ви звикли (перетворення тексту на відео, зображення на… відео, відео-в- відео) та деякі нові, які стали можливими тільки зараз з більш функціональною базовою моделлю."

Як і AI-відеогенератор OpenAI, зразки, створені Gen-3 Alpha, також далекі від ідеального пікселя: від спотвореного тексту до відсутніх частин тіла.

Хоча компанія Runway стверджує, що Gen-3 Alpha «навчалася спільно з відео та зображеннями» на своєму веб-сайті, компанія не стала уточнювати, звідки взялися ці дані — тенденція, яка стає все більш поширеною серед компаній, що займаються штучним інтелектом.

Очевидно, щоб запобігти побоюванням щодо можливого порушення авторських прав, Runway також заявляє, що «співпрацює з провідними розважальними та медіаорганізаціями для створення індивідуальних версій Gen-3».

Ми утримаємося від суджень доти, доки у нас не з'явиться можливість випробувати Gen-3 Alpha, але, судячи з того, що ми бачили досі, Runway не ледарює.