OpenAI випустила довгоочікувану модель штучного інтелекту під кодовою назвою «Полуниця».
Як і очікувалося, нова модель, що отримала назву OpenAI o1-preview — зовсім нова угода про імена для компанії — «призначена для того, щоб витрачати більше часу на обмірковування», перш ніж відповісти, розширюючи межі «складних завдань» і згідно з повідомленням компанії, вона може вирішати «складніші проблеми».
Давно ходили чутки, що ця модель є проривом у прагненні компанії реалізувати загальний штучний інтелект (AGI) — теоретичну точку, в якій ШІ може перевершити людину. Мета – надати моделі відчуття "міркування", що дозволить їй, наприклад, вирішувати складніші математичні завдання.
І якщо вірити компанії, вона вже має серйозні наукові досягнення.
OpenAI стверджує, що модель «працює так само як аспіранти при виконанні складних контрольних завдань з фізики, хімії та біології».
Але, як випливає з назви, o1-preview все ще знаходиться на досить ранній стадії, і в майбутньому очікується безліч оновлень.
"Як рання модель, вона ще не має багатьох функцій, які роблять ChatGPT корисним, таких як перегляд інформації в Інтернеті та завантаження файлів та зображень", — написали в компанії. «У багатьох поширених випадках GPT-4o найближчим часом стане більш ефективною».
На цей момент OpenAI o1 буде доступна користувачам ChatGPT Plus та Team. Компанія також планує надати всім користувачам безплатної версії ChatGPT більш полегшену версію нової моделі, що отримала назву o1-mini, але поки не повідомляє, коли це станеться.
У OpenAI стверджують, що при розробці своєї останньої моделі штучного інтелекту особлива увага приділялася безпеці. В одному із «найскладніших тестів на злом» нова модель набрала 84 бали зі 100 порівняно з 22 балами у її попередниці GPT-4o.
Нову модель «було навчено з використанням абсолютно нового алгоритму оптимізації та нового набору навчальних даних, спеціально розроблених для неї», — розповів The Verge керівник дослідження OpenAI Джеррі Творек.
Компанія стверджує, що o1 може використовуватися «дослідниками в галузі охорони здоров'я для анотування даних секвенування клітин, фізиками для створення складних математичних формул, необхідних для квантової оптики, а також розробниками у всіх сферах для створення та виконання багатоетапних робочих процесів».
Завдяки новому процесу «ланцюжка думок» вона оцінює кілька відповідей на запит, перш ніж вибрати найкращу. А це може зайняти деякий час, особливо в порівнянні з миттєвими відповідями, які ми отримуємо від ChatGPT.
У демоверсії, показаній The Verge, моделі знадобилося 30 секунд, щоб вирішити головоломку, що стосується віку принцеси та принца.
Щодо схильності до «галюцинацій» фактів, явної проблеми, яка історично переслідувала чат-боти зі штучним інтелектом, OpenAI виявився більш реалістичним.
«Ми помітили, що ця модель менше галюцинує», — розповів Творек The Verge. Але «ми не можемо сказати, що подолали галюцинації».
Генеральний директор компанії Сем висловив думку про нову модель, заявивши, що вона "все ще недосконала, все ще обмежена і, як і раніше, здається більш разючою при першому використанні, ніж після того, як ви проведете з нею більше часу".
Чи означає це загальний штучний інтелект, запитав один зі співрозмовників у керівника.
"Ні", — відповів він.