Нова версія Sora 2 може відтворювати дії, які раніше були практично неможливими для генеративних моделей відео. Зокрема олімпійські гімнастичні вправи, сальто на падлборді з точним урахуванням динаміки плавучості та жорсткості.
Про це повідомляє OpenAI.
На відміну від попередніх систем, які часто «спотворювали реальність» заради виконання запиту, Sora 2 здатна показати й помилки, дотримуючись логіки фізики. Наприклад, якщо баскетболіст не влучає у кільце, м’яч відбивається від щита, а не телепортується. Це вважається важливим кроком для створення повноцінного симулятора світу.
Крім того, модель значно поліпшила керованість: вона може виконувати складні інструкції, дотримуватися цілісності світу в кількох сценах і працювати як у реалістичному, так і в кінематографічному чи аніме-стилі. Також Sora 2 генерує звукові ефекти, музику та мову з високим рівнем реалістичності, створюючи повноцінні аудіовізуальні сцени.
Бекграунд. Раніше Mind повідомляв, що Opera представила новий браузер Neon із вбудованим агентним ШІ. Інноваційний інструмент дозволяє виконувати завдання, писати код і працювати з даними безпосередньо у браузері.