Нещодавно OpenAI випустила на ринок власну ШІ-модель для створення відео – Sora. Відтепер користувачі отримали доступ до неї скрізь, де працює ChatGPT, кажуть у компанії. Втім є декілька винятків. Як опанувати новий сервіс і де знаходити підказки, пояснює Mind.
Дуже просто. Для старту потрібно зареєструватися на окремому сайті sora.com. Далі ввести Prompt (текстове завдання). OpenAI наводить багато прикладів таких завдань і демонструє, яке відео в підсумку створив ШІ.
Prompt: Красиве засніжене місто Токіо. Камера рухається гамірною міською вулицею, стежачи за кількома людьми, які насолоджуються прекрасною сніжною погодою та роблять покупки в найближчих кіосках. Розкішні пелюстки сакури розлітаються разом зі сніжинками.
Prompt: Камера стежить за білим вінтажним позашляховиком із чорним багажником на даху, коли він мчить крутою ґрунтовою дорогою, оточеною соснами на крутому схилі гори. Пил підіймається з його шин, сонячне світло освітлює позашляховик, коли він мчить ґрунтовою дорогою. Ґрунтова дорога плавно згинається вдалину, не видно інших машин чи транспортних засобів. Дерева обабіч дороги – секвої, усюди розкидані плями зелені. Ззаду видно, що автомобіль легко проходить поворот, створюючи враження, ніби він їде по пересіченій місцевості. Сама ґрунтова дорога оточена крутими пагорбами та горами, а над ними чисте блакитне небо з тонкими хмарами.
Prompt: 3D-анімація маленької круглої пухнастої істоти з великими виразними очима, яка досліджує яскравий зачарований ліс. Істота, химерна суміш кролика та білки, має ніжно-блакитне хутро й густий смугастий хвіст. Вона стрибає вздовж блискучого струмка, очі широко розширені від подиву. Ліс живий із чарівними елементами: квітами, які світяться та змінюють кольори, деревами з листям фіолетових і сріблястих відтінків і маленькими вогниками, що плавають і нагадують світлячків. Істота зупиняється, щоб грайливо взаємодіяти з групою крихітних, схожих на фею істот, які танцюють навколо кільця гриба. Істота з благоговінням дивиться на велике сяюче дерево, яке, здається, є серцем лісу.
Також користувачу потрібно вибрати роздільну здатність майбутнього відео – від 480p до 1080p. Чим вище цей параметр – тим довше доведеться чекати створення відео. Втім тестувальники розповідають, що на «креатив» витрачається максимум декілька хвилин у найвищій роздільної здатності.
Поки сервіс дозволяє генерувати відео тривалістю до 20 секунд. Кількість генерацій на початковому етапі буде обмеженою, повідомив топ OpenAI Сем Альтман.
Як зазначено в презентації, відео можна генерувати вертикальні, горизонтальні та квадратні; всі згенеровані ролики матимуть метадані C2PA та водяні знаки для ідентифікації контенту.
У компанії уточнюють, що Sora може створювати фотореалістичні складні сцени з кількома персонажами, певними типами руху й точними деталями об’єкта та фону. ШІ-модель розуміє не лише те, що написав користувач у текстовому завданні, а й те, як ці речі існують у фізичному світі.
«Модель має глибоке розуміння мови, що дозволяє їй точно інтерпретувати підказки та створювати переконливі персонажі, які виражають яскраві емоції. Sora також може створювати кілька кадрів в одному згенерованому відео, де точно зберігаються персонажі та візуальний стиль», – сподіваються в OpenAI.
Втім застерігають, що в поточній моделі не все ідеально. «Їй може бути важко імітувати фізику складної сцени. Sora може не розуміти конкретних причинно-наслідкових зв’язків, наприклад, на печиві може не залишитися мітки після того, як персонаж його вкусить. Модель також може плутати просторові деталі, включені в підказку, наприклад, не розрізняти ліворуч і праворуч, або мати проблеми з точним описом подій, які розгортаються з часом, як-от певні траєкторії камери.
Ще в лютому 2024 року OpenAI відкрила доступ до Sora командам-тестувальникам, які оцінювали модель на предмет потенційної шкоди й ризиків, а також художникам, дизайнерам і кінематографістам для отримання зворотного зв’язку.
Наразі в компанії розповідають, що доступ наданий користувачам з усіх країн, де працює ChatGPT, за винятком Великої Британії, Швейцарії та ЄС. Втім юзерів з України на сайті Sora зустрічає сповіщення про те, що створення облікового запису поки недоступне. «Наразі в нас великий трафік, тому ми тимчасово вимкнули створення облікового запису Sora. Якщо ви ніколи раніше не входили до Sora, перевірте знову незабаром», – рекомендує сервіс.
Наразі Sora доступна тільки за підпискою. Користувачі з тарифним планом ChatGPT Plus вартістю $20 на місяць зможуть щомісяця генерувати до 50 відео роздільною здатністю 480p, клієнти з тарифом ChatGPT Pro за $200 на місяць отримають можливість створення до 500 відео з вищою роздільною здатністю у швидкому режимі та безлімітний доступ до повільних генерацій.
Наразі OpenAI не дозволяє користуватися сервісом молодим людям до 18 років. Також Sora не приймає текстові завдання на створення відео з насильством, сексуальним вмістом, діпфейками знаменитостей тощо.