Компанія OpenAI офіційно анонсувала Sora 2 – нову версію свого найпотужнішого на сьогодні генеративного AI для створення відео та аудіо. Презентація стала своєрідною відповіддю на нещодавній реліз Veo 3 від Google.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Sora 2 з’явилася майже через десять місяців після виходу першої версії. Якщо запуск оригінальної Sora у компанії називали “моментом GPT-1 для відео”, то другу ітерацію позиціюють як “момент GPT-3.5”, адже вона виводить генерацію відео на якісно новий рівень. Модель може створювати складні сцени з реалістичними фізичними взаємодіями, що були недосяжними для попередніх систем.

Раніше алгоритми часто спотворювали реальність, приміром, могли “телепортувати” баскетбольний м’яч у кошик після промаху. Натомість Sora 2 розуміє закони фізики та здатна відтворювати точні рухи: від олімпійських гімнастичних вправ і сальто на дошці для серфінгу з урахуванням плавучості та жорсткості, до складних потрійних акселів, які виконують віртуальні персонажі. Ба більше, система синхронізує діалоги та звукові ефекти з діями на екрані. Одним із ключових досягнень моделі є вміння показувати не лише успіх, а й провал, що наближає її до моделювання реального світу.
Ще однією сильною стороною Sora 2 є керованість. Модель може дотримуватися багатокадрових інструкцій і зберігати сталість середовища у відео. Вона підтримує кілька візуальних стилів – від реалістичного та кінематографічного до аніме, що відкриває ширші можливості для авторів.
Інноваційною функцією Sora 2 стала можливість додавати до згенерованих роликів реальні елементи за допомогою так званих “камео”. Завантаживши короткий фрагмент відео та аудіо, користувач може перенести у віртуальне середовище власне цифрове відтворення, а також додати друзів чи будь-які предмети.
Разом з моделлю OpenAI запустила і новий застосунок Sora для iOS. У ньому користувачі можуть створювати власні відео, реміксувати роботи інших та додавати одне одного у вигляді камео. Важливим елементом програми стала вбудована відеострічка з контентом, створеним штучним інтелектом.
Розробники наголошують, що врахували ризики безконтрольного скролінгу, залежності й ізоляції, які притаманні звичайним соцмережам. Тому акцент зроблено не на пасивному перегляді, а на креативності та взаємодії. В окремому дописі компанія розповіла й про заходи безпеки, які впроваджені в Sora Feed.
Алгоритми рекомендацій у застосунку працюють на основі AI, але ними можна керувати за допомогою голосових чи текстових команд. Передбачено функції для турботи про добробут користувачів, а також можливість налаштовувати параметри стрічки. Для підлітків встановлені стандартні обмеження за замовчуванням, а батьки можуть застосовувати інструменти на основі ChatGPT, щоб регулювати налаштування й захищати молодшу аудиторію.
Застосунок Sora вже доступний в App Store для iOS. Користувачі можуть залишити заявку й отримати запрошення після відкриття доступу. На початковому етапі модель Sora 2 можна використовувати безкоштовно також через сайт OpenAI, а передплатники ChatGPT Pro отримають доступ до розширеної версії Sora 2 Pro поряд з Sora 1 Turbo. У компанії додали, що найближчим часом модель стане доступною й через API.
Читайте також:
- Opera випустила свій перший AI-браузер Neon
- Найбільші AI-розробники прагнуть створити машинний «суперінтелект»
