Стартап Stability AI, який є розробником інструменту Stable Diffusion, що використовує генеративний ШІ для створення зображень з текстових підказок, представив модель наступного покоління Stable Diffusion 3. Як повідомляють представники Stability AI, їхня нова модель, яка ще не є широко доступною, покращує якість зображень, краще працює з підказками, що містять кілька предметів, і може точніше відтворювати текст як частину згенерованого зображення. Це якраз те, з чим не могли впоратися попередні моделі Stable Diffusion.
Генеральний директор Stability AI Емад Моске опублікував кілька прикладів у своєму акаунті у Twitter.
Це оголошення з’явилося через кілька днів після того, як найбільший конкурент Stability AI, OpenAI, представив абсолютно нову модель ШІ Sora, яка може генерувати майже реалістичні відео високої чіткості на основі простих текстових підказок. Sora, яка ще не доступна широкому загалу, викликала занепокоєння щодо її потенціалу створювати реалістичні на вигляд фальшиві кадри. Але OpenAI заявила, що співпрацює з експертами з дезінформації, щоб протестувати інструмент перед тим, як зробити його широкодоступним. Stability AI заявила, що робить те саме.
“[Ми] вжили і продовжуємо вживати розумних заходів для запобігання зловживанню Stable Diffusion 3 недобросовісними суб’єктами, – написала компанія в блозі на своєму сайті. – Постійно співпрацюючи з дослідниками, експертами та нашою спільнотою, ми сподіваємось на подальші інновації з дотриманням принципів доброчесності в міру наближення до публічного релізу моделі”. Поки що невідомо, коли Stable Diffusion 3 буде випущена для громадськості.
Нагадаємо, нещодавно ми писали, що ШІ-модель Google Gemini отримала безліч скарг від користувачів через неточно згенеровані зображення людей. Інструмент створював зображення історичних постатей, як-от батьків-засновників США або Папи Римського, з іншим кольором шкіри. Тож Google заявила, що призупиняє генерацію зображень людей і незабаром випустить покращену версію.
Читайте також:
Leave a Reply