Дослідницька лабораторія штучного інтелекту OpenAI оголосила подробиці про свою новітню технологію, яка значно покращить 3D-рендеринг. OpenAI – це компанія, що стоїть за генератором текст-зображення DALL-E, яка тепер звернула свою увагу на переклад текстових підказок в 3D-хмари точок, які вона називатиме POINT-E.
Згідно з документом, опублікованим OpenAI, POINT-E «створює 3D-моделі всього за 1-2 хвилини на одному графічному процесорі», в порівнянні з іншими існуючими рішеннями, які можуть зайняти години і вимагають декількох графічних процесорів.
Уривок з доповіді докладно описує поточне місце POINT-E у світі побудови 3D моделей: «Хоча наш метод все ще не дотягує до найсучасніших з точки зору якості зразків, він на один-два порядки швидше, пропонуючи практичний компроміс для деяких випадків використання».
Він працює шляхом створення єдиного синтетичного зображення з моделлю дифузії текст-зображення. Потім генерується 3D хмара точок, яку легше синтезувати, що знижує навантаження на графічні процесори, хоча вона не захоплює дрібні деталі, що є компромісом, згаданим в статті.
Вторинний штучний інтелект був навчений, щоб полегшити деякі з цих проблем, але в роботі пояснюється, що він може «іноді пропускати тонкі/рідкісні частини об’єктів», такі як стебла рослин, створюючи ілюзію плаваючих квітів.
OpenAI обіцяє навчити штучний інтелект на кількох мільйонах 3D-моделей та їхніх метаданих, хоча сфери його застосування поки що залишаються досить обмеженими.
Одним з таких прикладів є рендеринг реальних об’єктів для 3D-друку, хоча в міру розвитку і вдосконалення технології, цілком ймовірно, що ми побачимо її використання в складніших випадках, таких як ігри і навіть телебачення.
Відкритий код проєкту доступний на GitHub.
Ви можете допомогти Україні боротися з російськими окупантами. Найкращий спосіб зробити це – пожертвувати кошти Збройним Силам України через Savelife або через офіційну сторінку НБУ.