Огляд Midjourney: створення зображень, згенерованих ШІ

Ви коли-небудь мріяли легко перенести образи зі своєї уяви на папір? Тепер це можливо завдяки генераторам зображень, таким як Midjourney.

Незалежно від того, чи ви є талановитим художником, чи зовсім не маєте досвіду роботи з пензлем, тепер ви зможете створювати шедеври. Тобто, завдяки штучному інтелекту, ви можете за кілька хвилин створювати образи, які раніше залишалися лише у вашій голові. Просто опишіть їх словами і за мить картина буде готова. Все це завдяки цікавому сервісу Midjourney, який створює зображення, згенеровані штучним інтелектом. Заінтригував? Тоді пропоную більш детально дізнатись, що таке Midjourney, як він працює, та всю найважливішу інформацію про цей інструмент штучного інтелекту.

Читайте також: Я перевірив, як працює чат-бот Bing, і взяв у нього інтерв’ю

Midjourney: що це таке?

Зображення, створені штучним інтелектом, стають все більш поширеними в Інтернеті: від Папи Франциска в яскравій куртці до постерів фільмів, натхненних Уесом Андерсоном. Легко зрозуміти чому – сучасні інструменти штучного інтелекту стали настільки переконливими, що фотографії, які вони створюють, навіть отримали престижні фотонагороди.

Midjourney є прикладом генеративного штучного інтелекту, який може створювати графіку на основі текстових інструкцій. Це лише один із багатьох генераторів зображень на основі машинного навчання, які нещодавно з’явилися. Незважаючи на це, Midjourney став одним з найбільших і найпопулярніших інструментів штучного інтелекту цього типу, поряд із DALL-E та Stable Diffusion.

Вам не потрібне спеціальне апаратне чи програмне забезпечення, щоб використовувати Midjourney, оскільки він працює через програму чату Discord. Єдиний недолік? Так він є. Це необхідність заплатити певну суму, щоб почати генерувати зображення, що відрізняє Midjourney від більшості конкуруючих рішень, які часто пропонують, принаймні, кілька безкоштовних генерацій зображень.

Тим не менш, використання Midjourney надзвичайно просте та доступне для будь-кого, оскільки вартість не є надто високою, а отримані результати можуть бути справді приголомшливими.

Також цікаво: Сучасна артилерія – суперзброя України. І до чого тут Ілон Маск?

Історія походження Midjourney

На відміну від DALL-E, який підтримує розробник Chat GPT, Midjourney описує себе як самофінансований і незалежний проект. Сервіс був заснований Девідом Хольцом, який також є співзасновником Leap Motion, відомого стартапу у просторі віртуальної та доповненої реальності, який був придбаний компанією UltraHaptics у 2019 році.

Команда Midjourney включає видатних діячів, таких як Джим Келлер (інженер процесорів Apple, AMD, Tesla, Intel і співавтор x86-64), Нат Фрідман (генеральний директор Github і голова GNOME Foundation) і Філіп Роздейл (засновник Second Life).

Розробка штучним інтелектом тексту та зображень Midjourney почалася в закритій бета-версії, яка потім була перенесена у відкриту бета-версію у липні 2022 року. Це дозволило громадськості отримати доступ до інструменту та використовувати його. Саме такий хід допоміг сервісу Midjourney набути популярності. На відміну від інших інструментів штучного інтелекту, Midjourney був прибутковим ще в серпні 2022 року, що підтвердило його успіх на ринку.

Також цікаво: ChatGPT: Проста інструкція з використання

Як користуватися Midjourney?

Використання Midjourney спочатку може видатися дещо складним. Тим більше, що творці зважилися на незвичайне рішення. А саме, замість спеціального застосунку для генерації зображень ми отримуємо посилання на бота Discord під назвою Midjourney Bot. Отже, давайте розглянемо всі кроки, які потрібно виконати, щоб створити графіку за допомогою інструмента Midjourney.

Зареєструйтесь на Discord

Щоб почати свою роботу з Midjourney, ви повинні мати обліковий запис Discord. Discord — це програма для чату, дещо схожа на Slack. Хоча спочатку він був розроблений для гравців, яким потрібно скоординувати тактику під час гри в багатокористувацькі онлайн-ігри, такі як League of Legends і World of Warcraft, але зараз він надзвичайно популярний і серед інших спільнот.

Отже, як ви вже зрозуміли, перш ніж користуватися Midjourney, потрібно створити обліковий запис Discord. Це безкоштовно. Відвідайте сторінку Discord, щоб зареєструватися. Там пройдіть усі кроки відповідно до інструкцій, які з’являться. Якщо у вас уже є, або ви щойно створили, обліковий запис Discord, ви можете перейти до наступного кроку.

Зареєструйтесь на Midjourney

Налаштувавши обліковий запис Discord, перейдіть до Midjourney і натисніть “Приєднатися до бета-версії”. Відкриється запрошення приєднатися до каналу Midjourney Discord. Натисніть “Прийняти запрошення”.

Як вільний учасник ви не зможете створювати зображення, але можете переглядати інтерфейс. Ви також можете побачити творіння інших користувачів, відвідуючи різні кімнати (під назвою #newbies-14 і #newbies-21), щоб зрозуміти, як працює Midjourney.

Підписка на Midjourney

Щоб почати генерувати зображення за допомогою Midjourney, вам потрібно придбати підписку. Для цього відвідайте Midjourney.com/account, увійдіть за допомогою підтвердженого облікового запису Discord і виберіть план підписки, який відповідає вашим потребам. Про ціни індивідуальних планів ми напишемо далі в тексті.

Приєднайтеся до сервера Midjourney Discord

Після того, як ви приєдналися до сервера Midjourney Discord і підписалися на план, ви можете почати генерувати зображення. Виконайте такі дії:

  • Відкрийте Discord і переконайтеся, що ви вибрали сервер Midjourney у меню ліворуч.
  • Ви повинні побачити довгий список каналів у лівій частині екрана.
  • Виберіть один із каналів, який починається на “новачки”. Можливо, вам доведеться прокрутити список вниз, щоб знайти його.
  • Ви можете прокручувати стрічку, щоб побачити, які підказки використовували інші користувачі для створення зображень.

Як генерувати команди

У каналі для початківців або у вашому власному каналі введіть “/imagine”, а потім текст інструкції. Щоб почати приватний чат із ботом, знайдіть значок Midjourney Bot у списку користувачів у правій частині екрана. Клацніть по ньому правою кнопкою миші та виберіть “Надіслати повідомлення” або “Повідомлення”.

Будьте якомога більш конкретними в описанні, щоб надати ШІ достатньо інформації для створення потрібного зображення. Наприклад, ви можете включити такі деталі, як стиль, жанр, настрій та інші елементи, щоб допомогти ШІ створити образ, який ви уявляєте. Про це ви прочитаєте далі в тексті.

Також цікаво: Що таке нейронні мережі і як вони працюють

Як створити ефективні підказки в Midjourney

Кожен, хто користувався Midjourney, знає, що чим краще ви опишете зображення, яке хочете отримати, тим яскравішим і унікальнішим буде результат. Користувачі зазвичай використовують короткі та прямі підказки. Наприклад, після надання простої інструкції на кшталт “робот використовує ШІ для створення графіки”, Midjourney створить, серед іншого, щось схоже на це:

the image is created Midjourney

Як бачите, таких простих інструкцій недостатньо (або, принаймні, не завжди) для отримання бажаних результатів, тому ключем до успіху є написання ідеальної пояснювальної підказки.

Вам подобається стиль того чи іншого митця? Хочете, щоб ваша графіка була виконана в стилі іншої епохи? Або є конкретна техніка, яку ви хочете використовувати генератором зображень? Всього цього можна досягти. Штучний інтелект — це навчена система, яка має незліченну кількість вихідних зображень для створення з них ідеальної графіки. Єдине, про що вам потрібно подбати, це надати штучному інтелекту якнайкращий опис того, що ви від нього очікуєте. Але як це зробити? На щастя, ми знаємо цю відповідь.

Пунктуація

Більшість розділових знаків, які ви використовуєте в підказках, не буде враховуватися Midjourney. Єдина пунктуація, яку розуміє Midjourney, це:

  • Параметри розділяються подвійними дефісами, наприклад «–ar 16:9» або «–v 5».
  • Подвійна двокрапка відокремлює цілі числа, як додатні, так і від’ємні. Наприклад, “::-0.5”.
  • Пробіли слугують основним символом, що розділяє лексичні елементи.

Структурування підказок Midjourney

Насамперед, пам’ятайте, що у Midjourney підказки мають бути написані англійською мовою, тоді програма їх найкраще зрозуміє. Кожне запрошення починається з команди /imagine та має містити опис того, що ви хочете отримати. Добре надати вашим підказкам деяку структуру. Це не є необхідним, але, безумовно, дуже корисно, щоб отримати бажану графіку якнайшвидше і легко змінити її за необхідності.

У першу частину опису включіть всі елементи, які найкраще описують ваше зображення. Наприклад, ви можете попросити Midjourney наслідувати певний художній стиль, запропонувавши взяти його за основу. Ось приклад: «Зображення слона у стилі Ван Гога»:

the image is created Midjourney

Однак, що дійсно цікаво в Midjourney, то це його здатність відтворювати зображення, схожі на фотографії. Для цього потрібно враховувати кілька речей. Наприклад, ви можете вибрати тип камери, яку повинен емулювати ШІ: SLR для плівкових камер та DSLR для DSLR-камер. Ви також можете запропонувати тип об’єктива (18, 35, 50 або навіть 250 мм) та конкретну модель камери.

Потім можна зробити додаткові команди. Їм має передувати знак «–», і вони дозволяють спрямовувати штучний інтелект на певні аспекти, наприклад, щодо версії Midjourney (v 4, v 5), формату зображення (3:2, 16:9 тощо) або параметри стилю (s 100 для середнього, p 250 для високого або p 750 для дуже високого). Низькі значення параметра стилю створюють зображення, які точно відповідають підказці, але менш художні. Високі значення створюють набагато більш художню графіку, але менш пов’язану із підказкою.

Повний список параметрів і команд доступний на вебсайті Midjourney.

Ось як виглядає приклад підказки та отримана графіка:

image of a sweet little mouse lying on the beach. Photo with a Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750

(зображення милого мишенятка, що лежить на пляжі. Фото з Canon R5, 50 мм, DSLR, –v 5 –ar 3:2 –s 750)

the image is created Midjourney
the image is created Midjourney

Освітлення, оточення, ракурс – продумайте кожну деталь

Щоб надати вашим фотографіям контекст, помістіть об’єкти, які ви придумали, у певне середовище. Midjourney дозволяє зробити неймовірні сцени ультрареалістичними. Можливо, ви захочете помістити персонажа в будинок, оформлений у певному стилі, на пляж, чи на вулиці певного міста.

Ще один аспект, на який варто звернути увагу, оскільки він приносить чудові ефекти, – це світло. Нікого не потрібно переконувати, наскільки це важливо при фотографуванні. Те саме стосується і графіки ШІ, яка часто дуже нагадує реальні фотографії.

Залежно від часу доби освітлення неоднакове. Тому кольори та контрасти на фотографіях різні. Midjourney здатний відтворити ці контрасти. Наприклад, вам більше не доведеться чекати на захід сонця, просто попросіть створити конкретну фотографію, додавши слово “золота година” (“golden hour”).

Іншим фактором, з яким ви можете пограти, є кут огляду зображення. У деяких випадках для цього необхідно налаштувати оптику, це може суттєво змінити вашу графіку.

Ось кілька прикладів кутів огляду, які можна включити в підказки Midjourney: для віддалених знімків – ширококутний знімок, надширококутний знімок, далекий знімок, вид з повітря або супутника, знімок на рівні очей; близький – Up, Glamour Portrait, Macro-Shot або Macrophotography.

Ось приклад запиту та його результат:

a handsome man walking the streets of Los Angeles, golden hour Photo with a Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750

(красивий чоловік, що йде вулицями Лос-Анджелеса, золота година Фото на Canon R5, 50 мм, DSLR, –v 5 –ar 3:2 –s 750)

the image is created Midjourney

Редагувати зображення за допомогою масштабування та дисперсії

Під кожним набором згенерованих зображень ви побачите вісім кнопок: U1, U2, U3, U4, V1, V2, V3 і V4. Усі ці кнопки дозволяють точно налаштовувати та краще контролювати тип зображень із Midjourney.

Якщо ви використовуєте версію, ранішу за V5, кнопки U використовуватимуться для підвищення масштабу, тобто зміни розміру оригінального зображення, створюючи нову, більшу версію з додатковими деталями. Вони пронумеровані U1–U4, які використовуються для ідентифікації зображень у послідовності. Наприклад, якщо ви хочете масштабувати друге зображення, натисніть кнопку U2 у верхньому рядку. Останні моделі за умовчанням створюють зображення розміром 1024×1024 пікселів, тому кнопки U просто виділяють їх для подальшого редагування та легшого збереження.

Праворуч у першому рядку є кнопка Re-roll. Це чудовий інструмент, якщо ви не задоволені першим набором зображень, створених для вас Midjourney. Натисніть цю кнопку повторного створення, щоб попросити Midjourney спробувати іншу концепцію на основі оригінального запиту, і ви отримаєте чотири нові зображення.

Кнопки V створюють чотири нові варіації вибраного зображення, які відповідають їм за стилем і композицією. Вибираючи між V1 – V4, ви можете вибрати кнопку, що відповідає зображенню, для якого ви хочете створити варіації.

І останнє, але не менш важливе: функція /describe

Насамкінець я залишив чудову команду, яка значно полегшить вам створення ідеальної підказки. Це функція /describe, яка дозволяє вам завантажити власне зображення та згенерувати чотири можливі запити на основі цього зображення. Як це працює? Після введення /describe з’явиться вікно вибору фотографії з диска комп’ютера. Виберіть відповідний графічний файл, завантажте його на сервер, і Midjourney запропонує вам 4 текстові пропозиції з його описом. Нижче наведено опис надісланої мною фотографії:

Як ви можете бачити на скріншоті вище, для кожного з чотирьох наведених описів будуть кнопки, що дозволяють використовувати підказку, згенеровану Midjourney. Після вибору зображення з’являється текстове вікно з вибраним описом. На цьому етапі ви можете вирішити, чи ви хочете редагувати текст, чи залишити його в тому вигляді, в якому він був створений.

Якщо ви хочете отримати найкращі результати, пропоную максимально розширити опис і просто взяти за основу текст, створений програмою. Після натискання кнопки “Надіслати” просто прийміть запрошення і надішліть його до Midjourney. Через деякий час ви отримаєте відповідь з прикладами зображень:

the image is created Midjourney

Для порівняння – нижче фото, яке я завантажив як приклад, і фото, яке я вибрав із представлених пропозицій:

Original image
the image is created Midjourney

Читайте також: Про квантові комп’ютери простими словами

Скільки коштує Midjourney? Чи можна використовувати безкоштовно?

Хоча ми звикли, що такі чат-боти, як ChatGPT і Bing Chat, пропонують майже необмежене безкоштовне використання, чого не можна сказати про генератори зображень. Практично всі вони мають деякі обмеження, а Midjourney більше не є безкоштовним, за винятком кількох коротких акційних періодів.

Коли послугу вперше запустили в липні 2022 року, будь-хто міг використовувати її для безкоштовного створення 25 зображень. Все, що вам потрібно було зробити, це створити безкоштовний обліковий запис Discord і приєднатися до сервера Midjourney. Безкоштовна пробна версія активувалась одразу після надсилання першого запиту. Однак, коли ви досягали ліміту у 25 зображень, вам треба було перейти на платний план.

Усе змінилося у квітні 2023 року, коли генеральний директор Midjourney оголосив про призупинення програми безкоштовного ознайомлення. За останній рік Midjourney став дуже популярним, і користувачі охоче діляться створеною ними графікою в соціальних мережах. Чому ж творці зважилися на такий крок?

Рішення відмовитися від безкоштовної версії легко зрозуміти. Кожне завдання створення зображення вимагає великої обчислювальної потужності, особливо графічних процесорів (GPU). Крім того, кожен графічний процесор має обмежену відеопам’ять, яка використовується у великих обсягах для процесу усунення шумів.

Точніше, генератори зображень використовують енергоємні графічні процесори, які не тільки коштують багато грошей, але й існують лише в обмеженій кількості. Тому, щоб зберегти якість послуг, компанія припинила безкоштовний пробний період до подальшого повідомлення, що нікого не повинно дивувати.

Але безкоштовний пробний доступ колись може повернутися. Наприклад, із запуском версії 5.1 Midjourney повернув безкоштовну пробну версію на один вихідний.

Однак, щоб використовувати Midjourney у будь-який час, вам необхідно придбати один із чотирьох планів передплати. Найнижча вартість – $10 на місяць. Що ви отримуєте натомість? У середньому Midjourney створює нове зображення за одну хвилину. Однак, можливо, доведеться витратити трохи більше часу, якщо ви хочете зображення зі зміненим розміром або зображення з неквадратним співвідношенням сторін. Таким чином, ми можемо припустити, що базовий, найдешевший план Basic дає 3,3 години часу графічного процесора, чого достатньо для створення приблизно 200 генерацій зображень.

З кожною вищою передплатою ви отримуєте більший ліміт, який дозволяє створювати більше зображень протягом місяця. Отже, наступний план, Standard, передбачає 15 годин генерації зображень у швидкому режимі та необмежену кількість повільніших генерацій (режим Relax) за $30 на місяць. Далі слідує план Pro, який коштує $60 на місяць і забезпечує 30 годин швидкого створення зображень, необмежене створення повільніших зображень та прихований режим.

У липні 2023 року було додано план Mega, який коштує $120 і дає 60 годин швидкої генерації зображень і, звичайно ж, необмежену кількість годин у режимі Relax.

Як бачите, усі плани Midjourney вищого рівня пропонують необмежену кількість фотографій у режимі Relax, але вам потрібно чекати до 10 хвилин, щоб отримати зображення.

Найнижчий рівень не має цієї функції, але він коштує $10 на місяць, тому варто розпочати свою подорож Midjourney саме з нього. Цей план дозволяє досліджувати платформу, створювати зображення та знайомитися з інтерфейсом і тим, як працюють текстові пропозиції. Якщо вам подобається те, що ви бачите, то завжди можете перейти на наступний рівень, просто ввівши підказку /subscribe, щоб перейти до свого облікового запису, де можете легко оновити свій інструмент Midjourney.

Також варто пам’ятати, що Midjourney інколи проводить акції і пропонує річні плани зі знижкою 20%:

  • Базовий план із річною передплатою – $8 на місяць
  • Стандартний план із річною передплатою – $24 на місяць
  • План Pro з річною передплатою – $48 на місяць
  • План Mega з річною передплатою – $96 на місяць.

Midjourney та права власності

Генератори зображень штучного інтелекту навчаються на мільярдах зображень фотографів і художників. Midjourney не виняток. Багато митців вважають, що генератори зображень зі штучним інтелектом порушують авторські права, використовуючи їхні роботи в навчальних цілях. Деякі художники навіть подали скарги в Сполучених Штатах на генератори штучного інтелекту, такі як Midjourney, Stability AI і DeviantArt. Однак інша сторона стверджує, що процес навчання підпадає під категорію добросовісного використання. Отже, хто є фактичним власником створеного штучним інтелектом зображення?

Засновник Midjourney Девід Хольц зізнався в інтерв’ю Forbes, що використовує зображення без згоди власників, оскільки це практично неможливо з таким величезним набором даних.

Отже, ми знаємо, що ці зображення отримані без авторського права, але чи може створена вами графіка підлягати авторському праву? Відповідь непроста, але загалом можна сказати, що художники ШІ можуть використовувати, навіть комерційно, зображення, створені Midjourney, але не можуть заборонити іншим використовувати їх.

Читайте також: 7 найкрутіших варіантів використання ChatGPT

Альтернативи Midjourney

DALL-E

DALL-E це перший генеративний штучний інтелект, який став дуже популярним у соціальних мережах. Спочатку, коли він був запущений у 2021 році, створена графіка залишала бажати кращого. Однак остання версія, DALL-E 2, завдяки кращому розумінню мови та вищій якості зображення, є вже зовсім іншим рівнем. DALL-E також може редагувати існуючі зображення, дозволяючи замінювати або додавати повністю нові об’єкти.

Bing Image Creator

Якщо вам потрібна безкоштовна альтернатива Midjourney, ви можете вибрати Bing Image Creator. Bing Image Creator вбудовано в бічну панель Microsoft Edge, тому ви можете отримати доступ до нього під час використання браузера. Завдяки партнерству Microsoft з OpenAI ви можете безкоштовно використовувати генератор зображень DALL-E 2 через Bing.

DreamStudio

Наразі Midjourney працює лише через Discord, який може бути не дуже інтуїтивним у використанні. DreamStudio, з іншого боку, пропонує багатий вебсайт із великою кількістю кнопок і ручок, які можна налаштувати, але це може здаватися досить складним. DreamStudio використовує відкриту модель Stable Diffusion.

Sam Stable Diffusion — це безкоштовне програмне забезпечення з відкритим вихідним кодом, яке можна встановити та запустити на своєму комп’ютері. Однак це вимагає певних знань програмування та значної обчислювальної потужності. З цієї причини Stability AI, компанія, відповідальна за цю модель, створила платформу під назвою DreamStudio. Подібно до моделі Midjourney, Stable Diffusion створює чотири різні зображення на основі однієї команди (підказки). Потім користувач може змінювати їх або використовувати як основу для створення нової графіки. Також можна тонко відкалібрувати модель, щоб зображення, які вона генерує, більш узгоджувалися із запитом користувача, або може використовуватися більше кроків обчислення, що може призвести до більш точного результату.

Чи вартий Midjourney вашої уваги?

Midjourney відомий тим, що створює добре структуровані, визначені та реалістичні зображення, що робить його сильним конкурентом серед інших інструментів AI, таких як DALL-E та Stable Diffusion.

Цей інструмент може створювати зображення з роздільною здатністю до 1792×1024 пікселів, що забезпечує більшу деталізацію зображень.

Midjourney працює через Discord, широко використовувану платформу для спілкування. Користувачі можуть взаємодіяти з ботом ШI за допомогою простих команд, що робить його доступним навіть для людей без досвіду програмування. Хоча одночасно це один з його недоліків, бо прив’язаний тільки до платформи Discord. Не всім це сподобається. Особисто для мене, простіше було встановити окремо застосунок Midjourney.

the image is created Midjourney

Хоча розробники запевняють, що саме сервер Midjourney Discord забезпечує активну спільноту, де користувачі можуть ділитися своїми творіннями, ставити запитання та отримувати допомогу як від інших користувачів, так і від команди Midjourney.

Мені не сподобалося, що згенеровані зображення є загальнодоступними. Тобто, зображення, які ви створюєте за допомогою Midjourney, не належать вам. Ви можете використовувати їх (з обмеженнями), навіть комерційно, але вони також можуть використовуватися цілком законно іншими користувачами. Midjourney навіть відображає найуспішніші творіння, включаючи текстові підказки, на власному вебсайті.

Команда Midjourney постійно працює над покращенням і розширенням можливостей штучного інтелекту, гарантуючи, що інструмент залишається актуальним у середовищі ШІ, що постійно розвивається. Саме тому інструмент і не має безкоштовної версії. Це може не сподобатись багатьом потенційним користувачам, але $10 варті того, щоб власноруч генерувати “справжні” шедеври за допомогою Midjourney.

Цікаво також: 

Share
Yuri Svitlyk

Син Карпатських гір, невизнаний геній математики, "адвокат "Microsoft, практичний альтруїст, лівоправосек

Leave a Reply

Your email address will not be published. Required fields are marked*

View Comments

  • Puikus straipsnis! :) Užsisakiau standartinį MJ planą. Ar aš gerai suprantu, kad galėsiu per mėnesį panaudoti tik 10 savo nuotraukų ir internete rastų nuotraukų kuriant vizualus?

    Cancel reply

    Leave a Reply

    Your email address will not be published. Required fields are marked*