Вы когда-нибудь мечтали легко перенести образы из своего воображения на бумагу? Теперь это возможно благодаря генераторам изображений, таким как Midjourney.
Независимо от того, являетесь ли вы талантливым художником или совсем не имеете опыта работы с кистью, теперь вы сможете создавать шедевры. То есть, благодаря искусственному интеллекту, вы можете за несколько минут создавать образы, которые раньше оставались только в вашей голове. Просто опишите их словами и через мгновение картина будет готова. Все это благодаря интересному сервису Midjourney, который создает изображения, сгенерированные искусственным интеллектом. Заинтриговал? Тогда предлагаю более подробно узнать, что такое Midjourney, как он работает, и всю важнейшую информацию об этом инструменте искусственного интеллекта.
Читайте также: Война за спутниковый интернет: Европа бросает вызов Starlink
Midjourney: что это такое?
Изображения, созданные искусственным интеллектом, становятся все более распространенными в Интернете: от Папы Франциска в яркой куртке до постеров фильмов, вдохновленных Уэсом Андерсоном. Легко понять почему – современные инструменты искусственного интеллекта стали настолько убедительными, что фотографии, которые они создают, даже получают престижные фотонаграды.
Midjourney является примером генеративного искусственного интеллекта, который может создавать графику на основе текстовых инструкций. Это лишь один из многих генераторов изображений на основе машинного обучения, которые недавно появились. Несмотря на это, Midjourney стал одним из крупнейших и самых популярных инструментов искусственного интеллекта этого типа, наряду с DALL-E и Stable Diffusion.
Вам не нужно специальное аппаратное или программное обеспечение, чтобы использовать Midjourney, поскольку он работает через приложение чата Discord. Единственный недостаток? Да, он есть. Это необходимость заплатить определенную сумму, чтобы начать генерировать изображения, что отличает Midjourney от большинства конкурирующих решений, которые часто предлагают, по крайней мере, несколько бесплатных генераций изображений.
Тем не менее, использование Midjourney чрезвычайно простое и доступное любому, поскольку стоимость не слишком высока, а полученные результаты могут быть действительно потрясающими.
Читайте также: Зарядная станция ALLPOWERS S1500 (AP-SS-008): Обзор и опыт использования
История происхождения Midjourney
В отличие от DALL-E, который поддерживает разработчик Chat GPT, Midjourney описывает себя как самофинансируемый и независимый проект. Сервис был основан Дэвидом Хольцом, который также является соучредителем Leap Motion, известного стартапа в пространстве виртуальной и дополненной реальности, который был приобретен компанией UltraHaptics в 2019 году.
Команда Midjourney включает выдающихся деятелей, таких как Джим Келлер (инженер процессоров Apple, AMD, Tesla, Intel и соавтор x86-64), Нат Фридман (генеральный директор Github и председатель GNOME Foundation) и Филип Роздейл (основатель Second Life).
Разработка искусственным интеллектом текста и изображений Midjourney началась с закрытой бета-версии, которая затем была перенесена в открытую бета-версию в июле 2022 года. Это позволило общественности получить доступ к инструменту и использовать его. Именно такой ход помог сервису Midjourney приобрести популярность. В отличие от других инструментов искусственного интеллекта, Midjourney стал прибыльным еще в августе 2022 года, что подтвердило его успех на рынке.
Читайте также: Thunderbolt 5 против Thunderbolt 4: все, что нужно знать
Как пользоваться Midjourney?
Использование Midjourney поначалу может показаться несколько сложным. Тем более, что создатели решились на необычное решение. А именно, вместо специального приложения для генерации изображений мы получаем ссылку на бот Discord под названием Midjourney Bot. Итак, давайте рассмотрим все шаги, которые нужно выполнить, чтобы создать графику с помощью инструмента Midjourney.
Зарегистрируйтесь на Discord
Чтобы начать работу с Midjourney, у вас должна быть учетная запись Discord. Discord – это приложение для чата, немного похожее на Slack. Хотя изначально он был разработан для игроков, которым нужно скоординировать тактику во время игры в многопользовательские онлайн-игры, такие как League of Legends и World of Warcraft, но сейчас он чрезвычайно популярен и среди других сообществ.
Итак, как вы уже поняли, прежде чем использовать Midjourney, вам необходимо создать учетную запись Discord. Это бесплатно. Посетите страницу Discord, чтобы зарегистрироваться. Там пройдите все шаги в соответствии с инструкциями, которые появятся. Если у вас уже есть или вы только что создали учетную запись Discord, вы можете перейти к следующему шагу.
Зарегистрируйтесь на Midjourney
Настроив учетную запись Discord, перейдите в Midjourney и нажмите “Присоединиться к бета-версии”. Откроется приглашение присоединиться к каналу Midjourney Discord. Нажмите “Принять приглашение”.
Как свободный участник вы не сможете создавать изображения, но можете просматривать интерфейс. Вы также можете увидеть творения других пользователей, посещая различные комнаты (под названием #newbies-14 и #newbies-21), чтобы понять, как работает Midjourney.
Подписка на Midjourney
Чтобы начать генерировать изображения с помощью Midjourney, вам нужно приобрести подписку. Для этого посетите Midjourney.com/account, войдите с помощью подтвержденной учетной записи Discord и выберите план подписки, который соответствует вашим потребностям. О ценах на индивидуальные планы мы напишем далее в тексте.
Присоединитесь к серверу Midjourney Discord
После того, как вы присоединились к серверу Midjourney Discord и подписались на план, вы можете начать генерировать изображения. Выполните следующие действия:
- Откройте Discord и убедитесь, что вы выбрали сервер Midjourney в меню слева.
- Вы должны увидеть длинный список каналов в левой части экрана.
- Выберите один из каналов, который начинается со слова “новички”. Вам может потребоваться прокрутить список вниз, чтобы найти его.
- Вы можете прокручивать ленту, чтобы увидеть, какие подсказки использовали другие пользователи для создания изображений.
Как генерировать команды
В канале для начинающих или в вашем собственном канале введите “/imagine”, а затем текст инструкции. Чтобы начать приватный чат с ботом, найдите значок Midjourney Bot в списке пользователей в правой части экрана. Щелкните по нему правой кнопкой мыши и выберите “Отправить сообщение” или “Сообщение”.
Будьте как можно более конкретными в описании, чтобы предоставить ИИ достаточно информации для создания нужного изображения. Например, вы можете включить такие детали, как стиль, жанр, настроение и другие элементы, чтобы помочь ИИ создать образ, который вы представляете. Об этом вы прочитаете далее в тексте.
Тоже интересно: Что такое Li-Fi? Новый быстрый беспроводной интернет уже рядом
Как создать эффективные подсказки в Midjourney
Каждый, кто пользовался Midjourney, знает, что чем лучше вы опишете изображение, которое хотите получить, тем ярче и уникальнее будет результат. Пользователи обычно используют короткие и простые подсказки. Например, после предоставления простой инструкции вроде “робот использует ИИ для создания графики”, Midjourney создаст, среди прочего, что-то похожее на это:
Как видите, таких простых инструкций недостаточно (или, по крайней мере, не всегда) для получения желаемых результатов, поэтому ключом к успеху является написание идеальной пояснительной подсказки.
Вам нравится стиль того или иного художника? Хотите, чтобы ваша графика была выполнена в стиле другой эпохи? Или есть конкретная техника, которую вы хотите использовать генератором изображений? Всего этого можно достичь. Искусственный интеллект – это обученная система, которая имеет бесчисленное количество исходных изображений для создания из них идеальной графики. Единственное, о чем вам нужно позаботиться, это предоставить искусственному интеллекту наилучшее описание того, что вы от него ожидаете. Но как это сделать? К счастью, мы знаем этот ответ.
Пунктуация
Большинство знаков препинания, которые вы используете в подсказках, не будут учитываться Midjourney. Единственная пунктуация, которую понимает Midjourney, это:
- Параметры разделяются двойными дефисами, например “–ar 16:9” или “–v 5”.
- Двойное двоеточие отделяет целые числа, как положительные, так и отрицательные. Например, “::-0.5”.
- Пробелы служат основным символом, разделяющим лексические элементы.
Структурирование подсказок Midjourney
Прежде всего, помните, что в Midjourney подсказки должны быть написаны на английском языке, тогда программа их лучше всего поймет. Каждое приглашение начинается с команды /imagine и должно содержать описание того, что вы хотите получить. Хорошо придать вашим подсказкам некоторую структуру. Это не обязательно, но, безусловно, очень полезно, чтобы получить желаемую графику как можно быстрее и легко изменить ее при необходимости.
В первую часть описания включите все элементы, которые лучше всего описывают ваше изображение. Например, вы можете попросить Midjourney подражать определенному художественному стилю, предложив взять его за основу. Вот пример: “Изображение слона в стиле Ван Гога”:
Однако, что действительно интересно в Midjourney, то это его способность воспроизводить изображения, похожие на фотографии. Для этого нужно учитывать несколько вещей. Например, вы можете выбрать тип камеры, которую должен эмулировать ИИ: SLR для пленочных камер и DSLR для DSLR-камер. Вы также можете предложить тип объектива (18, 35, 50 или даже 250 мм) и конкретную модель камеры.
Затем можно сделать дополнительные команды. Им должен предшествовать знак “–“, и они позволяют направлять искусственный интеллект на определенные аспекты, например, относительно версии Midjourney (v 4, v 5), формата изображения (3:2, 16:9 и т. Д.) Или параметров стиля (s 100 для среднего, p 250 для высокого или p 750 для очень высокого). Низкие значения параметра стиля создают изображения, которые точно соответствуют подсказке, но менее художественные. Высокие значения создают гораздо более художественную графику, но менее связанную с подсказкой.
Полный список параметров и команд доступен на вебсайте Midjourney.
Вот как выглядит пример подсказки и полученная графика:
image of a sweet little mouse lying on the beach. Photo with a Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750
(изображение милого мышонка, лежащего на пляже. Фото с Canon R5, 50 мм, DSLR, –v 5 –ar 3:2 -s 750)
Освещение, окружение, ракурс – продумайте каждую деталь
Чтобы придать вашим фотографиям контекст, поместите объекты, которые вы придумали, в определенную среду. Midjourney позволяет сделать невероятные сцены ультрареалистичными. Возможно, вы захотите поместить персонажа в дом, оформленный в определенном стиле, на пляж, или на улицы определенного города.
Еще один аспект, на который стоит обратить внимание, поскольку он приносит замечательные эффекты, – это свет. Никого не нужно убеждать, насколько это важно при фотографировании. То же самое касается и графики ИИ, которая часто очень напоминает реальные фотографии.
В зависимости от времени суток освещенность неодинакова. Поэтому цвета и контрасты на фотографиях разные. Midjourney способен воссоздать эти контрасты. Например, вам больше не придется ждать заката, просто попросите создать конкретную фотографию, добавив слово “золотой час” (“golden hour”).
Другим фактором, с которым вы можете поиграть, является угол обзора изображения. В некоторых случаях для этого необходимо настроить оптику, это может существенно изменить вашу графику.
Вот несколько примеров углов обзора, которые можно включить в подсказки Midjourney: для удаленных снимков – широкоугольный снимок, сверхширокоугольный снимок, дальний снимок, вид с воздуха или спутника, снимок на уровне глаз; близкий – Up, Glamour Portrait, Macro-Shot или Macrophotography.
Вот пример запроса и его результат:
a handsome man walking the streets of Los Angeles, golden hour Photo with a Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750
(красивый мужчина, идущий по улицам Лос-Анджелеса, золотой час Фото на Canon R5, 50 мм, DSLR, –v 5 –ar 3:2 –s 750)
Редактировать изображение с помощью масштабирования и дисперсии
Под каждым набором сгенерированных изображений вы увидите восемь кнопок: U1, U2, U3, U4, V1, V2, V3 и V4. Все эти кнопки позволяют точно настраивать и лучше контролировать тип изображений из Midjourney.
Если вы используете версию, более раннюю, чем V5, кнопки U будут использоваться для увеличения масштаба, то есть изменения размера оригинального изображения, создавая новую, более крупную версию с дополнительными деталями. Они пронумерованы U1-U4, которые используются для идентификации изображений в последовательности. Например, если вы хотите масштабировать второе изображение, нажмите кнопку U2 в верхней строке. Последние модели по умолчанию создают изображения размером 1024×1024 пикселей, поэтому кнопки U просто выделяют их для дальнейшего редактирования и более легкого сохранения.
Справа в первой строке есть кнопка Re-roll. Это отличный инструмент, если вы не удовлетворены первым набором изображений, созданных для вас Midjourney. Нажмите эту кнопку повторного создания, чтобы попросить Midjourney попробовать другую концепцию на основе оригинального запроса, и вы получите четыре новых изображения.
Кнопки V создают четыре новые вариации выбранного изображения, которые соответствуют им по стилю и композиции. Выбирая между V1 – V4, вы можете выбрать кнопку, соответствующую изображению, для которого вы хотите создать вариации.
И последнее, но не менее важное: функция /describe
На самый конец я оставил отличную команду, которая значительно упростит вам создание идеальной подсказки. Это функция /describe, которая позволяет вам загрузить собственное изображение и сгенерировать четыре возможных запроса на основе этого изображения. Как это работает? После ввода /describe появится окно выбора фотографии с диска вашего компьютера. Выберите подходящий графический файл, загрузите его на сервер, и Midjourney предложит вам 4 текстовых предложения с его описанием. Ниже приведено описание отправленной мной фотографии:
Как вы можете видеть на скриншоте выше, для каждого из четырех приведенных описаний есть кнопки, позволяющие использовать подсказку, сгенерированную Midjourney. После выбора изображения появляется текстовое окно с выбранным описанием. На этом этапе вы можете решить, хотите ли вы редактировать текст или оставить его в том виде, в котором он был создан.
Если вы хотите получить наилучшие результаты, предлагаю максимально расширить описание и просто взять за основу текст, созданный программой. После нажатия кнопки “Отправить” просто примите приглашение и отправьте его в Midjourney. Через некоторое время вы получите ответ с примерами изображений:
Для сравнения – ниже фото, которое я загрузил в качестве примера, и фото, которое я выбрал из представленных предложений:
Также интересно: Google Bard AI: все, что вам нужно знать
Сколько стоит Midjourney, можно ли использовать бесплатно?
Хотя мы привыкли, что такие чат-боты, как ChatGPT и Bing Chat, предлагают почти неограниченное бесплатное использование, этого нельзя сказать о генераторах изображений. Практически все они имеют некоторые ограничения, а Midjourney больше не является бесплатным, за исключением нескольких коротких акционных периодов.
Когда услугу впервые запустили в июле 2022 года, любой мог использовать ее для бесплатного создания 25 изображений. Все, что вам нужно было сделать, это создать бесплатную учетную запись Discord и присоединиться к серверу Midjourney. Бесплатная пробная версия активировалась сразу после отправки первого запроса. Однако, когда вы достигали лимита в 25 изображений, вам нужно было перейти уже на платный план.
Все изменилось в апреле 2023 года, когда генеральный директор Midjourney объявил о приостановке программы бесплатного ознакомления. За последний год Midjourney стал очень популярным, и пользователи охотно делятся созданной ими графикой в социальных сетях. Почему же создатели решились на такой шаг?
Решение отказаться от бесплатной версии легко понять. Каждая задача создания изображения требует большой вычислительной мощности, особенно графических процессоров (GPU). Кроме того, каждый графический процессор имеет ограниченную видеопамять, которая используется в больших объемах для процесса устранения шумов.
Точнее, генераторы изображений используют энергоемкие графические процессоры, которые не только стоят много денег, но и существуют только в ограниченном количестве. Поэтому, чтобы сохранить качество услуг, компания прекратила бесплатный пробный период до дальнейшего уведомления, что никого не должно удивлять.
Но бесплатный пробный доступ когда-нибудь может вернуться. Например, с запуском версии 5.1 Midjourney вернул бесплатную пробную версию на один выходной день.
Однако, чтобы использовать Midjourney в любое время, вам необходимо приобрести один из четырех планов подписки. Самая низкая стоимость – $10 в месяц. Что вы получаете взамен? В среднем Midjourney создает новое изображение за одну минуту. Однако, возможно, придется потратить немного больше времени, если вы хотите изображение с измененным размером или изображение с неквадратным соотношением сторон. Таким образом, мы можем предположить, что базовый, самый дешевый план Basic дает 3,3 часа времени графического процессора, чего достаточно для примерно 200 генераций изображений.
С каждой более высокой подпиской вы получаете больший лимит, который позволяет создавать больше изображений в течение месяца. Итак, следующий план, Standard, предусматривает 15 часов генерации изображений в быстром режиме и неограниченное количество более медленных генераций (режим Relax) за $30 в месяц. Далее следует план Pro, который стоит $60 в месяц и обеспечивает 30 часов быстрого создания изображений, неограниченное создание более медленных изображений и скрытый режим.
В июле 2023 года был добавлен план Mega, который стоит $120 и дает 60 часов быстрой генерации изображений и, конечно же, неограниченное количество часов в режиме Relax.
Как видите, все планы Midjourney высшего уровня предлагают неограниченное количество фотографий в режиме Relax, но вам нужно ждать до 10 минут, чтобы получить изображение.
Самый низкий уровень не имеет этой функции, но он стоит $10 в месяц, поэтому стоит начать свое путешествие Midjourney именно с него. Этот план позволяет исследовать платформу, создавать изображения и знакомиться с интерфейсом и тем, как работают текстовые предложения. Если вам нравится то, что вы видите, то всегда можете перейти на следующий уровень, просто введя подсказку /subscribe, чтобы перейти к своей учетной записи, где можете легко обновить свой инструмент Midjourney.
Также стоит помнить, что Midjourney иногда проводит акции и предлагает годовые планы со скидкой 20%:
- Базовый план с годовой подпиской – $8 в месяц
- Стандартный план с годовой подпиской – $24 в месяц
- План Pro с годовой подпиской – $48 в месяц
- План Mega с годовой подпиской – $96 в месяц.
Midjourney и права собственности
Генераторы изображений искусственного интеллекта обучаются на миллиардах изображений фотографов и художников. Midjourney не исключение. Многие художники считают, что генераторы изображений с искусственным интеллектом нарушают авторские права, используя их работы в учебных целях. Некоторые художники даже подали жалобы в Соединенных Штатах на генераторы искусственного интеллекта, такие как Midjourney, Stability AI и DeviantArt. Однако другая сторона утверждает, что процесс обучения подпадает под категорию добросовестного использования. Итак, кто является фактическим владельцем созданного искусственным интеллектом изображения?
Основатель Midjourney Дэвид Хольц признался в интервью Forbes, что использует изображения без согласия владельцев, поскольку это практически невозможно с таким огромным набором данных.
Итак, мы знаем, что эти изображения получены без авторского права, но может ли созданная вами графика подлежать авторскому праву? Ответ непростой, но в целом можно сказать, что художники ИИ могут использовать, даже коммерчески, изображения, созданные Midjourney, но не могут запретить другим использовать их.
Читайте также: Феномен Bluesky: что за сервис и надолго ли?
Альтернативы Midjourney
DALL-E
DALL-E это первый генеративный искусственный интеллект, который стал очень популярным в социальных сетях. Сначала, когда он был запущен в 2021 году, созданная графика оставляла желать лучшего. Однако последняя версия, DALL-E 2, благодаря лучшему пониманию языка и более высокому качеству изображения, является уже совсем другим уровнем. DALL-E также может редактировать существующие изображения, позволяя заменять или добавлять совсем новые объекты.
Bing Image Creator
Если вам нужна бесплатная альтернатива Midjourney, вы можете выбрать Bing Image Creator. Bing Image Creator встроен в боковую панель Microsoft Edge, поэтому вы можете получить доступ к нему во время использования браузера. Благодаря партнерству Microsoft с OpenAI вы можете бесплатно использовать генератор изображений DALL-E 2 через Bing.
DreamStudio
В настоящее время Midjourney работает только через Discord, который может быть не очень интуитивно понятным в использовании. DreamStudio, с другой стороны, предлагает богатый веб-сайт с большим количеством кнопок и ручек, которые можно настроить, но это может показаться довольно сложным. DreamStudio использует открытую модель Stable Diffusion.
Sam Stable Diffusion – это бесплатное программное обеспечение с открытым исходным кодом, которое можно установить и запустить на своем компьютере. Однако это требует определенных знаний программирования и значительной вычислительной мощности. По этой причине Stability AI, компания, ответственная за эту модель, создала платформу под названием DreamStudio. Подобно модели Midjourney, Stable Diffusion создает четыре разных изображения на основе одной команды (подсказки). Затем пользователь может изменять их или использовать как основу для создания новой графики. Также можно тонко откалибровать модель, чтобы изображения, которые она генерирует, лучше согласовывались с запросом пользователя, или может использоваться больше шагов вычисления, что может привести к более точному результату.
Стоит ли Midjourney вашего внимания?
Midjourney известен тем, что создает хорошо структурированные, четкие и реалистичные изображения, что делает его сильным конкурентом среди других инструментов AI, таких как DALL-E и Stable Diffusion.
Этот инструмент может создавать изображения с разрешением до 1792×1024 пикселей, что обеспечивает большую детализацию изображений.
Midjourney работает через Discord, широко используемую платформу для общения. Пользователи могут взаимодействовать с ботом ИИ с помощью простых команд, что делает его доступным даже для людей без опыта программирования. Хотя одновременно это один из его недостатков, так как привязан только к платформе Discord. Не всем это понравится. Лично мне, проще было установить отдельно приложение Midjourney.
Хотя разработчики уверяют, что именно сервер Midjourney Discord обеспечивает активное сообщество, где пользователи могут делиться своими творениями, задавать вопросы и получать помощь как от других пользователей, так и от команды Midjourney.
Мне не понравилось, что сгенерированные изображения являются общедоступными. То есть, изображения, которые вы создаете с помощью Midjourney, не принадлежат вам. Вы можете использовать их (с ограничениями) даже в коммерческих целях, но они также могут вполне законно использоваться другими пользователями. Midjourney даже размещает самые успешные творения, включая текстовые подсказки, на собственном веб-сайте.
Команда Midjourney постоянно работает над улучшением и расширением возможностей искусственного интеллекта, гарантируя, что инструмент остается актуальным в постоянно развивающейся среде ИИ. Именно поэтому инструмент и не имеет бесплатной версии. Это может не понравиться многим потенциальным пользователям, но $10 стоят того, чтобы собственноручно генерировать “настоящие” шедевры с помощью Midjourney.
Читайте также: