Root Nation柔らかいサービスのレビューMidjourney レビュー: AI 生成画像の作成

Midjourney レビュー: AI 生成画像の作成

-

あなたの想像上の画像を紙に簡単に転写したいと夢見たことがありますか? Midjourney のような画像ジェネレーターのおかげで、これが可能になりました。

才能のあるアーティストでも、ブラシの経験がまったくなくても、今すぐ傑作を作成できます。 つまり、人工知能のおかげで、これまで頭の中にだけ残っていたイメージを数分で作成できるのです。 言葉で説明するだけで、すぐに写真が完成します。 これもすべて興味深いサービスのおかげです ミッドジャーニー、人工知能によって生成された画像を作成します。 興味をそそられましたか? 次に、Midjourney とは何なのか、どのように機能するのか、そしてこの人工知能ツールに関する最も重要な情報をすべて詳しく調べることをお勧めします。

また読む: Bingのチャットボットをテストしてインタビューしました

ミッドジャーニー: それは何ですか?

鮮やかなジャケットを着たフランシスコ教皇からウェス・アンダーソンにインスピレーションを得た映画ポスターに至るまで、AI が生成した画像はインターネット上でますます一般的になりつつあります。 その理由は簡単にわかります。最新の AI ツールは非常に説得力があり、そこで作成された写真は権威ある写真賞を受賞することさえあります。

ミッドジャーニー

Midjourney は、テキストの指示に基づいてグラフィックを作成できる生成人工知能の一例です。 これは、最近登場した数多くの機械学習ベースの画像ジェネレーターの つにすぎません。 それにもかかわらず、Midjourney は、DALL-E や Stable Diffusion と並んで、この種の AI ツールとしては最大かつ最も人気のあるツールの つになりました。

Midjourney は Discord チャット アプリを通じて機能するため、特別なハードウェアやソフトウェアは必要ありません。 唯一の欠点は? そうです。 画像の生成を開始するには一定の金額を支払う必要があるという点が、Midjourney を、少なくともある程度の無料の画像生成を提供するほとんどの競合ソリューションと区別している点です。

ただし、Midjourney の使用は非常に簡単で、コストもそれほど高くなく、得られる結果は本当に驚くべきものであるため、誰でもアクセスできます。

また興味深い: 現代の大砲はウクライナの超兵器です。 なぜイーロン・マスクがここに?

ミッドジャーニーの起源の物語

Chat 開発者の GPT の支援を受けている DALL-E とは異なり、Midjourney は自己資金による独立したプロジェクトであると説明しています。 このサービスは、2019 年に UltraHaptics に買収された有名な仮想現実および拡張現実のスタートアップである Leap Motion の共同創設者でもある David Holtz によって設立されました。

- 広告 ​​-

ミッドジャーニー

Midjourney チームには、ジム ケラー (プロセッサ エンジニア) などの著名人が含まれています。 Apple、AMD、Tesla、Intel、x86-64 の共著者)、Nat Friedman (Github の CEO および GNOME Foundation 会長)、Philip Rosedale (Second Life の創設者)。

ミッドジャーニー

Midjourney のテキストと画像の AI 開発はクローズド ベータ版で始まり、2022 年 2022 月にオープン ベータ版に移行しました。 これにより、一般の人がツールにアクセスして使用できるようになりました。 この動きにより、Midjourney サービスの人気が高まりました。 他の AI ツールとは異なり、Midjourney は 年 月にはすでに利益を上げており、市場での成功が裏付けられています。

また興味深い: ChatGPT: 簡単な使用方法

ミッドジャーニーの使い方は?

Midjourney を使用するのは、最初は少し面倒に思えるかもしれません。 特にクリエイターが異例の決定を下したので。 つまり、画像を生成するための専用アプリケーションの代わりに、Midjourney Bot と呼ばれる Discord ボットへのリンクを取得します。 それでは、Midjourney ツールを使用してグラフィックを作成するために必要なすべての手順を見てみましょう。

Discordにサインアップする

Midjourney を始めるには、Discord アカウントが必要です。 Discord は Slack に似たチャット アプリです。 元々は、League of Legends や World of Warcraft などのマルチプレイヤー オンライン ゲームをプレイする際に戦術を調整する必要があるプレイヤーのために開発されましたが、現在では他のコミュニティでも非常に人気があります。

ご覧のとおり、Midjourney を使用する前に、Discord アカウントを作成する必要があります。 これは無料。 Discord ページにアクセスしてサインアップしてください。 そこで、表示される指示に従ってすべての手順を実行します。 Discord アカウントをすでに持っている場合、または作成したばかりの場合は、次のステップに進んでください。

ミッドジャーニーに登録する

Discord アカウントを設定したら、Midjourney に移動し、「ベータに参加」をクリックします。 Midjourney Discord チャンネルへの招待が開きます。 「招待を受け入れる」をクリックします。

無料会員では画像の作成はできませんが、インターフェースの閲覧は可能です。 また、Midjourney の仕組みを理解するために、さまざまなルーム (#newbies-14 および #newbies-21 という名前) にアクセスして他のユーザーの作品を確認することもできます。

ミッドジャーニーを購読する

Midjourney でイメージの生成を開始するには、サブスクリプションを購入する必要があります。 これを行うには、にアクセスしてください Midjourney.com/アカウント, 認証済みの Discord アカウントでサインインし、ニーズに合ったサブスクリプション プランを選択します。 各プランの料金については本文後半で書きます。

Midjourney Discord サーバーに参加する

Midjourney Discord サーバーに参加し、プランに加入したら、画像の生成を開始できます。 次の手順を実行します:

  • Discordを開き、左側のメニューでMidjourneyサーバーを選択していることを確認してください。
  • 画面の左側にチャンネルの長いリストが表示されます。
  • 「初心者」で始まるチャンネルのいずれかを選択してください。 リストを下にスクロールして見つける必要がある場合があります。
  • フィードをスクロールすると、他のユーザーが画像を作成するために使用したヒントを確認できます。

コマンドの生成方法

初心者チャンネルまたは自分のチャンネルで、「/imagine」と入力し、続いて説明テキストを入力します。 ボットとのプライベート チャットを開始するには、画面の右側にあるユーザーのリストで Midjourney Bot アイコンを探します。 それを右クリックし、「メッセージの送信」または「メッセージ」を選択します。

希望の画像を作成するために AI に十分な情報を提供できるよう、説明はできるだけ具体的にしてください。 たとえば、スタイル、ジャンル、雰囲気、その他の要素などの詳細を含めて、AI が思い描いた外観を作成できるようにすることができます。 これについては本文の後半で説明します。

また興味深い: ニューラル ネットワークとは何ですか?また、どのように機能するのでしょうか?

- 広告 ​​-

Midjourney で効果的なプロンプトを作成する方法

Midjourney を使用したことがある人なら誰でも、得たいイメージをより適切に表現すればするほど、結果がより明るくユニークになることを知っています。 ユーザーは通常、短く直接的なプロンプトを使用します。 たとえば、「ロボットは AI を使用してグラフィックを作成します」などの簡単な指示を与えると、Midjourney は次のようなものを作成します。

画像は旅の途中で作成されます
画像は旅の途中で作成されます

ご覧のとおり、このような単純な指示だけでは望ましい結果を得るには十分ではありません (少なくとも常にではありません)。そのため、成功の鍵は完璧な説明ツールチップを作成することです。

このアーティストまたはあのアーティストのスタイルが好きですか? あなたのグラフィックを別の時代のスタイルで作成したいですか? それとも、画像ジェネレーターに使用してほしい特定のテクニックはありますか? これらはすべて達成可能です。 人工知能は、無数の入力画像を取得してそこから完璧なグラフィックを作成する、訓練されたシステムです。 注意する必要がある唯一のことは、AI に期待される動作について可能な限り最善の説明を AI に与えることです。 しかし、どうやってそれを行うのでしょうか? 幸いなことに、私たちは答えを知っています。

句読点

ヒントで使用する句読点のほとんどは、Midjourney では無視されます。 Midjourney が理解できる唯一の句読点は次のとおりです。

  • オプションは「-ar 16:9」や「-v 5」のように二重ハイフンで区切られます。
  • 二重コロンは、正と負の両方の整数を区切ります。 たとえば、「::-0.5」などです。
  • スペースは、語彙項目を区切る主な記号として機能します。

ミッドジャーニープロンプトの構造化

まず第一に、Midjourney ではプロンプトは英語で書かれなければならないことを覚えておいてください。そうすれば、プログラムがプロンプトを最もよく理解できるようになります。 各招待状はコマンド /imagine で始まり、受け取りたいものの説明が含まれている必要があります。 プロンプトに何らかの構造を与えると良いでしょう。 必須ではありませんが、必要なグラフィックをできるだけ早く入手し、必要に応じて簡単に変更できると非常に便利です。

説明の最初の部分には、画像を最もよく説明するすべての要素を含めてください。 たとえば、Midjourney に特定のアート スタイルに従うように依頼し、それをベースとして採用することを申し出ることができます。 以下に例を示します。「ゴッホ風の象の画像」:

画像は旅の途中で作成されます
画像は旅の途中で作成されます

しかし、Midjourney で本当に興味深いのは、写真のような画像を再現できることです。 これには考慮すべきことがいくつかあります。 たとえば、AI がエミュレートするカメラの種類を選択できます。フィルム カメラの場合は SLR、DSLR カメラの場合は DSLR です。 レンズの種類 (18、35、50、さらには 250mm) や特定のカメラのモデルを提案することもできます。

その後、追加のコマンドを作成できます。 これらの前に「-」記号を付ける必要があります。これにより、Midjourney バージョン (v 4、v 5)、アスペクト比 (3:2、16:9 など)、またはスタイル オプション (中程度の場合は s 100、高レベルの場合は p 250、または非常に高い場合は p 750)。 スタイル オプションの値を低くすると、ツールチップによく似た画像が生成されますが、芸術性が低くなります。 値を高くすると、より芸術的なグラフィックが作成されますが、ツールチップとの関連性は低くなります。

オプションとコマンドの完全なリストは、Midjourney Web サイトで入手できます。

プロンプトとその結果のグラフィックの例を次に示します。

ビーチに横たわっているかわいいネズミのイメージ。 Canon R5、50mm、DSLR、-v 5 -ar 3:2 -s 750 での写真

(ビーチに横たわるかわいいネズミの画像。Canon R5、50 mm、DSLR、-v 5 -ar 3:2 -s 750 で撮影)

照明、環境、遠近感 - 細部まで考え抜く

写真にコンテキストを与えるには、思いついたオブジェクトを特定の環境に配置します。 Midjourney を使用すると、信じられないほどのシーンを超現実的に作成できます。 特定のスタイルで装飾された家、ビーチ、または特定の都市の通りにキャラクターを配置したい場合があります。

大きな効果をもたらすもう一つの注目すべき点は光です。 写真を撮るときにこれがどれほど重要であるかを誰も理解する必要はありません。 AI グラフィックスについても同様で、多くの場合、実際の写真に非常に似ています。

時間帯によって光り方が違います。 そのため、写真の色やコントラストが異なります。 Midjourney ではこれらのコントラストを再現できます。 たとえば、日没を待つ必要はもうありません。「ゴールデンアワー」という単語を追加して特定の写真を作成するように依頼するだけです。

調整できるもう つの要素は、画像の視野角です。 場合によっては、これに合わせて光学系を調整する必要があり、グラフィックスが大幅に変化する可能性があります。

Midjourney プロンプトに含めることができる角度の例をいくつか示します。 遠距離ショット、広角ショット、超広角ショット、ロングショット、航空写真または衛星ビュー、アイレベル ショット。 クローズアップ – アップ、魅力的なポートレート、マクロショット、またはマクロ写真。

クエリの例とその結果を次に示します。

ゴールデンアワー、ロサンゼルスの通りを歩くハンサムな男性 Canon R5、50 mm、DSLR、–v 5 –ar 3:2 –s 750 での写真

(ロサンゼルスの通りを歩くハンサムな男性、ゴールデンアワー、Canon R5、50mm、DSLR、–v 5 –ar 3:2 –s 750 で撮影)

画像は旅の途中で作成されます
画像は旅の途中で作成されます

スケーリングと分散を使用して画像を編集する

生成された画像の各セットの下には、U1、U2、U3、U4、V1、V2、V3、V4 の つのボタンが表示されます。 これらのボタンをすべて使用すると、Midjourney からの画像の種類を微調整し、より適切に制御できます。

V5 より前のバージョンを使用している場合は、U ボタンを使用してズームインします。つまり、元の画像のサイズを変更して、より詳細な新しい大きなバージョンを作成します。 これらには U1 ~ U4 の番号が付けられており、シーケンス内の画像を識別するために使用されます。 たとえば、2 番目の画像を拡大したい場合は、上段の U1024 ボタンを押します。 最新モデルではデフォルトで 1024× ピクセルの画像が設定されているため、U ボタンを押すだけで画像が強調表示され、後で編集したり簡単に保存したりできます。

行目の右側には Re-roll ボタンがあります。 これは、Midjourney が作成した最初の画像セットに満足できない場合に最適なツールです。 この再作成ボタンをクリックして、Midjourney に元のリクエストに基づいて別のコンセプトを試すよう依頼すると、 つの新しいイメージが得られます。

V ボタンは、スタイルと構成が一致する、選択した画像の 1 つの新しいバリエーションを作成します。 V4~Vの中からバリエーションを作成したい画像に応じたボタンを選択できます。

ミッドジャーニー

そして最後に重要なこと: /describe 関数

最後に、完璧なヒントを簡単に作成できるように、私は素晴らしいチームを残しました。 これは関数です /説明を使用すると、独自の画像をアップロードし、その画像に基づいて つの可能なクエリを生成できます。 どのように機能するのでしょうか? 導入後 /説明 コンピュータのディスクから写真を選択するウィンドウが表示されます。 適切なグラフィック ファイルを選択してサーバーにアップロードすると、Midjourney がそれを説明する 4 つのテキスト候補を提供します。 送った写真の説明は以下の通りです。

ミッドジャーニー

上のスクリーンショットでわかるように、 つの説明のそれぞれに、Midjourney によって生成されたヒントを使用できるボタンがあります。 画像を選択すると、選択した説明が記載されたテキスト ウィンドウが表示されます。 この時点で、テキストを編集するか、作成したままにするかを決定できます。

最良の結果を得たい場合は、可能な限り説明を拡張し、プログラムによって生成されたテキストをベースとして使用することをお勧めします。 [送信] をクリックした後、招待を受け入れて Midjourney に送信するだけです。 しばらくすると、サンプル画像を含む返信が届きます。

画像は旅の途中で作成されます
画像は旅の途中で作成されます

比較のために、例としてアップロードした写真と、提示された提案から選択した写真を以下に示します。

また読む: 量子コンピューターについて簡単に言うと

ミッドジャーニーの料金はいくらですか? 無料で利用できますか?

私たちは、ほぼ無制限に無料で使用できる ChatGPT や Bing Chat などのチャットボットに慣れていますが、画像ジェネレーターの場合はそうではありません。 ほとんどすべてにいくつかの制限があり、Midjourney はいくつかの短いプロモーション期間を除いて無料ではなくなりました。

このサービスが 2022 年 25 月に初めて開始されたとき、誰でもそれを使用して 25 枚の画像を無料で作成できました。 無料の Discord アカウントを作成し、Midjourney サーバーに参加するだけで済みました。 無料試用版は、最初のリクエストを送信した直後にアクティベートされました。 ただし、 枚の画像制限に達すると、有料プランにアップグレードする必要がありました。

ミッドジャーニー

2023 年 月、Midjourney の CEO が無料トライアル プログラムの中止を発表したことで状況が一変しました。 昨年、Midjourney は非常に人気が高まり、ユーザーは作成したグラフィックをソーシャル ネットワーク上で共有することに熱心になりました。 なぜ制作者はそのような措置をとったのでしょうか?

無料版を放棄するという決断は簡単に理解できます。 すべてのイメージング タスクには、大量のコンピューティング能力、特にグラフィックス プロセッシング ユニット (GPU) が必要です。 さらに、各 GPU のビデオ メモリは限られており、ノイズ除去プロセスに大量に使用されます。

具体的には、画像ジェネレーターは電力を大量に消費する GPU を使用しますが、これは多額の費用がかかるだけでなく、数量も限られています。 したがって、サービスの品質を維持するために、同社は追って通知があるまで無料試用期間を停止しましたが、これは誰も驚くべきことではありません。

しかし、いつか無料トライアルが復活するかもしれません。 たとえば、バージョン 5.1 のリリースに伴い、Midjourney では 週間の無料トライアルが復活しました。

ただし、Midjourney をいつでも使用するには、10 つのサブスクリプション プランのいずれかを購入する必要があります。 最低価格は月額 3,3 ドルです。 見返りに何が得られますか? Midjourney は平均して 200 分で新しいイメージを作成します。 ただし、サイズ変更された画像や正方形以外のアスペクト比の画像が必要な場合は、もう少し時間がかかる場合があります。 したがって、最も安価な基本プランでは 時間の GPU 時間が提供され、これは約 の画像生成を生成するのに十分であると想定できます。

サブスクリプションが高くなるほど、制限も大きくなり、15 か月あたりより多くのイメージを作成できるようになります。 そのため、次のプランである Standard では、月額 30 ドルで 60 時間の高速画像生成と無制限の低速生成 (リラックス モード) が提供されます。 次に Pro プランが登場します。これは月額 30 ドルで、 時間の高速イメージング、無制限の低速イメージング、およびステルス モードを提供します。

2023 年 120 月に、Mega プランが追加されました。料金は 60 ドルで、 時間の高速画像生成と、もちろん無制限の時間のリラックス モードが提供されます。

ミッドジャーニー

ご覧のとおり、上位レベルのすべての Midjourney プランでは、リラックス モードで無制限の写真が提供されますが、画像を取得するまでに最大 10 分待つ必要があります。

最下層にはこの機能はありませんが、月額 10 ドルなので、Midjourney の旅を始める価値があります。 このプランでは、プラットフォームを探索し、画像を作成し、インターフェイスとテキストの提案がどのように機能するかを理解することができます。 表示された内容が気に入った場合は、プロンプト /subscribe を入力してアカウントに移動するだけで、いつでも次のレベルに進むことができ、Midjourney ツールを簡単に更新できます。

Midjourney では時々プロモーションを実施し、20% 割引の年間プランを提供していることも覚えておく価値があります。

  • 年間サブスクリプション付きの基本プラン - 月額 8 ドル
  • 年間サブスクリプションの標準プランは月額 24 ドルです
  • 年間サブスクリプション付きのプロ プラン - 月額 48 ドル
  • 年間サブスクリプションのメガ プラン - 月額 96 ドル。

旅の途中と所有権

AI 画像ジェネレーターは、写真家やアーティストからの数十億枚の画像から学習します。 ミッドジャーニーも例外ではありません。 多くのアーティストは、AI 画像ジェネレーターが自分の作品を教育目的で使用することで著作権を侵害していると考えています。 米国では、Midjourney、Stability AI、DeviantArt などの AI ジェネレーターに対して苦情を申し立てたアーティストもいます。 しかし、相手側は、学習プロセスはフェアユースの範疇に入る、と主張している。 では、AI が生成した画像の実際の所有者は誰でしょうか?

Midjourney の創設者である David Holtz は、Forbes とのインタビューで、これほど膨大なデータセットでは事実上不可能であるため、所有者の同意なしに画像を使用していることを認めました。

これらの画像は著作権フリーであることはわかっていますが、作成したグラフィックも著作権の対象になる可能性はありますか? 答えは簡単ではありませんが、一般的に言えば、AI アーティストは、Midjourney によって作成された画像を商用であっても使用できますが、他の人が使用することを妨げることはできません。

また読む: ChatGPTの7つのクールな使い方

旅の途中での代替手段

DALL-E

DALL-E は、ソーシャル ネットワークで非常に人気になった最初の生成人工知能です。 2021 年に発売された当初、作成されたグラフィックスには不満がたくさんありました。 ただし、最新バージョンの DALL-E 2 は、言語の理解が向上し、画質が向上したため、まったく別のレベルになっています。 DALL-E は既存のイメージを編集することもでき、まったく新しいオブジェクトを置き換えたり追加したりできます。

Bing イメージ クリエーター

Midjourney の無料の代替手段が必要な場合は、Bing Image Creator を選択できます。 Bing Image Creator はサイドバーに組み込まれています Microsoft Edgeなので、ブラウザを使用しながらアクセスできます。パートナーシップのおかげで Microsoft OpenAI を使用すると、Bing 経由で DALL-E 2 画像ジェネレーターを無料で使用できます。

ドリームスタジオ

Midjourney は現在、Discord を通じてのみ機能するため、あまり直感的に使用できない可能性があります。 一方、DreamStudio は、カスタマイズするためのボタンやノブがたくさんある豊富な Web サイトを提供していますが、非常に複雑に見えるかもしれません。 DreamStudio はオープンな安定拡散モデルを使用します。

Sam Stable Diffusion は、コンピュータにインストールして実行できる無料のオープンソース ソフトウェアです。 ただし、これにはある程度のプログラミング知識とかなりの計算能力が必要です。 このため、このモデルを担当する会社である Stability AI は、DreamStudio と呼ばれるプラットフォームを作成しました。 Midjourney モデルと同様に、Stable Diffusion は つのコマンド (キュー) に基づいて つの異なる画像を作成します。 ユーザーはそれらを変更したり、新しいグラフィックを作成するための基礎として使用したりできます。 また、生成される画像がユーザーの要求とより一致するようにモデルを微調整したり、より多くの計算ステップを使用して、より正確な結果を得ることができます。

『ミッドジャーニー』は注目に値するでしょうか?

Midjourney は、適切に構造化され、明確でリアルな画像を生成することで知られており、DALL-E や Stable Diffusion などの他の AI ツールに対する強力な競合相手となっています。

このツールは、最大 1792 × 1024 ピクセルの解像度で画像を作成でき、より詳細な画像を提供します。

Midjourney は、広く使用されているコミュニケーション プラットフォームである Discord を利用しています。 ユーザーは簡単なコマンドを使用して AI ボットと対話できるため、プログラミング経験のない人でもアクセスできます。 ただし、これは Discord プラットフォームのみに関連付けられているため、同時に欠点の つでもあります。 誰もが気に入るわけではありません。 個人的には、Midjourney アプリを個別にインストールする方が簡単だと感じました。

画像は旅の途中で作成されます
画像は旅の途中で作成されます

開発者は、ユーザーが自分の作品を共有したり、質問したり、他のユーザーと Midjourney チームの両方から助けを得たりできるアクティブなコミュニティを提供するのは Midjourney Discord サーバーであると保証しています。

生成された画像が公開されるのが気に入らなかった。 つまり、Midjourney で作成した画像はあなたのものではありません。 商用でも (制限付きで) 使用できますが、他のユーザーが完全に合法的に使用することもできます。 Midjourney は、テキスト プロンプトを含む最も成功した作品を自社の Web サイトに掲載しています。

Midjourney チームは、AI 機能の改善と拡張に常に取り組んでおり、進化し続ける AI 環境においてツールが適切であり続けることを保証します。 このため、このツールには無料版がありません。 これは多くの潜在的なユーザーにとって魅力的ではないかもしれませんが、Midjourney で独自の「本物の」傑作を生成するには 10 ドルの価値があります。

また興味深い: 

Yuri Svitlyk
Yuri Svitlyk
カルパティア山脈の息子、知られざる数学の天才、「弁護士」Microsoft、実践的な利他主義者、左右
- 広告 ​​-
サインアップ
について通知する
ゲスト

1 コメント
新しいもの
古いもの 最もポピュラーな
埋め込まれたレビュー
すべてのコメントを表示
ジャスティナ
ジャスティナ
5ヶ月前

素晴らしい記事です! :) Užsisakiau標準MJプラン。 インターネット上に 10 枚の写真を保存して、インターネット上で写真を保存できますか?