Root Nation軟件服務評價中途回顧:創建人工智慧生成的圖像

中途回顧:創建人工智慧生成的圖像

-

您是否曾夢想過輕鬆地將想像中的圖像轉移到紙上? 現在,借助 Midjourney 等圖像生成器,這一切成為可能。

無論您是才華橫溢的藝術家還是根本沒有畫筆經驗,現在您都可以創作傑作。 也就是說,借助人工智慧,您可以在幾分鐘內創建出以前只存在於您腦海中的圖像。 只需用文字描述它們,圖片很快就會準備好。 這一切都歸功於一項有趣的服務 中途,它創建由人工智慧生成的圖像。 有興趣嗎? 然後我建議您更詳細地了解 Midjourney 是什麼、它是如何運作的以及有關此人工智慧工具的所有最重要的資訊。

另請閱讀: 我測試並採訪了 Bing 的聊天機器人

中途:什麼事?

從穿著鮮豔夾克的教宗方濟各到魏斯安德森風格的電影海報,人工智慧生成的圖像在網路上變得越來越普遍。 原因很容易理解——現代人工智慧工具已經變得如此令人信服,它們創作的照片甚至贏得了著名的照片獎。

中途

Midjourney 是生成式人工智慧的一個例子,它可以根據文字指令創建圖形。 這只是最近出現的眾多基於機器學習的圖像生成器之一。 儘管如此,Midjourney 已成為同類中最大、最受歡迎的 AI 工具之一,與 DALL-E 和 Stable Diffusion 並列。

您不需要任何特殊的硬體或軟體來使用 Midjourney,因為它透過 Discord 聊天應用程式運作。 唯一的缺點? 所以他是。 需要支付一定的費用才能開始生成圖像,這使得 Midjourney 與大多數競爭解決方案區分開來,這些解決方案通常至少提供一些免費的圖像生成功能。

然而,使用 Midjourney 非常簡單,任何人都可以使用,因為成本不太高,而且獲得的結果確實令人驚訝。

也很有趣: 現代火砲是烏克蘭的超級武器。 為什麼埃隆馬斯克在這裡?

中途之旅的起源故事

與由 Chat 開發商 GPT 支持的 DALL-E 不同,Midjourney 將自己描述為一個自籌資金的獨立專案。 該服務由 David Holtz 創立,他也是 Leap Motion 的聯合創始人,Leap Motion 是一家著名的虛擬和擴增實境新創公司,於 2019 年被 UltraHaptics 收購。

- 廣告 -

中途

Midjourney 團隊包括 Jim Keller(處理器工程師)等知名人士 Apple、AMD、Tesla、Intel 和 x86-64 的合著者)、Nat Friedman(Github 執行長兼 GNOME 基金會主席)和 Philip Rosedale(Second Life 創辦人)。

中途

Midjourney 的文字和圖像的人工智慧開發開始於封閉測試版,然後在 2022 年 2022 月轉入公開測試版。 這允許公眾訪問和使用該工具。 正是這項措施幫助中程服務廣受歡迎。 與其他人工智慧工具不同,Midjourney 早在 年 月就實現了盈利,證實了其在市場上的成功。

也很有趣: ChatGPT:簡單的使用說明

如何使用中途?

使用 Midjourney 乍看之下似乎有點難以承受。 特別是因為創作者做出了一個不尋常的決定。 也就是說,我們得到的不是用於生成圖像的專用應用程序,而是一個名為 Midjourney Bot 的 Discord 機器人的連結。 因此,讓我們詳細了解使用 Midjourney 工具建立圖形所需遵循的所有步驟。

註冊不和諧

要開始使用 Midjourney,您必須擁有 Discord 帳號。 Discord 是一款類似 Slack 的聊天應用程式。 雖然它最初是為玩英雄聯盟和魔獸世界等多人線上遊戲時需要協調戰術的玩家開發的,但現在它在其他社群中也非常受歡迎。

因此,如您所見,在使用 Midjourney 之前,您需要建立一個 Discord 帳戶。 這是免費的。 造訪 Discord 頁面進行註冊。 在那裡,根據出現的說明完成所有步驟。 如果您已經擁有或剛剛建立了 Discord 帳戶,則可以跳到下一步。

報名參加中途之旅

設定您的 Discord 帳戶後,前往 Midjourney 並點擊「加入 Beta」。 將開啟加入 Midjourney Discord 頻道的邀請函。 點選「接受邀請」。

作為免費會員,您將無法建立圖像,但可以查看介面。 您還可以透過造訪不同的房間(名為#newbies-14和#newbies-21)來查看其他用戶的創作,以了解 Midjourney 的工作原理。

訂閱中途之旅

要開始使用 Midjourney 生成圖像,您需要購買訂閱。 為此,請訪問 Midjourney.com/account,使用經過驗證的 Discord 帳戶登入並選擇適合您需求的訂閱方案。 我們將在本文後面介紹各個計劃的價格。

加入中途 Discord 伺服器

一旦您加入 Midjourney Discord 伺服器並訂閱了計劃,您就可以開始產生圖像。 按著這些次序:

  • 開啟 Discord 並確保在左側選單中選擇 Midjourney 伺服器。
  • 您應該在螢幕左側看到一長串頻道。
  • 選擇以“新手”開頭的頻道之一。 您可能需要向下捲動清單才能找到它。
  • 您可以捲動瀏覽提要,查看其他使用者用於建立圖像的提示。

如何產生指令

在初學者頻道或您自己的頻道中,輸入“/imagine”,然後輸入說明文字。 若要開始與機器人進行私人聊天,請在螢幕右側的使用者清單中尋找 Midjourney Bot 圖示。 右鍵單擊它並選擇“發送訊息”或“訊息”。

描述盡可能具體,以便為人工智慧提供足夠的資訊來創建所需的圖像。 例如,您可以包含風格、流派、情緒和其他元素等詳細信息,以幫助 AI 創建您設想的外觀。 您將在本文後面了解這一點。

也很有趣: 什麼是神經網絡以及它們如何工作?

- 廣告 -

如何在中途創建有效的提示

使用過 Midjourney 的人都知道,您對想要獲得的圖像描述得越好,結果就會越明亮、越獨特。 使用者通常使用簡短而直接的提示。 例如,在發出「機器人使用人工智慧創建圖形」之類的簡單指令後,Midjourney 將創建以下內容:

該圖像是在中途創建的
該圖像是在中途創建的

正如您所看到的,這樣簡單的說明不足以(或至少不總是)獲得所需的結果,因此成功的關鍵是編寫完美的解釋性工具提示。

你喜歡這個或那個藝術家的風格嗎? 您希望您的圖形具有另一個時代的風格嗎? 或者您希望圖像生成器使用某種特定技術? 這一切都是可以實現的。 人工智慧是一個訓練有素的系統,它需要無數的輸入圖像來創建完美的圖形。 你唯一需要關心的就是向人工智慧提供你期望它做什麼的最佳描述。 但怎麼做呢? 幸運的是,我們知道答案。

標點

您在提示中使用的大部分標點符號都會被 Midjourney 忽略。 Midjourney 唯一能理解的標點符號是:

  • 選項由雙連字元分隔,例如“-ar 16:9”或“-v 5”。
  • 雙冒號分隔正數和負數。 例如,「::-0.5」。
  • 空格是分隔詞彙項的主要符號。

建立中途提示

首先,請記住,在 Midjourney 中,提示必須用英語編寫,這樣程式才能最好地理解它們。 每個邀請都以命令 /imagine 開頭,並且必須包含您希望收到的內容的描述。 最好給你的提示一些結構。 這不是必需的,但它絕對有助於盡快獲得您想要的圖形並在需要時輕鬆更改它們。

在描述的第一部分中,包含最能描述您的圖像的所有元素。 例如,你可以要求中途遵循某種藝術風格,並提出以它為基礎。 這是一個例子:「梵谷風格的大象形象」:

該圖像是在中途創建的
該圖像是在中途創建的

然而,Midjourney 真正有趣的是它能夠再現看起來像照片的圖像。 為此需要考慮幾件事。 例如,您可以選擇 AI 應模擬的相機類型:用於底片相機的 SLR 和用於 DSLR 相機的 DSLR。 您也可以建議鏡頭類型(18、35、50 甚至 250 毫米)和特定相機型號。

然後您可以發出其他命令。 它們前面必須有一個“-”號,並允許您將 AI 定向到特定方面,例如 Midjourney 版本(v 4、v 5)、寬高比(3:2、16:9 等)或樣式選項(s 100為中型,p 250 為高型,p 750 為非常高型)。 樣式選項的值較低會產生與工具提示非常匹配的圖像,但藝術性較差。 高值會創造更具藝術性的圖形,但與工具提示的相關性較小。

Midjourney 網站上提供了選項和命令的完整清單。

以下是提示和生成的圖形的範例:

一隻可愛的小老鼠躺在海灘上的圖像。 使用 Canon R5、50mm、DSLR、–v 5 –ar 3:2 –s 750 拍攝的照片

(一隻可愛的老鼠躺在海灘上的圖像。使用佳能 R5,50 毫米,DSLR,–v 5 –ar 3:2 –s 750 拍攝的照片)

燈光、環境、視角-思考每一個細節

要為您的照片提供背景信息,請將您想到的對象放置在特定的環境中。 Midjourney 可讓您將令人難以置信的場景變得超現實。 您可能想將您的角色放置在以某種風格裝飾的房屋中、海灘或某個城市的街道上。

另一個值得關注的方面是光線,因為它能帶來巨大的效果。 沒有人需要相信這一點在拍照時有多重要。 人工智慧圖形也是如此,它通常與真實照片非常相似。

根據一天中不同的時間,燈光會有所不同。 因此,照片中的顏色和對比是不同的。 Midjourney 能夠重現這些對比。 例如,您不再需要等待日落,只需添加“黃金時刻”一詞即可創建特定的照片。

您可以考慮的另一個因素是影像的視角。 在某些情況下,您需要為此調整光學元件,這可能會顯著改變您的圖形。

以下是中途提示中可以包含的角度範例: 遠距離拍攝、廣角拍攝、超廣角拍攝、遠景拍攝、鳥瞰或衛星視野、平視拍攝; 特寫——特寫、魅力肖像、微距拍攝或微距攝影。

這是一個範例查詢及其結果:

一個英俊的男人走在洛杉磯的街道上,黃金時段使用佳能 R5,50 毫米,數位單眼相機拍攝的照片,–v 5 –ar 3:2 –s 750

(走在洛杉磯街道上的帥哥,黃金時段照片,Canon R5,50mm,DSLR,–v 5 –ar 3:2 –s 750)

該圖像是在中途創建的
該圖像是在中途創建的

透過縮放和色散編輯影像

在每組產生的影像下方,您將看到八個按鈕:U1、U2、U3、U4、V1、V2、V3 和 V4。 所有這些按鈕都允許您微調且更好地控制中途影像的類型。

如果您使用的是 V5 之前的版本,U 按鈕將用於放大,即調整原始影像的大小,創建一個具有更多細節的新的更大版本。 它們編號為 U1–U4,用於識別序列中的影像。 例如,如果您想放大第二張影像,請按下頂行的 U2 按鈕。 最新型號預設為 1024×1024 像素影像,因此 U 按鈕只需突出顯示它們,以便以後編輯並更輕鬆地保存。

第一行右側是“重新滾動”按鈕。 如果您對 Midjourney 為您創建的第一組圖像不滿意,這是一個很棒的工具。 點擊此重新建立按鈕,要求 Midjourney 根據原始請求嘗試不同的概念,您將獲得四張新圖像。

V 按鈕可建立所選影像的四種新變體,在風格和構圖上與它們相匹配。 透過在 V1 – V4 之間進行選擇,您可以選擇與要為其建立變體的影像相對應的按鈕。

中途

最後但並非最不重要的一點是:/describe 函數

最後,我留下了一支優秀的團隊,讓您更輕鬆地創建完美的提示。 這是一個函數 /描述,它允許您上傳自己的圖像並根據該圖像生成四個可能的查詢。 它是如何運作的? 介紹完後 /描述 將出現電腦磁碟中的照片選擇視窗。 選擇適當的圖形文件,將其上傳到伺服器,Midjourney 將為您提供 4 個描述它的文字建議。 以下是我發送的照片的說明:

中途

正如您在上面的螢幕截圖中看到的,對於給出的四個描述中的每一個,都會有一些按鈕允許您使用 Midjourney 生成的提示。 選擇圖像後,會出現一個文字窗口,其中包含所選的描述。 此時,您可以決定是否要編輯文字或保留其建立時的樣子。

如果您想獲得最佳結果,我建議您盡可能擴展描述,僅使用程式生成的文字作為基礎。 點擊“提交”後,只需接受邀請並將其發送到 Midjourney。 一段時間後,您將收到包含範例圖像的回應:

該圖像是在中途創建的
該圖像是在中途創建的

為了進行比較,以下是我作為範例上傳的照片和我從建議中選擇的照片:

另請閱讀: 關於量子計算機 簡單來說

中途費用是多少? 可以免費使用嗎?

雖然我們習慣了 ChatGPT 和 Bing Chat 等聊天機器人提供幾乎無限的免費使用,但影像產生器的情況並非如此。 幾乎所有這些都有一些限制,除了少數短暫的促銷期外,Midjourney 不再免費。

該服務於 2022 年 25 月首次推出時,任何人都可以使用它免費創建 25 張圖像。 您所要做的就是建立一個免費的 Discord 帳戶並加入 Midjourney 伺服器。 免費試用版在發送第一個請求後立即啟動。 但是,當您達到 個影像限制時,您必須升級到付費方案。

中途

這一切在 2023 年 月發生了變化,Midjourney 執行長宣布暫停免費試用計畫。 去年,Midjourney 變得非常流行,用戶渴望在社交網路上分享他們創建的圖形。 為什麼創作者決定採取這樣的步驟?

放棄免費版本的決定很容易理解。 每個成像任務都需要大量的運算能力,尤其是圖形處理單元 (GPU)。 此外,每個 GPU 的視訊記憶體有限,大量用於去噪過程。

更具體地說,影像產生器使用耗電的 GPU,不僅成本高昂,而且數量有限。 因此,為了保持服務質量,該公司停止了免費試用期,直至另行通知,這應該不會令任何人感到驚訝。

但免費試用可能有一天會回歸。 例如,隨著5.1版本的推出,Midjourney恢復了一週的免費試用。

但是,要隨時使用 Midjourney,您必須購買四種訂閱方案之一。 最低價格為每月 10 美元。 你得到什麼回報? 平均而言,Midjourney 在一分鐘內創建一個新圖像。 但是,如果您想要調整大小的圖像或具有非方形長寬比的圖像,您可能需要花費更多時間。 因此我們可以假設最便宜的基本方案提供 3,3 小時的 GPU 時間,足以產生大約 200 代映像。

每增加一個更高的訂閱,您就會獲得更高的限制,讓您每月創建更多圖像。 因此,下一個計劃「標準」提供 15 小時的快速影像生成和無限的慢速生成(放鬆模式),每月費用為 30 美元。 接下來是 Pro 計劃,每月費用為 60 美元,提供 30 小時的快速成像、無限慢速成像和隱形模式。

2023 年 120 月,添加了 Mega 計劃,售價 60 美元,可為您提供 小時的快速圖像生成,當然還有無限時長的放鬆模式。

中途

正如您所看到的,所有更高級別的中途計劃都在放鬆模式下提供無限的照片,但您必須等待最多 10 分鐘才能獲取圖像。

最低級別沒有此功能,但每月 10 美元,值得開始您的中途旅程。 該計劃可讓您探索平台、創建圖像並熟悉介面以及文字建議的工作原理。 如果您喜歡所看到的內容,只需輸入提示 /訂閱即可進入您的帳戶,在其中可以輕鬆更新您的中途工具,從而將其提升到一個新的水平。

還值得記住的是,Midjourney 有時會進行促銷活動並提供 20% 折扣的年度計劃:

  • 按年訂閱的基本方案 - 每月 8 美元
  • 按年訂閱的標準方案為每月 24 美元
  • 專業計劃,按年訂閱 - 每月 48 美元
  • 每年訂閱的大型計劃 - 每月 96 美元。

中途旅行和所有權

人工智慧圖像生成器從攝影師和藝術家的數十億張圖像中學習。 中途也不例外。 許多藝術家認為人工智慧圖像產生器將其作品用於教育目的侵犯了版權。 一些藝術家甚至在美國對 Midjourney、Stability AI 和 DeviantArt 等 AI 生成器提出投訴。 然而,另一方則聲稱學習過程屬於合理使用的範疇。 那麼誰是人工智慧生成圖像的實際所有者呢?

Midjourney 的創始人 David Holtz 在接受《福布斯》採訪時承認,他在未經業主同意的情況下使用了圖像,因為對於如此龐大的數據集,這實際上是不可能的。

那麼,我們知道這些圖像不受版權保護,但是您創建的圖形是否受版權保護? 答案並不容易,但一般來說,人工智慧藝術家可以使用中途創作的圖像,甚至用於商業用途,但不能阻止其他人使用它們。

另請閱讀: ChatGPT 的 7 個最酷的用途

中途替代方案

DALL-E

DALL-E 是第一個在社群網路中非常流行的生成人工智慧。 最初,當它在 2021 年推出時,製作的圖形還有很多不足之處。 然而,最新版本 DALL-E 2 憑藉更好的語言理解和更高的圖像質量,達到了完全不同的水平。 DALL-E 還可以編輯現有影像,讓您可以替換或新增全新的物件。

必應圖像創作者

如果您想要 Midjourney 的免費替代品,您可以選擇 Bing Image Creator。 Bing Image Creator 內建於側邊欄中 Microsoft Edge,以便您可以在使用瀏覽器時存取它。感謝合作夥伴 Microsoft 借助 OpenAI,您可以透過 Bing 免費使用 DALL-E 2 圖像生成器。

夢想工作室

Midjourney 目前只能透過 Discord 運行,使用起來可能不是很直覺。 另一方面,DreamStudio 提供了一個豐富的網站,其中有許多按鈕和旋鈕可供自訂,但它看起來相當複雜。 DreamStudio 使用開放的穩定擴散模型。

Sam Stable Diffusion 是免費的開源軟體,您可以在電腦上安裝和運行。 然而,這需要一些程式設計知識和強大的運算能力。 為此,負責該模型的 Stability AI 公司創建了一個名為 DreamStudio 的平台。 與中途模型類似,穩定擴散根據單一命令(提示)創建四個不同的影像。 然後,使用者可以修改它們或使用它們作為創建新圖形的基礎。 該模型還可以進行微調,使其生成的圖像更符合用戶的請求,或者可以使用更多的計算步驟,從而獲得更準確的結果。

中途值得你關注嗎?

Midjourney 以產生結構良好、清晰且逼真的影像而聞名,這使其成為 DALL-E 和 Stable Diffusion 等其他 AI 工具的強大競爭對手。

該工具可以創建分辨率高達1792×1024像素的圖像,從而提供更詳細的圖像。

Midjourney 由廣泛使用的通訊平台 Discord 提供支援。 使用者可以使用簡單的命令與人工智慧機器人進行交互,即使沒有程式設計經驗的人也可以使用它。 儘管同時這是它的缺點之一,因為它僅與 Discord 平台綁定。 不是每個人都會喜歡它。 就我個人而言,我發現單獨安裝 Midjourney 應用程式更容易。

該圖像是在中途創建的
該圖像是在中途創建的

儘管開發人員保證 Midjourney Discord 伺服器提供了一個活躍的社區,用戶可以在其中分享他們的創作、提出問題並從其他用戶和 Midjourney 團隊獲得幫助。

我不喜歡生成的圖像是公開的。 也就是說,您使用 Midjourney 創建的圖像並不屬於您。 您可以使用它們(有限制),甚至可以用於商業用途,但其他用戶也可以相當合法地使用它們。 Midjourney 甚至在自己的網站上展示了最成功的創作,包括文字提示。

Midjourney 團隊持續致力於改進和擴展 AI 功能,確保工具在不斷發展的 AI 環境中保持相關性。 這就是該工具沒有免費版本的原因。 這可能對許多潛在用戶沒有吸引力,但是用 Midjourney 生成您自己的“真正”傑作,10 美元是值得的。

也很有趣: 

Yuri Svitlyk
Yuri Svitlyk
喀爾巴阡山脈之子、不為人知的數學天才、“律師”Microsoft,實用的利他主義者,左右
- 廣告 -
註冊
通知有關
客人

1 評論
較新的
年紀大的 最受歡迎
嵌入式評論
查看所有評論
梁魏懋
梁魏懋
5個月前

很棒的文章! :) Užsisakiau 標準 MJ planą。 是否可以在網路上使用 10 張照片來保存照片 kuriant vizualus?