什麼是 Gemini：關於 Google 新 AI 模型的所有資訊

谷歌剛剛發布了有史以來最強大的人工智慧模型 雙子座。她是什麼以及她能做什麼？關於我們文章中的所有內容。

谷歌多年來一直在開發自己的人工智慧工具。隨著OpenAI公開發布ChatGPT-3，這家經營全球最受歡迎搜尋引擎的公司也創造了類似的工具Bard。但這個工具仍然輸給了競爭對手，這是Google不能允許的。因此，世界最近看到了 Gemini，我們在演示中了解到的 Google 新語言模型也就不足為奇了。

它的設計不僅是為了改進巨人之前的LLM（大型語言模型），而且還為文字處理、圖形和聲音領域提供了全新的可能性。

那麼讓我們仔細看看新的 Google Gemini 語言模型。

也很有趣： OpenAI 專案 Q*：它是什麼以及該專案為何受到關注

內容

6. Google Bard 的 Gemini：會發生什麼變化？

7. Google Pixel 智慧型手機中的 Gemini

8. Gemini 與其他 AI 模型（例如 GPT-4）有何不同？

9. 對準確性和公正性的擔憂

10. 未來與雙子座同在

什麼是谷歌雙子座？

這是Google推出的一種新的、強大的人工智慧模型，它不僅可以理解文本，還可以理解圖像、視訊和音訊。這種多模態模型被描述為能夠執行數學、物理和其他領域的複雜任務，以及理解和產生各種程式語言的高品質程式碼。

Gemini 目前可透過與 Google Bard 和 Google Pixel 8 整合來使用，並將逐步納入其他 Google 服務。

「Gemini 是 Google 團隊（包括我們 Google Research 的同事）大規模協作的結果，」—— Google DeepMind 執行長兼聯合創始人丹尼斯·哈薩比斯 (Dennis Hassabis) 說。 “它是從頭開始構建的多模式，這意味著它可以概括並無縫地理解、操作和組合不同類型的信息，包括文本、代碼、音頻、圖像和視頻。”

- 廣告 -

也很有趣：並非所有我們稱為 AI 的東西實際上都是人工智能。這是你需要知道的

誰創建了模型？

正如你可能已經猜到的，Gemini 是由 Google 和 Google 母公司 Alphabet 創建的，是該公司迄今為止最先進的人工智慧模型。谷歌的DeepMind部門也為其發展做出了重大貢獻。目前尚不清楚有多少員工參與了開發，分配了哪些資金，但了解谷歌的能力，我們可以確定數量非常大。

也很有趣： Windows 12：新作業系統是什麼

機會

正如我上面提到的，它是一個多模式模型，這意味著它可以理解、操作和組合不同類型的數據，包括文字、程式碼、音訊、圖像和視訊。與以前的人工智慧系統相比，它提供了更好的理解、思考和編碼技能。

此模型的主要功能是：

用於翻譯、摘要和對話等任務的自然語言處理
數學思維和解決問題
能夠產生程式碼和文檔
了解影像、音訊和視頻
不同領域的多工處理

正如您所看到的，這些功能優於其他型號。

在語言理解、數學思維和編碼測驗中，Gemini Ultra 的表現優於 GPT-4 等模型。特別是，它是第一個在大規模多任務語言理解 (MMLU) 測試中超越人類水平的模型，準確率達到 90% 以上。

在一項大型語言模型研究的 32 項學術測驗中，Gemini 的表現優於 GPT-4。在 30 個案例中，谷歌的新語言模型比競爭對手更好。這證明了模型完全理解該語言的能力。

另請閱讀：人腦計畫：模仿人腦的嘗試

有不同的版本嗎？

谷歌將這種人工智慧描述為一種靈活的模型，可以在任何設備上工作：從谷歌資料中心到行動裝置。為了實現這種可擴充性，Gemini 提供了三個版本：Nano、Pro 和 Ultra。

讓我們更詳細地討論一下 Gemini 的不同版本。

雙子座奈米：設計用於智慧型手機，特別是 Google Pixel 8。它旨在執行需要人工智慧高效處理的任務，而無需連接到外部伺服器，例如在聊天程式中建議答案或總結文字。這個緊湊的設備模型有大約 6 億個參數。
雙子座臨：在 Google 資料中心運作。 Pro 旨在與最新版本的 Bard AI 聊天機器人配合使用。它能夠提供快速回應時間並理解複雜的查詢。中型模型大約有 100 億個參數，是巴德對話式 AI 的核心。 Pro 將透過 Google Cloud 提供。
雙子座超：雖然 Ultra 版本尚未廣泛使用，但 Google 將其描述為性能最佳的模型，超過了「大型語言模型 (LLM) 研究中使用的 30 種廣泛使用的學術測試中的 32 種的當前最先進水平。」作為最大、最強大的版本，Ultra 將接收超過 1 兆個參數。它將位於數據中心。 Ultra 適合企業使用。此版本旨在執行非常複雜的任務。谷歌計劃在當前測試階段結束後發布它。也就是說，目前還沒有提供給使用者最強大的版本。

也很有趣： Google Bard AI：您需要了解的一切

- 廣告 -

如何進入雙子座？

Nano 和 Pro 版本的 AI 現在分別在 Google 產品中使用，例如 Google Pixel 8 智慧型手機和 Bard 聊天機器人。谷歌計劃最終將其整合到其搜尋引擎、廣告、Gmail電子郵件服務、Chrome瀏覽器和其他服務中。

從 13 年 2023 月日開始，開發者和企業客戶將能夠透過 Google AI Studio 和 Google Cloud Vertex AI 中的 Gemini API 存取 Pro。開發商 Android 將可以透過 AICore 存取 Nano 版本模型，該模型將在早期預覽中提供。

另請閱讀： Samsung Galaxy 翻轉5 vs Motorola Razr 40 Ultra：兩場橫尊之戰

Google Bard 的 Gemini：會發生什麼變化？

根據演示期間提供的信息，該模型將使 Google Bard 能夠更好地處理更複雜的問題，如下所示：

「我們設計 Gemini 時，模型自然是多模式的，並且從一開始就針對多種模式進行了預訓練。然後，我們透過添加更多多模式資料來改進它以提高效能。因此，Gemini 比以前的多模式模型更容易理解和推斷，並且在幾乎所有領域都擁有最先進的能力。

Gemini 非凡的多模式功能可協助您理解複雜的文字和視覺訊息。當從龐大的資料集中提取特定資訊時，它們特別有用。該模型具有通過閱讀、過濾和分析數十萬份文檔來提取信息本質的非凡能力，這無疑將有助於從科學到金融等各個領域獲得閃電般的新發現。”

在演示過程中，演示了一個複雜研究的範例，其中包含超過 200 萬筆記錄，其中一些記錄必須根據新數據進行更新。正如您可能已經猜到的那樣，手動執行此操作將非常耗時，因此研究作者使用 Gemini 準備程式碼來獲取輸入並進行必要的更新。另一個更現實的例子是使用谷歌的語言模型來解釋數學或物理問題。

這裡的輸入資料是學校課程作業的照片/掃描件。該系統能夠處理儲存在其中的圖形和文本，然後指示作業的哪些部分完成正確，哪些部分需要更多注意。該演示顯示，使用者可以反覆要求 Gemini 解釋一項任務，並且隨後的每次嘗試都必須以更簡單的語言進行解釋。當然，雙子座的準確性和正確性將由有興趣的人檢查，但直接從照片中讀取和處理文字的能力令人印象深刻。正如演示期間所補充的：

“雙子座被教導同時辨識和理解文字、圖像、聲音等。因此，他可以更好地理解訊息的細微差別，並能夠回答複雜的問題。它對於解釋與數學和物理相關的話題特別有效，因此可以作為個人作業的幫手“。

Google Pixel 智慧型手機中的 Gemini

谷歌還吹噓Gemini「學習」了新的TPUv5晶片組，並計劃在2024年初推出Gemini Ultra，它將使用Bard Advanced，這是巨人語音模型的消費版的新版本。 Gemini Ultra 目前正在測試中，並且已經可供選定的安全專家使用。

最後一個重要資訊是在 Google Pixel 8 智慧型手機中引入 Gemini，這將允許透過訊息應用程式中的 Gboard 應用程式建立快速回應。第一個是 WhatsApp，但明年此類解決方案將出現在與通訊相關的其他應用程式中。然而，這只是一個開始，Google已經宣布了許多適用於 Pixel 8 智慧型手機的新 AI 工具，未來它們還將在其他一些設備上使用。 Android。不過，這些都是進一步的計劃，目前尚未提供任何細節。

Gemini 與其他 AI 模型（例如 GPT-4）有何不同？

谷歌的新 Gemini 模型看起來是迄今為止最大、最先進的人工智慧模型之一，儘管 Ultra 模型的發布將確定這一點。與目前使用人工智慧聊天機器人的其他流行模型相比，Gemini 以其自己的多模態功能脫穎而出，而 GPT-4 等其他模型則依靠插件和整合來實現真正的多模態。

對準確性和公正性的擔憂

儘管Gemini在人工智慧能力發展方面取得了重大飛躍，但它也與其他主要語言模型一樣存在缺陷。首先，這是製造虛假資訊的可能性。偏差也基於新語言模型可用的訓練資料。還值得一提的是對現實世界的了解有限。谷歌承認，新的 Gemini 模型可能會犯錯，提供沒有證據的事實並違反常識。

還需要更多的測試，特別是對於 Gemini Ultra，它具有尚未完全探索的新功能。 Google 致力於仔細評估 Gemini，以最大程度地減少潛在危害。

也很有趣：所有關於 Microsoft 副駕駛：未來還是方向不對？

未來與雙子座同在

谷歌推出Gemini，開啟了人工智慧發展的新時代。與先前的模型和人類基準相比，Gemini 具有最佳的性能，並指出了人工智慧未來的可能性，但仍需要更多的研究來解決某些缺點。

未來，您可以期待Gemini在Google產品中提供更多有用且智慧的功能。展望未來，該公司計劃繼續將 Gemini 擴展到英語以外的領域，並以其核心建模方法為基礎。

我們只能袖手旁觀，希望Google知道它在做什麼。

另請閱讀：

作者的更多內容

註冊

0 留言

嵌入式評論

查看所有評論

其他文章

什麼是 Gemini：關於Google新人工智慧模型的一切