Root Nation文章技術什麼是 Gemini:關於Google新人工智慧模型的一切

什麼是 Gemini:關於Google新人工智慧模型的一切

-

谷歌剛剛發布了有史以來最強大的人工智慧模型 雙子座。 她是什麼以及她能做什麼? 關於我們文章中的所有內容。

谷歌多年來一直在開發自己的人工智慧工具。 隨著OpenAI公開發布ChatGPT-3,這家經營全球最受歡迎搜尋引擎的公司也創造了類似的工具Bard。 但這個工具仍然輸給了競爭對手,這是Google不能允許的。 因此,世界最近看到了 Gemini,我們在演示中了解到的 Google 新語言模型也就不足為奇了。

它的設計不僅是為了改進巨人之前的LLM(大型語言模型),而且還為文字處理、圖形和聲音領域提供了全新的可能性。

那麼讓我們仔細看看新的 Google Gemini 語言模型。

也很有趣: OpenAI 專案 Q*:它是什麼以及該專案為何受到關注

什麼是谷歌雙子座?

這是Google推出的一種新的、強大的人工智慧模型,它不僅可以理解文本,還可以理解圖像、視訊和音訊。 這種多模態模型被描述為能夠執行數學、物理和其他領域的複雜任務,以及理解和產生各種程式語言的高品質程式碼。

谷歌雙子座

Gemini 目前可透過與 Google Bard 和 Google Pixel 8 整合來使用,並將逐步納入其他 Google 服務。

「Gemini 是 Google 團隊(包括我們 Google Research 的同事)大規模協作的結果,」—— Google DeepMind 執行長兼聯合創始人丹尼斯·哈薩比斯 (Dennis Hassabis) 說。 “它是從頭開始構建的多模式,這意味著它可以概括並無縫地理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。”

- 廣告 -

也很有趣: 並非所有我們稱為 AI 的東西實際上都是人工智能。 這是你需要知道的

誰創建了模型?

谷歌雙子座

正如你可能已經猜到的,Gemini 是由 Google 和 Google 母公司 Alphabet 創建的,是該公司迄今為止最先進的人工智慧模型。 谷歌的DeepMind部門也為其發展做出了重大貢獻。 目前尚不清楚有多少員工參與了開發,分配了哪些資金,但了解谷歌的能力,我們可以確定數量非常大。

也很有趣: Windows 12:新作業系統是什麼

機會

正如我上面提到的,它是一個多模式模型,這意味著它可以理解、操作和組合不同類型的數據,包括文字、程式碼、音訊、圖像和視訊。 與以前的人工智慧系統相比,它提供了更好的理解、思考和編碼技能。

谷歌雙子座

此模型的主要功能是:

  • 用於翻譯、摘要和對話等任務的自然語言處理
  • 數學思維和解決問題
  • 能夠產生程式碼和文檔
  • 了解影像、音訊和視頻
  • 不同領域的多工處理

正如您所看到的,這些功能優於其他型號。

在語言理解、數學思維和編碼測驗中,Gemini Ultra 的表現優於 GPT-4 等模型。 特別是,它是第一個在大規模多任務語言理解 (MMLU) 測試中超越人類水平的模型,準確率達到 90% 以上。

在一項大型語言模型研究的 32 項學術測驗中,Gemini 的表現優於 GPT-4。 在 30 個案例中,谷歌的新語言模型比競爭對手更好。 這證明了模型完全理解該語言的能力。

另請閱讀: 人腦計畫:模仿人腦的嘗試

有不同的版本嗎?

谷歌將這種人工智慧描述為一種靈活的模型,可以在任何設備上工作:從谷歌資料中心到行動裝置。 為了實現這種可擴充性,Gemini 提供了三個版本:Nano、Pro 和 Ultra。

谷歌雙子座

讓我們更詳細地討論一下 Gemini 的不同版本。

  • 雙子座奈米:設計用於智慧型手機,特別是 Google Pixel 8。它旨在執行需要人工智慧高效處理的任務,而無需連接到外部伺服器,例如在聊天程式中建議答案或總結文字。 這個緊湊的設備模型有大約 6 億個參數。
  • 雙子座臨:在 Google 資料中心運作。 Pro 旨在與最新版本的 Bard AI 聊天機器人配合使用。 它能夠提供快速回應時間並理解複雜的查詢。 中型模型大約有 100 億個參數,是巴德對話式 AI 的核心。 Pro 將透過 Google Cloud 提供。
  • 雙子座超:雖然 Ultra 版本尚未廣泛使用,但 Google 將其描述為性能最佳的模型,超過了「大型語言模型 (LLM) 研究中使用的 30 種廣泛使用的學術測試中的 32 種的當前最先進水平。 」 作為最大、最強大的版本,Ultra 將接收超過 1 兆個參數。 它將位於數據中心。 Ultra 適合企業使用。 此版本旨在執行非常複雜的任務。 谷歌計劃在當前測試階段結束後發布它。 也就是說,目前還沒有提供給使用者最強大的版本。

也很有趣: Google Bard AI:您需要了解的一切

- 廣告 -

如何進入雙子座?

Nano 和 Pro 版本的 AI 現在分別在 Google 產品中使用,例如 Google Pixel 8 智慧型手機和 Bard 聊天機器人。 谷歌計劃最終將其整合到其搜尋引擎、廣告、Gmail電子郵件服務、Chrome瀏覽器和其他服務中。

從 13 年 2023 月 日開始,開發者和企業客戶將能夠透過 Google AI Studio 和 Google Cloud Vertex AI 中的 Gemini API 存取 Pro。開發商 Android 將可以透過 AICore 存取 Nano 版本模型,該模型將在早期預覽中提供。

另請閱讀: Samsung Galaxy 翻轉5 vs Motorola Razr 40 Ultra:兩場橫尊之戰

Google Bard 的 Gemini:會發生什麼變化?

根據演示期間提供的信息,該模型將使 Google Bard 能夠更好地處理更複雜的問題,如下所示:

「我們設計 Gemini 時,模型自然是多模式的,並且從一開始就針對多種模式進行了預訓練。 然後,我們透過添加更多多模式資料來改進它以提高效能。 因此,Gemini 比以前的多模式模型更容易理解和推斷,並且在幾乎所有領域都擁有最先進的能力。

Gemini 非凡的多模式功能可協助您理解複雜的文字和視覺訊息。 當從龐大的資料集中提取特定資訊時,它們特別有用。 該模型具有通過閱讀、過濾和分析數十萬份文檔來提取信息本質的非凡能力,這無疑將有助於從科學到金融等各個領域獲得閃電般的新發現。”

在演示過程中,演示了一個複雜研究的範例,其中包含超過 200 萬筆記錄,其中一些記錄必須根​​據新數據進行更新。 正如您可能已經猜到的那樣,手動執行此操作將非常耗時,因此研究作者使用 Gemini 準備程式碼來獲取輸入並進行必要的更新。 另一個更現實的例子是使用谷歌的語言模型來解釋數學或物理問題。

谷歌雙子座

這裡的輸入資料是學校課程作業的照片/掃描件。 該系統能夠處理儲存在其中的圖形和文本,然後指示作業的哪些部分完成正確,哪些部分需要更多注意。 該演示顯示,使用者可以反覆要求 Gemini 解釋一項任務,並且隨後的每次嘗試都必須以更簡單的語言進行解釋。 當然,雙子座的準確性和正確性將由有興趣的人檢查,但直接從照片中讀取和處理文字的能力令人印象深刻。 正如演示期間所補充的:

雙子座被教導同時辨識和理解文字、圖像、聲音等。 因此,他可以更好地理解訊息的細微差別,並能夠回答複雜的問題。 它對於解釋與數學和物理相關的話題特別有效,因此可以作為個人作業的幫手“。

Google Pixel 智慧型手機中的 Gemini

谷歌還吹噓Gemini「學習」了新的TPUv5晶片組,並計劃在2024年初推出Gemini Ultra,它將使用Bard Advanced,這是巨人語音模型的消費版的新版本。 Gemini Ultra 目前正在測試中,並且已經可供選定的安全專家使用。

谷歌雙子座

最後一個重要資訊是在 Google Pixel 8 智慧型手機中引入 Gemini,這將允許透過訊息應用程式中的 Gboard 應用程式建立快速回應。第一個是 WhatsApp,但明年此類解決方案將出現在與通訊相關的其他應用程式中。然而,這只是一個開始,Google已經宣布了許多適用於 Pixel 8 智慧型手機的新 AI 工具,未來它們還將在其他一些設備上使用。 Android。不過,這些都是進一步的計劃,目前尚未提供任何細節。

Gemini 與其他 AI 模型(例如 GPT-4)有何不同?

谷歌的新 Gemini 模型看起來是迄今為止最大、最先進的人工智慧模型之一,儘管 Ultra 模型的發布將確定這一點。 與目前使用人工智慧聊天機器人的其他流行模型相比,Gemini 以其自己的多模態​​功能脫穎而出,而 GPT-4 等其他模型則依靠插件和整合來實現真正的多模態。

對準確性和公正性的擔憂

儘管Gemini在人工智慧能力發展方面取得了重大飛躍,但它也與其他主要語言模型一樣存在缺陷。 首先,這是製造虛假資訊的可能性。 偏差也基於新語言模型可用的訓練資料。 還值得一提的是對現實世界的了解有限。 谷歌承認,新的 Gemini 模型可能會犯錯,提供沒有證據的事實並違反常識。

谷歌雙子座

還需要更多的測試,特別是對於 Gemini Ultra,它具有尚未完全探索的新功能。 Google 致力於仔細評估 Gemini,以最大程度地減少潛在危害。

也很有趣: 所有關於 Microsoft 副駕駛:未來還是方向不對?

未來與雙子座同在

谷歌推出Gemini,開啟了人工智慧發展的新時代。 與先前的模型和人類基準相比,Gemini 具有最佳的性能,並指出了人工智慧未來的可能性,但仍需要更多的研究來解決某些缺點。

未來,您可以期待Gemini在Google產品中提供更多有用且智慧的功能。 展望未來,該公司計劃繼續將 Gemini 擴展到英語以外的領域,並以其核心建模方法為基礎。

我們只能袖手旁觀,希望Google知道它在做什麼。

另請閱讀: 

Yuri Svitlyk
Yuri Svitlyk
喀爾巴阡山脈之子、不為人知的數學天才、“律師”Microsoft,實用的利他主義者,左右
- 廣告 -
註冊
通知有關
客人

0 留言
嵌入式評論
查看所有評論