Root Nation訊息資訊科技資訊谷歌新的 Gemini AI 模型將能夠收聽音訊文件

谷歌新的 Gemini AI 模型將能夠收聽音訊文件

-

因此,在過去的一年半中,我們看到生成式人工智慧的快速成長,而人工智慧模型似乎每分鐘都在獲得越來越多的知識。據報道,一種新的人工智慧模式 谷歌,Gemini 1.5 Pro,現在可以收聽和理解音訊檔案。

你向人工智慧提供的數據越多,它就越好(如果你對此持懷疑態度,它就會變得越可怕)。最初,人工智慧模型的訓練主要透過文字完成——對於聊天機器人尤其重要。然而,後來 人工智能-模型已經學會如何處理圖像數據,現在可以用於重建圖像(或根據請求創建全新的圖像)。

谷歌雙子座

AI模型Gemini(以前稱為Bard)已經學會了處理圖像(儘管最近創建一些圖像導致幾乎 醜聞),現在正在朝著理解音訊檔案的方向發展。具有此功能的 Gemini 1.5 Pro 版本目前正在測試中,據說比 Gemini Ultra 更強大。

此功能的成功實施將為使用者帶來許多新的機會 - 例如,由於建立長報告、對話、電話、講座和其他類似事物的摘要而節省大量時間。您所需要做的就是將文件上傳到 Gemini。存在長通話錄音工具,但它們首先轉錄通話,然後創建摘要。不過,雙子座只要聽聽看就夠了。

更新後的 Google Gemini AI 模型將能夠收聽和理解音訊文件

當然,有一個警告 - 這個功能還不會公開。要存取它,用戶需要 Vertex AI 開發平台 谷歌 或人工智慧工作室。該公司表示,它將稍後公開,但沒有給出時間表。

總的來說,觀看人工智慧的發展是非常有趣的。它已經幫助我們的生活變得更加輕鬆,並為我們提供了更多的空間來實現我們的創造潛力,並且透過此功能,它還可以讓我們節省寶貴的時間。但是,如果您與人工智慧聊天機器人的「溝通」在過去非常無效,那麼可能值得對您的查詢進行處理。

谷歌發布了一份指南,幫助用戶有效地建立查詢提示,以充分利用聊天機器人,例如 雙子座。該手冊建議始終在提示中指明有關您自己的信息,不僅要寫任務,還要添加詳細信息,要求提供標記列表。建議將單獨的任務分解為單獨的提示,添加對清單或字元數量的具體要求,要求以某種語氣執行。您甚至可以詢問聊天機器人是否有任何需要澄清的問題,以便它可以更好地理解任務。

該指南補充說,提示應該自然地書寫,“用完整的句子表達完整的想法”,並且“最成功的提示平均有 21 個單字”。

另請閱讀:

註冊
通知有關
客人

0 留言
嵌入式評論
查看所有評論