因此，在過去的一年半中，我們看到生成式人工智慧的快速成長，而人工智慧模型似乎每分鐘都在獲得越來越多的知識。據報道，一種新的人工智慧模式谷歌，Gemini 1.5 Pro，現在可以收聽和理解音訊檔案。

你向人工智慧提供的數據越多，它就越好（如果你對此持懷疑態度，它就會變得越可怕）。最初，人工智慧模型的訓練主要透過文字完成——對於聊天機器人尤其重要。然而，後來人工智能-模型已經學會如何處理圖像數據，現在可以用於重建圖像（或根據請求創建全新的圖像）。

AI模型Gemini（以前稱為Bard）已經學會了處理圖像（儘管最近創建一些圖像導致幾乎醜聞），現在正在朝著理解音訊檔案的方向發展。具有此功能的 Gemini 1.5 Pro 版本目前正在測試中，據說比 Gemini Ultra 更強大。

此功能的成功實施將為使用者帶來許多新的機會 - 例如，由於建立長報告、對話、電話、講座和其他類似事物的摘要而節省大量時間。您所需要做的就是將文件上傳到 Gemini。存在長通話錄音工具，但它們首先轉錄通話，然後創建摘要。不過，雙子座只要聽聽看就夠了。

當然，有一個警告 - 這個功能還不會公開。要存取它，用戶需要 Vertex AI 開發平台谷歌或人工智慧工作室。該公司表示，它將稍後公開，但沒有給出時間表。

總的來說，觀看人工智慧的發展是非常有趣的。它已經幫助我們的生活變得更加輕鬆，並為我們提供了更多的空間來實現我們的創造潛力，並且透過此功能，它還可以讓我們節省寶貴的時間。但是，如果您與人工智慧聊天機器人的「溝通」在過去非常無效，那麼可能值得對您的查詢進行處理。

谷歌發布了一份指南，幫助用戶有效地建立查詢提示，以充分利用聊天機器人，例如雙子座。該手冊建議始終在提示中指明有關您自己的信息，不僅要寫任務，還要添加詳細信息，要求提供標記列表。建議將單獨的任務分解為單獨的提示，添加對清單或字元數量的具體要求，要求以某種語氣執行。您甚至可以詢問聊天機器人是否有任何需要澄清的問題，以便它可以更好地理解任務。

該指南補充說，提示應該自然地書寫，“用完整的句子表達完整的想法”，並且“最成功的提示平均有 21 個單字”。

另請閱讀：

來源電話競技場

註冊

0 留言

嵌入式評論

查看所有評論

其他文章

谷歌新的 Gemini AI 模型將能夠收聽音訊文件

最近的評論