Root Nation消息资讯资讯谷歌新的 Gemini AI 模型将能够收听音频文件

谷歌新的 Gemini AI 模型将能够收听音频文件

-

因此,在过去的一年半中,我们看到生成式人工智能的快速增长,并且人工智能模型似乎每分钟都在获得越来越多的知识。据报道,一种新的人工智能模式 谷歌,Gemini 1.5 Pro,现在可以收听和理解音频文件。

你向人工智能提供的数据越多,它就越好(如果你对此持怀疑态度,它就会变得越可怕)。最初,人工智能模型的训练主要通过文本完成——对于聊天机器人尤其重要。然而,后来 人工智能-模型已经学会了如何处理图像数据,现在可以用于重建图像(或根据请求创建全新的图像)。

谷歌双子座

AI模型Gemini(以前称为Bard)已经学会了处理图像(尽管最近创建一些图像导致几乎 丑闻),现在正在向理解音频文件的方向发展。具有此功能的 Gemini 1.5 Pro 版本目前正在测试中,据说比 Gemini Ultra 更强大。

此功能的成功实施将为用户带来许多新的机会 - 例如,由于创建长报告、对话、电话、讲座和其他类似事物的摘要而节省大量时间。您所需要做的就是将文件上传到 Gemini。存在长通话录音工具,但它们首先转录通话,然后创建摘要。不过,双子座只要听听就够了。

更新后的 Google Gemini AI 模型将能够收听和理解音频文件

当然,有一个警告 - 这个功能还不会公开。要访问它,用户需要 Vertex AI 开发平台 谷歌 或人工智能工作室。该公司表示,它将稍后公开,但没有给出时间表。

总的来说,观看人工智能的发展是非常有趣的。它已经帮助我们的生活变得更加轻松,并为我们提供了更多的空间来实现我们的创造潜力,并且通过此功能,它还可以让我们节省宝贵的时间。但是,如果您与人工智能聊天机器人的“沟通”在过去非常无效,那么可能值得对您的查询进行处理。

谷歌发布了一份指南,帮助用户有效地构建查询提示,以充分利用聊天机器人,例如 双子座。该手册建议始终在提示中指出一些有关您自己的信息,不仅仅是写任务,还要添加详细信息,要求提供项目符号列表。建议将单独的任务分解为单独的提示,添加对列表或字符数量的具体要求,要求以某种语气执行。您甚至可以询问聊天机器人是否有任何需要澄清的问题,以便它可以更好地理解任务。

该指南补充说,提示应该自然地书写,“用完整的句子表达完整的想法”,并且“最成功的提示平均有 21 个单词”。

另请阅读:

Dzherelophonearena
注册
通知关于
客人

0 评论
嵌入式评论
查看所有评论