因此，在过去的一年半中，我们看到生成式人工智能的快速增长，并且人工智能模型似乎每分钟都在获得越来越多的知识。据报道，一种新的人工智能模式谷歌，Gemini 1.5 Pro，现在可以收听和理解音频文件。

你向人工智能提供的数据越多，它就越好（如果你对此持怀疑态度，它就会变得越可怕）。最初，人工智能模型的训练主要通过文本完成——对于聊天机器人尤其重要。然而，后来人工智能-模型已经学会了如何处理图像数据，现在可以用于重建图像（或根据请求创建全新的图像）。

AI模型Gemini（以前称为Bard）已经学会了处理图像（尽管最近创建一些图像导致几乎丑闻），现在正在向理解音频文件的方向发展。具有此功能的 Gemini 1.5 Pro 版本目前正在测试中，据说比 Gemini Ultra 更强大。

此功能的成功实施将为用户带来许多新的机会 - 例如，由于创建长报告、对话、电话、讲座和其他类似事物的摘要而节省大量时间。您所需要做的就是将文件上传到 Gemini。存在长通话录音工具，但它们首先转录通话，然后创建摘要。不过，双子座只要听听就够了。

当然，有一个警告 - 这个功能还不会公开。要访问它，用户需要 Vertex AI 开发平台谷歌或人工智能工作室。该公司表示，它将稍后公开，但没有给出时间表。

总的来说，观看人工智能的发展是非常有趣的。它已经帮助我们的生活变得更加轻松，并为我们提供了更多的空间来实现我们的创造潜力，并且通过此功能，它还可以让我们节省宝贵的时间。但是，如果您与人工智能聊天机器人的“沟通”在过去非常无效，那么可能值得对您的查询进行处理。

谷歌发布了一份指南，帮助用户有效地构建查询提示，以充分利用聊天机器人，例如双子座。该手册建议始终在提示中指出一些有关您自己的信息，不仅仅是写任务，还要添加详细信息，要求提供项目符号列表。建议将单独的任务分解为单独的提示，添加对列表或字符数量的具体要求，要求以某种语气执行。您甚至可以询问聊天机器人是否有任何需要澄清的问题，以便它可以更好地理解任务。

该指南补充说，提示应该自然地书写，“用完整的句子表达完整的想法”，并且“最成功的提示平均有 21 个单词”。

另请阅读：

Dzherelophonearena

注册

0 评论

嵌入式评论

查看所有评论

其他文章

谷歌新的 Gemini AI 模型将能够收听音频文件

最近的评论