Entonces, durante el último año y medio, hemos visto un rápido crecimiento en la IA generativa, y los modelos de IA parecen estar adquiriendo más y más conocimiento minuto a minuto. Sí, se informa que el nuevo modelo de inteligencia artificial de Google, Gemini 1.5 Pro, ahora puede escuchar y comprender archivos de audio.
Cuantos más datos proporciones a la IA, mejor se volverá (y más aterrador, si eres escéptico al respecto). Inicialmente, el entrenamiento de los modelos de IA se realizaba principalmente con ayuda de texto, algo especialmente importante para los chatbots. Sin embargo, desde entonces los modelos de IA han aprendido a procesar datos de imágenes y ahora pueden usarse para reconstruir una imagen (o crear una imagen completamente nueva si lo solicita).
El modelo de IA Gemini (anteriormente llamado Bard) ha aprendido a procesar imágenes (aunque la creación de algunas imágenes recientemente provocó un escándalo ) y ahora se está desarrollando en la dirección de comprender archivos de audio. La versión Gemini 1.5 Pro que hace esto se encuentra actualmente en prueba y se dice que es incluso más potente que el Gemini Ultra.
La implementación exitosa de esta función abrirá muchas oportunidades nuevas para los usuarios; por ejemplo, un importante ahorro de tiempo mediante la creación de un resumen de un informe largo, una conversación, una llamada telefónica, una conferencia y otras cosas similares. Todo lo que necesitas hacer es subir el archivo a Gemini. Existen herramientas de grabación de llamadas largas, pero primero transcriben la llamada y luego crean un resumen. Sin embargo, a Géminis le basta con escucharlo.
Por supuesto, hay una advertencia: esta función aún no estará disponible públicamente. Para acceder a él, los usuarios necesitarán la plataforma de desarrollo Vertex AI de Google o AI Studio. La compañía dice que estará disponible públicamente más adelante, pero no proporciona un cronograma.
En general, observar el desarrollo de la inteligencia artificial es muy interesante. Ya nos ayuda a hacernos la vida más fácil y nos da más espacio para realizar nuestro potencial creativo, y con esta función también nos permitirá ahorrar un tiempo precioso. Pero si su “comunicación” con los chatbots de IA ha sido extremadamente ineficaz en el pasado, podría valer la pena trabajar en sus consultas.
Google ha publicado una guía para ayudar a los usuarios a estructurar eficazmente las consultas para aprovechar al máximo un chatbot como Gemini . El manual recomienda indicar siempre algo sobre usted en el mensaje, escribir no solo una tarea, sino agregar detalles y solicitar una lista marcada. Se recomienda dividir las tareas separadas en indicaciones separadas, agregar requisitos específicos para las listas o la cantidad de caracteres, y pedir hacerlo en un tono determinado. Incluso puedes preguntarle al chatbot si tiene alguna pregunta aclaratoria para ti para que pueda comprender mejor la tarea.
La guía agrega que las indicaciones deben escribirse de forma natural, con “pensamientos completos en oraciones completas” y que “las indicaciones más exitosas tienen un promedio de 21 palabras”.
Aquí te dejamos una lista de noticias que de seguro vas a querer leer: