Root NationΝέαειδήσεις πληροφορικήςΤο νέο μοντέλο Gemini AI από την Google θα μπορεί να ακούει αρχεία ήχου

Το νέο μοντέλο Gemini AI από την Google θα μπορεί να ακούει αρχεία ήχου

-

Έτσι, τον τελευταίο ενάμιση χρόνο, είδαμε ταχεία ανάπτυξη στη γενετική τεχνητή νοημοσύνη και τα μοντέλα τεχνητής νοημοσύνης φαίνεται να αποκτούν όλο και περισσότερη γνώση κάθε λεπτό. Έτσι, αναφέρεται ότι ένα νέο μοντέλο τεχνητής νοημοσύνης από Google, Gemini 1.5 Pro, μπορεί πλέον να ακούει και να κατανοεί αρχεία ήχου.

Όσο περισσότερα δεδομένα τροφοδοτείτε το AI, τόσο καλύτερο γίνεται (και τόσο πιο τρομακτικό, αν είστε δύσπιστοι σχετικά με αυτό). Αρχικά, η εκπαίδευση μοντέλων τεχνητής νοημοσύνης γινόταν κυρίως με κείμενο – ιδιαίτερα σημαντικό για τα chatbots. Ωστόσο, αργότερα Όλα συμπεριλαμβάνονται-Τα μοντέλα έχουν μάθει πώς να επεξεργάζονται δεδομένα εικόνας και μπορούν τώρα να χρησιμοποιηθούν για την ανακατασκευή μιας εικόνας (ή τη δημιουργία μιας εντελώς νέας εικόνας κατόπιν αιτήματος).

Google Gemini

Το μοντέλο AI Gemini (πρώην Bard) έμαθε να επεξεργάζεται εικόνες (αν και η δημιουργία ορισμένων εικόνων πρόσφατα είχε σχεδόν σκάνδαλο), και τώρα αναπτύσσεται προς την κατεύθυνση της κατανόησης των αρχείων ήχου. Η έκδοση Gemini 1.5 Pro που το κάνει αυτό είναι αυτή τη στιγμή σε δοκιμή και λέγεται ότι είναι ακόμα πιο ισχυρή από την Gemini Ultra.

Η επιτυχής εφαρμογή αυτής της δυνατότητας θα ανοίξει πολλές νέες ευκαιρίες για τους χρήστες - για παράδειγμα, σημαντική εξοικονόμηση χρόνου λόγω της δημιουργίας μιας σύνοψης μιας μεγάλης αναφοράς, συνομιλίας, τηλεφωνικής κλήσης, διάλεξης και άλλων παρόμοιων πραγμάτων. Το μόνο που χρειάζεται να κάνετε είναι να ανεβάσετε το αρχείο στο Gemini. Υπάρχουν εργαλεία εγγραφής κλήσεων μεγάλης διάρκειας, αλλά πρώτα μεταγράφουν την κλήση και μετά δημιουργούν μια περίληψη. Ωστόσο, ο Δίδυμος αρκεί μόνο να το ακούσει.

Το ενημερωμένο μοντέλο Google Gemini AI θα μπορεί να ακούει και να κατανοεί αρχεία ήχου

Φυσικά, υπάρχει μια προειδοποίηση - αυτή η λειτουργία δεν θα είναι ακόμη δημόσια διαθέσιμη. Για να αποκτήσουν πρόσβαση, οι χρήστες θα χρειαστούν την πλατφόρμα ανάπτυξης Vertex AI από Google ή AI Studio. Η εταιρεία λέει ότι θα γίνει διαθέσιμο στο κοινό αργότερα, αλλά δεν δίνεται χρονοδιάγραμμα.

Γενικά, η παρακολούθηση της ανάπτυξης της τεχνητής νοημοσύνης είναι πολύ ενδιαφέρουσα. Βοηθά ήδη να κάνουμε τη ζωή μας πιο εύκολη και μας δίνει περισσότερο χώρο για να συνειδητοποιήσουμε τις δημιουργικές μας δυνατότητες, και με αυτή τη λειτουργία, θα μας επιτρέψει επίσης να εξοικονομήσουμε πολύτιμο χρόνο. Αλλά αν η «επικοινωνία» σας με τα chatbot AI ήταν εξαιρετικά αναποτελεσματική στο παρελθόν, ίσως αξίζει να ασχοληθείτε με τα ερωτήματά σας.

Η Google δημοσίευσε έναν οδηγό για να βοηθήσει τους χρήστες να δομούν αποτελεσματικά τα μηνύματα ερωτημάτων για να αξιοποιήσουν στο έπακρο ένα chatbot όπως Gemini. Το εγχειρίδιο συμβουλεύει να υποδεικνύετε πάντα κάτι για τον εαυτό σας στην προτροπή, να γράφετε όχι απλώς μια εργασία, αλλά να προσθέτετε λεπτομέρειες, να ζητάτε μια επισημασμένη λίστα. Συνιστάται να αναλύονται οι ξεχωριστές εργασίες σε ξεχωριστές προτροπές, να προσθέτετε συγκεκριμένες απαιτήσεις για λίστες ή αριθμό χαρακτήρων, να ζητάτε να το κάνετε με συγκεκριμένο τόνο. Μπορείτε ακόμη να ρωτήσετε το chatbot εάν έχει διευκρινιστικές ερωτήσεις για εσάς, ώστε να κατανοήσει καλύτερα την εργασία.

Ο οδηγός προσθέτει ότι οι προτροπές πρέπει να γράφονται φυσικά, με "πλήρες σκέψεις σε πλήρεις προτάσεις" και ότι "οι πιο επιτυχημένες προτροπές έχουν κατά μέσο όρο 21 λέξεις".

Διαβάστε επίσης:

ΠηγήPhoneArena
Εγγραφείτε
Ειδοποίηση για
επισκέπτης

0 Σχόλια
Ενσωματωμένες κριτικές
Δείτε όλα τα σχόλια