Η Meta δημιούργησε μια νέα γεννήτρια βασισμένη στην τεχνητή νοημοσύνη

Οι γεννήτριες κειμένου σε εικόνα με τεχνητή νοημοσύνη (AI) έχουν γίνει πρωτοσέλιδα τους τελευταίους μήνες, αλλά οι ερευνητές έχουν ήδη προχωρήσει στο επόμενο σύνορο: τις γεννήτριες κειμένου σε βίντεο που τροφοδοτούνται με τεχνητή νοημοσύνη. Οι ερευνητές της Meta παρουσίασαν δημόσια μια τέτοια νέα γεννήτρια, αναφέρει το The Verge.

Η ομάδα μηχανικής μηχανικής μάθησης της Meta παρουσιάζονται ένα νέο σύστημα που ονομάζεται Make-A-Video. Αυτό το μοντέλο AI επιτρέπει στους χρήστες να εισάγουν μια πρόχειρη περιγραφή της σκηνής και δημιουργεί ένα σύντομο βίντεο που ταιριάζει με το κείμενό τους. Τα βίντεο είναι σαφώς τεχνητά, με θολά αντικείμενα και παραμορφωμένα κινούμενα σχέδια, αλλά εξακολουθούν να αποτελούν σημαντικό επίτευγμα στον τομέα της δημιουργίας περιεχομένου τεχνητής νοημοσύνης.

- Διαφήμιση -

Στην ανάρτησή του στο Facebook Ο διευθύνων σύμβουλος της Meta, Mark Zuckerberg, χαρακτήρισε το έργο ως «καταπληκτική πρόοδο», προσθέτοντας: «Η δημιουργία βίντεο είναι πολύ πιο δύσκολη από τις φωτογραφίες, γιατί εκτός από τη σωστή παραγωγή κάθε pixel, το σύστημα πρέπει επίσης να προβλέψει πώς θα αλλάξουν με την πάροδο του χρόνου».

Τα κλιπ δεν διαρκούν περισσότερο από πέντε δευτερόλεπτα και δεν περιέχουν ήχο, αλλά καλύπτουν μια τεράστια γκάμα ενδείξεων. Ενώ είναι σαφές ότι το βίντεο δημιουργείται από υπολογιστή, η ποιότητα τέτοιων μοντέλων τεχνητής νοημοσύνης θα βελτιωθεί γρήγορα στο εγγύς μέλλον. Μέσα σε λίγα μόλις χρόνια, οι γεννήτριες εικόνων AI έχουν περάσει από τη δημιουργία σχεδόν ακατανόητων εικόνων σε φωτορεαλιστικό περιεχόμενο. Και ενώ η πρόοδος στο βίντεο μπορεί να είναι πιο αργή, δεδομένης της σχεδόν απεριόριστης πολυπλοκότητας του θέματος, το βραβείο για την απρόσκοπτη παραγωγή βίντεο θα παρακινήσει πολλούς οργανισμούς και εταιρείες να επενδύσουν σημαντικούς πόρους στο έργο.

Η εταιρεία λέει ότι σχεδιάζει να κυκλοφορήσει μια δοκιμαστική έκδοση του συστήματος, αλλά δεν έχει πει πότε και πώς θα εφαρμοστεί. Σε ένα έγγραφο που περιγράφει το μοντέλο, οι ερευνητές του Meta σημειώνουν ότι το Make-A-Video εκπαιδεύεται σε ζεύγη εικόνας-λεζάντες καθώς και σε πλάνα βίντεο χωρίς ετικέτα.

Το εκπαιδευτικό περιεχόμενο προήλθε από δύο σύνολα δεδομένων, τα WebVid-10M και HD-VILA-100M, τα οποία μαζί περιέχουν εκατομμύρια βίντεο και εκτείνονται σε εκατοντάδες χιλιάδες ώρες βίντεο. Παρεμπιπτόντως, αυτό περιλαμβάνει πλάνα αρχείου.

Οι ερευνητές σημειώνουν ότι το μοντέλο έχει πολλούς τεχνικούς περιορισμούς, εκτός από θολά καρέ και διάσπαρτα κινούμενα σχέδια. Το Make-A-Video παράγει 16 καρέ βίντεο με ανάλυση 64×64 pixel, τα οποία στη συνέχεια αλλάζουν μέγεθος χρησιμοποιώντας ένα ξεχωριστό μοντέλο AI σε 768×768 pixel.

Μπορείτε να βοηθήσετε την Ουκρανία να πολεμήσει ενάντια στους Ρώσους εισβολείς. Ο καλύτερος τρόπος για να γίνει αυτό είναι να δωρίσετε χρήματα στις Ένοπλες Δυνάμεις της Ουκρανίας μέσω Savelife ή μέσω της επίσημης σελίδας NBU.

- Διαφήμιση -

Επίσης ενδιαφέρον:

Ο Meta έδειξε AI για τη δημιουργία βίντεο με βάση την περιγραφή