Root NationȘtiriștiri ITNoua IA pentru clonarea vocii a OpenAI are nevoie de doar o mostră de 15 secunde pentru a funcționa

Noua IA pentru clonarea vocii a OpenAI are nevoie de doar o mostră de 15 secunde pentru a funcționa

-

OpenAI oferă acces limitat la o platformă de text-to-speech pe care a dezvoltat-o, numită Voice Engine, care poate crea o voce sintetică bazată pe un clip de 15 secunde al vocii cuiva. O voce generată de inteligență artificială poate citi mesaje text la comandă în aceeași limbă ca și crainicul sau în mai multe alte limbi. „Aceste implementări mici ne ajută să ne modelăm abordarea, garanțiile și gândirea despre modul în care motorul vocal poate fi folosit pentru bine în diferite industrii”, a spus OpenAI într-un comunicat. în blog.

Printre companiile care au obținut acces se numără compania de tehnologie educațională Age of Learning, platforma de povestiri vizuale HeyGen, dezvoltatorul de software pentru sănătate Dimagi, creatorul de aplicații de comunicare AI Livox și sistemul de sănătate Lifespan.

OpenAI a spus că a început să dezvolte Voice Engine la sfârșitul anului 2022 și că tehnologia alimentează deja voci preinstalate pentru API-ul text-to-speech și funcționalitatea de citire cu voce tare a ChatGPT. Într-un interviu acordat TechCrunch, Jeff Harris, membru al echipei de dezvoltare Voice Engine la OpenAI, a declarat că modelul a fost instruit pe „o combinație de date licențiate și disponibile public”. OpenAI a declarat publicației că modelul va fi disponibil doar pentru aproximativ 10 dezvoltatori.

OpenAI Voice

AI text-to-audio este o zonă de AI generativă care continuă să evolueze. În timp ce majoritatea se concentrează pe sunete instrumentale sau naturale, un număr mai mic se concentrează pe generarea vocii, în parte din cauza problemelor menționate de OpenAI. Acestea includ companii precum Podcastle și ElevenLabs, care oferă tehnologie și instrumente pentru clonarea vocii AI, pe care Vergecast a explorat-o anul trecut.

În același timp, guvernul SUA încearcă să limiteze utilizarea neetică a tehnologiilor vocale AI. Luna trecută, Comisia Federală de Comunicații a interzis apelurile automate care utilizează voci AI după ce oamenii au primit apeluri spam de la o voce AI clonată a președintelui Joe Biden.

Potrivit OpenAI, partenerii săi au fost de acord cu o politică de utilizare care prevede că nu vor folosi Voice Generation pentru a uzurpa identitatea unor persoane sau organizații fără consimțământul acestora. De asemenea, cere partenerilor să obțină „consimțământul expres și informat” al vorbitorului original, să nu creeze modalități pentru utilizatorii individuali de a-și crea propriile voci și să informeze ascultătorii că vocile sunt generate de inteligența artificială. OpenAI a adăugat, de asemenea, filigrane la clipurile audio pentru a le urmări originea și a controla în mod proactiv utilizarea audio.

OpenAI a propus câțiva pași despre care consideră că ar putea limita riscurile asociate cu astfel de instrumente, inclusiv eliminarea treptată a autentificării vocale pentru accesarea conturilor bancare, politici de protecție a utilizării vocilor umane în AI, creșterea gradului de conștientizare a falsurilor AI și dezvoltarea de urmărire a conținutului generat de AI. sisteme.

Citeste si:

Dzherelomarginea
Inscrie-te
Notifică despre
oaspete

1 Comentariu
Cele mai noi
Cei mai mari Cel mai popular
Recenzii încorporate
Vezi toate comentariile
Pavlo
Pavlo
acum 1 luna

- Care este numele câinelui tău?

gj7yilkxeaa9cif