Root NationNoviceIT noviceNova umetna inteligenca OpenAI za kloniranje glasu potrebuje le 15-sekundni vzorec, da deluje

Nova umetna inteligenca OpenAI za kloniranje glasu potrebuje le 15-sekundni vzorec, da deluje

-

OpenAI ponuja omejen dostop do platforme za pretvorbo besedila v govor, ki jo je razvil, imenovane Voice Engine, ki lahko ustvari sintetični glas na podlagi 15-sekundnega posnetka glasu nekoga. Glas, ki ga ustvari umetna inteligenca, lahko na ukaz prebere besedilne pozive v istem jeziku kot napovedovalec ali v več drugih jezikih. "Te majhne uvedbe pomagajo oblikovati naš pristop, zagotovila in razmišljanje o tem, kako je mogoče Voice Engine dobro uporabiti v različnih panogah," je dejal OpenAI v izjavi. v blogu.

Med podjetji, ki so pridobila dostop, so izobraževalno tehnološko podjetje Age of Learning, platforma za vizualno pripovedovanje zgodb HeyGen, razvijalec zdravstvene programske opreme Dimagi, ustvarjalec komunikacijske aplikacije AI Livox in sistem zdravstvenega varstva Lifespan.

OpenAI je dejal, da je začel razvijati Voice Engine konec leta 2022 in da tehnologija že poganja vnaprej nameščene glasove za API za pretvorbo besedila v govor in funkcijo branja na glas ChatGPT. V intervjuju za TechCrunch je Jeff Harris, član razvojne ekipe Voice Engine pri OpenAI, dejal, da je bil model usposobljen na "kombinaciji licenčnih in javno dostopnih podatkov." OpenAI je publikaciji povedal, da bo model na voljo le približno 10 razvijalcem.

OpenAI Voice

Umetna inteligenca za pretvorbo besedila v zvok je področje generativne umetne inteligence, ki se še naprej razvija. Medtem ko se večina osredotoča na instrumentalne ali naravne zvoke, se manjše število osredotoča na ustvarjanje glasu, deloma zaradi težav, ki jih omenja OpenAI. Sem spadajo podjetja, kot sta Podcastle in ElevenLabs, ki zagotavljata tehnologijo in orodja za kloniranje glasu z umetno inteligenco, kar je Vergecast raziskoval lani.

Obenem poskuša ameriška vlada omejiti neetično uporabo glasovnih tehnologij umetne inteligence. Prejšnji mesec je Zvezna komisija za komunikacije prepovedala robotske klice z uporabo glasov umetne inteligence, potem ko so ljudje prejeli vsiljene klice kloniranega glasu umetne inteligence predsednika Joeja Bidna.

Glede na OpenAI so se njegovi partnerji strinjali s politiko uporabe, ki navaja, da ne bodo uporabljali Voice Generation za lažno predstavljanje ljudi ali organizacij brez njihovega soglasja. Prav tako zahteva, da partnerji pridobijo "izrecno in informirano soglasje" prvotnega govorca, da ne ustvarjajo načinov za posamezne uporabnike, da ustvarjajo lastne glasove, in da obvestijo poslušalce, da glasove ustvarja umetna inteligenca. OpenAI je zvočnim posnetkom dodal tudi vodne žige, da bi sledil njihovemu izvoru in proaktivno nadzoroval uporabo zvoka.

OpenAI je predlagal več korakov, za katere verjame, da bi lahko omejili tveganja, povezana s takšnimi orodji, vključno s postopno opustitvijo glasovne avtentikacije za dostop do bančnih računov, politike za zaščito uporabe človeških glasov v AI, ozaveščanjem o ponaredkih AI in razvojem sledenja vsebini, ki jo ustvari AI. sistemi.

Preberite tudi:

Prijavite se
Obvesti o
gost

1 komentar
Novejše
Tisti starejši Najbolj priljubljene
Vdelana mnenja
Prikaži vse komentarje
pavlo
pavlo
pred 1 mesecem

- Kako je ime vašemu psu?

gj7yilkxeaa9cif