OpenAI introduserte AI Voice Engine

OpenAI tilbyr begrenset tilgang til en tekst-til-tale-plattform den utviklet kalt Voice Engine, som kan lage en syntetisk stemme basert på et 15-sekunders klipp av noens stemme. En AI-generert stemme kan lese tekstmeldinger på kommando på samme språk som taleren eller på flere andre språk. "Disse små distribusjonene er med på å forme vår tilnærming, forsikringer og tenkning om hvordan Voice Engine kan brukes til det gode i forskjellige bransjer," sa OpenAI i en uttalelse. i bloggen.

Blant selskapene som har fått tilgang er utdanningsteknologiselskapet Age of Learning, visuell historiefortellingsplattform HeyGen, helseprogramvareutvikler Dimagi, skaper av AI-kommunikasjonsapper Livox og helsesystemet Lifespan.

OpenAI sa at de begynte å utvikle Voice Engine på slutten av 2022, og at teknologien allerede driver forhåndsinstallerte stemmer for tekst-til-tale API og ChatGPTs høytlesningsfunksjonalitet. I et intervju med TechCrunch sa Jeff Harris, et medlem av Voice Engine-utviklingsteamet hos OpenAI, at modellen ble trent på "en kombinasjon av lisensierte og offentlig tilgjengelige data." OpenAI fortalte publikasjonen at modellen bare vil være tilgjengelig for rundt 10 utviklere.

Tekst-til-lyd AI er et område med generativ AI som fortsetter å utvikle seg. Mens de fleste fokuserer på instrumentelle eller naturlige lyder, fokuserer et mindre antall på stemmegenerering, delvis på grunn av problemene OpenAI nevner. Disse inkluderer selskaper som Podcastle og ElevenLabs, som leverer teknologi og verktøy for AI-stemmekloning, som Vergecast utforsket i fjor.

Samtidig prøver den amerikanske regjeringen å begrense den uetiske bruken av AI-stemmeteknologier. Forrige måned forbød Federal Communications Commission robocalling med AI-stemmer etter at folk mottok spam-anrop fra en klonet AI-stemme til president Joe Biden.

I følge OpenAI har partnerne deres gått med på en brukspolicy som sier at de ikke vil bruke Voice Generation til å etterligne personer eller organisasjoner uten deres samtykke. Det krever også at partnere innhenter "uttrykkelig og informert samtykke" fra den opprinnelige foredragsholderen, ikke å skape måter for individuelle brukere å lage sine egne stemmer på, og å informere lytterne om at stemmene er generert av kunstig intelligens. OpenAI har også lagt til vannmerker til lydklipp for å spore opprinnelsen deres og proaktivt kontrollere lydbruken.

OpenAI har foreslått flere trinn de mener kan begrense risikoen forbundet med slike verktøy, inkludert utfasing av stemmeautentisering for tilgang til bankkontoer, retningslinjer for å beskytte bruken av menneskelige stemmer i AI, øke bevisstheten om AI-forfalskninger og utvikling av AI-generert innholdssporing systemer.

Les også:

Dzherelotheverge

Melde deg på

1 Kommentar

Nyere

De eldre Den mest populære

Innebygde anmeldelser

Se alle kommentarer

pavlo

1 måned siden

– Hva heter hunden din?

1

0

Svare

Andre artikler

OpenAIs nye stemmeklonings-AI trenger bare en 15-sekunders prøve for å fungere

Nylige kommentarer