OpenAI esitteli AI Voice Enginen

OpenAI tarjoaa rajoitetun pääsyn kehittämäänsä tekstistä puheeksi -alustaan nimeltä Voice Engine, joka voi luoda synteettisen äänen, joka perustuu 15 sekunnin pituiseen äänileikeeseen. Tekoälyn luoma ääni voi lukea tekstikehotteita käskystä samalla kielellä kuin kuuluttaja tai useilla muilla kielillä. "Nämä pienet käyttöönotot auttavat muokkaamaan lähestymistapaamme, takeitamme ja ajattelua siitä, kuinka Voice Engineä voidaan käyttää hyväksi eri toimialoilla", OpenAI sanoi lausunnossaan. blogissa.

Pääsyn saaneita yrityksiä ovat muun muassa koulutusteknologiayritys Age of Learning, visuaalinen tarinankerrontaalusta HeyGen, terveydenhuollon ohjelmistokehittäjä Dimagi, tekoälyviestintäsovellusten luoja Livox ja terveydenhuoltojärjestelmä Lifespan.

OpenAI sanoi aloittaneensa Voice Enginen kehittämisen vuoden 2022 lopulla ja että tekniikka tukee jo valmiiksi asennettuja ääniä tekstistä puheeksi -sovellusliittymälle ja ChatGPT:n ääneenlukutoiminnalle. TechCrunchin haastattelussa Jeff Harris, OpenAI:n Voice Engine -kehitystiimin jäsen, sanoi, että malli on koulutettu "lisensoidun ja julkisesti saatavilla olevan datan yhdistelmällä". OpenAI kertoi julkaisulle, että malli on saatavilla vain noin 10 kehittäjälle.

Tekstistä ääneksi tekoäly on generatiivisen tekoälyn alue, joka kehittyy jatkuvasti. Suurin osa keskittyy instrumentaalisiin tai luonnollisiin ääniin, mutta pienempi osa keskittyy äänen tuottamiseen, osittain OpenAI:n mainitsemien ongelmien vuoksi. Näihin kuuluvat yritykset, kuten Podcastle ja ElevenLabs, jotka tarjoavat teknologiaa ja työkaluja tekoälypuheen kloonaukseen, jota Vergecast tutki viime vuonna.

Samaan aikaan Yhdysvaltain hallitus yrittää rajoittaa tekoälyn puhetekniikoiden epäeettistä käyttöä. Viime kuussa Federal Communications Commission kielsi tekoälyääniä käyttävät robottipuhelut sen jälkeen, kun ihmiset saivat roskapostipuheluita presidentti Joe Bidenin kloonatulta tekoälyääneltä.

OpenAI:n mukaan sen kumppanit ovat sopineet käyttökäytännöstä, jonka mukaan he eivät käytä Voice Generationia esiintyä ihmisinä tai organisaatioina ilman heidän suostumustaan. Se vaatii myös kumppaneita hankkimaan alkuperäisen puhujan "nimenomainen ja tietoinen suostumus", ei luomaan tapoja yksittäisille käyttäjille luoda omia ääniä ja ilmoittamaan kuulijoille, että äänet ovat tekoälyn tuottamia. OpenAI lisäsi myös vesileimat äänileikkeisiin niiden alkuperän jäljittämiseksi ja äänen käytön ennakoimiseksi.

OpenAI on ehdottanut useita toimenpiteitä, joiden se uskoo voivan rajoittaa tällaisiin työkaluihin liittyviä riskejä, mukaan lukien äänitodennuksen asteittainen poistaminen pankkitileille pääsystä, käytännöt ihmisäänen käytön suojaamiseksi tekoälyssä, tietoisuuden lisääminen tekoälyväärennöksistä ja tekoälyn luoman sisällön seurannan kehittäminen. järjestelmät.

Lue myös:

Dzherelotheverge

Kirjaudu

1 Kommentti

Uudemmat

Vanhemmat Suosituin

Upotetut arvostelut

Näytä kaikki kommentit

Pavlo

1 kuukausi sitten

- Mikä on koirasi nimi?

1

0

Vastaus

Muut artikkelit

OpenAI:n uusi äänikloonaava tekoäly tarvitsee vain 15 sekunnin näytteen toimiakseen

Viimeaikaiset kommentit