Vineri, 29 martie 2024

desktop v4.2.1

Root NationНовиниștiri ITUn generator de imagini AI a fost învățat să creeze muzică

Un generator de imagini AI a fost învățat să creeze muzică

-

Muzica generată de inteligența artificială (AI) a devenit deja realitate. Instrumentele AI pot crea acum muzică cu doar un mesaj text, iar rezultatele depășesc toate așteptările.

Cu toate acestea, acest lucru nu înseamnă că instrumentele AI pot crea direct muzică. În schimb, muzica trece prin generatoare de imagini AI care creează spectrograme ale muzicii. Puteți apoi converti aceste spectrograme în clipuri audio. Înseamnă asta că muzica generată de AI va înlocui muzica creată de om în viitor?

Rifuzie

Inteligența artificială bazată pe imagini învață algoritmii de computer să recunoască imaginile locurilor și obiectelor. După aceea, algoritmii sunt utilizați pentru a reproduce imagini similare, dar unice. DALL-E și Stable Diffusion sunt exemple bune. Deocamdată, puteți face ca aceste programe să redea orice doriți. Tot prin text!

Deci, instrumentul AI care poate crea spectrograme se numește Riffusion. Acesta este cel mai recent proiect AI și, în esență, este un generator de imagini din text bazat pe difuzie stabilă (Stable Diffusion). Dar cum a devenit capabil să genereze muzică?

Rifuzie

În spatele Riffusion se află roboticianul Heik Martiros și dezvoltatorul de software Seth Forsgren. Au vrut să testeze dacă programele moderne de inteligență artificială ar putea funcționa în domeniul audio. Astfel a început călătoria muzicală a lui Riffusion. Forsgren vorbește despre tehnologie astfel: „Hake și cu mine cântăm într-o trupă mică împreună și am început proiectul doar pentru că ne place muzica. După ce am văzut rezultatele uimitoare ale Stable Diffusion pentru generarea de imagini, ne-am întrebat cum ar arăta să folosim o abordare de difuzie pentru a crea muzică?

Pentru a afla, o echipă de doi a instruit Stable Diffusion cu sursă deschisă pe imagini spectrograme. Au fost combinate cu textul. După aceea, programul a putut crea spectrograme de muzică pe baza anumitor indicii.

La început, nu știau dacă arhitectura modelului Stable Diffusion ar putea crea o imagine spectrogramă cu suficientă acuratețe pentru a fi convertită în audio, dar s-a dovedit că ar putea face asta și multe altele. Martiros și Forsgren și-au publicat rezultatele pe site-ul oficial Riffusion. La început a fost un proiect de hobby. Dar acum vizitatorii își pot adăuga propriile sfaturi text. Acest lucru va forța Riffusion să genereze o spectrogramă. Ulterior, vizitatorii îl pot folosi ca clip audio și îl pot reda pe site.

Rezultatele în această etapă pot să nu fie de foarte înaltă calitate. Dar cu siguranță nu este atât de rău pe cât ai putea crede.

Riffusion poate încerca, de asemenea, să redea melodii care includ rap în stilul lui Eminem și K-Pop. Dar funcția de a genera versuri nu este atât de bună. În loc de text, veți auzi melodiosuri omenești. Dar cel mai interesant lucru este că această farfurie încă se potrivește cu tonul melodiei.

Această tehnologie nu este încă pregătită să înlocuiască muzica creată de om. Dar proiectul ne-a arătat că algoritmii de procesare a imaginilor AI au încă un potențial mare. În curând poate deveni asistent pentru autorii muzicali. Poate pentru a obține ceva inspirație pentru a scrie o melodie.

Poți ajuta Ucraina să lupte împotriva invadatorilor ruși. Cel mai bun mod de a face acest lucru este să donați fonduri Forțelor Armate ale Ucrainei prin intermediul Salveaza viata sau prin pagina oficiala NBU.

Dzherelogizchina
Inscrie-te
Notifică despre
oaspete

0 Comentarii
Recenzii încorporate
Vezi toate comentariile
Alte articole
Abonați-vă pentru actualizări

Comentarii recente

Popular acum
0
Ne plac gândurile voastre, vă rugăm să comentați.x