Četvrtak, 28

desktop v4.2.1

Root NationVijestiIT vijestiGenerator AI slike je naučen da stvara muziku

Generator AI slike je naučen da stvara muziku

-

Muzika koju generiše veštačka inteligencija (AI) već je postala stvarnost. AI alati sada mogu stvarati muziku samo sa tekstualnim upitom, a rezultati nadmašuju sva očekivanja.

Međutim, to ne znači da AI alati mogu direktno kreirati muziku. Umjesto toga, muzika prolazi kroz AI generatore slika koji kreiraju spektrograme muzike. Zatim možete pretvoriti ove spektrograme u audio zapise. Da li to znači da će muzika generisana umjetnom inteligencijom zamijeniti muziku koju je napravio čovjek u budućnosti?

Rifuzija

AI zasnovana na slikama uči kompjuterske algoritme da prepoznaju slike mjesta i objekata. Nakon toga, algoritmi se koriste za reprodukciju sličnih, ali jedinstvenih slika. DALL-E i Stable Diffusion su dobri primjeri. Za sada možete učiniti da ovi programi prikazuju sve što želite. Cijeli tekst!

Dakle, AI alat koji može kreirati spektrograme zove se Riffusion. Ovo je najnoviji AI projekat, i u svojoj suštini je generator slika iz teksta zasnovan na stabilnoj difuziji (Stable Diffusion). Ali kako je postao sposoban da stvara muziku?

Rifuzija

Iza Riffusiona stoje robotičar Heik Martiros i programer softvera Seth Forsgren. Željeli su testirati mogu li moderni AI programi raditi u audio polju. Tako je počelo Riffusionovo muzičko putovanje. Forsgren ovako govori o tehnologiji: „Hake i ja zajedno sviramo u malom bendu, a pokrenuli smo projekat samo zato što volimo muziku. Nakon što smo vidjeli zapanjujuće rezultate Stable Diffusion za generiranje slika, zapitali smo se kako bi izgledalo korištenje pristupa difuzije za stvaranje muzike?

Da bi to saznao, tim od dvoje obučavao je Stable Diffusion otvorenog koda na slikama spektrograma. Kombinovane su sa tekstom. Nakon toga, program je mogao da kreira spektrograme muzike na osnovu određenih tragova.

U početku nisu znali da li arhitektura modela Stable Diffusion može stvoriti sliku spektrograma s dovoljno preciznosti da se pretvori u audio, ali se pokazalo da može to i više. Martiros i Forsgren objavili su svoje rezultate na službenoj web stranici Riffusiona. U početku je to bio hobi projekat. Ali sada posjetitelji mogu dodati svoje tekstualne savjete. Ovo će primorati Riffusion da generiše spektrogram. Kasnije ga posjetitelji mogu koristiti kao audio klip i puštati ga na stranici.

Rezultati u ovoj fazi možda neće biti vrlo kvalitetni. Ali definitivno nije tako loše kao što mislite.

Riffusion takođe može pokušati da pusti pesme koje uključuju rep u stilu Eminema i K-Pop. Ali funkcija generiranja tekstova nije tako dobra. Umjesto teksta, čut ćete melodične ljudske brbljarije. Ali najzanimljivije je da ovo brbljanje i dalje odgovara tonu pjesme.

Ova tehnologija još nije spremna da zameni muziku koju je napravio čovek. Ali projekat nam je pokazao da algoritmi za obradu slike AI i dalje imaju veliki potencijal. Uskoro može postati asistent muzičkim autorima. Možda da dobijem inspiraciju da napišem pjesmu.

Možete pomoći Ukrajini u borbi protiv ruskih osvajača. Najbolji način da to učinite je da donirate sredstva Oružanim snagama Ukrajine putem Savelife ili preko službene stranice NBU.

Jerelogizchina
Prijaviti se
Obavijesti o
gost

0 Komentari
Embedded Reviews
Pogledaj sve komentare
Ostali članci
Pretplatite se na ažuriranja

Nedavni komentari

Popularno sada
0
Sviđaju nam se vaše misli, molim vas komentarišite.x