Četvrtak, 28. ožujka 2024

desktop v4.2.1

Root NationНовиниIT vijestiAI generator slike naučen je stvarati glazbu

AI generator slike naučen je stvarati glazbu

-

Glazba koju stvara umjetna inteligencija (AI) već je postala stvarnost. AI alati sada mogu stvarati glazbu samo uz tekstualni upit, a rezultati premašuju sva očekivanja.

Međutim, to ne znači da AI alati mogu izravno stvarati glazbu. Umjesto toga, glazba prolazi kroz AI generatore slike koji stvaraju spektrograme glazbe. Zatim možete pretvoriti te spektrograme u audio zapise. Znači li to da će glazba generirana umjetnom inteligencijom u budućnosti zamijeniti glazbu koju stvaraju ljudi?

Rifuzija

AI temeljena na slikama uči računalne algoritme da prepoznaju slike mjesta i objekata. Nakon toga se koriste algoritmi za reprodukciju sličnih, ali jedinstvenih slika. DALL-E i Stable Diffusion dobri su primjeri. Za sada možete učiniti da ti programi prikazuju što god želite. Sve kroz tekst!

Dakle, AI alat koji može stvoriti spektrograme zove se Riffusion. Ovo je najnoviji AI projekt, au svojoj suštini je generator slika iz teksta temeljen na stabilnoj difuziji (Stable Diffusion). Ali kako je postao sposoban stvarati glazbu?

Rifuzija

Iza Riffusiona stoje robotičar Heik Martiros i programer Seth Forsgren. Željeli su testirati mogu li moderni AI programi raditi u audio polju. Tako je započeo Riffusionov glazbeni put. Forsgren o tehnologiji govori ovako: “Hake i ja zajedno sviramo u malom bendu, a projekt smo pokrenuli samo zato što volimo glazbu. Nakon što smo vidjeli zapanjujuće rezultate Stable Diffusion za stvaranje slike, zapitali smo se kako bi izgledalo koristiti pristup difuzije za stvaranje glazbe?

Kako bi to otkrili, tim od dvoje obučavao je Stable Diffusion otvorenog koda na slikama spektrograma. Kombinirali su se s tekstom. Nakon toga, program je mogao stvoriti spektrograme glazbe na temelju određenih tragova.

Isprva nisu znali može li arhitektura modela Stable Diffusion stvoriti sliku spektrograma s dovoljnom točnošću da se pretvori u zvuk, ali pokazalo se da može učiniti to i više. Martiros i Forsgren objavili su svoje rezultate na službenoj stranici Riffusion. U početku je to bio projekt iz hobija. Ali sada posjetitelji mogu dodati vlastite tekstualne savjete. Ovo će prisiliti Riffusion da generira spektrogram. Kasnije ga posjetitelji mogu koristiti kao audio isječak i reproducirati ga na stranici.

Rezultati u ovoj fazi možda neće biti vrlo visoke kvalitete. Ali definitivno nije tako loše kao što možda mislite.

Riffusion također može pokušati reproducirati pjesme koje uključuju rap u stilu Eminema i K-Pop. Ali funkcija generiranja tekstova nije tako dobra. Umjesto teksta, čut ćete melodično ljudsko brbljanje. Ali najzanimljivije je to što ovo brbljanje ipak odgovara tonu pjesme.

Ova tehnologija još nije spremna zamijeniti glazbu koju stvaraju ljudi. Ali projekt nam je pokazao da AI algoritmi za obradu slika još uvijek imaju veliki potencijal. Uskoro može postati pomoćnik autorima glazbe. Možda da dobijem inspiraciju da napišem pjesmu.

Možete pomoći Ukrajini u borbi protiv ruskih osvajača. Najbolji način da to učinite je donirati sredstva Oružanim snagama Ukrajine putem Savelife ili putem službene stranice NBU.

Prijavite se
Obavijesti o
gost

0 Komentari
Ugrađene recenzije
Pogledaj sve komentare
Ostali članci
Pretplatite se na ažuriranja

Nedavni komentari

Sada popularno
0
Sviđaju nam se vaša razmišljanja, komentirajte.x