Një gjenerator imazhi i AI u mësua të krijonte muzikë

Muzika e gjeneruar nga inteligjenca artificiale (AI) tashmë është bërë realitet. Mjetet e inteligjencës artificiale tani mund të krijojnë muzikë vetëm me një mesazh teksti dhe rezultatet tejkalojnë të gjitha pritjet.

Sidoqoftë, kjo nuk do të thotë që mjetet e AI mund të krijojnë drejtpërdrejt muzikë. Në vend të kësaj, muzika kalon përmes gjeneratorëve të imazhit të AI që krijojnë spektrograme të muzikës. Më pas mund t'i konvertoni këto spektrograme në klipe audio. A do të thotë kjo se muzika e krijuar nga AI do të zëvendësojë muzikën e krijuar nga njeriu në të ardhmen?

AI i bazuar në imazhe mëson algoritmet kompjuterike për të njohur imazhet e vendeve dhe objekteve. Pas kësaj, algoritmet përdoren për të riprodhuar imazhe të ngjashme, por unike. DALL-E dhe Stable Diffusion janë shembuj të mirë. Tani për tani, ju mund t'i bëni këto programe të japin gjithçka që dëshironi. Gjithçka përmes tekstit!

Pra, mjeti i AI që mund të krijojë spektrogramë quhet Riffusion. Ky është projekti më i fundit i AI, dhe në thelb, është një gjenerues i imazheve nga teksti i bazuar në difuzion të qëndrueshëm (Stable Diffusion). Por si u bë ai i aftë për të gjeneruar muzikë?

Pas Riffusion janë robotisti Heik Martiros dhe zhvilluesi i softuerit Seth Forsgren. Ata donin të testonin nëse programet moderne të AI mund të funksiononin në fushën audio. Kështu filloi udhëtimi i Riffusion për të bërë muzikë. Forsgren flet për teknologjinë si kjo: “Unë dhe Hake luajmë në një grup të vogël së bashku dhe e filluam projektin vetëm sepse e duam muzikën. Pasi pamë rezultatet mahnitëse të Stable Diffusion për gjenerimin e imazheve, ne pyetëm veten se si do të dukej të përdornim një qasje difuzioni për të krijuar muzikë?

Për të zbuluar, një ekip prej dy personash trajnuan Difuzionin e Qëndrueshëm me burim të hapur mbi imazhet e spektrogramit. Ato u kombinuan me tekstin. Pas kësaj, programi ishte në gjendje të krijonte spektrograme të muzikës bazuar në të dhëna të caktuara.

Në fillim, ata nuk e dinin nëse arkitektura e modelit Stable Diffusion mund të krijonte një imazh spektrogram me saktësi të mjaftueshme për t'u kthyer në audio, por doli se mund ta bënte këtë dhe më shumë. Martiros dhe Forsgren publikuan rezultatet e tyre në faqen zyrtare të Riffusion. Në fillim ishte një projekt hobi. Por tani vizitorët mund të shtojnë këshillat e tyre për tekstin. Kjo do të detyrojë Riffusion të gjenerojë një spektrogram. Më vonë, vizitorët mund ta përdorin atë si një videoklip dhe ta luajnë atë në faqe.

Rezultatet në këtë fazë mund të mos jenë të një cilësie shumë të lartë. Por definitivisht nuk është aq e keqe sa mund të mendoni.

Riffusion mund të përpiqet gjithashtu të luajë këngë që përfshijnë rap në stilin e Eminem dhe K-Pop. Por funksioni i gjenerimit të teksteve nuk është aq i mirë. Në vend të tekstit, do të dëgjoni gërmadha melodioze njerëzore. Por gjëja më interesante është se kjo dërdëllitje përputhet ende me tonin e këngës.

Kjo teknologji nuk është ende gati të zëvendësojë muzikën e krijuar nga njeriu. Por projekti na tregoi se algoritmet e përpunimit të imazhit të AI kanë ende një potencial të madh. Së shpejti mund të bëhet një asistent për autorët e muzikës. Ndoshta për të marrë një frymëzim për të shkruar një këngë.

Ju mund ta ndihmoni Ukrainën të luftojë kundër pushtuesve rusë. Mënyra më e mirë për ta bërë këtë është të dhuroni fonde për Forcat e Armatosura të Ukrainës përmes Savelife ose përmes faqes zyrtare NBU.

Gjithashtu interesante:

Burimigizchina

Regjistrohu

0 Comments

Shqyrtime të ngulitura

Shiko të gjitha komentet

Artikuj të tjerë

Një gjenerator imazhi i AI u mësua të krijonte muzikë

Komentet e fundit