29 m. kovo 2024 d., penktadienis

darbalaukis v4.2.1

Root NationNaujienosIT naujienosKurti muziką buvo išmokytas dirbtinio intelekto vaizdų generatorius

Kurti muziką buvo išmokytas dirbtinio intelekto vaizdų generatorius

-

Dirbtinio intelekto (DI) sukurta muzika jau tapo realybe. Dirbtinio intelekto įrankiai dabar gali kurti muziką naudodami tik tekstinį raginimą, o rezultatai pranoksta visus lūkesčius.

Tačiau tai nereiškia, kad AI įrankiai gali tiesiogiai kurti muziką. Vietoj to, muzika perduodama per AI vaizdo generatorius, kurie sukuria muzikos spektrogramas. Tada šias spektrogramas galite konvertuoti į garso klipus. Ar tai reiškia, kad dirbtinio intelekto sukurta muzika ateityje pakeis žmogaus sukurtą muziką?

Rifuzija

Vaizdais pagrįstas AI moko kompiuterinius algoritmus atpažinti vietų ir objektų vaizdus. Po to algoritmai naudojami panašiems, bet unikaliems vaizdams atkurti. DALL-E ir Stable Diffusion yra geri pavyzdžiai. Šiuo metu galite priversti šias programas pateikti viską, ko norite. Viskas per tekstą!

Taigi, AI įrankis, galintis kurti spektrogramas, vadinamas Riffusion. Tai naujausias AI projektas ir savo esme yra vaizdų generatorius iš teksto, paremtas stabilia difuzija (Stable Diffusion). Bet kaip jis sugebėjo kurti muziką?

Rifuzija

Už Riffusion yra robotikas Heikas Martirosas ir programinės įrangos kūrėjas Sethas Forsgrenas. Jie norėjo išbandyti, ar šiuolaikinės AI programos gali veikti garso srityje. Taip prasidėjo „Riffusion“ muzikos kūrimo kelionė. Forsgren apie technologiją kalba taip: „Mes su Hake grojame mažoje grupėje ir pradėjome projektą tik todėl, kad mėgstame muziką. Pamatę stulbinančius „Stable Diffusion“ įvaizdžio generavimo rezultatus, paklausėme savęs, kaip atrodytų naudojant difuzijos metodą kuriant muziką?

Norėdami tai išsiaiškinti, dviejų žmonių komanda apmokė atvirojo kodo stabilią difuziją spektrogramų vaizdams. Jie buvo derinami su tekstu. Po to programa, remdamasi tam tikrais įkalčiais, galėjo sukurti muzikos spektrogramas.

Iš pradžių jie nežinojo, ar „Stable Diffusion“ modelio architektūra gali sukurti pakankamai tiksliai spektrogramos vaizdą, kad būtų galima konvertuoti į garsą, tačiau paaiškėjo, kad tai gali padaryti ir daugiau. Martiros ir Forsgren paskelbė savo rezultatus oficialioje Riffusion svetainėje. Iš pradžių tai buvo hobio projektas. Tačiau dabar lankytojai gali pridėti savo teksto patarimų. Tai privers Riffusion generuoti spektrogramą. Vėliau lankytojai galės jį naudoti kaip garso klipą ir paleisti svetainėje.

Šio etapo rezultatai gali būti ne itin kokybiški. Bet tai tikrai nėra taip blogai, kaip jūs manote.

Riffusion taip pat gali bandyti leisti dainas, kuriose yra repas Eminemo stiliumi ir K-Pop. Tačiau dainų tekstų generavimo funkcija nėra tokia gera. Vietoj teksto išgirsite melodingą žmonių šneką. Tačiau įdomiausia tai, kad šis blevyzgas vis tiek atitinka dainos toną.

Ši technologija dar nėra pasirengusi pakeisti žmonių sukurtą muziką. Tačiau projektas mums parodė, kad AI vaizdo apdorojimo algoritmai vis dar turi didelį potencialą. Netrukus jis gali tapti muzikos autorių asistentu. Galbūt pasisemti įkvėpimo parašyti dainą.

Jūs galite padėti Ukrainai kovoti su Rusijos įsibrovėliais. Geriausias būdas tai padaryti – aukoti lėšas Ukrainos ginkluotosioms pajėgoms per Išgelbėk gyvybę arba per oficialų puslapį NBU.

Jerelasgizchina
Registruotis
Pranešti apie
svečias

0 komentarai
Įterptieji atsiliepimai
Žiūrėti visus komentarus
Kiti straipsniai
Prenumeruokite naujienas

Naujausi Komentarai

Dabar populiarus
0
Mums patinka jūsų mintys, pakomentuokite.x