Root NationВестиИТ вестиГенератор на слики со вештачка интелигенција беше научен да создава музика

Генератор на слики со вештачка интелигенција беше научен да создава музика

-

Музиката генерирана од вештачка интелигенција (AI) веќе стана реалност. Алатките за вештачка интелигенција сега можат да создаваат музика со ништо друго освен текстуално известување и резултатите ги надминуваат сите очекувања.

Сепак, тоа не значи дека алатките за вештачка интелигенција можат директно да создаваат музика. Наместо тоа, музиката поминува низ генератори на слики со вештачка интелигенција кои создаваат спектрограми на музиката. Потоа можете да ги конвертирате овие спектрограми во аудио клипови. Дали ова значи дека музиката генерирана од вештачка интелигенција во иднина ќе ја замени музиката создадена од човекот?

Рифузија

Вештачката интелигенција базирана на слики ги учи компјутерските алгоритми да препознаваат слики од места и предмети. После тоа, алгоритмите се користат за репродукција на слични, но уникатни слики. DALL-E и Stable Diffusion се добри примери. Засега, можете да направите овие програми да прикажуваат што сакате. Сите преку текст!

Значи, алатката за вештачка интелигенција која може да создаде спектрограми се нарекува Riffusion. Ова е најновиот проект за вештачка интелигенција и во својата суштина е генератор на слики од текст базиран на стабилна дифузија (Stable Diffusion). Но, како стана способен да генерира музика?

Рифузија

Зад Riffusion се роботичарот Хеик Мартирос и развивачот на софтвер Сет Форсгрен. Тие сакаа да тестираат дали современите програми за вештачка интелигенција можат да работат на аудио поле. Така започна патувањето на Riffusion за правење музика. Форсгрен зборува за технологијата вака: „Јас и Хејк свириме заедно во мал бенд, а проектот го започнавме само затоа што ја сакаме музиката. Откако ги видовме зачудувачките резултати на Стабилна дифузија за генерирање слики, се запрашавме како би изгледало да се користи дифузен пристап за создавање музика?

За да дознаеме, тим од двајца ја обучувале стабилната дифузија со отворен код на слики од спектрограм. Тие беа комбинирани со текстот. После тоа, програмата можеше да создаде спектрограми на музика врз основа на одредени индиции.

Отпрвин, тие не знаеја дали архитектурата на моделот Stable Diffusion може да создаде спектрограмска слика со доволно точност за да се претвори во аудио, но се покажа дека може да го направи тоа и повеќе. Мартирос и Форсгрен ги објавија своите резултати на официјалната веб-страница на Riffusion. Отпрвин тоа беше проект за хоби. Но, сега посетителите можат да додадат свои совети за текст. Ова ќе го принуди Riffusion да генерира спектрограм. Подоцна, посетителите можат да го користат како аудио клип и да го пуштат на страницата.

Резултатите во оваа фаза можеби не се со многу висок квалитет. Но, дефинитивно не е толку лошо како што мислите.

Riffusion исто така може да се обиде да репродуцира песни што вклучуваат рап во стилот на Еминем и К-Поп. Но, функцијата за генерирање на текстови не е толку добра. Наместо текст, ќе слушнете милозвучни човечки глупости. Но, она што е најинтересно е што овој глупост сепак одговара на тонот на песната.

Оваа технологија сè уште не е подготвена да ја замени музиката создадена од човекот. Но, проектот ни покажа дека алгоритмите за обработка на слики со вештачка интелигенција сè уште имаат голем потенцијал. Наскоро може да стане асистент за музички автори. Можеби за да добијам некоја инспирација да напишам песна.

Можете да и помогнете на Украина да се бори против руските напаѓачи. Најдобар начин да го направите ова е да донирате средства за вооружените сили на Украина преку Савелифе или преку официјалната страница Bвезди.

Jerelogizchina
Пријавете се
Известете за
гостин

0 коментари
Вградени критики
Прикажи ги сите коментари
Други статии
Претплатете се за ажурирања
Популарно сега