Root NationHaberlerBT haberleriBir AI görüntü oluşturucuya müzik oluşturması öğretildi

Bir AI görüntü oluşturucuya müzik oluşturması öğretildi

-

Yapay zeka (AI) tarafından üretilen müzik şimdiden gerçek oldu. AI araçları artık yalnızca bir metin istemi ile müzik oluşturabilir ve sonuçlar tüm beklentileri aşıyor.

Ancak bu, AI araçlarının doğrudan müzik oluşturabileceği anlamına gelmez. Bunun yerine müzik, müziğin spektrogramlarını oluşturan AI görüntü oluşturuculardan geçer. Daha sonra bu spektrogramları ses kliplerine dönüştürebilirsiniz. Bu, AI tarafından üretilen müziğin gelecekte insan yapımı müziğin yerini alacağı anlamına mı geliyor?

dağılma

Görüntü tabanlı AI, bilgisayar algoritmalarına yerlerin ve nesnelerin görüntülerini tanımayı öğretir. Bundan sonra, benzer ancak benzersiz görüntüleri yeniden üretmek için algoritmalar kullanılır. DALL-E ve Kararlı Difüzyon iyi örneklerdir. Şimdilik, bu programların istediğiniz her şeyi oluşturmasını sağlayabilirsiniz. Metin yoluyla!

Yani spektrogram oluşturabilen AI aracına Riffusion denir. Bu en son yapay zeka projesidir ve özünde kararlı difüzyona (Stabil Difüzyon) dayalı metinden bir görüntü oluşturucusudur. Ama nasıl müzik üretme yeteneğine sahip oldu?

dağılma

Riffusion'ın arkasında robotist Heik Martiros ve yazılım geliştiricisi Seth Forsgren var. Modern AI programlarının ses alanında çalışıp çalışamayacağını test etmek istediler. Böylece Riffusion'ın müzik yapma yolculuğu başladı. Forsgren teknoloji hakkında şöyle konuşuyor: “Hake ve ben birlikte küçük bir grupta çalıyoruz ve müziği sevdiğimiz için projeye başladık. Stable Diffusion'ın görüntü üretimi için çarpıcı sonuçlarını gördükten sonra, müzik yaratmak için bir difüzyon yaklaşımı kullanmanın nasıl bir şey olacağını kendimize sorduk.

Öğrenmek için iki kişilik bir ekip, açık kaynaklı Stable Difusion'ı spektrogram görüntüleri üzerinde eğitti. Metinle birleştirildiler. Bundan sonra program, belirli ipuçlarına dayalı olarak müzik spektrogramları oluşturabildi.

İlk başta, Kararlı Difüzyon modeli mimarisinin sese dönüştürmek için yeterli doğrulukta bir spektrogram görüntüsü oluşturup oluşturamayacağını bilmiyorlardı, ancak bunu ve daha fazlasını yapabileceği ortaya çıktı. Martiros ve Forsgren sonuçlarını resmi Riffusion web sitesinde yayınladılar. İlk başta bir hobi projesiydi. Ancak artık ziyaretçiler kendi metin ipuçlarını ekleyebilir. Bu, Riffusion'ı bir spektrogram oluşturmaya zorlayacaktır. Daha sonra ziyaretçiler bunu bir ses klibi olarak kullanabilir ve sitede oynatabilir.

Bu aşamadaki sonuçlar çok yüksek kalitede olmayabilir. Ama kesinlikle düşündüğünüz kadar kötü değil.

Riffusion, aşağıdakileri içeren şarkıları da çalmayı deneyebilir: Eminem tarzında rap ve K-Pop. Ancak söz üretme işlevi o kadar iyi değil. Metin yerine, melodik insan saçmalıkları duyacaksınız. Ama en ilginç olanı, bu anlamsızlığın hala şarkının tonuna uyması.

Bu teknoloji henüz insan yapımı müziğin yerini almaya hazır değil. Ancak proje bize AI görüntü işleme algoritmalarının hala büyük bir potansiyele sahip olduğunu gösterdi. Yakında müzik yazarları için asistan olabilir. Belki bir şarkı yazmak için ilham almak için.

Ukrayna'nın Rus işgalcilerine karşı savaşmasına yardım edebilirsiniz. Bunu yapmanın en iyi yolu, Ukrayna Silahlı Kuvvetlerine bağış yapmaktır. Hayat kurtarmak veya resmi sayfa aracılığıyla NBU.

Dzherelogizchina
Üye olmak
hakkında bilgilendir
konuk

0 Yorumlar
Gömülü İncelemeler
Tüm yorumları görüntüle
Diğer makaleler
Güncellemeler için abone olun
Şimdi popüler