შაბათი, 20 აპრილი, 2024 წ

დესკტოპის v4.2.1

Root NationსიახლეებიIT სიახლეებიAI გამოსახულების გენერატორს ასწავლეს მუსიკის შექმნა

AI გამოსახულების გენერატორს ასწავლეს მუსიკის შექმნა

-

ხელოვნური ინტელექტის (AI) მიერ გენერირებული მუსიკა უკვე რეალობად იქცა. ხელოვნური ინტელექტის ინსტრუმენტებს ახლა შეუძლიათ მუსიკის შექმნა ტექსტური მოთხოვნის გარდა და შედეგები გადააჭარბებს ყველა მოლოდინს.

თუმცა, ეს არ ნიშნავს იმას, რომ AI ინსტრუმენტებს შეუძლიათ პირდაპირ შექმნან მუსიკა. ამის ნაცვლად, მუსიკა გადის AI გამოსახულების გენერატორებს, რომლებიც ქმნიან მუსიკის სპექტროგრამებს. შემდეგ შეგიძლიათ გადაიყვანოთ ეს სპექტროგრამები აუდიო კლიპებად. ნიშნავს თუ არა ეს, რომ ხელოვნური ინტელექტის გენერირებული მუსიკა მომავალში ჩაანაცვლებს ადამიანის მიერ შექმნილ მუსიკას?

რიფუზია

სურათზე დაფუძნებული AI ასწავლის კომპიუტერულ ალგორითმებს ადგილების და ობიექტების სურათების ამოცნობას. ამის შემდეგ, ალგორითმები გამოიყენება მსგავსი, მაგრამ უნიკალური სურათების რეპროდუცირებისთვის. DALL-E და სტაბილური დიფუზია კარგი მაგალითებია. ამ დროისთვის, შეგიძლიათ ამ პროგრამებს აწარმოოთ ყველაფერი, რაც გსურთ. ყველაფერი ტექსტის საშუალებით!

ასე რომ, AI-ის ხელსაწყოს, რომელსაც შეუძლია შექმნას სპექტროგრამები, ეწოდება Riffusion. ეს არის უახლესი ხელოვნური ინტელექტის პროექტი და თავისი არსით არის ტექსტიდან გამოსახულების გენერატორი, რომელიც დაფუძნებულია სტაბილურ დიფუზიაზე (სტაბილური დიფუზია). მაგრამ როგორ გახდა მან მუსიკის გენერირების უნარი?

რიფუზია

Riffusion-ის უკან არიან რობოტი ჰეიკ მარტიროსი და პროგრამული უზრუნველყოფის შემქმნელი სეტ ფორსგრენი. მათ სურდათ შეემოწმებინათ, შეუძლია თუ არა თანამედროვე AI პროგრამებს მუშაობა აუდიო სფეროში. ასე დაიწყო Riffusion-ის მუსიკალური მოგზაურობა. ფორსგრენი ტექნოლოგიაზე ასე საუბრობს: „მე და ჰეიკი ერთად ვუკრავთ პატარა ჯგუფში და პროექტი დავიწყეთ მხოლოდ იმიტომ, რომ გვიყვარს მუსიკა. სურათის გენერირებისთვის Stable Diffusion-ის განსაცვიფრებელი შედეგების ნახვის შემდეგ, საკუთარ თავს ვკითხეთ, როგორი იქნებოდა დიფუზიური მიდგომის გამოყენება მუსიკის შესაქმნელად?

ამის გასარკვევად, ორკაციანმა გუნდმა გაწვრთნა ღია კოდის სტაბილური დიფუზია სპექტროგრამის სურათებზე. ისინი გაერთიანდა ტექსტთან. ამის შემდეგ პროგრამამ შეძლო მუსიკის სპექტროგრამების შექმნა გარკვეული მინიშნებების საფუძველზე.

თავიდან მათ არ იცოდნენ, შეეძლო თუ არა სტაბილური დიფუზიის მოდელის არქიტექტურას სპექტროგრამის გამოსახულების შექმნა საკმარისი სიზუსტით აუდიოზე გადასაყვანად, მაგრამ აღმოჩნდა, რომ მას შეეძლო ამის გაკეთება და მეტი. მარტიროსმა და ფორსგრენმა შედეგები გამოაქვეყნეს ოფიციალურ Riffusion-ის ვებსაიტზე. თავიდან ეს იყო ჰობი პროექტი. მაგრამ ახლა ვიზიტორებს შეუძლიათ დაამატოთ საკუთარი ტექსტური რჩევები. ეს აიძულებს Riffusion-ს შექმნას სპექტროგრამა. მოგვიანებით, ვიზიტორებს შეუძლიათ გამოიყენონ ის აუდიო კლიპად და დაუკრას საიტზე.

შედეგები ამ ეტაპზე შეიძლება არ იყოს ძალიან მაღალი ხარისხის. მაგრამ ეს ნამდვილად არ არის ისეთი ცუდი, როგორც თქვენ ფიქრობთ.

Riffusion-მა ასევე შეიძლება სცადოს სიმღერების დაკვრა, რომელიც მოიცავს რეპი ემინემის სტილში და K-Pop. მაგრამ ლექსების გენერირების ფუნქცია არც ისე კარგია. ტექსტის ნაცვლად მოისმენთ მელოდიური ადამიანური ჭკუას. მაგრამ ყველაზე საინტერესო ის არის, რომ ეს სისულელე მაინც ემთხვევა სიმღერის ტონს.

ეს ტექნოლოგია ჯერ არ არის მზად ადამიანის მიერ შექმნილი მუსიკის ჩასანაცვლებლად. მაგრამ პროექტმა დაგვანახა, რომ AI გამოსახულების დამუშავების ალგორითმებს ჯერ კიდევ დიდი პოტენციალი აქვთ. მალე ის შეიძლება გახდეს მუსიკის ავტორების ასისტენტი. იქნებ რაიმე შთაგონება მიიღო სიმღერის დასაწერად.

თქვენ შეგიძლიათ დაეხმაროთ უკრაინას რუსი დამპყრობლების წინააღმდეგ ბრძოლაში. ამის საუკეთესო გზაა უკრაინის შეიარაღებული ძალებისთვის თანხების შემოწირულობა Savelife ან ოფიციალური გვერდის საშუალებით NBU.

ჯერილოgizchina
დარეგისტრირდით
შეატყობინეთ შესახებ
სასტუმრო

0 კომენტარები
ჩაშენებული მიმოხილვები
ყველა კომენტარის ნახვა
სხვა სტატიები
გამოიწერეთ განახლებები
პოპულარული ახლა