शुक्रवार, 26 अप्रैल 2024

डेस्कटॉप v4.2.1

Root Nationसमाचारआईटी अखबारसंगीत बनाने के लिए एक एआई छवि जनरेटर सिखाया गया था

संगीत बनाने के लिए एक एआई छवि जनरेटर सिखाया गया था

-

आर्टिफिशियल इंटेलिजेंस (एआई) द्वारा उत्पन्न संगीत पहले ही एक वास्तविकता बन चुका है। एआई उपकरण अब टेक्स्ट प्रॉम्प्ट के अलावा और कुछ नहीं के साथ संगीत बना सकते हैं और परिणाम सभी अपेक्षाओं से अधिक हैं।

हालाँकि, इसका मतलब यह नहीं है कि AI उपकरण सीधे संगीत बना सकते हैं। इसके बजाय, संगीत एआई इमेज जेनरेटर के माध्यम से जाता है जो संगीत के स्पेक्ट्रोग्राम बनाते हैं। फिर आप इन स्पेक्ट्रोग्राम को ऑडियो क्लिप में बदल सकते हैं। क्या इसका मतलब यह है कि एआई-जनित संगीत भविष्य में मानव निर्मित संगीत की जगह ले लेगा?

रिफ्यूजन

छवि-आधारित एआई कंप्यूटर एल्गोरिदम को स्थानों और वस्तुओं की छवियों को पहचानने के लिए सिखाता है। उसके बाद, समान लेकिन अद्वितीय छवियों को पुन: उत्पन्न करने के लिए एल्गोरिदम का उपयोग किया जाता है। DALL-E और स्थिर प्रसार इसके अच्छे उदाहरण हैं। अभी के लिए, आप इन प्रोग्रामों को अपनी इच्छानुसार कुछ भी प्रस्तुत कर सकते हैं। पूरे पाठ के माध्यम से!

तो, एआई उपकरण जो स्पेक्ट्रोग्राम बना सकता है, रिफ्यूजन कहलाता है। यह नवीनतम एआई परियोजना है, और इसके सार में, यह स्थिर प्रसार (स्थिर प्रसार) पर आधारित पाठ से छवियों का एक जनरेटर है। लेकिन वह संगीत पैदा करने में कैसे सक्षम हुआ?

रिफ्यूजन

रिफ्यूजन के पीछे रोबोटिस्ट हेइक मार्टिरोस और सॉफ्टवेयर डेवलपर सेठ फोर्सग्रेन हैं। वे परीक्षण करना चाहते थे कि आधुनिक एआई प्रोग्राम ऑडियो क्षेत्र में काम कर सकते हैं या नहीं। इस प्रकार रिफ्यूज़न की संगीत-निर्माण यात्रा शुरू हुई। फोर्सग्रेन इस तरह की तकनीक के बारे में बात करता है: "हेक और मैं एक साथ एक छोटे से बैंड में खेलते हैं, और हमने प्रोजेक्ट सिर्फ इसलिए शुरू किया क्योंकि हम संगीत से प्यार करते हैं। छवि निर्माण के लिए स्थिर प्रसार के आश्चर्यजनक परिणामों को देखने के बाद, हमने खुद से पूछा कि संगीत बनाने के लिए प्रसार दृष्टिकोण का उपयोग करना कैसा लगेगा?

पता लगाने के लिए, दो की एक टीम ने स्पेक्ट्रोग्राम छवियों पर ओपन-सोर्स स्थिर प्रसार को प्रशिक्षित किया। उन्हें पाठ के साथ जोड़ा गया। उसके बाद, कार्यक्रम कुछ सुरागों के आधार पर संगीत के स्पेक्ट्रोग्राम बनाने में सक्षम था।

सबसे पहले, वे नहीं जानते थे कि स्थिर प्रसार मॉडल आर्किटेक्चर ऑडियो में कनवर्ट करने के लिए पर्याप्त सटीकता के साथ एक स्पेक्ट्रोग्राम छवि बना सकता है, लेकिन यह पता चला कि यह ऐसा कर सकता है और बहुत कुछ कर सकता है। मार्टिरोस और फोर्सग्रेन ने अपने परिणाम आधिकारिक रिफ्यूजन वेबसाइट पर प्रकाशित किए। पहले यह एक हॉबी प्रोजेक्ट था। लेकिन अब विज़िटर अपनी खुद की टेक्स्ट टिप्स जोड़ सकते हैं। यह रिफ्यूज़न को एक स्पेक्ट्रोग्राम उत्पन्न करने के लिए बाध्य करेगा। बाद में, आगंतुक इसे ऑडियो क्लिप के रूप में उपयोग कर सकते हैं और इसे साइट पर चला सकते हैं।

इस स्तर पर परिणाम बहुत उच्च गुणवत्ता वाले नहीं हो सकते हैं। लेकिन यह निश्चित रूप से उतना बुरा नहीं है जितना आप सोच सकते हैं।

रिफ्यूज़न भी शामिल गीतों को चलाने का प्रयास कर सकता है एमिनेम की शैली में रैप और के-पॉप। लेकिन बोल पैदा करने का काम उतना अच्छा नहीं है। पाठ के बजाय, आप मधुर मानव जिबरिश सुनेंगे। लेकिन सबसे दिलचस्प बात यह है कि यह जिबरिश अब भी गाने के लहजे से मेल खाती है।

यह तकनीक अभी तक मानव निर्मित संगीत को बदलने के लिए तैयार नहीं है। लेकिन परियोजना ने हमें दिखाया कि एआई इमेज प्रोसेसिंग एल्गोरिदम में अभी भी काफी संभावनाएं हैं। जल्द ही यह संगीत लेखकों का सहायक बन सकता है। शायद गीत लिखने के लिए कुछ प्रेरणा पाने के लिए।

आप यूक्रेन को रूसी आक्रमणकारियों से लड़ने में मदद कर सकते हैं। ऐसा करने का सबसे अच्छा तरीका यूक्रेन के सशस्त्र बलों को धन दान करना है जीवन बचाएं या आधिकारिक पेज के माध्यम से NBU.

स्रोतgizchina
साइन अप करें
के बारे में सूचित करें
अतिथि

0 टिप्पणियाँ
एंबेडेड समीक्षा
सभी टिप्पणियाँ देखें
अपडेट के लिए सब्सक्राइब करें