ດົນຕີທີ່ສ້າງຂຶ້ນໂດຍປັນຍາປະດິດ (AI) ໄດ້ກາຍເປັນຄວາມເປັນຈິງແລ້ວ. ດຽວນີ້ເຄື່ອງມື AI ສາມາດສ້າງດົນຕີໂດຍບໍ່ມີຫຍັງນອກ ເໜືອ ຈາກການກະຕຸ້ນຂໍ້ຄວາມແລະຜົນໄດ້ຮັບເກີນຄວາມຄາດຫວັງ.
ຢ່າງໃດກໍຕາມ, ນີ້ບໍ່ໄດ້ຫມາຍຄວາມວ່າເຄື່ອງມື AI ສາມາດສ້າງດົນຕີໂດຍກົງ. ແທນທີ່ຈະ, ດົນຕີຜ່ານເຄື່ອງສ້າງຮູບພາບ AI ທີ່ສ້າງ spectrograms ຂອງດົນຕີ. ຫຼັງຈາກນັ້ນທ່ານສາມາດປ່ຽນ spectrograms ເຫຼົ່ານີ້ເຂົ້າໄປໃນຄລິບສຽງ. ນີ້ຫມາຍຄວາມວ່າດົນຕີທີ່ສ້າງໂດຍ AI ຈະທົດແທນດົນຕີທີ່ສ້າງຂຶ້ນໂດຍມະນຸດໃນອະນາຄົດບໍ?
AI ທີ່ອີງໃສ່ຮູບພາບສອນ algorithms ຄອມພິວເຕີເພື່ອຮັບຮູ້ຮູບພາບຂອງສະຖານທີ່ແລະວັດຖຸ. ຫຼັງຈາກນັ້ນ, ສູດການຄິດໄລ່ໄດ້ຖືກນໍາໃຊ້ເພື່ອຜະລິດຮູບພາບທີ່ຄ້າຍຄືກັນແຕ່ເປັນເອກະລັກ. DALL-E ແລະ Stable Diffusion ເປັນຕົວຢ່າງທີ່ດີ. ສໍາລັບໃນປັດຈຸບັນ, ທ່ານສາມາດເຮັດໃຫ້ໂຄງການເຫຼົ່ານີ້ສະແດງສິ່ງທີ່ທ່ານຕ້ອງການ. ທັງຫມົດຜ່ານຂໍ້ຄວາມ!
ດັ່ງນັ້ນ, ເຄື່ອງມື AI ທີ່ສາມາດສ້າງ spectrograms ໄດ້ຖືກເອີ້ນວ່າ Riffusion. ນີ້ແມ່ນໂຄງການ AI ຫລ້າສຸດ, ແລະໃນຄວາມສໍາຄັນຂອງມັນ, ມັນເປັນການສ້າງຮູບພາບຈາກຂໍ້ຄວາມໂດຍອີງໃສ່ການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງ (Stable Diffusion). ແຕ່ລາວມີຄວາມສາມາດສ້າງດົນຕີໄດ້ແນວໃດ?
ເບື້ອງຫຼັງ Riffusion ແມ່ນນັກຫຸ່ນຍົນ Heik Martiros ແລະຜູ້ພັດທະນາຊອບແວ Seth Forsgren. ພວກເຂົາຕ້ອງການທົດສອບວ່າໂຄງການ AI ທີ່ທັນສະໄຫມສາມາດເຮັດວຽກຢູ່ໃນພາກສະຫນາມສຽງໄດ້. ດັ່ງນັ້ນຈຶ່ງເລີ່ມການເດີນທາງສ້າງດົນຕີຂອງ Riffusion. Forsgren ເວົ້າກ່ຽວກັບເທກໂນໂລຍີເຊັ່ນນີ້: "Hake ແລະຂ້ອຍຫຼິ້ນຢູ່ໃນແຖບຂະຫນາດນ້ອຍຮ່ວມກັນ, ແລະພວກເຮົາໄດ້ເລີ່ມຕົ້ນໂຄງການພຽງແຕ່ຍ້ອນວ່າພວກເຮົາຮັກດົນຕີ. ຫຼັງຈາກເຫັນຜົນທີ່ໜ້າຕື່ນຕາຕື່ນໃຈຂອງ Stable Diffusion ສໍາລັບການສ້າງຮູບພາບ, ພວກເຮົາຖາມຕົວເຮົາເອງວ່າໃຊ້ວິທີການກະຈາຍສຽງເພື່ອສ້າງດົນຕີແນວໃດ?
ເພື່ອຊອກຫາ, ທີມງານສອງຄົນໄດ້ຝຶກອົບຮົມການແຜ່ກະຈາຍຄວາມຫມັ້ນຄົງຂອງແຫຼ່ງເປີດໃນຮູບພາບ spectrogram. ພວກເຂົາເຈົ້າໄດ້ຖືກລວມເຂົ້າກັບຂໍ້ຄວາມ. ຫຼັງຈາກນັ້ນ, ໂຄງການດັ່ງກ່າວສາມາດສ້າງ spectrograms ຂອງດົນຕີໂດຍອີງໃສ່ຂໍ້ຄຶດທີ່ແນ່ນອນ.
ໃນຕອນທໍາອິດ, ພວກເຂົາບໍ່ຮູ້ວ່າສະຖາປັດຕະຍະກໍາຕົວແບບ Stable Diffusion ສາມາດສ້າງຮູບພາບ spectrogram ທີ່ມີຄວາມຖືກຕ້ອງພຽງພໍທີ່ຈະປ່ຽນເປັນສຽງ, ແຕ່ມັນໄດ້ຫັນອອກວ່າມັນສາມາດເຮັດໄດ້ແລະຫຼາຍກວ່ານັ້ນ. Martiros ແລະ Forsgren ເຜີຍແຜ່ຜົນໄດ້ຮັບຂອງພວກເຂົາຢູ່ໃນເວັບໄຊທ໌ Riffusion ຢ່າງເປັນທາງການ. ທໍາອິດມັນເປັນໂຄງການ hobby. ແຕ່ໃນປັດຈຸບັນນັກທ່ອງທ່ຽວສາມາດເພີ່ມຄໍາແນະນໍາຂໍ້ຄວາມຂອງຕົນເອງ. ນີ້ຈະບັງຄັບໃຫ້ Riffusion ສ້າງ spectrogram. ຕໍ່ມາ, ນັກທ່ອງທ່ຽວສາມາດໃຊ້ມັນເປັນຄລິບສຽງແລະຫຼິ້ນຢູ່ໃນເວັບໄຊທ໌.
ຜົນໄດ້ຮັບໃນຂັ້ນຕອນນີ້ອາດຈະບໍ່ມີຄຸນນະພາບສູງຫຼາຍ. ແຕ່ແນ່ນອນມັນບໍ່ຮ້າຍແຮງດັ່ງທີ່ເຈົ້າຄິດ.
Riffusion ອາດຈະພະຍາຍາມຫຼິ້ນເພງທີ່ປະກອບມີ rap ໃນແບບຂອງ Eminem ແລະ K-Pop. ແຕ່ການທໍາງານຂອງການສ້າງເນື້ອເພງແມ່ນບໍ່ດີ. ແທນທີ່ຈະເປັນຂໍ້ຄວາມ, ທ່ານຈະໄດ້ຍິນສຽງ gibberish ຂອງມະນຸດ melodious. ແຕ່ສິ່ງທີ່ຫນ້າສົນໃຈທີ່ສຸດແມ່ນ gibberish ນີ້ຍັງສອດຄ່ອງກັບໂຕນຂອງເພງໄດ້.
ເຕັກໂນໂລຊີນີ້ຍັງບໍ່ທັນມີຄວາມພ້ອມທີ່ຈະທົດແທນການດົນຕີທີ່ສ້າງໂດຍມະນຸດ. ແຕ່ໂຄງການສະແດງໃຫ້ເຫັນພວກເຮົາວ່າ AI ຂັ້ນຕອນການປະມວນຜົນຮູບພາບຍັງມີທ່າແຮງທີ່ຍິ່ງໃຫຍ່. ໃນໄວໆນີ້ມັນສາມາດກາຍເປັນຜູ້ຊ່ວຍສໍາລັບຜູ້ຂຽນດົນຕີ. ອາດຈະໄດ້ຮັບແຮງບັນດານໃຈໃນການຂຽນເພງ.
ທ່ານສາມາດຊ່ວຍ Ukraine ຕໍ່ສູ້ຕ້ານກັບ invaders ລັດເຊຍ. ວິທີທີ່ດີທີ່ສຸດເພື່ອເຮັດສິ່ງນີ້ແມ່ນການບໍລິຈາກເງິນທຶນໃຫ້ກອງປະກອບອາວຸດຂອງ Ukraine ໂດຍຜ່ານການ ຊ່ວຍຊີວິດ ຫຼືຜ່ານຫນ້າທາງການ NBU.
ຍັງຫນ້າສົນໃຈ: