ລົດຈັກຂອບ 30 Neo
realme 10G
Root Nationຂ່າວຂ່າວໄອທີເຄື່ອງສ້າງຮູບພາບ AI ໄດ້ຖືກສອນເພື່ອສ້າງດົນຕີ

ເຄື່ອງສ້າງຮູບພາບ AI ໄດ້ຖືກສອນເພື່ອສ້າງດົນຕີ

-

ດົນຕີທີ່ສ້າງຂຶ້ນໂດຍປັນຍາປະດິດ (AI) ໄດ້ກາຍເປັນຄວາມເປັນຈິງແລ້ວ. ດຽວນີ້ເຄື່ອງມື AI ສາມາດສ້າງດົນຕີໂດຍບໍ່ມີຫຍັງນອກ ເໜືອ ຈາກການກະຕຸ້ນຂໍ້ຄວາມແລະຜົນໄດ້ຮັບເກີນຄວາມຄາດຫວັງ.

ຢ່າງໃດກໍຕາມ, ນີ້ບໍ່ໄດ້ຫມາຍຄວາມວ່າເຄື່ອງມື AI ສາມາດສ້າງດົນຕີໂດຍກົງ. ແທນທີ່ຈະ, ດົນຕີຜ່ານເຄື່ອງສ້າງຮູບພາບ AI ທີ່ສ້າງ spectrograms ຂອງດົນຕີ. ຫຼັງຈາກນັ້ນທ່ານສາມາດປ່ຽນ spectrograms ເຫຼົ່ານີ້ເຂົ້າໄປໃນຄລິບສຽງ. ນີ້ຫມາຍຄວາມວ່າດົນຕີທີ່ສ້າງໂດຍ AI ຈະທົດແທນດົນຕີທີ່ສ້າງຂຶ້ນໂດຍມະນຸດໃນອະນາຄົດບໍ?

rifusion

AI ທີ່ອີງໃສ່ຮູບພາບສອນ algorithms ຄອມພິວເຕີເພື່ອຮັບຮູ້ຮູບພາບຂອງສະຖານທີ່ແລະວັດຖຸ. ຫຼັງຈາກນັ້ນ, ສູດການຄິດໄລ່ໄດ້ຖືກນໍາໃຊ້ເພື່ອຜະລິດຮູບພາບທີ່ຄ້າຍຄືກັນແຕ່ເປັນເອກະລັກ. DALL-E ແລະ Stable Diffusion ເປັນຕົວຢ່າງທີ່ດີ. ສໍາລັບໃນປັດຈຸບັນ, ທ່ານສາມາດເຮັດໃຫ້ໂຄງການເຫຼົ່ານີ້ສະແດງສິ່ງທີ່ທ່ານຕ້ອງການ. ທັງ​ຫມົດ​ຜ່ານ​ຂໍ້​ຄວາມ​!

ດັ່ງນັ້ນ, ເຄື່ອງມື AI ທີ່ສາມາດສ້າງ spectrograms ໄດ້ຖືກເອີ້ນວ່າ Riffusion. ນີ້ແມ່ນໂຄງການ AI ຫລ້າສຸດ, ແລະໃນຄວາມສໍາຄັນຂອງມັນ, ມັນເປັນການສ້າງຮູບພາບຈາກຂໍ້ຄວາມໂດຍອີງໃສ່ການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງ (Stable Diffusion). ແຕ່ລາວມີຄວາມສາມາດສ້າງດົນຕີໄດ້ແນວໃດ?

rifusion

ເບື້ອງຫຼັງ Riffusion ແມ່ນນັກຫຸ່ນຍົນ Heik Martiros ແລະຜູ້ພັດທະນາຊອບແວ Seth Forsgren. ພວກເຂົາຕ້ອງການທົດສອບວ່າໂຄງການ AI ທີ່ທັນສະໄຫມສາມາດເຮັດວຽກຢູ່ໃນພາກສະຫນາມສຽງໄດ້. ດັ່ງນັ້ນຈຶ່ງເລີ່ມການເດີນທາງສ້າງດົນຕີຂອງ Riffusion. Forsgren ເວົ້າກ່ຽວກັບເທກໂນໂລຍີເຊັ່ນນີ້: "Hake ແລະຂ້ອຍຫຼິ້ນຢູ່ໃນແຖບຂະຫນາດນ້ອຍຮ່ວມກັນ, ແລະພວກເຮົາໄດ້ເລີ່ມຕົ້ນໂຄງການພຽງແຕ່ຍ້ອນວ່າພວກເຮົາຮັກດົນຕີ. ຫຼັງຈາກເຫັນຜົນທີ່ໜ້າຕື່ນຕາຕື່ນໃຈຂອງ Stable Diffusion ສໍາລັບການສ້າງຮູບພາບ, ພວກເຮົາຖາມຕົວເຮົາເອງວ່າໃຊ້ວິທີການກະຈາຍສຽງເພື່ອສ້າງດົນຕີແນວໃດ?

ເພື່ອຊອກຫາ, ທີມງານສອງຄົນໄດ້ຝຶກອົບຮົມການແຜ່ກະຈາຍຄວາມຫມັ້ນຄົງຂອງແຫຼ່ງເປີດໃນຮູບພາບ spectrogram. ພວກເຂົາເຈົ້າໄດ້ຖືກລວມເຂົ້າກັບຂໍ້ຄວາມ. ຫຼັງຈາກນັ້ນ, ໂຄງການດັ່ງກ່າວສາມາດສ້າງ spectrograms ຂອງດົນຕີໂດຍອີງໃສ່ຂໍ້ຄຶດທີ່ແນ່ນອນ.

ໃນຕອນທໍາອິດ, ພວກເຂົາບໍ່ຮູ້ວ່າສະຖາປັດຕະຍະກໍາຕົວແບບ Stable Diffusion ສາມາດສ້າງຮູບພາບ spectrogram ທີ່ມີຄວາມຖືກຕ້ອງພຽງພໍທີ່ຈະປ່ຽນເປັນສຽງ, ແຕ່ມັນໄດ້ຫັນອອກວ່າມັນສາມາດເຮັດໄດ້ແລະຫຼາຍກວ່ານັ້ນ. Martiros ແລະ Forsgren ເຜີຍແຜ່ຜົນໄດ້ຮັບຂອງພວກເຂົາຢູ່ໃນເວັບໄຊທ໌ Riffusion ຢ່າງເປັນທາງການ. ທໍາອິດມັນເປັນໂຄງການ hobby. ແຕ່ໃນປັດຈຸບັນນັກທ່ອງທ່ຽວສາມາດເພີ່ມຄໍາແນະນໍາຂໍ້ຄວາມຂອງຕົນເອງ. ນີ້ຈະບັງຄັບໃຫ້ Riffusion ສ້າງ spectrogram. ຕໍ່ມາ, ນັກທ່ອງທ່ຽວສາມາດໃຊ້ມັນເປັນຄລິບສຽງແລະຫຼິ້ນຢູ່ໃນເວັບໄຊທ໌.

ຜົນໄດ້ຮັບໃນຂັ້ນຕອນນີ້ອາດຈະບໍ່ມີຄຸນນະພາບສູງຫຼາຍ. ແຕ່ແນ່ນອນມັນບໍ່ຮ້າຍແຮງດັ່ງທີ່ເຈົ້າຄິດ.

Riffusion ອາດຈະພະຍາຍາມຫຼິ້ນເພງທີ່ປະກອບມີ rap ໃນແບບຂອງ Eminem ແລະ K-Pop. ແຕ່ການທໍາງານຂອງການສ້າງເນື້ອເພງແມ່ນບໍ່ດີ. ແທນ​ທີ່​ຈະ​ເປັນ​ຂໍ້​ຄວາມ​, ທ່ານ​ຈະ​ໄດ້​ຍິນ​ສຽງ gibberish ຂອງ​ມະ​ນຸດ melodious​. ແຕ່​ສິ່ງ​ທີ່​ຫນ້າ​ສົນ​ໃຈ​ທີ່​ສຸດ​ແມ່ນ gibberish ນີ້​ຍັງ​ສອດ​ຄ່ອງ​ກັບ​ໂຕນ​ຂອງ​ເພງ​ໄດ້​.

ເຕັກ​ໂນ​ໂລ​ຊີ​ນີ້​ຍັງ​ບໍ່​ທັນ​ມີ​ຄວາມ​ພ້ອມ​ທີ່​ຈະ​ທົດ​ແທນ​ການ​ດົນ​ຕີ​ທີ່​ສ້າງ​ໂດຍ​ມະ​ນຸດ​. ແຕ່ໂຄງການສະແດງໃຫ້ເຫັນພວກເຮົາວ່າ AI ຂັ້ນຕອນການປະມວນຜົນຮູບພາບຍັງມີທ່າແຮງທີ່ຍິ່ງໃຫຍ່. ໃນໄວໆນີ້ມັນສາມາດກາຍເປັນຜູ້ຊ່ວຍສໍາລັບຜູ້ຂຽນດົນຕີ. ອາດຈະໄດ້ຮັບແຮງບັນດານໃຈໃນການຂຽນເພງ.

ທ່ານສາມາດຊ່ວຍ Ukraine ຕໍ່ສູ້ຕ້ານກັບ invaders ລັດເຊຍ. ວິ​ທີ​ທີ່​ດີ​ທີ່​ສຸດ​ເພື່ອ​ເຮັດ​ສິ່ງ​ນີ້​ແມ່ນ​ການ​ບໍ​ລິ​ຈາກ​ເງິນ​ທຶນ​ໃຫ້​ກອງ​ປະ​ກອບ​ອາ​ວຸດ​ຂອງ Ukraine ໂດຍ​ຜ່ານ​ການ ຊ່ວຍຊີວິດ ຫຼືຜ່ານຫນ້າທາງການ NBU.

Dzherelogizchina

ບົດຄວາມອື່ນໆ

ລົງ​ທະ​ບຽນ
ແຈ້ງ​ການ​ກ່ຽວ​ກັບ
ບຸກຄົນທົ່ວໄປ

0 ຄວາມຄິດເຫັນ
ການທົບທວນທີ່ຝັງໄວ້
ເບິ່ງຄຳເຫັນທັງໝົດ

ຈອງສໍາລັບການອັບເດດ

ເປັນທີ່ນິຍົມໃນປັດຈຸບັນ