Gumawa ang Meta ng bagong generator batay sa artificial intelligence

Ang mga artificial intelligence (AI) text-to-image generators ay gumagawa ng mga headline nitong mga nakaraang buwan, ngunit ang mga mananaliksik ay lumipat na sa susunod na hangganan: AI-powered text-to-video generators. Ang mga mananaliksik ng meta ay nagpahayag sa publiko ng isang bagong generator, ulat ng The Verge.

Ang machine learning engineering team ng Meta ipinakita isang bagong system na tinatawag na Make-A-Video. Ang AI model na ito ay nagbibigay-daan sa mga user na magpasok ng isang magaspang na paglalarawan ng eksena, at ito ay bumubuo ng isang maikling video na tumutugma sa kanilang teksto. Ang mga video ay malinaw na artipisyal, na may malabong mga bagay at mga distorted na animation, ngunit isa pa ring makabuluhang tagumpay sa larangan ng pagbuo ng nilalamang artificial intelligence.

Sa kanyang post sa Facebook Inilarawan ng Meta CEO na si Mark Zuckerberg ang gawain bilang isang "kamangha-manghang pag-unlad", at idinagdag: "Ang paggawa ng video ay mas mahirap kaysa sa mga larawan, dahil bilang karagdagan sa pagbuo ng bawat pixel nang tama, kailangan ding hulaan ng system kung paano sila magbabago sa paglipas ng panahon."

Gumawa-A-Video: AI

Ang mga clip ay tumatagal ng hindi hihigit sa limang segundo at walang tunog, ngunit sumasaklaw sa isang malaking hanay ng mga pahiwatig. Bagama't malinaw na ang video ay binuo ng computer, ang kalidad ng naturang mga modelo ng AI ay mabilis na mapapabuti sa malapit na hinaharap. Sa loob lamang ng ilang taon, ang mga generator ng imahe ng AI ay lumipat mula sa paglikha ng halos hindi maintindihan na mga larawan sa photorealistic na nilalaman. At habang ang pag-usad sa video ay maaaring mas mabagal dahil sa halos walang limitasyong pagiging kumplikado ng lugar ng paksa, ang parangal para sa tuluy-tuloy na pagbuo ng video ay mag-uudyok sa maraming organisasyon at kumpanya na mamuhunan ng mga makabuluhang mapagkukunan sa proyekto.

Sinabi ng kumpanya na plano nitong maglabas ng demo na bersyon ng system, ngunit hindi sinabi kung kailan o paano ito ipapatupad. Sa isang papel na naglalarawan sa modelo, napansin ng mga mananaliksik ng Meta na ang Make-A-Video ay sinanay sa mga pares ng caption ng larawan pati na rin ang walang label na footage ng video.

Ang content ng pagsasanay ay nagmula sa dalawang dataset, ang WebVid-10M at HD-VILA-100M, na magkasamang naglalaman ng milyun-milyong video at sumasaklaw sa daan-daang libong oras ng video footage. Kasama pala dito ang stock footage.

Napansin ng mga mananaliksik na ang modelo ay may maraming teknikal na limitasyon, bilang karagdagan sa malabong mga frame at nakakalat na mga animation. Ang Make-A-Video ay naglalabas ng 16 na frame ng video sa resolution na 64×64 pixels, na pagkatapos ay ire-resize gamit ang isang hiwalay na AI model sa 768×768 pixels.

Matutulungan mo ang Ukraine na labanan ang mga mananakop na Ruso. Ang pinakamahusay na paraan upang gawin ito ay ang mag-abuloy ng mga pondo sa Armed Forces of Ukraine sa pamamagitan ng Savelife o sa pamamagitan ng opisyal na pahina NBU.

Kawili-wili din:

Jerelopagkubkob

Mag-sign up

0 Comments

Naka-embed na Mga Review

Tingnan ang lahat ng komento

Iba pang mga artikulo

Nagpakita ang Meta ng AI para sa paglikha ng mga video batay sa paglalarawan

Mga kamakailang komento