Root NationМэдээ мэдээлэлМэдээллийн технологийн мэдээШинэ AI Microsoft 3 секундын дууны дээжээс дурын хүний ​​дуу хоолойг дуурайдаг

Шинэ AI Microsoft 3 секундын дууны дээжээс дурын хүний ​​дуу хоолойг дуурайдаг

-

Пүрэв гарагт судлаачид Microsoft VALL-E нэртэй шинэ хиймэл оюун ухааны (AI) загварыг зарласан бөгөөд энэ нь гурван секундын дууны дээж өгөхөд хүний ​​дуу хоолойг яг таг дуурайж чаддаг. VALL-E нь тодорхой дуу хоолойг сурсны дараа тухайн хүний ​​юу ч хэлж байгаа дууг нэгтгэж, илтгэгчийн сэтгэл хөдлөлийн өнгө аясыг хадгалах боломжтой.

Зохиогчид нь VALL-E-г өндөр чанартай текстээс яриа, ярианы засвар хийхэд ашиглаж болох бөгөөд энд хүний ​​бичлэгийг текстийн транскрипцээс засварлаж, өөрчлөх (анх хэлээгүй зүйлээ хэлүүлэх) болон зэрэг бусад үүсгэгч AI загваруудтай хослуулан аудио контент бүтээхэд зориулагдсан GPT-3.

Microsoft AI VALL-E

Microsoft VALL-E-г "Мэдрэлийн кодлогч хэлний загвар" гэж нэрлэдэг бөгөөд энэ нь Метагийн 2022 оны -р сард зарласан EnCodec нэртэй технологи дээр суурилдаг. Долгионы хэлбэрийг удирдах замаар яриаг нэгтгэдэг бусад текстээс ярианы аргуудаас ялгаатай нь VALL-E нь салангид аудио үүсгэдэг. текст болон акустик дохионы кодлогч кодууд. Энэ нь үндсэндээ тухайн хүн ямар сонсогдож байгааг задлан шинжилж, EnCodec-ийн ачаар тэр мэдээллийг салангид бүрэлдэхүүн хэсгүүдэд ("жетон" гэж нэрлэдэг) задалж, сургалтын өгөгдлийг ашиглан гаднаас өөр хэллэг хэлвэл ямар сонсогдох талаар "мэддэг" зүйлдээ тохируулдаг. гурван секундын дээжийн.

Microsoft VALL-E-ийн ярианы синтезийн чадварыг Метагийн LibriLight нэртэй аудио санд сургасан. Энэ нь 60 гаруй хөтлөгчийн 7 цагийн англи хэл дээрх нэвтрүүлгийг багтаасан бөгөөд ихэнх нь олон нийтэд нээлттэй LibriVox аудио номноос авсан болно.

VALL-E нь илтгэгчийн дуу хоолойны тембр, сэтгэл хөдлөлийн өнгө аясыг хадгалахаас гадна дууны дээжийн "акустик орчинг" дуурайж чаддаг. Жишээлбэл, хэрэв дээжийг утасны ярианаас авсан бол нэгтгэсэн аудио гаралт нь утасны ярианы акустик болон давтамжийн шинж чанарыг дуурайна. Мөн дээж Microsoft VALL-E нь дууны тембрийн өөрчлөлтийг үүсгэж чадна гэдгийг харуулах.

Microsoft AI VALL-E

Магадгүй VALL-E нь залилан, хууран мэхлэлтийг хөнгөвчлөх чадвартай учраас, Microsoft бусдад туршилт хийх VALL-E кодыг өгөөгүй тул бид түүний чадварыг шалгах боломжгүй болно. Энэхүү технологи нь нийгэмд учруулж болзошгүй хор хөнөөлийг судлаачид мэдэж байгаа бололтой. Өгүүллийн төгсгөлд тэд ингэж бичжээ.

“VALL-E нь чанга яригчийн хувийн шинж чанарыг хадгалсан яриаг нэгтгэж чаддаг тул дуу хоолойг хууран мэхлэх, тодорхой чанга яригчийг дуурайх гэх мэт загварыг урвуулан ашиглах эрсдэлийг дагуулж болзошгүй. Ийм эрсдлийг бууруулахын тулд аудио клипийг VALL-E ашиглан нэгтгэсэн эсэхийг ялгах таних загварыг бий болгоно."

Та Украинд Оросын түрэмгийлэгчдийн эсрэг тэмцэхэд тусалж чадна. Үүнийг хийх хамгийн сайн арга бол Украины Зэвсэгт хүчинд мөнгө хандивлах явдал юм Амьдралыг аврах эсвэл албан ёсны хуудсаар дамжуулан NBU.

Мөн уншина уу:

Эх сурвалжарстечник
Бүртгүүлэх
тухай мэдэгдэх
зочин

0 Сэтгэгдэл
Суулгасан тойм
Бүх сэтгэгдлийг харах
Бусад нийтлэлүүд
Шинэчлэлтүүдийг авахын тулд бүртгүүлнэ үү
Одоо алдартай