Root NationYangiliklarIT yangiliklariMeta nutqi AI 4 dan ortiq og'zaki tillarni taniydi

Meta nutqi AI 4 dan ortiq og'zaki tillarni taniydi

-

huzur ChatGPT kloni bo'lmagan sun'iy intellekt tili modelini yaratdi. Kompaniyaning Massively Multilingual Speech (MMS) loyihasi 4 dan ortiq og‘zaki tillarni taniy oladi va 000 dan ortiq tilda nutqni (matndan nutqqa) takrorlay oladi. Ommaga e'lon qilingan ko'pgina AI loyihalari singari, Meta bugungi kunda til xilma-xilligini saqlab qolish va tadqiqotchilarni uni rivojlantirishga undash uchun MMSga ochiq kirish imkonini beradi. "Bugun biz tadqiqot hamjamiyatining boshqa a'zolari bizning ishimizga asoslanishlari uchun modellarimiz va kodlarimizni ommaga baham ko'ramiz", deb yozadi kompaniya. "Ushbu ish tufayli biz dunyoning aql bovar qilmaydigan til xilma-xilligini saqlashga ozgina hissa qo'shishga umid qilamiz".

huzur

Nutqni aniqlash va matndan nutqqa oʻtish modellari odatda transkripsiya belgilari bilan minglab soatlik audioyozuvlarni oʻrganishni talab qiladi. Ammo sanoati rivojlangan mamlakatlarda keng tarqalgan tillar uchun - ularning aksariyati yaqin o'n yilliklarda yo'q bo'lib ketish xavfi ostida - "bu ma'lumotlar oddiygina mavjud emas", deydi Meta.

Meta audio ma'lumotlarni yig'ishda noan'anaviy yondashuvni qo'lladi: tarjima qilingan diniy matnlarning audio yozuvlarini tinglash. "Biz ko'plab turli tillarga tarjima qilingan va matnga asoslangan tarjima tadqiqotlari uchun tarjimalari keng o'rganilgan Injil kabi diniy matnlarga murojaat qildik", dedi kompaniya. "Ushbu tarjimalarda odamlarning ushbu matnlarni turli tillarda o'qiyotgani haqida hamma uchun ochiq audio yozuvlar mavjud." Muqaddas Kitob va shunga o'xshash matnlardan belgilanmagan yozuvlarni kiritish orqali Meta tadqiqotchilari model uchun mavjud bo'lgan tillar sonini 4 dan oshib ketdi.

“Audio yozuvlar mazmuni diniy bo‘lsa-da, bizning tahlilimiz shuni ko‘rsatadiki, bu modelning ko‘proq diniy nutq ishlab chiqarishiga ta’sir qilmaydi”, deb yozadi Meta. "Biz bunga ishonamiz, chunki biz katta til modellari (LLM) yoki nutqni tanib olish uchun ketma-ketlik modellari bilan solishtirganda ancha cheklangan bo'lgan ulanish vaqtini tasniflash (CTC) yondashuvidan foydalanamiz." Bundan tashqari, diniy matnlarning aksariyati erkaklar tomonidan o'qilganiga qaramay, bu erkaklar tarafkashligiga olib kelmadi - tizim ayol va erkak ovozini teng darajada yaxshi tan oldi.

Ma'lumotlarni yanada qulayroq qilish uchun moslashtirish modelini o'rgatgandan so'ng, Meta yorliqsiz ma'lumotlardan o'rganish mumkin bo'lgan kompaniyaning "o'z-o'zidan boshqariladigan til vakilligini o'rganish" modeli - wav2vec 2.0 dan foydalangan. An'anaviy bo'lmagan ma'lumotlar manbalari va o'z-o'zidan boshqariladigan nutq modelining kombinatsiyasi ta'sirchan natijalarga olib keldi. "Bizning natijalarimiz shuni ko'rsatadiki, ommaviy ko'p tilli eshittirish modellari mavjud modellarga nisbatan yaxshi ishlaydi va 10 barobar ko'proq tillarni qamrab oladi". Xususan, Meta MMS-ni OpenAI’s Whisper bilan taqqosladi va natijalar kutilganidan ham oshib ketdi. "Biz Massively Multilingual Speech ma'lumotlari bo'yicha o'qitilgan modellarda so'z xatolarining yarmi borligini aniqladik, ammo Massively Multilingual Speech 11 baravar ko'proq tillarni qamrab oladi."

Meta uning yangi modellari mukammal emasligidan ogohlantiradi. “Masalan, nutqdan matnga model alohida so‘z yoki iboralarni noto‘g‘ri tarjima qilishi mumkinligi xavfi bor”, — deb yozadi kompaniya. “Natijaga qarab, bu haqoratomuz va/yoki notoʻgʻri tilga olib kelishi mumkin. Biz AI hamjamiyatidagi hamkorlik AI texnologiyalarini mas'uliyatli rivojlantirish uchun muhim ekanligiga ishonishda davom etamiz.

huzur

Endi Meta MMS-ni ochiq manbali tadqiqotlar uchun chiqarganidan so'ng, u dunyodagi tillar sonini 100 yoki undan kamgacha kamaytirish tendentsiyasini o'zgartirishga umid qilmoqda, ularning aksariyati asosiy texnologiyalar tomonidan qo'llab-quvvatlanadi. U yordamchi texnologiyalar, TTS va hatto VR / AR texnologiyalari har kimga o'z ona tilida gapirish va o'rganish imkonini beradigan dunyoni ko'radi. Unda shunday deyilgan: "Biz texnologiya teskari ta'sirga ega bo'lgan, odamlarni o'z tillarini saqlab qolishga undaydigan dunyoni tasavvur qilamiz, chunki ular o'z ona tillarida gapirganda ma'lumotlarga kirishlari va texnologiyadan foydalanishlari mumkin".

Shuningdek o'qing:

Ro'yxatdan o'tish
Xabar berish
mehmon

0 Izoh
O'rnatilgan sharhlar
Barcha sharhlarni ko'ring