Root NationXəbərlərİT xəbərləriMetanın nitqi süni intellekt 4-dən çox danışıq dilini tanıyır

Metanın nitqi süni intellekt 4-dən çox danışıq dilini tanıyır

-

Meta ChatGPT klonu olmayan AI dil modeli yaratdı. Şirkətin Kütləvi Çoxdilli Nitq (MMS) layihəsi 4-dən çox danışıq dilini tanıya və 000-dən çox dildə nitqi (text-to-speech) bərpa edə bilər. Açıqca elan edilmiş süni intellekt layihələrinin əksəriyyəti kimi, Meta bu gün dil müxtəlifliyini qorumağa kömək etmək və tədqiqatçıları onu inkişaf etdirməyə təşviq etmək üçün MMS-ə açıq giriş imkanı verir. "Bu gün biz modellərimizi və kodumuzu açıq şəkildə paylaşırıq ki, tədqiqat cəmiyyətinin digər üzvləri bizim işimizə əsaslansınlar" deyə şirkət yazıb. “Bu iş sayəsində biz dünyanın inanılmaz dil müxtəlifliyinin qorunub saxlanmasına kiçik bir töhfə verəcəyimizə ümid edirik”.

Meta

Nitqin tanınması və mətndən nitqə modelləri adətən müşayiət olunan transkripsiya etiketləri ilə minlərlə saatlıq audio yazılar üzrə təlim tələb edir. Meta deyir ki, sənayeləşmiş ölkələrdə geniş şəkildə danışılmayan - bir çoxu yaxın onilliklərdə yox olmaq təhlükəsi ilə üzləşən dillər üçün "bu məlumat sadəcə mövcud deyil".

Meta audio məlumatların toplanmasına qeyri-ənənəvi yanaşdı: tərcümə edilmiş dini mətnlərin audio yazılarını dinləmək. “Biz İncil kimi bir çox müxtəlif dillərə tərcümə edilmiş və tərcümələri mətn əsaslı tərcümə araşdırması üçün geniş şəkildə tədqiq edilmiş dini mətnlərə müraciət etdik”, - deyə şirkət bildirib. "Bu tərcümələrdə insanların bu mətnləri müxtəlif dillərdə oxuduğuna dair ictimaiyyətə açıq səs yazıları var." İncildən və oxşar mətnlərdən qeyd edilməmiş qeydləri daxil etməklə, Meta tədqiqatçıları model üçün mövcud olan dillərin sayını 4-dən çox artırdılar.

“Audio yazıların məzmunu dini olsa da, bizim təhlilimiz göstərir ki, bu, modelin daha çox dini dil istehsalına təsir göstərmir”, Meta yazır. "Biz inanırıq ki, bunun səbəbi nitqin tanınması üçün böyük dil modelləri (LLM) və ya ardıcıllıq modelləri ilə müqayisədə daha məhdud olan əlaqəçi müvəqqəti təsnifat (CTC) yanaşmasından istifadə edirik." Həmçinin, dini mətnlərin əksəriyyətinin kişilər tərəfindən oxunmasına baxmayaraq, bu, kişi qərəzinə səbəb olmadı – sistem həm qadın, həm də kişi səslərini eyni dərəcədə yaxşı tanıdı.

Məlumatları daha istifadə edilə bilən etmək üçün uyğunlaşdırma modelini öyrətdikdən sonra Meta etiketsiz məlumatlar üzərində öyrənə bilən şirkətin “öz-özünə nəzarət edilən dil təmsilini öyrənmə” modeli olan wav2vec 2.0-dan istifadə etdi. Qeyri-ənənəvi məlumat mənbələrinin və özünü idarə edən nitq modelinin birləşməsi təsirli nəticələrə gətirib çıxardı. “Nəticələrimiz göstərir ki, kütləvi çoxdilli yayım modelləri mövcud modellərlə müqayisədə yaxşı işləyir və 10 dəfə daha çox dili əhatə edir”. Xüsusilə Meta MMS-i OpenAI-nin Whisper ilə müqayisə etdi və nəticələr gözləntiləri üstələdi. "Biz aşkar etdik ki, Kütləvi Çoxdilli Nitq datası ilə öyrədilmiş modellərdə söz xətalarının yarısı var, lakin Kütləvi Çoxdilli Nitq 11 dəfə daha çox dili əhatə edir."

Meta xəbərdarlıq edir ki, onun yeni modelləri mükəmməl deyil. "Məsələn, nitqdən mətnə ​​modelin ayrı-ayrı sözləri və ya ifadələri səhv tərcümə edə bilməsi riski var", - şirkət yazır. “Nəticədən asılı olaraq, bu təhqiredici və/və ya qeyri-dəqiq dilə səbəb ola bilər. Biz süni intellekt icması daxilində əməkdaşlığın AI texnologiyalarının məsuliyyətli inkişafı üçün vacib olduğuna inanmağa davam edirik.

Meta

İndi Meta açıq mənbəli tədqiqatlar üçün MMS-i buraxdığından, o, dünyada dillərin sayını 100 və ya daha az dilə endirmək tendensiyasını tərsinə çevirməyə ümid edir, əksəriyyəti əsas texnologiyalar tərəfindən dəstəklənir. O, köməkçi texnologiya, TTS və hətta VR/AR texnologiyalarının hər kəsə öz ana dilində danışmağa və öyrənməyə imkan verdiyi bir dünya görür. Orada deyilir: "Biz texnologiyanın əks təsirə malik olduğu, insanları öz dillərini yaşatmağa təşviq edən bir dünya təsəvvür edirik, çünki onlar öz ana dillərində danışarkən informasiya əldə edə və texnologiyadan istifadə edə bilirlər."

Həmçinin oxuyun:

JereloEngadget
Qeydiyyatdan keçmək
Haqqında məlumat verin
qonaq

0 Şərhlər
Daxil edilmiş rəylər
Bütün şərhlərə baxın