تصور کنید با پیامی مواجه شده اید که می تواند حاوی اطلاعات نجات دهنده باشد. اما یک مشکل وجود دارد: شما یک کلمه را نمی فهمید. شما حتی مطمئن نیستید که به کدام یک از هزاران زبان دنیا نوشته شده است. چه خواهید کرد اگر پیام به زبان انگلیسی یا فرانسوی نوشته شده باشد، با وارد کردن آن به سیستم ترجمه خودکار، معما را فورا حل کرده و به زبان شما پاسخ قابل اعتمادی می دهد. اما بسیاری از زبانهای دیگر غیرقابل ترجمه هستند، از جمله زبانهایی که میلیونها نفر از جمله ولوف، لوگاندا، توئی و میش در آفریقا صحبت میکنند. دلیلش این است که الگوریتمهایی که این موتورها را نیرو میدهند، بر روی ترجمههای انسانی - در حالت ایدهآل - روی میلیونها کلمه متن ترجمه شده آموزش داده میشوند.
به لطف آژانسهای چندزبانه دولتی و تجاری که مترجمان انسانی آنها رونوشتهای ترجمه شده و سایر اسناد را تولید میکنند، چنین مطالبی برای زبانهای رایج مانند انگلیسی، فرانسوی، اسپانیایی یا آلمانی فراوان است. با این حال، چنین کوهی از دادهها برای زبانهایی که ممکن است به طور گسترده صحبت میشوند اما به اندازه گسترده ترجمه نشدهاند، وجود ندارد. این زبان ها به عنوان زبان های محدود به منابع شناخته می شوند. مثال، گوگل Translate در حال حاضر توانایی برقراری ارتباط به حدود 108 زبان مختلف را ارائه می دهد. با این حال، بیش از 7 زبان گفتاری و حداقل 4 زبان با سیستم نوشتاری در جهان وجود دارد. این مانع زبانی میتواند برای هر کسی که نیاز به جمعآوری فوری اطلاعات جهانی دقیق دارد، از جمله سازمانهای اطلاعاتی، به مشکل تبدیل شود.
محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) الهام گرفتهاند تا با استفاده از یادگیری ماشین، زندگی جدیدی به زبانهای مرده بدهند. سیستم جدید آنها میتواند بهطور خودکار زبانهای گمشدهای را که در غیر این صورت قابل درک نیستند، رمزگشایی کند، و میتواند این کار را بدون نیاز به دانش عمیق در مورد ارتباط آنها با اشکال اولیه زبانهای دیگر انجام دهد. اکنون اعلام شده است که تحقیقات آنها در مورد "ترجمه زبان های گمشده با استفاده از یادگیری ماشین" به عنوان یکی از برندگان جایزه Netexplo 2021 با مشارکت یونسکو اعلام شده است.
همچنین جالب: هدفون Timekettle WT2 Edge با ترجمه دو طرفه به ۴۰ زبان منتشر شد
رصدخانه نت اکسپلو بر "نوآوری های دیجیتال انقلابی که می تواند تاثیر عمیق و بلندمدتی بر جامعه دیجیتال امروز و فردا داشته باشد" تمرکز دارد.
رجینا بارزیلای، استاد دانشگاه MIT و جیامین لو، دانشجوی فارغ التحصیل MIT، پیشرفت بزرگی در این زمینه داشته اند: سیستم جدیدی که نشان داده شده است می تواند به طور خودکار یک زبان گم شده را بدون نیاز به دانش عمیق از روابط آن با زبان های دیگر رمزگشایی کند. آنها همچنین نشان دادند که سیستم آنها می تواند ارتباط بین زبان ها را به تنهایی تعیین کند و از آن برای تأیید تحقیقات اخیر استفاده کردند که نشان می دهد زبان ایبری در واقع با باسک مرتبط نیست.
"برای زبان های رمزگشایی نشده در زندگی واقعی، دانش زبان های مرتبط گامی مهم در راه رمزگشایی است. مدل ما میتواند یک معیار «نزدیک» ایجاد کند که میزان تطابق دو فرهنگ لغت را اندازهگیری میکند.» به طور گسترده تر، من معتقدم که هوش مصنوعی (AI) می تواند از پیشرفت ها در سایر زمینه ها بهره مند شود. و بالعکس، زیرا تحقیقات پایه علمی و انسانی نیز می تواند از نوآوری های هوش مصنوعی بهره مند شود. بارزیلای و لو در مورد کار خود در فروم Netexplo Innovation 2021 صحبت کردند.
همچنین بخوانید: