Root Nation訊息資訊科技資訊古語言神經解碼研究獲聯合國教科文組織認定

古語言神經解碼研究獲聯合國教科文組織認定

-

想像一下,您收到一條可能包含救生信息的消息。 但是有一個問題:你一個字都聽不懂。 您甚至不確定它是用世界上數千種語言中的哪一種編寫的。 你會怎麼做如果消息是用英語或法語編寫的,將其輸入自動翻譯系統會立即解開謎題,並以您的語言給出可靠的答案。 但許多其他語言仍然無法翻譯,包括非洲的 Wolof、Luganda、Twi 和 Ewe 等數百萬人使用的語言。 這是因為為這些引擎提供動力的算法是根據人工翻譯(理想情況下)對數百萬字的翻譯文本進行訓練的。

由於多語種政府和商業機構的人工翻譯會產生大量翻譯的成績單和其他文件,因此有大量此類通用語言的材料,例如英語、法語、西班牙語或德語。 然而,對於可能被廣泛使用但翻譯不那麼廣泛的語言來說,並不存在如此龐大的數據。 這些被稱為資源受限語言。 例子, 谷歌 Translate 目前提供以大約 108 種不同語言進行交流的能力。 但是,世界上有超過7種口語和至少4種有書面系統的語言。 對於任何需要緊急收集準確全球信息的人(包括情報機構)來說,這種語言障礙都可能成為一個問題。

死語言

麻省理工學院計算機科學與人工智能實驗室 (CSAIL) 的研究人員受到啟發,利用機器學習為死語言注入新的活力。 他們的新系統可以自動破譯無法理解的丟失語言,並且無需深入了解它們與其他語言的早期形式的關係就可以做到這一點。 現在已經宣布,他們關於“使用機器學習翻譯丟失的語言”的研究已被宣佈為與聯合國教科文組織合作的 2021 年 Netexplo 獎的獲得者之一。

也很有趣: 發布 Timekettle WT2 Edge 耳機,支持 40 種語言的雙向翻譯

Netexplo 天文台專注於“對當今和未來的數字社會產生深遠而長期影響的革命性數字創新”。

麻省理工學院教授 Regina Barzilai 和麻省理工學院研究生 Jiamin Luo 在該領域取得了重大進展:一種新系統已被證明能夠自動破譯丟失的語言,而無需深入了解其與其他語言的關係。 他們還表明,他們的系統可以自行確定語言之間的關係,並用它來證實最近的研究表明伊比利亞語實際上與巴斯克語無關。

研究 - 死語言

“對於現實生活中未破譯的語言來說,相關語言的知識是破譯路上至關重要的一步。 我們的模型可以生成一個衡量兩個字典匹配程度的“接近度”指標,”羅說。 “更廣泛地說,我相信人工智能(AI)可以從其他領域的發展中受益。 反之亦然,因為基礎科學和人類研究也可以從人工智能的創新中受益。” Barzilai 和羅在 Netexplo 創新 2021 論壇上談到了他們的工作。

另請閱讀:

註冊
通知有關
客人

0 留言
嵌入式評論
查看所有評論