Root Nation消息资讯资讯古语言神经解码研究获联合国教科文组织奖

古语言神经解码研究获联合国教科文组织奖

-

想象一下,您收到一条可能包含救生信息的消息。 但是有一个问题:你一个字也听不懂。 您甚至不确定它是用世界上数千种语言中的哪一种编写的。 你会怎么做如果消息是用英语或法语写的,将其输入自动翻译系统会立即解开谜语并以您的语言给出可靠的答案。 但许多其他语言仍然无法翻译,包括数百万人使用的语言,如非洲的沃洛夫语、卢干达语、特维语和埃维语。 这是因为为这些引擎提供动力的算法是在人工翻译的基础上训练的——理想情况下——是在数百万字的翻译文本上。

由于多语种政府和商业机构的人工翻译产生了翻译的成绩单和其他文件流,因此英语、法语、西班牙语或德语等通用语言的此类材料非常丰富。 然而,对于那些可能被广泛使用但没有被广泛翻译的语言来说,这样大量的数据是不存在的。 这些被称为资源受限语言。 例子, 谷歌 Translate 目前提供使用大约 108 种不同语言进行交流的能力。 然而,世界上有超过7种口头语言和至少4种具有书面系统的语言。 这种语言障碍可能成为任何需要紧急收集准确全球信息的人的问题,包括情报机构。

死语言

麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员受到启发,利用机器学习为死去的语言注入新的活力。 他们的新系统可以自动破译无法以其他方式理解的失传语言,并且不需要深入了解它们与其他语言早期形式的关系就可以做到这一点。 现已宣布,他们关于“使用机器学习翻译丢失的语言”的研究已被宣布为与联合国教科文组织合作的 Netexplo 2021 奖的获奖者之一。

也很有趣: 发布 2 种语言双向翻译的 Timekettle WT40 Edge 耳机

Netexplo Observatory 专注于“可以对当今和未来的数字社会产生深远和长期影响的革命性数字创新”。

麻省理工学院教授 Regina Barzilai 和麻省理工学院研究生 Jiamin Luo 在该领域取得了重大进展:一种新系统已被证明能够自动破译一种丢失的语言,而无需深入了解它与其他语言的关系。 他们还表明,他们的系统可以自行确定语言之间的关系,并用它来证实最近的研究表明伊比利亚语实际上与巴斯克语没有关系。

研究 - 死去的语言

“对于现实生活中未破译的语言,相关语言的知识是通向破译之路的关键一步。 我们的模型可以生成一个‘接近度’指标来衡量两个词典的匹配程度,”罗说。 “更广泛地说,我相信人工智能 (AI) 可以从其他领域的发展中受益。 反之亦然,因为基础科学和人类研究也可以从人工智能的创新中受益。” Barzilai 和 Luo 在 Netexplo Innovation 2021 论坛上谈到了他们的工作。

另请阅读:

Dzherelo
注册
通知关于
客人

0 评论
嵌入式评论
查看所有评论