Meta发布新闻稿指出,在台湾长大、讲中文的陈鹏仁深深了解语言障碍将影响沟通能力,他的父亲陈圣奖是一位70岁、退休的工厂技术主管,来自闽南语普遍使用的台湾南部。虽然闽南语与中文这2种语言相关,仍有许多不同,让陈鹏仁的爸爸常觉得用中文进行复杂的对话非常困难。

推荐新闻:万华枪击|阿国犯案前与儿女诀别全文 要孝顺妈妈「不要像爸爸一样!」


「我希望我爸跟所有人沟通时,都用台语,这是他最熟悉的语言。」Meta AI研究员陈鹏仁分享,「他听得懂中文,但若是讨论比较复杂的主题时,他说话的速度会比较慢。」不甘于只为爸爸担心,陈鹏仁开始投入心力,改善这个问题,推动全新的技术发展,让闽南语及英文能相互翻译。

Meta表示,目前为止,AI翻译主要著重于各种书写语言,但在全球超过7000种的现存语言中,有近半数主要以口语表达,没有标准或广泛使用的书写文字系统。这导致Meta无法使用标准技术为这类语言打造机器翻译工具,因为标准技术需有大量的书写文字来训练AI模型。

推荐新闻:万华枪击|首都染红!周玉蔻斥:柯文哲做黑道杀手啦啦队长

为克服这项挑战,Meta为主要以口语表达的「闽南语」打造一个史无前例的人工智慧技术翻译系统。这项采用开放原始码的翻译系统是Meta Universal Speech Translator(UST,通用语音翻译工具)专案的一部分,致力于开发新的AI方法,希望能为所有现存语言进行即时语音翻译,包括主要以口语表达的语言。

为开发这个只有语音的全新翻译系统,Meta AI研究人员必须克服许多来自传统机器翻译系统的挑战,包括资料搜集、模型设计以及准确度评估。Meta不只会开放闽南语翻译模型的原始码,也会公开评估资料集和研究报告,让其他人能重制并以Meta的工作成果为基础建立模型。

推荐新闻:政府祭高端仔补打方案 医轰花大钱善后「这些都是纳税人的钱」

Meta著手打造闽南语翻译系统时,面临的一个重大障碍,是能否搜集足够资料。Meta利用中文作为中间语言,以建立伪标签和人工翻译,也就是先将英语或闽南语语音翻译成中文文字,接著再翻译成闽南语或英语,并新增至训练资料中。这个方法利用资源充足的相似语言的资料,大幅改善模型成效。

推荐新闻:热水瓶一打开!蚂蚁蛋多到吓死人 还有躲在吹风机里「喷了我满脸⋯⋯」

祖克柏在个人脸书上示范交谈福建话翻译英文的AI语音翻译系统。翻摄脸书
祖克柏在个人脸书上示范交谈福建话翻译英文的AI语音翻译系统。翻摄脸书

Meta指出,评估主要以口语表达的语言例如闽南语时,挑战之一是没有标准的书写文字系统。为启动自动评估程序,Meta开发了一套系统,将闽南语语音转译成标准化的拼音符号,能够很容易比较不同方法下的翻译品质。

推荐新闻:比手掌小的文青蛋糕!结帐大吃一惊 女主播:奇檬子「跟草泥马很搭」

Meta也根据名为Taiwanese Across Taiwan的闽南语语音语料库,建立第一个闽南语与英语双向的语音翻译基准资料集。Meta将开放此基准资料集的原始码,鼓励其他研究人员合作进行闽南语语音翻译,一同在这个领域取得更多进展。

 

Meta表示,在目前的阶段,Meta的作法能让使用闽南语的人士与使用英语者对话。虽然相关模型仍在开发中,而且每次只能翻译一个完整句子,但已朝向未来实现为各种语言提供同步翻译的目标迈进。

推荐新闻:信用卡背面没签名被拒刷 他连说「我就不想签名!」网教这一招

Meta认为,AI研究有助于打破在现实世界和元宇宙中的语言限制,未来所有语言无论是否可以书写,都不再是阻碍人们相互理解的障碍,期待为未来顺畅无阻的沟通持续贡献。(中央社)

★快点加入《壹苹》Line,和我们做好友!

★FB按赞追踪《壹苹新闻网》各大脸书粉丝团,即时新闻到你手,不漏任何重要新闻!

壹苹娱乐粉专

壹苹新闻网粉专

壹苹 LINE 好友