目錄
Meta 打造的 AI 人工智慧技術翻譯系統,居然能讓使用閩南語(台語)的人和使用英語者對話!
從孝出發,來自台灣的 Meta 工程師帶領團隊推出閩南語 AI 語音翻譯
原來這項新技術的幕後推手之一,是來自台灣的 Meta 軟體工程師陳鵬仁,他秉持希望父親能用最熟悉的台語跟大家溝通的初衷,投入這項人工智慧技術的發展。
陳鵬仁表示,自己深刻理解語言障礙對溝通能力的影響。然而,幾乎所有的 AI 翻譯系統都只著重於書寫語言,但在全球逾七千種的現存語言中,就有近半數主要以口語表達為主,並沒有標準或泛用的書寫文字系統。由於標準技術需有大量的書寫文字來訓練 AI 模型,因此這類以口語為主的語言致使 Meta 無法使用標準技術打造機器翻譯工具。
目前為止,AI翻譯主要著重於各種書寫語言,但在全球超過7000種的現存語言中,有近半數主要以口語表達,沒有標準或廣泛使用的書寫文字系統。這導致 Meta 無法使用標準技術為這類語言打造機器翻譯工具,因為標準技術需有大量的書寫文字來訓練 AI 模型。

開發團隊的共同語言,讓閩南語成為 Meta 推出的 AI 語音翻譯先鋒
陳鵬仁表示,其實最初之所以選擇閩南語作為首個開發翻譯語言的原因,其實是開發團隊有不少熟稔閩南語的同仁,因此可以在更快時間驗證翻譯結果是否正確、通順。不過,實際上投入開發之後,大家才發現要順利將閩南語翻譯成其他語言,真的比想像中還難。
畢竟光是閩南語中七聲八調的不同、在台灣明顯的南腔北調情況,甚至在中國福建沿海地區、馬來西亞和新加坡等地所使用的閩南語就有極大落差。閩南語沒有標準化的文字系統,加上各地區發音用詞上的差異,更讓這樣口語相傳為主的語言,更難以制式翻譯方式轉譯為其他語言。
為了打造能這項直接以語音對語音的翻譯技術,Meta 這個多達 50 人規模的開發團隊除了工程師,還包含語言學者、社會學家、倫理學家與諸多跨學術團隊成員,藉此研究目標翻譯語言的背後結構和文化影響。
雖然這項技術目前仍然受限於演算法、學習資料庫等因素,尚無法流暢對話,只能做到逐句翻譯的表現。但 Meta 認為 AI 研究確實能有效幫助人類打破現實世界和元宇宙中的語言藩籬,期許未來能達成更多語言的互譯,讓語言不再是阻擋彼此相互理解的障礙。甚至藉此技術保存更多面臨瀕危的少數語言,為文化保存盡一份力。