18.7 C
Taipei
星期四, 15 12 月, 2022
Home科技新聞AI人工智慧Meta AI 閩南語翻譯成英語不卡卡,幕後推手竟是台灣工程師

Meta AI 閩南語翻譯成英語不卡卡,幕後推手竟是台灣工程師

Meta 打造的 AI 人工智慧技術翻譯系統,居然能讓使用閩南語(台語)的人和使用英語者對話!

從孝出發,來自台灣的 Meta 工程師帶領團隊推出閩南語 AI 語音翻譯

原來這項新技術的幕後推手之一,是來自台灣的 Meta 軟體工程師陳鵬仁,他秉持希望父親能用最熟悉的台語跟大家溝通的初衷,投入這項人工智慧技術的發展。

陳鵬仁表示,自己深刻理解語言障礙對溝通能力的影響。然而,幾乎所有的 AI 翻譯系統都只著重於書寫語言,但在全球逾七千種的現存語言中,就有近半數主要以口語表達為主,並沒有標準或泛用的書寫文字系統。由於標準技術需有大量的書寫文字來訓練 AI 模型,因此這類以口語為主的語言致使 Meta 無法使用標準技術打造機器翻譯工具。

目前為止,AI翻譯主要著重於各種書寫語言,但在全球超過7000種的現存語言中,有近半數主要以口語表達,沒有標準或廣泛使用的書寫文字系統。這導致 Meta 無法使用標準技術為這類語言打造機器翻譯工具,因為標準技術需有大量的書寫文字來訓練 AI 模型。

來源:截圖自Meta網站

開發團隊的共同語言,讓閩南語成為 Meta 推出的 AI 語音翻譯先鋒

陳鵬仁表示,其實最初之所以選擇閩南語作為首個開發翻譯語言的原因,其實是開發團隊有不少熟稔閩南語的同仁,因此可以在更快時間驗證翻譯結果是否正確、通順。不過,實際上投入開發之後,大家才發現要順利將閩南語翻譯成其他語言,真的比想像中還難。

畢竟光是閩南語中七聲八調的不同、在台灣明顯的南腔北調情況,甚至在中國福建沿海地區、馬來西亞和新加坡等地所使用的閩南語就有極大落差。閩南語沒有標準化的文字系統,加上各地區發音用詞上的差異,更讓這樣口語相傳為主的語言,更難以制式翻譯方式轉譯為其他語言。

為了打造能這項直接以語音對語音的翻譯技術,Meta 這個多達 50 人規模的開發團隊除了工程師,還包含語言學者、社會學家、倫理學家與諸多跨學術團隊成員,藉此研究目標翻譯語言的背後結構和文化影響。

雖然這項技術目前仍然受限於演算法、學習資料庫等因素,尚無法流暢對話,只能做到逐句翻譯的表現。但 Meta 認為 AI 研究確實能有效幫助人類打破現實世界和元宇宙中的語言藩籬,期許未來能達成更多語言的互譯,讓語言不再是阻擋彼此相互理解的障礙。甚至藉此技術保存更多面臨瀕危的少數語言,為文化保存盡一份力。

最新文章

熱門文章