來自台灣的陳鵬仁在臉書母公司Meta研發AI翻譯系統。圖/中央社
【本報綜合報導】臉書母公司Meta日前公布人工智慧(AI)技術翻譯系統,讓閩南語(台語)能和英語互譯。負責這項計畫的Meta AI研究員陳鵬仁來自台灣,他「為愛翻譯」的初衷是希望他父親能夠用台語和任何人交談。
陳鵬仁,出生於台灣,曾在新北市板橋居住二十多年,畢業於台灣大學資訊工程學系,在台工作一年多後即加入Meta公司前身臉書的紐約辦公室。
在Meta工作近十年的陳鵬仁,主要負責AI相關,臉書的地點打卡功能精進就由他操刀,四年前研發文字翻譯,一年半前轉為研究語音對語音翻譯。
父親來自南部
主要說閩南語
陳鵬仁表示,他在台灣的成長過程說國語,但他七十歲已退休的父親陳聖獎來自台灣南部,主要說閩南語。他說,父親聽得懂國語,但是對較複雜的國語反應較慢,國語和閩南語之間,雖然有關聯性,卻也有其不同。
陳鵬仁了解語言的障礙會影響人們的溝通,他一直希望父親能用閩南語和所有人溝通,因為那是他父親用起來最舒服的語言。
就是這個「為愛翻譯」的初心,他著手解決問題,他領頭開發新技術,進行閩南語和英語之間的翻譯。
無現成資料庫
翻譯人員很少
這個閩南語翻譯系統展示影音,由Meta創辦人兼執行長祖克柏(Mark Zuckerberg),用英語和說閩南語的陳鵬仁對話,經由機器人中介翻譯,無縫溝通。
在開發這套翻譯系統之初,由於閩南語沒有太多現成可用的語音資料庫,加上能夠以英語轉換為閩南語的翻譯人員很少,在收集文本、解譯資料,和訓練翻譯模型時困難重重。
陳鵬仁和Meta的研究人員利用國語作為中間語言,和會說閩南語的人緊密合作、確保翻譯正確,把閩南語轉為國語、再轉為英文,以兩組配對的句子透過機器學習進行比對訓練。
陳鵬仁表示,Meta AI翻譯系統的語料庫包含台灣連續劇,其中有些比較誇張的語調,目前沒有特別對此設計。語音翻譯系統的好處是不用透過文字。
考慮納入客語
團隊還在討論
未來是否可能納入如客家話或原住民語等台灣在地語言?陳鵬仁指出,「有可能」,對於接下來要選擇哪些語言,Meta團隊還在討論,客語確實是考慮的語言之一,會評估不同因素來決定哪些語言優先發展,再繼續擴張。
他提到,這次發表閩南語翻譯工具前,有先請家人試用看看,因此理解到閩南語的語調非常困難,但父親測試後覺得很有趣。新聞曝光後,伯父透過父親詢問是否有販賣,因為伯父經營民宿,不太懂英文,如果有這套軟體,未來接待國外觀光客會方便許多。