台灣工程師投入台語AI翻譯 盼父親溝通順暢

 |2022.10.20
844觀看次
字級
Meta打造人工智慧(AI)技術翻譯系統,讓使用閩南語人士能與使用英語者對話。這項新技術的幕後推手之一,是來自台灣的Meta軟體工程師陳鵬仁。圖/取自馬克·祖克柏臉書

【本報台北訊】臉書(Facebook)母公司Meta打造人工智慧(AI)技術翻譯系統,讓使用閩南語人士能與使用英語者對話。這項新技術的幕後推手之一,是來自台灣的Meta軟體工程師陳鵬仁,希望父親能用最熟悉的台語跟所有人溝通。

Meta指出,在台灣長大的陳鵬仁深深了解語言障礙將影響溝通能力,他的父親陳聖獎是一位70歲、退休的工廠技術主管,來自閩南語普遍使用的台灣南部。雖然閩南語與中文這2種語言相關,仍有許多不同,讓陳鵬仁的爸爸常覺得用中文進行複雜的對話非常困難。

「我希望我爸跟所有人溝通時,都用台語,這是他最熟悉的語言。」陳鵬仁分享,「他聽得懂中文,但若是討論比較複雜的主題時,他說話的速度會比較慢。」不甘於只為爸爸擔心,他開始投入心力,改善這個問題,推動全新的技術發展,讓閩南語及英文能相互翻譯。

Meta表示,目前為止,AI翻譯主要著重於各種書寫語言,但在全球超過7000種的現存語言中,有近半數主要以口語表達,沒有標準或廣泛使用的書寫文字系統。這導致Meta無法使用標準技術為這類語言打造機器翻譯工具,因為標準技術需有大量的書寫文字來訓練AI模型。

為克服這項挑戰,Meta為主要以口語表達的「閩南語」打造一個史無前例的人工智慧技術翻譯系統。這項採用開放原始碼的翻譯系統是Meta Universal Speech Translator(UST,通用語音翻譯工具)專案的一部分,致力於開發新的AI方法,希望能為所有現存語言進行即時語音翻譯,包括主要以口語表達的語言。

為開發這個只有語音的全新翻譯系統,Meta AI研究人員必須克服許多來自傳統機器翻譯系統的挑戰,包括資料蒐集、模型設計以及準確度評估。圖/unsplash

為開發這個只有語音的全新翻譯系統,Meta AI研究人員必須克服許多來自傳統機器翻譯系統的挑戰,包括資料蒐集、模型設計以及準確度評估。Meta不只會開放閩南語翻譯模型的原始碼,也會公開評估資料集和研究報告,讓其他人能重製並以Meta的工作成果為基礎建立模型。

Meta著手打造閩南語翻譯系統時,面臨的一個重大障礙,是能否蒐集足夠資料。Meta利用中文作為中間語言,以建立偽標籤和人工翻譯,也就是先將英語或閩南語語音翻譯成中文文字,接著再翻譯成閩南語或英語,並新增至訓練資料中。這個方法利用資源充足的相似語言的資料,大幅改善模型成效。

Meta指出,評估主要以口語表達的語言例如閩南語時,挑戰之一是沒有標準的書寫文字系統。為啟動自動評估程序,Meta開發了一套系統,將閩南語語音轉譯成標準化的拼音符號,能夠很容易比較不同方法下的翻譯品質。

Meta也根據名為Taiwanese Across Taiwan的閩南語語音語料庫,建立第一個閩南語與英語雙向的語音翻譯基準資料集。Meta將開放此基準資料集的原始碼,鼓勵其他研究人員合作進行閩南語語音翻譯,一同在這個領域取得更多進展。

Meta表示,在目前的階段,Meta的作法能讓使用閩南語的人士與使用英語者對話。雖然相關模型仍在開發中,而且每次只能翻譯一個完整句子,但已朝向未來實現為各種語言提供同步翻譯的目標邁進。

Meta認為,AI研究有助於打破在現實世界和元宇宙中的語言限制,未來所有語言無論是否可以書寫,都不再是阻礙人們相互理解的障礙,期待為未來順暢無阻的溝通持續貢獻。

熱門新聞
訂閱電子報
台北市 天氣預報   台灣一週天氣預報

《人間福報》是一份多元化的報紙,不單只有報導佛教新聞,乃以推動祥和社會、淨化人心為職志,以關懷人類福祉、追求世界和平為宗旨,堅持新聞的準度與速度、廣度與深度,關懷弱勢族群與公益;強調內容溫馨、健康、益智、環保,不八卦、不加料、不阿諛,希冀藉由優質的內涵,體貼大眾身心靈的需要、關懷地球永續經營、延續宇宙無窮慧命,是一份承擔社會責任的報紙。自許成為「社會的一道光明」的《人間福報》任重而道遠,在秉持創辦人星雲大師「傳播人間善因善緣」的理念之際,更將堅持為社會注入清流,讓福報的發行為人間帶來祥和歡喜,具體實現「人間有福報,福報滿人間」的目標。
人間福報社股份有限公司 統編:70470026

 
聯絡我們 隱私權條款

Copyright © 2000-2024 人間福報 www.merit-times.com.tw
All Rights Reserved.