【妙手回春】為何要研究電腦視覺?

文/中央研究院|研之有物編輯群  |2025.02.16
460觀看次
字級
充滿歲月痕跡的老照片(圖),按一個鍵,色調不再泛黃、摺痕也消失無蹤。 圖/廖弘源提供
充滿歲月痕跡的老照片,按一個鍵,色調不再泛黃、摺痕也消失無蹤(圖)。 圖/廖弘源提供
作者簡介 中央研究院|研之有物編輯群 研之有物,取諧音自「言之有物」,出處為《周易‧家人》:「君子以言有物而行有恆。」盼以具體的研究案例、真實的研究員生活,揭開中央研究院神祕的面紗,讓人們了解研究成果如何應用到生活中,繼而體會研究的價值與重要性。另著有《研之有物:穿越古今!中研院的25堂人文公開課》、《研之有物:見微知著!中研院的21堂生命科學課》。圖/廖弘源提供

文/中央研究院|研之有物編輯群

輕按快門,相機可以快速找到人臉對焦;機場快速通關窗口,機器能在幾秒鐘之內認出你是誰;裝一台攝影機,就可以計算某段時間內有多少人車經過……「電腦視覺」加上「機器學習」技術的進步,讓我們的生活更加安全及便利。

不過,電腦可不是一開始就這麼聰明。電腦「看」世界的方式,和你我很不一樣。在我們眼中,一張圖畫裡可能有人物有風景。但在電腦「眼」中,卻只是大量數字,每個數字代表的是對應像素的灰階或顏色強度。

中研院資訊所特聘研究員兼所長廖弘源,窮畢生之力,都在教電腦怎麼「看」世界:從0與1組合成的數位世界中,找出各種「特徵」,並據此識別出特定的物件,進而判斷視訊資料的意義。

比方說,媽媽今天燙了個捲捲頭回家,爸爸可能會一時之間認不出來,但電腦依然能辨認這位捲髮女士是媽媽,因為五官並沒有改變。廖弘源和研究團隊在二○○一年發表的論文,探討此一問題,證明「五官特徵」才是電腦辨識人臉的依據,而非五官之外的髮型、衣著、首飾等,此知識讓業界的臉部辨識系統發展得更精準,也成為該領域近二十年來必讀的文獻之一。

以「識別」與「比對」為核心,電腦視覺延伸出很多用途。廖弘源和研究團隊二十多年來開發出了多項創新技術,像是人臉和車牌的辨識系統,現在已是治安保全的重要利器;而為數位檔案加上「雞尾酒浮水印」,則可以防範辛苦的智慧結晶被盜用。

老相片老電影重獲新生

二○○六年起,廖弘源接手另一項艱難任務:「數位典藏與數位學習國家型科技計畫」。面對龐大的數位典藏檔案,首要工作就是快速有效地處理、判讀、注解,接著有效搜尋及擷取多媒體內容。多媒體資料不只有圖片,還包括影片(數位化後稱為「視訊」)。視訊等於一秒鐘三十張圖片串接在一起,再加上聲音,資訊量非常龐大,因此分析難度,跟簡單的圖片不可同日而語。

另外一個大難題是,許多珍貴的老膠捲,有的被蟲蛀、有的甚至發霉了,眼看就要損毀。還好,廖弘源研究團隊成功打出一記「還我漂亮拳」!一連串視訊篡改的研究,應用在數位修補技術上,成功幫受損的照片或影片「回春」了。

什麼是視訊篡改?目的不是要捏造不存在的歷史,或是製造虛構的畫面,但透過「無中生有」的原理,卻可以還原已經被破壞的元素。像右圖照片所示,原本斑駁陳舊,但電腦程式可以自動擷取摺痕周邊的影像資訊,用類似「模擬」的方式,產生原本不存在於照片上的元素,把缺損給填補起來。

要修補動態的影片更加困難,廖弘源團隊在當年做出了領先世界的創新研究,採用一種ISOMAP技術,以非線性的方式降低維度,不但減少了影片資料運算所需的記憶容量,還能用空間的轉換,填補被破壞的片段,讓動作看起來自然而連續。許多發霉的老膠捲、經典電影或相片,在這項技術之下,重獲新生。

(摘自《研之有物:格物窮理!中研院的25堂數理科學課》,時報出版)

熱門新聞
訂閱電子報
台北市 天氣預報   台灣一週天氣預報

《人間福報》是一份多元化的報紙,不單只有報導佛教新聞,乃以推動祥和社會、淨化人心為職志,以關懷人類福祉、追求世界和平為宗旨,堅持新聞的準度與速度、廣度與深度,關懷弱勢族群與公益;強調內容溫馨、健康、益智、環保,不八卦、不加料、不阿諛,希冀藉由優質的內涵,體貼大眾身心靈的需要、關懷地球永續經營、延續宇宙無窮慧命,是一份承擔社會責任的報紙。自許成為「社會的一道光明」的《人間福報》任重而道遠,在秉持創辦人星雲大師「傳播人間善因善緣」的理念之際,更將堅持為社會注入清流,讓福報的發行為人間帶來祥和歡喜,具體實現「人間有福報,福報滿人間」的目標。
人間福報社股份有限公司 統編:70470026

 
聯絡我們 隱私權條款

Copyright © 2000-2024 人間福報 www.merit-times.com.tw
All Rights Reserved.