【妙手回春】為何要研究電腦視覺？

文／中央研究院｜研之有物編輯群｜2025.02.16

語音朗讀

571觀看次

字級

大

中

小

充滿歲月痕跡的老照片（圖），按一個鍵，色調不再泛黃、摺痕也消失無蹤。圖／廖弘源提供

充滿歲月痕跡的老照片，按一個鍵，色調不再泛黃、摺痕也消失無蹤（圖）。圖／廖弘源提供

作者簡介中央研究院｜研之有物編輯群研之有物，取諧音自「言之有物」，出處為《周易‧家人》：「君子以言有物而行有恆。」盼以具體的研究案例、真實的研究員生活，揭開中央研究院神祕的面紗，讓人們了解研究成果如何應用到生活中，繼而體會研究的價值與重要性。另著有《研之有物：穿越古今！中研院的25堂人文公開課》、《研之有物：見微知著！中研院的21堂生命科學課》。圖／廖弘源提供

文／中央研究院｜研之有物編輯群

輕按快門，相機可以快速找到人臉對焦；機場快速通關窗口，機器能在幾秒鐘之內認出你是誰；裝一台攝影機，就可以計算某段時間內有多少人車經過……「電腦視覺」加上「機器學習」技術的進步，讓我們的生活更加安全及便利。

不過，電腦可不是一開始就這麼聰明。電腦「看」世界的方式，和你我很不一樣。在我們眼中，一張圖畫裡可能有人物有風景。但在電腦「眼」中，卻只是大量數字，每個數字代表的是對應像素的灰階或顏色強度。

中研院資訊所特聘研究員兼所長廖弘源，窮畢生之力，都在教電腦怎麼「看」世界：從0與1組合成的數位世界中，找出各種「特徵」，並據此識別出特定的物件，進而判斷視訊資料的意義。

比方說，媽媽今天燙了個捲捲頭回家，爸爸可能會一時之間認不出來，但電腦依然能辨認這位捲髮女士是媽媽，因為五官並沒有改變。廖弘源和研究團隊在二○○一年發表的論文，探討此一問題，證明「五官特徵」才是電腦辨識人臉的依據，而非五官之外的髮型、衣著、首飾等，此知識讓業界的臉部辨識系統發展得更精準，也成為該領域近二十年來必讀的文獻之一。

以「識別」與「比對」為核心，電腦視覺延伸出很多用途。廖弘源和研究團隊二十多年來開發出了多項創新技術，像是人臉和車牌的辨識系統，現在已是治安保全的重要利器；而為數位檔案加上「雞尾酒浮水印」，則可以防範辛苦的智慧結晶被盜用。

老相片老電影重獲新生

二○○六年起，廖弘源接手另一項艱難任務：「數位典藏與數位學習國家型科技計畫」。面對龐大的數位典藏檔案，首要工作就是快速有效地處理、判讀、注解，接著有效搜尋及擷取多媒體內容。多媒體資料不只有圖片，還包括影片（數位化後稱為「視訊」）。視訊等於一秒鐘三十張圖片串接在一起，再加上聲音，資訊量非常龐大，因此分析難度，跟簡單的圖片不可同日而語。

另外一個大難題是，許多珍貴的老膠捲，有的被蟲蛀、有的甚至發霉了，眼看就要損毀。還好，廖弘源研究團隊成功打出一記「還我漂亮拳」！一連串視訊篡改的研究，應用在數位修補技術上，成功幫受損的照片或影片「回春」了。

什麼是視訊篡改？目的不是要捏造不存在的歷史，或是製造虛構的畫面，但透過「無中生有」的原理，卻可以還原已經被破壞的元素。像右圖照片所示，原本斑駁陳舊，但電腦程式可以自動擷取摺痕周邊的影像資訊，用類似「模擬」的方式，產生原本不存在於照片上的元素，把缺損給填補起來。

要修補動態的影片更加困難，廖弘源團隊在當年做出了領先世界的創新研究，採用一種ISOMAP技術，以非線性的方式降低維度，不但減少了影片資料運算所需的記憶容量，還能用空間的轉換，填補被破壞的片段，讓動作看起來自然而連續。許多發霉的老膠捲、經典電影或相片，在這項技術之下，重獲新生。

（摘自《研之有物：格物窮理！中研院的25堂數理科學課》，時報出版）

熱門新聞

訂閱電子報

台北市天氣預報台灣一週天氣預報

相關報導