【妙手回春】為何要研究電腦視覺? 文/中央研究院|研之有物編輯群 |2025.02.16 語音朗讀 668觀看次 字級 大 中 小 充滿歲月痕跡的老照片(圖),按一個鍵,色調不再泛黃、摺痕也消失無蹤。 圖/廖弘源提供充滿歲月痕跡的老照片,按一個鍵,色調不再泛黃、摺痕也消失無蹤(圖)。 圖/廖弘源提供作者簡介 中央研究院|研之有物編輯群 研之有物,取諧音自「言之有物」,出處為《周易‧家人》:「君子以言有物而行有恆。」盼以具體的研究案例、真實的研究員生活,揭開中央研究院神祕的面紗,讓人們了解研究成果如何應用到生活中,繼而體會研究的價值與重要性。另著有《研之有物:穿越古今!中研院的25堂人文公開課》、《研之有物:見微知著!中研院的21堂生命科學課》。圖/廖弘源提供 文/中央研究院|研之有物編輯群 輕按快門,相機可以快速找到人臉對焦;機場快速通關窗口,機器能在幾秒鐘之內認出你是誰;裝一台攝影機,就可以計算某段時間內有多少人車經過……「電腦視覺」加上「機器學習」技術的進步,讓我們的生活更加安全及便利。不過,電腦可不是一開始就這麼聰明。電腦「看」世界的方式,和你我很不一樣。在我們眼中,一張圖畫裡可能有人物有風景。但在電腦「眼」中,卻只是大量數字,每個數字代表的是對應像素的灰階或顏色強度。中研院資訊所特聘研究員兼所長廖弘源,窮畢生之力,都在教電腦怎麼「看」世界:從0與1組合成的數位世界中,找出各種「特徵」,並據此識別出特定的物件,進而判斷視訊資料的意義。比方說,媽媽今天燙了個捲捲頭回家,爸爸可能會一時之間認不出來,但電腦依然能辨認這位捲髮女士是媽媽,因為五官並沒有改變。廖弘源和研究團隊在二○○一年發表的論文,探討此一問題,證明「五官特徵」才是電腦辨識人臉的依據,而非五官之外的髮型、衣著、首飾等,此知識讓業界的臉部辨識系統發展得更精準,也成為該領域近二十年來必讀的文獻之一。以「識別」與「比對」為核心,電腦視覺延伸出很多用途。廖弘源和研究團隊二十多年來開發出了多項創新技術,像是人臉和車牌的辨識系統,現在已是治安保全的重要利器;而為數位檔案加上「雞尾酒浮水印」,則可以防範辛苦的智慧結晶被盜用。老相片老電影重獲新生二○○六年起,廖弘源接手另一項艱難任務:「數位典藏與數位學習國家型科技計畫」。面對龐大的數位典藏檔案,首要工作就是快速有效地處理、判讀、注解,接著有效搜尋及擷取多媒體內容。多媒體資料不只有圖片,還包括影片(數位化後稱為「視訊」)。視訊等於一秒鐘三十張圖片串接在一起,再加上聲音,資訊量非常龐大,因此分析難度,跟簡單的圖片不可同日而語。另外一個大難題是,許多珍貴的老膠捲,有的被蟲蛀、有的甚至發霉了,眼看就要損毀。還好,廖弘源研究團隊成功打出一記「還我漂亮拳」!一連串視訊篡改的研究,應用在數位修補技術上,成功幫受損的照片或影片「回春」了。什麼是視訊篡改?目的不是要捏造不存在的歷史,或是製造虛構的畫面,但透過「無中生有」的原理,卻可以還原已經被破壞的元素。像右圖照片所示,原本斑駁陳舊,但電腦程式可以自動擷取摺痕周邊的影像資訊,用類似「模擬」的方式,產生原本不存在於照片上的元素,把缺損給填補起來。要修補動態的影片更加困難,廖弘源團隊在當年做出了領先世界的創新研究,採用一種ISOMAP技術,以非線性的方式降低維度,不但減少了影片資料運算所需的記憶容量,還能用空間的轉換,填補被破壞的片段,讓動作看起來自然而連續。許多發霉的老膠捲、經典電影或相片,在這項技術之下,重獲新生。(摘自《研之有物:格物窮理!中研院的25堂數理科學課》,時報出版) 前一篇文章 【科學實證】幸福密碼 不假外求 下一篇文章 【亡羊補牢】病毒起源追追追 熱門新聞 01曾在日本絕跡 人工繁殖8朱鷺野放2026.06.0302誠實麵包坊 烤出信任香氣2026.06.0403一車甘泉入山林 印度水人護生2026.06.0504破淚2026.06.0305【浮世畫框】斑斕的歲月2026.06.0506多瑙河畔法音交融 佛光山祈世界和平2026.06.0407曼城博物館慶佛誕 佛光人祈世界和平2026.06.0308新馬寺慶衛塞節 政商教界祈福淨心2026.06.0309普賢寺 佛光人蓮潭淨園2026.06.0410【老師的話】 接受不完美,人生才能更美2026.06.06 訂閱電子報 台北市 天氣預報 台灣一週天氣預報 相關報導 【另類處方】 來不及告別的遺憾【腳踏實地】 接受大地的洗禮【創造共好】 讓你的光,帶著更多人一起發光【心有所感】 從榮獲全球華文文學星雲獎 談文學啟迪人心【先禮後兵】 如何應對得寸進尺之人?【惜福知足】 練習感受 富足的心態