【妙手回春】為何要研究電腦視覺? 文/中央研究院|研之有物編輯群 |2025.02.16 語音朗讀 460觀看次 字級 大 中 小 充滿歲月痕跡的老照片(圖),按一個鍵,色調不再泛黃、摺痕也消失無蹤。 圖/廖弘源提供充滿歲月痕跡的老照片,按一個鍵,色調不再泛黃、摺痕也消失無蹤(圖)。 圖/廖弘源提供作者簡介 中央研究院|研之有物編輯群 研之有物,取諧音自「言之有物」,出處為《周易‧家人》:「君子以言有物而行有恆。」盼以具體的研究案例、真實的研究員生活,揭開中央研究院神祕的面紗,讓人們了解研究成果如何應用到生活中,繼而體會研究的價值與重要性。另著有《研之有物:穿越古今!中研院的25堂人文公開課》、《研之有物:見微知著!中研院的21堂生命科學課》。圖/廖弘源提供 文/中央研究院|研之有物編輯群 輕按快門,相機可以快速找到人臉對焦;機場快速通關窗口,機器能在幾秒鐘之內認出你是誰;裝一台攝影機,就可以計算某段時間內有多少人車經過……「電腦視覺」加上「機器學習」技術的進步,讓我們的生活更加安全及便利。不過,電腦可不是一開始就這麼聰明。電腦「看」世界的方式,和你我很不一樣。在我們眼中,一張圖畫裡可能有人物有風景。但在電腦「眼」中,卻只是大量數字,每個數字代表的是對應像素的灰階或顏色強度。中研院資訊所特聘研究員兼所長廖弘源,窮畢生之力,都在教電腦怎麼「看」世界:從0與1組合成的數位世界中,找出各種「特徵」,並據此識別出特定的物件,進而判斷視訊資料的意義。比方說,媽媽今天燙了個捲捲頭回家,爸爸可能會一時之間認不出來,但電腦依然能辨認這位捲髮女士是媽媽,因為五官並沒有改變。廖弘源和研究團隊在二○○一年發表的論文,探討此一問題,證明「五官特徵」才是電腦辨識人臉的依據,而非五官之外的髮型、衣著、首飾等,此知識讓業界的臉部辨識系統發展得更精準,也成為該領域近二十年來必讀的文獻之一。以「識別」與「比對」為核心,電腦視覺延伸出很多用途。廖弘源和研究團隊二十多年來開發出了多項創新技術,像是人臉和車牌的辨識系統,現在已是治安保全的重要利器;而為數位檔案加上「雞尾酒浮水印」,則可以防範辛苦的智慧結晶被盜用。老相片老電影重獲新生二○○六年起,廖弘源接手另一項艱難任務:「數位典藏與數位學習國家型科技計畫」。面對龐大的數位典藏檔案,首要工作就是快速有效地處理、判讀、注解,接著有效搜尋及擷取多媒體內容。多媒體資料不只有圖片,還包括影片(數位化後稱為「視訊」)。視訊等於一秒鐘三十張圖片串接在一起,再加上聲音,資訊量非常龐大,因此分析難度,跟簡單的圖片不可同日而語。另外一個大難題是,許多珍貴的老膠捲,有的被蟲蛀、有的甚至發霉了,眼看就要損毀。還好,廖弘源研究團隊成功打出一記「還我漂亮拳」!一連串視訊篡改的研究,應用在數位修補技術上,成功幫受損的照片或影片「回春」了。什麼是視訊篡改?目的不是要捏造不存在的歷史,或是製造虛構的畫面,但透過「無中生有」的原理,卻可以還原已經被破壞的元素。像右圖照片所示,原本斑駁陳舊,但電腦程式可以自動擷取摺痕周邊的影像資訊,用類似「模擬」的方式,產生原本不存在於照片上的元素,把缺損給填補起來。要修補動態的影片更加困難,廖弘源團隊在當年做出了領先世界的創新研究,採用一種ISOMAP技術,以非線性的方式降低維度,不但減少了影片資料運算所需的記憶容量,還能用空間的轉換,填補被破壞的片段,讓動作看起來自然而連續。許多發霉的老膠捲、經典電影或相片,在這項技術之下,重獲新生。(摘自《研之有物:格物窮理!中研院的25堂數理科學課》,時報出版) 前一篇文章 【科學實證】幸福密碼 不假外求 下一篇文章 【亡羊補牢】病毒起源追追追 熱門新聞 01【何處不交朋友】可敬的朋友2025.05.05028 方法有效 對治胃食道逆流2025.05.0303【國學探究】 人相忘乎道術:《莊子》論「忘」的生命智慧2025.05.0604【寓言故事】天宮保健官到人間2025.05.0405聯合國衛塞節慶典 佛光山與會2025.05.0806助緬重建 佛光山、佛光會、星洲基金會再捐物資 2025.05.0307【深頁凝視】《小書店大繪集》手繪匠心獨具的書空間2025.05.0408人間佛教學術工作坊 探索實踐路徑2025.05.0309尤英夫 40年公益軌跡不停歇2025.05.0310【營養專欄】這些奶,你喝對了嗎?2025.05.03 訂閱電子報 台北市 天氣預報 台灣一週天氣預報 相關報導 【寓言故事】天宮保健官到人間【投向媒體】避免更多受害者【畫中有話】具象化我的內心世界【一舉兩得】功利性步行【此情此景】茉莉花【愛與犧牲】犧牲的媽媽 愧疚的女兒