文/本報綜合報導
美國和中國在科技爭霸上的焦點是人工智慧(AI),有學者認為發展AI的基礎在數學,但事實上,美國並不重視數學人才的培育。據此,美國若不認真補救數學教育,極可能在這場強國爭霸賽輸給中國。
數學差 美國AI爭霸恐輸中國
美國史丹佛大學胡佛研究所(Hoover Institution)學者歐斯林在〈何以中國在AI優勢的競賽要靠數學〉(Why China's Race For AI Dominance Depends On Math)文章表示,世界第一AI強權未來將決定全球金融、商業、電信通訊、戰爭與運算,AI霸權的競賽或許已成為美國和中國權力競逐最突顯的面向。美國總統川普2019年2月簽署一項行政命令「美國AI倡議」,以保護美國在主要AI科技的領導地位。
歐斯林表示,美國未能在適當數學領域訓練出足夠的美國公民以維持AI優勢地位。他指出,北京在AI領域的高超能力已於2017年經由英國廣播公司(BBC)駐中國記者沙磊(John Sudworth)揭露,讓世人得知。沙磊躲在中國西南某地,中國的閉路監控系統7分鐘內就定位到他,這消息震驚了民主國家。
■ AI科技領域需要數學人才
幾年來,美國的企業、大學、智庫和政府已投入數百篇政策論文,以及針對AI挑戰的企畫案。但歐斯林說,AI不是投入大筆經費就能夠發展的,如果相關的基礎數學無法維持優勢,再多的研究報告都是空談。
而機器學習(Machine Learning)領域的技術也需要精密和計算能力超強的演算法。從智慧型手機到美國能源部的橡樹嶺國家實驗室(Oak Ridge National Laboratory)中號稱世界上最強大的超級電腦「高峰」(Summit),或搜尋引擎「谷歌」(Google)到社群網站「臉書」(Facebook)等企業,相關平台和程式都運用了極複雜的數學運算。
歐斯林指出,美國中學生與大學生對基礎數學不夠專精,以至於無法進入更高深的數學領域,像是AI所需的統計理論和微分幾何學。在經濟合作暨發展組織(OECD)對各國學生的數學評量,15歲美國學生的數學成績排名35,低於OECD的平均成績。美國教育無法訓練出具高等數學能力的學生,導致愈來愈少美國人在碩博士班研究數學和科學。
根據國家科學基金會(National Science Foundation)統計,2017年美國的電腦科學系中,有超過64%的博士候選人與將近70%的碩士生是外國人,一半的數學博士學位授予非美國公民。在這些外國學生中,中國和印度學生占大半,他們有些人會留在美國工作,但也有很多人回國幫助自己國家發展的科技。
雖然放寬專業人才簽證審查能吸引國際人才學成後留在美國,但更重要的問題是沒有足夠的美國公民在研究所攻讀高深數學,這可說是所有複雜問題的根源。
■ 中國全方位的AI策略發展
歐斯林說,為何要突顯美國在數學教育上的失敗,原因在於中國已訂下2030年取得全球AI優勢的目標,並動用資源全力達成。
中國的AI市場目前估計約為35億美元,目標是在2030年以前建立一個1兆人民幣(1420億美元)的AI市場,除了政府出資在北京打造AI工業園區,通訊巨擘華為技術公司在倫敦和新加坡皆有AI研究的實驗室,並提出全方位的AI策略。
中國經費大半投入人臉和聲音辨識技術和自然語音處理,其目的是用這些應用數學和AI設備來打造一個史無前例的數位監控國家。據報導,北京正在招募全國最聰明的高中生,訓練他們成為AI的武器科學家。在最近一份國際學生能力評量計畫(PISA)的成績,中國學生在全世界的數學排名第一(科學與閱讀也是),儘管這項成績可以懷疑,但毫無疑問中國重視科學技術工程數學(STEM)教育,遠超過歐美國家。
此外,中國積極招攬海外一流的數學家,包括「千人計畫」吸引關鍵領域的國內外研究人員到中國。歐斯林說,AI投資者如李開復看到中國在AI科技迅速迎頭趕上美國,卻鮮少有人評論是因為「數學能力推動了相關發展」。
先進的AI結合中國發展第5代行動通訊(5G)網路的領先優勢,加上政府挹注資金努力成為半導體晶片生產的領導者。歐斯林認為,這意味著在可見的未來,美國公司不僅會成為中國技術的消費者,而且會放棄打造數位經濟的能力;並將導致美國在維持全球軍事力量平衡的能力崩盤。美國必須承認在吸引與訓練各種數學人才上表現差勁,並認真思考與提出對策,否則很可能輸掉這場AI競賽的先機。
學習AI 必備的數學基礎
數學是AI科技發展不可或缺的理論基礎,雖然數學被認為是獨立性純科學,但在AI時代,數學使AI成為一門規範的科學,在AI各個發展階段都具有關鍵作用。例如:概率論與數理統計,矩陣分析,最優化理論,凸優化,數學分析,泛函分析等等,皆是AI科學必備的數學基礎。
AI的基礎是數學,這已經是確定無疑的共識,但「數學」包含的內涵與外延太廣,到底哪些數學理論和AI科技有直接相關?
■線性代數
在AI學習領域,線性代數無處不在,包含分析(PCA)、奇異值分解(SVD)、特徵分解、LU分解、QR分解、對稱矩陣、正交化&標準正交化、矩陣運算、投射、特徵值&特徵向量、向量空間和規範等,這些概念對理解AI學習的優化方法是必須的。
■機率論與數理統計
機器學習和數理統計並非完全不同的領域,近來有人把AI學習定義為「在Mac上做數理統計」。AI學習需要的數理統計基礎和機率論知識包括組合數學、機率規則&公理、貝葉斯定理、隨機變量、方差和均值、條件和聯合分別、標準分布(伯努利、二項、多項、統一和高斯)、矩母函數、最大似然估計(MLE)、先驗和後驗、最大後驗估計(MAP)和採樣方法。
■多元微積分
在AI學習中,微積分主要用的是微分部分,作用是求函數的極值,就是許多AI學習庫中的求解器(solver)呈現的功能。在AI學習會用到微積分的部分是:微積分概念、偏導數、向量函數、方向梯度、矩陣分布等。
■最優化方法
幾乎所有AI學習算法歸根到底都是在求解最優化問題,求解最優化問題的指導思想是在極值點出函數的導數/梯度必須為0。因此必須理解梯度下降法、牛頓法這兩種常用的算法,它們的疊代公式皆可從泰勒展開公式中找到。