【本報台北訊】台灣人工智慧年會昨天邀請Google DeepMind工程師黃士傑以「AlphaGo─深度學習與強化學習的勝利」為題演講,黃士傑認為,AlphaGo的成功,是深度與強化學習的勝利,AI在可見的未來將成為人類的工具,與人類合作。
黃士傑指出,DeepMind的夢想就是要做出General(通用型)的AI,而AlphaGo僅是其中一個專案。身為業餘六段棋士的黃士傑,從師大時開始研究電腦圍棋,也曾發展出Erica,獲得二○一○年電腦奧林匹亞十九路圍棋冠軍。
「Google要做的不是『Erica +』。」黃士傑指出,Deep mind先把策略網路應用至AlphaGo中,並把判斷形勢的價值網路應用其中,強化學習結合深度學習,並擁有左右互搏的自我學習,成為打敗柯潔的AlphaGo Master。
黃士傑指出,後來的AlphaGo Zero則是移除所有人類既有知識,僅留下規則、限制,AlphaGo Zero三天就走過人類幾千年圍棋研究的歷程,二十一天達到AlphaGo Master的水準,四十天後AlphaGo Zero更是輾壓前面各版本的AlphaGo。
「AlphaGo Zero展示了強化學習的巨大潛力,AI在可見的未來將成為人類的工具,與人類合作等結論。」黃士傑也說,AlphaGo自我學習目前還不能適應所有領域,而什麼時候會有Strong AI呢?黃士傑認為,仍舊是遙遠的,「有時候電影只是電影」。