【本報綜合報導】Google旗下公司打造的人工智慧軟體AlphaGo在學習人類經驗後橫掃圍棋高手,據報導,新一代AlphaGo似乎更讓人驚訝,能在無任何人類經驗情況下迅速自學,只花短短三天就成為頂級圍棋高手,以一百比零的戰績擊敗「前輩」。
頂尖棋手的養成,動輒需要數十年的訓練、磨礪,Google旗下DeepMind公司打造的AlphaGo,也是在大量學習人類棋譜後才慢慢「封神」,但新一代AlphaGo Zero,卻是從空白狀態學起,在無任何人類輸入條件下,迅速自學圍棋。
網路新聞報導引述專家說,「拋棄人類經驗」和「自我訓練」並非AlphaGo Zero的最大亮點,關鍵在於採用了新的強化學習算法,讓自己變成老師,並帶來了新的發展。
在數百萬局自我對弈及訓練後,AlphaGo Zero獨立發現了人類花費數千年才總結出的圍棋規則,還建立了新戰略,為這個古老的遊戲帶來新見解。
AlphaGo團隊負責人大衛.席爾瓦(Dave Sliver)指出,系統一開始並不知道甚麼是圍棋,只是從單一神經網絡開始,透過神經網絡強大的搜索算法,進行自我對弈,並逐漸調整,提升預測下一步的能力,甚至獨立發現遊戲規則,走出新策略,為這項古老遊戲帶來新見解。
AlphaGo Zero的提升,讓DeepMind看到利用人工智能技術改變人類命運的突破。他們目前正積極與英國醫療機構和電力能源部門合作,提高看病效率和能源效率。