人類數千年的實戰演練進化,計算機卻告訴我們人類全都是錯的
錢童心 邱智麗 權小星
誰也沒料到,2017年最先刷新人類三觀的,竟然是人工智能。
去年3月一戰成名的AlphaGo(阿爾法圍棋),在歲末年初化身為“Master”,進行60場互聯網棋局車輪大戰,挑落了幾乎所有的中日韓三國圍棋界泰鬥名宿與天才新秀。
隨後在當地時間1月4日清晨,穀歌DeepMind創始人兼CEO戴米斯·哈薩比斯(DemisHassabis)發布推文稱,Master就是AlphaGo,正式宣布升級版的AlphaGo問世。
劇情像極了電影《終結者》中,阿諾·施瓦辛格狠狠地甩來的一句“Iwillbeback!”
AlphaGo曾向多位高手下“戰書”。韓國棋院的負責人向第一財經記者透露:“此前,Master背後團隊DeepMind曾表示,最後十局,想和曾經稱雄一時的各國圍棋界高手進行對決。應該是在這種情況下,‘棋聖’聶衛平九段和常昊九段等和Master進行了對決。”
而DeepMind也希望韓國的曹薰鉉九段和李昌鎬九段兩位“圍棋泰鬥”應戰。不過,曹薰鉉九段已成為韓國執政黨新國家黨的國會議員,因黨內事態混亂,未接受邀請。
而韓國圍棋界的另一位泰鬥李昌鎬九段拒絕的理由更為“直白”。他表示,自己並不喜歡下互聯網圍棋,拒絕了對決請求。
“如果只論勝負的話,畢竟人工智能沒有疲勞,也沒有任何失誤;這種不同於人類的絕對優勢,以及可以按照某種特定的規則進行不斷訓練的條件,都為它創造了良好的條件,人工智能獲得勝利,不見得是個意外。”韓國女棋手尹英敏(音譯)四段說。
發展速度令人震驚
就在去年3月,AlphaGo曾經在韓國打敗了當時韓國專業圍棋手李世石,震驚世界;彼時尹英敏曾經確信李世石會獲得勝利,甚至表示“如果李世石真的輸掉,那么我們這些圍棋指導者,可能就都會面臨失業了”。
尹英敏在韓國首爾運營一家圍棋培訓機構。時隔近一年,第一財經記者再訪尹英敏,她正在接待來帶孩子學習圍棋的家長。
“事實上,世紀級人機大戰過去一年,不僅沒有使我失業,反而還使許多民眾的關注點放在了圍棋上,更多家長開始關注圍棋對於兒童智力發展的促進;這可能也是人機大戰給圍棋界帶來的好處吧。”尹英敏說。
而韓國棋院的負責人也證實說,“在去年人機大戰以後,咨詢觀看圍棋比賽,以及申請參加圍棋段位賽的人數也有了明顯增多”。
對於Master的頻傳捷報,尹英敏似乎也看開了很多。“看到許許多多中日韓的頂級棋手都紛紛敗給AlphaGO,看著這些自己的偶像一個個失敗,心中還是有一些吃驚和失落的。”她坦言。
對於Master的棋風和水平,尹英敏承認“要遠高於此前人機對戰時的AlphaGO,棋風穩健並極少失誤”,並表示“AlphaGo人工智能的發展速度著實令人吃驚”。
哈薩比斯說,他的團隊一直在致力於提升AlphaGo的性能,過去幾天他們用新版測試了幾次非官方的圍棋遊戲,這要感謝網名為Magister和Master的賬號,兩者分別在Tygem(弈城圍棋網)和FoxGo(野狐)的服務器上運行;也要感謝所有觀看比賽的人。他們對比賽結果非常滿意。“更重要的是,新的AlphaGo在遊戲過程中為圍棋界提供了寶貴的經驗。”
哈薩比斯還特地提到了在對弈中失敗的古力,“古力發表博文稱,人類和人工智能一起將會很快發現深度學習的奧秘。”
“我們期待官方的測試,並將於今年再次舉辦整場的圍棋比賽,挖掘AlphaGo博弈過程中所呈現出來的創造力。”哈薩比斯說。
圍棋還能這么下?
2016年12月29日,Master首次出現在弈城,並在當晚就很快取得了對國內高水平職業棋手的十連勝;30日中午,它又在數次連勝後,拿下了“韓國第一人”樸廷桓九段和疑似“中國第一人”柯潔。
柯潔此前在觀戰時曾驚歎:“從來沒見過這樣的招法,圍棋還能這么下?”“人類數千年的實戰演練進化,計算機卻告訴我們人類全都是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。”
1月4日晚,在連續對陣申真諝九段、周睿羊九段、古力九段後,AlphaGo的連勝紀錄擴大到了60場,按照事先的計劃,圍棋程序的非正式比賽測試暫時告一段落。
網絡快棋是目前職業選手練習的主要方式之一,因為每一步思考時間很短,與帶獎金的正式比賽相比,快棋賽中對決雙方更加容易出錯,所以這次升級版AlphaGo的實際圍棋水平如何還需要正式規則比賽的進一步檢驗。
Master展示了人類棋手無法企及的快棋水平,但如果給人類足夠的思考時間,是否結果會不同?
沖擊已經開始
值得一提的是,去年12月13日,多名穀歌高層曾經突訪中國,他們在中國棋院與聶衛平、柯潔等人進行了交流,並達成了合作協議。隨後在日本棋院JournalistClub的頒獎儀式上,哈薩比斯曾表示:“2017年對AlphaGo和圍棋界都將是充滿興奮的一年。”人們沒有意識到,在新的一年還未到來時,人工智能對這項流傳千年的古老技藝的沖擊已經開始。
芝麻科技創始人、CEO朱智對第一財經記者表示:“這次比賽相比上次和李世石的三局體現出了AlphaGo更好的穩定性和信心。在圍棋這個領域,人工智能證明了它確實表現得更好,但這並不意味著機器具有智慧。事實上,機器更擅長處理這些複雜的理性問題,因此在許多的特定領域,機器學習所帶來的智能將逐漸改變傳統的模式。”
而Master版本相較AlphaGO是否有升級與改進,又究竟是優化了什么使其變得如此強大,具體的改進方案目前仍沒有公開。人工智能公司第四范式創始人兼CEO戴文淵猜測認為,“經過逾半年的訓練,數據量應該提升了不少,上回訓練了800萬盤棋,這次估計好幾億了。另外針對上回(對李世石)第四盤棋的弱點,估計在訓練方法上也有改進。”
知乎上同樣引發了Master是否升級的討論,一位備注為“未來知識圖譜創始人”的用戶表示,變強的原因在於,“Master是在AlphaGo的基礎上調整了算法和參數的,而不是它下過多少盤棋,畢竟機器不會真的‘學習’,它只是在重複使用人設定的算法,為優化參數提供數據。”
不過戴文淵認為,升級版的AlphaGo“在對弈中可能會有一些隨機或者非隨機的擾動,即選擇不是最優的位置落子,嘗試新的可能,不會是很笨地自己和自己下”。
電氣和電子工程師協會(IEEE)高級會員、英國厄爾斯特大學計算機科學專業教授柯倫(KevinCurran)對第一財經記者表示:“AlphaGo的成功就連它的創造者們也大吃一驚。我們都知道AlphaGo已經非常先進了,但是沒想到它竟如此優秀。由此可見,增強學習加上‘樹搜索’而成的算法,的確有效增加了‘勝率’,這是AlphaGo優於最厲害的人類圍棋選手的地方。同時我們也不應忘記,當初穀歌的DeepMind團隊研究人工智能技術的目的,並不僅僅是為了研發一套圍棋比賽工具,而是為了在將來能夠更好地把人工智能科技應用到醫療、機器人、無人駕駛汽車、農業、金融等為人類服務的行業當中。這才是如今科技發展最讓人驚豔的地方。”
詩人艾略特說過,“去年的話屬於去年的語言,明年的話等待另一種聲音。”這用在人工智能的瞬息巨變上絲毫不差。