AlphaGo2.0來到中國, “人機大戰(zhàn)第二季”激戰(zhàn)正酣。
但事實上,AlphaGo已經是圍棋人工智能的第三代。在開發(fā)圍棋人工智能的道路上,人類已經艱難地探索了將近五十年。
第一代圍棋人工智能是中國教授發(fā)明
圍棋的英譯名Go是日語的發(fā)音譯來的,圍棋在日語里寫成“碁”(即Go的發(fā)音),把圍棋譯成Go或者The game of go大概是最蹩腳的翻譯了,尤其是在互聯網時代,把圍棋譯成Go非常不利于圍棋的推廣,但AlphaGo的出現或能改變這個事實。
棋類游戲是對人類智能的挑戰(zhàn),自然也成了人工智能的標志之一。而圍棋一直被認為是人工智能領域里的非常困難的挑戰(zhàn)。二戰(zhàn)還沒結束,圖靈就研究計算機下棋,他于1947年編了第一個國際象棋下棋程序,但直到1968年,最早的電腦圍棋程序才被編寫出來。它是由阿爾伯特·索伯特開發(fā)的,引入了一個評估函數對棋局進行分析,來估算雙方占空的大小。然而,在相當長的一段時間里,業(yè)界的普遍觀點是電腦圍棋只能達到業(yè)余棋手的水準。
真正意義上的第一代圍棋AI(人工智能)——“手談”,是由已故中山大學化學系教授陳志行研發(fā)的圍棋程序,從1993年到2002年共10次獲得電腦圍棋世界冠軍,而“手談”這個名字也是圍棋除“弈”之外的別稱。
陳志行教授原本研究的是量子化學,但同時也是圍棋業(yè)余高手。在1991年退休后,他才開始潛心研發(fā)電腦圍棋軟件,雖然當時的電腦軟件技術水平還非常低,而圍棋棋盤大(19 19,一共有361點),空間狀態(tài)多,打劫、終局規(guī)則復雜,一般程序員至少需要設計一兩年才可能讓電腦學會下圍棋。但量子化學專業(yè)出身的陳志行,使用速度快但不太常用的匯編程序語言搭建圍棋框架和編寫圍棋對弈引擎,他潛心編寫的“Alpha-Beta搜索引擎”速度非常快,在當時領先其他同行幾個數量級,達到了13層搜索深度,也就是說“手談”可以算清后面的13步棋,而其他程序通常只能算七八步。陳志行編寫的“模式識別”專家系統(tǒng)在當時也是無人能及。
陳志行潛心研發(fā)“手談”3年后,終于在世界比賽中斬獲首個圍棋人工智能世界冠軍。當時的“手談”以戰(zhàn)斗力超強著稱,智能水平遙遙領先國際同行。之后“手談”對弈水平不斷進步,在國際性的電腦圍棋對弈比賽上連續(xù)奪冠,奪得了該時期大部分世界比賽的冠軍。
當時個人電腦系統(tǒng)剛在世界范圍內普及,許多圍棋愛好者還專門購買電腦安裝“手談”軟件,用作學習圍棋和訓練的工具,“手談”軟件在世界范圍內銷售量排名第一??梢哉f,“手談”軟件的成功在國內掀起了一波圍棋人工智能研究的熱潮。
“蒙特卡洛樹”算法開啟二代圍棋人工智能
當如IBM深藍那樣的超級電腦,已經能夠擊敗世界上最好的國際象棋棋手時,圍棋軟件卻仍然無法擊敗業(yè)余圍棋高手。
但是,從2006年開始,隨著應用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機器學習在圍棋上的應用,電腦圍棋水平有了突飛猛進的增長,棋力普遍提升到業(yè)余高段的水準。
圍棋的棋子多,組合可能性也多。蒙特卡洛算法是一種基于“隨機數”的計算方法,這一方法源于美國在二戰(zhàn)中研制原子彈的“曼哈頓計劃”。頻率決定概率,圍棋對弈軟件將最常見的對弈定式及棋形輸入其中,從而達到較短時間提高棋力的功效。用通俗的語言解釋這種算法:“簡單來說,人腦下圍棋靠的是邏輯思維,而蒙特卡洛算法就是一個抽樣調查的方法。其實就是一個賭博概率式的方法,如果電腦下100盤棋,用這種下法贏了60盤,用另一種下法只贏了50盤,那么,它就會認定第一種下法,而淘汰另一種下法。”
蒙特卡洛樹搜索算法的出現,可以看作是人工智能取得突破性進展的標志:計算機的思考方式,已經有點接近人類的思維方式了。目前使用蒙特卡洛樹搜索的圍棋對弈軟件有瘋石圍棋(CrazyStone)、銀星圍棋(SilverStar)、天頂圍棋(ZEN)等,都取得了不錯的成績。
2011年8月歐洲圍棋大會,電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段。2012年3月,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手。2013年,CrazyStone被讓四子擊敗日本石田芳夫九段,2014年,CrazyStone被讓四子擊敗日本依田紀基九段。可見圍棋軟件進步迅速,至少比起十年前對弈水平已經提高一大截,受讓四子優(yōu)勢明顯。
2015年10月,同樣基于蒙特卡洛樹搜索的Google旗下人工智能公司DeepMind開發(fā)的AlphaGo,在沒有任何讓子的情況下,以五戰(zhàn)全勝的成績擊敗了歐洲圍棋冠軍、職業(yè)圍棋二段樊麾,這也是電腦圍棋程序首次擊敗圍棋職業(yè)棋手,當然也意味著圍棋AI新時代的來臨。
AlphaGo、絕藝以及人機協(xié)作
圍棋AI之難,難在這項運動本身的多重復雜性——“最簡單的規(guī)則,最復雜的變化”。在AlphaGo及其開發(fā)團隊DeepMind出現之前,幾乎所有研究者都認為在十年內人工智能戰(zhàn)勝圍棋大師的機會是渺茫的。而在它出現以后,幾乎所有人都在驚呼人工智能已破解了圍棋這一歷史難題,甚至在極短的時間內兩次讓研究成果上了《自然》雜志的封面。
據AlphaGo官方介紹,AlphaGo采用了一種更加“通用”的人工智能方法,即采用將改進的蒙特卡洛決策樹算法與深度神經網絡算法相結合的方法構建最終的學習系統(tǒng)。其包括兩個部分:策略網絡與價值網絡。策略網絡在當前給定的棋局中,負責預測下一步的走棋,并對下一步走棋的好壞進行打分,策略網絡的作用好比“模仿”人類棋手的各種走法,以達到預測的效果。然而僅憑模仿無法擊敗最頂級的人類高手,AlphaGo又增加了價值網絡來判斷當前的局面到底對哪一方有利,但圍棋程序的局勢評估相當困難,只能通過深度學習網絡之間自我訓練的方法來達到良好的效果。
2016年3月,AlphaGo以4:1戰(zhàn)勝世界圍棋名將李世石,AlphaGo的實力首次被世人真正認可。AlphaGo 2.0版本的升級亮點是——摒棄人類棋譜,即僅通過監(jiān)督學習和強化學習,再度進化出新的“圍棋機器人”。
事實上,除了AlphaGo,現在還有其他圍棋AI程序也已被證明達到甚至超過了人類棋手的一流水平,比如騰訊AI Lab(騰訊人工智能實驗室)研發(fā)的圍棋人工智能程序“絕藝”(Fine Art),它在今年首次參加UEC杯計算機圍棋大賽,就以11連勝奪得了本屆UEC杯冠軍,在隨后的人機大戰(zhàn)中完勝日本先鋒棋手一力遼。
AI作為工具,被人類棋手“喂招”不斷進化后,它也能“反哺”人類,棋手使用圍棋AI開展人機協(xié)同,AI為人類棋手“蓄力”,1+1>2的進化成為了新看點。隨著數據量的高速增長,AI可以分析總結、自我學習,人則可以通過善用AI、人機協(xié)作,開啟智慧時代,改變現在以及未來的一切。(作者為《機器人產業(yè)》雜志副總編)
實戰(zhàn)雙方形成一場轉換,其結果依然是黑棋明顯優(yōu)勢,白棋斷這個是勝負手這個局部顯然是白棋最后的機會。白棋斷時黑棋已經無法阻止白棋在空中出棋了,而此時或許AI才剛剛意識到前面的失誤。
奧多姆仍處于病危狀態(tài),包括艾弗森在內的多位NBA退役以及現役球星為奧多姆祈福,“魔術師”約翰遜回憶往事,稱贊奧多姆心地善良待人友善。
廣西有一件命案15年沒破,人工智能卻幫警察抓住了嫌疑人。盡管不方便詳細透露案情,但王海波仍然向《科技日報》介紹了機器福爾摩斯近期破獲廣西一起15年懸疑命案的大致套路。
近日美國名嘴采訪機器人被調戲了,看來AI比我們想象的要厲害得多啊。Hanson表示,他以全民女神奧黛麗赫本和他妻子為原型打造了Sophia,而目前他的公司Hanson Robotics已經打造了20個機器人。
而艾弗森作為NBA歷史上最矮小的得分王,的確如杜蘭特所說,在同等身材的球員出類拔萃。值得一提的是,雖然艾弗森身高只有1.83米,杜蘭特的實際身高接近2.10米,但兩個人都是NBA歷史上數得著的砍分大王。
北京時間3月12日,本月初,費城76人隊的傳奇球星阿倫-艾弗森的3號球衣正式退役?!薄 〗衲?月2日,艾弗森的球衣退役儀式在費城76人隊的主場富國銀行中心球館隆重舉行,2萬多名觀眾來到現場見證這一偉大的時刻。
北京時間11月7日,據《菲律賓星報》報道,NBA傳奇球星阿倫-艾弗森日前正在菲律賓出席籃球慈善賽,在接受當地媒體的采訪時,他特別談到了昔日賽場上的老對手科比-布萊恩特。
北京時間10月31日(費城時間10月30日)消息,阿倫-艾弗森今天在76人主場富國銀行中心正式宣布退役?!薄 “ド瓕τ谧约旱某删头浅r湴粒毖?,“我就是費城,當你想起費城籃球,你想起阿倫-艾弗森,這是我努力贏得的。
北京時間7月4日消息,據美國《丹佛郵報》報道,在國王隊撤回5600萬美元的報價合同后不久,安德烈-伊戈達拉和丹佛掘金重新回到談判桌,雙方將會就一份長期的合同進行談判。本來國王想要給伊戈達拉提供一份高達5600萬美元的合同,但是不久前國王宣布撤回這份報價,這樣伊戈達拉仍然是自由球員。
近日,他的前妻塔瓦娜聲稱艾弗森涉嫌誘拐了他們的孩子,現在她請求法院讓前夫把孩子們歸還給她。作為孩子們的唯一法定監(jiān)護人,塔瓦娜相信艾弗森當時并沒有帶著孩子們去夏洛特,而是把他們留在了佐治亞州的一家喜來登酒店。