跳转到内容

AlphaGo李世乭五番棋

本页使用了标题或全文手工转换
维基百科,自由的百科全书
(重定向自AlphaGo李世石五番棋

AlphaGo對李世乭是由韓國職業九段棋士李世乭이세돌)與由Google DeepMind開發的電腦圍棋軟件AlphaGo對弈的五局三勝制圍棋比賽。比賽於2016年3月8日到3月15日在南韓首爾舉行,採中國圍棋規則:黑方給白方的貼目為七目半,思考時間每方兩小時,用完後各有三次一分鐘讀秒[1]。結果為AlphaGo以四勝一敗擊敗李世乭。賽後韓國棋院授予AlphaGo為榮譽九段[2]

背景

遊戲棋類比賽一直是軟體工程師用來測試電腦運算能力與人工智慧的最好方法。1997年,IBM深藍電腦擊敗俄籍西洋棋冠軍卡斯巴羅夫,工程師們轉往開發圍棋軟體程式,但由於圍棋的高複雜度,在2015年10月以前,電腦程式(如Zen和Crazy Stone英语Crazy Stone (software))的圍棋能力都略與業餘高手相當,無法在分先的情況下擊敗圍棋職業棋士,只能在受讓四或五子的情況下擊敗九段的職業棋士[3][4]

AlphaGo於2015年10月以5比0的成績擊敗了歐洲圍棋冠軍二段職業棋手樊麾,這是電腦程式第一次在未受讓子的情況下在19路棋盤上擊敗職業棋士[5][6][7]谷歌決定宣佈出資100萬美元,向韓國最強的職業棋士挑戰[8]。但是不少評論員認為樊麾的棋力與李世乭九段相距甚遠,不認為AlphaGo真的俱備了擊敗頂尖選手的實力。[9]部分圍棋職業棋士在AlphaGo對樊麾的對局中發現AlphaGo有失誤的情況,雖然認為AlphaGo真實的棋力還未知[9],但仍普遍看好李世乭可以5:0战胜AlphaGo[10][11]

加拿大人工智能專家强納生·謝弗英语Jonathan Schaeffer在樊麾被擊敗後把AlphaGo比喻為一個欠缺經驗的“天才兒童”,並指出“真正的成功要在與真正的頂級棋士對戰時才會出現”,但他在2016年3月卻表示相信李世乭會取得這次比賽的勝利[6]。Google工程师同样自信,来自Google内部的消息称「李世石胜出的可能性为0」[12]國際圍棋聯盟的秘書長李夏辰英语Lee Ha-jin對於有人工智能能夠挑戰李世乭一事表示“非常興奮”,同時她認為兩者的勝算均等[6]。機器學習專家李開復在賽前預測李世乭對上AlphaGo,每盤勝算約是89%,AlphaGo想獲勝應該還要一、兩年。

規則

此次比賽採用中國圍棋規則,黑方給白方的貼目為七目半,思考時間每方兩小時,用完後各有三次一分鐘讀秒[1]。每一局的開始時間為13:00 KST (04:00 GMT).[13]。勝方會獲得一百萬美元的獎金。若AlphaGo勝出,則奬金會捐給包括聯合國兒童基金會在內的慈善機構[14]。除了獲勝獎金之外,李世乭還會在五輪對局後獲得共十五萬美元的出場費,以及每局勝利外加二萬美元的額外獎金[1]

對局

比賽日期為2016年3月8日到3月15日,地點為韓國首爾四季酒店[15][16],並透過流媒体向全球直播[17]。由Google DeepMind研究員暨台灣圍棋業餘六段棋士黃士傑替分散式運算版的AlphaGo放置棋子[18],而AlphaGo則透過雲端技術傳送至美國Google伺服器上進行運算來決定棋子位置[19]

在第四局後,由電腦圍棋軟體瘋狂的石頭英语Crazy Stone (software)的作者所架設的世界職業圍棋等級分排行網站Go Ratings,將AlphaGo排入該網站的第四名[20],五番棋獲四勝後晉為該網站的第二位[21]。但是被該網站排為第一的中國棋士柯潔認為此網站的排名沒有公信力,並表示將程式與職業棋士並排也不公平。[22]

摘要

局次 日期 黑方 白方 結果 手數
1 2016年3月9日 李世乭 AlphaGo 白中盘勝 186
2 2016年3月10日 AlphaGo 李世乭 黑中盤勝 211
3 2016年3月12日 李世乭 AlphaGo 白中盘勝 176
4 2016年3月13日 AlphaGo 李世乭 白中盘勝 180
5 2016年3月15日 李世乭 AlphaGo 白中盘勝 280
最終結果:
AlphaGo  4-1  李世乭
註:依照官方規則第五局執先方為隨機,但第四局後的記者會結束時李世乭希望繼第四局執白獲勝後能於第五局執黑挑戰勝利。哈薩比斯同意了提議。[23]

第一局

李世乭在他的比賽時間尚餘約28分鐘時投子(認輸)[24],由執白子的AlphaGo獲勝[25]

前99手
100–186手

第二局

AlphaGo(黑方)勝出第二局。

前99手

白14開始攻擊左下角黑棋,黑15覷、白16粘,黑17、黑19回防。

王銘琬九段說:日本棋界稱黑15為「阿法覷」。

100-199手
200-211手

第三局

第三局比賽執黑子的李世乭在第176手之後投子(認輸),AlphaGo在五番棋對戰中取得了三連勝,確定在這場人機對戰中拿下勝利。第三局賽後記者會中李世乭強調「這只是我李世乭個人的敗退,並不是全人類。」,對於敗棋的原因,李世乭說「我從來沒有感受到如此嚴重的壓迫感、負擔感,要克服這些壓力,我的能力不足。」[26]

前99手
100-176手(122在113,
154在, 163在145, 164在151,
166和171在160, 169在145, 175在

第四局

李世乭(白方)勝出第四局;古力將李世乭78手稱為「神之一手」,AlphaGo大約在87手才發現它79手算錯了,其後AlphaGo在97手時更出現入門級別的錯誤;李世乭在這次比賽發現AlphaGo用黑子對抗白子時,若遇上不在預期內的棋步就可能出錯;其次,只要AlphaGo用黑子下棋,猶疑的時間更久[27]。而這些錯誤的原因,DeepMind團隊還沒有找出來[28]

前99手
100-180手(177在, 178在

第五局

AlphaGo(白方)勝出第五局。

前99手
100-199手 (118在107,161在
200-280手(240在200,271在
275在,276在

播放

YouTube上的第一局直播平均約有8萬名觀眾收看,最高峰的終局時段觀眾人數達10萬[29]。據微博非官方消息统计首战直播有一亿人观看,其中六千万来自中国。排名最高的非東亞裔圍棋選手邁克·雷蒙(Michael Redmond,美籍職業九段)擔任此次官方英語直播的旁述。新浪乐视网騰訊bilibili等中国网络媒体也轉播了此次比赛[30]

質疑

在李世乭第二盤落敗後,開始出現對於AlphaGo處理打劫能力方面的質疑。圍棋棋局中打劫是常见手段,而劫的存在会让人工智能增加計算量,並进一步考验人工智能的深度计算模型。

前兩場對弈中未出現劫爭,媒体問李世乭是否与谷歌签署保密协议不能打劫争胜,对此李世乭回答:“我中间确实有胜机,以后比赛会尽力下好(笑)。”[31]“棋圣”聂卫平認為:“对电脑的打劫有点质疑,可能打劫时电脑的应对不太好,这两盘棋确实都没有出现打劫的局面,看看后几盘棋电脑应对打劫的时候是什么样子吧。”[32]人机大战裁判长樊麾則表示,2015年十月與AlphaGo對弈的棋谱里,就有过很多劫争,並沒有保密协议[33]

隨後AlphaGo的主要開發人員並曾撰寫碩士論文《電腦圍棋打劫的策略》[34][35]的黃士傑博士也在台灣的弈棋論壇做出下列聲明:“這次比賽並沒有所謂的不能打劫的保密協議。第一、第二盤棋覆盤時李世石九段都有擺出打劫的變化,只是實戰他沒有下出來。我們也想知道,AlphaGo在對陣李世石九段這種級別的棋手,打劫時的表現。 ”[36][37]後來的第三盤後半出現了劫爭,AlphaGo仍然應對得當,證實了AlphaGo有處理打劫的能力。[38]

南韓資訊通信專業律師田石鎮則指控AlphaGo在這場對弈之中可以透過網路隨時收集資訊,並非按照已獲取的資訊落子。[39]然而田石鎮並未對AlphaGo連上網際網路的論述提出任何證據[40],且抨擊其仰賴暴力搜索的論述也與實際運作原理不符。[41]

參考資料

  1. ^ 1.0 1.1 1.2 이세돌 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 기자회견 열려. 韓國棋院. 22 February 2016 [22 February 2016]. (原始内容存档于2016-03-03) (韩语). 
  2. ^ 人機大戰再敗 李世乭:AlphaGo讓我開始挑戰對圍棋的傳統想法. 15 March 2016 [2016-03-15]. (原始内容存档于2016-03-15). 
  3. ^ Zen computer Go program beats Takemiya Masaki with just 4 stones!. Go Game Guru. [28 January 2016]. (原始内容存档于2016-02-01). 
  4. ^ 「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦. MSN Sankei News. [27 March 2013]. (原始内容存档于2013年3月21日). 
  5. ^ Google achieves AI 'breakthrough' by beating Go champion - BBC News. BBC. 27 January 2016 [28 January 2016]. (原始内容存档于2016-01-30).  参数|newspaper=与模板{{cite web}}不匹配(建议改用{{cite news}}|website=) (帮助)
  6. ^ 6.0 6.1 6.2 Elizabeth Gibney, Go players react to computer defeat, Nature, 27 January 2016 [2016-03-10], doi:10.1038/nature.2016.19255, (原始内容存档于2016-01-30) 
  7. ^ Google人工智慧AlphaGo打敗歐洲圍棋冠軍,3月將挑戰全球棋王. 2016-01-28 [2016-03-11]. (原始内容存档于2016-03-12). 
  8. ^ Google AlphaGo 對決李世石前夕,9 位圍棋世界冠軍分析勝負. 2016-02-24 [2016-03-11]. (原始内容存档于2016-03-09). 
  9. ^ 9.0 9.1 Dana Mackenzie. Update: Why this week’s man-versus-machine Go match doesn't matter (and what does). Science. 9 March 2016 [2016-03-10]. doi:10.1126/science.aaf4152. (原始内容存档于2016-03-10). 
  10. ^ 俞斌:谷歌围棋关键内容还是谜 看好李世石5-0. 新浪体育. 2016-03-01 [2016-03-10]. (原始内容存档于2016-03-11). 
  11. ^ 柯洁力挺李世石将完胜电脑:100元全压他. 中国新闻网. 2016-03-06 [2016-03-10]. (原始内容存档于2016-03-11). 
  12. ^ 人类输了!谷歌工程师估算李世石获胜可能为0. 澎湃新闻. 2016-03-09 [2016-03-10]. (原始内容存档于2016-03-10). 
  13. ^ AlphaGo. Google DeepMind. [10 March 2016]. (原始内容存档于2016-01-30). 
  14. ^ Human champion certain he'll beat AI at ancient Chinese game. AP News. 22 February 2016 [22 February 2016]. (原始内容存档于2018-12-22). 
  15. ^ Google's AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast. The Guardian. 5 February 2016 [15 February 2016]. (原始内容存档于2016-03-09). 
  16. ^ Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea. Business Insider. 22 February 2016 [23 February 2016]. (原始内容存档于2016-03-02). 
  17. ^ Novet, Jordan. YouTube will livestream Google's AI playing Go superstar Lee Sedol in March. VentureBeat. 4 February 2016 [7 February 2016]. (原始内容存档于2016-03-08). 
  18. ^ 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo. [2016-03-11]. (原始内容存档于2021-08-03). 
  19. ^ 李世乭:即使Alpha Go得到升级也一样能赢. 中央日報 (韓國). 23 February 2016 [24 February 2016]. (原始内容存档于2016-03-04). 
  20. ^ Google AlphaGo「不小心」排名世界第四,公開點名挑戰圍棋世界第一柯潔. 科技新報. [27 March 2013]. (原始内容存档于2016-03-16). 
  21. ^ goratings.org. [2016-03-16]. (原始内容存档于2017-04-01). 
  22. ^ AlphaGo獲授職業九段 世界排名未獲柯潔認. 北京新浪網. 2016-03-15 [2016-03-18]. (原始内容存档于2016-03-18) (中文(繁體)). 
  23. ^ Why the Final Game Between AlphaGo and Lee Sedol Is Such a Big Deal for Humanity. [2016-03-16]. (原始内容存档于2016-03-16). 
  24. ^ 捍衛人類尊嚴首戰 李世乭敗! - The News Lens 關鍵評論網页面存档备份,存于互联网档案馆) AlphaGo所用的時間比李世乭多(它只餘下5分鐘左右,而李世乭則有還有28分)
  25. ^ AlphaGo defeats Lee Sedol in first game of historic man vs machine match. Go Game Guru. 9 March 2016 [9 March 2016]. (原始内容存档于2016-05-03). 
  26. ^ http://udn.com/news/story/5/1559274/页面存档备份,存于互联网档案馆) 李世乭:只是我輸了-不是全人類 - 中央社 首爾
  27. ^ 棋王奪首勝 「發現電腦弱點」. [2016-03-20]. (原始内容存档于2016-03-19). 
  28. ^ AlphaGo第四戰輸了、為什麼連黃士傑也不知道原因?. [2016-03-20]. (原始内容存档于2016-03-20). 
  29. ^ Künstliche Intelligenz: "Alpha Go spielt wie eine Göttin" - Golem.de. [2016-03-09]. (原始内容存档于2016-03-09). 
  30. ^ 围棋人机大战 李世石 vs AlphaGo 第一盘. letv. 2016-03-09 [2016-03-10]. (原始内容存档于2016-03-10). 
  31. ^ 李世石输到说不出话 遭失礼提问称后面会尽力. 2016-03-11 [2016-03-11]. (原始内容存档于2016-03-12). 
  32. ^ 存保密协议?媒体称李世石连败阿尔法因规则限制. 2016-03-11 [2016-03-11]. (原始内容存档于2016-03-12). 
  33. ^ 人机大战裁判长辟谣:"打劫保密协议"属无稽之谈. 2016-03-11 [2016-03-12]. (原始内容存档于2016-03-12). 
  34. ^ 強者在此!AlphaGo 棋手黃士傑 是台師大博士. 2016-03-10 [2016-03-12]. (原始内容存档于2016-03-13). 
  35. ^ 我為什麼支持 AlphaGo:近距離觀察「AlphaGo背後推手」黃士傑. 2016-03-10 [2016-03-12]. (原始内容存档于2016-03-13). 
  36. ^ janus. 黃士傑闢謠:請別再攻擊李世石九段,打敗他的是分散式版的AlphaGo. 2016-03-11 [2016-03-12]. (原始内容存档于2016-03-12). 
  37. ^ 黃士傑(aja). [專欄] 電腦圍棋程式人工智慧大突破-Google AlphaGo. 2016-03-11 [2016-03-12]. (原始内容存档于2021-08-03). 
  38. ^ 新浪体育. 李世石序盘遭重创 AlphaGo劫争表现无懈可击(多谱). 新浪体育. 2016-03-12 [2016-03-12]. (原始内容存档于2016-03-13).  参数|newspaper=与模板{{cite web}}不匹配(建议改用{{cite news}}|website=) (帮助)
  39. ^ 人機對弈不公平? 南韓專家:AlphaGo可拆解李世乭棋招. 自由時報. 2016-03-11 [2016-03-11]. (原始内容存档于2016-03-12).  参数|newspaper=与模板{{cite web}}不匹配(建议改用{{cite news}}|website=) (帮助)
  40. ^ 专家:阿尔法可实时分析李世石棋招 人机博弈本身不公平. 韩联社. 2016-03-11 [2016-03-16]. (原始内容存档于2016-03-25).  参数|newspaper=与模板{{cite web}}不匹配(建议改用{{cite news}}|website=) (帮助)
  41. ^ David Silver, Aja Huang. Mastering the game of Go with deep neural networks and tree search. Nature. 2016-01-28 [2016-03-16]. (原始内容存档于2019-09-24). 

参考条目

外部链接

  • 回看圍棋比賽直播
    • 李世乭对阵AlphaGo第一局(英語
    • 李世乭对阵AlphaGo第二局(英語
    • 李世乭对阵AlphaGo第三局(英語
    • 李世乭对阵AlphaGo第四局(英語
    • 李世乭对阵AlphaGo第五局(英語