計算機將棋
此條目翻譯自英語維基百科,需要相關領域的編者協助校對翻譯。 |
計算機將棋是用人工智能創建可以下將棋(包括日本將棋與韓國將棋)的計算機程序的一個領域。將棋軟件的研發主要由自由程序員、大學研究團體和私營公司進行。到2017年,最強大的程序表現超過了頂尖人類棋士。
遊戲複雜度
日本將棋具有重複使用被捕獲棋駒的特點。因此,將棋具有比其他棋類更高的分支因子。因為每一手棋都可以放在眾多方格上,計算機要檢查更多的位置。這使日本將棋在流行的眾多象棋類遊戲中有着最高的合法落子可能性。將棋的高複雜度意味着很難做到高水平的比賽。合法位置和可能出現的局面數是將棋遊戲複雜度的兩種衡量標準。
遊戲 | 棋盤大小 | 棋子數 | 不同棋子數 | 合法局面 | 可能的遊戲局面 | 平均遊戲長度 |
---|---|---|---|---|---|---|
國際象棋 | 64 | 32 | 6 | 1047 | 10123 | 80 |
象棋 | 90 | 32 | 7 | 1040 | 10150 | 95 |
韓國將棋 | 90 | 32 | 7 | 1044 | 10160 | 95 |
日本將棋 | 81 | 40 | 8 | 1071 | 10226 | 140 |
圍棋 | 361 | 最多360 | 1 | 10170 | 10360 | 150 |
組成部分
計算機將棋程序的主要組成部分是開局棋譜、搜索算法和終局。開局棋譜有助於程序處於一個很好的局面,節省時間。然而,將棋專業棋手並不總是按照將棋的開局順序下棋,而是採取不同的舉措來創造出優秀的局面。搜索算法在一系列移動中更深入地預判,使程序能夠更好地評估移動。由於可能的移動較多,將棋(包括日本將棋與韓國將棋)比國際象棋更難搜索,因為日本將棋與韓國將棋的棋盤都比國際象棋的棋盤大。程序到達穩定局面時將停止搜索。問題在於許多位置因打入而不穩定。最後,終局是在王(日本將棋為玉將,韓國將棋為宮)遭到攻擊時開始,並在比賽獲勝時結束。在國際象棋中,終局棋子較少導致通過殘局數據庫可以做到完美遊戲,而日本將棋中可以打入持駒,所以沒有殘局數據庫。
電腦對戰人類
在20世紀80年代,由於編程、CPU和內存等領域的技術不成熟,計算機將棋程序要花很長時間思考,並且往往做出沒有明顯理由的舉動。這些程序具有一個業餘愛好者的水平。
在21世紀的頭十年,計算機將棋在軟硬件技術方面邁出了重要的一步。在2007年,頂級將棋棋士羽生善治估計了2006年世界計算機將棋冠軍Bonanza的實力。他於2007年3月26日在《日本經濟新聞》晚間版上撰寫了關於Bonanza與龍王渡辺明的比賽。羽生善治評價Bonanza有二段將棋學徒的水平。
具體而言,計算機最擅長蠻力計算,並且在從給定局面尋找詰玉方式的任務方面遠遠優於人類,因為這牽扯的可能性更少。在步時為10秒的遊戲中,即使弈者是專業的棋士,電腦也是一個艱巨的挑戰。電腦將棋在過去的穩步發展也是對未來預測的依據。在1996年,羽生善治預測計算機會在2015年打敗他。渡辺明於2012年接受了朝日新聞的採訪。他估計電腦有職業四段的水平。渡邊也表示,電腦有時會為他找到着法。
2005年10月23日,日本將棋協會在第3屆國際將棋論壇上允許2005年名人森內俊之(Toshiyuki Moriuchi)對戰電腦將棋程序YSS。森內俊之贏得了步時30秒的比賽勝利(角行落)。2012年,一位退休職業選手在公開場合首先輸掉了一場比賽。而在2013年,一位未退休的職業選手也負於AI。
Bonanza與渡邊 (2007)
日本將棋協會(JSA)允許龍王渡邊在2007年3月21日與衛冕世界計算機將棋冠軍Bonanza競爭。大和證券贊助了這場比賽。 Hoki Kunihito編寫了Bonanza。 該電腦採用英特爾至強2.66 GHz 8核,內存為8千兆字節,硬盤容量為160 GB。 之後以每場2小時和1分鐘讀秒進行比賽。 這些條件有利於渡邊,因為更長的時間限制意味着時間壓力導致的錯誤更少。 更長的比賽時間也意味着人類玩家可以在計算機的計算範圍之外制定長期策略。 這兩名棋士的水平並不相同。 渡邊是2006龍王戰冠軍,Bonanza為2段將棋學徒水平。由於程序改進和更快的計算機,Bonanza比以前強一點。 由於渡邊研究舊的Bonanza遊戲記錄,渡邊為一個較弱的Bonanza作準備。
正如渡邊預計,Bonanza先手並使用四間飛車。渡邊認為Bonanza的一些着法較差。 然而,渡邊深刻分析了這些舉動,認為計算機可能會看到渡邊沒有看到的東西。渡邊在比賽結束後評論道,如果Bonanza在進入終局之前進行了防守動作,他可能會輸掉。 但電腦選擇立即進行攻擊,而不是花時間防守(並使用其令人印象深刻的終局戰略),這使其最終輸棋。 Bonanza在112步之後投了。
Bonanza認輸後,渡邊在他的博客中評論了電腦,「我認為他們還有很長的路要走,但現在我們必須認識到他們已經達到了與專業人士匹敵的地步。」渡邊在2008年6月27日的讀賣新聞中進一步澄清了他在下象棋的電腦上的表態,當時他說:「我認為我將能夠在未來10年中擊敗將棋軟件」。另一個跡象是Bonanza遠遠低於職業渡邊的水平,這是在2007年5月的世界電腦將棋錦標賽結束後的兩個月。 Bonanza輸給了2007年世界電腦將棋冠軍YSS。 然後YSS在15分鐘的比賽中輸給業餘的加藤幸雄。
年度CSA比賽展覽比賽(2003-2009)
CSA錦標賽的獲勝者與強大的棋士一起參加了比賽。 這些展覽比賽始於2003年。
年 | 程序 | 人 | 讓子 | 時間 | 讀秒 | 優勝者 |
---|---|---|---|---|---|---|
2003 | IS Shogi | Pro 5 Dan Katsumata | 二枚落 | 25分鐘 | 沒有 | 電腦 |
2004年 | YSS | Pro 5 Dan Katsumata | 飛車落 | 25分鐘 | 沒有 | 電腦 |
2005年 | Gekisashi | Pro 5 Dan Katsumata | 角行落 | 25分鐘 | 沒有 | 電腦 |
2006年 | Bonanza | Yukio Kato | 沒有 | 15分鐘 | 30秒 | 人 |
2007年 | YSS | Yukio Kato | 沒有 | 15分鐘 | 30秒 | 人 |
2008年 | Tanase Shogi | Yukio Kato | 沒有 | 15分鐘 | 30秒 | 電腦 |
2008年 | Gekisashi | Toru Shimizugami | 沒有 | 15分鐘 | 30秒 | 電腦 |
2009年 | GPS將棋 | 業餘冠軍 | 沒有 | 1小時 | 1分鐘 | 取消 |
在接下來的一年中,人類競爭更強烈,以面對更強大的程序。 加藤幸雄是朝日業餘名人冠軍。 Toru Shimizugami是業餘名人冠軍。 Bonkras的創始人Eiki Ito在2011年表示,Bonkras等頂級將棋程序目前處於中低水平的職業棋士水平。
Akara與Shimizu(2010)
計算機程序Akara擊敗了女子王將( women's Osho champion)冠軍Ichiyo Shimizu 。 Akara包含4個電腦引擎,Gekisashi,GPS Shogi,Bonanza和YSS。 Akara在169台電腦組成的網絡上運行。 這四個引擎投票選出最佳着法。 Akara選擇票數最多的着法。 如果有相等的投票結果,那麼Akara選擇了Gekisashi的舉動。 東京大學和電子通信大學的研究人員開發了Akara。
Shimizu先手,並在6小時3分鐘、86步後投了。 清水說她正在努力發揮自己的最佳狀態,好像她正面對一個人類棋士。 她於2010年10月11日在東京大學下棋。每位玩家的分配思考時間為3小時,60秒的讀秒 。 750名粉絲出席了這次活動。 這是自2005年以來第三次日本將棋協會授予專業人員與程序對弈的權限,並且是第一次對抗女性職業選手的勝利。
Akara從比賽開始就積極追趕清水。 Akara下出了振飛車,並交換了角行。 雖然這場比賽Shimizu做出了可疑的下法,Akara繼續取勝。 龍王渡邊明批評清水的比賽。 2010年11月19日,讀賣新聞引用渡邊的話。 渡邊說,「清水女士有很多贏得勝利的機會。」
計算機Bonanza和Akara擊敗業餘愛好者Kosaku和Shinoda(2011)
2011年7月24日,有兩局的(two-game)業餘棋士與電腦比賽。 兩個電腦將棋程序擊敗了兩個業餘愛好者組成的對手。 一位業餘的Kosaku先生是一名Shoreikai三段棋士。 另一位業餘的Shinoda先生是1999年的業餘龍王。 業餘愛好者被分配的時間是局時1小時,然後讀秒3分鐘。 計算機的分配時間為局時25分鐘,然後讀秒10秒。
局數 | 電腦 | 先手 | 後手 | 步數 | 計算機時間 | 業餘選手時間 | 硬件 | 優勝者 |
---|---|---|---|---|---|---|---|---|
1 | Bonanza | Kosaku&Shinoda | Bonanza | 93 | 24分41秒 | 2小時2分鐘 | 17個處理器,132個內核,300 GB | Bonanza |
2 | Akara | Akara | Kosaku&Shinoda | 150 | 25分54秒 | 1小時42分鐘 | 帶有6個內核的英特爾至強W3680 | Akara |
Bonkras與Yonenaga(2011-2012)
2011年12月21日,Bonkras計算機程序徹底擊敗了退休的68歲的Kunio Yonenaga ,1993年的名人。 他們在將棋俱樂部24,1小時3分39秒內下了85步。局時15分鐘,然後讀秒60秒。 Yonenaga是後手(白)並且下出了2. K-62(6二玉)。 這一舉措是通過擺脫Bonkras的開局棋譜來混淆計算機。 2012年1月14日,Bonkras再次擊敗Yonenaga。 這場比賽是第一場Denou-sen比賽。 這場比賽有113步。 局時是3小時,讀秒1分鐘。 Bonkras先手並使用了振飛車。 Yonenaga也做出了同樣的第二步,6二玉,就像他之前輸掉的那場比賽一樣。 Bonkras使用6台刀鋒伺服器運行富士通Primergy BX400,每秒搜索18,000,000次移動。 Yonenaga用了2小時33分鐘。 Bonkras用了1小時55分鐘。 Bonkras在2012年1月與Yonenaga評估了它的比賽。
Denou-sen(2013)
Denou-sen是一場人機戰爭。 這場比賽是第二場Denou-sen比賽。Niconico贊助了這5場比賽。5名專業將棋選手對弈5台電腦。前世界計算機將棋冠軍的獲勝者將扮演專業的將棋選手。 每名棋手擁有4小時局時。用完4小時後,玩家必須在60秒內完成每次移動。Niconico現場直播評論。
姓名 | 段位 | Jun'isen Class | 年齡 | JSA號碼 |
---|---|---|---|---|
Koru Abe | 4 | C2 | 18 | 283 |
Shin'ichi Sato | 4 | C2 | 31 | 271 |
Kohei Funae | 5 | C1 | 26 | 281 |
Yasuaki Tsukada | 9 | C1 | 48 | 148 |
Hiroyuki Miura | 8 | A | 39 | 204 |
程序 | 編寫者 | 硬件 | 局面/秒 | 搜索深度 | 程序員的第一場比賽 |
---|---|---|---|---|---|
Shueso | Akira Takeuchi | 2個CPU 8核 | 10000000 | 18~ | 2008 |
Ponanza | Issei Yamamoto | 10個CPU | 30000000 | 30~ | 2009 |
Tsutsukana | 高城一丸 | 1個CPU | 2010 | ||
Puella alpha | Eikyu ito | 3個CPU 16核 | 4000000 | 20~ | 1999 |
GPS將棋 | GPS團隊,田中哲郎 | 667個CPU | 2.8億 | 22 | 2001 |
日期 | 先手 | 後手 | 步數 | 專業棋手 | 電腦時間 | 優勝者 |
---|---|---|---|---|---|---|
3月23日 | KōruAbe | Shueso | 113 | 3小時1分鐘 | 3小時15分鐘 | 人 |
3月30日 | Ponanza | Shin'ichiSatō | 141 | 3小時59分鐘 | 3小時31分鐘 | 電腦 |
4月6日 | KōheiFunae | Tsutsukana | 184 | 3小時59分鐘 | 3小時27分鐘 | 電腦 |
4月13日 | Puella Alpha | Yasuaki Tsukada | 230 | 3小時29分鐘 | 2小時19分鐘 | 和棋 |
4月20日 | Hiroyuki Miura | GPS Shogi | 102 | 3小時59分鐘 | 2小時7分鐘 | 電腦 |
Miura與GPS Shogi
Hiroyuki Miura在比賽前表示他會「全心全意地」打球。三浦決定使用可信的策略,而不是反計算機策略。電腦使用棋譜着法,他們對稱地防守他們的王將。計算機迅速攻擊,三浦採取打入進行反擊。8個多小時後,三浦投了。比賽結束後,三浦表示:「我不應該這樣為比賽做準備,我應該以真正的緊迫感為比賽做好準備,只要我知道,電腦非常強大。」 三浦表示失望,並表示他還沒有弄清楚他出了什麼問題。通過GPS對遊戲的評估在GPS Shogi網站上進行。
Funae與Tsutsukana(復仇賽)
2013年12月31日,Funae和Tsutsukana進行了第二場比賽。Tsutsukana是2013年4月6日擊敗Funae的同一版本。該計算機有一個帶6個內核的英特爾處理器。 Funae贏了。
Denou-sen 3(2014)
2013年8月21日,日本將棋協會宣布,2014年3月15日至4月12日,五名專業將棋選手將會與五台電腦對弈。 2013年10月7日,日本將棋協會挑選了五名選手。
姓名 | 段位 | Jun'isen Class | JSA號碼 | 年齡 |
---|---|---|---|---|
Tatsuya Sugai | 5 | C1 | 278 | 22 |
ShinyaSatō | 6 | C1 | 224 | 36 |
Masayuki Toyoshima | 7 | B1 | 264 | 24 |
Taku Morishita | 9 | B2 | 161 | 47 |
Nobuyuki Yashiki | 9 | A | 189 | 42 |
專業將棋選手將與初級計算機錦標賽的獲勝者對戰。 初級計算機錦標賽於2013年11月2日至4日舉行。
程序員 | 程序 | 排名 | 搜索局面/秒 |
---|---|---|---|
Akira Takeuchi | Shueso | 5 | |
Motohiro Isozaki | Yaneuraou | 4 | 4000000 |
Hiroshi Yamashita | YSS | 3 | 4000000 |
高城一丸 | Tsutsukana | 2 | |
Issei Yamamoto | Ponanza | 1 | 3000000 |
計算機限制
- 每個將棋程序運行在一個6核英特爾處理器上。 不允許多處理器系統。
- 初級電腦比賽結束後,將不允許更改將棋程序。
- 在初級電腦比賽結束後,專業將棋棋士將使用這些將棋程序訓練。
日期 | 先手 | 後手 | 步數 | 專業棋士時間 | 電腦時間 | 優勝者 |
---|---|---|---|---|---|---|
3月15日 | Tatsuya Sugai | Shueso | 98 | 4小時39分鐘 | 4小時1分鐘 | 電腦 |
3月22日 | Yaneuraou | ShinyaSatō | 95 | 5小時0分鐘 | 3小時27分鐘 | 電腦 |
3月29日 | Masayuki Toyoshima | YSS | 83 | 2小時8分鐘 | 3小時15分鐘 | 專業棋士 |
4月5日 | Tsutsukana | Taku Morishita | 135 | 4小時48分鐘 | 3小時56分鐘 | 電腦 |
4月12日 | Nobuyuki Yashiki | Ponanza | 130 | 5小時0分鐘 | 4小時51分鐘 | 電腦 |
每場比賽在上午10點開始,局時5小時。完成5小時後,棋士必須在1分鐘內完成每次移動。中午有1小時午餐,下午5點有半小時晚餐。 Niconico現場直播評論。 日本汽車零部件製造商Denso開發了一種機器手臂來移動計算機的棋駒。
Yashiki 與 Ponanza
Ōshō和Kiō冠軍Akira Watanabe在他的博客中寫道:「人類無法想象Ponanza的一些舉動,如60.L * 16和88.S * 79。我不確定他們現在是否是最好的動作,但是我感覺我正在看不可思議的東西。「 Kisei , andi和Ōza冠軍羽生善治告訴朝日新聞報,「我覺得這次我看到他們的比賽時機器非常強大。」
Denou-sen 3.1:Sugai與Shueso(復仇賽)
2014年7月19日星期六,菅井龍也再次有機會與「Shogo Denou-sen Revenge Match」中的Shueso對抗。 4個月前,菅野在Denou-sen 3的第一場比賽中被Sugues擊敗,所以這被視為他為這次失敗復仇的機會。 這個比賽由日本將棋協會和電信和媒體公司Dwango贊助 ,並在東京將棋會館(日本將棋協會總部)舉行。 雖然遊戲網站對公眾不公開,但遊戲通過Niconico Live直播 ,並由各種將棋專業人員和女性專業人員提供評論。 Shuesho的動作是由機器手臂完成的。 每個棋士的局時是8小時,然後是讀秒1分鐘。 此外,整個比賽時間安排了四個1小時的休息時間,以便雙方有時間吃飯和休息。 這場比賽持續了整個晚上,直到第二天,當Sugai在Shueso的144着後投了時,終於在開始後近20小時完成。
程序員工具
- Shogidokoro(將棋所)
- XBoard/WinBoard
- Shogi Browser Q
- BCMShogi
- FloodGate i
世界計算機將棋冠軍
視頻遊戲系統
下將棋的商業遊戲軟件包括Super Famicom的Habu Meijin no OmoshiroShōgi、Nintendo DS的Clubhouse Games和Xbox的Shotest Shogi。
限制
2005年9月18日,日本將棋協會專業5段與電腦下將棋。 這場比賽在日本小松的第29屆Hokkoku Osho杯將棋比賽中進行。 松江國立技術學院開發了計算機程序Tacos。Tacos先手,並在開局中選擇了不移動飛車。 專業棋士橋本跟隨Tacos開局,同時交換角行。 Tacos在開局和中盤比賽中有着很好的表現,甚至到第80步也是如此。許多業餘棋士都希望Tacos能夠獲勝。 然而,專業棋士橋本防守嚴密。Tacos下奇怪的着法,最終輸棋。
2005年10月14日,日本將棋協會禁止職業棋手與電腦下棋。 日本將棋協會表示,這項規則是為了維護其專業人員的尊嚴,並充分利用電腦將棋作為潛在商機。 禁令阻止了計算機相對於職業棋手的評級。
從2008年到2012年,日本將棋協會不允許專業棋手和電腦之間進行任何比賽。
里程碑
- 2005年:在業餘龍王戰中,程序Gekisashi在第一輪淘汰賽中以40分鐘的比賽擊敗小川榮司。
- 2005年:程序」歌姬「在40分鐘的表演賽中擊敗業餘6段筱人人士。
- 2007年:Shogi Club 24計算機的最高評分是YSS 2744。
- 2008年5月,電腦程序Tanase Shogi擊敗Asahi業餘名人冠軍持有人Yukio Kato。 在15分鐘的表演賽中走75步。
- 2008年:5月,計算機程序Gekisashi擊敗業餘名人 Toru Shimizugami。 在15分鐘的表演賽中下100步。
- 2008年11月,「歌姬」在1小時的比賽中以1分鐘讀秒擊敗業餘名人清水美。
- 2010年10月,第一次電腦擊敗了將棋冠軍。 Akara在6小時3分鐘內擊敗女子Osho冠軍清水。
- 2011年5月,Shogi Club 24上最高評價的棋手是計算機程序Ponanza,評分3211. [ 需要的引證 ]
- 2011年12月,最高評價的Shogi Club 24棋手是電腦程序Bonkras,在2116場比賽後被評為3364分。 [ 引用需要 ]
- 2012年1月,邦克拉斯擊敗了1993年的名人 Yonenaga。 他們進行了113步的對局,局時3小時,然後是每次移動1分鐘。
- 2013年4月20日,GPS Shogi擊敗三浦浩之,排名第15。比賽局時4小時,102着,讀秒1分鐘。
- 2013年5月12日,Shogi Club 24上最高評價的棋手是計算機程序Ponanza,評分3453。 [ 需要的引證 ]
- 2014年4月12日,Ponanza擊敗羽之伸行,名列第12位。比賽進行130着,局時為5小時,然後每次1分鐘。
- 2016年4月10日,Ponanza擊敗了Takayuki Yamasaki 八段。 85着。 Takayuki使用了7小時9分鐘。
- 2017年5月20日,Ponanza在2場比賽中擊敗了名人 AmahikoSatō 。
- 2017年12月5日,Google DeepMind的AlphaZero令人信服地擊敗強大的程序elmo 。