继国际象棋被ai攻克后,围棋也将被ai击败,不过这次ai代表是google,而不是ibm

alphago 2016年3月对决李世乭,在此之前它已经5:0完成欧洲冠军职业2段樊麾

alphago的杀手是deep mind,由policy network和value network组成,不断做supervised learning(研究专业棋手棋局,向专业棋手学习)和reinforecemnt learning(和自己下棋,同时学习),这是和深蓝完全不同的一个特点,深蓝行棋的规则是事先定义好的,而alphago部分是从棋谱中学习来的

有意思的是,这两个network是训练(喂棋谱)出来的,这是怎么做到的?

ref:

http://www.deepmind.com/alpha-go.html

https://googleblog.blogspot.com/2016/01/alphago-machine-learning-game-go.html

http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

 

Advertisements