当前位置: 首页> 资讯> 人机大战第4番:李世石成...

人机大战第4番:李世石成功复仇AlphaGo

雷射战机雷射战机
来源:中关村在线
2016-03-14 14:43:08

导语:AlphaGo是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾。


人机大战第4番:李世石成功复仇AlphaGo

3月13日中午12点,谷歌AlphaGo与李世石之间的围棋世纪大战进入第四轮较量。虽然人机围棋对决的胜负已定,AlphaGo 3:0李世石,但也将下满5局让AlphaGo获得更多的学习机会。第四轮AlphaGo持黑子先行,李世石持白子。此战被定义为荣誉之战,最终李世石180手执白中盘胜。

开局阶段双方就形成星小目对星小目的局面,但之后李世石会并未走出模仿棋,在打出自己风格的同时,棋风依旧稳健,并且开局不久就陷入“长考”。

随后在盘中阶段,李世石白78挖,下出一招妙手,成为本场比赛的转折点。从黑87开始,AlphaGo似乎就“崩溃”了,接连出来现两次失误。由于李世石今天多次陷入“长考”,导致耗时太多,先于AlphaGo进入读秒阶段,此时AlphGo剩余时间布局时间还有1个小时。

最后,左下角AlphaGo黑159扳再次出现漏洞,黑子没有继续在此处落子,而是到左边立,导致上一步棋成为“无用功”。李世石180手执白中盘胜,这是AlphaGo在向人类顶尖高手挑战的过程中,第一次投降! 

当前,人机围棋世纪大战比分为,AlphaGo 3:1李世石,剩余最后一场对决将在北京时间:3月15日12:00举行。

蛋君说:阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。

1:0

相关标签

AlphaGo

评论 (0)

| 注册 参与评论

返回

顶部

硬蛋网
扫一扫 关注硬蛋公众号