Mastering the game of Go with deep neural networks and tree search 中文版来了

nehemiah666 · 2016-04-04 20:00:10 · 3835 次点击 · 预计阅读时间 1 分钟 · 大约8小时之前开始浏览

这是一个创建于 2016-04-04 20:00:10 的文章，其中的信息可能已经有所发展或是发生改变。

http://pan.baidu.com/s/1hr3kxog

http://download.csdn.net/detail/nehemiah666/9472669

里面有nature上paper，我翻译的中文版，和录的一个讲述AlphaGo工作原理的视频，是对AlphaGo工作原理的总结。

下面是摘要部分：

对于人工智能来说，围棋一直被视为最具挑战性的经典游戏，这是由于其巨大的搜索空间以及难于评估的棋盘盘面和走子。这里我们介绍了一个新方法：使用价值网络 (value networks )来评估棋盘盘面和使用策略网络 (policy networks )来选择走子。为了训练这些深度神经网络，我们将有监督学习（从人类职业比赛中学习）和增强学习（从自我对抗的比赛中学习）创新地结合在一起。在没有使用任何前瞻搜索的情况下，这些神经网络的水平已经相当于最先进的使用蒙特卡罗树搜索(MCTS：Monte Carlo tree search)的程序，这些程序模拟了成千上万的随机的自我对抗盘局。我们还提出了一种将蒙特卡罗仿真和价值网络以及策略网络结合起来的新搜索算法。使用该搜索算法后，AlphaGo在和其他围棋程序的对弈中，赢了99.8%的盘局，并且以5比0击败了欧洲围棋冠军。这是计算机程序首次在全尺寸的围棋对抗中击败职业围棋选手，这个壮举以前被认为是至少十年以后才会发生。

有疑问加站长微信联系（非本文作者）

本文来自：CSDN博客

感谢作者：nehemiah666

查看原文：Mastering the game of Go with deep neural networks and tree search 中文版来了

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

3835 次点击

加入收藏微博

收入我的专栏

上一篇：Go-数组去重

下一篇：再次自我黑客马拉松--不用第三方库实现一个基于golang的web service

搜索算法

神经网络

http

net

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

Mastering the game of Go with deep neural networks and tree search 中文版来了

用户登录

今日阅读排行

一周阅读排行

关注我

Mastering the game of Go with deep neural networks and tree search 中文版来了

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏