打开/关闭搜索
搜索
打开/关闭菜单
43
40
4
649
皮卡鱼 Wiki
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
上传文件
切换首选项菜单
通知
打开/关闭个人菜单
未登录
未登录用户的IP地址会在进行任意编辑后公开展示。
user-interface-preferences
个人工具
登录
查看“神经网络的“自我学习”是什么?”的源代码
来自皮卡鱼 Wiki
分享此页面
查看
阅读
查看源代码
查看历史
associated-pages
页面
讨论
更多操作
←
神经网络的“自我学习”是什么?
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<small>[[棋软知识|返回“棋软知识”]]</small> <br> <br> 在主流棋类引擎中,神经网络都属于离线监督学习。 作者会先让引擎自对弈,从而生成数据(棋谱)。 以NNUE跑谱为例,这些数据里面有每步的局面、分数、和这局游戏的结果等等信息,通常是以每步几层或者几千、几万节点自对弈生成。 生成了足够多的数据后,便拿去训练,训练过程可以简单理解为去调整神经网络里的海量参数,使得网络的输出更接近数据。比如一个局面100分,训练就会改变神经网络参数让评估分数去接近这个100分。 因为是离线学习,依赖作者训练发布,所以你使用引擎是无法让引擎“学习”的(但棋类也完全不适合在线学习),而引擎有[[置换表(哈希)是什么?设置多少好?|哈希表]]这种暂时的信息储存,所以拆棋时会感觉引擎有记忆功能,但重新加载后便失去了记忆。 所以强引擎目前不可能一边使用一边学习,而是依赖作者训练好之后再发布出来的。
返回
神经网络的“自我学习”是什么?
。