阿尔法狗2代原理

蜗牛凶猛 1个月前已收到1个回答举报

共回答了376个问题采纳率：95.5% 评论

阿尔法狗二代，结合了监督学习和强化学习的优势。它通过训练形成一个策略网络（policynetwork），将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。然后，训练出一个价值网络（valuenetwork）对自我对弈进行预测，以-1（对手的绝对胜利）到1（AlphaGo的绝对胜利）的标准，预测所有可行落子位置的结果。这两个网络自身都十分强大，而阿尔法围棋将这两种网络整合进基于概率的蒙特卡罗树搜索（MCTS）中，实现了它真正的优势。新版的阿尔法围棋产生大量自我对弈棋局，为下一代版本提供了训练数据，此过程循环往复。

　　在获取棋局信息后，阿尔法围棋会根据策略网络（policynetwork）探索哪个位置同时具备高潜在价值和高可能性，进而决定最佳落子位置。在分配的搜索时间结束时，模拟过程中被系统最频繁考察的位置将成为阿尔法围棋的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后，阿尔法围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

1小时前

可能相似的问题

阿尔法狗名字

闇纞的啞劇

查看 50

回答 1
阿尔法狗的三个组成部分

璎洮尛芄

查看 172

回答 1
阿尔法狗退役原因

丿吥弃

查看 72

回答 1
狗狗一切正常有点打蔫怎么回事

将要吻上

查看 79

回答 2
请问为什么狗狗细小好后鼻子还是干干的

陌离女王

查看 79

回答 1
狗狗鼻子很干燥一般是什么病

笨笨猪

查看 64

回答 1
狗狗的鼻子上没汗了是干的是不是代表生病了或者不健康什么的啊

始终在一起

查看 822

回答 1
没有精神是怎么了小狗鼻子干干的没有精神

開始恨厼

查看 348

回答 1
狗狗鼻子干燥怎么回事

二次伤害你

查看 55

回答 3
小狗狗鼻子干是怎么回事

四面台

查看 774

回答 1

猜你喜欢的问题

热门问题推荐