“阿尔法围棋”（RalphA.Go）在几次世界瞩目的人机大战

[单选题]

“阿尔法围棋”（Ralph A. Go）在几次世界瞩目的人机大战后站在了围棋之巅，现在它又以一种新的方式超越了自己：新版本“从零开始”自学围棋，仅用 3 天就击败其前辈版本，成为新的王者。“阿尔法围棋”主要采用的技术是（）。

```
虚拟现实
```
```
仿真技术
```
```
人工智能
```
```
多媒体技术
```

查看答案及解析

牛客488094426号

AlphaGo（一款围棋人工智能程序）的核心组件和技术：蒙特卡洛树搜索法、监督学习、强化学习、神经网络深度学习。

结合了数百万人类围棋专家的棋谱，通过两个不同神经网络“大脑”合作来下棋，一个神经网络大脑是“监督学习的策略网络policy network”观察棋盘布局企图找到最佳的下一步；另一个神经网络大脑是在给定棋子位置情况下，预测每一个棋手赢棋的概率。AlphaGo为了应对围棋的复杂性，结合了监督学习和强化学习的优势，通过训练形成一个策略网络，将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。

发表于 2021-04-16 16:34:26 回复(0)