首页 > 试题广场 >

“阿尔法围棋”(RalphA.Go)在几次世界瞩目的人机大战

[单选题]

“阿尔法围棋”(Ralph A. Go)在几次世界瞩目的人机大战后站在了围棋之巅,现在 它又以一种新的方式超越了自己:新版本“从零开始”自学围棋,仅用 3 天就击败其前辈版 本,成为新的王者。“阿尔法围棋”主要采用的技术是( )。

  • 虚拟现实
  • 仿真技术
  • 人工智能
  • 多媒体技术

AlphaGo(一款围棋人工智能程序)的核心组件和技术:蒙特卡洛树搜索法、监督学习、强化学习、神经网络 深度学习。

结合了数百万人类围棋专家的棋谱,通过两个不同神经网络“大脑”合作来下棋,一个神经网络大脑是“监督学习的策略网络policy network”观察棋盘布局企图找到最佳的下一步;另一个神经网络大脑是在给定棋子位置情况下,预测每一个棋手赢棋的概率AlphaGo为了应对围棋的复杂性,结合了监督学习和强化学习的优势,通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

发表于 2021-04-16 16:34:26 回复(0)