首页 > 试题广场 >

(单选题)以下是针对哪种机器学习算法的描述?系统从环境到行为

[单选题]
(单选题)以下是针对哪种机器学习算法的描述?
系统从环境到行为映射的学习,以获得最大的数值的奖赏信号,然后进行闭路循环,与其他机器学习算法不同,它着重与从交互中进行以目标为导向的学习。
  • 监督学习
  • 强化学习
  • 半监督学习
  • 聚类学习
有惩罚和奖赏关键词的可以初步判定为强化学习
发表于 2019-04-10 17:09:25 回复(0)
B
发表于 2020-10-22 18:37:22 回复(0)