首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
牛客图书馆
>
读书笔记
开通博客写笔记
读书笔记
全部
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
第12章
第13章
第14章
第15章
第16章
Machine Learning 16th
强化学习的目的是要找到能使长期累积奖赏最大化的策略.在某种意义上可看作具有"延迟标记信息"的监督学习问题. 每个动作的奖赏值往往来自于一个概率分布,因此强化学习会面临"探索-利用窘境",因此...
Just丶Like
编辑于 2019-11-22 17:52:35
热门图书
自然哲学之数学原理
普林斯顿微积分读本
昆虫Q&A
点石成金
Neural Network Methods in Natural Language Processing
神经网络与深度学习
查看全部