读书笔记_牛客图书馆_牛客网

牛客图书馆 > 读书笔记

开通博客写笔记

读书笔记

全部第1章第2章第3章第4章第5章第6章第7章第8章第9章第10章第11章第12章第13章第14章第15章第16章

Machine Learning 16th

强化学习的目的是要找到能使长期累积奖赏最大化的策略.在某种意义上可看作具有"延迟标记信息"的监督学习问题. 每个动作的奖赏值往往来自于一个概率分布,因此强化学习会面临"探索-利用窘境",因此...

Just丶Like 编辑于 2019-11-22 17:52:35

热门图书

宇宙的结构

数学史（上下）

计算机程序的构造和解释

Essentials of Programming Languages, 3rd Edition

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号