2020-02-25 14:14 腾讯_数据平台部_算法工程师

关注

Functional approximation

Generalization and discrimination:
Generalization: 相似借鉴
Discrimination：不同区分

reinforcement online setting
reinforcement learning里的算法是online learning,所以并不是所有的supervised learning algorithm都能用到reinforcement learning里面。
Supervised learning: target是固定的,不会随着时间而改变。Reinforcement learning会随着自身状态估计而改变。

Gradient Monte Carlo Method
图片说明

State aggregation
把状态相近的分为一组。更新是一组跟着一起更新。

TD is a semi-gradient method
图片说明
所以是semi-gradient的策略。

The true objective for TD
图片说明

全部评论

推荐最新楼层

12-04 11:37

西安电子科技大学 Java

🔥面试官：说说看，用户登录后拿到的 Token，你应该怎么存？存哪里？

开篇：一个经典的面试题“说说看，用户登录后拿到的 Token，前端应该怎么存？”这个问题看似简单，却能清晰地分辨出一个前端开发者对安全的理解深度。是存到 localStorage？sessionStorage？还是 Cookie？又或者是内存里？不同的选择背后，是截然不同的安全考量。今天，来聊一聊 Token 的存储之道，让你不仅知道怎么做，更明白为什么这么做。选项一：Web Storage（localStorage / sessionStorage）这是最直观、最容易想到的方案。 // 登录成功后 const token = 'your_jwt_token_here'; localStora...

查看1道真题和解析

点赞评论收藏

分享

12-05 10:50

上海得物信息集团有限公司_java开发工程师(准入职员工)

得物内推，得物内推码

得物测开一面面经，摘自优秀牛油面试时间：24/10/19面试时长：30 min1. 自我介绍； 2. 为什么找测试岗位； 3. 讲一下测试的一般流程； 4. 设计测试用例的常用方法； 5. 如果需要测试一个接口，去测试一个并发场景，应该如何去做； 6. 如何去设置多线程； 7. 10万级别的接口访问量，如何去模拟； 8. 数据库了解如何； 9. 2000万中有2万条数据是热数据，需要经常使用的，如何实现； 10. socket 和 http 的区别； 11. 现场直播或者打游戏，在线视频，使用 http 还是 socket； 12. 如果你负责一个项目，需要多个团队或者业务组合作，作为项目负责...

点赞评论收藏

分享

11-08 22:19

浙江科技大学运营

2025秋招现状be like：

深圳某不知名公司  

Java转测开第一人：这种就是饼把应届当廉价劳动力用完然后丢掉

你觉得今年秋招难吗

点赞评论收藏

分享

10-18 19:23

东北大学 Java

27届日常实习简历求拷打

bg末9 CS弱相关专业，第一次写简历，外卖+点评烂大街项目，最近一个月才开始刷算法背八股，目前hot100过了一遍，八股只看了JavaGuide重点和黑马的视频，想在北京找个中小厂实习有机会吗😭

为了实习付出一切：随便乱杀

简历中的项目经历要怎么写

点赞评论收藏

分享

12-01 09:35

OPPO_AI算法部_AI研究员(准入职员工)

霸王茶姬内推，霸王茶姬内推码

1️⃣霸王茶姬面经（hr面） “简单自我介绍一下” 我大概讲了专业成绩和获奖等，我特意提到了我在社团有过活动策划的经历 “嗯有过活动策划经历是吧，说一下你对最近的市场热点有关注吗” “你了解霸王茶姬吗？就你的了解说一下” “你知道我们最近做的活动吗？” “你觉得你的沟通能力怎么样” “你知道达人是什么吗” “你了解我们这个岗位吗” “你觉得以你的经历，能为这个岗位带来什么，你做这个岗位的优势是什么” “你从大学城到公司大概要多久” -反问环节 问了薪资和上下班时间之类的 2️⃣霸王茶姬复试面经（部门主管面） “简单介绍一下自己” “你觉得做一个活动策划最重要的是什么” “你想从我们这个实习中获...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

华为开奖交流

热聊中

创作者周榜

更多

正在热议

更多

# uu们，春招你还来吗？ #

13860次浏览 91人参与

# 硬件兄弟们甩出你的华为奖状 #

117327次浏览 699人参与

# 百融云创求职进展汇总 #

266次浏览 0人参与

# 哪一瞬间让你觉得“这班不如不上” #

12800次浏览 161人参与

# 面试紧张时你会有什么表现？ #

16050次浏览 131人参与

# 工作前VS工作后，你的心态变化 #

14587次浏览 164人参与

# Offer比较，你最看重什么？ #

240851次浏览 1483人参与

# 2025年终总结 #

14368次浏览 224人参与

# 第一份工作能做外包吗？ #

87095次浏览 583人参与

# 为了去实习，我赌上了___ #

22746次浏览 208人参与

# 总结:哪家公司最喜欢泡池子 #

155694次浏览 560人参与

# 应届生初入职场，求建议 #

279090次浏览 2839人参与

# 父母对你找工作是助力还是阻力？ #

14408次浏览 207人参与

# 高薪高压 vs 低薪wlb，你怎么选？ #

12925次浏览 140人参与

# 互联网公司评价 #

459295次浏览 4041人参与

# 一人推荐一个值得做的项目 #

10378次浏览 147人参与

# 十二月请对我好一点 #

26509次浏览 356人参与

# 和牛牛一起刷真题 #

118714次浏览 2085人参与

# 学历or实习经历，哪个更重要 #

202934次浏览 1076人参与

# 毕业论文进行时 #

17014次浏览 112人参与

# 25届网易互娱暑实进度 #

91930次浏览 750人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务