2020-02-25 14:14 腾讯_数据平台部_算法工程师

关注

Functional approximation

Generalization and discrimination:
Generalization: 相似借鉴
Discrimination：不同区分

reinforcement online setting
reinforcement learning里的算法是online learning,所以并不是所有的supervised learning algorithm都能用到reinforcement learning里面。
Supervised learning: target是固定的,不会随着时间而改变。Reinforcement learning会随着自身状态估计而改变。

Gradient Monte Carlo Method
图片说明

State aggregation
把状态相近的分为一组。更新是一组跟着一起更新。

TD is a semi-gradient method
图片说明
所以是semi-gradient的策略。

The true objective for TD
图片说明

全部评论

推荐最新楼层

04-19 22:30

杭州电子科技大学大数据开发工程师

HR面被问的猝不及防

HR面考的不是技术，是这个人稳不稳、好不好管。每句话背后都有潜台词。问为什么离职→ 你会不会也这样离开我们？问职业规划→ 你打算待多久？问期望薪资→ 这个人好不好谈？被HR刷掉的基本就这几种：薪资说死了没空间、抱怨前公司被打叉、规划说走一步看一步、反问环节一声不吭。过HR面的人有个共同点：不卑不亢，说话留余地。薪资给区间不给死数，离职原因永远是"寻求更好发展"，被压薪别慌，淡定说句我这边还有其他offer在考虑，您这边有空间吗？往往比你想象中管用。HR面是最后一道情商检测。带着筹码去，别空手进。

查看3道真题和解析

点赞评论收藏

分享

04-19 22:22

杭州电子科技大学大数据开发工程师

想从事Agent方向，从Claude出发反而是个很好的切入点。

很多人学Agent上来就啃框架文档，结果越看越懵。不如先把Claude用透。日常用Claude的过程中，你会自然遇到三个问题：为什么有时候回答很准，有时候一塌糊涂？为什么给的上下文不一样，结果差这么多？为什么有些任务它能自己拆解，有些完全跑偏？这三个问题就是Agent的核心：prompt工程、上下文管理、任务规划。从这里展开学就有方向了。prompt写不好，Agent就是个废物，先把Claude的system prompt、few-shot、chain of thought这些玩明白。然后学RAG，因为Agent需要调用外部知识，向量数据库怎么存怎么检索得懂。再学tool calling，Cl...

想从事Agent应该学习...

点赞评论收藏

分享

04-24 19:10

已编辑

电子科技大学嵌入式工程师

真是有华选华

华为这一块还是权威👍

点赞评论收藏

分享

04-24 10:32

北京邮电大学 Java

阿里云基础平台研发一面

自我介绍实习是否遇到过大量连接建立导致服务端压力很高的线上问题，你们是短连接还是 TCP 长连接A 系统 QPS 2k，单机需要承受多少 QPSC 系统 详细说一下稳定性治理的整个过程；主从同步的时间是多少Checkpoint 回溯机制是如何做的如果做核心数据流，如何解决 Checkpoint 回溯导致重复消费的问题；如果用事务提交两个点之间的数据，可能带来什么问题项目使用 Canal 监听 Binlog 实现最终一致性，是如何做的RabbitMQ 一定能保证消息不重复，不漏发，以及一定能消费到吗Canal 重复向 MQ 发送数据，如何解决八股缓存雪崩、击穿、穿透分别是什么MySQL 有哪几种...

查看24道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 简历上如何体现你的“AI”能力？ #

15266次浏览 337人参与

# 哪些AI项目值得做？ #

25434次浏览 620人参与

# 华泰星战营，提前锁定校招offer #

13330次浏览 389人参与

# 找不到大厂实习可以去小厂吗？ #

20665次浏览 228人参与

# 你总挂在第__面？ #

10856次浏览 120人参与

# 没有面试的日子里，你在做什么 #

13575次浏览 363人参与

# 实习时最怕听到的一句话 #

22693次浏览 195人参与

# 选择和努力，哪个更重要？ #

207241次浏览 1551人参与

# 你想吐槽公司的哪些规定 #

47585次浏览 237人参与

# 你简历上最心虚的一句话 #

21240次浏览 233人参与

# 这份实习，有没有动摇过你的职业方向？ #

51455次浏览 284人参与

# 你知道最慷慨和最抠的公司分别是 #

10639次浏览 86人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

200303次浏览 1186人参与

# 正在春招的你，也参与了去年秋招吗？ #

398456次浏览 2741人参与

# 京东笔试 #

174119次浏览 936人参与

# 秋招笔试记录 #

399855次浏览 2221人参与

# 机械人还在等华为开奖吗？ #

335138次浏览 1638人参与

# 网易笔试 #

170542次浏览 811人参与

# 2022毕业的你对23届的寄语 #

68215次浏览 578人参与

# 90后北漂现状 #

39148次浏览 225人参与

# 机械人，说说你的烦心事 #

144788次浏览 1153人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务