2019-12-07 15:47 腾讯_数据平台部_算法工程师

关注

DRN

DRN: A deep reinforcement learning framework for news recommendation
遇到的问题：无法体现dynamic nature of news recommendation
First, they only try to model current reward
Second, very few studies consider to use user feedback other than click/no click labels (how frequent user returns) to help improve recommendations.
Third, these methods tend to keep recommending similar news to users, which may cause users to bored.

$\epsilon$ -greedy问题: 会推荐完全不相关的东西

$UCB$ 需要尝试多次才能准确得到价值估计
*contribution: *
1.强化学习框架
2.用户活跃度，比起仅仅用点击和不点击的反馈要好很多
3.Dueling Bandit Gradient Descent
4.效果确实好

method：
We use a continuous state feature representation of users and continuous action feature representation of items as inputs to DQN.
model framework:

Push: when a user sends a news request to the system, the recommendation agent G will take the feature representation of the current user and news candidates as input, and generates a top-k list of news to recommend L. L is generated by combining the exploitation of current model and exploration of movie items
Feedback: User u who has received recommended news L will give their feedback B by his clicks on this set of news.
Minor update: After each timestamp, with feature representation of the previous user u and news list L, and the feedback B. G 会比较两个DQN exploitation Q Network and exploration Q network, 哪个效果好，如果后者效果好，现在的模型会朝着exploration更新一点。
Major update: 经验回放, agent保留者最近历史点击和用户活跃度记录.

User Activeness
$\lambda(t) = lim_{dt->0} \frac {Pr(t<=T<t+dt|T>t)}{dt}$

全部评论

推荐最新楼层

昨天 17:05

北京理工大学数据通信工程师

ssob的高效打招呼方式！

很多岗位的hr能收到上百份简历，因此已读不回是常态，所以你需要强制给 hr 展示你自己！简历截图+自我介绍，不用等对方点击交换简历，你直接把简历截图发给对方，你的简历直接闯入对方的眼里！自我介绍太短没有重点、太长大家有阅读障碍，表达公式如下：找实习版：你好，我对此岗位非常感兴趣，我目前是xxx学校(学校好的可以重点提)在读，过往有xxx实习/项目经历，擅长xxxx，和这个岗位非常匹配，每周可以出勤xx天，期望和你有进一步的沟通交流~社招版：你好，我有【x】xxx经验，精通python，有自动化和jmeter性能测试落地经验，熟悉Linux命令和mysql，对接口测试工具fiddler，Wire...

牛客激励计划

点赞评论收藏

分享

05-29 18:20

重庆大学算法工程师

数据开发实习生|暑期实习|米哈游|内推

内推码：J4VQ9 岗位链接：链接 岗位名称：数据开发实习生 投递的时候，请填写内推码，方便我跟进后续流程；实习岗位一般至少5个工作日才有进度更新，请耐心等候； 也欢迎同学们内部相互推荐，实习相对比较容易拿到米哈游的offer 工作职责  1、参与公司数据仓库和数据平台的建设，包括但不限于数据采集、清洗、建模与入仓； 2、参与数据模型的设计和开发，提高数据处理效率和数据质量； 3、编写开发文档，提升数据可用性与可维护性。  任职要求  1、26届及以上均可，本科及以上学历，计算机、软件工程等相关专业优先； 2、熟悉至少一种编程语言，如 Java、Scala、Python等； 3、掌握大数据技术...

投递米哈游等公司7个岗位 >

点赞评论收藏

分享

04-02 17:17

河北工业大学 Java

虽然能力确实不强但不至于被羞辱吧

发出来大家看个乐子吧 北京昌平小厂 应该是初创公司  

Wy_m：只要不是能叫的上名的公司去实习没有任何意义不如好好沉淀自己

点赞评论收藏

分享

昨天 20:05

北京交通大学游戏策划

亲爱的公司，你好！

感谢你收下了我的简历并拒绝了我，你的不选择是对我莫大的怀疑和否定。承蒙大环境的厚爱，我每天都会投递很多简历，我本着尊重每一个公司的原则，努力将我的简历投进每一家公司；但由于个人职业发展规划的限制，你的招聘链接已进入我个人的公司储备库，后期如有合适的投递机会，我将优先考虑投递你，请保持岗位时刻开放。如你需了解更多我个人求职动态，请登录牛客网搜索"FalconSpeed"进行查看再次不感谢你对我的不关注与不支持，在未来的某一天，希望仍有机会与你合作，为实现我的“百万银行存款”而共同奋斗！祝你们的公司早日倒闭！FalconSpeed(校招版)

找工作的破防时刻

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

字节暑期补捞

热聊中

创作者周榜

更多

正在热议

更多

# 写给毕业5年后的自己 #

3926次浏览 65人参与

# 好好告别我的学生时代 #

40833次浏览 800人参与

# 华泰证券Fintech星战营 #

168114次浏览 191人参与

# 职场捅娄子大赛 #

317427次浏览 3250人参与

# 晒一下我的毕业照 #

30972次浏览 331人参与

# 华为求职进展汇总 #

4642860次浏览 28244人参与

# 如何缓解求职过程中的焦虑？ #

7159次浏览 94人参与

# 海信求职进展汇总 #

64834次浏览 357人参与

# 如果今天是你的last day，你会怎么度过？ #

22600次浏览 197人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

108195次浏览 781人参与

# 毕业季等于分手季吗 #

12261次浏览 124人参与

# 晒晒我司的端午福利 #

14812次浏览 99人参与

# HR问：你期望的薪资是多少？如何回答 #

39928次浏览 524人参与

# 记录实习开销 #

24521次浏览 179人参与

# 我想象的实习vs现实的实习 #

280218次浏览 2214人参与

# 上班苦还是上学苦呢？ #

222683次浏览 1329人参与

# 视觉/交互/设计百问百答 #

43158次浏览 427人参与

# 如果中了500万，你会离职吗？ #

81940次浏览 649人参与

# 参加完秋招的机械人，还参加春招吗？ #

47772次浏览 544人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

82775次浏览 1108人参与

# 工作两年想退休了 #

119827次浏览 1118人参与

牛客网
牛客企业服务