小红书商业广告算法校招一面
1.TDerror更新公式
2.DuelingDQN中Q值的计算公式
3.DuelingDQN对比DQN优势在哪里
4.DQN还有哪些系列、分别改进点是什么
5.介绍一下TD3
6.离线RL训练如何切换到在线训练?
7.DCN交叉是怎么做的,DCNv2对DCN的改进是什么,带来了怎样的提升?
8.还有哪些交叉模型?
9.为什么离线AUC上涨的比较多,但是ADVVPU提升不明显?
手撕
1.如何用randint(1,6)生成randint(1,8)
2.如何用randint(1,8)生成randint(1,6)
2.DuelingDQN中Q值的计算公式
3.DuelingDQN对比DQN优势在哪里
4.DQN还有哪些系列、分别改进点是什么
5.介绍一下TD3
6.离线RL训练如何切换到在线训练?
7.DCN交叉是怎么做的,DCNv2对DCN的改进是什么,带来了怎样的提升?
8.还有哪些交叉模型?
9.为什么离线AUC上涨的比较多,但是ADVVPU提升不明显?
手撕
1.如何用randint(1,6)生成randint(1,8)
2.如何用randint(1,8)生成randint(1,6)
全部评论
相关推荐
点赞 评论 收藏
分享
阿里云成长空间 695人发布
