腾讯大模型算法一面凉经 好难好难...

1.讨论表格 Agent;以及我认为什么是 agent 什么是 pipeline。
2.写这个论文初衷是什么? 用在业务上吗?
3.GRPO、DPO、DAPO 区别是什么?
4.DPO 的 loss 你怎么理解的?你们业务上用了 DPO 为什么这样设计?
5.讲讲你认你的简历中什么是“感知、规划、执行、反思”?
6.讲一讲你模型的混合推理是什么?和 qwen 他们的 instruct、think 模型有什么区别?
7.GRPO 计算公式是什么?讲一下
8.你给 contribution 给 nips 哪个仓库是什么?
9.你还做了哪些开源贡献
10.玩游戏吗?LOL 什么段位?你一般 lol 是怎么识别外挂的?,还玩过哪些 fps 游戏吗?
11.手撕: 最长递增子序列
全部评论

相关推荐

2025-12-17 11:44
吉首大学 平台产品
黑着眼圈看手机:pdd秋招笔试挂了,春招还行吗
点赞 评论 收藏
分享
2025-12-25 16:26
已编辑
河北科技学院 Java
勇敢的牛油不服输:2800-300那不等于2500一个月吗兄弟们
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务