腾讯实习-大模型算法二面面经分享
感觉自己好菜、面试很难,还是要多多练习
1.拷打项目
2.介绍一下grpo训练流程 ppo loss公式 新的网络概率比老的概率要大很多且此时样本优势是负的 会被clip掉需要学习吗
3.benchmark有模型在上面刷榜吗 有没有考虑这种关联推理能力难度太大 现在的研究暂时不需要关注这个能力
4.平时怎么用vibe coding cursor怎么设计的 怎么记住你之前编码踩过的坑
1.拷打项目
2.介绍一下grpo训练流程 ppo loss公式 新的网络概率比老的概率要大很多且此时样本优势是负的 会被clip掉需要学习吗
3.benchmark有模型在上面刷榜吗 有没有考虑这种关联推理能力难度太大 现在的研究暂时不需要关注这个能力
4.平时怎么用vibe coding cursor怎么设计的 怎么记住你之前编码踩过的坑
全部评论
相关推荐
点赞 评论 收藏
分享
查看19道真题和解析 点赞 评论 收藏
分享
查看25道真题和解析 点赞 评论 收藏
分享