26校招美团大模型算法二面

1.八股:讲讲transformer架构
2.八股:Transformer encoder?为什么需要FFN?
3.八股:LORA和全参数微调的区别
4.八股:讲DPO,PPO,GRPO
5.项目:实习项目问的很细,数据构造,微调参数等
6.项目:Agent整体流程是怎么做的?包括哪些模块
7.项目:为什么选用deepSeek,了解deepseek-R1吗,介绍一下
8.项目:Deepseek MLA?为什么压缩?
9.项目:如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数
10.项目:Agent怎么评估效果
11.代码题:lc143 重排链表
全部评论

相关推荐

11-13 20:16
已编辑
厦门理工学院 软件测试
专业嗎喽:硕佬,把学校背景放后面几段,学校背景双非还学院,让人看了就不想往下看。 把实习经历和个人奖项放前面,用数字化简述自己实习的成果和掌握的技能,比如负责项目一次通过率90%,曾4次发现项目潜在问题风险为公司减少损失等等
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务