26校招美团大模型算法二面

1.八股:讲讲transformer架构
2.八股:Transformer encoder?为什么需要FFN?
3.八股:LORA和全参数微调的区别
4.八股:讲DPO,PPO,GRPO
5.项目:实习项目问的很细,数据构造,微调参数等
6.项目:Agent整体流程是怎么做的?包括哪些模块
7.项目:为什么选用deepSeek,了解deepseek-R1吗,介绍一下
8.项目:Deepseek MLA?为什么压缩?
9.项目:如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数
10.项目:Agent怎么评估效果
11.代码题:lc143 重排链表
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务