26校招美团大模型算法二面
1.八股:讲讲transformer架构
2.八股:Transformer encoder?为什么需要FFN?
3.八股:LORA和全参数微调的区别
4.八股:讲DPO,PPO,GRPO
5.项目:实习项目问的很细,数据构造,微调参数等
6.项目:Agent整体流程是怎么做的?包括哪些模块
7.项目:为什么选用deepSeek,了解deepseek-R1吗,介绍一下
8.项目:Deepseek MLA?为什么压缩?
9.项目:如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数
10.项目:Agent怎么评估效果
11.代码题:lc143 重排链表
2.八股:Transformer encoder?为什么需要FFN?
3.八股:LORA和全参数微调的区别
4.八股:讲DPO,PPO,GRPO
5.项目:实习项目问的很细,数据构造,微调参数等
6.项目:Agent整体流程是怎么做的?包括哪些模块
7.项目:为什么选用deepSeek,了解deepseek-R1吗,介绍一下
8.项目:Deepseek MLA?为什么压缩?
9.项目:如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数
10.项目:Agent怎么评估效果
11.代码题:lc143 重排链表
全部评论
相关推荐
点赞 评论 收藏
分享

