美团大模型应用算法秋招一面
1.八股:Transformer中哪个模块的计算量最大?如何优化
2.八股:Transformer 的位置编码方式有哪些?RoPE 的核心思想是什么?
3.八股:在大模型推理阶段,KV Cache 的作用是什么?
4.项目:在项目中你用过 DPO 吗?和 PPO 相比,它有什么优缺点?
5.项目:如何在有限算力下做大模型微调?常用方法有哪些?
6.项目:训练一个7b模型要占用多少显存,不同zero阶段能节省多少显存
7.项目:如果让 agent 调用搜索引擎,如何避免无关结果影响回答?
8.项目:你在项目里有没有做过 RAG 里的“召回-过滤-生成”三段式 pipeline?能不能细讲一下?
9.代码题:lc141 环形链表
2.八股:Transformer 的位置编码方式有哪些?RoPE 的核心思想是什么?
3.八股:在大模型推理阶段,KV Cache 的作用是什么?
4.项目:在项目中你用过 DPO 吗?和 PPO 相比,它有什么优缺点?
5.项目:如何在有限算力下做大模型微调?常用方法有哪些?
6.项目:训练一个7b模型要占用多少显存,不同zero阶段能节省多少显存
7.项目:如果让 agent 调用搜索引擎,如何避免无关结果影响回答?
8.项目:你在项目里有没有做过 RAG 里的“召回-过滤-生成”三段式 pipeline?能不能细讲一下?
9.代码题:lc141 环形链表
全部评论
相关推荐
查看25道真题和解析 点赞 评论 收藏
分享
02-24 19:45
西南大学 后端工程师
程序员小白条:简历写的有点太多了,一般两页是实习经历比较多的情况下,要么自己有一些有影响力的开源项目,如果你走软件,硬件没必要实习,学校安排总是没区分度的,央国企最好有中大厂实习,另外学历比较重要,不是都要求硕士的,技术会比互联网要求低一些 点赞 评论 收藏
分享
