美团大模型应用算法秋招一面

1.八股:Transformer中哪个模块的计算量最大?如何优化
2.八股:Transformer 的位置编码方式有哪些?RoPE 的核心思想是什么?
3.八股:在大模型推理阶段,KV Cache 的作用是什么?
4.项目:在项目中你用过 DPO 吗?和 PPO 相比,它有什么优缺点?
5.项目:如何在有限算力下做大模型微调?常用方法有哪些?
6.项目:训练一个7b模型要占用多少显存,不同zero阶段能节省多少显存
7.项目:如果让 agent 调用搜索引擎,如何避免无关结果影响回答?
8.项目:你在项目里有没有做过 RAG 里的“召回-过滤-生成”三段式 pipeline?能不能细讲一下?
9.代码题:lc141 环形链表
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务