大模型应用面经合集(已拿offer!)
今天给大家分享一份热乎的大模型应用开发面经。
1️⃣时间范围近半年
2️⃣先说总结
(1)面试内容 & 难度个人觉得,在 LLM 应用的面试题上,没有太多复杂、高深的问题,不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下 MVCC 原理这种偏高难度的八股文问题(当然也遇到了一两次)。
(2)offer会有很多横向对比,如果你期望薪资比较高,对方说要在等等,基本上凉了。大部分涨幅基本是不到 20% 的,但我的期望是 30% 左右,最后还是拿到了。
(3)再总结如下:每次面完都要复盘,没答好的问题,一定要重新梳理答案。没把握问题的可以直接说不会,别给个你自己都听不懂的答案。多看技术文章,扩展技术视野,提高二面面试官对你的印象。终究还是要看效果,看落地效果。
3️⃣面试题
1.LLM 基础:大模型是怎么训练出来的?2.Transform 的架构,Encoder 和 Decoder 是什么?
3.Function Call 是怎么训练的?
4.微调的方案有哪些?自己做过没有?
5.大模型分词器是什么?
6.Embedding 是什么?
7.你们用的那个模型?
8.Lib:介绍一下 langchian
9.介绍一下 autogen有没有用过大模型的网关框架(litellm)为什么手搓 agent,而不是用框架?
10.mcp 是什么?和 Function Call 有什么区别?有没有实践过?A2A 了解吗?
11.Prompt:ReAct 是啥?怎么实现的?CoT 是啥?为啥效果好呢?有啥缺点?Prompt Caching 是什么?温度值/top-p/top-k 分别是什么?各个场景下的最佳设置是什么?
12.RAG:你介绍一下RAG 是什么?最难的地方是哪?文档切割策略有哪些?怎么规避语义被切割掉的问题?多路召回是什么?文档怎么存的?粒度是多大?用的什么数据库?为啥要用到图数据库?向量数据库的对比有没有做过?Qdrant 性能如何?量级是多大?有没有性能瓶颈?怎么规避大模型的幻觉?微调和 RAG 的优劣势?怎么量化你的回答效果?例如检索的效果、回答的效果。
13.workflow:怎么做的任务拆分?为什么要拆分?效果如何?怎么提升效果?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1️⃣时间范围近半年
2️⃣先说总结
(1)面试内容 & 难度个人觉得,在 LLM 应用的面试题上,没有太多复杂、高深的问题,不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下 MVCC 原理这种偏高难度的八股文问题(当然也遇到了一两次)。
(2)offer会有很多横向对比,如果你期望薪资比较高,对方说要在等等,基本上凉了。大部分涨幅基本是不到 20% 的,但我的期望是 30% 左右,最后还是拿到了。
(3)再总结如下:每次面完都要复盘,没答好的问题,一定要重新梳理答案。没把握问题的可以直接说不会,别给个你自己都听不懂的答案。多看技术文章,扩展技术视野,提高二面面试官对你的印象。终究还是要看效果,看落地效果。
3️⃣面试题
1.LLM 基础:大模型是怎么训练出来的?2.Transform 的架构,Encoder 和 Decoder 是什么?
3.Function Call 是怎么训练的?
4.微调的方案有哪些?自己做过没有?
5.大模型分词器是什么?
6.Embedding 是什么?
7.你们用的那个模型?
8.Lib:介绍一下 langchian
9.介绍一下 autogen有没有用过大模型的网关框架(litellm)为什么手搓 agent,而不是用框架?
10.mcp 是什么?和 Function Call 有什么区别?有没有实践过?A2A 了解吗?
11.Prompt:ReAct 是啥?怎么实现的?CoT 是啥?为啥效果好呢?有啥缺点?Prompt Caching 是什么?温度值/top-p/top-k 分别是什么?各个场景下的最佳设置是什么?
12.RAG:你介绍一下RAG 是什么?最难的地方是哪?文档切割策略有哪些?怎么规避语义被切割掉的问题?多路召回是什么?文档怎么存的?粒度是多大?用的什么数据库?为啥要用到图数据库?向量数据库的对比有没有做过?Qdrant 性能如何?量级是多大?有没有性能瓶颈?怎么规避大模型的幻觉?微调和 RAG 的优劣势?怎么量化你的回答效果?例如检索的效果、回答的效果。
13.workflow:怎么做的任务拆分?为什么要拆分?效果如何?怎么提升效果?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
为什么感觉这问的好简单,我刚自学两天的都会
大模型应用是不是不太卡学历
相关推荐

点赞 评论 收藏
分享