大模型小坛 - 个人主页动态 - 牛客网

发布(9) 评论刷题收藏

2025-09-10 16:07

华东理工大学产品经理

大模型面试题合集大模型面试八股

大模型面试题合集大模型面试八股文

0 点赞评论收藏

分享

2025-08-01 16:06

华东理工大学产品经理

大模型秋招必刷：上百道2025最新大模型面试八股文，含答案讲解，5天背完不愁没工作

大模型小坛：所有面试题可以开源给大家后台T一下

0 点赞评论收藏

分享

2025-07-27 20:47

华东理工大学产品经理

大模型应用开发面经（5年经验）

时间范围 近半年实际面过的公司阿里、腾讯、美团、字节、快手、同程、京东、360、keep、滴滴、印象笔记、作业帮、彩云科技、蓝色光标、江城互娱、Aviagames、Hungry Stdios、深言科技、即时科技、RockFlow、格灵深瞳、百融云创、印象笔记、网龙、 HiDream.ai、昆仑万维、数驱互动、Authing先说总结面试内容 &amp; 难度个人觉得，在llm应用的面试题上，没有太多复杂、高深的问题，不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下MVCC原理这种偏高难度的八股文问题（当然也遇到了一两次），究其原因以下几点，一是大模型应用目前仍没有很成熟且被广泛接纳的方案，都还在探索；二是很多公司今年刚开始all in AI（我司all进去的比较早点），面试官也懂得不多，例如RAG这个东西，大部分的面试题无非是“你觉得RAG中最难的是什么？（文档切割喽）”、“你是怎么解决幻觉问题的？”，“微调和RAG的区别是啥？”等等，如果你做过RAG加上你经常看技术文章结合你的“侃侃而谈”，基本面试官都觉得ok。但这里着重说一下我觉得当前非常重要且极大概率提升面试通过率的的一个技术点，就是掌握微调原理并且做过动手做过微调工作再加上动手部署过大模型，这是我面试中最常被问到而又只能说没做过的问题，当然大部分公司都有专门的算法团队去做这件事，自己到没机会参与其中，也是可以理解的。算法题：一半是DP问题，还有一部分难度是easy的问题，总体上都是“老熟人”，但是，你即使写出来，面试不一定就能过，有的干脆就不考算法题。八股文：明显比之前少很多，这个和面试的岗位有关系，LLM应用的岗位更偏实践，所有很多一面就是leader面，直接问项目，除非一面也不懂LLM的东西，就会考八股文，但总的来说，八股少了，但是绝对不可以不准备，好几次挂在这上面，别小瞧它。岗位内容：游戏公司：基本上是LLM + AB test for 游戏策划；BI 分析；游戏社区客服助手；toC: Agent 个人助手toB: Agent for 解决方案other: 通用 Agent 平台；公司内部AI助手、平台；Agent for 运维offer会有很多横向对比，如果你期望薪资比较高，对方说要在等等，基本上凉了。大部分涨幅基本是不到20%的，但我的期望是30%左右，最后还是拿到了（要有一点点耐心，还要有一定的运气）。不要眼高手低，先拿一个低于自己预期的offer，再慢慢谈，前提是公司想要你。规划好时间，集中面试，集中对比，由于我时间线拉的过长，后面安排的很乱。再总结每次面完都要复盘，没答好的问题，一定要重新梳理答案。没把握问题的可以直接说不会，别给个你自己都听不懂的答案。简历一定要让大模型润色，但自己要check一遍，别吹过头了。多看技术文章，扩展技术视野，提高二面面试官对你的印象。表达一定要流畅清晰，不要断断续续的，面试官会觉得你思路不清晰。项目效果评估是个很重要的问题，不管你的技术多炫酷，终究还是要看效果，看落地效果。面试题这里想到多少写多少LLM 基础大模型是怎么训练出来的？Transform 的架构，Encoder 和 Decoder 是什么？Function Call 是怎么训练的？微调的方案有哪些？自己做过没有？大模型分词器是什么？Embedding 是什么？你们用的那个模型？Lib介绍一下 langchian介绍一下 autogen有没有用过大模型的网关框架（litellm）为什么手搓agent，而不是用框架？mcp 是什么？和Function Call 有什么区别？有没有实践过？A2A 了解吗？PromptReAct 是啥？怎么实现的？CoT 是啥？为啥效果好呢？有啥缺点？Prompt Caching 是什么？温度值/top-p/top-k 分别是什么？各个场景下的最佳设置是什么？RAG你介绍一下RAG 是什么？最难的地方是哪？文档切割策略有哪些？怎么规避语义被切割掉的问题？多路召回是什么？文档怎么存的？粒度是多大？用的什么数据库？为啥要用到图数据库？向量数据库的对比有没有做过？Qdrant 性能如何？量级是多大？有没有性能瓶颈？怎么规避大模型的幻觉？微调和RAG的优劣势？怎么量化你的回答效果？ 例如检索的效果、回答的效果。Workflow怎么做的任务拆分？为什么要拆分？ 效果如何？怎么提升效果？text2sql 怎么做的？怎么提高准确率？如何润色query，目的是什么？code-generation 是什么做的？如何确保准确性？现在再让你设计你会怎么做？（replan）效果是怎么量化的？Agent介绍一下你的 Agent 项目长短期记忆是怎么做的？记忆是怎么存的？粒度是多少？怎么用的？Function Call 是什么做的？你最大的难题是什么？你是怎么提高效果的？怎么降低延迟的？端到端延迟如何优化的？介绍一下single-agent、multi-agent的设计方案有哪些？反思机制是什么做的？为什么要用反思？如何看待当下的LLM应用的趋势和方向为什么要用Webrtc？它和ws的区别是什么？agent服务高可用、稳健性是怎么保证的？llm 服务并发太高了怎么办？系统设计题短链系统分布式锁的设计给你一部长篇小说，怎么做文档切割？怎么做到论文翻译，并且格式尽可能和原来的统一游戏社区客服助手设计。如何绑定游戏黑话，如何利用好公司内部的文档结合线上问题快速定位项目工程代码有问题的地方有很多结构化和非结构化数据，怎么分析，再怎么得出我要的结论。八股go的内存分配策略、GMP、GCpython 的内存分配策略、GCredis 用过那些？mget 底层什么实现的？、zset怎么实现的？mysql 索引怎么设计最好？数据库隔离级别？mvcc是怎么实现的？分布式锁是什么实现的？kafka的 reblance 是什么？会产生那些问题？怎么保证数据不丢?fastapi 设计原理？go 中 net/http 如何处理的tcp粘包问题http2 是什么？比http1.1有什么优势？Linux 网络性能调优的方式如何定位Linux中的pid、端口号等等个人在每个项目的里的角色是什么？承担那些工作？项目是几个人在做？为什么离职、每次离职的原因是什么？平常怎么学习的？怎么接触到大模型的最新进展的？对大模型将来的应用发展有什么看法？你将来的职业规划是什么？

大模型小坛：所有面试题可以开源给大家后台T一下

0 点赞评论收藏

分享

华东理工大学产品经理

@明天不下雨了： AI应用面试题

点赞 79

评论 18

0 点赞评论收藏

分享

2025-07-27 17:22

华东理工大学产品经理

7月大模型面试题合集大模型面试八股

#找工作##找工作，你会甘心进小厂还是猛冲大厂##大模型##面试##编程##程序员##实习##研究生#

找工作，你会甘心进小厂还...

0 点赞评论收藏

分享

2025-07-27 17:09

华东理工大学产品经理

大模型面试题合集大模型面试八股

#大模型##面试##面试问题记录##面试常问题系列##八股##找工作##实习#

面试问题记录

0 点赞评论收藏

分享

2025-07-27 17:06

华东理工大学产品经理

算法岗面试八股（一）

深度学习基础1. LN和BN的原理和区别2. 交叉熵的数学推导3. 交叉熵的代码手写4. sigmoid的代码手写5. 手撕多头注意力6. ReLU为什么能缓解梯度消失7. Adam优化器原理8. AUC计算方法9. Python装饰器作用10. KL散度11. softmax公式12. 梯度消失和梯度爆炸如何缓解13. 手撕NMS过程14. L1和L2正则的区别15. BN中可学习参数如何获取16. 如何缓解过拟合17. 介绍一下dropout多模态/NLP算法1. 介绍dpo算法原理2. gpt和bert的结构和参数量3. flash attention原理4. bert预训练任务，embedding5. fp16量化训练的策略6. qformer原理7. 了解哪些位置编码及原理8. clip原理9. blip2架构10. sft，lora和pretrain的区别11. llava和llama的区别12. 手撕BCE，InfoNCE损失13. 什么是大模型幻觉14. 混合精度训练是什么15. 很多大模型decoder-only原因16. 手撕RMSNorm17. deepspeed原理及使用18. peft微调介绍一下19. 介绍一下RAGAIGC生成式1. vit，dit原理2. ddpm/ddim原理，区别3. ae，vae，vq-vae的原理与区别4. U-net网络设计思路5. 怎么保证长视频一致性6. 怎么保证背景一致性7. cross attention用法8. svd原理

0 点赞评论收藏

分享

2025-07-27 17:03

华东理工大学产品经理

大模型算法面试题，练完你就牛了

今天给大家分享一下字节、滴滴、腾讯等大厂的面试真题合集。对于很多需要去面试的宝子们都可以做一个参考，因为许多大产的面试都是基于这些去提问的。

0 点赞评论收藏

分享

2025-07-27 16:59

华东理工大学产品经理

最后提醒下AI大模型面试肚子里没墨水的人！

常见的业务题架构理解篇Q1 Transformer模型主要由哪两部分组成？Q2 自注意力机制中的Q、K、V矩阵是什么缩写？Q3 多头注意力中"头"（head）指的是什么？Q4 位置编码的作用是什么？Q5 Encoder和Decoder结构的主要区别？Q6 为什么要使用残差连接（Residual Connection）？基础组件篇Q7 前馈神经网络（FFN）有多少层？Q8 Layer Normalization放在哪个位置？Q9 激活函数ReLU和GeLU的主要区别？Q10 词嵌入（Word Embedding）的维度代表什么？Q11 注意力掩码（Attention Mask）的作用是什么？Q12 为什么要使用dropout技术？训练基础篇Q13 预训练（Pre-training）的目标是什么？Q14 什么是语言模型中的"自回归生成"？Q15 数据并行的基本实现方式？Q16 什么是训练中的批量大小（Batch Size）？Q17 学习率（Learning Rate）过大会导致什么问题？Q18 训练损失（Training Loss）下降说明什么？模型应用篇Q19 什么是文本生成中的贪心解码（Greedy Decoding）？Q20 温度参数（Temperature）如何影响生成结果？Q21 模型推理时为什么要限制生成长度？基础概念篇Q25 参数量（Parameters）和计算量（FLOPs）的区别？Q26 什么是生成式AI（Generative AI）？Q27 预训练模型和传统NLP模型的核心区别？Q28 为什么大模型需要海量训练数据？Q29 什么是过拟合（Overfitting）现象？Q30 模型推理（Inference）是指什么过程？工程实践篇Q31 GPU显存不足时常见的解决方法？Q32 模型权重文件（Checkpoint）包含哪些内容？评估基础篇Q37 如何评估语言模型的生成质量？Q38 困惑度（Perplexity）指标的计算原理？

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务