2025-04-02 19:08 浙江大学算法工程师发布于上海

关注

字节大模型二面面经（持续记录！！

面试的部门是字节seedlm
二面感觉面试官很和善

面试问题：
- transformer 的 decoder 和 llama 有啥区别，他们的位置编码有啥区别？三角函数位置编码和 ROPE 公式很像啊，他们是怎么实现不同的功能？（一个加 embedding 一个加 KQV，但是公式很像但是推理完全不一样吧，不太会答）
- 介绍一下RLHF流程，包括哪几步
- llm有哪些评估指标？如何评估模型？
- lora原理细节，为什么可以加速？什么是秩？
- reward bench上的reward model分哪几类？reward model如何训练的，训练目标是什么？
- dpo训练的损失函数和训练目标，dpo如何改进
代码题：
- 给定长度为 n+1 的数组 nums，其中元素取值范围为 [1, n]，求唯一的重复数。
- 手写多头注意力mha，写完后让加位置编码（因为之前写过了，继续吟唱）

全部评论

推荐最新楼层

准备进厂的小熊猫很讲文明

北京航空航天大学算法工程师

接好运

点赞回复分享

发布于 2025-06-12 22:25 北京

楼主

浙江大学算法工程师

需要面经的戳我😋

点赞回复分享

发布于 2025-04-08 12:26 上海

甘之如饴啊

天津职业技术师范大学售前技术工程师

大佬可以分享下面经的那些东西吗？本人一直在做大模型sa想跳，但还是想看下整理好的面经

点赞回复分享

发布于 2025-04-07 14:31 广东

03-26 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

03-22 13:35

门头沟学院 Java

AI Agent二面-字节实习面经

攒攒人品！ 1. 项目拷打2. 多模态大模型有什么了解3. Agent skills4. 怎么加强大模型记忆机制5. 多Agent执行策略的智能选择和切换机制设计6. SSE的局限性7. lora效果不好怎么办8. RAG动态知识更新9. 大模型项目遇到了什么问题10. lora的缺点，改进方向11. 复杂任务执行准确率提升的评估方法12. 多轮对话的实现方案13. RAG评估方案14. 了解过市面上有哪些智能体agent吗15. 介绍一些AI大模型16. MCP和Function Calling

粗心的蚊不叮深藏功与...：大佬这是字节ai agent岗吗？只问了ai agent相关的八股吗

查看16道真题和解析

点赞评论收藏

分享

03-26 09:50

门头沟学院推荐算法

字节大模型算法二面面经分享

祝大家都能拿到满意的Offer！1.项目拷打2.你们这里说的分层混合编排式 Agent 架构设计是具体怎么做的3.我问一个就是你们在Routing那里，你会根据难度去做不同的一个处理，对吧？那你们这个难度是怎么划分的呢4.你刚才提到就是说，比方说如果刚开始有动态升级的一个范式，就是比方说这个任务刚开始被分配到了7B但是如果它在生成的过程当中，置信度或者说生成的结果它的置信度比较低，你们这个置信度是怎么生成的呢5.你们大概配备了多少个工具6.以风险评估为例，你们的输入输出分别是什么呢7.你的字段是什么8.比方说你说的收缩压这个字段，在用户的问题当中可能不会有这样的一个检测数据。那这种情况你们是怎么来处理呢9.我看到你这里有说在引入了应用层的MOE按照任务动态的激活专家路径，这个具体是怎么实现的呢10.这里就有个问题，我们针对不同的科室去训练一个微调专家，那你们是你们怎么训练的呢？怎么针对于不同科室去训练的，第二个问题就是逻辑上你们这个专家数量可不会少，然后你们的工作量会比较大，这个问题你们又是怎么解决的呢11.你们最终大概是用了多少个专家12.每个大概训练的数据量是多少呢13你们的这个70b模型用的是自己？从头开始预训练的吗？还是用的开源的14那你们医疗数据你们医疗数据的主要来源是在哪里呢？

查看14道真题和解析

点赞评论收藏

分享

03-18 02:25

门头沟学院推荐算法

多模态大模型面经分享-字节

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.项目拷打2.讲一下你用的大模型是什么结构，特征是怎么喂给大模型的3.讲一下multi-head attention，用pytorch手撕一下，要可以实现cross attention的4.大模型训练为什么不用SFT5.知道RLHF吗，讲一下训练流程6.问了几个电商相关的场景题，用大模型解决 prompt 应该怎么设计，怎么处理prompt的输出，怎么过滤错误格式的输出

查看5道真题和解析

点赞评论收藏

分享

04-05 03:40

电子科技大学算法工程师

ai agent实习面经分享-字节

攒攒人品！有面试过同岗的朋友欢迎评论区交流1. 实习拷打2. 项目拷打3. RLHF中奖励模型（RM）的训练数据如何构建？4. 推理加速技术5. 模型剪枝/量化（GPTQ、AWQ）、服务化框架（FastAPI+vLLM）6. 如何优化大模型在长文本生成中的显存占用？7. 微调方法对比8. 设计一个ai爬取字节视频，如何设计？9. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案10. 如何解决大模型API服务的响应延迟问题？

查看10道真题和解析

点赞评论收藏

分享

评论

2

29

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

33051次浏览 424人参与

# 大学生该如何认清当下的就业环境？ #

162031次浏览 884人参与

# 有哪些公司在面试时考察AICoding？ #

18515次浏览 346人参与

# 运营来爆料 #

98718次浏览 508人参与

# HR面都在聊什么？ #

13144次浏览 161人参与

# 美团开奖 #

407627次浏览 1805人参与

# 26届春招投递记录 #

3497次浏览 41人参与

# 百度工作体验 #

325268次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

8076次浏览 276人参与

# 实习学到最有价值的工作习惯 #

69540次浏览 551人参与

# OPPO求职进展汇总 #

808781次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143299次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

57087次浏览 370人参与

# 从投递到OC，你用了多久 #

23005次浏览 237人参与

# 什么人最适合大厂？ #

12322次浏览 132人参与

# 父母问你工作找得怎么样，怎么回 #

22476次浏览 280人参与

# 哪些公司面试还在问八股？ #

13502次浏览 123人参与

373679次浏览 2921人参与

# 我与AI的日常 #

3224次浏览 16人参与

# 我的求职进度条 #

1107759次浏览 8003人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务