算法打工人阿旺

02-24 23:01 中山大学算法工程师发布于山东

关注

字节大模型面经合集（二）

1. 大模型相关经历深挖：你项目里最核心的贡献是什么，怎么验证有效
2. 对比学习 loss：负样本和正样本拉不开/太像了，你会怎么改损失或采样
3. FlashAttention 跟普通 attention 的差异？实现里 QK^T、softmax、PV 这几步怎么落
4. 3D 并行里 DP/DDP 你怎么理解；实际落地时通信瓶颈一般卡在哪些环节
5. 14B：FP16 权重大概多大；训练还要加哪些；INT8 大概能省多少
6. torch.contiguous() 干嘛的？推理为什么在意连续性
7. 代码：读 txt 井字棋（3×3），判断当前玩家是否获胜
8. 交叉熵损失：解释/怎么写
9. 线性回归用 SGD：更新公式怎么推/怎么写

⭕如果你现在：
- 春招/秋招没方向
- 简历没人看
- 面试总挂
- 不知道怎么准备
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

02-24 12:02

武汉大学算法工程师

暑期实习简历，计划投大模型开发或者大模型算法岗，求指导[好无辜]

大佬们看看，简历是否合适。（两个项目的“主要工作”写的很粗糙）然后还有一个问题请大佬们支支招... 我想走大模型相关岗位，但没想好去算法还是开发。算法岗肯定是首选，主要是怕我的项目经历跟算法岗离得远找不到实习。请大佬们给给建议

简历中的项目经历要怎么写

点赞评论收藏

分享

03-26 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

03-10 21:16

快手_后端开发

27届实习校招必看：后端&大模型应用开发突围指南

🚀 27届校招必看：后端&大模型应用开发突围指南（2026春招/秋招版）你好，27届的同学！现在是2026年3月，26届春招已进入白热化，27届的暑期实习预热也即将开始。作为站在AI浪潮风口的一代，你们面临的机遇与挑战并存：传统后端岗位在收缩，而“后端+AI”或纯“大模型应用开发”岗位需求激增。很多大厂（如字节、阿里、腾讯）的后端JD里已经明确标注“需具备大模型开发与应用能力”。如何在这个时代合理利用AI工具，打造核心竞争力？这份实战分享贴为你拆解。一、核心认知：AI时代，后端开发变了吗？变了，也没变。没变的是：高并发、分布式、数据库优化、系统设计等后端基石依然是面试和工作的硬通货。...

点赞评论收藏

分享

03-22 13:35

门头沟学院 Java

AI Agent二面-字节实习面经

攒攒人品！ 1. 项目拷打2. 多模态大模型有什么了解3. Agent skills4. 怎么加强大模型记忆机制5. 多Agent执行策略的智能选择和切换机制设计6. SSE的局限性7. lora效果不好怎么办8. RAG动态知识更新9. 大模型项目遇到了什么问题10. lora的缺点，改进方向11. 复杂任务执行准确率提升的评估方法12. 多轮对话的实现方案13. RAG评估方案14. 了解过市面上有哪些智能体agent吗15. 介绍一些AI大模型16. MCP和Function Calling

粗心的蚊不叮深藏功与...：大佬这是字节ai agent岗吗？只问了ai agent相关的八股吗

查看16道真题和解析

点赞评论收藏

分享

03-26 09:50

门头沟学院推荐算法

字节大模型算法二面面经分享

祝大家都能拿到满意的Offer！1.项目拷打2.你们这里说的分层混合编排式 Agent 架构设计是具体怎么做的3.我问一个就是你们在Routing那里，你会根据难度去做不同的一个处理，对吧？那你们这个难度是怎么划分的呢4.你刚才提到就是说，比方说如果刚开始有动态升级的一个范式，就是比方说这个任务刚开始被分配到了7B但是如果它在生成的过程当中，置信度或者说生成的结果它的置信度比较低，你们这个置信度是怎么生成的呢5.你们大概配备了多少个工具6.以风险评估为例，你们的输入输出分别是什么呢7.你的字段是什么8.比方说你说的收缩压这个字段，在用户的问题当中可能不会有这样的一个检测数据。那这种情况你们是怎么来处理呢9.我看到你这里有说在引入了应用层的MOE按照任务动态的激活专家路径，这个具体是怎么实现的呢10.这里就有个问题，我们针对不同的科室去训练一个微调专家，那你们是你们怎么训练的呢？怎么针对于不同科室去训练的，第二个问题就是逻辑上你们这个专家数量可不会少，然后你们的工作量会比较大，这个问题你们又是怎么解决的呢11.你们最终大概是用了多少个专家12.每个大概训练的数据量是多少呢13你们的这个70b模型用的是自己？从头开始预训练的吗？还是用的开源的14那你们医疗数据你们医疗数据的主要来源是在哪里呢？

查看14道真题和解析

点赞评论收藏

分享

评论

2

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

33051次浏览 424人参与

# 大学生该如何认清当下的就业环境？ #

162031次浏览 884人参与

# 有哪些公司在面试时考察AICoding？ #

18515次浏览 346人参与

# 运营来爆料 #

98718次浏览 508人参与

# HR面都在聊什么？ #

13144次浏览 161人参与

# 美团开奖 #

407627次浏览 1805人参与

# 26届春招投递记录 #

3494次浏览 41人参与

# 百度工作体验 #

325268次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

8076次浏览 276人参与

# 实习学到最有价值的工作习惯 #

69540次浏览 551人参与

# OPPO求职进展汇总 #

808781次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143299次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

57087次浏览 370人参与

# 从投递到OC，你用了多久 #

23005次浏览 237人参与

# 什么人最适合大厂？ #

12322次浏览 132人参与

# 父母问你工作找得怎么样，怎么回 #

22476次浏览 280人参与

# 哪些公司面试还在问八股？ #

13502次浏览 123人参与

373679次浏览 2921人参与

# 我与AI的日常 #

3224次浏览 16人参与

# 我的求职进度条 #

1107759次浏览 8003人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务