工资卡余额大于五位数

03-13 07:25 门头沟学院推荐算法

关注

字节实习大模型算法面经

给我面没招了，发点面经攒攒人品～
1. 实习拷打
2. 详细问了项目
3. 数据集是怎样做扩充的？
4. 为什么要SFT后还要使用DPO进行训练？
5. 对于难样本是怎么解决的？
6. 如何实现Function call的功能？
7. 为什么RAG的效果用正确率来表示？
8. RAG的文档是怎么划分的？基于什么规则划分？
9. RAG召回冗余的数据怎么解决的？
10. 有哪些可以优化RAG的方法？
11. Decode-only和encoder-only有什么区别？

全部评论

推荐最新楼层

04-02 14:53

已编辑

河北科技大学 Java

小黑盒春招面经

一直想发的，但因为一面面了 1h47min 让我整理面经就整理了好几天小黑盒面试官有个特点，你要是没回答到他的点上，他就会打断你，会一直深挖整个面试压力爆大，过程中大脑宕机重启宕机重启一面自我介绍介绍下 GMP 是什么东西？如果在早期的 GM 模型中，我们直接给每个 M 分配一个本地队列和上下文资源，不也能解决全局锁冲突的问题吗？为什么非得在 G 和 M 之间，再凭空造出一个 P 的抽象层呢？M 没法窃取吗？为什么非要 P？如果 M 阻塞掉，P 会怎么处理？怎么动态知道 M 会阻塞，并提前退回 P？M 被解绑后，它还有 P 吗？新接手的 M 是哪来的？如果所有的 M 都进行了系统调用，程序会停...

isaacE2：二面是创始人级别的，而且每次必问两数之和

面试时最害怕被问到的问题

点赞评论收藏

分享

03-22 13:35

门头沟学院 Java

AI Agent二面-字节实习面经

攒攒人品！ 1. 项目拷打2. 多模态大模型有什么了解3. Agent skills4. 怎么加强大模型记忆机制5. 多Agent执行策略的智能选择和切换机制设计6. SSE的局限性7. lora效果不好怎么办8. RAG动态知识更新9. 大模型项目遇到了什么问题10. lora的缺点，改进方向11. 复杂任务执行准确率提升的评估方法12. 多轮对话的实现方案13. RAG评估方案14. 了解过市面上有哪些智能体agent吗15. 介绍一些AI大模型16. MCP和Function Calling

粗心的蚊不叮深藏功与...：大佬这是字节ai agent岗吗？只问了ai agent相关的八股吗

查看16道真题和解析

点赞评论收藏

分享

03-26 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

03-21 04:30

门头沟学院 Java

字节大模型应用开发二面日常实习

发点面经攒攒人品～1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？6.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？8.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？9.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？10.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？11.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？15.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？16.针对大规模PDF解析这种任务，你选择多线程还是多进程？17.如何确保Agent返回的结果是标准的JSON格式？如果模型输出中有多余的说明文字，你在后端如何提取？18.场景题：对于RAG，如果检索到了针对同一故障的两份手册，内容相互冲突，请你设计一套逻辑，让模型能够识别冲突并优先选择时效性更高的信息？19.手撕：第k大元素

查看19道真题和解析

点赞评论收藏

分享

04-05 03:40

电子科技大学算法工程师

ai agent实习面经分享-字节

攒攒人品！有面试过同岗的朋友欢迎评论区交流1. 实习拷打2. 项目拷打3. RLHF中奖励模型（RM）的训练数据如何构建？4. 推理加速技术5. 模型剪枝/量化（GPTQ、AWQ）、服务化框架（FastAPI+vLLM）6. 如何优化大模型在长文本生成中的显存占用？7. 微调方法对比8. 设计一个ai爬取字节视频，如何设计？9. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案10. 如何解决大模型API服务的响应延迟问题？

查看10道真题和解析

点赞评论收藏

分享

评论

1

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

63689次浏览 540人参与

# 第一份工作应该选择高薪还是大平台 #

220569次浏览 1040人参与

# 华泰星战营，提前锁定校招offer #

3734次浏览 236人参与

# 考公VS就业，你怎么选？ #

99954次浏览 523人参与

# 卷__卷不过你们，只能卷__了 #

59892次浏览 756人参与

# 商战，最累的是我们 #

31650次浏览 99人参与

# 校招第一份工作你干了多久？ #

150143次浏览 631人参与

# 小红书求职进展汇总 #

238478次浏览 1397人参与

# 哪些公司对双非友好 #

229991次浏览 1234人参与

# 大疆求职进展汇总 #

699803次浏览 4351人参与

# AI时代还有必要刷leetcode吗？ #

49980次浏览 583人参与

# 字节7000实习来了，你投了吗？ #

43921次浏览 343人参与

# 国企/银行/研究所公司爆料 #

209237次浏览 919人参与

# 格力求职进展汇总 #

213495次浏览 1276人参与

# 大学生该如何认清当下的就业环境？ #

166131次浏览 912人参与

# 想从事Agent应该学习哪些技术？ #

14523次浏览 391人参与

# 26届春招投递记录 #

4951次浏览 51人参与

# 校招生月薪1W算什么水平 #

144080次浏览 496人参与

# 海康威视求职进展 #

134642次浏览 555人参与

# 机械笔面试考察这些知识点 #

17956次浏览 121人参与

# 工作中，努力重要还是选择重要？ #

285977次浏览 2587人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务