正实现的小目标

2025-11-05 02:05 上海交通大学算法工程师

关注

26秋招百度大模型算法面经

一面
1、自我介绍
2、详细聊了在百度半年的实习干了什么，为什么选择产品部去实习
3、详细聊了在百度产出的这一篇A会，自己的贡献是怎么样的?
4、详细聊了自己的科研方向:大模型推理的框架，包括底层的架构，硬件的架构(感觉面试官真什么都能问的出)
5、八股没怎么问，问的都是论文中的细节，为什么选择该模型，为什么不用剪枝量化去优化推理你的方法比这些方法好在什么地方，文章的idea是如何产生和实现的，包括代码的编写是基于别人的base改的?还是全自己写的?为什么没有考虑实用场景等等总体来说是问的简历，还是比较好回答
6、手撕tokenizer(可能是因为我在回答问题的时候说代码都全自己写的把直接让手撕了tokenize
二面
1、自我介绍
2、问为什么没在部门转正?为什么不投自己的实习部门?
3、开始聊在百度产出的这篇文章，她说她看过这篇文章，我谢谢您，开始在线解答面试官的疑惑全程一个审稿人状态开始提问;为什么你们只用了小模型，不用大模型，是你们的实验数据有问题?包括后期问能不能落地？
4、代码，接雨水
5、反问

全部评论

推荐最新楼层

03-08 00:25

门头沟学院推荐算法

大模型算法实习面经——百度

攒人品中，祝大家都能拿到满意的Offer！1.介绍DPO和PPO2.DPO损失函数怎么算的3.梯度检查点如何提升效率4.详细讲一下deepseed5.以7B的模型为例，计算训练需要多少显存说明都有哪些部分，每部分怎么算的，以及用deepseed每一个阶段节省多少内存，怎么节省的，计算过程中都有乘以2字节是为什么，什么原理6.做Rag 时候的分块策略7.BM25原理，RRF的原理8.Kl散度的输入是什么，怎么来的手撕：用torch实现kl散度

点赞评论收藏

分享

03-07 02:20

门头沟学院推荐算法

LLM算法实习百度二面面经

继续来分享下之前的面经~强度好大，俺不中咧。。。。1.实习中多智能体系统包含几个智能体？它们之间如何交互？2.意图识别模型需要识别多少个意图？3.750B 模型用于什么场景？4.实习中 Qwen3VL 模型是多少 B 的？用于什么场景？5.在实习中，你主要的贡献是什么？6.检索环节做了哪些优化？7.答案生成环节做了哪些优化？8.是否做了 SFT 或强化学习相关工作？在哪个环节做的？9.SFT 过程中是否对类别标签做了清洗或修正？10.强化学习的样本量是多少？11.基础模型经常分类分不准的案例有哪些？12.在校项目中，为什么用对话数据来增强数据集？13.在校项目任务的输出可以简单描述并举例吗？14.单智能体能否完成在校项目相关工作？为什么要使用多智能体？15.LangGraph 相对其他开源智能体编排工具的优点是什么？16.在现有场景中是否需要用到 LangGraph 的状态管理功能？17.如何理解 Long-term Memory 的实现方式？18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆，有什么想法？19.Context Window 能否储存大量电商交互信息？如何解决存储问题？20.推理时若将大量 Memory 以 Token 形式给到大模型，Token 长度过长该如何处理？21.强化学习有哪些常用技巧？22.若通过 SFT 进一步提升模型准确率，常用的手段有哪些？23.SFT 的理想数据量是多少？如何确定？24.SFT 数据分布一般怎么取？为什么选择该分布而非其他分布？

点赞评论收藏

分享

03-18 21:50

上海交通大学算法工程师

百度二面大模型研发凉经

继续来分享下之前的面经~欢迎友好讨论，信息共享1讨论项目2什么是GAE3解释deepseek的MLA，分析可能有什么缺点4介绍deepseekV3.2的闪电索引器和可能的缺点5介绍MHC残差连接6什么是多头注意力7口述两个算法题，说出求根号的多重方法（牛顿，梯度下降，二分），二分法求到小数点后k位精度算法复杂度8一个哈希表题目，不是力扣

查看8道真题和解析

点赞评论收藏

分享

03-23 17:30

门头沟学院推荐算法

百度大模型多模态算法实习面经分享

被横向挂了，希望发出来对大家有帮助！1. 讲一下主要的多模态模型的模型结构2. 对多模态的数据有什么了解，我回答之前看了一些多模态cot的工作构造的dpo数据，以及毕设做的多模态数据增强3. 之前的工作的多模态数据有什么特点和创新点，觉得还可以有什么改进4.统一生成理解模型下游微调各个任务的数据是怎么构造的5. dpo算法是怎么实现的，和其他强化学习有什么区别6. 看项目有目标检测任务，问了IoU是怎么算的，目标检测一般有哪些损失优化code：1. 实现dpo损失，按照想法能写多少是多少，不要求跑通2. 手写IoU损失，要求跑通

点赞评论收藏

分享

03-23 17:25

石家庄铁道大学 Java

1.为什么要用消息中间件？2.消息可靠性如何保证？3.RAG知识库搭建4.如何系统的评估知识库？5.大模型如何调用工具6. 工具用什么方式集成进去的7. 用什么框架实现MCP8. 用到哪些大模型的研发工具9.历史Memory10.JVM内存组成及垃圾处理11. Full GC 频繁发生的原因12.类函数的存储13. gc算法怎么判断垃圾14. 多线程访问数据，访问可能遇到什么问题？15. 怎么解决多线程访问冲突问题？16. jvm的内存地址是虚拟还是物理？17. 两个jvm，库在内存是加载两次吗18. tcp三次握手四次回收19. 为什么握手三次回收四次

发面经攒人品

点赞评论收藏

分享

评论

2

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你和你的mentor相处模式是__ #

3217次浏览 20人参与

# 如果公司降薪，你会跳槽吗？ #

160168次浏览 938人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

25982次浏览 320人参与

# 实习第一天，你在干什么 #

2144次浏览 14人参与

# 华为工作体验 #

322100次浏览 1409人参与

# 你会因为行情，降低找工作标准吗？ #

2406次浏览 19人参与

# 非技术2024笔面经 #

501918次浏览 5038人参与

# 机械人与华为的爱恨情仇 #

158490次浏览 1055人参与

# 0offer互助地 #

773058次浏览 4756人参与

# 你是怎么和mt相处的？ #

103027次浏览 507人参与

# 联想求职进展汇总 #

356395次浏览 2262人参与

# 运营人求职交流聚集地 #

247222次浏览 1124人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

113550次浏览 1196人参与

# 我的成功项目解析 #

531950次浏览 8611人参与

# 打工人的工作餐日常 #

97012次浏览 558人参与

# 26年哪些行业会变好/更差 #

66198次浏览 534人参与

# 蚂蚁求职进展汇总 #

170973次浏览 1291人参与

# 今年秋招还有金九银十吗 #

82769次浏览 514人参与

# 工作两年想退休了 #

271620次浏览 2048人参与

# 你总挂在第__面？ #

14758次浏览 162人参与

# 简历上如何体现你的“AI”能力？ #

20142次浏览 405人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务