正实现的小目标

2025-12-24 12:20 上海交通大学算法工程师

关注

26校招商汤大模型算法一面

1、实习介绍，随后围绕项目问八股
2、对qwen-coder大模型的了解
3、Lora训练的原理，调过哪些参数，其含义，怎么设置的
4、训练过程中调过哪些参数，怎么设置的，loss曲线在训练过程中如果突然上升，一定是坏的吗？如何区分是训练参数不对和学到新东西导致的loss上升？
5、大模型训练的流程有哪些？文本是如何tokens化的？tokenizer的原理是什么？
6、RAG的流程？在打比赛时，有哪些提高的点？RAG中召回算法的原理？为什么还需要重排？如何提高RAG召回的效果，如何对向量化模型进行微调？
7、代码题1：a = [1],b=[a,a],b[0]=[0],随后b[1]=？如果不想改a的值怎么做？
8、代码题2：给一个数组，求划分方式，使得左半部分的最大值-右半部分的最大值最大。

全部评论

推荐最新楼层

俩个手撕啊

点赞回复分享

发布于 2025-12-25 23:33 北京

哞客374226558号

数字马力（长沙）信息技术有限公司_后端开发

商汤大公司，之前就听过

点赞回复分享

发布于 2025-12-25 19:21 陕西

嵌入式的小白

西安理工大学嵌入式软件开发

感觉你这面得好晚啊

点赞回复分享

发布于 2025-12-25 16:07 陕西

04-09 15:46

门头沟学院嵌入式软件工程师

华测导航嵌入式二面面经综合性比较强

最近参加了华测导航嵌入式岗位的二面，整体感受是相比一面明显更深入一些。如果说一面更多是在考察基础知识是否扎实，那二面就更偏向于看你能不能把基础知识和实际项目结合起来，看看你对自己做过的东西到底理解到什么程度。面试官整体风格还是比较平和，没有那种很强的压迫感，但问问题的方式会更有层次，不再只是单独问某个知识点，而是会顺着你的项目往下追问。很多问题表面上看是在问项目，实际上是在考察你的系统设计能力、排查问题能力、代码理解深度，以及你是不是真的亲手做过。就我个人感受来说，二面的难度比一面高一些，主要难在“综合性更强”。不是单纯背八股就能很好应对，尤其是当面试官围绕项目细节不断展开时，如果平时只是做了...

点赞评论收藏

分享

04-13 03:15

门头沟学院算法工程师

蚂蚁实习 AI agent算法二面 1h

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2. 实习拷打3. 你们选用的训练方法是什么？训练数据具体是怎么构造的？4. 这里的训练过程，我理解是前面有一段医学语料的预训练，然后再加一段对齐过程，是这样吗？5. 关于 SFT 阶段，数据具体是怎么生成的？6. SFT 之后，后面的 DPO 过程又是如何开展的？7. DPO 需要 Chosen 和 Rejected 至少两组对比数据，这两组数据你们是怎么得到的？8. 我们现在这边可能对于医疗业务关系比较远，问一下更加基础的知识。既然谈到 DPO，谈一下 DPO 以及后续其他偏好学习算法的区别，以及各自的优劣。9. 那么 GRPO 算法呢？10. DPO 算法有哪些缺点？11. 谈谈强化学习中 On-policy 和 Off-policy 的区别，你是怎么理解的？12. 看你不仅做训练，还负责基础设施 Infra 的搭建。训练基础设施也是归你亲自搭吗？13. 当时是在哪个项目里面参与 Infra 工作的14. 你刚才提到了 Megatron，你们试过 PyTorch 原生的 FSDP 吗？15. 既然试过 FSDP，为什么最终还是选用了 Megatron？，你们当时的选型考量是什么？16. 既然提到 FSDP 和 DeepSpeed ZeRO 的区别，FSDP 实现了 ZeRO 的哪几个阶段？ZeRO-1, 2 还是 3？17. 探讨一个现实的业务问题：我们核心业务是对话类 Agent 产品。经典架构是前端设有一个意图识别与路由环节，将客户请求分发到不同的子 Agent，由于子 Agent 功能实现完全不同，不能混在一起，所以路由非常关键，一旦路由错误就无法满意回答。另外，作为全链路的必经点，路由必须足够快。我们考虑在最前端用一个相对较小（如 7B 或 13B）的模型，通过后训练使其掌握特定领域知识，实现低延迟的路由。如果让你做这个模型，你会怎么去做？

查看15道真题和解析

点赞评论收藏

分享

04-15 17:18

已编辑

门头沟学院人工智能

数坤Agent一面

📍面试公司：数坤科技🕐面试时间：4.15（1h左右）💻面试岗位：实习算法工程师❓面试问题：1.自我介绍2.项目介绍，用代码/伪代码介绍项目数据流3.你的agent项目是如何评估的？4.rag的召回指标如何评估？5.如何知道chunk是不是你的目标chunk？只能人为标注？能不能自动化完成？[补充]如何写好一份prompt？6.rag效果不好怎么办？微调？成本太高怎么办？prompt工程？小模型提示词写好之后依然对有些数据效果好，有些数据不好，怎么办？除了微调，换模型，还有什么？7.KV cache原理？为什么不存Q？8.数据漂移怎么办？哪些参数影响模型推理阶段回答的稳定性？如何影响？手撕: 开根号反问: 组内业务/人数，作息时间🙌面试感想：有几个问题忘了，记性不太好。。想起来会补充。面试官人挺好的，不过我回答问题啰啰嗦嗦又磕磕巴巴。。

查看9道真题和解析

点赞评论收藏

分享

04-13 21:04

北京信息职业技术学院前端工程师

快手一面面经

📍面试公司：快手🕐面试时间：1h💻面试岗位：前端开发❓面试问题：1. 自我介绍2. 如何看待ai对前后端的冲击3. 看代码说结果function Foo() {this.a = 1;return {a: 4,b: 5,};}Foo.prototype.a = 6;Foo.prototype.b = 7;Foo.prototype.c = 8;let o = new Foo();console.log(o.a);console.log(o.b);console.log(o.c);4. Promise实现异步并发调度器5. 实现Promise.all6. 数组转树7. 实习里有技术难度的内容8. ai项目怎么保证输出结果一定正确9. 反问

查看8道真题和解析

点赞评论收藏

分享

04-15 18:34

广东药科大学 Java

快手后端日常实习一面

面试公司：快手面试时间：4.10面试内容：一、自我介绍（3分钟+）二、实习项目拷打（20分钟+）：1.按照项目背景+成果描述实习经历2.解释一下cdn是什么，怎么用的？3.Guava在项目里是用来做什么的？4.直接用redis+mysql不行吗？5.如果使用hashmap做缓存，同时只有一个线程读和一个线程写，会不会有并发问题？6.这个热点key是通过什么来判断的？三、算法题（20分钟+）手撕快排（这题我起码写3遍了，可是脑子里当时想的是基于链表的归并分治搞的我直接宕机了，结果拼尽全力无法战胜，最后说了思路）面试感想：面试时间比较短，算法没a出来我就感觉这次必挂了，最可惜的还是这算法我写过，其他方面这次项目拷打就问了我简历上的一个小点，让我感觉有点像kpi，不过也让我体会到基础算法的重要性面试结果：不出意料的秒🐸🐸🐸🐸🐸🐸🐸🐸🐸🐸

查看8道真题和解析

点赞评论收藏

分享

评论

2

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

27895次浏览 275人参与

# 机械人还在等华为开奖吗？ #

338931次浏览 1652人参与

# 在爱玛，骑向未来 #

19311次浏览 381人参与

# 这个offer值得去吗？ #

29010次浏览 209人参与

# 24秋招避雷总结 #

1019270次浏览 7097人参与

# 你会因为行情，降低找工作标准吗？ #

43076次浏览 313人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

49597次浏览 755人参与

# 大学最后一个寒假，我想…… #

103145次浏览 846人参与

# 机械求职避坑tips #

103530次浏览 589人参与

# 华为池子有多大 #

177548次浏览 928人参与

# 刚入职就____，这样正常吗？ #

148172次浏览 709人参与

# 记录我的毕业季 #

3631次浏览 98人参与

# 去年你投递实习了吗？ #

32761次浏览 339人参与

# 字节开奖 #

158461次浏览 777人参与

# 做完笔试后你收到面试了吗？ #

65142次浏览 309人参与

# 今年找实习到底有多难？ #

104772次浏览 489人参与

# 秋招盘点:机械人值得去的企业 #

106391次浏览 741人参与

# 远程面试的尴尬瞬间 #

363529次浏览 2062人参与

# 秋招前后对offer的期望对比 #

551498次浏览 3464人参与

# 面试体验最好和最差的公司 #

48008次浏览 197人参与

# 有深度的简历长什么样？ #

60666次浏览 771人参与

# 金融财会交流会 #

150963次浏览 498人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务