2025-04-11 18:58 已编辑上海华东师范大学算法工程师发布于广西

关注

百度实习大模型一面

这次面试的问题都比较有意思，记录一下：
1、介绍一下之前工作的业务场景(code LLM)
2、你微调过这么多不同家的大模型(LLama、Qwen、codellam、mistral等)，都有什么区别(在业务上，并不是八股结构)
3、在业务上比较有效的微调手段
4、具体代码翻译场景下，遇到的两种不同语言的函数不能完全一致对应，该用什么方法解决。
    我提出说用一些RAG可以解决
5、使用工程手段解决4好，还是使用SFT解决4好，
6、如何进行5的SFT
    我认为这是一个较难的问题，还是说之前在工作的时候是使用RAG解决的，此外又讲了一些在数据构造上的手段和prompt上的手段
7、面试官认为可以使用RLHF解决（似乎他没有完全理解我说的业务场景）
    讲了使用DPO的做法
8、讲一下DPO、PPO、GRPO、KTO
    其他的讲了，不了解KTO
8.5、为什么不考虑对Base直接做DPO

9、问DPO的数据如何构造
10、问RAG问题的痛点在哪里、优点在哪里
11、是否了解COT
    讲了另外一段NLP实习做的COT的经历
11.5、问COT从数理逻辑上为什么奏效
12、问之前具体负责了哪些工作，是否具体做过训练的内容
    表明做过（正常流程下面要问DeepSpeed了，但并没有问）
13、问Attention上都有哪些优化措施
    把GQA和FlashAttention搞混了

好像这次面的比较差，可能要挂，来攒攒人品

全部评论

推荐最新楼层

暴叔讲留学

蚌埠坦克学院算法工程师

过了没佬，度一面就这么猛，是文心部门吧，真卷

点赞回复分享

发布于 2025-04-12 02:16 浙江

03-31 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

03-21 23:20

门头沟学院推荐算法

多模态算法实习一面-小红书

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.项目拷打2.实习拷打3.如何做RLHF阶段的稳定训练？PPO在RLHF中的核心不稳定点？4.如果训练中出现：GPU利用率低、显存碎片化严重，你会如何排查与优化？5.RLHF训练中，奖励模型（RM）的训练难点是什么？如何避免奖励模型过拟合，确保其能准确反映人类偏好？6.数据清洗过程中，如何区分有效数据与噪声数据？针对不同类型的噪声（如文本错误、图像模糊），有哪些针对性的处理方法？7.在大模型训练过程中，如何优化显存占用和训练速度？8.你在过往项目中，有没有基于业务需求，提出过创新的技术方案或优化思路？如何推动方案落地并验证效果？9.代码题：合并两个有序链表和二叉树中的最大路径和

查看9道真题和解析

点赞评论收藏

分享

03-26 16:47

门头沟学院 Java

找多模态大模型实习

作业帮的笔试真的是做过最简单的，像是三道简单题，20分钟a完了

点赞评论收藏

分享

03-26 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

04-02 11:35

美团Agent开发一面，攒人品

笔试a 1.83(没开long long不ac的那次)（投的好迟现在才面第一家）1.自我介绍2.实习拷打-agent具体流程-使用什么模型，时延多少-复合多少tool，缺槽具体是怎么处理的-多轮逻辑有吗-RAG怎么做的-记忆怎么更新，删除。权重3.kv cache了解吗，具体是啥，存kv，为啥不存q4.回到实习，kv cache下，你的query怎么构建，顺序如何才能利用好5.即使把query放最后，如果新增小变更 前面的k矩阵还是会变化要重算，怎么办。-乱答flashattention，被指出错误，问是否了解vllm里的解决机制-不是搞infra的，论文也是可解释性相关的，没追问了6.做题top k大的元素，k<<N;-上午面脑子不清醒，一开始写了个堆排序，随后立刻改成k大小的堆排序7.问想来做什么8.反问40min猛攻特勤处，洗洗睡了

查看12道真题和解析

点赞评论收藏

分享

评论

1

15

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你知道最慷慨和最抠的公司分别是 #

3821次浏览 39人参与

# 哪些AI项目值得做？ #

2455次浏览 85人参与

# 华泰星战营，提前锁定校招offer #

8887次浏览 316人参与

# 实习时最怕听到的一句话 #

2742次浏览 49人参与

# 简历上如何体现你的“AI”能力？ #

2786次浏览 54人参与

# 没有面试的日子里，你在做什么 #

3598次浏览 55人参与

# 怎么给家人解释你的工作？ #

57098次浏览 217人参与

# 你简历上最心虚的一句话 #

8317次浏览 49人参与

# 你总挂在第__面？ #

1527次浏览 22人参与

# 找不到大厂实习可以去小厂吗？ #

2814次浏览 30人参与

# 荣耀笔试 #

83739次浏览 410人参与

# 实习生如何通过转正 #

138155次浏览 1493人参与

# 国央企笔面经互助 #

196963次浏览 1235人参与

# 考公VS就业，你怎么选？ #

100749次浏览 534人参与

# 卷__卷不过你们，只能卷__了 #

60942次浏览 767人参与

# 你今年的保底offer是哪家 #

187945次浏览 760人参与

# 大城市找工作会更容易吗 #

66902次浏览 400人参与

# 哪些公司对双非友好 #

231197次浏览 1248人参与

# 快消秋招求职进展汇总 #

11719次浏览 43人参与

# 你找实习最大的坎坷是什么 #

322375次浏览 2469人参与

# 哪些公司校招卡第一学历 #

256718次浏览 876人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务