4.24滴滴大模型算法一面面经

1. 自我介绍
2. 过一下你觉得最好的项目/实习。说了一个教程类开源项目,其中包括部署、LoRA微调等内容。又说了了另一个在学校做的项目,问的很细,包括我们使用Function Call做检索的流程、用langchain如何实现的,内部原理是什么。
3. 下一个项目BERT相关的,问了问Transformer的原理结构,他的优点是什么,我讲的是他是不限制距离计算,有效遏制了经典RNN模型的长序列遗忘问题。问了问BERT的原理,幸好看过原论文,简单说了下。
4. 下一个项目是做的Qwen SFT,训练数据如何生成的,多少数据,训练的参数,训了多久。
5. 问了强化学习deepseek,我答了GRPO和PPO,问了DPO我没看过。
6. medium题
全部评论
开源项目经验加分
1 回复 分享
发布于 05-03 17:40 广东
佬,开源项目可以分享一下吗
点赞 回复 分享
发布于 05-13 11:46 广东
方便问问佬bg吗
点赞 回复 分享
发布于 04-29 14:03 浙江
求问是哪个部门啊
点赞 回复 分享
发布于 04-28 13:53 四川
佬,可以问一下是哪个部门吗,我们的问题好相似
点赞 回复 分享
发布于 04-28 09:21 浙江

相关推荐

1.请简述什么是大模型,以及它与传统模型的主要区别是什么?2.你如何评估大模型的性能?有哪些常用的评估指标?3.请描述一下你如何对大模型进行优化,以提高其性能和效率。4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?8.在大模型设计中,如何权衡模型的复杂度和性能?9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?12. reward model如何训练的,训练目标是什么?13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?14.指令跟随能力的评估集有什么,如何评估的?15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?17.在开发大模型时,当你面临推理阶段的资源需求时,你如何确保模型的可解释性和公平性?18.谈谈你对Transformer模型的理解,以及它在自然语言处理中的应用。19.请简述Transformer的基本结构和工作原理?20.为什么Transformer使用位置编码(Positional Encoding)?21.如何优化 Transformer 模型的性能?22.Transformer在自然语言处理中有哪些应用?23.transformer里边norm的位置在哪里,norm如何计算的多头自注意力机制的作用是什么?24.注意力机制为什么除以根号dk, 为什么不是dk请解释什么是注意力机制,并举例说明其应用场景。25.注意力机制是如何工作的?请简述其计算过程。26.多头注意力机制是什么?它相比单头注意力有什么优势?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
四月中旬才开始投递,总算是抓住了暑期的尾巴time line如下:4.15投递5.6一面5.7二面5.8三面512收到offer(一周速通三面,感觉可以挑战全网最快流程)一面(技术面):约80分钟1. 自我介绍2. 详细盘问了科研论文的项目(深度强化学习方向),问的非常详细,包括论文的主要创新点、具体的建模细节等,非常刨根问底,几乎每个设计都要问一下为什么,其中也交叉问了一些八股,主要是强化学习方面的,如loss如何计算与传递等。常规问题以外,面试官还进行了一些拓展,比如让我思考这个科研项目距离落地还需要做哪些工作,多目标的奖励权重如何更新等,这部分我答的不好,但是面试官也非常耐心,一步步引导我去进行思考,也和我交流了他们实际业务中应用强化学习的一些设计。3. 然后又盘问了在滴滴做的项目,这个主要是大致介绍了业务的背景、项目的目标、模型选型的考虑等。其中具体问了一些推荐系统模型的八股(因为简历里有写),如w&d、deepfm、d&c network等的模型特点。4. 面试官介绍了下组里的一些业务,以及如果我能进来的话可以做的一些方向,涵盖的内容非常广,从传统运筹的路径规划到强化学习再到营销用增方向。由于项目和业务上聊了很多,导致没时间手撕,面试官就让我自己截图回去做,做完微信发给他即可。手撕的题是一道力扣mid,最佳股票策略。二面(技术面):约40分钟一面结束后立刻发来了二面通知,第二天上午十一点有趣的是,大概当天十点半的时候,二面还没开始,三面的链接就已经发来了1. 自我介绍2. 滴滴实习项目盘问,问的也很细,跟一面的问题有一些重叠,还问了业务中如果遇到没出现的特征应该怎么处理等数据预处理的问题3. 科研论文盘问,dtw距离是什么,如何计算?k中心聚类的步骤,都是一些常见的八股4. 手撕:力扣mid 编辑距离,发现美团很喜欢出动规题5. 业务介绍,一面时介绍的已经比较仔细了,也没什么需要反问的三面(hr面):约20分钟都是一些开放性的问题,开始侃侃而谈1. 经过前两轮面试,对业务有什么了解?2. 平常有没有用过业务相关的产品?体验怎么样?有哪些痛点?3. 如何利用ai来辅助进行业务升级?举几个具体的场景4. 简历中最能体现自己能力的项目是哪个?具体展开说明5. 过去的几段实习经历里,给自己带来最大改变的是什么?带来了哪些改变?6. 反问    
查看16道真题和解析
点赞 评论 收藏
分享
评论
5
31
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务