滴滴内推,滴滴内推码

滴滴面经|一天三面,已发意向书,冲冲冲

面完都准备休息了发现十分钟后二面,看了眼邮件发现是连环面试,于是一口气面了三轮,一面二面都是五十分钟,各有一道简单的代码题,三面半小时左右

1️⃣ 一面50min,一道代码题1 聊项目20分钟2 传统的强化学习与LLM中的强化学习的对应关系3 介绍一下PPO,GRPO这几个算法的区别4 AI Coding用过那些 如果你来设计 要包含哪些模块5 代码题:动态规划6 反问

2️⃣ 二面50min,一道代码题1 聊项目20分钟2 Decoder-only的主要组成3 解释一下自注意力,交叉注意力4 常见位置编码了解哪些5 传统策略梯度的收敛性有理论上能收敛吗(能,但条件苛刻),LLM做强化学习训练时怎么能更容易收敛6 代码题:斐波那契数列变种 后续问了下理论解怎么求(特征方程)7 反问

3️⃣ 三面30min,无代码1 做项目的时候遇到最大困难了吗,怎么解决的2 项目的指标提升很大,具体怎么实现的3 强化学习在游戏场景下的主要应用与主要研究方向4 聊了一下Kimi K2的技术方案5 介绍了一下组里的方向6 反问 总体感觉在滴滴很舒服,工作强度不大,我所在的部门也没有太多dirty work ,mentor非常认真负责,不会push,还经常找我聊天和询问我有没有什么困难,同部门哥哥姐姐经常投喂我各种食物,真的很喜欢滴滴

内推链接:https://app.mokahr.com/m/campus_apply/didiglobal/96064?recommendCode=DSrx48tx&hash=%23%2Fjobs#/jobs

内推码:DSrx48tx

内推码:DSrx48tx

内推码:DSrx48tx

投递的同学评论区留言,如LXX+后端,方便后续跟进,随时查进度哇,欢迎一起交流,欢迎各位大佬加入桔厂!

全部评论

相关推荐

被横向挂了,希望发出来对大家有帮助!1.面对激烈的同质化竞争,混元平台应构筑怎样的非技术性壁垒?是依靠腾讯的生态场景、独特的数据管道、还是极致的服务体验?2.你在一面中规划了长文本功能。现在,请将这个功能抽象为一个可被平台其他模型或开发者复用的“平台级能力”。你会如何设计它的API接口、计费单元和性能SLA?3.平台需要管理模型训练、微调、评测、部署、服务等全链路。请描绘你心目中理想的“一体化AI开发平台”产品架构图,并指出其中最复杂、最需要产品经理介入设计的两个模块。4.现在从平台全局视角看,当高并发的长文本请求与高优先次的模型训练任务争夺同一集群的显卡资源时,作为平台产品负责人,你的调度策略和优先级规则是什么?5.假设要求在未来一年内,将平台服务的综合单位成本降低30%。你会从哪几个主要方向着手制定方案?每个方向可能带来的产品体验风险是什么?6.你定义了工具调用准确率等指标。但当一个包含多步复杂工具调用的Agent任务失败时,如何建立有效的归因分析体系,快速定位是Prompt问题、模型问题、工具本身问题还是逻辑设计问题?平台应提供怎样的产品或数据能力来支持这种诊断?7.在平台层面,“模型效果”、“推理速度”、“服务成本”和“开发者体验”构成了一个不可能三角。针对不同类型的客户,你会如何动态调整这个三角的优先级,并体现在产品策略上?8.如何设计平台的“激励机制”,才能吸引并留住高质量的开发者,而不仅仅是算力掮客?除了云券,哪些非货币化的激励可能更有效?
查看8道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务