滴滴RL实习生面经(已oc)

浙大98投递

背景:9本9硕,1篇2作A, 1篇4作A, 1篇1作在投,半年算法研究实习

一面

科研经历

如何增强多模态模型的识别准确度(比如识别出一个医疗手写表格中的特征与具体值)

在用verl做强化学习时,你是根据什么指标来查看训练的进度的。

讲一讲你对rag的理解

ppo的原理

ppo是倾向于将模型往什么方向训练

讲一个你最熟悉的模型(讲的deepseek-r1)

多模态基础

手写多头注意力

为什么计算注意力要除以维度

decoder-only的结构,输入prompt到输出token的整个过程。

有什么办法将2维的embedding转换成3维的embedding,同时保留位置编码信息

以后读博还是进入工业界

如果有转正机会,是否考虑留下

反问:

做什么(关于多模态Agentic RL的算法研究,论文导向,计划投一篇nips)

base (杭州)

需要学习的内容。

好久没面试了,有点紧张,讲述逻辑很混乱,而且多模态没准备也没基础,有点凉了

二面

面试官感觉比我还紧张

如果过来,还是要靠实习生自己从零开始做,可以接受嘛

之前做科研遇到的困难和挑战,如何解决的

细问了一下一作的文章,然后就结束了,讲述了一下目前部门的情况,很像闲聊的感觉。

反问

卡量

对实习的期望

3天后oc

全部评论
感觉可以
点赞 回复 分享
发布于 2025-12-20 12:38 北京

相关推荐

1. 某笔记管理网站的音乐源从何处获取,音乐是存储在云端还是前端工程中;若音乐打包在前端工程中,音乐数量增多会导致包体积变大,该如何对其进行更新修改?2. 百度关键词命中系统的架构是怎样的?请介绍该系统的实现逻辑及相关算法。3. 百度关键词命中系统是否使用Java开发?4. 百度关键词命中系统的优化是否包含将关键字从MySQL加载到内存和CDA中,系统实际运行时是否不再查询MySQL?5. 百度关键词命中系统的400个实例加载的内容是否一致?6. 百度关键词命中系统为何要通过shell脚本让400多个实例重启,不重启是否无法完成数据更新?7. 请介绍百度关键词命中系统中Redis带宽优化的具体实现逻辑。8. 百度关键词命中系统中通过何种方式将12MB的流量降至10MB以下?9. 若不使用Redis,是否有更简单的方法控制百度关键词命中系统的带宽问题?10. 在Golang中,协程异步推送是否会带来较大的内存压力?11. 请介绍Golang的协程和进程的模型。12. 请介绍Java的JVM内存区域分布。13. 请介绍Java常用集合(如HashMap、HashSet等)的相关源码。14. 在实际工作中是否利用Java相关知识做过性能调优,具体是如何操作的?15. 在百度文档提取系统中参与最深的模块是哪个,请介绍该模块的具体实现逻辑。16. 百度文档提取系统中通过try catch捕获异常绕过提取失败的部分,为何可以绕过该部分,该操作是否真正解决了提取失败的核心问题?17. 请解释在百度侧的数据库优化中,覆盖索引的具体优化方式。18. 日常工作中是否经常处理慢SQL,具体是如何处理的?19. 请介绍Innodb中索引的数据结构,并说明为何选择该结构,该结构对索引设计有何指导意义?20. 某笔记管理网站中使用MySQL的全文索引NGRAPH,该索引与Elasticsearch相比效率是否更低,为何选择该索引而非Elasticsearch?21. 某智能oncall的agent系统的核心agent型架构是怎样的?22. 某智能oncall的agent系统开发中,除了使用相关AI工具外,做的最多的工作是哪些,具体是如何实现的?23. 在使用AI编程工具时,若一个工具查询了大量数据超过了工具的上下文窗口,该如何处理?24. 编程题:给定一个字符串,仅允许在其末尾添加字符使其变成回文串,请使用Java实现并返回构造后的最短回文串。
查看24道真题和解析
点赞 评论 收藏
分享
评论
5
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务