高德大模型实习一面(凉凉

给我面没招了,感觉自己好菜
1. 介绍项目,主要只问了和强化学习相关的那个项目。
2.项目强化学习部分,为什么用 DPO 而不是 PPO?GRPO效果怎么样?为什么要用GRPO
3.DPO 的目标函数 / 损失函数大概是什么思路?和 PPO 区别在哪?为什么要加 KL 散度限制?为什么要防止和原模型偏差太大?
4. 你对 Transformer 的 Encoder-Decoder 结构理解如何?Self-attention 公式是什么?
5. 了解 Multi-Head Attention、Group Attention、MLA、KV Cache 这些优化吗?Group Attention是哪两个可以复用?
无手撕
全部评论
兄弟,愿意试试多多吗,看我住叶,进度随时帮看
点赞 回复 分享
发布于 03-06 14:44 上海

相关推荐

因为年终奖发的比较晚,本来想年底看机会的哪成想时间接不上,3月底开始看机会,4年社招小弟被虐惨了。。。。按照面试顺序如下美团-交易中台         二面挂        场景题回答的不是很好滴滴-稳定性平台     BP面挂        年包接不住挂爱回收-二手平台     三面挂         年包接不住挂百度                       hr面完         谈薪中阿里淘天                一面挂         八股项目回答还可以,问了很多AI Agent相关的细节完犊子滴滴-外卖配送        二面挂         二面面试官觉得我没相关经验,明里暗里说不建议换赛道,业务不匹配高德-大云图           一面挂         数据采集平台业务不匹配字节-火山引擎        一面挂         感觉跟面试官聊的还不错,项目+算法都还可以,第二天直接感谢信小红书                    二面中          聊的还可以,部门很扁平化,有点向往白龙马云行科技      二面中           全程没八股,项目的各种细节各种问阿里和美团是为数不多还一直问八股的公司,其他都是聊项目,聊具体场景设计方案当然都有算法题,但是对于社招选手还可以,一般都是二叉树、数组、链表、栈这种的各种遍历、删除的变种,目前没有遇到hard难度的,对于社招选手真是省大力了,如果你也在看机会中可以交流交流。。。。
逆羽_:老哥之前在哪呀,社招创业公司经历有机会冲大厂嘛
我的求职进度条
点赞 评论 收藏
分享
评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务