26秋招之网易有道大模型算法一面

1. 挑一个实习项目介绍
2. 你在项目里有没有实现过 Plan-Execute / ReAct 这种 agent 框架?具体是怎么做任务分解的?能举个例子吗?
3. 在数据处理里,难例挖掘怎么做?有没有办法从失败的 agent 轨迹里构建训练数据?
4. Function Calling 和 Agent 框架中的 Tool Routing 有什么不同?在什么情况下优先用哪种?
5. DPO 和 GRPO 在优化目标上有什么区别?在工具使用成功率优化时你会选择哪一个?
6. 针对端侧场景,如果要用 SLM + 蒸馏,你会选择哪种蒸馏方式?为什么?
7. RLHF 中 reward model 的训练数据是怎么构建的?你觉得哪些噪声来源会影响它?
8. 你做过检索相关工作吗?能说说你会如何在 BM25、向量召回和 cross-encoder rerank 之间做架构组合?
9. 算法题:二叉搜索树中的第k小元素
全部评论

相关推荐

11-17 17:15
已编辑
武汉理工大学 Unity3D客户端
找工作勤劳小蜜蜂:选诗悦(首选)或勇士(广州团队),不建议选广州以外的团队(米哈游除外),原因很简单,广州是游戏研发天朝集散地,生态更完善,考虑未来长期就业地首选,全国5000家游戏公司,有4500家在广州,其中以诗悦公司为中心的天河公园科韵路一带产业园区周边3公里内有3500家游戏公司研发部。游戏公司工作3年一个台阶,初级,中级,高级,主程(30-45k+项目分红股),如果做主程时候有1-2个成功项目(基本能有300-500万的创业启动基金),40岁毕业后创业;如果没有,就要下滑到新创公司做研发总监或顾问(收入锐减,月入20-25k),这非常重要,因为这时候游戏产业集群丰富给这批40-50岁的老骨头一个体面延续。50岁要不成功上市,要不落幕在家躺平。 整体考虑未来结婚安家,广州教育是全国领先型城市,这个不用描述,医疗,广州也是顶级3大医疗中心(北上广),深圳的教育和医疗还在爬坡,离北上广还有很大距离。广州安家购房成本也远低于深圳。在未来有可能的波动还可以横跳到深圳过度(毕竟很近,只有120公里)。 其次选择深圳的团队,深圳大约有1800-2000家游戏公司研发中心,但分布比较松散,并没有广州那么几种(科韵路-天河公园圈)。
游戏求职进展汇总
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务