6.23 高德视觉研究团队 大模型研究型实习生(1h)

1.面试官介绍团队
2.自我介绍
3.有没有了解生成式推荐模型的范式与流程
4.详细介绍DPO,PPO,GRPO算法的原理与区别
5.有没有了解Deepsearch
6.场景题:如果给你一个通用性Agent,请给出强化学习训练的流程与数据制作的流程
7.场景编程题:500 囚犯 一排 一次报数 每次随机奇数会随机铅笔  下一次 奇数随机墙壁 最后一个人无罪释放 加入我是最后囚犯 大概率货到最后。编程实现

面试官人很好,可以看出来是专门做研究和技术等的,可惜我太拉,一周后挂了

#面试问题记录# #牛客AI配图神器#
全部评论
请问这个场景变成题是站一排吗? 一排的话多次报完数最后留下的人结果不是固定的吗?
点赞 回复 分享
发布于 今天 19:41 天津

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务