6.16 京东物流大模型实习生(1.5h)

1.自我介绍
2.问项目的场景
3.问大模型的输入输出
4.问强化学习的项目
5.问GRPO,PPO,DPO的算法原理
6.什么时候用PPO,什么时候用GRPO
7.模型的SFT和PEFT训练的时候有什么小trick
8.有没有了解Agent和RAG,解释原理
9.算法题 最长公共子序列,环形链表
10.场景题 有没有了解复读机, 如何解决复读机问题
11.反问:业务是做ToB的多轮对话机器人,读取客户需求,营销产品,更多偏强化学习微调
12.三轮面试
全部评论

相关推荐

你觉得实习能学到东西吗
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务