27字节agent开发实习一面
发点面经攒攒人品
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
全部评论
相关推荐
今天 14:52
武汉大学 Java 点赞 评论 收藏
分享
今天 17:32
门头沟学院 Java Grant_Lin:昨天 HR 面,反问时问了面试官说是一两天后有结果,目前仍焦虑等待中,希望年前能拿到 offer。许愿🙏🙏🙏
查看36道真题和解析 点赞 评论 收藏
分享
