27字节agent开发实习一面

发点面经攒攒人品
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务