27字节agent开发实习一面
发点面经攒攒人品
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
全部评论
佬有没有面算法
这个涉及的确实很多了 到基座层面了
忍耐王
借楼,谢谢!!希望对大家有帮助。
帮转-小红书视频剪辑Agent开源项目
帮转-求star
FireRed-OpenStoryline
基于本地部署项目,使用起来更丝滑哦
github开源链接:
https://github.com/FireRedTeam/FireRed-OpenStoryline/tree/main
hugging face网页版体验链接:
https://fireredteam-firered-openstoryline.hf.space/
RedTech公众号宣传推文:
https://mp.weixin.qq.com/s/tr-SEjZp6fNVS6IrjIbCRg
太强了佬
相关推荐
查看24道真题和解析