平安nlp一二面面经

一面
主要问实习经历
介绍一下DPO
多agent开源框架有哪些?为什么不用开源框架
code: lru

二面
主要问实习经历,以及为什么
为什么要改写,改写前后有什么区别?
为什么不微调deepseek
deepseek优化了哪些?为什么不用PPO,而是用GRPO?
大模型出现幻觉怎么办?有什么方法避免?
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务