Tele-AI大模型算法实习一面
继续来分享下之前的面经~欢迎友好讨论,信息共享
1.实习拷打
2.介绍下项目
3.你主要负责哪方面
4.仔细讲下这几大链路
5.有和其他智能体协作吗
6.F1怎么做的,怎么计算的,是放到提示词做示例,还是微调了模型
7.幻觉验证是怎么做的
8.RLHF和PPO的区别
9.在PPO训练过程有遇到什么问题吗
10.训练PPO需要几个模型
11.
假设现在有一条query,你现在告诉我PPO的整个流程是怎么样训练的,这四个模型是怎么协作的
12.有了解其他ppo改进算法吗
13.KL散度加在PPO损失的哪里
1.实习拷打
2.介绍下项目
3.你主要负责哪方面
4.仔细讲下这几大链路
5.有和其他智能体协作吗
6.F1怎么做的,怎么计算的,是放到提示词做示例,还是微调了模型
7.幻觉验证是怎么做的
8.RLHF和PPO的区别
9.在PPO训练过程有遇到什么问题吗
10.训练PPO需要几个模型
11.
假设现在有一条query,你现在告诉我PPO的整个流程是怎么样训练的,这四个模型是怎么协作的
12.有了解其他ppo改进算法吗
13.KL散度加在PPO损失的哪里
全部评论
相关推荐
查看17道真题和解析 点赞 评论 收藏
分享