腾讯 AI中台日常实习面经分享
继续来分享下最近的面经~欢迎友好讨论,信息共享
项目:
1. 整体项目介绍
2. prompt设计和迭代过程
3. 裁判模型打分维度,和生成模型的性能对比,以及数据质量
4. 训练数据,实验的结果观察(loss曲线、checkpoint选择)
5. 如何判断模型过拟合,重做项目以什么思路优化
八股:
1. SFT的loss形式,如何计算
2. DPO相比较SFT能够解决什么问题,原理和loss公式,以及beta参数的含义和尝试
3. KL散度
4. GRPO介绍
项目:
1. 整体项目介绍
2. prompt设计和迭代过程
3. 裁判模型打分维度,和生成模型的性能对比,以及数据质量
4. 训练数据,实验的结果观察(loss曲线、checkpoint选择)
5. 如何判断模型过拟合,重做项目以什么思路优化
八股:
1. SFT的loss形式,如何计算
2. DPO相比较SFT能够解决什么问题,原理和loss公式,以及beta参数的含义和尝试
3. KL散度
4. GRPO介绍
全部评论
相关推荐
查看6道真题和解析 点赞 评论 收藏
分享
