阿里大模型算法暑期实习面经分享
继续来分享下最近的面经~欢迎友好讨论,信息共享
1.项目背景
2.要解决的问题
3.要解决问题的难点
4.技术方案选型
5.最终如何确定技术方案
6.Qwen3-VL embedding 是怎么做的
7.是怎么提取图片的
8.用的什么提取器
9.最终怎么嵌入到文本里
10.怎么定义 DPO 训练集是高质量的
11.DPO 训练数据量是怎么确定的
12.数据量确定是拍脑袋,还是有原则
13.为什么不用 SFT
14.SFT 数据质量要求高体现在哪些方面
15.如果现在用 SFT 去解决这个问题,从理论上能不能解决
16.为什么不用 GRPO 解决,而是选择 DPO
17.说一下目前强化学习的问题和解决思路
1.项目背景
2.要解决的问题
3.要解决问题的难点
4.技术方案选型
5.最终如何确定技术方案
6.Qwen3-VL embedding 是怎么做的
7.是怎么提取图片的
8.用的什么提取器
9.最终怎么嵌入到文本里
10.怎么定义 DPO 训练集是高质量的
11.DPO 训练数据量是怎么确定的
12.数据量确定是拍脑袋,还是有原则
13.为什么不用 SFT
14.SFT 数据质量要求高体现在哪些方面
15.如果现在用 SFT 去解决这个问题,从理论上能不能解决
16.为什么不用 GRPO 解决,而是选择 DPO
17.说一下目前强化学习的问题和解决思路
全部评论
相关推荐
点赞 评论 收藏
分享
查看9道真题和解析