继续来分享下最近的面经~欢迎友好讨论,信息共享1.项目背景2.要解决的问题3.要解决问题的难点4.技术方案选型5.最终如何确定技术方案6.Qwen3-VL embedding 是怎么做的7.是怎么提取图片的8.用的什么提取器9.最终怎么嵌入到文本里10.怎么定义 DPO 训练集是高质量的11.DPO 训练数据量是怎么确定的12.数据量确定是拍脑袋,还是有原则13.为什么不用 SFT14.SFT 数据质量要求高体现在哪些方面15.如果现在用 SFT 去解决这个问题,从理论上能不能解决16.为什么不用 GRPO 解决,而是选择 DPO