阿里淘天大模型一面面经
1️⃣切分策略( chunk size / overlap )怎么定的?拍脑袋还是实验出来的?
2️⃣向量召回和关键词召回冲突时如何融合?
3️⃣重排模型为什么这么选?延迟预算是多少?
4️⃣你说线上提升2.1%,实验分桶方案是什么?
5️⃣显著性怎么验证?样本量怎么算?
6️⃣给一个你最失败的 bad case ,最后怎么定位的?
7️⃣如果今天线上再次复现,你第一步看哪个监控?
8️⃣SFT 数据如何清洗,怎么避免模板味太重?12) DPO 比 SFT 多解决了什么真实问题?
9️⃣LoRA rank 为什么这么选?有没有做过 ablation ?
1️⃣0️⃣QLoRA 稳定性问题你遇到过吗?如何兜底?
1️⃣1️⃣手撕:括号生成,要求讲清楚剪枝逻辑。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2️⃣向量召回和关键词召回冲突时如何融合?
3️⃣重排模型为什么这么选?延迟预算是多少?
4️⃣你说线上提升2.1%,实验分桶方案是什么?
5️⃣显著性怎么验证?样本量怎么算?
6️⃣给一个你最失败的 bad case ,最后怎么定位的?
7️⃣如果今天线上再次复现,你第一步看哪个监控?
8️⃣SFT 数据如何清洗,怎么避免模板味太重?12) DPO 比 SFT 多解决了什么真实问题?
9️⃣LoRA rank 为什么这么选?有没有做过 ablation ?
1️⃣0️⃣QLoRA 稳定性问题你遇到过吗?如何兜底?
1️⃣1️⃣手撕:括号生成,要求讲清楚剪枝逻辑。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享

安克创新 Anker公司福利 881人发布