阿里淘天大模型一面面经

1️⃣切分策略( chunk size / overlap )怎么定的?拍脑袋还是实验出来的?
2️⃣向量召回和关键词召回冲突时如何融合?
3️⃣重排模型为什么这么选?延迟预算是多少?
4️⃣你说线上提升2.1%,实验分桶方案是什么?
5️⃣显著性怎么验证?样本量怎么算?
6️⃣给一个你最失败的 bad case ,最后怎么定位的?
7️⃣如果今天线上再次复现,你第一步看哪个监控?
8️⃣SFT 数据如何清洗,怎么避免模板味太重?12) DPO 比 SFT 多解决了什么真实问题?
9️⃣LoRA rank 为什么这么选?有没有做过 ablation ?
1️⃣0️⃣QLoRA 稳定性问题你遇到过吗?如何兜底?
1️⃣1️⃣手撕:括号生成,要求讲清楚剪枝逻辑。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

整体面试还是不错的,但是没后续了,不知道是哪里出了问题1.项目拷打2.你做的日志解析分析项目里涉及爬虫,具体是做什么的?你有相关的爬虫经验吗?3.用一两句话说明你的爬虫能力深度,以及处理过的最复杂的问题是什么样的?有处理过登录验证码、APP相关的反爬场景吗?4.你做的意图识别项目,描述一下面临的问题、产品需求,过程中遇到的技术难点以及解决方法。5.普通策略下意图识别准确率已经达到95%,经过优化后达到了多少?具体做了什么工作让准确率提升的?6.举例说明意图识别项目的业务场景,包括用户的提问方式、模型的解答形式,以及意图类别的设计逻辑。7.意图识别模型的类别除了商品查询、21类操作手册查询,还有别的吗?遇到无关问题时,模型会归类到哪一类,如何处理?8.提升的3%准确率,是不是主要通过完善数据集实现的?如果要进一步提升准确率,你的思路是什么?9.这个实习的项目中你是主导还是配合角色?这些优化思路是领导给的还是自己提出的?10.你做过的所有项目里,有哪些是自己主导的、有成就感的事情?11.你做的编程助手项目借鉴的是哪个开源框架?除了这个框架,还有没有对其他开源框架做过选型工作?12.你看过这个开源框架的完整代码吗?你觉得它的本质是什么?有了解过检索增强、总结洞察相关的内容吗?13.除了这个编程助手项目,还有其他比较有成就感的事情吗?14.谈谈你对Transformer架构中注意力机制的理解,以及它的实现方式。15.讲讲Transformer架构中编码器和解码器的处理过程,以及两者的区别。
查看14道真题和解析
点赞 评论 收藏
分享
评论
点赞
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务