美团实习 推荐算法 一面面经

给我面没招了....攒人品中
1.如果线上只有弱标签甚至没有人工标注,Reranker 如何进行微调或持续优化?

2.Reranker 和 Cross-Encoder / Bi-Encoder 的关系是什么?各自的取舍点在哪里?

3.为什么要做 Query 改写?它在召回和排序阶段分别能带来什么收益?

4.常见的 Query 改写方式有哪些?规则、模型、生成式方法各自优缺点?

5.在你的项目中,Query 改写的核心做法是什么?

6.有没有读过或参考过 Query 改写 / Query Expansion 相关论文?印象最深的是哪一篇?

7.GRPO 损失函数是什么?公式中每一部分分别起什么作用?

8.GRPO 相比传统 RL 或 SFT 的优势在哪里?为什么要这样设计?

9.在大模型训练过程中,Transformer 通常会更新哪些参数?哪些可能被冻结?

10.从工程角度看,你是如何优化大模型训练和推理效率的?

11.项目中使用的 Embedding 模型结构是什么?是 Encoder 还是双塔?

12.输出向量的维度是多少?维度大小如何影响检索效果和性能?

13.Embedding 向量在实际使用中是如何做归一化、存储和索引的?

14.手撕算法:合并两个数组并去重,如何保证时间复杂度?

15.手撕算法:求前 K 个最小值,使用最小堆实现。

16.手撕算法:子集型回溯问题。如果输入列表中可能包含重复元素,如何避免重复解?
全部评论

相关推荐

03-04 17:07
南昌大学 Java
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务