vivo大模型多模态算法面经分享
发一下问题给大家参考,攒攒人品!
1. 实习拷打
2. 你做的 Agent 系统采用的是什么框架?
3. 系统的整体工作流 / 执行范式是如何设计的?
4. 多路召回后的粗排策略是什么?
5. 二阶段重排序(Rerank)是如何实现的?
6. 多模态特征(图文)是如何融合的?
7. 项目中使用了多大参数的模型?为什么这样选择?
8. SFT 的训练目标是什么?数据集如何构建?
9. VQA 数据的 Query 和 Answer 是如何生成的?
10. 工具调用的监督数据(GT)是如何获取的?
11. 数据生成后有没有做校验与过滤?怎么做的?
12. LoRA 微调的超参数(rank)如何选择?
13. 是否尝试过多种微调 / 强化学习方法?为什么选当前方案?
14. 奖励函数(Reward)是如何设计的?
15. 强化学习是优化端到端结果,还是优化单步决策?
16. 有没有遇到奖励作弊(Reward Hacking)?如何解决?
17. GRPO 的重要性采样的数学意义是什么?
18. KL 散度系数等超参数是如何调优的?
19. 多轮任务是否考虑端到端训练?如何设计?
20. 模型 / 系统效果如何评估?指标怎么计算?
21. 复杂查询 / 多意图查询如何做准确率评估?
22. 系统推理延迟(首 Token 延迟)大概多少?
23. 影响系统性能的主要因素有哪些?
24. 请写出 Attention 计算公式,并解释原理。
25. QK^T 为什么要除以根号 dk?
1. 实习拷打
2. 你做的 Agent 系统采用的是什么框架?
3. 系统的整体工作流 / 执行范式是如何设计的?
4. 多路召回后的粗排策略是什么?
5. 二阶段重排序(Rerank)是如何实现的?
6. 多模态特征(图文)是如何融合的?
7. 项目中使用了多大参数的模型?为什么这样选择?
8. SFT 的训练目标是什么?数据集如何构建?
9. VQA 数据的 Query 和 Answer 是如何生成的?
10. 工具调用的监督数据(GT)是如何获取的?
11. 数据生成后有没有做校验与过滤?怎么做的?
12. LoRA 微调的超参数(rank)如何选择?
13. 是否尝试过多种微调 / 强化学习方法?为什么选当前方案?
14. 奖励函数(Reward)是如何设计的?
15. 强化学习是优化端到端结果,还是优化单步决策?
16. 有没有遇到奖励作弊(Reward Hacking)?如何解决?
17. GRPO 的重要性采样的数学意义是什么?
18. KL 散度系数等超参数是如何调优的?
19. 多轮任务是否考虑端到端训练?如何设计?
20. 模型 / 系统效果如何评估?指标怎么计算?
21. 复杂查询 / 多意图查询如何做准确率评估?
22. 系统推理延迟(首 Token 延迟)大概多少?
23. 影响系统性能的主要因素有哪些?
24. 请写出 Attention 计算公式,并解释原理。
25. QK^T 为什么要除以根号 dk?
全部评论
vivo这个岗卡学历吗
相关推荐
查看13道真题和解析 点赞 评论 收藏
分享
昨天 13:57
门头沟学院 Java 点赞 评论 收藏
分享
