vivo大模型多模态算法面经分享

发一下问题给大家参考,攒攒人品!
1. 实习拷打
2. 你做的 Agent 系统采用的是什么框架?
3. 系统的整体工作流 / 执行范式是如何设计的?
4. 多路召回后的粗排策略是什么?
5. 二阶段重排序(Rerank)是如何实现的?
6. 多模态特征(图文)是如何融合的?
7. 项目中使用了多大参数的模型?为什么这样选择?
8. SFT 的训练目标是什么?数据集如何构建?
9. VQA 数据的 Query 和 Answer 是如何生成的?
10. 工具调用的监督数据(GT)是如何获取的?
11. 数据生成后有没有做校验与过滤?怎么做的?
12. LoRA 微调的超参数(rank)如何选择?
13. 是否尝试过多种微调 / 强化学习方法?为什么选当前方案?
14. 奖励函数(Reward)是如何设计的?
15. 强化学习是优化端到端结果,还是优化单步决策?
16. 有没有遇到奖励作弊(Reward Hacking)?如何解决?
17. GRPO 的重要性采样的数学意义是什么?
18. KL 散度系数等超参数是如何调优的?
19. 多轮任务是否考虑端到端训练?如何设计?
20. 模型 / 系统效果如何评估?指标怎么计算?
21. 复杂查询 / 多意图查询如何做准确率评估?
22. 系统推理延迟(首 Token 延迟)大概多少?
23. 影响系统性能的主要因素有哪些?
24. 请写出 Attention 计算公式,并解释原理。
25. QK^T 为什么要除以根号 dk?
全部评论
vivo这个岗卡学历吗
点赞 回复 分享
发布于 04-26 21:33 辽宁

相关推荐

04-30 08:02
东南大学 C++
一、基本情况 / 实习经历1.你先做一下自我介绍。2.你大二就去字节实习了吗?3.你能简单介绍一下你在字节实习做的项目吗?________________________________________二、字节实习项目:端上特征平台 / 性能优化4.你们这个端上特征平台里的“特征”具体指什么?5.客户端上的特征和服务端上的特征有什么区别?6.你在实习中做的两块优化,具体分别是什么?7.这两块优化分别解决了什么问题?8.你觉得这里面的难点主要在发现问题,还是在方案设计和落地?9.设备特征缓存为什么可以做分层?10.你们是怎么确定 2 秒、10 秒、90 秒这类分层缓存策略的?11.业务方怎么感知或使用这套缓存频率配置?12.这些设备特征的规模是固定的吗?13.你做的特征 SQL 优化具体是怎么做的?14.这里的时间戳在 SQL 里具体是什么条件?15.为什么这些 SQL 可以合并处理?16.你们为什么要在端上做特征处理,而不是全部上报到云端处理?17.端上做特征处理,最终是给哪些场景使用的?18.你这个特征平台和抖音、头条这些业务之间的关系是什么?19.业务方如果需要自定义特征,是怎么接入你们平台的?________________________________________三、AI 投资分析系统 / 多 Agent 设计20.你能介绍一下你做的 AI 投资分析系统吗?21.这个系统从用户输入到输出投资建议,大概是什么流程?22.你为什么要把系统拆成多个 Agent,而不是单 Agent?23.你这样拆成多个子 Agent,会不会导致信息割裂,反而影响最终分析效果?24.你觉得你现在这个多 Agent 方案主要问题在哪里?25.如果让你继续优化这个投资分析系统,你会怎么改它的 pipeline?26.你会怎么降低这个系统里的幻觉和噪声问题?27.你觉得投资分析系统里的“证据链完整性”应该怎么保证?28.除了证据链,你觉得最终“投资建议生成”这一层应该怎么设计规则或决策机制?29.你理解的“闭环”是什么?30.如果要让这个投资分析系统真正形成闭环,你觉得还缺哪些能力?31.用户反馈信号应该怎么作用到你的系统里?32.长期记忆、短期记忆和用户画像在这个系统里应该怎么设计?33.你觉得用户反馈信号应该怎么转成 reward 或权重更新?34.你提到意图识别和 plan,那你怎么保证这条链路本身的一致性?________________________________________四、高并发 AI 聊天系统35.你做的高并发 AI 聊天系统,里面“高并发”和“AI 聊天”结合起来,有什么特别值得讲的地方?36.你为什么会做这个项目?
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务