大厂算法面经|京东大模型一面
1. 自我介绍及项目阐述:请先做一个简单的自我介绍,然后详细介绍一下你参与过的相关项目。
2. 语义理解相关:在搜索链路里,像“苹果”这种既代表品牌又代表水果的语义歧义情况,通常是如何进行建模的?另外,多义词消解和上下文建模的核心方法分别是什么?
3. Toolformer 与 RLHF 对比:Toolformer 采用自监督学习来生成 tool call 数据,这种训练范式和 RLHF 存在哪些差别?并且,为什么 Toolformer 更容易实现泛化呢?
4. Reflection 机制判断问题:在 Reflection 机制中,我们该如何判断一个 Agent 执行失败是由于知识缺失,还是工具调用错误导致的呢?
5. RAG 与库存一致性:假如商品知识库是实时更新的,那么要怎样保证 RAG 的召回结果和库存信息保持一致呢?
6. RAG 长尾商品问题:在搜索场景中,RAG 的向量检索容易受到长尾商品的影响,针对这个问题,你会采取什么措施来缓解呢?
7. GRPO 与 PPO 对比:GRPO 和 PPO 之间的区别体现在哪些方面?另外,GRPO 的优化目标函数应该怎么写呢?
8. LoRA 电商推荐场景设计:如果要运用 LoRA 来对电商推荐场景进行微调,你会如何设计相应的数据和标签呢?
9. LoRA 与 Prefix Tuning 对比:LoRA 和 Prefix Tuning 有哪些区别?在什么样的场景下会选择使用 LoRA 呢?
10.算法题:请实现一个 LRU 缓存机制。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2. 语义理解相关:在搜索链路里,像“苹果”这种既代表品牌又代表水果的语义歧义情况,通常是如何进行建模的?另外,多义词消解和上下文建模的核心方法分别是什么?
3. Toolformer 与 RLHF 对比:Toolformer 采用自监督学习来生成 tool call 数据,这种训练范式和 RLHF 存在哪些差别?并且,为什么 Toolformer 更容易实现泛化呢?
4. Reflection 机制判断问题:在 Reflection 机制中,我们该如何判断一个 Agent 执行失败是由于知识缺失,还是工具调用错误导致的呢?
5. RAG 与库存一致性:假如商品知识库是实时更新的,那么要怎样保证 RAG 的召回结果和库存信息保持一致呢?
6. RAG 长尾商品问题:在搜索场景中,RAG 的向量检索容易受到长尾商品的影响,针对这个问题,你会采取什么措施来缓解呢?
7. GRPO 与 PPO 对比:GRPO 和 PPO 之间的区别体现在哪些方面?另外,GRPO 的优化目标函数应该怎么写呢?
8. LoRA 电商推荐场景设计:如果要运用 LoRA 来对电商推荐场景进行微调,你会如何设计相应的数据和标签呢?
9. LoRA 与 Prefix Tuning 对比:LoRA 和 Prefix Tuning 有哪些区别?在什么样的场景下会选择使用 LoRA 呢?
10.算法题:请实现一个 LRU 缓存机制。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
这个名字真的有十个字:三毒出来的都像老了十岁
点赞 评论 收藏
分享
热苏打:年终奖变“分手费”是吧
点赞 评论 收藏
分享
到手了的卷王:这薪资架构也太激进了
点赞 评论 收藏
分享

查看10道真题和解析