百度文策大模型二面面经分享

给我面没招了,感觉自己好菜、面试很难,还是要多多练习
1.项目拷打
2.你的知识库数据是如何清洗和构造的?如果数据质量参差不齐会对 RAG 系统产生哪些影响?
3.文档切分策略是如何设计的?chunk size 和 overlap 会如何影响召回质量和生成效果?
4.如果用户的问题在知识库中确实存在,但系统经常没有召回正确文档,你会如何排查?
5.如果检索到的文档是正确的,但模型最终生成的答案仍然是错误的,你会如何定位问题?
6.实际系统中,如果召回结果经常语义相似但事实不相关,你会如何优化检索模块?
7.如果一个问题需要跨多个文档的信息才能回答,你的 RAG 系统如何处理这种情况?
8.在 RAG 系统中如何判断问题出在检索模块还是生成模块?
9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。
10.FFN 层为什么采用“先升维再降维”的结构,这种设计对模型表达能力有什么作用?
11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异?
12.为什么推理阶段 KV Cache 只缓存 K 和 V,而不缓存 Q?
13.RoPE 的核心原理是什么,它在长上下文场景下会遇到什么问题?
14.instruction tuning 中多轮对话数据训练时,loss mask 应该如何设计?
15.如果 SFT 之后模型在特定任务上能力增强,但通用能力明显下降,你会如何解决?
16.LoRA 的低秩分解为什么能够逼近全参数微调的效果?
17.如果 LoRA 的 rank 设置不合理,在模型表现上会出现什么现象?
18.DPO 训练后模型输出明显变长,在实际系统中你会如何处理?
19.如果对齐之后模型变得过于保守,经常拒绝回答,你会如何调整训练策略?
20.大模型出现复读机现象通常由哪些因素导致?
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 09:23 广东

相关推荐

泥给路哒油:真的不行了,以后趋势就是没有前后端职位之分了,我现在就是什么都干,有了ai就能干全栈,md年初目送一大堆同事毕业
点赞 评论 收藏
分享
03-20 15:48
吉林大学 Java
Q1: (2:09) 简单介绍一下你自己。Q2: (3:22) 解决长耗时阻塞是怎么样的一个场景?解决思路是什么?Q3: (5:36) 引入Redisson分布式锁的目的是为了解决重复上传的问题吗? 讲讲Q4: (6:22) 分片上传和断点续传是怎么实现的?Q5: (9:03) 项目中用过RocketMQ的哪些特性?Q6: (11:22) 线程池在项目里大概是怎么用的?有哪些核心参数?Q7: (12:06) 任务提交到线程池时,它的一个执行流程是怎么样的?Q8: (13:15) 线程池默认的阻塞队列有多长?Q9: (13:27) MySQL常用的引擎有哪些?Q10: (13:59) MySQL大概有哪些索引类型?Q11: (14:23) 什么是联合索引?你是怎么用的?Q12: (15:30) 在规避回表的情况下,真实写SQL时应该怎么写?Q13: (16:07) 简单聊一下什么是乐观锁?项目中如何解决支付回调并发问题?Q14: (18:27) 理解CAS中的ABA问题吗?如何规避这种情况?Q15: (19:55) 说一下SQL优化的大概流程。Q16: (24:14) 简单讲一下Spring的IOC和AOP。Q17: (26:46) 在Spring使用过程中会用到哪些Bean生命周期的接口?Q18: (27:23) 设计模式有没有了解过?Q19: (27:36) 目前在哪里?能接受来____实习吗?实习时长大概有多长?Q20: (29:33) 你有什么爱好?为什么喜欢听摇滚?反问。拷打过于基础,全程无压力。放空大脑,再多吟唱一遍八股,面试时间就会流过去十分之一罢。面经 我的找工作日记
查看20道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务