百度搜索 Ai agent一面 面没招了

攒人品中,祝大家都能拿到满意的Offer!
1.实习拷打
2.工业 PDF 解析中,复杂版面(多栏、表格、图文混排)如何做版面理解并还原结构?
3.OCR 结果有噪声或错误时,你是怎么做纠错或提升解析质量的?
4.多模态检索中,图像和文本向量不在同一空间时,如何实现对齐?
5.Agent 中长短期记忆如何设计?各自存什么,怎么触发读取?
6.多轮对话中,如果不同轮次的记忆发生冲突,你如何处理?
7.用户情绪异常(投诉、愤怒)时,Agent 如何在不中断主流程的情况下进行干预?
8.长文档为什么一定要切 chunk 再做向量化?不切会有什么问题?
9.chunk 切分时为什么要有重叠区域?比例一般怎么确定?
10.稠密向量和稀疏向量的区别是什么?各自适合什么场景?
11.是否做过关键词召回和向量召回的融合?具体怎么做的?
12.向量检索中 Top-K 设置过大或过小分别会带来什么问题?
13.余弦相似度和欧氏距离在高维空间中的差异是什么?实际怎么选?
14.为什么需要 rerank 模型?它解决了向量召回的哪些问题?
15.rerank 之后的截断策略是怎么设计的?为什么选这个 K 值?
16.文档发生局部更新时,如何做增量索引而不是全量重建?
17.RAG 中如果没有召回到相关知识,如何约束模型避免胡编?
18.HyDE 在 query 模糊时是如何提升召回效果的?
19.超长上下文模型出现后,RAG 架构的必要性是否会下降?
全部评论

相关推荐

03-25 17:03
门头沟学院 Java
点赞 评论 收藏
分享
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.项目中实际 QPS、延迟、数据规模是多少?瓶颈在哪,怎么解决的?3.讲一个你做过的技术选型,为什么选它?有没有更优方案?4.设计一个支持多轮对话+工具调用的 Agent,整体架构怎么拆?5.Prompt 如何设计才能降低 hallucination?有哪些工程手段?6.多轮对话中上下文过长怎么处理?裁剪策略有哪些?7.Agent 调多个工具时,如何做调度、重试和兜底?8.function calling / tool calling 的实现原理是什么?9.一条 query 在 RAG 系统中的完整链路是怎样的?10.BM25 和向量召回各自优缺点?线上如何融合?11.embedding 模型选型时要考虑哪些指标?12.query rewrite / 多 query 扩展的原理是什么?有什么风险?13.rerank 模型为什么必要?一般放在哪一层?14.HNSW 的核心结构是什么?为什么查询效率高?15.IVF、PQ、HNSW 的区别和适用场景?16.向量索引如何支持高并发查询和在线更新?17.embedding 维度过高会带来什么问题?如何优化?18.文档 chunk 如何切分?长度和重叠怎么设计?19.如何解决 chunk 切分带来的语义断裂问题?20.知识库如何做增量更新并保证一致性?21.多模态数据(图文/表格)如何统一建索引?
点赞 评论 收藏
分享
评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务