百度搜索 Ai agent一面 面没招了

攒人品中,祝大家都能拿到满意的Offer!
1.实习拷打
2.工业 PDF 解析中,复杂版面(多栏、表格、图文混排)如何做版面理解并还原结构?
3.OCR 结果有噪声或错误时,你是怎么做纠错或提升解析质量的?
4.多模态检索中,图像和文本向量不在同一空间时,如何实现对齐?
5.Agent 中长短期记忆如何设计?各自存什么,怎么触发读取?
6.多轮对话中,如果不同轮次的记忆发生冲突,你如何处理?
7.用户情绪异常(投诉、愤怒)时,Agent 如何在不中断主流程的情况下进行干预?
8.长文档为什么一定要切 chunk 再做向量化?不切会有什么问题?
9.chunk 切分时为什么要有重叠区域?比例一般怎么确定?
10.稠密向量和稀疏向量的区别是什么?各自适合什么场景?
11.是否做过关键词召回和向量召回的融合?具体怎么做的?
12.向量检索中 Top-K 设置过大或过小分别会带来什么问题?
13.余弦相似度和欧氏距离在高维空间中的差异是什么?实际怎么选?
14.为什么需要 rerank 模型?它解决了向量召回的哪些问题?
15.rerank 之后的截断策略是怎么设计的?为什么选这个 K 值?
16.文档发生局部更新时,如何做增量索引而不是全量重建?
17.RAG 中如果没有召回到相关知识,如何约束模型避免胡编?
18.HyDE 在 query 模糊时是如何提升召回效果的?
19.超长上下文模型出现后,RAG 架构的必要性是否会下降?
全部评论

相关推荐

04-04 16:49
门头沟学院 Java
已挂 1.自我介绍2找一个大模型项目,技术选型,技术框架等介绍下3.bge向量化模型,看过其他模型吗,对比了吗回答的不好,没准备4.向量数据库milvus里面的ANN算法5.它和传统的算法的时间复杂度是怎么样的6.rag的切分策略是什么答得递归切分,三层策略7.LLM的提示词怎么设计的答得结合业务场景,意图识别,角色限定,模型选择,query改写,8.编写提示词有哪些经验,有参考的示例吗架构师,全站工程师,测试工程师,必须,禁止等关键词9.LLM怎么跟rag结合起来的,只听到意图识别检索测和生成侧都有10.查询结果通过精排,LLM结合输出,可以简单的这样理解吗11问答的过程,记忆是怎么实现的12.短期记忆的话涉及到多轮对话,怎么进行压缩,或者说有什么其他策略吗答得近期保留,远处的对话摘要,保持知道这样一个对话13.自我介绍的时候的时候,有做过模型的训练,基于哪个预训练模型YOLOV8,V1114.数据集是什么类型的数据集,准确度能达到多少,指标15.平常用哪些语言,mysql慢查询优化,索引优化策略16.mysql主键索引一定是连续的吗17.默认的情况设定的自增吗,连续吗18.三个线程同时写msqyl数据,第一个比如主键ID为1,第二个主键ID为2,同时向一个唯一索引的写数据,1写成功了,二失败了回滚;此时第三个线程往里面插数据,这个时候第三个线程的主键ID是三还是二呢不会19.kafka消息是怎么存储的,存储的组织结构,topic下面有很多持久化文件或者说现在输入一个id,kafka根据id怎么找到持久化的一个内容20java用的哪个版本,默认垃圾回收器是什么,G1是怎么做垃圾回收的吗可以详细讲下垃圾回收算法吗21项目里面redis除了做记忆存储还有哪些作用list set做存储,bitmap做文件上传标记22redis里面是单机,还是主从还是集群呢23.redis怎么保证高可用的不会24.集群或者是主从一个机器宕机的话,怎么故障回复的;或者说主从切换怎么做的之前有了解吗25.选主策略呢,哪个从节点优选为主节点反问ai业务,业务进度清明节前会更新吗,然后秒挂跨境电商,相关的策略相关的,推荐相关的,在做探索kafka redis高可用知识不系统,后面再看看
查看27道真题和解析
点赞 评论 收藏
分享
03-30 18:50
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1. 实习拷打2. 项目拷打3. 你的检索是否基于向量实现,搭建完整的 RAG 系统会涉及哪些核心部分?4. RAG 项目的文档上传和分块是怎么实现的?5. 向量检索召回的单次耗时是多久,有没有用到Rerank模型?6. 你如何评估检索召回内容与用户问题的匹配度,有没有做相关的效果评估?7. 你对 Agent 的理解是什么,它包含哪些核心模块?8. 是否了解 Agent 的设计范式,例如ReAct 范式?9. 你的 Agent 循环一般多少步可以完成任务,有没有出现过达到最大步数仍无法完成的情况?10. 你的 Agent 目前接入了哪些工具?11. 你是如何约定并约束大模型进行工具调用的?12. 你的项目推流是否使用 SSE?13. 你的 Agent 编排流程中有没有做 Plan 阶段?14. 从协议层面,介绍 SSE、WebSocket 与 HTTP 的区别和关联?15. 项目为什么限制每个用户只能上传单个文件?16. 项目的图像识别如何实现的,为什么不用多模态大模型,而选择传统的识别模型?17. 你的项目中用到了哪些大语言模型?18. 请介绍 Go 语言的并发和其他语言并发的区别?19. Goroutine 是什么,请介绍一下它的核心原理?20. 你对锁的理解是什么,锁是解决什么问题的?21. 日常开发中用哪种锁更多,还了解哪些后台开发常用的锁?22. 多机器、多进程场景下会涉及到哪些锁,是否了解分布式锁?23. 你对 MCP、Function Call、A2A 分别是怎么理解的?24. 你的项目接入了哪些 MCP 服务?有没有本地手写过 MCP 服务?25. 你日常开发会借助哪些 AI 工具?26. 使用这些工具的心得以及是否有写过相关的 command/skill?27. Claude Code 的实现原理?28. 是否了解OpenClaw以及了解它的实现原理?
LambertCla...:Claude Code实现原理都来了,难道是预测到了这波源码泄露
查看26道真题和解析
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务