百度AI Agent开发一面-日常实习
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.项目中实际 QPS、延迟、数据规模是多少?瓶颈在哪,怎么解决的?
3.讲一个你做过的技术选型,为什么选它?有没有更优方案?
4.设计一个支持多轮对话+工具调用的 Agent,整体架构怎么拆?
5.Prompt 如何设计才能降低 hallucination?有哪些工程手段?
6.多轮对话中上下文过长怎么处理?裁剪策略有哪些?
7.Agent 调多个工具时,如何做调度、重试和兜底?
8.function calling / tool calling 的实现原理是什么?
9.一条 query 在 RAG 系统中的完整链路是怎样的?
10.BM25 和向量召回各自优缺点?线上如何融合?
11.embedding 模型选型时要考虑哪些指标?
12.query rewrite / 多 query 扩展的原理是什么?有什么风险?
13.rerank 模型为什么必要?一般放在哪一层?
14.HNSW 的核心结构是什么?为什么查询效率高?
15.IVF、PQ、HNSW 的区别和适用场景?
16.向量索引如何支持高并发查询和在线更新?
17.embedding 维度过高会带来什么问题?如何优化?
18.文档 chunk 如何切分?长度和重叠怎么设计?
19.如何解决 chunk 切分带来的语义断裂问题?
20.知识库如何做增量更新并保证一致性?
21.多模态数据(图文/表格)如何统一建索引?
1.项目拷打
2.项目中实际 QPS、延迟、数据规模是多少?瓶颈在哪,怎么解决的?
3.讲一个你做过的技术选型,为什么选它?有没有更优方案?
4.设计一个支持多轮对话+工具调用的 Agent,整体架构怎么拆?
5.Prompt 如何设计才能降低 hallucination?有哪些工程手段?
6.多轮对话中上下文过长怎么处理?裁剪策略有哪些?
7.Agent 调多个工具时,如何做调度、重试和兜底?
8.function calling / tool calling 的实现原理是什么?
9.一条 query 在 RAG 系统中的完整链路是怎样的?
10.BM25 和向量召回各自优缺点?线上如何融合?
11.embedding 模型选型时要考虑哪些指标?
12.query rewrite / 多 query 扩展的原理是什么?有什么风险?
13.rerank 模型为什么必要?一般放在哪一层?
14.HNSW 的核心结构是什么?为什么查询效率高?
15.IVF、PQ、HNSW 的区别和适用场景?
16.向量索引如何支持高并发查询和在线更新?
17.embedding 维度过高会带来什么问题?如何优化?
18.文档 chunk 如何切分?长度和重叠怎么设计?
19.如何解决 chunk 切分带来的语义断裂问题?
20.知识库如何做增量更新并保证一致性?
21.多模态数据(图文/表格)如何统一建索引?
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
相关推荐
点赞 评论 收藏
分享
查看5道真题和解析