百度AI Agent开发一面-日常实习

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.项目中实际 QPS、延迟、数据规模是多少?瓶颈在哪,怎么解决的?
3.讲一个你做过的技术选型,为什么选它?有没有更优方案?
4.设计一个支持多轮对话+工具调用的 Agent,整体架构怎么拆?
5.Prompt 如何设计才能降低 hallucination?有哪些工程手段?
6.多轮对话中上下文过长怎么处理?裁剪策略有哪些?
7.Agent 调多个工具时,如何做调度、重试和兜底?
8.function calling / tool calling 的实现原理是什么?
9.一条 query 在 RAG 系统中的完整链路是怎样的?
10.BM25 和向量召回各自优缺点?线上如何融合?
11.embedding 模型选型时要考虑哪些指标?
12.query rewrite / 多 query 扩展的原理是什么?有什么风险?
13.rerank 模型为什么必要?一般放在哪一层?
14.HNSW 的核心结构是什么?为什么查询效率高?
15.IVF、PQ、HNSW 的区别和适用场景?
16.向量索引如何支持高并发查询和在线更新?
17.embedding 维度过高会带来什么问题?如何优化?
18.文档 chunk 如何切分?长度和重叠怎么设计?
19.如何解决 chunk 切分带来的语义断裂问题?
20.知识库如何做增量更新并保证一致性?
21.多模态数据(图文/表格)如何统一建索引?
全部评论

相关推荐

04-24 17:20
门头沟学院 Java
发一下问题给大家参考,攒攒人品!1.实习拷打2.拷打第一个项目:如果长表格被切分到了两个不同的Chunk,如何保证大模型在回答时不丢失表头信息?为什么不直接把图片转成描述再做文本检索,而是做视觉Embedding?有什么好处?3.拷打第二个项目:你是如何设定记忆总结的触发条件的?是根据对话轮数总结,还是根据Token消耗量来总结?如果测评量表返回的数据量非常大,超过了模型窗口,在不丢失核心指标的前提下,如何对工具结果进行预压缩?4.为什么在做RAG时,切片不能切得太长,也不能切得太短?5.什么是混合检索?为什么一些场景下,只用向量检索效果不好?6.如何在Prompt中设计拒答逻辑,让模型在知识库没有相关内容时,不强行生成答案?7.什么是CoT?它在提升Agent逻辑推理能力方面的原理是什么?8.在Function Call的过程中,大模型返回给后端的是真实运行的结果,还是调用的意图?9.拷打Transformer10.了解MySQL吗?在MySQL中,如果要存储用户的对话记录,你会选择哪种字段类型?为什么?11.Redis有哪些常见的数据结构?12.为什么在大模型应用中,会把一些重复的问题和答案存入Redis缓存?13.介绍一下如何利用Redis存储大模型的响应结果?14.如果两个用户的提问意思一样但表达不同,如何判断该不该命中Redis里的缓存?15.在分布式Agent环境下,用户的Session应该存放在哪里?16.手撕:无重复字符最长子串
查看16道真题和解析
点赞 评论 收藏
分享
评论
3
18
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务