百度AI Agent开发一面-日常实习

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.项目中实际 QPS、延迟、数据规模是多少?瓶颈在哪,怎么解决的?
3.讲一个你做过的技术选型,为什么选它?有没有更优方案?
4.设计一个支持多轮对话+工具调用的 Agent,整体架构怎么拆?
5.Prompt 如何设计才能降低 hallucination?有哪些工程手段?
6.多轮对话中上下文过长怎么处理?裁剪策略有哪些?
7.Agent 调多个工具时,如何做调度、重试和兜底?
8.function calling / tool calling 的实现原理是什么?
9.一条 query 在 RAG 系统中的完整链路是怎样的?
10.BM25 和向量召回各自优缺点?线上如何融合?
11.embedding 模型选型时要考虑哪些指标?
12.query rewrite / 多 query 扩展的原理是什么?有什么风险?
13.rerank 模型为什么必要?一般放在哪一层?
14.HNSW 的核心结构是什么?为什么查询效率高?
15.IVF、PQ、HNSW 的区别和适用场景?
16.向量索引如何支持高并发查询和在线更新?
17.embedding 维度过高会带来什么问题?如何优化?
18.文档 chunk 如何切分?长度和重叠怎么设计?
19.如何解决 chunk 切分带来的语义断裂问题?
20.知识库如何做增量更新并保证一致性?
21.多模态数据(图文/表格)如何统一建索引?
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 09:23 广东

相关推荐

昨天 13:35
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打3.你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过另一种方案?4.Agent 任务是怎么拆分的?拆分粒度是怎么决定的?5.上下文是怎么构建的?你们怎么避免上下文过长或者信息污染?6.如果上下文窗口不够,你优先保留哪些信息?为什么?7.你们做代码理解的时候,AST、调用关系这些信息是怎么用起来的?8.单测生成里,哪些代码其实不适合生成单测?你们是怎么识别并过滤的?9.覆盖率高但测试质量很差,这种情况你见过吗?你们是怎么解决的?10.mock在单测里什么时候是必须的?什么时候反而会带来问题?11.如果一个函数依赖数据库和RPC,你怎么让模型生成的单测还能稳定运行?12.你们怎么评估生成单测的质量?除了覆盖率,还有哪些指标?13.LLM的输入到底是什么?模型真正看到的是什么?14.self attention的核心作用是什么,为什么要拆成 QKV?为什么attention 可以建模长距离关系,15.为什么需要multi-head为什么 attention可以看成动态加权16.同一个 token的 Q、K、V 为什么不一样?17.attention复杂度很高,如果上下文特别长,你会怎么优化?18.模型产生幻觉的时候,一般是什么原因?工程上有什么办法降低19.Python有多线程吗?GIL 是干什么的?什么时候多线程是有用的?20.讲一下C++从源码到可执行文件的流程。21.手撕:给定数组的区间中位数之和:给定一个长度为n的数nums,一个区间 [l, r] 的 中位数 为:如果区间长度是奇数:排序后中间的数,如果是偶数:排序后靠左的那个数,要求:计算所有子数组的中位数之和
查看19道真题和解析
点赞 评论 收藏
分享
评论
2
8
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务