03-23 21:10 门头沟学院推荐算法

关注

百度搜索 Ai agent一面面没招了

攒人品中，祝大家都能拿到满意的Offer！
1.实习拷打
2.工业 PDF 解析中，复杂版面（多栏、表格、图文混排）如何做版面理解并还原结构？
3.OCR 结果有噪声或错误时，你是怎么做纠错或提升解析质量的？
4.多模态检索中，图像和文本向量不在同一空间时，如何实现对齐？
5.Agent 中长短期记忆如何设计？各自存什么，怎么触发读取？
6.多轮对话中，如果不同轮次的记忆发生冲突，你如何处理？
7.用户情绪异常（投诉、愤怒）时，Agent 如何在不中断主流程的情况下进行干预？
8.长文档为什么一定要切 chunk 再做向量化？不切会有什么问题？
9.chunk 切分时为什么要有重叠区域？比例一般怎么确定？
10.稠密向量和稀疏向量的区别是什么？各自适合什么场景？
11.是否做过关键词召回和向量召回的融合？具体怎么做的？
12.向量检索中 Top-K 设置过大或过小分别会带来什么问题？
13.余弦相似度和欧氏距离在高维空间中的差异是什么？实际怎么选？
14.为什么需要 rerank 模型？它解决了向量召回的哪些问题？
15.rerank 之后的截断策略是怎么设计的？为什么选这个 K 值？
16.文档发生局部更新时，如何做增量索引而不是全量重建？
17.RAG 中如果没有召回到相关知识，如何约束模型避免胡编？
18.HyDE 在 query 模糊时是如何提升召回效果的？
19.超长上下文模型出现后，RAG 架构的必要性是否会下降？

全部评论

推荐最新楼层

03-27 09:52

广西大学算法工程师

百度 AI Agent开发一面

1.多轮对话中，如果不同轮次的记忆发生冲突，你如何处理？这个问题本质上不是“删哪条、留哪条”，而是做记忆的版本管理。实际处理时一般会同时看三个维度：时间、来源、置信度。时间上通常新信息优先，但前提是它来自更可信的输入；来源上，用户当前轮明确表达、工具查询结果、系统写入，优先级通常高于模型从历史里自己总结出来的内容；置信度上，如果只是一次低置信抽取，不会直接覆盖长期稳定画像。工程上我会把记忆拆成两层，一层是 event log，完整保留用户每次表达过什么；另一层是 materialized profile，也就是给模型使用的当前画像。冲突发生时，不是直接物理覆盖，而是先记事件，再按规则刷新画像。...

百度一面1040人在聊

点赞评论收藏

分享

04-04 16:49

门头沟学院 Java

4.1 阿里国际-履约表达-ai应用一面

已挂 1.自我介绍2找一个大模型项目，技术选型，技术框架等介绍下3.bge向量化模型，看过其他模型吗，对比了吗回答的不好，没准备4.向量数据库milvus里面的ANN算法5.它和传统的算法的时间复杂度是怎么样的6.rag的切分策略是什么答得递归切分，三层策略7.LLM的提示词怎么设计的答得结合业务场景，意图识别，角色限定，模型选择，query改写，8.编写提示词有哪些经验，有参考的示例吗架构师，全站工程师，测试工程师，必须，禁止等关键词9.LLM怎么跟rag结合起来的，只听到意图识别检索测和生成侧都有10.查询结果通过精排，LLM结合输出，可以简单的这样理解吗11问答的过程，记忆是怎么实现的12.短期记忆的话涉及到多轮对话，怎么进行压缩，或者说有什么其他策略吗答得近期保留，远处的对话摘要，保持知道这样一个对话13.自我介绍的时候的时候，有做过模型的训练，基于哪个预训练模型YOLOV8，V1114.数据集是什么类型的数据集，准确度能达到多少，指标15.平常用哪些语言，mysql慢查询优化，索引优化策略16.mysql主键索引一定是连续的吗17.默认的情况设定的自增吗，连续吗18.三个线程同时写msqyl数据，第一个比如主键ID为1，第二个主键ID为2，同时向一个唯一索引的写数据，1写成功了，二失败了回滚；此时第三个线程往里面插数据，这个时候第三个线程的主键ID是三还是二呢不会19.kafka消息是怎么存储的，存储的组织结构，topic下面有很多持久化文件或者说现在输入一个id，kafka根据id怎么找到持久化的一个内容20java用的哪个版本，默认垃圾回收器是什么，G1是怎么做垃圾回收的吗可以详细讲下垃圾回收算法吗21项目里面redis除了做记忆存储还有哪些作用list set做存储，bitmap做文件上传标记22redis里面是单机，还是主从还是集群呢23.redis怎么保证高可用的不会24.集群或者是主从一个机器宕机的话，怎么故障回复的；或者说主从切换怎么做的之前有了解吗25.选主策略呢，哪个从节点优选为主节点反问ai业务，业务进度清明节前会更新吗，然后秒挂跨境电商，相关的策略相关的，推荐相关的，在做探索kafka redis高可用知识不系统，后面再看看

查看27道真题和解析

点赞评论收藏

分享

03-30 18:50

门头沟学院 Java

腾讯实习-agent开发一面-攒人品

给我面没招了，发点面经攒攒人品～1. 实习拷打2. 项目拷打3. 你的检索是否基于向量实现，搭建完整的 RAG 系统会涉及哪些核心部分？4. RAG 项目的文档上传和分块是怎么实现的？5. 向量检索召回的单次耗时是多久，有没有用到Rerank模型？6. 你如何评估检索召回内容与用户问题的匹配度，有没有做相关的效果评估？7. 你对 Agent 的理解是什么，它包含哪些核心模块？8. 是否了解 Agent 的设计范式，例如ReAct 范式？9. 你的 Agent 循环一般多少步可以完成任务，有没有出现过达到最大步数仍无法完成的情况？10. 你的 Agent 目前接入了哪些工具？11. 你是如何约定并约束大模型进行工具调用的？12. 你的项目推流是否使用 SSE？13. 你的 Agent 编排流程中有没有做 Plan 阶段？14. 从协议层面，介绍 SSE、WebSocket 与 HTTP 的区别和关联？15. 项目为什么限制每个用户只能上传单个文件？16. 项目的图像识别如何实现的，为什么不用多模态大模型，而选择传统的识别模型？17. 你的项目中用到了哪些大语言模型？18. 请介绍 Go 语言的并发和其他语言并发的区别？19. Goroutine 是什么，请介绍一下它的核心原理？20. 你对锁的理解是什么，锁是解决什么问题的？21. 日常开发中用哪种锁更多，还了解哪些后台开发常用的锁？22. 多机器、多进程场景下会涉及到哪些锁，是否了解分布式锁？23. 你对 MCP、Function Call、A2A 分别是怎么理解的？24. 你的项目接入了哪些 MCP 服务？有没有本地手写过 MCP 服务？25. 你日常开发会借助哪些 AI 工具？26. 使用这些工具的心得以及是否有写过相关的 command/skill？27. Claude Code 的实现原理？28. 是否了解OpenClaw以及了解它的实现原理？

LambertCla...：Claude Code实现原理都来了，难道是预测到了这波源码泄露

查看26道真题和解析

点赞评论收藏

分享

04-11 11:36

禅游科技_java后端开发(实习员工)

深圳禅游科技二面面经

时长45min，说一下拷打内容：1.简单介绍一下你这个项目的业务？2.你这个项目的架构是什么？3.这个项目你优化的点是什么？你怎么做到的4.Spring的原理，底层代码你了解哪些？说说你最了解的。5.简单介绍一下你的Rag项目？emmm...其他的忘了，总体上没有问什么八股难度，而且基本上45分钟全程都是我在输出，嗓子都哑了...。反问环节也是问了一下对我的感觉和期望，也是对我很认可，面完后10分钟通知已过，准备下周一的hr面，如果能过这家公司先去了，不能再等了，接下来边实习边学吧，这家我还是挺满意的

查看5道真题和解析

点赞评论收藏

分享

04-10 19:33

大连理工大学 Java

字节剪映 ai应用开发

攒人品！！！ 大家都要拿到暑期实习的offer啊！！！项目一：1. 你这里的意图判断是怎么做的？直接交给模型做，还是这个用户的查询query做了一些其他处理。2. 为什么要设计这三层记忆架构，是一个通用的设计还是参考了什么论文。3. Agent 的评估是怎么做的4. 有没有评估过你的记忆架构，在没参考openclaw之前和之后的指标有什么变化，成功率有对比吗？5. 你之前向量检索加redis缓存是怎么做的？ redis健和值是什么？6. 新的记忆加到文件里 是直接append吗？ 覆盖？还是改写？7. 改的方式 模型改吗？模型调用editor去改文件是吗？8. 你觉得 redis+milvus向量存储 和mysql+文件系统+向量检索，他们的优劣如何？优点缺点分别是什么。9. 其实我比较感兴趣的是他们这两种方式的查询检索召回 效率的对比。10. 对于每一个用户，在系统中怎么保存这些不同用户的文档？11. 其实就是模型通过路径去读这些文件是吧，那如果两个人登了同一个账号，在同一时刻，这个文件会被两个不同的用户使用，在这个情况下，你们的系统如何处理？怎么解决这个问题？项目二：1. 你说你的文档准确率达到90%，具体做的改变是什么。2. 那为什么医院的问答项目里，不采用同样的实现3. 你说pdf表格密集，那假如用户就是问一个表格里，第二行是2025年，第三行是2024年，具体问2025年的值是多少，你的系统能做到吗？4. skill是自己写的吗 ，互相之间可以联动吗？5. 为什么不用skill-creator6. 你的数据集是怎么收集的，然后是怎么评估的呢？打分是谁在打分？人在打分 ，还是模型裁判员去打分？如果有很好用的模型裁判员，为什么不用裁判员模型7. 介绍一下KV cache8. 讲一下transfromer架构。算法题1. 字符串数字相减2. 字符串最长连续序列

查看21道真题和解析

点赞评论收藏

分享

评论

1

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

88941次浏览 639人参与

# 简历当中有水分算不算造假？ #

176538次浏览 2330人参与

# 在爱玛，骑向未来 #

44859次浏览 437人参与

# 百度工作体验 #

332397次浏览 2254人参与

# 打工人的精神状态 #

154629次浏览 1552人参与

# 你收到了哪些公司的笔试？ #

69364次浏览 446人参与

# 你以为的实习VS真实的实习 #

142753次浏览 758人参与

# 备战春招/暑实，现在应该做什么？ #

70307次浏览 557人参与

# 距离春招还有一个月，你现在是什么开局？ #

62864次浏览 320人参与

# 职场新人体验 #

192891次浏览 1241人参与

# 银行笔面经互助 #

198574次浏览 1326人参与

# 工作后，你落下了哪些病根 #

42452次浏览 294人参与

# 应届生，你找到工作了吗 #

174216次浏览 900人参与

# 机械人，说说你的烦心事 #

148787次浏览 1165人参与

# 毕业季，给职场新人一些建议 #

221419次浏览 2603人参与

# 面试被问期望薪资时该如何回答 #

402708次浏览 2219人参与

# 你被哪些公司挂了？ #

198387次浏览 1077人参与

# 我们是不是被“优绩主义”绑架了？ #

49529次浏览 550人参与

# 你会为了工作牺牲生活吗？ #

81919次浏览 466人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

103583次浏览 707人参与

# 实习生工资多少才算正常？ #

76829次浏览 532人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务