阿里国际暑期实习Agent一面分享 1h

继续来分享下最近的面经~欢迎友好讨论，信息共享
1. 实习拷打
2. 项目询问，没到拷打级别
3. 因为是做agent，所以问了一些agent问题

3.1 说一下 React范式，执行这一步包括什么
3.2 multi agent和single agent的区别，优缺点，适用场景
3.3 Claude code是multi agent还是single agent
3.4 Claude code如何解决上下文爆炸问题
3.5 说说skill
3.6 skill有很多，描述很长，导致上下文爆炸怎么办

4. 手撕题—求岛屿数量，邮箱发题，需要共享屏幕

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

04-30 17:45

不愧是字节，问的好难啊🤯

本人简历上 1 个 RAG 项目 + 1 个 Agent demo；这次面的是AI岗一面前我以为：背完八股 + 把项目讲清楚，应该能稳过。0-5 min：自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的，痛点是大模型不懂行业术语。5-20 min：项目深挖（开始崩）- Q1：你的法律文档总共多少？切了多少个 chunk？- 我：约 500 份 PDF，5 万个 chunk- Q2：500 份 PDF 加起来才 5 万 chunk？平均每份 100 个 chunk，你切片粒度是多少？- 我：512 token- Q3：法律文档里"第三条第二款"和"第三条之二"是不同含义，你的切片会不会把它切散？- 我：（沉默 5 秒）……应该会- Q4：那你怎么解决？- 我：我可以加一个 metadata……（开始编）❌ 第一次崩：切片粒度没考虑业务语义。20-35 min：评测体系（继续崩）- Q：你怎么知道你的 RAG 有效？- 我：我用 Recall@5……- Q：评测集多少条？怎么构造的？- 我：100 条，我手工标注的- Q：100 条够吗？分布怎么样？- 我：分布……我没分- Q：那你的 Recall@5 是 0.81，你怎么知道这个数字是好是坏？baseline 是什么？- 我：（沉默 10 秒）❌ 第二次崩：没有 baseline，没分布分析，纯靠"看起来还行"。35-55 min：Agent 部分（彻底崩）- Q：你的 Agent demo 用了几个工具？- 我：3 个，搜索、计算器、文档查询- Q：当用户问一个问题，你的 Agent 怎么决定调哪个工具？- 我：用 ReAct，让模型自己决定- Q：模型决策错了怎么办？- 我：我加了个 reflection……- Q：reflection 失败 3 次后怎么处理？- 我：（沉默 15 秒）……我没想过❌ 第三次崩：异常路径完全没设计。55-65 min：业务理解 + 反问- Q：你觉得字节做 AI 应用最大的瓶颈是什么？- 我：算力？数据？- Q：你看过哪些字节最近发的 AI 产品？- 我：豆包、扣子……- Q：扣子是 Agent 平台还是工作流平台？- 我：（再次沉默）❌ 第四次崩：对面试公司业务一无所知。

面试官拷打AI项目都会问...

点赞评论收藏

05-03 18:43

哈尔滨工业大学后端工程师

京东物流java一面面经

项目挑一个讲？这个项目里大部分是大模型，工程上的有讲一下吗？有用到 Agent 吗？Agent 和传统大模型有什么区别？工作记忆了解吗？向量数据库和传统数据库区别是什么？从模型上查询索引结构上、事务上的区别呢？你提到的给 A 推荐的喜好是怎么做的？你的项目如果对标京东、阿里的话，有没有了解到现在成熟的方案？比方说对你的身高体重、用户画像等这类长期记忆的应用。大模型使用向量数据库的诉求是什么？什么场景用向量数据库？向量数据库在 AI 里的核心作用在哪？向量数据库开源的有哪些？ 在毕设过程中，有哪些方案是做过技术调研的？做过压测吗？2000 QPS 的瓶颈在哪里？怎么优化？压测的时候什么指标达到了...

点赞评论收藏

05-03 05:25

门头沟学院算法工程师

阿里云暑期实习Agent面经分享

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 实习拷打2. 项目拷打2.1 现在复盘一下，有哪些可以优化改进的点2.2 问知识图谱构建和维护怎么做，困难点有什么？3. 场景题3.1 问到了他们正在做的场景3.2 文档撰写的速度可能跟不上产品迭代的速度，怎么搭建agent来解决这个问题？4. 对agent的了解，context engineering和现在的harness engineering 的区别，平时用小龙虾来做什么，claude code怎么做记忆管理，做梦机制是什么？没有手撕

点赞评论收藏

昨天 15:50

华为_系统工程师

【面试真题】百度 Agent 面经

面完之后：按记忆把题串起来说 手里那份问题清单，是好几场面谈里碎片问题的合集。 单独看每一条都像八股，串在一起你会发现面试官的注意力一直在两条线上晃：一条是「这东西在线上会不会出事」，一条是「你知不知道自己在用什么、没用上什么」。 下面按我自己后来复盘时觉得顺的思路写——从项目怎么讲，一路滑到 LangGraph、记忆、agent 形态、工具协议、RAG，最后落到后端那几道「看起来基础、其实能问穿」的题。 你如果对某一块熟，可以快速扫小标题跳读。 从项目讲起：先别急着报框架名 几乎所有 agent 岗都会从项目开刀。我踩过的坑是开场三十秒就把 LangGraph、LangChain、某某向量库...

Ai Agent：面试3...

点赞评论收藏

04-28 10:00

燕山大学人工智能

rag已经死了吗？

大二玩了半年RAG，我发现最靠谱的解法，居然是百年图书馆逻辑本人大二，接触Agent开发从RAG入门，摸过GraphRAG、RAGFlow这些热门项目，也啃过LlamaIndex、LangChain框架，踩了不少坑，也有了些不一样的想法，纯分享思路，不做落地。先说说我看到的核心问题：RAGFlow的溯源功能能标清信息出处，解决了模型胡编的问题，却缺了LangChain那样的隐私数据守卫——检索时只过滤正文，溯源链接还留着，等于给隐私泄露、外网信息跳转留了后门。同时现在的RAG大多是文档乱塞一锅炖，海量数据根本管不住，开源框架要么太笨重新手难维护，要么功能太简陋撑不起场景。想通这些的时候我正在学校图书馆，突然发现：我们卷破头的RAG问题，现代图书馆这套人类用了上百年的「信息管理系统」，早就完美解决了。核心思路完全对标图书馆逻辑，分三点：1. 先分级管控，从根源堵隐私漏洞像图书馆分普通阅览区、内部资料室、涉密档案室一样，给文档做分级。敏感内容直接拦在库外，内部文档没权限连检索都搜不到，自然不会有溯源链接泄露的问题，只有合规公开内容才开放完整溯源。2. 先分类入库，解决海量数据混乱图书馆新书不会直接堆书架，会先验收、查重、按标准分类标引再上架。对应到RAG里，就是文档先自动清洗、去重、分类打标，再分到独立向量库物理隔离，再多文档也井井有条，不会越用越臃肿。3. 统一规范做开源生态，解决「各玩各的」的痛点图书馆能跨馆互通，核心是有统一的编目规则。我们也可以定一套极简统一的开源RAG库规范，实现两个核心：一是人人都能按规范分享自己的RAG库，开箱即用不用二次处理；二是符合规范的任意两个RAG库，都能无缝拼接，自动对齐分类、去重、更新索引，不用手动改配置。现在RAG圈总在卷框架、卷算法，却忘了做RAG的初衷，是让普通人用最低成本让AI落地。这套图书馆逻辑的思路，不用高算力不堆复杂技术，刚好能让本地小模型配上标准化RAG库，真正变得可用。纯思路分享，不打算自己落地做项目，玩RAG的朋友有想法，欢迎一起交流。大模型  开源思路 #大学生编程

空想天使：有的兄弟有的，rag有这些技术，第一点叫做二级权限校验，在用户输入，调向量库之前，先去用户数据库找找有没有这用户，如果没有就挡住，第二部就是调知识库之前再去用户数据库核对一下，他的读库权限和检索库名是否对应，不对应也挡住。第二点叫做分库管理+元数据过滤。核心就是用户问2024或者指定v0.1版本的文档，那检索的时候就筛选对应的文档标签。第三点我还没听说过倒是，毕竟rag这玩意做出来的主要目的就是赋能企业的知识库，而企业知识库一般都是私有的，比较讲究私有化部署，有啥需要共享内容的直接调用web search得了

点赞评论收藏