简历上的AI项目,面试官到底想看什么?

#AI项目实战#  #AI求职实录# 最近做了一个企业级 RAG 智能体项目 Ragent,基于 SpringBoot 技术栈 + 手搓 RAG,完整开源了。不是 Demo 级别的调 API 玩具,是覆盖了 RAG 全链路的工程实现,分享出来给大家参考。

GitHub:https://github.com/nageoffer/ragent

为什么做这个项目

现在面试越来越多地问 AI 相关的东西——RAG 怎么做的?Agent 怎么实现?MCP 了解吗?但市面上大部分 RAG 教程要么是 Python 生态,要么停留在调 API 跑通 Demo 的阶段,离真正能上线的系统差距很大。

所以基于自己在公司实际落地 RAG 系统的经验,做了 Ragent 这个项目,把企业里真正会遇到的问题都实现了一遍。

核心能力

▪ 多路检索引擎:意图定向 + 全局向量双通道并行,检索结果经去重、重排序等后处理流水线。
▪ 意图识别:树形意图分类体系,置信度不足时主动引导澄清。
▪ 问题重写与拆分:多轮对话自动补全上下文,复杂问题拆分为子问题分别检索。
▪ 会话记忆:滑动窗口 + 自动摘要压缩,控制 Token 成本的同时保留关键上下文。
▪ 模型路由与容错:多模型候选、优先级调度、首包探测、三态熔断器、自动降级。
▪ MCP 工具调用:知识检索与外部系统调用在同一流程中无缝融合。
▪ 文档入库 ETL:基于节点编排,从解析、分块、向量化到写入 Milvus,每步可配置、有日志。
▪ 全链路追踪:每次对话的重写、意图、检索、生成各环节都有 Trace 记录。

技术栈

后端:Java 17、Spring Boot 3、MyBatis Plus、Milvus 2.6、Redis + Redisson、RocketMQ 5.x、Apache Tika、Sa-Token
前端:React 18、TypeScript、Vite

代码量:后端约 4w 行,前端约 1.8w 行,20 张业务表,22 个前端页面。

和 Demo 项目的主要区别

▪ 检索方式:Demo 通常是单路向量检索,Ragent 是多通道并行 + 后处理流水线。
▪ 意图识别:Demo 没有,Ragent 做了树形意图 + 歧义引导。
▪ 模型调用:Demo 单模型挂了就挂了,Ragent 多候选路由 + 熔断降级。
▪ 会话记忆:Demo 全量塞给模型,Ragent 滑动窗口 + 摘要压缩。
▪ 可观测性:Demo 没有,Ragent 全链路 Trace。

项目会持续迭代,感兴趣的同学可以 clone 下来跑一跑,有问题欢迎提 Issue 交流。#项目实战#
全部评论
建议你面试的时候不要叫企业级随便问问用户量、产品竞争力、稳定性咋办,项目做了整条链路很不错的,别因为强调企业级搬起石头砸了自己的脚,可以强调做的内容;代码量也不要向面试官强调,放在前几年手搓代码的时候6万行代码还能拿出来打一打,可以强调用AI coding做了全栈开发之类的
27 回复 分享
发布于 03-06 15:14 浙江
我以为是营销号呢,进来看是特么的大佬
23 回复 分享
发布于 03-05 17:15 山东
牛友们觉得不错点个 Star 哈
12 回复 分享
发布于 03-06 08:42 浙江
Ragent 多候选路由都想到了,这一看是自己用多了的经验哈哈
9 回复 分享
发布于 03-05 17:12 山东
大佬,请问该怎么入手学习该项目呢
5 回复 分享
发布于 03-05 20:32 安徽
ai只是一个加分项,不是必须
3 回复 分享
发布于 03-05 18:58 北京
哇,感谢大佬的分享!很有价值诶!我私信你了~
3 回复 分享
发布于 03-05 14:18 北京
关键词:手搓RAG
2 回复 分享
发布于 03-05 17:11 山西
大家可以看看我新写的文章:6 个 AI 实战小技巧,帮你在简历+面试中拉开差距~全程干货
1 回复 分享
发布于 03-16 12:07 浙江
AI项目最终还是看落地。
1 回复 分享
发布于 03-06 23:17 河北
大佬
1 回复 分享
发布于 03-06 22:48 河南
刚去看了下,我只能说牛客竟然有这种大佬发帖了
1 回复 分享
发布于 03-05 17:10 北京
同学拼多多【暑假实习/春招】机会考虑吗?链接见主页,团队氛围好,工作内容挑战性强,转正薪资待遇极具竞争力。可一对一帮查进度,解答过程问题。27实习:https://careers.pddglobalhr.com/campus/intern/detail?t=dcsvrwtijZ
点赞 回复 分享
发布于 04-15 11:07 上海
大佬 请问有视频讲解吗 更新完了吗
点赞 回复 分享
发布于 04-04 21:06 辽宁
淘天阿里巴巴实习欢迎投递,ai研发、算法hc都有:https://www.nowcoder.com/feed/main/detail/b882dddd14ae4236aa18adce1dcc5915?sourceSSR=users
点赞 回复 分享
发布于 03-23 11:15 浙江
请问如何学习这个项目呢
点赞 回复 分享
发布于 03-22 10:12 江苏
淘天核心部门ai应用暑期实习,hc多多,速速来勾搭
点赞 回复 分享
发布于 03-17 21:22 浙江
查个队, 淘天基础平台暑期实习招聘啦有意私
点赞 回复 分享
发布于 03-17 12:13 浙江
项目看着还是可以的
点赞 回复 分享
发布于 03-11 17:50 湖南
大佬
点赞 回复 分享
发布于 03-08 18:06 江苏

相关推荐

04-11 17:34
已编辑
重庆大学 Java
面试时间:3.30上午11点面试时长:1h5min部门:到家的搜索工程组?(没听清)自我介绍1、完整讲一下你的 RAG 项目(离线 + 在线 + 架构)2、重叠大小分块是自己做的吗?还是用的什么工具?3、向量化用的模型是什么,还记得吗?然后这个模型是你自己部署的吗?还是调的LLM接口?4、专门做过什么策略来提升召回率和准确率?如何评测召回率和准确率,有没有做过数字化的评估?5、如果说你的 embedding 质量比较高的话,那这个评测确实没有问题,但如果说就是向量化的效果没那么好的话,那这个方案好像也并不是很行得通,因为它可能生成向量的时候就会有问题,这个有考虑过吗?然后你有没有想办法去……(接着面试官说,算了不问了)6、关键字检索是怎么做的?7、你可以说一下在线的部分,就是用户从一个请求,到它最终拿到结果的一个过程?8、你刚才说意图节点,也就是意图识别的时候去识别它关联的那个叶子节点,我想问一下你这块是怎么实现的?9、你刚才说首先有多路召回,多路检索,然后每一路检索里面会有一个粗排,然后这些结果拿到之后可能还会有一个细排。然后想问一下你这两个排序大概都是怎么做的?然后如果是用模型排的话,你这分别是用什么模型?然后你知道这些模型的检索排序的原理吗?10、重排序用的什么模型?11、你可以再总结一下,就是从你这个离线到在线的过程中有多少次和大模型的交互吗?分别简述一下。12、我看你这个里面会有那个模型的,多模型的降级策略和熔断机制,你可以简单说一下,你现在是有哪几个模型之间可以降级?然后以及是怎么实现的?13、你这个降级是手动降级吗?还是自动降级?14、那这个自动降级是怎么感知的?比如说从模型里是刚才三个状态,它们三个状态之间流转是什么样子的?就什么情况下就把它变为异常了?然后什么情况下会让它自动恢复正常?还是就是怎么做的这块?15、看你这个里面还支持了那个 MCP 的工具调用,然后你可以说一下你现在支持哪些那个MCP,然后以及这些 MCP 是怎么和模型交互,然后大概的实现原理吗?(这一部分不太会,就扯到MCP与function calling的区别了)16、那function calling的话是怎么调呢?是 RPC调还是HTTP调?还是怎么调用的?17、看你这边那个会话,大概是怎么存储的?可以说一下吗?18、然后就是你这个会话就是大概是一个什么样的存储结构呢?可以说一下这个 MySQL表的存储的结构,就是哪几个关键字段?19、就比如说一个用户可能在一个会话里面和模型会有多轮的这种对话。就比如说问了一个问题,模型回答一次,然后我再问一个问题,他再回答一次,再问,再回答。这样的结构在数据库里面是怎么存的?是一条还是多条?20、然后就是你这个 message 表大概是一个什么结构?就是有哪几个关键字段?21、看你这个里面用到了那个Redis,然后你可以解释一下那个 Redis 的缓存穿透、缓存击穿以及缓存雪崩吗?以及具体解决思路?22、然后那个布隆过滤器,你可以说一下布隆过滤器的实现原理吗?算法题:合并区间23、然后我们谈一下,就是之前就是那个AI coding的那个面试题,然后你可以简单说一下你这边实现的思路吗?(这个是美团面试前发的AI Coding的题目,让设计一个限流中间件)24、我再问一下,就是你认为它的这个Lua脚本能满足那个需求吗?(要求同一个用户60秒内只能发送60个请求)这里面试官理解的是滑动的时间窗口,但是我实现的是固定的时间窗口,题目中只说了“时间窗口”,然后面试官就说你这个实现好像也没有问题。反问1、业务2、具体工作3、建议做项目其实可以更深入一点,而不是说只是作为一个 API 的调用方,就比如说这些模型,因为其实我们日常就是也会和这些模型交互之类的,你除了知道调它这个API,你可能需要更多的去了解一下,就是我为什么要这么设计,然后以及我这个模型具体能做什么东西,它大概是怎么实现的,有了这些可能对你未来会更有帮助,然后职业生涯可能更具有那个什么。(录音没录到,估计是想表达“更具有竞争力”这个意思吧)感受:面试官问的很细,能感觉出来面试官真的很专业,但是自己对于大模型相关底层原理的理解显然不够深入,MCP具体的工具调用也没来得及研究,属于半吊子水平也是第一次拿RAG项目来面试,这个面试官真的让我学到了很多,也让我知道了自己诸多的不足以及还需要提升的地方。整体面试体验感很好,面试官也不会特意刁难,我表达的很含糊的地方或者不会的地方,就是一句“行”帮我带过,感谢面试官现在还没消息,大概率是寄了,下去好好沉淀了二编:4.1晚上6点约二面。
查看26道真题和解析
点赞 评论 收藏
分享
评论
249
936
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务