不过最后是有个好结果啊,有offer,不错

相关推荐

头像
03-05 16:52
已编辑
北京邮电大学 Java
最近做了一个企业级 RAG 智能体项目 Ragent,基于 SpringBoot 技术栈 + 手搓 RAG,完整开源了。不是 Demo 级别的调 API 玩具,是覆盖了 RAG 全链路的工程实现,分享出来给大家参考。GitHub:https://github.com/nageoffer/ragent为什么做这个项目现在面试越来越多地问 AI 相关的东西——RAG 怎么做的?Agent 怎么实现?MCP 了解吗?但市面上大部分 RAG 教程要么是 Python 生态,要么停留在调 API 跑通 Demo 的阶段,离真正能上线的系统差距很大。所以基于自己在公司实际落地 RAG 系统的经验,做了 Ragent 这个项目,把企业里真正会遇到的问题都实现了一遍。核心能力▪ 多路检索引擎:意图定向 + 全局向量双通道并行,检索结果经去重、重排序等后处理流水线。▪ 意图识别:树形意图分类体系,置信度不足时主动引导澄清。▪ 问题重写与拆分:多轮对话自动补全上下文,复杂问题拆分为子问题分别检索。▪ 会话记忆:滑动窗口 + 自动摘要压缩,控制 Token 成本的同时保留关键上下文。▪ 模型路由与容错:多模型候选、优先级调度、首包探测、三态熔断器、自动降级。▪ MCP 工具调用:知识检索与外部系统调用在同一流程中无缝融合。▪ 文档入库 ETL:基于节点编排,从解析、分块、向量化到写入 Milvus,每步可配置、有日志。▪ 全链路追踪:每次对话的重写、意图、检索、生成各环节都有 Trace 记录。技术栈后端:Java 17、Spring Boot 3、MyBatis Plus、Milvus 2.6、Redis + Redisson、RocketMQ 5.x、Apache Tika、Sa-Token前端:React 18、TypeScript、Vite代码量:后端约 4w 行,前端约 1.8w 行,20 张业务表,22 个前端页面。和 Demo 项目的主要区别▪ 检索方式:Demo 通常是单路向量检索,Ragent 是多通道并行 + 后处理流水线。▪ 意图识别:Demo 没有,Ragent 做了树形意图 + 歧义引导。▪ 模型调用:Demo 单模型挂了就挂了,Ragent 多候选路由 + 熔断降级。▪ 会话记忆:Demo 全量塞给模型,Ragent 滑动窗口 + 摘要压缩。▪ 可观测性:Demo 没有,Ragent 全链路 Trace。项目会持续迭代,感兴趣的同学可以 clone 下来跑一跑,有问题欢迎提 Issue 交流。
勇敢的王老五最喜欢春...:我以为是营销号呢,进来看是特么的大佬
AI求职实录
点赞 评论 收藏
分享
02-27 08:25
门头沟学院 Java
给我面没招了,强度也太大了....1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术,除了减少参数量,它还有什么优点?你做的LoRA相关工作,后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?14.你用过LangChain吗?如何用它解决大模型的幻觉问题?若不熟悉LangChain,还能通过什么方法做AI能力增强?
查看12道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务