蚂蚁集团 智能体与大模型应用工程 电话面试 30min

  1. 自我介绍
  2. RAG 的流程
  3. RAG 的优势
  4. 怎么识别大模型的幻觉?减少大模型幻觉的措施有哪些?
  5. 用了 RAG 以后,大模型就一定不出幻觉了吗?怎么排查?
  6. 怎么确保 RAG 检索到的文档块一定是想要的?
  7. MCP 的概念
  8. 怎么写好提示词?
  9. 未来的升学规划?
  10. 反问
全部评论
实习岗嘛
点赞 回复 分享
发布于 05-02 11:41 广东

相关推荐

大二玩了半年RAG,我发现最靠谱的解法,居然是百年图书馆逻辑本人大二,接触Agent开发从RAG入门,摸过GraphRAG、RAGFlow这些热门项目,也啃过LlamaIndex、LangChain框架,踩了不少坑,也有了些不一样的想法,纯分享思路,不做落地。先说说我看到的核心问题:RAGFlow的溯源功能能标清信息出处,解决了模型胡编的问题,却缺了LangChain那样的隐私数据守卫——检索时只过滤正文,溯源链接还留着,等于给隐私泄露、外网信息跳转留了后门。同时现在的RAG大多是文档乱塞一锅炖,海量数据根本管不住,开源框架要么太笨重新手难维护,要么功能太简陋撑不起场景。想通这些的时候我正在学校图书馆,突然发现:我们卷破头的RAG问题,现代图书馆这套人类用了上百年的「信息管理系统」,早就完美解决了。核心思路完全对标图书馆逻辑,分三点:1. 先分级管控,从根源堵隐私漏洞像图书馆分普通阅览区、内部资料室、涉密档案室一样,给文档做分级。敏感内容直接拦在库外,内部文档没权限连检索都搜不到,自然不会有溯源链接泄露的问题,只有合规公开内容才开放完整溯源。2. 先分类入库,解决海量数据混乱图书馆新书不会直接堆书架,会先验收、查重、按标准分类标引再上架。对应到RAG里,就是文档先自动清洗、去重、分类打标,再分到独立向量库物理隔离,再多文档也井井有条,不会越用越臃肿。3. 统一规范做开源生态,解决「各玩各的」的痛点图书馆能跨馆互通,核心是有统一的编目规则。我们也可以定一套极简统一的开源RAG库规范,实现两个核心:一是人人都能按规范分享自己的RAG库,开箱即用不用二次处理;二是符合规范的任意两个RAG库,都能无缝拼接,自动对齐分类、去重、更新索引,不用手动改配置。现在RAG圈总在卷框架、卷算法,却忘了做RAG的初衷,是让普通人用最低成本让AI落地。这套图书馆逻辑的思路,不用高算力不堆复杂技术,刚好能让本地小模型配上标准化RAG库,真正变得可用。纯思路分享,不打算自己落地做项目,玩RAG的朋友有想法,欢迎一起交流。大模型  开源思路 #大学生编程
空想天使:有的兄弟有的,rag有这些技术,第一点叫做二级权限校验,在用户输入,调向量库之前,先去用户数据库找找有没有这用户,如果没有就挡住,第二部就是调知识库之前再去用户数据库核对一下,他的读库权限和检索库名是否对应,不对应也挡住。第二点叫做分库管理+元数据过滤。核心就是用户问2024或者指定v0.1版本的文档,那检索的时候就筛选对应的文档标签。第三点我还没听说过倒是,毕竟rag这玩意做出来的主要目的就是赋能企业的知识库,而企业知识库一般都是私有的,比较讲究私有化部署,有啥需要共享内容的直接调用web search得了
点赞 评论 收藏
分享
timeline二月1. 腾讯云架构  二面挂2. 字节云  二面过 后续转部门三月3. 字节广告  面了两次,不知道是一二面还是两部门一面4. 腾讯pcg  二面挂5. minimax aiinfra 一面面试官聊的很好,但技术栈不匹配(分布式共识和k8s)6. 百度 分布式计算 一面挂四月7. 腾讯 QQ浏览器ima  上午通知二面过 下午秒挂8. 滴滴 云平台 二面后泡池子9. 快手 可视化 一面挂10. 普联  一面后没通知11.  蚂蚁  Agent基础设施 二面后换部门三面 4.28oc 已体检等节后通知个人体验首先说一下就是我的技术、之前的bg和一些基本功非常一般,所以说最后拿到蚂蚁offer的话其实运气成分占很大一部分,当时接的时候也是和面试官已经hr说的不保研+只要发意向毕接然后一周内入职,所以感觉也挺顺利的。下面就是我自己对于各个公司的考察侧重、各个时间段的一些体验以及对于暑期实习的理解。(ps  个人感受其实都挺好的)我个人体感的话,刚开始的一个月,进二面或者横向是比较容易的,当时鹅厂和字节基本上如果比较match的话(我可能投的是云业务相关的消防方向),面试感觉是很不错的;但是横向的时候就感觉有很多人,这些大佬在面试以及bg上都很优秀,所以相对来说横向挂是普遍一点的。然后四月份其实大家都开了,这个时候我感觉面试挂的会比较多一些;当然,还有笔试,我笔试就过了一家,算法题实在太烂了(这部分如果将来准备暑期实习的uu真的可以提前来练)。然后公司的话,字节和鹅厂感觉面试和部门关系很大,如果遇到和自己垂类匹配到部门、加上竞争不大的话体感是很不错的。字节真的不要去海投别的业务,我投的搜广推,感觉他们对于redis这些都使用真的有点出神入化的意思。然后直观感受是鹅厂偏技术而且普遍涉及AI,字节对于业务深度的挖掘很厉害,能学到很多东西,不愧是宇宙厂。然后minimax的面试感觉真的很棒,像聊天一样,不过他们对于技术的匹配度可能会要求高一点;滴滴属于车轮面,体感不错,但是泡池子可能就一些;百度的话也是有点偏向于技术匹配度,个人感觉也还不错;快手的话技术和相关知识要求有点高,是我遇到强度很大的公司,仅次于字节;普联hc有点少了,不过面试问的不是很深,业务知识都问了;然后蚂蚁的面试官问的问题很发散,有一些考察个人知识广度和思考的意思在里面,很有意思。笔试的话多多很难、b站和团子还可以、携程记不清了感觉也有点难,然后鹰角、网易和米哈游这些如果不是游戏开发(比如我是写go的)投这个岗位的话基本上笔试完流程就结束了,不清楚是bg的原因还是单纯我太菜了。然后心态上,感觉有一些offer打扑克,也有像我这种一直挂的。个人感觉就是想去哪里再投哪里,适当保底就可以了,然后心态放松,每场面试不管体感如何都好好准备,这样方式是我觉得比较好的。经验教训就是大家算法题可以早做一些,祝大家都有理想的offer。
点赞 评论 收藏
分享
评论
1
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务