面试官:关于Rag,你了解多少?

1️⃣面试官:上面这个是 RAG 标准流程,实际项目中还有哪些优化技巧?
在实际中,召回源会考虑多路召回,例如稀疏召回,语义召回,字面召回等。对于多路召回截断和召回分数对齐的问题,还会采用在召回后面增加一个重排序的阶段,精简召回数并提升召回的质量。另外,其中的 embedding 模型,重排序模型,以及生成模型会根据系统问答的指标情况,会针对性的进行进一步的微调。
2️⃣面试官:那生成环节怎么评估效果?
首先是量化指标:例如 Rouge - L ,文本相似度,关键词重合度等指标。除了准确度,还可以评估生成答案的多样性,看看模型是否能够生成多种合理且相关的答案。还需要引入人类评估:进行人工评估,一般是负责改项目的产品经理和测试人员,以及内测的普通用户对模型的回答进行质量、准确性和连贯性的评分。
还应考虑资源效率:考虑模型的计算复杂性、内存需求和推理速度,尤其是在资源受限的环境中,看看 RAG 是否能够以合理硬件资源效果提供更好的性能。
3️⃣面试官: RAG 中为什么会出现幻觉?
幻觉问题是大模型的一个通病,出现幻觉问题主要分为两大类,一类是生成结果与数据源不一致,自相矛盾。另一类是用户问题超出了大模型的认知。针对前者可能是训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷和解码器策略错误可能导致幻觉。后者则是用户的问题不在语言模型认知范围内。
4️⃣面试官:针对幻觉的问题,有什么解决思路?第一个是引入更精准的知识库,消除虚假的数据源,减少数据偏差。另外可以加入一些纠偏规则,比如采用 ReAct 的思想,让大模型对输出的结果进行反思;还有现在比较流行的思路是集成知识图谱,即不再局限于向量数据库匹配,做召回时不仅考虑文档块,同时还考虑图谱的三元组。将知识图谱( KGs )集成到 RAG 中,通过利用知识图谱中结构化且相互关联的数据,可以增强当前 RAG 系统的推理能力。
5️⃣面试官:在实际做项目中,经常遇到各种边界的 case ,一般怎么解决?
首先是无效问题:如果对于知识库中没有的问题,我们需要做一个准入的判别,判断是否需要回答。
一般是一个二分类模型,或者直接用大模型+ prompt 来做,使模型在这种情况下输出一个预设的兜底话术。第二是减少幻觉:对于时间变化的问题,模型回答"我不知道"。在推理模块中添加规则和提示工程技术,使模在不确定时回答"根据当前的信息,不足以回答这个问题"。还有格式错误:模型可能会生成无法解析的答案,例如没有输出预定义格式。
全部评论
mark
点赞 回复 分享
发布于 08-15 00:33 北京
mark
点赞 回复 分享
发布于 10-15 16:19 浙江
mark
点赞 回复 分享
发布于 09-20 16:37 广东
mark
点赞 回复 分享
发布于 09-19 00:19 湖南
mark
点赞 回复 分享
发布于 09-18 22:41 上海

相关推荐

11-19 21:35
门头沟学院 Java
1. 为什么需要序列化和反序列化?它们的使用场景是什么?2. Java 实现序列化需要继承哪个接口?3. 给 serialVersionUID 赋值时通常采用什么形式?如果两个类的 UID 不一样会有什么影响?4. 如果子类增加了或修改了属性,serialVersionUID 需要变化吗?不变的话新字段会怎样?5. transient 关键字的作用是什么?被 transient 修饰的字段会怎样使用?6. 使用 new 创建对象时,JVM 会做哪些事情?7. 指针碰撞和空闲列表对应哪类垃圾回收器?哪些回收器用这两种方式分配内存?8. JDK 8 默认的垃圾回收器是哪个?9. 你提到的项目,是你从需求构思到落地全程负责,还是只参与了技术开发?10. 现成的项目技术栈、系统框架、数据库设计你是如何转化成落地技术方案的?过程中遇到过哪些难点?11. 系统需要哪些功能?数据库和框架怎么选型?12. 数据库设计了哪些模型?它们之间怎么关联?13. 交易表怎么设计的?交易状态有几种?已支付和已完成的区别是什么?14. 已支付如何流转到已完成?15. 已支付后若库存不足,状态会回滚成什么?16. 出票失败和已退款两个状态如何区分?它们之间能流转吗?17. 项目中使用 RAG 的具体过程?用它解决了什么问题?18. 用户投资风格在向量库里没有存储,你们如何给不同用户提供定制化回答?19. 用户登录时标签如何缓存到 Redis?问答时如何结合标签做向量化提取?20. 如果用户标签为“稳健型”但近期交易激进,你们会动态调整吗?21. 训练金融大模型时,用户行为数据打算从哪些方面采集?如何喂给模型?22. 除了交易行为,还有哪些数据可用来分析用户投资风格?23. 如何校验 AI 生成结果的准确性?24. 你刚才提到的技术已在项目里落地了吗?25. 对 AI 技术的学习思路是什么?通过哪些途径了解最新技术?26. 你经常使用哪些 AI 工具?
查看26道真题和解析
点赞 评论 收藏
分享
评论
4
38
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务