亿城 - 个人主页动态 - 牛客网

发布(1) 评论刷题收藏

昨天 10:14

北京化工大学 Java

阿里大模型应用开发凉经

1.自我介绍。2.你在做这个系统的时候，遇到了哪些问题？你是怎么解决的？（后续主线）当时回答了三个方向：文档上传、解析、切分、向量化链路太长，所以用 RabbitMQ 异步解耦；单纯向量检索对关键词、制度条款、专有名词召回不好，所以引入关键词检索和 RRF 融合；Agent 工具调用、ReAct 执行流程、记忆控制这些工程设计。3. 为什么要用 RabbitMQ，你为什么要把文档上传接口和后续处理链路解耦？4. 你说纯向量检索对一些关键词效果不好，所以引入了 Elasticsearch / 关键词检索，并用 RRF 做融合。你为什么要引入关键词检索？纯向量检索有什么问题？5. 你怎么证明加了关键词检索之后效果变好了？有没有指标？6. 向量检索和关键词检索召回的结果怎么合并？7. 你说用了 RRF为什么不直接给语义检索和关键词检索设置权重，然后加权融合？8. RRF 里的 K 值是多少？为什么用 60？调过吗？9. 你文档切分是怎么做的？10. 你设置的 chunk size 是多少？overlap 是多少？过大过小有什么问题，参数调过吗，效果怎么验证。11. 为什么是 800 / 200？依据是什么？（我回答的这个）12. 你了解 Graph RAG / Tree RAG 这类方法吗？13. Graph RAG 适合解决什么问题？14. 图怎么构建？15. GraphRAG的难点是什么？16. 你这个 ReAct 工具调用具体是怎么实现的？17. 模型怎么知道调用哪个工具？后端怎么执行？18. ReAct 的核心思想是什么？举一个例子说明19. 你了解 MCP 吗？它主要解决什么问题？MCP 解决的是模型侧的问题，还是使用方的问题？权限/鉴权怎么做？20. Agent 的记忆机制是怎么设计的？长期记忆怎么设计？用户新开窗口之后还能记住吗？21.如果进一步改进记忆机制，你会怎么改？你的思路是什么？22.图神经网络项目难负样本怎么做的？23.写了一个论文相关的，主要负责什么?核心内容是什么? 知识库怎么增强摘要？24.手撕快排序，撕完问了这是递归的实现，有没有非递归实现的思路？

查看24道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务