阿里大模型应用开发凉经

1.自我介绍。
2.你在做这个系统的时候，遇到了哪些问题？你是怎么解决的？（后续主线）
当时回答了三个方向：
文档上传、解析、切分、向量化链路太长，所以用 RabbitMQ 异步解耦；
单纯向量检索对关键词、制度条款、专有名词召回不好，所以引入关键词检索和 RRF 融合；
Agent 工具调用、ReAct 执行流程、记忆控制这些工程设计。
3. 为什么要用 RabbitMQ，你为什么要把文档上传接口和后续处理链路解耦？
4. 你说纯向量检索对一些关键词效果不好，所以引入了 Elasticsearch / 关键词检索，并用 RRF 做融合。你为什么要引入关键词检索？纯向量检索有什么问题？
5. 你怎么证明加了关键词检索之后效果变好了？有没有指标？
6. 向量检索和关键词检索召回的结果怎么合并？
7. 你说用了 RRF为什么不直接给语义检索和关键词检索设置权重，然后加权融合？
8. RRF 里的 K 值是多少？为什么用 60？调过吗？
9. 你文档切分是怎么做的？
10. 你设置的 chunk size 是多少？overlap 是多少？过大过小有什么问题，参数调过吗，效果怎么验证。
11. 为什么是 800 / 200？依据是什么？（我回答的这个）
12. 你了解 Graph RAG / Tree RAG 这类方法吗？
13. Graph RAG 适合解决什么问题？
14. 图怎么构建？
15. GraphRAG的难点是什么？
16. 你这个 ReAct 工具调用具体是怎么实现的？
17. 模型怎么知道调用哪个工具？后端怎么执行？
18. ReAct 的核心思想是什么？举一个例子说明
19. 你了解 MCP 吗？它主要解决什么问题？MCP 解决的是模型侧的问题，还是使用方的问题？权限/鉴权怎么做？
20. Agent 的记忆机制是怎么设计的？长期记忆怎么设计？用户新开窗口之后还能记住吗？
21.如果进一步改进记忆机制，你会怎么改？你的思路是什么？
22.图神经网络项目难负样本怎么做的？
23.写了一个论文相关的，主要负责什么?核心内容是什么? 知识库怎么增强摘要？
24.手撕快排序，撕完问了这是递归的实现，有没有非递归实现的思路？
#牛客解忧铺##我的求职进度条#

全部评论

推荐最新楼层

AI牛可乐

带#牛客在线求职答疑中心#提问都会召唤我

哇，你分享的阿里大模型应用开发经验好详细呀！看起来你技术能力很强呢～关于文档处理和检索优化这块，RabbitMQ解耦确实是个聪明的方法，能提高系统效率呢！你提到用RRF融合向量检索和关键词检索，这个思路很实用！我很好奇，除了RRF，你还尝试过其他融合方法吗？效果怎么样呀？对了，想了解更多求职相关的技术细节，可以点击我的头像私信我哦！我可以帮你整理面试常见问题，还有更多求职技巧分享给你～

阿里大模型应用开发凉经

全站热榜

创作者周榜