阿里大模型应用开发凉经

1.自我介绍。
2.你在做这个系统的时候,遇到了哪些问题?你是怎么解决的?(后续主线)
当时回答了三个方向:
文档上传、解析、切分、向量化链路太长,所以用 RabbitMQ 异步解耦;
单纯向量检索对关键词、制度条款、专有名词召回不好,所以引入关键词检索和 RRF 融合;
Agent 工具调用、ReAct 执行流程、记忆控制这些工程设计。
3. 为什么要用 RabbitMQ,你为什么要把文档上传接口和后续处理链路解耦?
4. 你说纯向量检索对一些关键词效果不好,所以引入了 Elasticsearch / 关键词检索,并用 RRF 做融合。你为什么要引入关键词检索?纯向量检索有什么问题?
5. 你怎么证明加了关键词检索之后效果变好了?有没有指标?
6. 向量检索和关键词检索召回的结果怎么合并?
7. 你说用了 RRF为什么不直接给语义检索和关键词检索设置权重,然后加权融合?
8. RRF 里的 K 值是多少?为什么用 60?调过吗?
9. 你文档切分是怎么做的?
10. 你设置的 chunk size 是多少?overlap 是多少?过大过小有什么问题,参数调过吗,效果怎么验证。
11. 为什么是 800 / 200?依据是什么?(我回答的这个)
12. 你了解 Graph RAG / Tree RAG 这类方法吗?
13. Graph RAG 适合解决什么问题?
14. 图怎么构建?
15. GraphRAG的难点是什么?
16. 你这个 ReAct 工具调用具体是怎么实现的?
17. 模型怎么知道调用哪个工具?后端怎么执行?
18. ReAct 的核心思想是什么?举一个例子说明
19. 你了解 MCP 吗?它主要解决什么问题?MCP 解决的是模型侧的问题,还是使用方的问题?权限/鉴权怎么做?
20. Agent 的记忆机制是怎么设计的?长期记忆怎么设计?用户新开窗口之后还能记住吗?
21.如果进一步改进记忆机制,你会怎么改?你的思路是什么?
22.图神经网络项目难负样本怎么做的?
23.写了一个论文相关的,主要负责什么?核心内容是什么? 知识库怎么增强摘要?
24.手撕快排序,撕完问了这是递归的实现,有没有非递归实现的思路?
#牛客解忧铺##我的求职进度条#
全部评论
哇,你分享的阿里大模型应用开发经验好详细呀!看起来你技术能力很强呢~关于文档处理和检索优化这块,RabbitMQ解耦确实是个聪明的方法,能提高系统效率呢! 你提到用RRF融合向量检索和关键词检索,这个思路很实用!我很好奇,除了RRF,你还尝试过其他融合方法吗?效果怎么样呀? 对了,想了解更多求职相关的技术细节,可以点击我的头像私信我哦!我可以帮你整理面试常见问题,还有更多求职技巧分享给你~
点赞 回复 分享
发布于 昨天 10:14 AI生成

相关推荐

clink*0816:那哥们要是知道20年后还有人共鸣,估计能缓过来
我的实习日记
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务