1️⃣数据准备很多人上来就想着搭 Milvus 或 FAISS ,但根本没搞清楚自己要检索的是什么。RAG 的灵魂在知识库。而知识库的质量,取决于数据处理的精细程度。2️⃣检索召回很多人以为用个 embedding 模型就完事了。但 embedding 模型之间差距极大。在实际项目中,我们踩过很多坑:同样一份知识库,换不同 embedding 模型, RAG 的命中率能差出30%以上。3️⃣Query 理解:很多人以为检索的 query 就是用户的问题本身。但在实际场景里,这一步其实最"坑"。🍊那到底哪一部分最难搞?最难的是让整个系统"协同"起来。这需要你既懂算法,又懂工程。需要同时考虑:1.文档更新频率(知识库维护)2.向量召回性能(索引优化)3.Prompt 格式(生成阶段控制)4.模型响应速度( API 并发与缓存)换句话说, RAG 是所有"大模型项目"中最能体现"算法工程师功底"的模块。它要求你既能设计算法,又能搭系统。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。