一、第一层:从堆代码到搭系统1.数据是怎么进入知识库的?2.用了什么样的分块策略?3.索引更新机制如何保证?4.检索精排是怎么设计的?二、第二层:从能检索到会优化1.混合检索在语义检索之外,引入关键词召回(BM25),融合两种结果,既保留语义理解,又能精确匹配术语。2.两阶段检索用向量召回快速找Top50,再用 Cross - Encoder 做精排,取Top5。这就是成熟 RAG 的"标配"架构。3.查询理解用小模型或提示词自动扩展 Query三、第三层:从能回答到能推理1.长上下文优化( Long Context )做成一个"小型知识总结助手" Demo ,就非常有竞争力。2.强化学习( RL )在 RAG 上叠加轻量 RL 流程,根据反馈信号调整 Reranker 或 Prompt 策略。3.多模态融合( Multimodal RAG )尝试接入图像或表格内容。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。