继续来分享下之前的面经~欢迎友好讨论,信息共享1- RAG痛点2- 检索精度与召回率的平衡(如chunk粒度优化) 如何解决多跳推理问题?3- 知识更新机制(小红书UGC内容高频更新如何应对4- LLM针对RAG的优化5- 是否用LLM直接生成Embedding?如何解决生成式检索的稳定性6- 提示工程优化(如HyDE技术在小红书的应用场景)。7- 幻觉问题8- 检索结果置信度过滤方案?是否引入知识图谱作为验证层9- 检索污染处理10- 用户生成内容(如错误美妆知识)如何清洗?实时性(如突发谣言)如何应对11- 图文对RAG产品设计12- 多模态检索方案(图文联合Embedding vs. 分离对齐)13- 如何将用户评论/标签纳入检索增强