一些自己在网上搜刮的面经题目路过的牛爷爷可以试着答一答,附上自己的答案,如果有更好的答案也可以拷打我,如果有别的比较好的题目也可以评论里发一发。 如何评估 RAG 效果?指标是什么? 分层评估: 检索质量评估:看如HitRate(命中率),Recall(召回率)等指标 生成质量评估:看如相关性(是否切题)、忠诚度(生成是否基于检索内容生成)、完整性(生成答案是否完整) 用户满意度测评:答案是否满意,检索速度够不够块。 RAG 和微调怎么取舍? RAG适合更新频率高,存在隐私数据以及需要可解性性要求高需要稳定输出的场景。 微调适合需要特定规则以及语气的使用场景。 这两个技术在大部分场景下都不...