继续来分享下之前的面经~欢迎友好讨论,信息共享1.当时为什么决定选用 RAG 这个技术框架?2.你选择的是哪个 RAG / 哪个向量库?为什么选它?3.你们做了哪些评测对比?4.你为什么要用向量检索(RAG)?为什么不用其他方式?5.为什么不用全文索引(类似某度/某g那种关键词检索)?6.你说大模型有幻觉,那为什么不用更“权威”的全文检索来避免胡编?7.如果用开源全文检索在本地部署、自己喂私有数据,也能搜——那你们当时为什么没选这条路?8.你选的向量维度是多少维?9.这个维度为什么重要?你有没有显示配置/修改过维度?10.你用的切分策略是什么?11.你说按段落/按语义切,那段落有的 100 字、有的 1 万字怎么办?12.你的 chunk size 为什么定 1000 token?这是拍脑袋还是有依据?13.overlap 设多少?为什么这样设?14.你怎么评价/评测 RAG 效果的好坏?