继续来分享下之前的面经~欢迎友好讨论,信息共享1.设计一个电商导购 RAG 系统,要求给出完整链路和瓶颈点。2.召回层你会放几路?每路的职责怎么分?3.query 改写怎么做,怎么避免语义漂移?4.重排模型如何离线训练与线上蒸馏?5."命中检索但生成幻觉"你会如何分层定位?6.线上P95突然上升30%,你如何10分钟止血?7.如果要在一周内恢复体验,你排优先级的原则是什么?8.Continuous Batching 在你场景里是否值得上?9.KV Cache 占用如何估算?你们做过哪些降占用策略?10.如果预算砍半,你保留哪些模块,砍掉哪些模块?11.618大促场景下,准确率和延迟冲突时你怎么取舍?12.你如何向产品解释"离线分高但线上没提升"?