1、自我介绍2、项目拷打3、RAG 的完整链路是什么,哪些地方最容易出问题RAG 的完整链路一般是文档接入、清洗去噪、切 chunk、向量化、建索引、在线检索、重排、上下文构造、Prompt 拼接、模型生成和结果后处理。线上请求过来以后,先对用户 query 做归一化处理,再进行向量召回或者混合召回,把候选文档取回来,然后用 rerank 模型重新排序,选出最相关的内容拼到 prompt 里,再交给大模型回答。最容易出问题的地方通常有几个。第一是 chunk 切得不合理,太短会丢语义,太长会导致噪声太多。第二是召回率不够,模型根本没拿到正确证据。第三是重排不准,正确文档被排到后面。第四是上下文...