RAG 知识图谱检索系统
从零手写工业产品 RAG 检索系统|三路混合检索+全链路降级,2026 届求捞
正文:
大三下独立开发的一个面向工业设备的 RAG 知识问答系统,核心理念是"每个组件都要有降级方案"。
技术架构(9 步管线):
意图分类 → 查询改写 → 三路并行检索 → RRF 融合 → Cross-Encoder 重排 → LLM 生成
三路检索:向量检索(BGE)+ HyDE(LLM 生成假设文档→编码→搜索)+知识图谱(Neo4j)
RRF 融合公式 1/(k+rank),k=60 压制单路高分,追求多路共识
全链路降级(DEMO_MODE 一键切换):
Milvus → NumPy 本地向量库
Neo4j → 内存字典
BGE embedding → n-gram 哈希
PostgreSQL → SQLite
Cross-Encoder → 简单分数排序
没有 Docker、没有 GPU、没有网络也能跑通完整管线。
技术栈: Python / FastAPI / BGE / Milvus / Neo4j / PostgreSQL / Redis / DeepSeek API
GitHub: https://github.com/yfkzdk/product-rag
求捞方向: 后端开发 / 搜索推荐 / NLP 工程师,base 不限
正文:
大三下独立开发的一个面向工业设备的 RAG 知识问答系统,核心理念是"每个组件都要有降级方案"。
技术架构(9 步管线):
意图分类 → 查询改写 → 三路并行检索 → RRF 融合 → Cross-Encoder 重排 → LLM 生成
三路检索:向量检索(BGE)+ HyDE(LLM 生成假设文档→编码→搜索)+知识图谱(Neo4j)
RRF 融合公式 1/(k+rank),k=60 压制单路高分,追求多路共识
全链路降级(DEMO_MODE 一键切换):
Milvus → NumPy 本地向量库
Neo4j → 内存字典
BGE embedding → n-gram 哈希
PostgreSQL → SQLite
Cross-Encoder → 简单分数排序
没有 Docker、没有 GPU、没有网络也能跑通完整管线。
技术栈: Python / FastAPI / BGE / Milvus / Neo4j / PostgreSQL / Redis / DeepSeek API
GitHub: https://github.com/yfkzdk/product-rag
求捞方向: 后端开发 / 搜索推荐 / NLP 工程师,base 不限
全部评论
相关推荐
查看5道真题和解析 点赞 评论 收藏
分享
查看18道真题和解析 点赞 评论 收藏
分享
