勇敢的布莱克说等下个版本吧

03-26 18:15 南京邮电大学驱动开发

关注

RAG知识库搭建与技术栈分享

整体架构
用户提问 → 向量检索 → LLM 生成答案
核心三件套：文档解析 + 向量数据库 + 大模型 API
完整实现步骤
1.文档预处理
支持 PDF/Word/Markdown 等格式
用 LangChain 的 DocumentLoader 加载文件
文本分块（推荐 chunk_size=500，overlap=50）
2.向量化存储
选用向量库：Milvus / FAISS / Chroma
用 text-embedding 模型把文本转成向量
存入库并建立索引
3.检索 + 生成
用户问题向量化 → 检索 Top-K 相关文档
把「检索结果 + 用户问题」拼成 Prompt
调用大模型 API，返回最终答案
推荐技术栈（低成本 / 全免费）
Python + LangChain + FAISS + 通义千问 API
新手避坑
分块太大 → 检索不精准
不做 Rerank → 召回质量差
不设置 “我不知道” → 模型容易瞎编 #从事AI岗需要掌握哪些技术栈？#

全部评论

推荐最新楼层

03-25 18:22

新疆大学 Java

如何设计高性能的上下文记忆架构？

在开发 AI 对话应用（如调用豆包、GPT 等 API）时，我们常面临一个核心问题：AI 本身是无状态的，如何让它记得用户的历史对话，且在高并发下依然保持极速响应？ 一、 核心痛点：为什么 AI 需要“记忆”？ 调用大模型 API 时，模型不会自动记录之前的聊天记录。为了实现“多轮对话”，我们必须在每次发送请求时，把历史消息一并传给 API。这就引出了三个挑战：  性能：频繁的数据库查询会拖慢响应速度。 上下文窗口：模型有 Token 上限，不能无限制地堆积历史。 成本：发送的上下文越多，消耗的 Token 越多，费用越高。  二、 四种演进方案深度解析 1. MySQL 单库方案（起步阶段）...

点赞评论收藏

分享

03-15 11:24

National University of Singapore Java

快手杭州电商-大模型应用java一面面经

3.5一面 一、 项目1. 简单介绍一下这个系统的知识库问答架构，从文档入库到最后回答的完整链路是怎样的？2. 向量检索用的是什么索引类型？3. 在召回之后有没有做重排（Rerank）之类的操作？4. 你知识库的准确率和召回率是怎么评估的？5. Spring AI Alibaba 的 Function Calling 是怎么实现的？模型如何决定调用哪个工具？6. 如果工具调用失败了，你们设计了什么处理机制？7. Execute Plan 模式具体是怎么实现的？8. 平时哪种模型用的比较多？9. 平时编码时会用哪些模型？10. 在选择向量数据库时，有没有看过其他的（如 ES、Milvus 以外的选择）？它们之间的区别你大概有概念吗？11. 在写 Prompt的时候，你有哪些实践经验或设计原则？12. Graph Rag / Agentic Rag了解过吗13. 在秒杀下单中，Lua 脚本具体做了什么？为什么要用 Lua，而不是分开执行多条指令？14. 这个项目你自己做过压测吗？15. 对系统能扛住的流量（QPS）有没有具体的概念？16. 对于什么时候该上缓存、什么时候该上本地缓存，你大概的概念是什么二、 Java 基础1. 线程池的核心参数有哪些？2. 线程池内部的具体工作流程是怎样的？3. 核心线程数和最大线程数一般怎么确定/计算？三、 场景题1. 你觉得目前 RAG（检索增强生成）最大的瓶颈是什么？2. 假设要给电商平台搭建一个百万/千万级的商品知识库问答系统，你会怎么设计？3. 针对商品信息（如价格、描述）可能被商家动态更新的情况，你的知识库设计需要考虑什么？四、手撕：二叉树的层序遍历反问面试表现，面试官当场告知通过

查看23道真题和解析

点赞评论收藏

分享

04-12 20:04

广西大学算法工程师

Shopee 大模型算法开发一面

1. 自我介绍2. 介绍你做的模型loss设计，包含基础损失与辅助损失，说明各部分作用与梯度流动逻辑模型loss采用多任务联合优化框架，主损失负责核心任务拟合，辅助损失用于约束特征对齐、分布对齐与梯度稳定。以多模态分类模型为例，主损失使用交叉熵损失，直接优化分类准确率；辅助损失包含对比损失用于拉近同类特征距离、拉远异类特征，以及KL散度损失用于对齐教师模型与学生模型的分布。训练时通过权重系数平衡各损失，保证主任务不被辅助任务淹没，同时利用梯度裁剪解决多任务梯度冲突问题。 import torch import torch.nn as nn class MultiModalLoss(nn.Mod...

AI-Agent面试实战...

点赞评论收藏

分享

04-12 15:30

门头沟学院全栈开发

哈啰后端agent一面日常实习

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1项目拷打2说一下实习经历3说下如何保证大促稳定性的，哪些独立完成的4你觉得其中比较有难点的是什么5如果让你实现一个xxx管理系统，你会怎么设计接和库表6如果要实现多开网页免登录的话，应该怎么做到的7rag文档切分怎么做的流程是什么8mcp有了解底层架构是啥吗9对前沿ai知识了解吗10skills你理解的是什么11讲一下你理解的harness，有用过他做过什么事情吗

查看10道真题和解析

点赞评论收藏

分享

04-03 11:41

上海交通大学算法工程师

一个故事讲清：LLM（大模型）、Agent、Skill、MCP、CLI、OpenClaw到底啥关系？

“企业微信开源的CLI是啥？为啥大厂都在做？”“Skill 和 MCP 又是啥？这俩有啥区别？”“说了小半年的 OpenClaw 又是个啥？为啥企业、个人都在紧急学？”这些都是粉丝问过的。为了搞懂这些，我研究了一周。搞清了谁是谁、谁套着谁、谁与谁的区别是啥。今天这篇文章，我就把这些难懂的名词，梳理成一个你能听懂的故事，把这些概念一次性理清楚。听完你会发现：它们不是一堆孤立的AI术语，而是一支协同作战的“智能特工队”。先记住这张“翻译表”：大模型（LLM）天才员工聪明绝顶，但刚入职，不熟你家规矩Prompt口头交代你临时说的任务，说完就没了Agent领班\领导自己不做具体事，但能拆解目标、调度员...

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

米哈游2026校园招聘

应届生春招&全年实习生专项

招商银行信用卡中心

2027届暑期训练营

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 从投递到OC，你用了多久 #

4600次浏览 39人参与

# 总结:哪家公司最喜欢泡池子 #

169476次浏览 603人参与

# 厦门银行科技岗值不值得投 #

19311次浏览 427人参与

# 我的求职进度条 #

994292次浏览 6583人参与

# 哪些公司面试还在问八股？ #

1103次浏览 21人参与

# 哪一刻你突然觉得实习“有点值了” #

3182次浏览 44人参与

# HR面都在聊什么？ #

1203次浏览 21人参与

# 实习教会我的事 #

73949次浏览 511人参与

# 一人一道大厂面试题 #

129386次浏览 1321人参与

# 生物制药/化工校招攻略 #

85783次浏览 347人参与

# 实习生如何通过转正 #

136224次浏览 1488人参与

# 哪些公司一直卡在简历筛选 #

108223次浏览 374人参与

# 大厂无回复，继续等待还是奔赴小厂 #

350576次浏览 2009人参与

# 实习生活中那些难忘的瞬间 #

333385次浏览 3399人参与

# 现在还是0offer，延毕还是备考 #

1364943次浏览 7953人参与

# 我想象的实习vs现实的实习 #

333243次浏览 2298人参与

# 有深度的简历长什么样？ #

54241次浏览 732人参与

# 反问环节如何提问 #

138704次浏览 2734人参与

# 夸夸我的求职搭子 #

261994次浏览 1983人参与

# 入职第一天，你准备什么时候下班 #

118596次浏览 519人参与

# 拿到offer之后，可以做些什么 #

105909次浏览 514人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务