数据源会是多源,多数据格式(包括多模态、结构化、JSON,graph等),怎么把数据进行加载清洗处理,得到合适的数据,如果一篇文章很长,怎么做分块,是直接分块,还是重叠的分,为什么这个场景要这样,有没有更好的分块或者压缩方法。在召回阶段,你的query要怎么重构,例如用户问题是“这个是什么?”这样就是语义很不清晰的,要怎么把query重构成一个语义清晰的问句,才能在查找的时候提高命中率,以及你算完相似度之后重排和召回有没有什么优化,是直接根据向量相似度排序吗?有没有别的重排参数,这些都可以优化。除此外,你的RAG应该是每次调用LLM都用一次的吧,你能不能针对每一个场景写一个表,然后分别打包成MCP,让LLM自己决定要不要用RAG,用哪个RAG,怎么用RAG,这些都可以深挖,除此外,基于向量数据库的RAG有标准流程,你可以对照每个阶段,都做一些工作。希望我的分享对你有帮助。
全部评论

相关推荐

03-14 16:04
已编辑
安徽农业大学 算法工程师
痴心的她allin秋...:啥笔试都挂怎么办,某9本考研下岸,练也没时间了,对算法也不感兴趣,大部分大厂笔试只能A0-1个😄
米哈游笔试
点赞 评论 收藏
分享
最喜欢秋天的火龙果很...:第一份工作一定要往大的去,工资低点没事。后面换工作会更好找,即使你去小公司,你也不可能不会换工作的。所以找大的去
点赞 评论 收藏
分享
MinGW_:直接投那个前端移动端就行,美团前端的岗位一直是叫这个名字的,哪怕是做内部系统只有网页没有移动端的组,招人的岗位也是这个名字
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务